본문 바로가기

딥러닝 & 머신러닝/논문 리뷰

[논문 리뷰] CNN - SqueezeNet (ICLR 2017)

반응형

이번 방학부터 대학원생 동기, 선배 2명과 함께 논문구현 스터디를 시작했습니다. 저는 논문을 읽고 요약 및 설명하는 역할을 맡았고 나머지 두 명은 각각 keras와 pytorch로 코드를 구현하는 역할을 맡았습니다. 블로그에 올라오는 글들은 원 논문 및 논문 관련 설명들을 참고하여 작성한 것입니다. 코드는 게시물 하단에 적어놓은 제 깃허브에 공유했습니다. 참고하시면 좋을 것 같습니다. 설명과 코드에 틀린 부분이 있을 수 있습니다. 정중하게 지적해주시면 참고하겠습니다.


원 논문: https://arxiv.org/abs/1602.07360

 

SqueezeNet은 다음과 같이 한 마디로 정리할 수 있겠습니다.

 

"1x1 컨볼루션 필터를 잘 활용한 squeeze와 expand 기능을 만들어냈고, 그 기능이 들어간 fire module이라는 것을 이용해서 AlexNet과 비슷한 정확도를 달성하면서도 parameter 수는 최대 50배까지 줄인 아주 효율적인 모델이다. 그러나 모델이 가벼울수록 정확도가 떨어진다는 것은 어쩔 수 없다(AlexNet 정확도가 그렇게 좋은 건 아님). 따라서 성능보단 용량이 중요할 때 쓰면 좋을 것 같다."

 

구현 코드:

https://github.com/jhcha08/DeeplearningPaperCode/blob/master/%EC%8A%A4%ED%84%B0%EB%94%94%2020200312%20-%20CNN.%20SqueezeNet.ipynb

 

참고 자료:

https://jayhey.github.io/deep%20learning/2018/05/26/SqueezeNet/

https://github.com/motlabs/mot-dev/blob/master/lab8_squeezenet/README.md

반응형