이번 방학부터 대학원생 동기, 선배 2명과 함께 논문구현 스터디를 시작했습니다. 저는 논문을 읽고 요약 및 설명하는 역할을 맡았고 나머지 두 명은 각각 keras와 pytorch로 코드를 구현하는 역할을 맡았습니다. 블로그에 올라오는 글들은 원 논문 및 논문 관련 설명들을 참고하여 작성한 것입니다. 코드는 게시물 하단에 적어놓은 제 깃허브에 공유했습니다. 참고하시면 좋을 것 같습니다. 설명과 코드에 틀린 부분이 있을 수 있습니다. 정중하게 지적해주시면 참고하겠습니다.
원 논문: https://arxiv.org/abs/1602.07360
SqueezeNet은 다음과 같이 한 마디로 정리할 수 있겠습니다.
"1x1 컨볼루션 필터를 잘 활용한 squeeze와 expand 기능을 만들어냈고, 그 기능이 들어간 fire module이라는 것을 이용해서 AlexNet과 비슷한 정확도를 달성하면서도 parameter 수는 최대 50배까지 줄인 아주 효율적인 모델이다. 그러나 모델이 가벼울수록 정확도가 떨어진다는 것은 어쩔 수 없다(AlexNet 정확도가 그렇게 좋은 건 아님). 따라서 성능보단 용량이 중요할 때 쓰면 좋을 것 같다."
구현 코드:
참고 자료:
https://jayhey.github.io/deep%20learning/2018/05/26/SqueezeNet/
https://github.com/motlabs/mot-dev/blob/master/lab8_squeezenet/README.md
'딥러닝 & 머신러닝 > 논문 리뷰' 카테고리의 다른 글
[논문 리뷰] GAN - Vanilla GAN (NIPS 2014) (0) | 2020.04.13 |
---|---|
[논문 리뷰] CNN - SENet (CVPR 2018) (0) | 2020.04.13 |
[논문 리뷰] CNN – MobileNet (CVPR 2017) (0) | 2020.04.12 |
[논문 리뷰] CNN - Attention (ECCV 2018) (0) | 2020.04.12 |
[논문 리뷰] CNN - DenseNet (CVPR 2017) (0) | 2020.04.12 |