머신러닝 과제 (데이터셋 조사, NLLLoss & Cross Entropy Loss)

# 데이터셋 조사

MNIST 데이터셋: 0 ~ 9까지의 손글씨 이미지로 구성되어 있으며 크기는 28x28이다. 각각의 픽셀값은 0~255의 정수로 이루어졌고, 회색조 이미지다. 데이터의 레이블은 0 ~ 9의 정수로 이루어져 있다. 학습용 데이터는 60,000개고, 테스트 데이터는 10,000개다. 가장 기본적인 이미지 분류가 이 데이터셋의 목적이다.

Fashion-MNIST 데이터셋: 의류, 가방, 신발 등 총 10종류의 패션 이미지들로 구성되어 있으며 크기는 28x28이다. 각각의 픽셀값은 0~255의 정수로 이루어졌고, 회색조 이미지다. 학습용 데이터는 60,000개고, 테스트 데이터는 10,000개다. MNIST 데이터셋과 마찬가지로, 가장 기본적인 이미지 분류가 이 데이터셋의 목적이다.

CIFAR: CIFAR-10에는 비행기, 차, 새 등 총 10종류의 사물 및 동물 이미지들로 구성되어 있으며, 크기는 32x32이다. 각 클래스마다 6,000장씩 총 60,000장의 컬러 이미지가 있다. CIFAR-100은 100개의 클래스와 각 클래스별 600장씩 총 60,000장의 이미지로 구성된다. 좀 더 복잡한 이미지 분류 문제에 사용하기 위함이 이 데이터셋의 목적이다.

# NLLLoss vs. Cross Entropy Loss

NLLLoss: Negative Log Likelihood Loss. 분류 문제에 유용하다. 신경망에서 로그 확률값을 얻으려면 마지막 레이어에 LogSoftmax 레이어를 추가해주어야 한다. 그러나 마지막 레이어에 LogSoftmax를 추가하는 대신 그냥 CrossEntropyLoss를 사용하면 LogSoftmax레이어를 추가할 필요가 없다.

CrossEntropyLoss: LogSoftmax와 NLLLoss의 기능이 하나의 class에 합쳐져 있는 것이다. 즉, Log 처리와 softmax 처리, NLLLoss연산을 한번에 하므로 NLLLoss와 LogSoftmax를 같이 사용하는 것보다 수식이 간소화되어 더 안정적으로 역전파가 이루어진다.

'딥러닝 & 머신러닝 > 강연 & 수업' 카테고리의 다른 글

머신러닝 과제 (활성화 함수 조사) (0)	2020.12.21
머신러닝 과제 (옵티마이저, 파이토치 기능 조사) (0)	2020.12.21
20201112 머신러닝 수업 (0)	2020.11.12
20200929 머신러닝 수업 (0)	2020.10.17
20200924 머신러닝 수업 (0)	2020.10.17

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

Deep Learning with Writing

머신러닝 과제 (데이터셋 조사, NLLLoss & Cross Entropy Loss)

'딥러닝 & 머신러닝 > 강연 & 수업' 카테고리의 다른 글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역

머신러닝 과제 (데이터셋 조사, NLLLoss & Cross Entropy Loss)

'딥러닝 & 머신러닝 > 강연 & 수업' 카테고리의 다른 글

'딥러닝 & 머신러닝/강연 & 수업' Related Articles

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역