본문 바로가기

딥러닝 & 머신러닝/강연 & 수업

20200910 머신러닝 수업

반응형

일반화 성능: 테스트 데이터에 대한 모델의 성능

 

데이터가 많아질수록 일반화 능력이 좋아지는 이유는?: 다양한 데이터의 특징을 학습해서 다양성이 증가하므로. 즉 데이터의 샘플 포인트가 많아져 모델의 파라미터 갯수보다 많아지면 오버피팅되지 않는다.

 

위 목적 함수는 어떻게 규제 효과를 가지는가?

: 우변의 두번째 항을 통해 파라미터(가중치) θ의 값이 커지는 걸 방지한다. (가중치 갱신때 J(θ)의 미분값이 빠지면서)

 

지도 학습: 데이터(특징 벡터)와 정답(목표값)이 모두 주어지는 것. 

비지도 학습: 데이터만 주어지고 정답은 없는 학습 방법.

 

결정론적 학습: 같은 데이터를 학습시켰을 때 같은 결과가 나온다.

스토캐스틱 학습: 같은 데이터를 학습시켜도 항상 다른 결과가 나온다. → 모델의 신뢰도 측정 가능.

 

분별 모델: 예측만을 위한 모델.

생성 모델: 예측도 할 수 있지만 새로운 샘플을 만들 수도 있다.

반응형