본문 바로가기

딥러닝 & 머신러닝/강연 & 수업

20200903 머신러닝 수업

반응형

회귀: 목표값이 실수

 

분류: 목표값이 실수가 아닌 범주형 자료 (부류값)

 

훈련집합: 모델을 학습시킬 때 사용하는 데이터 집합

 

테스트집합: 모델의 일반화 성능을 검증할 때 사용하는 데이터 집합

 

모델링: 모델을 만드는 과정. 모델이란 내가 데이터를 분석해서 이 데이터에 맞는 함수, 또는 머신러닝 알고리즘을 사용하는 것.

 

표현 학습 (representation learning): 좋은 특징 공간, 즉 분류에 유리한 특징 공간을 자동으로 찾아주는 방법. 딥러닝이 여기에 속함.

 

특징 공간 (feature space): 특징 벡터가 존재하는 공간. MNIST의 경우 28*28 = 784개 화소로 표현되므로 784차원.

 

특징 벡터 (feature vector): 어떤 특징 숫자값을 벡터로 표기한 것. ML에서는 입력된 샘플을 특징 벡터로 표현함.

ex) 특징 벡터: (키, 몸무게) = (178, 80), 목표값: (비만률) = (0.3)

 

매니폴드(manifold) 가정: 특징 공간 상에서 의미있는 데이터들은 한쪽에 모여있고, 그 의미있는 데이터들을 평면상에서 변화시켜보면 인접한 곳에서 존재할 가능성이 크다.

반응형