Broccoli's House

#3-(1) 비지도 학습 본문

공부/머신러닝

#3-(1) 비지도 학습

김콜리 2018. 2. 3. 18:58

※ 이 글의 내용은 O'REILLY의 <파이썬 라이브러리를 활용한 머신러닝> 책을 기반으로 한다.




비지도 학습




  • 비지도 학습

 - 비지도 학습(Unsupervised Learning) : 사용자가 알고 있는 출력 값이나 정보를 입력 값과 비교하여 학습하는 지도학습 알고리즘과는 다르게, 비지도 학습은 그러한 출력이나 정보 없이 학습 알고리즘을 가르쳐야 하는 모든 종류의 머신러닝을 가리킨다. 즉, 비지도 학습에서의 알고리즘은 입력 데이터만으로 데이터에서 지식을 추출할 수 있어야 한다.


 - 비지도 학습에는 데이터의 비지도 변환(Unsupervised Transformation)과 군집(Clustering)이 있다. 비지도 변환은 데이터를 새롭게 표현하여 사람이나 다른 머신러닝 알고리즘이 원래 데이터보다 쉽게 해석할 수 있도록 만드는 알고리즘이다. 따라서 데이터를 비지도 변환을 거쳐 그 출력 값을 다시 입력으로 지도 학습하기도 한다. 비지도 변환은 특성이 많은 고차원 데이터의 특성의 개수를 줄이면서 꼭 필요한 특징이 두드러지게 하는 데이터로 표현하는 차원 축소(Dimensionality Reduction)에 많이 사용된다.  군집 알고리즘은 데이터를 비슷한 것끼리 그룹으로 묶는 것이다.


 - 비지도 학습에서 가장 어려운 것은 알고리즘이 무엇을 어떻게 학습했는지 평가하는 것이다. 비지도 학습은 보통 레이블이 없는 데이터에 적용하기 때문에, 어떤 것이 올바른 출력인지 모른다 따라서 비지도 학습의 결과를 평가하기 위해서는 직접 확인하는 것이 유일한 방법일 때가 많다.  이러한 이유로 비지도 학습 알고리즘은 데이터를 이해하기 쉽도록 하는 탐색적 분석 단계에서 많이 사용한다.

Comments