Semi-supervised Learning¶
전체 학습에 사용되는 dataset에서 Label을 가진 data sample들이 일부인 경우 를 가리킴.

- unlabeled data들 덕분에 X표시를 삼각형으로 판정내릴 수 있음.
- 만약 labeled data만 사용한 경우라면, 네모로 판정하기 쉬움.
Google의 Photo 서비스가 예 로 들 수 있는데, 해당 서비스의 모델은 자신의 사진이라고 일부 알려준 것을 바탕으로 학습을 하여 classification등을 수행한다.
- 실제로는 사진을
unsupervised learning등을 통해 clustering을 해놓은 상태에서 - 사용자가 일부 알려준 label을 바탕으로 개별 class가 누구인지를 지정하는 방식으로 학습이 이루어졌다.
semi-supervised learning은 결국, unsupervised learning과 supervised learning의 조합 으로 어디까지를 무엇으로 할지 등등에 따라 다양한 variation을 가질 수 있다.
역사적으로 가장 유명한 Semi-supervised Learning 중 하나로 Hinton 교수님의 Deep Belief Network (DBN)을 꼽을 수 있음.
Hinton 교수님은 다음의 방식으로 DBN을 학습시킴:
- 각 계층의 Restricted Boltzmann Machine (RBM)을 unsupervised learning을 시키고
- 이들을 쌓아서 DBN 을 만들고
- 쌓아진 DBN 을 labeled data를 이용한 supervised learning을 통해 fine-tuning 하는 방식으로 학습시킴.
DBN은 Deep Neural Network가 학습 가능함을 보인 최초의 ANN 으로 가치를 가진다.
- DBN을 학습시킨 방식을
Greedy Layer-wise Learning이라고도 부름.
참고로,
Greedy Layer-wise Learning은 오늘날 end-to-end learning이 주류로 자리잡으면서 많이 사용되고 있진 않음.