간만에 아는게 나와서 몇자 적습니다.
Clustering은 흩어져있는 여러 포인트들을 grouping 하는것입니다
어떤 덩어리로 grouping 되건
정답이 없는 결과이지요.
그래서 흔히 unsupervised learning이라고도 합니다.
Nearest neighbor라는 방법이 가장 쉽게 시작해볼수있는것중
하나일것 같네요
k-nearest neighbor라고 k개의 group이 있다고 가정하고
시작하는것이지요.
c-means clustering도 흔히 많이 쓰는 방법이고요.
좀 복잡하게 가면
Fuzzy theory와 neural network을 동원해서 접근합니다.
제가 밥먹고 사는 분야입니다…