코호넨 네트워크는 데이터 군집화에 자주 이용되는 신경망 기법의 하나이다.
k-means 군집화 기법과 차이점은 다음과 같다.
첫째, 군집 중심 및 입력데이터를 0과 1사이의 정규화된 값으로 사용한다.
둘째, 알고리즘을 수행하면서 새로운 군집 중심을 계산하는 바식에 약간의 차이가 있다.
Algorithm
Step1. 군집 수 k를 결정하고, 각 군집에 초기치 또는 군집 중심을 0~1사이의 값으로 할당한다.
Step2. 0과1 사이로 정규화된 새로운 입력 데이터를 제시한다.
Step3. 입력 데이터와 각 군집 중심사이의 거리를 계산한다.
Step4. 거리가 최소인 군집 중심을 아래와 같이 새롭게 계산한다. (여기서 α는 0과 1사이의 학습 비율이다)
Step5. 모든 데이터에 대해 Step2~Step4를 반복한다.
Step6. 초기의 α값에 대한 군집 중심과 α를 줄여가면서 생성된 군집 중심의 변화가 없을 때까지 반복한다.
Step7. 모든 데이터를 가장 가까운 군집 중심에 배속한다.
## 0과 1사이의 표준화 데이터 생성 ## 새로운 군집 중심을 계산 new_center<-function(center,data,alpha){
center<-matrix(0,k,col) ## 초기의 군집 중심 설정 if(identical(round(center-or_center,4),c)==FALSE){
## 실행함수 kohonen_alg(data, 3) |
이 또한 k-means 기법과 유사하게 초기 값에 따라 군집화 결과가 다르게 나타남을 볼 수가 있다.
출처 : http://blog.naver.com/asus1984?Redirect=Log&logNo=120065317344
'Fundamental > Technical ' 카테고리의 다른 글
VLAN (Virtual LAN) 에 대한 몇가지 개념 (0) | 2014.07.31 |
---|---|
802.1Q (VLAN) (0) | 2014.07.31 |
k-medoids 기법 : 대표 객체기반 기법 (데이터마이닝) (0) | 2014.05.12 |
k-means 기법 (데이터마이닝) (0) | 2014.05.12 |
Data Clustering (0) | 2014.05.12 |
댓글