Logo
내 게시판 만들기
인공지능(AI)

K-평균 군집화(K-Means)

햇살이 | 2026.04.27 02:58:17
조회 51 | 추천 0

K-평균 군집화(K-Means)는 비지도학습의 대표 알고리즘입니다.

「데이터를 K개의 군집으로 묶고 싶다」고 사전에 정한 뒤, 데이터를 K개 그룹으로 자동 분류해 줍니다.

정답 라벨 없이 데이터의 자연스러운 모양만으로 군집을 찾습니다.



작동 방식은 단순합니다.

첫째, K개의 군집 중심(centroid)을 무작위로 둡니다.

둘째, 각 데이터 점을 가장 가까운 중심에 배정합니다.

셋째, 같은 군집에 배정된 점들의 평균 위치로 중심을 옮깁니다.

넷째, 중심이 더 이상 거의 움직이지 않을 때까지 둘째·셋째를 반복합니다.



비유하자면 K-Means는 「공원에 K개의 깃발을 세우고, 사람들이 가장 가까운 깃발 아래 모이도록 한 뒤, 모인 사람들의 무게중심으로 깃발을 옮기기를 반복하는 게임」과 같습니다.

결국 깃발들이 자연스러운 군중의 무게중심에 자리잡습니다.



K-Means의 가장 큰 결정은 「K를 몇으로 정할 것인가」입니다.

너무 작으면 다른 성격의 점들이 한 군집에 묶이고, 너무 크면 한 자연스러운 군집이 여러 개로 쪼개집니다.

「엘보 방법(elbow method)」이나 「실루엣 점수(silhouette score)」 같은 지표로 적절한 K를 찾습니다.



한계도 분명합니다.

군집의 모양이 동그란 모양에서 벗어나면(예: 고리 모양) K-Means는 잘 잡지 못합니다.

또 초기 중심을 어디에 두느냐에 따라 결과가 달라지므로, 보통 여러 번 다른 초기값으로 돌려 본 뒤 가장 좋은 결과를 고릅니다(K-Means++).




한 줄 요약


K-Means는 데이터를 K개 군집으로 묶는 비지도 알고리즘으로, 중심을 옮겨 가며 가까운 점들을 모으는 단순한 반복으로 작동합니다.

K를 정하는 것이 핵심 결정입니다.




더 알아볼 것


- 엘보 방법과 실루엣 점수

- K-Means++ — 초기 중심 영리하게 정하기

- DBSCAN — 동그랗지 않은 군집도 잡는 대안

공유하기
목록보기
번호 제목 글쓴이 작성일 조회 좋아요
40 토순이 26/04/27 17 0
39 토순이 26/04/27 34 0
38 다람쥐 26/04/27 23 0
37 별님이 26/04/27 20 0
36 곰돌이 26/04/27 43 0
35 햇살이 26/04/27 16 0
34 토순이 26/04/27 22 0
33 햇살이 26/04/27 51 0
32 멍뭉이 26/04/27 17 0
31 토순이 26/04/27 20 0
30 멍뭉이 26/04/27 20 0
29 곰돌이 26/04/27 18 0
28 부엉이 26/04/27 18 0
27 부엉이 26/04/27 18 0
26 다람쥐 26/04/27 16 0
25 야옹이 26/04/27 18 0
24 별님이 26/04/27 17 0
23 멍뭉이 26/04/27 24 0
22 너구리 26/04/27 52 0
21 부엉이 26/04/27 20 0
20 부엉이 26/04/27 23 0
19 야옹이 26/04/27 18 0
18 토순이 26/04/27 68 0
17 곰돌이 26/04/27 46 0
16 구름이 26/04/27 41 0
15 너구리 26/04/27 20 0
14 곰돌이 26/04/27 19 0
13 토순이 26/04/27 19 0
12 다람쥐 26/04/27 20 0
11 별님이 26/04/27 48 0
신고하기

신고 사유를 선택해 주세요.