이미지 분할(image segmentation)은 「이미지의 모든 픽셀이 어떤 객체에 속하는지 라벨링하는」 비전 작업입니다.
객체 검출이 「상자」를 그렸다면, 분할은 「객체의 정확한 윤곽」을 픽셀 단위로 추적합니다.
분할은 세 가지로 나뉩니다.
첫째, 「의미적 분할(Semantic Segmentation)」 — 같은 종류의 객체를 한 그룹으로 묶음(모든 사람을 「사람」 픽셀로).
둘째, 「인스턴스 분할(Instance Segmentation)」 — 같은 종류라도 개별 객체로 구분(사람1·사람2·사람3을 별도).
셋째, 「판옵틱 분할(Panoptic)」 — 위 두 가지의 결합.
대표 모델은 의미적 분할에 U-Net·DeepLab, 인스턴스 분할에 Mask R-CNN·SOLO, 그리고 2023년 Meta의 SAM(Segment Anything Model)이 등장하며 「클릭 한 번으로 무엇이든 분할」이라는 새 표준을 만들었습니다.
산업 응용은 매우 광범위합니다.
의료 영상(장기·종양 정확한 윤곽), 자율주행(차선·보행자 정확한 모양), 사진 편집(배경 제거·객체 잘라내기), 위성 영상(농경지·도로·건물 구분), AR/VR(실시간 사람 분리), 제조업(부품 결함 영역 표시) 등에서 활약합니다.
최근의 SAM은 분할의 진입 장벽을 크게 낮췄습니다.
그 전에는 새 분야에 분할 모델을 만들려면 수만 장의 픽셀 단위 라벨링이 필요했지만, SAM은 「클릭 몇 번」으로 즉시 분할이 가능해 라벨링 도구로도 쓰이고, 의료·위성·산업 어디서나 즉시 활용됩니다.
SAM 2(2024)는 비디오까지 확장돼 「움직이는 객체의 분할 추적」이 가능해졌습니다.
한 줄 요약
이미지 분할은 픽셀 단위로 객체의 윤곽을 추적하는 작업으로, 의미적·인스턴스·판옵틱의 세 종류가 있습니다.
2023년 Meta의 SAM이 「클릭 한 번 분할」로 진입 장벽을 크게 낮췄습니다.
더 알아볼 것
- IoU — 분할 정확도의 표준 지표
- SAM 2 — 비디오 분할로 확장
- 의료 영상에서의 분할 응용