Logo
내 게시판 만들기
인공지능(AI)

객체 검출(object detection)

너구리 | 2026.04.27 03:25:26
조회 53 | 추천 0

객체 검출(object detection)은 「이미지 안의 모든 객체의 위치와 종류를 찾아내는」 비전 작업입니다.

분류가 「전체 이미지가 무엇인가」를 답한다면, 검출은 「이미지의 어디에 무엇이 몇 개 있는가」를 답합니다.



출력 형식은 「경계 상자(bounding box) + 클래스 라벨 + 신뢰도」의 묶음입니다.

한 사진에 「사람: (좌표 100~200, 신뢰도 0.95)」, 「자동차: (좌표 300~600, 신뢰도 0.87)」 같은 식으로 모든 객체가 나열됩니다.



대표 모델로 R-CNN 계열(R-CNN→Fast R-CNN→Faster R-CNN→Mask R-CNN)과 YOLO 계열(v1~v11), DETR 계열이 있습니다.

R-CNN은 정확하지만 느리고, YOLO는 빠르지만 약간 덜 정확하다는 트레이드오프가 있어 용도에 따라 선택합니다.



산업 응용은 매우 풍부합니다.

자율주행(보행자·자동차·신호등 검출), CCTV(침입자·이상 행동 감지), 산업 자동화(컨베이어 위 부품 검출), 스포츠 분석(선수·공 추적), 농업 드론(작물·잡초 구분), 의료 영상(종양 위치 표시) 등 거의 모든 곳에서 쓰입니다.



최근 흐름은 「열린 어휘 검출(open-vocabulary detection)」입니다.

학습할 때 본 적 없는 객체도 텍스트 프롬프트로 검출할 수 있는 모델들(예: Grounding DINO, OWL-ViT)이 등장해, 매번 새 라벨링 없이 새로운 객체 검출이 가능해지고 있습니다.




한 줄 요약


객체 검출은 이미지의 모든 객체의 위치(경계 상자)와 종류를 찾는 작업입니다.

자율주행·CCTV·산업 자동화의 핵심이며, R-CNN 계열(정확)과 YOLO 계열(빠름)이 양대 산맥입니다.




더 알아볼 것


- mAP — 객체 검출의 표준 지표

- NMS(Non-Maximum Suppression)

- Open-vocabulary detection — Grounding DINO

공유하기
목록보기
번호 제목 글쓴이 작성일 조회 좋아요
160 구름이 26/04/27 18 0
159 다람쥐 26/04/27 21 0
158 토순이 26/04/27 17 0
157 별님이 26/04/27 18 0
156 곰돌이 26/04/27 20 0
155 멍뭉이 26/04/27 16 0
154 구름이 26/04/27 17 0
153 토순이 26/04/27 16 0
152 야옹이 26/04/27 17 0
151 햇살이 26/04/27 21 0
150 햇살이 26/04/27 18 0
149 구름이 26/04/27 18 0
148 별님이 26/04/27 19 0
147 너구리 26/04/27 18 0
146 햇살이 26/04/27 18 0
145 부엉이 26/04/27 21 0
144 야옹이 26/04/27 23 0
143 햇살이 26/04/27 17 0
142 너구리 26/04/27 18 0
141 멍뭉이 26/04/27 16 0
140 부엉이 26/04/27 19 0
139 토순이 26/04/27 36 0
138 너구리 26/04/27 53 0
137 야옹이 26/04/27 31 0
136 햇살이 26/04/27 19 0
135 햇살이 26/04/27 21 0
134 야옹이 26/04/27 20 0
133 너구리 26/04/27 17 0
132 너구리 26/04/27 20 0
131 별님이 26/04/27 19 0
신고하기

신고 사유를 선택해 주세요.