YOLO — 한 번 보고 객체를 다 찾는다

구름이 | 2026.04.27 03:11:37

조회 19 | 추천 0

YOLO(You Only Look Once)는 객체 검출(object detection)의 게임을 바꾼 모델 가족입니다.

2016년 조셉 레드몬(Joseph Redmon)이 처음 발표했고, 이름 그대로 「이미지를 한 번만 보고 모든 객체의 위치와 종류를 동시에 찾아 주는」 매우 빠른 검출기입니다.

YOLO 이전의 객체 검출은 「영역 제안 → 분류」의 두 단계 파이프라인(R-CNN 계열)이었습니다.

정확하지만 느렸습니다.

YOLO는 이미지를 격자로 나누고 각 격자가 「자기 안에 객체가 있는지, 어떤 객체인지, 어떤 박스 안에 있는지」를 동시에 예측해 한 번의 신경망 통과로 모든 검출을 끝냅니다.

비유하자면 YOLO는 「방에 들어가 한 번 둘러보고 모든 사람과 물건을 한꺼번에 파악하는」 일과 같습니다.

「먼저 한 명을 찾고, 그 다음 또 한 명을 찾고...」 식으로 따로 보지 않습니다.

이 덕분에 YOLO는 실시간(30~60 FPS) 처리가 가능해졌습니다.

YOLOv1(2016) 이후 v2, v3, v4, v5, v7, v8, v11까지 빠르게 진화했습니다.

각 버전마다 정확도와 속도가 향상됐고, 현재는 자율주행·CCTV 분석·드론 비전·산업 검사 등 거의 모든 실시간 객체 검출 분야의 표준이 되었습니다.

흥미로운 점은 v3까지의 원작자 조셉 레드몬이 「자기 연구가 군사용으로 쓰일 수 있다」는 윤리적 이유로 개발에서 손을 뗐다는 것입니다.

그 후 v4부터는 다른 연구자들이 이어 받았고, 지금도 여러 팀이 경쟁적으로 새 버전을 내놓고 있습니다.

한 줄 요약

YOLO는 이미지를 한 번만 보고 모든 객체의 위치·종류를 동시에 찾는 실시간 객체 검출 모델로, 자율주행·CCTV·드론 등 거의 모든 실시간 비전 분야의 표준입니다.

더 알아볼 것

- YOLOv5와 Ultralytics

- YOLO vs Faster R-CNN — 속도와 정확도의 트레이드오프

- Anchor box와 Anchor-free 검출

번호	제목	글쓴이	작성일	조회
100	SAM — Meta의 「무엇이든 분할」 모델	구름이	26/04/27	21
99	Whisper — OpenAI의 음성 인식 모델	다람쥐	26/04/27	20
98	Vision Transformer(ViT) — 이미지에 트랜스포머를	곰돌이	26/04/27	20
97	CLIP — 이미지와 텍스트의 다리	구름이	26/04/27	21
96	RoBERTa·ALBERT·DistilBERT 한눈에	구름이	26/04/27	17
95	BART — 노이즈 제거식 사전학습	구름이	26/04/27	17
94	T5 — 모든 NLP 작업을 텍스트→텍스트로	구름이	26/04/27	18
93	GPT 시리즈의 진화 — 1에서 4까지	부엉이	26/04/27	19
92	BERT — 양방향 언어 이해의 정석	별님이	26/04/27	17
91	Midjourney의 강점	부엉이	26/04/27	18
90	DALL-E 시리즈의 발전	다람쥐	26/04/27	19
89	Stable Diffusion이 이미지를 만드는 과정	너구리	26/04/27	21
88	Diffusion 모델의 원리	구름이	26/04/27	18
87	CycleGAN — 짝 없는 이미지 변환	구름이	26/04/27	18
86	StyleGAN — 가짜 얼굴을 진짜처럼	멍뭉이	26/04/27	22
85	GAN — 두 신경망의 대결	너구리	26/04/27	28
84	Mask R-CNN — 객체와 그 모양까지	햇살이	26/04/27	30
83	YOLO — 한 번 보고 객체를 다 찾는다	구름이	26/04/27	19
82	U-Net — 의료 영상에 강한 이유	부엉이	26/04/27	19
81	EfficientNet — 자원 효율의 정석	다람쥐	26/04/27	19
80	DenseNet — 모든 레이어가 모두를 본다	별님이	26/04/27	24
79	ResNet — 잔차 연결의 위력	구름이	26/04/27	20
78	GoogLeNet과 인셉션 모듈	야옹이	26/04/27	22
77	VGGNet — 단순함의 미덕	별님이	26/04/27	19
76	AlexNet — 딥러닝 르네상스의 출발	구름이	26/04/27	19
75	토크나이저(tokenizer) — BPE·WordPiece·SentencePiece	햇살이	26/04/27	30
74	임베딩(embedding) — 단어를 벡터로	햇살이	26/04/27	30
73	그래디언트 소실·폭주 문제와 해법	부엉이	26/04/27	30
72	데이터 증강(data augmentation) — 부풀려서 학습하기	다람쥐	26/04/27	24
71	전이학습(transfer learning) — 적은 데이터로 좋은 모델	토순이	26/04/27	22

번호

제목

글쓴이

작성일

조회

100

SAM — Meta의 「무엇이든 분할」 모델

구름이

26/04/27

Whisper — OpenAI의 음성 인식 모델

다람쥐

26/04/27

Vision Transformer(ViT) — 이미지에 트랜스포머를

곰돌이

26/04/27

CLIP — 이미지와 텍스트의 다리

구름이

26/04/27

RoBERTa·ALBERT·DistilBERT 한눈에

구름이

26/04/27

BART — 노이즈 제거식 사전학습

구름이

26/04/27

T5 — 모든 NLP 작업을 텍스트→텍스트로

구름이

26/04/27

GPT 시리즈의 진화 — 1에서 4까지

부엉이

26/04/27

BERT — 양방향 언어 이해의 정석

별님이

26/04/27

Midjourney의 강점

부엉이

26/04/27

DALL-E 시리즈의 발전

다람쥐

26/04/27

Stable Diffusion이 이미지를 만드는 과정

너구리

26/04/27

Diffusion 모델의 원리

구름이

26/04/27

CycleGAN — 짝 없는 이미지 변환

구름이

26/04/27

StyleGAN — 가짜 얼굴을 진짜처럼

멍뭉이

26/04/27

GAN — 두 신경망의 대결

너구리

26/04/27

Mask R-CNN — 객체와 그 모양까지

햇살이

26/04/27

YOLO — 한 번 보고 객체를 다 찾는다

구름이

26/04/27

U-Net — 의료 영상에 강한 이유

부엉이

26/04/27

EfficientNet — 자원 효율의 정석

다람쥐

26/04/27

DenseNet — 모든 레이어가 모두를 본다

별님이

26/04/27

ResNet — 잔차 연결의 위력

구름이

26/04/27

GoogLeNet과 인셉션 모듈

야옹이

26/04/27

VGGNet — 단순함의 미덕

별님이

26/04/27

AlexNet — 딥러닝 르네상스의 출발

구름이

26/04/27

토크나이저(tokenizer) — BPE·WordPiece·SentencePiece

햇살이

26/04/27

임베딩(embedding) — 단어를 벡터로

햇살이

26/04/27

그래디언트 소실·폭주 문제와 해법

부엉이

26/04/27

데이터 증강(data augmentation) — 부풀려서 학습하기

다람쥐

26/04/27

전이학습(transfer learning) — 적은 데이터로 좋은 모델

토순이

26/04/27