환각(hallucination)이 일어나는 이유

다람쥐 | 2026.04.27 03:19:02

조회 18 | 추천 0

「환각(hallucination)」은 LLM이 「존재하지 않는 사실, 잘못된 정보를 그럴듯하게 만들어 내는」 현상입니다.

예를 들어 「세종대왕의 맥북프로 던짐 사건」이라 묻으면 모델이 진지하게 가상의 사건을 지어내는 식입니다.

환각이 일어나는 근본 원인은 LLM의 본질에 있습니다.

LLM은 「가장 그럴듯한 다음 단어」를 예측할 뿐, 「자기가 정말 아는지」를 판단하지 못합니다.

학습 데이터에서 본 적 없는 정보도 「그럴듯한 답」을 만들어 내는 데 망설임이 없습니다.

환각은 특히 다음 상황에서 자주 발생합니다.

첫째, 학습 시점 이후의 최신 정보.

둘째, 매우 구체적인 인물·장소·날짜의 사실.

셋째, 학술 논문 인용·법조문·통계 수치 같은 「확실해 보이는」 정보.

모델은 「이런 형식의 답이 그럴듯하다」를 알지만 실제 사실 확인은 못 합니다.

비유하자면 LLM의 환각은 「책을 거의 안 읽고 시험을 보러 온 학생이 그럴듯하게 답안지를 채우는」 일과 같습니다.

답안의 외형은 정답처럼 보이지만 내용은 지어낸 것입니다.

자기가 모르는지를 자각하지 못하기에 「자신 있게」 틀린 답을 합니다.

환각을 줄이는 방법은 다음과 같습니다.

첫째, RAG(검색 기반) — 답하기 전에 신뢰할 만한 자료를 검색해 그 안에서만 답하도록.

둘째, 도구 사용 — 계산은 계산기, 검색은 검색기에 위임.

셋째, 프롬프트 — 「확실하지 않으면 "모릅니다"라고 답하라」는 명시적 지시.

넷째, 검증 — 사용자가 출력의 사실 여부를 별도로 확인.

한 줄 요약

환각은 LLM이 그럴듯한 거짓 정보를 만들어 내는 현상으로, 「가장 그럴듯한 다음 단어 예측」이라는 본질에서 비롯됩니다.

RAG·도구 사용·프롬프트 설계로 줄일 수 있습니다.

더 알아볼 것

- RAG — 환각 감소의 정석

- Chain-of-Verification — 자기 답을 검증하는 패턴

- 의료·법률 LLM이 특히 위험한 이유

번호	제목	글쓴이	작성일	조회
130	LLM 평가 — MMLU·HumanEval·GPQA 등 주요 벤치마크	토순이	26/04/27	26
129	양자화(quantization) — 모델을 가볍게	토순이	26/04/27	23
128	작은 LLM(SLM) — 7B·13B·70B의 의미	멍뭉이	26/04/27	28
127	추론(reasoning) 모델 — o1·o3·Claude 등의 변화	곰돌이	26/04/27	67
126	코드 생성 — Copilot·Cursor·Claude Code	멍뭉이	26/04/27	28
125	멀티모달 — 텍스트·이미지·음성을 함께	다람쥐	26/04/27	17
124	MCP — 모델·도구 연결의 새 표준	너구리	26/04/27	19
123	함수 호출(function calling) — 구조화된 출력	다람쥐	26/04/27	17
122	에이전트(Agent) — LLM이 도구를 쓰는 법	부엉이	26/04/27	18
121	Constitutional AI — 안전성 학습의 새 길	야옹이	26/04/27	24
120	DPO — RLHF의 더 단순한 대안	너구리	26/04/27	17
119	RLHF — 사람 피드백으로 모델을 다듬는 법	부엉이	26/04/27	17
118	파인튜닝의 종류 — Full·LoRA·QLoRA	구름이	26/04/27	21
117	임베딩 모델과 벡터 데이터베이스	구름이	26/04/27	18
116	RAG — 검색으로 환각을 줄이기	부엉이	26/04/27	20
115	환각(hallucination)이 일어나는 이유	다람쥐	26/04/27	18
114	ReAct — 추론과 행동을 함께	너구리	26/04/27	21
113	Chain-of-Thought 프롬프팅 — 단계적으로 생각하기	토순이	26/04/27	18
112	Few-shot 프롬프팅 — 예시로 가르치기	다람쥐	26/04/27	17
111	시스템 프롬프트와 유저 프롬프트의 역할	곰돌이	26/04/27	20
110	프롬프트 엔지니어링 7가지 기본 패턴	구름이	26/04/27	19
109	컨텍스트 윈도우 — 1M 토큰의 의미	별님이	26/04/27	20
108	폐쇄 모델 vs 오픈 모델 — 어떻게 다른가	야옹이	26/04/27	18
107	Qwen·DeepSeek — 중국 오픈 모델의 성장	구름이	26/04/27	18
106	Mistral·Mixtral — 유럽발 오픈 모델	부엉이	26/04/27	21
105	Llama 시리즈(Meta) — 오픈웨이트의 표준	부엉이	26/04/27	19
104	Gemini(Google) — 멀티모달 강자	별님이	26/04/27	24
103	Claude(Anthropic) — 어떻게 다른가	곰돌이	26/04/27	18
102	GPT-4 — 무엇이 달라졌나	너구리	26/04/27	19
101	LLM(거대 언어 모델)이란 무엇인가	토순이	26/04/27	20

번호

제목

글쓴이

작성일

조회

130

LLM 평가 — MMLU·HumanEval·GPQA 등 주요 벤치마크

토순이

26/04/27

129

양자화(quantization) — 모델을 가볍게

토순이

26/04/27

128

작은 LLM(SLM) — 7B·13B·70B의 의미

멍뭉이

26/04/27

127

추론(reasoning) 모델 — o1·o3·Claude 등의 변화

곰돌이

26/04/27

126

코드 생성 — Copilot·Cursor·Claude Code

멍뭉이

26/04/27

125

멀티모달 — 텍스트·이미지·음성을 함께

다람쥐

26/04/27

124

MCP — 모델·도구 연결의 새 표준

너구리

26/04/27

123

함수 호출(function calling) — 구조화된 출력

다람쥐

26/04/27

122

에이전트(Agent) — LLM이 도구를 쓰는 법

부엉이

26/04/27

121

Constitutional AI — 안전성 학습의 새 길

야옹이

26/04/27

120

DPO — RLHF의 더 단순한 대안

너구리

26/04/27

119

RLHF — 사람 피드백으로 모델을 다듬는 법

부엉이

26/04/27

118

파인튜닝의 종류 — Full·LoRA·QLoRA

구름이

26/04/27

117

임베딩 모델과 벡터 데이터베이스

구름이

26/04/27

116

RAG — 검색으로 환각을 줄이기

부엉이

26/04/27

115

환각(hallucination)이 일어나는 이유

다람쥐

26/04/27

114

ReAct — 추론과 행동을 함께

너구리

26/04/27

113

Chain-of-Thought 프롬프팅 — 단계적으로 생각하기

토순이

26/04/27

112

Few-shot 프롬프팅 — 예시로 가르치기

다람쥐

26/04/27

111

시스템 프롬프트와 유저 프롬프트의 역할

곰돌이

26/04/27

110

프롬프트 엔지니어링 7가지 기본 패턴

구름이

26/04/27

109

컨텍스트 윈도우 — 1M 토큰의 의미

별님이

26/04/27

108

폐쇄 모델 vs 오픈 모델 — 어떻게 다른가

야옹이

26/04/27

107

Qwen·DeepSeek — 중국 오픈 모델의 성장

구름이

26/04/27

106

Mistral·Mixtral — 유럽발 오픈 모델

부엉이

26/04/27

105

Llama 시리즈(Meta) — 오픈웨이트의 표준

부엉이

26/04/27

104

Gemini(Google) — 멀티모달 강자

별님이

26/04/27

103

Claude(Anthropic) — 어떻게 다른가

곰돌이

26/04/27

102

GPT-4 — 무엇이 달라졌나

너구리

26/04/27

101

LLM(거대 언어 모델)이란 무엇인가

토순이

26/04/27