인공지능(AI)

RAG — 검색으로 환각을 줄이기

부엉이 | 2026.04.27 03:19:03

조회 20 | 추천 0

RAG(Retrieval-Augmented Generation, 검색 증강 생성)는 「LLM이 답하기 전에 외부 지식 베이스를 검색해 관련 자료를 가져온 뒤, 그 자료를 바탕으로 답하게 하는」 패턴입니다.

LLM의 환각을 줄이고 최신 정보를 활용할 수 있게 하는 사실상 표준 기법입니다.

기본 흐름은 다음과 같습니다.

사용자가 질문을 보내면, 시스템이 그 질문을 임베딩(벡터화)하고 미리 임베딩해 둔 문서들 중 가장 비슷한 것 5~10개를 찾아옵니다.

그 검색 결과를 「참고 자료」로 LLM의 프롬프트에 함께 넣어, LLM이 그 자료를 바탕으로 답하게 합니다.

RAG의 결정적 장점은 세 가지입니다.

첫째, 「최신 정보」 — 어제 추가된 문서도 즉시 반영됩니다.

둘째, 「출처 표시」 — 모델이 어느 문서를 참고했는지 보여 줘 신뢰성이 오릅니다.

셋째, 「사내 지식」 — 회사 내부 문서만 검색 대상으로 삼으면 사내 전용 챗봇이 됩니다.

비유하자면 RAG는 「학생이 시험 때 책을 펴 보고 답을 작성하게 하는 오픈북 시험」과 같습니다.

학생이 모든 것을 외울 필요 없이 필요한 자료를 찾아서 답할 수 있어, 정확성과 출처 검증 모두 좋아집니다.

RAG 시스템 구축의 핵심 부품은 「임베딩 모델」, 「벡터 데이터베이스」(Pinecone·Weaviate·Qdrant·Chroma 등), 「청킹 전략」(긴 문서를 어떻게 나눌지), 「리랭커」(검색 결과 재정렬)입니다.

LangChain·LlamaIndex 같은 프레임워크가 이런 부품을 묶어 주는 표준 도구입니다.

한 줄 요약

RAG는 질문 → 임베딩 검색 → 관련 자료 → LLM에 함께 전달의 흐름으로 환각을 줄이고 최신 정보를 활용하는 패턴입니다.

사내 지식 챗봇의 사실상 표준입니다.

더 알아볼 것

- 임베딩 모델 — text-embedding-3·BGE·KoSimCSE

- 벡터 DB 비교 — Pinecone vs Weaviate vs Chroma

- Hybrid Search — 의미 검색 + 키워드 검색

아뢰옵기도 송구한 히미즈의 신이시여 — 스즈메의 문단속 [1]

장례식은 반드시 가야하는 이유.jpg [1]

목록보기

번호	제목	글쓴이	작성일	조회
130	LLM 평가 — MMLU·HumanEval·GPQA 등 주요 벤치마크	토순이	26/04/27	25
129	양자화(quantization) — 모델을 가볍게	토순이	26/04/27	22
128	작은 LLM(SLM) — 7B·13B·70B의 의미	멍뭉이	26/04/27	28
127	추론(reasoning) 모델 — o1·o3·Claude 등의 변화	곰돌이	26/04/27	67
126	코드 생성 — Copilot·Cursor·Claude Code	멍뭉이	26/04/27	28
125	멀티모달 — 텍스트·이미지·음성을 함께	다람쥐	26/04/27	17
124	MCP — 모델·도구 연결의 새 표준	너구리	26/04/27	18
123	함수 호출(function calling) — 구조화된 출력	다람쥐	26/04/27	16
122	에이전트(Agent) — LLM이 도구를 쓰는 법	부엉이	26/04/27	17
121	Constitutional AI — 안전성 학습의 새 길	야옹이	26/04/27	24
120	DPO — RLHF의 더 단순한 대안	너구리	26/04/27	17
119	RLHF — 사람 피드백으로 모델을 다듬는 법	부엉이	26/04/27	17
118	파인튜닝의 종류 — Full·LoRA·QLoRA	구름이	26/04/27	21
117	임베딩 모델과 벡터 데이터베이스	구름이	26/04/27	18
116	RAG — 검색으로 환각을 줄이기	부엉이	26/04/27	20
115	환각(hallucination)이 일어나는 이유	다람쥐	26/04/27	17
114	ReAct — 추론과 행동을 함께	너구리	26/04/27	21
113	Chain-of-Thought 프롬프팅 — 단계적으로 생각하기	토순이	26/04/27	18
112	Few-shot 프롬프팅 — 예시로 가르치기	다람쥐	26/04/27	17
111	시스템 프롬프트와 유저 프롬프트의 역할	곰돌이	26/04/27	19
110	프롬프트 엔지니어링 7가지 기본 패턴	구름이	26/04/27	18
109	컨텍스트 윈도우 — 1M 토큰의 의미	별님이	26/04/27	19
108	폐쇄 모델 vs 오픈 모델 — 어떻게 다른가	야옹이	26/04/27	17
107	Qwen·DeepSeek — 중국 오픈 모델의 성장	구름이	26/04/27	18
106	Mistral·Mixtral — 유럽발 오픈 모델	부엉이	26/04/27	20
105	Llama 시리즈(Meta) — 오픈웨이트의 표준	부엉이	26/04/27	18
104	Gemini(Google) — 멀티모달 강자	별님이	26/04/27	23
103	Claude(Anthropic) — 어떻게 다른가	곰돌이	26/04/27	18
102	GPT-4 — 무엇이 달라졌나	너구리	26/04/27	18
101	LLM(거대 언어 모델)이란 무엇인가	토순이	26/04/27	19

글쓰기

신고하기

신고 사유를 선택해 주세요.