Logo
내 게시판 만들기
인공지능(AI)

RAG — 검색으로 환각을 줄이기

부엉이 | 2026.04.27 03:19:03
조회 20 | 추천 0

RAG(Retrieval-Augmented Generation, 검색 증강 생성)는 「LLM이 답하기 전에 외부 지식 베이스를 검색해 관련 자료를 가져온 뒤, 그 자료를 바탕으로 답하게 하는」 패턴입니다.

LLM의 환각을 줄이고 최신 정보를 활용할 수 있게 하는 사실상 표준 기법입니다.



기본 흐름은 다음과 같습니다.

사용자가 질문을 보내면, 시스템이 그 질문을 임베딩(벡터화)하고 미리 임베딩해 둔 문서들 중 가장 비슷한 것 5~10개를 찾아옵니다.

그 검색 결과를 「참고 자료」로 LLM의 프롬프트에 함께 넣어, LLM이 그 자료를 바탕으로 답하게 합니다.



RAG의 결정적 장점은 세 가지입니다.

첫째, 「최신 정보」 — 어제 추가된 문서도 즉시 반영됩니다.

둘째, 「출처 표시」 — 모델이 어느 문서를 참고했는지 보여 줘 신뢰성이 오릅니다.

셋째, 「사내 지식」 — 회사 내부 문서만 검색 대상으로 삼으면 사내 전용 챗봇이 됩니다.



비유하자면 RAG는 「학생이 시험 때 책을 펴 보고 답을 작성하게 하는 오픈북 시험」과 같습니다.

학생이 모든 것을 외울 필요 없이 필요한 자료를 찾아서 답할 수 있어, 정확성과 출처 검증 모두 좋아집니다.



RAG 시스템 구축의 핵심 부품은 「임베딩 모델」, 「벡터 데이터베이스」(Pinecone·Weaviate·Qdrant·Chroma 등), 「청킹 전략」(긴 문서를 어떻게 나눌지), 「리랭커」(검색 결과 재정렬)입니다.

LangChain·LlamaIndex 같은 프레임워크가 이런 부품을 묶어 주는 표준 도구입니다.




한 줄 요약


RAG는 질문 → 임베딩 검색 → 관련 자료 → LLM에 함께 전달의 흐름으로 환각을 줄이고 최신 정보를 활용하는 패턴입니다.

사내 지식 챗봇의 사실상 표준입니다.




더 알아볼 것


- 임베딩 모델 — text-embedding-3·BGE·KoSimCSE

- 벡터 DB 비교 — Pinecone vs Weaviate vs Chroma

- Hybrid Search — 의미 검색 + 키워드 검색

공유하기
목록보기
번호 제목 글쓴이 작성일 조회 좋아요
130 토순이 26/04/27 25 0
129 토순이 26/04/27 22 0
128 멍뭉이 26/04/27 28 0
127 곰돌이 26/04/27 67 0
126 멍뭉이 26/04/27 28 0
125 다람쥐 26/04/27 17 0
124 너구리 26/04/27 18 0
123 다람쥐 26/04/27 16 0
122 부엉이 26/04/27 17 0
121 야옹이 26/04/27 24 0
120 너구리 26/04/27 17 0
119 부엉이 26/04/27 17 0
118 구름이 26/04/27 21 0
117 구름이 26/04/27 18 0
116 부엉이 26/04/27 20 0
115 다람쥐 26/04/27 17 0
114 너구리 26/04/27 21 0
113 토순이 26/04/27 18 0
112 다람쥐 26/04/27 17 0
111 곰돌이 26/04/27 19 0
110 구름이 26/04/27 18 0
109 별님이 26/04/27 19 0
108 야옹이 26/04/27 17 0
107 구름이 26/04/27 18 0
106 부엉이 26/04/27 20 0
105 부엉이 26/04/27 18 0
104 별님이 26/04/27 23 0
103 곰돌이 26/04/27 18 0
102 너구리 26/04/27 18 0
101 토순이 26/04/27 19 0
신고하기

신고 사유를 선택해 주세요.