질의응답(Q&A) 시스템은 「사용자가 자연어로 질문하면 AI가 자료를 바탕으로 답을 만들어 주는」 시스템입니다.
사내 위키 챗봇, 고객 응대 봇, 학습 도우미, 의료 상담 보조 등 응용이 폭넓습니다.
Q&A는 두 가지 방식으로 나뉩니다.
첫째, 「추출형 Q&A(Extractive)」 — 주어진 문서에서 답이 되는 정확한 구절을 찾아 그대로 인용합니다.
정답이 자료 안에 명시적으로 있는 경우에 강하며, SQuAD 같은 표준 벤치마크에서 BERT가 사람 수준의 점수를 기록했습니다.
둘째, 「생성형 Q&A(Generative)」 — 자료를 이해한 뒤 자연스러운 답변을 새로 만들어 냅니다.
자료에 명시되지 않은 「추론이 필요한 답」을 만들 수 있고, 친화적인 대화 형식이 가능합니다.
ChatGPT·Claude의 답변이 모두 생성형입니다.
현재 가장 흔한 구현은 「RAG(Retrieval-Augmented Generation)」입니다.
사용자 질문을 받으면 먼저 사내 문서·웹·지식 베이스에서 관련 자료를 검색해 가져온 뒤, 그 자료를 바탕으로 LLM이 답을 만들어 냅니다.
환각을 줄이고 출처를 표시할 수 있는 장점이 있습니다.
Q&A 시스템 구축의 핵심은 「검색의 품질」입니다.
LLM이 아무리 똑똑해도 잘못된 자료를 검색해 오면 잘못된 답을 합니다.
임베딩 모델 선택, 청킹 전략, 리랭킹, 메타데이터 필터링 같은 검색 파이프라인 설계가 결과의 품질을 좌우합니다.
한 줄 요약
Q&A 시스템은 추출형(자료에서 답 인용)과 생성형(새 문장으로 답 생성)으로 나뉩니다.
현재는 RAG 기반의 생성형이 주류이며, 검색 품질이 답의 신뢰성을 결정합니다.
더 알아볼 것
- SQuAD — 추출형 Q&A 표준 벤치마크
- 오픈 도메인 Q&A vs 문서 기반 Q&A
- Conversational Q&A — 대화 맥락을 유지하는 Q&A