인공지능(AI)

LLM(거대 언어 모델)이란 무엇인가

토순이 | 2026.04.27 03:18:53

조회 20 | 추천 0

LLM(Large Language Model, 거대 언어 모델)은 「수백억~수조 개의 파라미터를 가지고 인터넷 규모의 텍스트로 학습된 언어 모델」을 가리킵니다.

ChatGPT·Claude·Gemini가 모두 LLM이고, 현재 AI 분야의 가장 활발한 연구 영역입니다.

「Large」가 뜻하는 크기에는 두 가지 축이 있습니다.

첫째, 파라미터 수 — 보통 70억(7B) 이상이면 LLM으로 부릅니다.

둘째, 학습 데이터 — 수조 개의 토큰으로 학습됩니다.

GPT-4는 추정 1조 7천억 파라미터, Llama 3 405B는 4,050억 파라미터를 가집니다.

LLM의 학습 과제는 의외로 단순합니다.

「긴 문장이 주어지면 다음 단어를 예측하는」 일입니다.

「오늘 날씨가 ___」에서 빈칸을 「좋다」, 「흐리다」 같은 단어로 메우는 식입니다.

인터넷의 모든 텍스트로 이 단순한 과제를 거대 규모로 반복하면, 결과적으로 모델이 언어·세상 지식·추론 능력까지 익히게 됩니다.

비유하자면 LLM은 「인류가 쓴 거의 모든 텍스트를 다 읽고, 다음 한 단어가 무엇일지 매번 맞히는 연습을 수조 번 한 학생」과 같습니다.

그 연습의 부산물로 문법·상식·역사·과학·코딩까지 다양한 능력이 자연스럽게 만들어집니다.

다만 LLM은 「지식 베이스」가 아니라 「확률 모델」이라는 점을 잊으면 안 됩니다.

사실을 외워서 답하는 게 아니라 「가장 그럴듯한 다음 단어」를 예측할 뿐입니다.

그래서 사실에 어긋나는 그럴듯한 답(환각)을 내기도 하고, 학습 데이터에 없는 최신 정보는 모릅니다.

한 줄 요약

LLM은 수백억~수조 파라미터의 거대 언어 모델로, 「다음 단어 예측」이라는 단순한 과제를 인터넷 규모로 학습한 결과 언어·지식·추론 능력을 함께 얻은 모델입니다.

더 알아볼 것

- 스케일링 법칙(Scaling Law) — 크기와 성능의 관계

- Emergent abilities — 크기가 만들어 내는 새 능력

- Foundation Model — LLM을 포함한 더 큰 개념

아뢰옵기도 송구한 히미즈의 신이시여 — 스즈메의 문단속 [1]

장례식은 반드시 가야하는 이유.jpg [1]

목록보기

번호	제목	글쓴이	작성일	조회
130	LLM 평가 — MMLU·HumanEval·GPQA 등 주요 벤치마크	토순이	26/04/27	25
129	양자화(quantization) — 모델을 가볍게	토순이	26/04/27	22
128	작은 LLM(SLM) — 7B·13B·70B의 의미	멍뭉이	26/04/27	28
127	추론(reasoning) 모델 — o1·o3·Claude 등의 변화	곰돌이	26/04/27	67
126	코드 생성 — Copilot·Cursor·Claude Code	멍뭉이	26/04/27	28
125	멀티모달 — 텍스트·이미지·음성을 함께	다람쥐	26/04/27	17
124	MCP — 모델·도구 연결의 새 표준	너구리	26/04/27	18
123	함수 호출(function calling) — 구조화된 출력	다람쥐	26/04/27	16
122	에이전트(Agent) — LLM이 도구를 쓰는 법	부엉이	26/04/27	17
121	Constitutional AI — 안전성 학습의 새 길	야옹이	26/04/27	24
120	DPO — RLHF의 더 단순한 대안	너구리	26/04/27	17
119	RLHF — 사람 피드백으로 모델을 다듬는 법	부엉이	26/04/27	17
118	파인튜닝의 종류 — Full·LoRA·QLoRA	구름이	26/04/27	21
117	임베딩 모델과 벡터 데이터베이스	구름이	26/04/27	18
116	RAG — 검색으로 환각을 줄이기	부엉이	26/04/27	20
115	환각(hallucination)이 일어나는 이유	다람쥐	26/04/27	17
114	ReAct — 추론과 행동을 함께	너구리	26/04/27	21
113	Chain-of-Thought 프롬프팅 — 단계적으로 생각하기	토순이	26/04/27	18
112	Few-shot 프롬프팅 — 예시로 가르치기	다람쥐	26/04/27	17
111	시스템 프롬프트와 유저 프롬프트의 역할	곰돌이	26/04/27	19
110	프롬프트 엔지니어링 7가지 기본 패턴	구름이	26/04/27	18
109	컨텍스트 윈도우 — 1M 토큰의 의미	별님이	26/04/27	19
108	폐쇄 모델 vs 오픈 모델 — 어떻게 다른가	야옹이	26/04/27	17
107	Qwen·DeepSeek — 중국 오픈 모델의 성장	구름이	26/04/27	18
106	Mistral·Mixtral — 유럽발 오픈 모델	부엉이	26/04/27	20
105	Llama 시리즈(Meta) — 오픈웨이트의 표준	부엉이	26/04/27	18
104	Gemini(Google) — 멀티모달 강자	별님이	26/04/27	23
103	Claude(Anthropic) — 어떻게 다른가	곰돌이	26/04/27	18
102	GPT-4 — 무엇이 달라졌나	너구리	26/04/27	18
101	LLM(거대 언어 모델)이란 무엇인가	토순이	26/04/27	20

글쓰기

신고하기

신고 사유를 선택해 주세요.