사전학습(pre-training)과 미세조정(fine-tuning)

너구리 | 2026.04.27 03:05:40

조회 20 | 추천 0

현대 딥러닝, 특히 LLM은 「두 단계 학습」으로 만들어집니다.

첫 단계가 사전학습(pre-training), 두 번째 단계가 미세조정(fine-tuning)입니다.

이 두 단계의 분리가 깊은 신경망을 일상에서 쓸 수 있게 만든 핵심 비결입니다.

사전학습은 「인터넷 규모의 거대한 데이터로 모델에게 일반적인 언어·세상 지식을 익히게 하는 단계」입니다.

GPT-4 같은 모델은 수조 개의 토큰을 「다음 단어 예측」 같은 단순한 과제로 학습합니다.

이 단계는 수개월·수만 GPU·수억 달러의 비용이 들지만, 한 번 만들어진 결과는 모든 후속 작업에 재사용됩니다.

미세조정은 「사전학습된 모델을 특정 용도에 맞게 다시 한 번 짧게 학습시키는 단계」입니다.

예를 들어 의료 상담봇을 만들고 싶다면 의료 대화 데이터 1만 건 정도로 모델을 추가 학습시킵니다.

사전학습이 이미 「언어와 세상」을 가르쳐 두었기 때문에 작은 데이터로도 큰 효과를 볼 수 있습니다.

비유하자면 사전학습은 「일반 의대 6년 과정」이고, 미세조정은 「특정 전문 분야의 전공의 2~3년 과정」과 비슷합니다.

모든 의사가 의대 6년을 새로 다닐 수 없듯, 모든 회사가 LLM을 처음부터 학습시킬 수는 없습니다.

오늘날 ChatGPT나 Claude가 우리에게 친숙한 형태로 답하게 된 것도 이 두 단계 덕분입니다.

사전학습으로 일반 언어 능력을 쌓은 뒤, RLHF(사람 피드백 강화학습)라는 형태의 미세조정으로 「유용하고 무해한 답」을 내도록 다듬은 결과입니다.

한 줄 요약

사전학습은 인터넷 규모 데이터로 일반 능력을 익히는 거대한 첫 단계, 미세조정은 특정 용도로 짧게 재학습하는 두 번째 단계입니다.

두 단계의 분리가 LLM을 일상으로 가져왔습니다.

더 알아볼 것

- 사전학습의 비용 구조

- Instruction tuning — 지시 따르기 학습

- RLHF — 사람 피드백으로 다듬기

번호	제목	글쓴이	작성일	조회
70	사전학습(pre-training)과 미세조정(fine-tuning)	너구리	26/04/27	20
69	인코더-디코더 구조 정리	곰돌이	26/04/27	20
68	위치 인코딩(positional encoding) — 순서를 어떻게 알려 주는가	햇살이	26/04/27	23
67	Multi-head attention — 여러 시각으로 동시에 보기	다람쥐	26/04/27	20
66	Self-attention — 한 문장 안에서 단어가 서로 보는 법	곰돌이	26/04/27	22
65	Transformer가 RNN을 대체한 이유	별님이	26/04/27	31
64	어텐션(attention) 메커니즘 한 그림으로	너구리	26/04/27	51
63	시퀀스-투-시퀀스(seq2seq) 모델	구름이	26/04/27	22
62	GRU — LSTM을 단순화한 변형	햇살이	26/04/27	19
61	LSTM — RNN의 장기 기억 한계 극복	부엉이	26/04/27	20
60	순환 신경망(RNN)이란	다람쥐	26/04/27	19
59	잔차 연결(residual connection)이 깊은 망을 가능하게 한 이유	구름이	26/04/27	22
58	VGG·GoogLeNet·ResNet 한눈에	곰돌이	26/04/27	30
57	ImageNet과 알렉스넷의 의미 다시 보기	너구리	26/04/27	21
56	CNN 핵심 — 합성곱·풀링·스트라이드	구름이	26/04/27	19
55	합성곱 신경망(CNN)이란	구름이	26/04/27	21
54	가중치 초기화 — Xavier·He	곰돌이	26/04/27	23
53	배치 정규화(batch normalization)	부엉이	26/04/27	20
52	드롭아웃(dropout) — 과적합 방지의 정석	곰돌이	26/04/27	21
51	배치(batch)와 에폭(epoch)의 의미	토순이	26/04/27	21
50	옵티마이저 — SGD·Adam·AdamW 비교	토순이	26/04/27	23
49	역전파(backpropagation) 알고리즘	야옹이	26/04/27	18
48	활성화 함수 — ReLU·Sigmoid·Tanh·GELU	햇살이	26/04/27	24
47	인공 신경망의 기본 구조	야옹이	26/04/27	24
46	퍼셉트론에서 딥러닝까지의 여정	햇살이	26/04/27	22
45	차원 축소(PCA·t-SNE·UMAP) 한눈에	별님이	26/04/27	21
44	데이터 전처리 — 결측치·이상치·표준화	토순이	26/04/27	19
43	ROC 곡선과 AUC	너구리	26/04/27	45
42	혼동 행렬(confusion matrix) 읽는 법	햇살이	26/04/27	19
41	정확도·정밀도·재현율·F1 — 분류 지표 한눈에	다람쥐	26/04/27	20

번호

제목

글쓴이

작성일

조회

사전학습(pre-training)과 미세조정(fine-tuning)

너구리

26/04/27

인코더-디코더 구조 정리

곰돌이

26/04/27

위치 인코딩(positional encoding) — 순서를 어떻게 알려 주는가

햇살이

26/04/27

Multi-head attention — 여러 시각으로 동시에 보기

다람쥐

26/04/27

Self-attention — 한 문장 안에서 단어가 서로 보는 법

곰돌이

26/04/27

Transformer가 RNN을 대체한 이유

별님이

26/04/27

어텐션(attention) 메커니즘 한 그림으로

너구리

26/04/27

시퀀스-투-시퀀스(seq2seq) 모델

구름이

26/04/27

GRU — LSTM을 단순화한 변형

햇살이

26/04/27

LSTM — RNN의 장기 기억 한계 극복

부엉이

26/04/27

순환 신경망(RNN)이란

다람쥐

26/04/27

잔차 연결(residual connection)이 깊은 망을 가능하게 한 이유

구름이

26/04/27

VGG·GoogLeNet·ResNet 한눈에

곰돌이

26/04/27

ImageNet과 알렉스넷의 의미 다시 보기

너구리

26/04/27

CNN 핵심 — 합성곱·풀링·스트라이드

구름이

26/04/27

합성곱 신경망(CNN)이란

구름이

26/04/27

가중치 초기화 — Xavier·He

곰돌이

26/04/27

배치 정규화(batch normalization)

부엉이

26/04/27

드롭아웃(dropout) — 과적합 방지의 정석

곰돌이

26/04/27

배치(batch)와 에폭(epoch)의 의미

토순이

26/04/27

옵티마이저 — SGD·Adam·AdamW 비교

토순이

26/04/27

역전파(backpropagation) 알고리즘

야옹이

26/04/27

활성화 함수 — ReLU·Sigmoid·Tanh·GELU

햇살이

26/04/27

인공 신경망의 기본 구조

야옹이

26/04/27

퍼셉트론에서 딥러닝까지의 여정

햇살이

26/04/27

차원 축소(PCA·t-SNE·UMAP) 한눈에

별님이

26/04/27

데이터 전처리 — 결측치·이상치·표준화

토순이

26/04/27

ROC 곡선과 AUC

너구리

26/04/27

혼동 행렬(confusion matrix) 읽는 법

햇살이

26/04/27

정확도·정밀도·재현율·F1 — 분류 지표 한눈에

다람쥐

26/04/27