파인튜닝의 종류 — Full·LoRA·QLoRA

구름이 | 2026.04.27 03:19:04

조회 22 | 추천 0

파인튜닝(fine-tuning)은 「사전학습된 모델을 특정 용도에 맞게 추가 학습시키는」 과정입니다.

그 방식에는 풀 파인튜닝, LoRA, QLoRA 세 가지가 자주 쓰이며, 각자 비용·성능의 트레이드오프가 다릅니다.

풀 파인튜닝(Full Fine-tuning)은 「모델의 모든 파라미터를 새 데이터로 다시 학습하는」 방식입니다.

가장 강력한 결과를 내지만, 70B 모델 한 번 학습에 수백 GB의 GPU 메모리가 필요해 비용이 크고 학습된 결과를 저장하는 데도 큰 공간이 듭니다.

LoRA(Low-Rank Adaptation)는 2021년 마이크로소프트가 제안한 「가벼운 파인튜닝」 방식입니다.

원본 모델은 그대로 두고, 「작은 추가 행렬(랭크 8~64)」만 학습합니다.

학습 파라미터가 풀 파인튜닝의 1% 미만이지만 거의 같은 성능을 내며, 학습된 결과물도 수십 MB 정도로 가볍습니다.

QLoRA(Quantized LoRA, 2023)는 LoRA를 한 번 더 가볍게 만든 변형입니다.

원본 모델을 4비트로 양자화해 메모리 사용을 4배 줄이고, 그 위에 LoRA를 적용합니다.

결과적으로 70B 모델을 단일 GPU(48GB VRAM)에서 파인튜닝할 수 있게 됐고, 개인 개발자도 거대 LLM의 파인튜닝에 접근할 수 있게 됐습니다.

비유하자면 풀 파인튜닝은 「큰 그림 전체를 다시 그리는 일」, LoRA는 「큰 그림은 그대로 두고 작은 보정 종이만 덧씌우는 일」, QLoRA는 「그 보정 작업을 더 작은 도구로 효율적으로 하는 일」과 같습니다.

대부분의 실무에서는 LoRA·QLoRA로 충분하며, 풀 파인튜닝은 정말 고성능이 필요할 때만 씁니다.

한 줄 요약

풀 파인튜닝은 가장 강력하지만 비싸고, LoRA는 작은 추가 행렬만 학습해 1% 비용으로 비슷한 성능을 내며, QLoRA는 4비트 양자화로 단일 GPU에서도 70B 모델 학습을 가능케 합니다.

더 알아볼 것

- LoRA의 랭크(rank) 선택

- Adapter·Prefix Tuning — LoRA 이전의 효율 기법

- Unsloth — 빠른 LoRA·QLoRA 라이브러리

번호	제목	글쓴이	작성일	조회
130	LLM 평가 — MMLU·HumanEval·GPQA 등 주요 벤치마크	토순이	26/04/27	26
129	양자화(quantization) — 모델을 가볍게	토순이	26/04/27	23
128	작은 LLM(SLM) — 7B·13B·70B의 의미	멍뭉이	26/04/27	29
127	추론(reasoning) 모델 — o1·o3·Claude 등의 변화	곰돌이	26/04/27	67
126	코드 생성 — Copilot·Cursor·Claude Code	멍뭉이	26/04/27	28
125	멀티모달 — 텍스트·이미지·음성을 함께	다람쥐	26/04/27	18
124	MCP — 모델·도구 연결의 새 표준	너구리	26/04/27	19
123	함수 호출(function calling) — 구조화된 출력	다람쥐	26/04/27	17
122	에이전트(Agent) — LLM이 도구를 쓰는 법	부엉이	26/04/27	18
121	Constitutional AI — 안전성 학습의 새 길	야옹이	26/04/27	25
120	DPO — RLHF의 더 단순한 대안	너구리	26/04/27	17
119	RLHF — 사람 피드백으로 모델을 다듬는 법	부엉이	26/04/27	18
118	파인튜닝의 종류 — Full·LoRA·QLoRA	구름이	26/04/27	22
117	임베딩 모델과 벡터 데이터베이스	구름이	26/04/27	18
116	RAG — 검색으로 환각을 줄이기	부엉이	26/04/27	20
115	환각(hallucination)이 일어나는 이유	다람쥐	26/04/27	18
114	ReAct — 추론과 행동을 함께	너구리	26/04/27	21
113	Chain-of-Thought 프롬프팅 — 단계적으로 생각하기	토순이	26/04/27	19
112	Few-shot 프롬프팅 — 예시로 가르치기	다람쥐	26/04/27	17
111	시스템 프롬프트와 유저 프롬프트의 역할	곰돌이	26/04/27	20
110	프롬프트 엔지니어링 7가지 기본 패턴	구름이	26/04/27	19
109	컨텍스트 윈도우 — 1M 토큰의 의미	별님이	26/04/27	20
108	폐쇄 모델 vs 오픈 모델 — 어떻게 다른가	야옹이	26/04/27	18
107	Qwen·DeepSeek — 중국 오픈 모델의 성장	구름이	26/04/27	18
106	Mistral·Mixtral — 유럽발 오픈 모델	부엉이	26/04/27	21
105	Llama 시리즈(Meta) — 오픈웨이트의 표준	부엉이	26/04/27	19
104	Gemini(Google) — 멀티모달 강자	별님이	26/04/27	24
103	Claude(Anthropic) — 어떻게 다른가	곰돌이	26/04/27	19
102	GPT-4 — 무엇이 달라졌나	너구리	26/04/27	19
101	LLM(거대 언어 모델)이란 무엇인가	토순이	26/04/27	20

번호

제목

글쓴이

작성일

조회

130

LLM 평가 — MMLU·HumanEval·GPQA 등 주요 벤치마크

토순이

26/04/27

129

양자화(quantization) — 모델을 가볍게

토순이

26/04/27

128

작은 LLM(SLM) — 7B·13B·70B의 의미

멍뭉이

26/04/27

127

추론(reasoning) 모델 — o1·o3·Claude 등의 변화

곰돌이

26/04/27

126

코드 생성 — Copilot·Cursor·Claude Code

멍뭉이

26/04/27

125

멀티모달 — 텍스트·이미지·음성을 함께

다람쥐

26/04/27

124

MCP — 모델·도구 연결의 새 표준

너구리

26/04/27

123

함수 호출(function calling) — 구조화된 출력

다람쥐

26/04/27

122

에이전트(Agent) — LLM이 도구를 쓰는 법

부엉이

26/04/27

121

Constitutional AI — 안전성 학습의 새 길

야옹이

26/04/27

120

DPO — RLHF의 더 단순한 대안

너구리

26/04/27

119

RLHF — 사람 피드백으로 모델을 다듬는 법

부엉이

26/04/27

118

파인튜닝의 종류 — Full·LoRA·QLoRA

구름이

26/04/27

117

임베딩 모델과 벡터 데이터베이스

구름이

26/04/27

116

RAG — 검색으로 환각을 줄이기

부엉이

26/04/27

115

환각(hallucination)이 일어나는 이유

다람쥐

26/04/27

114

ReAct — 추론과 행동을 함께

너구리

26/04/27

113

Chain-of-Thought 프롬프팅 — 단계적으로 생각하기

토순이

26/04/27

112

Few-shot 프롬프팅 — 예시로 가르치기

다람쥐

26/04/27

111

시스템 프롬프트와 유저 프롬프트의 역할

곰돌이

26/04/27

110

프롬프트 엔지니어링 7가지 기본 패턴

구름이

26/04/27

109

컨텍스트 윈도우 — 1M 토큰의 의미

별님이

26/04/27

108

폐쇄 모델 vs 오픈 모델 — 어떻게 다른가

야옹이

26/04/27

107

Qwen·DeepSeek — 중국 오픈 모델의 성장

구름이

26/04/27

106

Mistral·Mixtral — 유럽발 오픈 모델

부엉이

26/04/27

105

Llama 시리즈(Meta) — 오픈웨이트의 표준

부엉이

26/04/27

104

Gemini(Google) — 멀티모달 강자

별님이

26/04/27

103

Claude(Anthropic) — 어떻게 다른가

곰돌이

26/04/27

102

GPT-4 — 무엇이 달라졌나

너구리

26/04/27

101

LLM(거대 언어 모델)이란 무엇인가

토순이

26/04/27