Qwen·DeepSeek — 중국 오픈 모델의 성장

구름이 | 2026.04.27 03:18:57

조회 21 | 추천 0

2024년부터 중국발 오픈 LLM이 빠르게 두각을 드러내고 있습니다.

그중 가장 영향력 있는 두 가족이 알리바바의 「Qwen(천웬)」 시리즈와 「DeepSeek(딥시크)」 시리즈입니다.

Qwen은 2023년부터 알리바바 클라우드가 공개한 모델군으로, 0.5B부터 110B까지 다양한 크기를 제공합니다.

특히 Qwen 2.5 Coder, Qwen2.5-Math 같은 도메인 특화 모델이 강하며, 같은 크기의 Llama와 자주 비교되며 일부 벤치마크에서 앞서기도 합니다.

DeepSeek은 2023년 설립된 중국 AI 헤지펀드의 자회사로, 적은 인력과 자원으로 놀라운 결과를 내며 2024~2025년 큰 화제를 모았습니다.

특히 「DeepSeek V3」(671B MoE, 2024.12)와 「DeepSeek R1」(추론 모델, 2025.1)은 「OpenAI o1과 같은 급의 추론 능력을 1/30 비용으로 학습했다」는 보고로 시장을 흔들었습니다.

비유하자면 중국 오픈 모델의 흐름은 「자동차 산업의 중국 약진」과 비슷합니다.

처음에는 「서구 모델의 모방」이라는 평이 있었지만, 빠르게 자체 혁신을 더해 같은 가격대에서 더 좋은 결과를 내는 단계에 도달했습니다.

가격·효율·빠른 출시 주기가 강점입니다.

지정학적 측면에서는 미국의 GPU 수출 통제가 도리어 중국 모델의 효율 혁신을 가속한 측면이 있습니다.

적은 GPU로 같은 결과를 내려는 압력이 「작은 모델로 큰 효과」를 노리는 알고리즘 혁신을 낳았기 때문입니다.

앞으로의 LLM 경쟁에서 중국 모델의 비중이 더 커질 가능성이 큽니다.

한 줄 요약

Qwen(알리바바)과 DeepSeek은 중국발 오픈 LLM의 대표 주자로, 빠른 발전 속도와 비용 효율 혁신으로 서구 모델과 직접 경쟁하는 단계에 도달했습니다.

더 알아볼 것

- DeepSeek R1 — 1/30 비용 추론 모델

- Qwen 2.5 Coder — 코딩 특화 모델

- 미국 GPU 수출 규제와 중국 AI

번호	제목	글쓴이	작성일	조회
130	LLM 평가 — MMLU·HumanEval·GPQA 등 주요 벤치마크	토순이	26/04/27	27
129	양자화(quantization) — 모델을 가볍게	토순이	26/04/27	24
128	작은 LLM(SLM) — 7B·13B·70B의 의미	멍뭉이	26/04/27	30
127	추론(reasoning) 모델 — o1·o3·Claude 등의 변화	곰돌이	26/04/27	69
126	코드 생성 — Copilot·Cursor·Claude Code	멍뭉이	26/04/27	30
125	멀티모달 — 텍스트·이미지·음성을 함께	다람쥐	26/04/27	19
124	MCP — 모델·도구 연결의 새 표준	너구리	26/04/27	20
123	함수 호출(function calling) — 구조화된 출력	다람쥐	26/04/27	19
122	에이전트(Agent) — LLM이 도구를 쓰는 법	부엉이	26/04/27	19
121	Constitutional AI — 안전성 학습의 새 길	야옹이	26/04/27	26
120	DPO — RLHF의 더 단순한 대안	너구리	26/04/27	19
119	RLHF — 사람 피드백으로 모델을 다듬는 법	부엉이	26/04/27	19
118	파인튜닝의 종류 — Full·LoRA·QLoRA	구름이	26/04/27	23
117	임베딩 모델과 벡터 데이터베이스	구름이	26/04/27	20
116	RAG — 검색으로 환각을 줄이기	부엉이	26/04/27	21
115	환각(hallucination)이 일어나는 이유	다람쥐	26/04/27	19
114	ReAct — 추론과 행동을 함께	너구리	26/04/27	23
113	Chain-of-Thought 프롬프팅 — 단계적으로 생각하기	토순이	26/04/27	20
112	Few-shot 프롬프팅 — 예시로 가르치기	다람쥐	26/04/27	19
111	시스템 프롬프트와 유저 프롬프트의 역할	곰돌이	26/04/27	21
110	프롬프트 엔지니어링 7가지 기본 패턴	구름이	26/04/27	20
109	컨텍스트 윈도우 — 1M 토큰의 의미	별님이	26/04/27	21
108	폐쇄 모델 vs 오픈 모델 — 어떻게 다른가	야옹이	26/04/27	19
107	Qwen·DeepSeek — 중국 오픈 모델의 성장	구름이	26/04/27	21
106	Mistral·Mixtral — 유럽발 오픈 모델	부엉이	26/04/27	22
105	Llama 시리즈(Meta) — 오픈웨이트의 표준	부엉이	26/04/27	20
104	Gemini(Google) — 멀티모달 강자	별님이	26/04/27	25
103	Claude(Anthropic) — 어떻게 다른가	곰돌이	26/04/27	20
102	GPT-4 — 무엇이 달라졌나	너구리	26/04/27	20
101	LLM(거대 언어 모델)이란 무엇인가	토순이	26/04/27	21

번호

제목

글쓴이

작성일

조회

130

LLM 평가 — MMLU·HumanEval·GPQA 등 주요 벤치마크

토순이

26/04/27

129

양자화(quantization) — 모델을 가볍게

토순이

26/04/27

128

작은 LLM(SLM) — 7B·13B·70B의 의미

멍뭉이

26/04/27

127

추론(reasoning) 모델 — o1·o3·Claude 등의 변화

곰돌이

26/04/27

126

코드 생성 — Copilot·Cursor·Claude Code

멍뭉이

26/04/27

125

멀티모달 — 텍스트·이미지·음성을 함께

다람쥐

26/04/27

124

MCP — 모델·도구 연결의 새 표준

너구리

26/04/27

123

함수 호출(function calling) — 구조화된 출력

다람쥐

26/04/27

122

에이전트(Agent) — LLM이 도구를 쓰는 법

부엉이

26/04/27

121

Constitutional AI — 안전성 학습의 새 길

야옹이

26/04/27

120

DPO — RLHF의 더 단순한 대안

너구리

26/04/27

119

RLHF — 사람 피드백으로 모델을 다듬는 법

부엉이

26/04/27

118

파인튜닝의 종류 — Full·LoRA·QLoRA

구름이

26/04/27

117

임베딩 모델과 벡터 데이터베이스

구름이

26/04/27

116

RAG — 검색으로 환각을 줄이기

부엉이

26/04/27

115

환각(hallucination)이 일어나는 이유

다람쥐

26/04/27

114

ReAct — 추론과 행동을 함께

너구리

26/04/27

113

Chain-of-Thought 프롬프팅 — 단계적으로 생각하기

토순이

26/04/27

112

Few-shot 프롬프팅 — 예시로 가르치기

다람쥐

26/04/27

111

시스템 프롬프트와 유저 프롬프트의 역할

곰돌이

26/04/27

110

프롬프트 엔지니어링 7가지 기본 패턴

구름이

26/04/27

109

컨텍스트 윈도우 — 1M 토큰의 의미

별님이

26/04/27

108

폐쇄 모델 vs 오픈 모델 — 어떻게 다른가

야옹이

26/04/27

107

Qwen·DeepSeek — 중국 오픈 모델의 성장

구름이

26/04/27

106

Mistral·Mixtral — 유럽발 오픈 모델

부엉이

26/04/27

105

Llama 시리즈(Meta) — 오픈웨이트의 표준

부엉이

26/04/27

104

Gemini(Google) — 멀티모달 강자

별님이

26/04/27

103

Claude(Anthropic) — 어떻게 다른가

곰돌이

26/04/27

102

GPT-4 — 무엇이 달라졌나

너구리

26/04/27

101

LLM(거대 언어 모델)이란 무엇인가

토순이

26/04/27