2024년부터 중국발 오픈 LLM이 빠르게 두각을 드러내고 있습니다.
그중 가장 영향력 있는 두 가족이 알리바바의 「Qwen(천웬)」 시리즈와 「DeepSeek(딥시크)」 시리즈입니다.
Qwen은 2023년부터 알리바바 클라우드가 공개한 모델군으로, 0.5B부터 110B까지 다양한 크기를 제공합니다.
특히 Qwen 2.5 Coder, Qwen2.5-Math 같은 도메인 특화 모델이 강하며, 같은 크기의 Llama와 자주 비교되며 일부 벤치마크에서 앞서기도 합니다.
DeepSeek은 2023년 설립된 중국 AI 헤지펀드의 자회사로, 적은 인력과 자원으로 놀라운 결과를 내며 2024~2025년 큰 화제를 모았습니다.
특히 「DeepSeek V3」(671B MoE, 2024.12)와 「DeepSeek R1」(추론 모델, 2025.1)은 「OpenAI o1과 같은 급의 추론 능력을 1/30 비용으로 학습했다」는 보고로 시장을 흔들었습니다.
비유하자면 중국 오픈 모델의 흐름은 「자동차 산업의 중국 약진」과 비슷합니다.
처음에는 「서구 모델의 모방」이라는 평이 있었지만, 빠르게 자체 혁신을 더해 같은 가격대에서 더 좋은 결과를 내는 단계에 도달했습니다.
가격·효율·빠른 출시 주기가 강점입니다.
지정학적 측면에서는 미국의 GPU 수출 통제가 도리어 중국 모델의 효율 혁신을 가속한 측면이 있습니다.
적은 GPU로 같은 결과를 내려는 압력이 「작은 모델로 큰 효과」를 노리는 알고리즘 혁신을 낳았기 때문입니다.
앞으로의 LLM 경쟁에서 중국 모델의 비중이 더 커질 가능성이 큽니다.
한 줄 요약
Qwen(알리바바)과 DeepSeek은 중국발 오픈 LLM의 대표 주자로, 빠른 발전 속도와 비용 효율 혁신으로 서구 모델과 직접 경쟁하는 단계에 도달했습니다.
더 알아볼 것
- DeepSeek R1 — 1/30 비용 추론 모델
- Qwen 2.5 Coder — 코딩 특화 모델
- 미국 GPU 수출 규제와 중국 AI