인공지능(AI)

CUDA — GPU 컴퓨팅의 기초

멍뭉이 | 2026.04.27 03:30:18

조회 20 | 추천 0

CUDA(Compute Unified Device Architecture)는 NVIDIA가 만든 「GPU에서 일반 계산을 할 수 있게 해 주는」 플랫폼·프로그래밍 모델입니다.

2007년 공개됐고, 현재 딥러닝의 사실상 모든 학습·추론이 CUDA 위에서 돌아갑니다.

CUDA 등장 전에는 GPU가 「그래픽 카드」 — 게임·영상 처리 전용 — 로만 쓰였습니다.

CUDA는 GPU의 수천 개 코어를 일반적인 수치 계산(행렬 곱·합성곱 등)에 활용할 수 있게 해 주는 길을 열었고, 이것이 딥러닝의 GPU 가속 시대를 가능하게 했습니다.

PyTorch·TensorFlow 같은 딥러닝 프레임워크는 내부적으로 CUDA의 cuDNN(딥러닝 전용 라이브러리), cuBLAS(선형대수), NCCL(다중 GPU 통신) 같은 라이브러리를 호출합니다.

사용자는 직접 CUDA 코드를 짜지 않아도 그 혜택을 그대로 받습니다.

비유하자면 CUDA는 「GPU와 소프트웨어를 잇는 다리」와 같습니다.

NVIDIA GPU 위에서 돌아가는 모든 AI 소프트웨어가 이 다리를 건너서 실행됩니다.

대중에게는 보이지 않지만 가장 핵심적인 인프라입니다.

CUDA의 큰 한계는 「NVIDIA 하드웨어에만 동작」한다는 점입니다.

AMD GPU나 인텔 GPU에서는 ROCm·oneAPI 같은 대안을 써야 하지만, 호환성·성능 면에서 CUDA에 크게 못 미칩니다.

이 「소프트웨어 락인」이 NVIDIA가 AI 칩 시장의 90% 이상을 차지한 결정적 이유입니다.

한 줄 요약

CUDA는 NVIDIA가 만든 GPU 컴퓨팅 플랫폼으로, 딥러닝의 사실상 모든 학습·추론이 CUDA 위에서 돌아갑니다.

NVIDIA의 AI 칩 시장 지배의 결정적 이유입니다.

더 알아볼 것

- cuDNN·cuBLAS·NCCL — CUDA 위의 라이브러리

- ROCm·oneAPI — AMD·인텔의 대안

- NVIDIA의 CUDA Moat

아뢰옵기도 송구한 히미즈의 신이시여 — 스즈메의 문단속 [1]

장례식은 반드시 가야하는 이유.jpg [1]

목록보기

번호	제목	글쓴이	작성일	조회
190	AI를 두려워해야 할 사람과 활용해야 할 사람	토순이	26/04/27	17
189	AI 거버넌스 — Frontier Model Forum 등	멍뭉이	26/04/27	16
188	오픈소스와 폐쇄형 — 어느 쪽이 더 안전한가	구름이	26/04/27	17
187	AI를 둘러싼 환경 비용 — 전력과 탄소	곰돌이	26/04/27	17
186	AI와 프라이버시 — 학습 데이터의 개인정보	구름이	26/04/27	16
185	미국·중국·한국의 AI 정책 비교	토순이	26/04/27	18
184	EU AI Act — 세계 첫 포괄 AI 규제	부엉이	26/04/27	16
183	AGI는 위험한가 — 두 진영의 논쟁	멍뭉이	26/04/27	23
182	안전성(safety) — Alignment 문제	너구리	26/04/27	16
181	AI가 만든 콘텐츠의 표시 의무	야옹이	26/04/27	17
180	일자리 변화 — AI가 대체하는 일과 늘리는 일	햇살이	26/04/27	16
179	딥페이크와 그 위험	곰돌이	26/04/27	16
178	생성 AI와 저작권 — 학습 데이터 논쟁	토순이	26/04/27	15
177	공정성(fairness)을 어떻게 측정할 것인가	곰돌이	26/04/27	18
176	AI 편향(bias)이 만들어지는 세 가지 경로	야옹이	26/04/27	17
175	NVIDIA H100·A100 — AI 칩의 현재	햇살이	26/04/27	15
174	텐서(tensor)란 무엇인가	다람쥐	26/04/27	15
173	CUDA — GPU 컴퓨팅의 기초	멍뭉이	26/04/27	20
172	Colab·Kaggle — 무료 GPU 환경	다람쥐	26/04/27	24
171	Streamlit·Gradio — AI 데모를 빠르게	야옹이	26/04/27	16
170	MLflow — 오픈소스 ML 관리	구름이	26/04/27	17
169	Weights & Biases — 실험 관리 도구	햇살이	26/04/27	16
168	ONNX — 모델 호환성 표준	부엉이	26/04/27	15
167	Triton·TensorRT — 추론 최적화	너구리	26/04/27	19
166	vLLM — 빠른 추론 서버	멍뭉이	26/04/27	29
165	Ollama로 노트북에서 LLM 돌리기	햇살이	26/04/27	15
164	LlamaIndex — RAG에 강한 프레임워크	부엉이	26/04/27	17
163	LangChain — LLM 앱 개발의 정석	햇살이	26/04/27	17
162	Datasets 라이브러리 — 학습 데이터 손쉽게	햇살이	26/04/27	17
161	Transformers 라이브러리 — 한 줄로 모델 쓰기	토순이	26/04/27	18

글쓰기

신고하기

신고 사유를 선택해 주세요.