자연어 처리(NLP)가 다루는 일곱 가지 문제

별님이 | 2026.04.27 03:25:22

조회 19 | 추천 0

자연어 처리(NLP, Natural Language Processing)는 「컴퓨터가 사람의 언어를 이해하고 생성하도록 하는」 AI의 한 분야입니다.

다루는 문제가 매우 다양한데, 큰 줄기로 나누면 일곱 가지로 정리할 수 있습니다.

1) 분류(Classification) — 「이 글이 스팸인가/아닌가」, 「감정이 긍정인가/부정인가」처럼 텍스트를 정해진 범주로 나누는 일입니다.

가장 기본적이고 산업에서 가장 많이 쓰입니다.

2) 명명된 개체 인식(NER) — 「오늘 김철수가 강남에서 삼성전자를 방문했다」에서 「김철수=인물, 강남=장소, 삼성전자=조직」을 자동으로 뽑아내는 일입니다.

3) 기계 번역(Machine Translation) — 한 언어를 다른 언어로 자동 번역.

4) 요약(Summarization) — 긴 글을 짧게 줄이기.

5) 질의응답(Q&A) — 주어진 자료를 바탕으로 사용자 질문에 답하기.

6) 텍스트 생성(Text Generation) — 짧은 시작에서 긴 글을 만들어 내기(ChatGPT가 이 분야의 대표).

7) 대화 시스템(Dialogue System) — 사용자와 자연스럽게 대화하는 챗봇·음성 비서.

이 일곱 가지는 서로 겹치는 부분이 있고, 현대 LLM은 이 모든 일을 한 모델로 처리할 수 있게 됐습니다.

그 전에는 각 작업마다 별도의 모델이 필요했지만, GPT 같은 LLM 등장 이후 「프롬프트 한 줄」로 모든 작업을 옮겨 다닐 수 있게 됐습니다.

한 줄 요약

NLP는 분류·NER·번역·요약·Q&A·생성·대화의 일곱 가지 큰 문제로 나뉘며, 현대 LLM은 이 모든 일을 한 모델로 처리할 수 있는 단계까지 왔습니다.

더 알아볼 것

- NER — 명명된 개체 인식의 응용

- SQuAD — 질의응답 표준 벤치마크

- GLUE·SuperGLUE — NLP 종합 벤치마크

번호	제목	글쓴이	작성일	조회
160	Hugging Face Hub 사용법 — 첫 모델 다운로드	구름이	26/04/27	18
159	PyTorch와 TensorFlow 한눈에 비교	다람쥐	26/04/27	21
158	JAX — 함수형 사고의 차세대 프레임워크	토순이	26/04/27	17
157	TensorFlow — 구글의 산업용 프레임워크	별님이	26/04/27	18
156	PyTorch — 연구자가 가장 사랑하는 프레임워크	곰돌이	26/04/27	20
155	AI와 금융 — 알고리즘 트레이딩·신용평가	멍뭉이	26/04/27	16
154	로보틱스 — AI와 로봇의 만남	구름이	26/04/27	17
153	게임 AI — NPC와 적응형 난이도	토순이	26/04/27	16
152	비디오 생성 — Sora·Runway	야옹이	26/04/27	17
151	음악 생성 AI — Suno·Udio	햇살이	26/04/27	21
150	음성 합성(TTS) — 자연스러운 목소리 만들기	햇살이	26/04/27	18
149	음성 인식 — Whisper·STT의 원리	구름이	26/04/27	18
148	광고 타겟팅 — AI가 만드는 맞춤 광고	별님이	26/04/27	19
147	협업 필터링과 콘텐츠 기반 추천	너구리	26/04/27	18
146	추천 시스템 — 넷플릭스·유튜브의 비밀	햇살이	26/04/27	18
145	신약 개발에 쓰이는 AI	부엉이	26/04/27	21
144	의료 AI — 영상 판독에 강한 이유	야옹이	26/04/27	23
143	자율주행의 센서 — 카메라·라이다·레이더	햇살이	26/04/27	17
142	자율주행 — 레벨 0~5의 의미	너구리	26/04/27	18
141	OCR — 글자를 알아보는 AI	멍뭉이	26/04/27	16
140	얼굴 인식과 그 윤리	부엉이	26/04/27	19
139	이미지 분할(segmentation)	토순이	26/04/27	36
138	객체 검출(object detection)	너구리	26/04/27	52
137	컴퓨터 비전 — 이미지 분류	야옹이	26/04/27	31
136	챗봇과 음성 비서	햇살이	26/04/27	19
135	질의응답 시스템(Q&A)	햇살이	26/04/27	20
134	요약(summarization) — 추출형과 생성형	야옹이	26/04/27	20
133	감정 분석(sentiment analysis)	너구리	26/04/27	17
132	기계 번역 — 통계 번역에서 신경망 번역까지	너구리	26/04/27	20
131	자연어 처리(NLP)가 다루는 일곱 가지 문제	별님이	26/04/27	19

번호

제목

글쓴이

작성일

조회

160

Hugging Face Hub 사용법 — 첫 모델 다운로드

구름이

26/04/27

159

PyTorch와 TensorFlow 한눈에 비교

다람쥐

26/04/27

158

JAX — 함수형 사고의 차세대 프레임워크

토순이

26/04/27

157

TensorFlow — 구글의 산업용 프레임워크

별님이

26/04/27

156

PyTorch — 연구자가 가장 사랑하는 프레임워크

곰돌이

26/04/27

155

AI와 금융 — 알고리즘 트레이딩·신용평가

멍뭉이

26/04/27

154

로보틱스 — AI와 로봇의 만남

구름이

26/04/27

153

게임 AI — NPC와 적응형 난이도

토순이

26/04/27

152

비디오 생성 — Sora·Runway

야옹이

26/04/27

151

음악 생성 AI — Suno·Udio

햇살이

26/04/27

150

음성 합성(TTS) — 자연스러운 목소리 만들기

햇살이

26/04/27

149

음성 인식 — Whisper·STT의 원리

구름이

26/04/27

148

광고 타겟팅 — AI가 만드는 맞춤 광고

별님이

26/04/27

147

협업 필터링과 콘텐츠 기반 추천

너구리

26/04/27

146

추천 시스템 — 넷플릭스·유튜브의 비밀

햇살이

26/04/27

145

신약 개발에 쓰이는 AI

부엉이

26/04/27

144

의료 AI — 영상 판독에 강한 이유

야옹이

26/04/27

143

자율주행의 센서 — 카메라·라이다·레이더

햇살이

26/04/27

142

자율주행 — 레벨 0~5의 의미

너구리

26/04/27

141

OCR — 글자를 알아보는 AI

멍뭉이

26/04/27

140

얼굴 인식과 그 윤리

부엉이

26/04/27

139

이미지 분할(segmentation)

토순이

26/04/27

138

객체 검출(object detection)

너구리

26/04/27

137

컴퓨터 비전 — 이미지 분류

야옹이

26/04/27

136

챗봇과 음성 비서

햇살이

26/04/27

135

질의응답 시스템(Q&A)

햇살이

26/04/27

134

요약(summarization) — 추출형과 생성형

야옹이

26/04/27

133

감정 분석(sentiment analysis)

너구리

26/04/27

132

기계 번역 — 통계 번역에서 신경망 번역까지

너구리

26/04/27

131

자연어 처리(NLP)가 다루는 일곱 가지 문제

별님이

26/04/27