T5 — 모든 NLP 작업을 텍스트→텍스트로

구름이 | 2026.04.27 03:11:44

조회 18 | 추천 0

T5(Text-to-Text Transfer Transformer, 2019, Google)는 「모든 NLP 작업을 "텍스트를 입력 받아 텍스트를 출력하는" 통일된 형식으로 다루자」는 야심찬 시도의 결과입니다.

이 단순한 발상이 NLP 연구의 큰 흐름을 정리해 줬습니다.

T5 이전에는 작업마다 모델 구조가 달랐습니다.

분류는 마지막에 분류층을, 번역은 인코더-디코더를, 질의응답은 또 다른 구조를 썼습니다.

T5는 「영어 → 한국어 번역」도 「translate English to Korean: Hello」 → 「안녕하세요」, 「감정 분석」도 「sentiment: This movie is great」 → 「positive」 식으로 모두 텍스트 입력·출력으로 통일했습니다.

비유하자면 T5는 「세상의 모든 문제를 "질문 → 답변" 형식의 시험으로 통일한 학교」와 같습니다.

분류·번역·요약·질의응답 모두가 같은 구조의 시험이 되고, 학생(모델)은 한 가지 시험 보는 법만 익히면 됩니다.

T5의 사전학습 과제는 「임의의 텍스트 일부를 가린 뒤 그 부분을 채워 넣게 하는」 것이었습니다.

BERT의 단일 단어 마스킹과 다르게 「연속된 여러 단어」를 동시에 가린다는 점이 차별점입니다.

이를 통해 더 풍부한 문맥 이해가 가능해졌습니다.

T5는 11개의 점수가 있는 SuperGLUE 벤치마크에서 사람 수준 점수를 처음 달성한 모델 중 하나였습니다.

이후 mT5(다국어), Flan-T5(지시 튜닝)로 발전했고, T5의 「텍스트→텍스트」 패러다임은 GPT 같은 후속 모델들에도 큰 영향을 줬습니다.

한 줄 요약

T5는 모든 NLP 작업을 「텍스트 입력 → 텍스트 출력」으로 통일한 인코더-디코더 모델로, 작업별로 다른 구조 대신 한 가지 모델로 모든 일을 처리하는 패러다임을 정착시켰습니다.

더 알아볼 것

- mT5 — 다국어 T5

- Flan-T5 — 지시 튜닝 강화 버전

- Span Corruption — T5의 사전학습 과제

아뢰옵기도 송구한 히미즈의 신이시여 — 스즈메의 문단속 [1]

장례식은 반드시 가야하는 이유.jpg [1]

목록보기

번호	제목	글쓴이	작성일	조회
100	SAM — Meta의 「무엇이든 분할」 모델	구름이	26/04/27	20
99	Whisper — OpenAI의 음성 인식 모델	다람쥐	26/04/27	19
98	Vision Transformer(ViT) — 이미지에 트랜스포머를	곰돌이	26/04/27	19
97	CLIP — 이미지와 텍스트의 다리	구름이	26/04/27	20
96	RoBERTa·ALBERT·DistilBERT 한눈에	구름이	26/04/27	17
95	BART — 노이즈 제거식 사전학습	구름이	26/04/27	17
94	T5 — 모든 NLP 작업을 텍스트→텍스트로	구름이	26/04/27	18
93	GPT 시리즈의 진화 — 1에서 4까지	부엉이	26/04/27	19
92	BERT — 양방향 언어 이해의 정석	별님이	26/04/27	17
91	Midjourney의 강점	부엉이	26/04/27	18
90	DALL-E 시리즈의 발전	다람쥐	26/04/27	18
89	Stable Diffusion이 이미지를 만드는 과정	너구리	26/04/27	21
88	Diffusion 모델의 원리	구름이	26/04/27	18
87	CycleGAN — 짝 없는 이미지 변환	구름이	26/04/27	17
86	StyleGAN — 가짜 얼굴을 진짜처럼	멍뭉이	26/04/27	21
85	GAN — 두 신경망의 대결	너구리	26/04/27	28
84	Mask R-CNN — 객체와 그 모양까지	햇살이	26/04/27	30
83	YOLO — 한 번 보고 객체를 다 찾는다	구름이	26/04/27	18
82	U-Net — 의료 영상에 강한 이유	부엉이	26/04/27	18
81	EfficientNet — 자원 효율의 정석	다람쥐	26/04/27	19
80	DenseNet — 모든 레이어가 모두를 본다	별님이	26/04/27	23
79	ResNet — 잔차 연결의 위력	구름이	26/04/27	19
78	GoogLeNet과 인셉션 모듈	야옹이	26/04/27	21
77	VGGNet — 단순함의 미덕	별님이	26/04/27	19
76	AlexNet — 딥러닝 르네상스의 출발	구름이	26/04/27	19
75	토크나이저(tokenizer) — BPE·WordPiece·SentencePiece	햇살이	26/04/27	29
74	임베딩(embedding) — 단어를 벡터로	햇살이	26/04/27	30
73	그래디언트 소실·폭주 문제와 해법	부엉이	26/04/27	30
72	데이터 증강(data augmentation) — 부풀려서 학습하기	다람쥐	26/04/27	24
71	전이학습(transfer learning) — 적은 데이터로 좋은 모델	토순이	26/04/27	21

글쓰기

신고하기

신고 사유를 선택해 주세요.