BART — 노이즈 제거식 사전학습

구름이 | 2026.04.27 03:11:45

조회 18 | 추천 0

BART(Bidirectional and Auto-Regressive Transformers, 2019, Facebook AI Research)는 BERT의 이해 능력과 GPT의 생성 능력을 한 모델에서 결합하려는 시도의 결과입니다.

인코더-디코더 구조를 가지며, 「텍스트에 다양한 노이즈를 가한 뒤 원본을 복원하는」 사전학습 과제를 사용합니다.

사전학습 과제가 흥미롭습니다.

단어 마스킹·단어 삭제·문장 순서 섞기·문서 회전·단어 무작위 삽입 등 여러 종류의 「노이즈」를 입력에 가한 뒤, 디코더가 원래 깨끗한 문서를 복원하도록 훈련됩니다.

다양한 노이즈를 학습하므로 모델이 매우 강건해집니다.

비유하자면 BART는 「엉망으로 흩어진 퍼즐 조각을 다시 맞추는 학생」과 같습니다.

누군가 일부러 어지럽혀 놓은 문서를 보고 원형을 복원하는 능력을 길러, 결과적으로 「언어의 구조와 의미」를 깊이 이해하게 됩니다.

BART의 강점은 텍스트 요약·기계 번역 같은 「텍스트 → 텍스트」 작업에서 두드러집니다.

입력을 깊이 이해(인코더)한 뒤 새 출력을 생성(디코더)하는 일에 자연스럽게 맞기 때문입니다.

CNN 뉴스 요약 벤치마크에서 한동안 최고 점수를 유지했습니다.

현재의 LLM 시대에는 디코더만 구조(GPT 계열)가 주류가 되어 BART 같은 인코더-디코더 모델은 새로 만들어지는 일이 줄었습니다.

그러나 요약·번역 같은 「짧고 명확한 변환」 작업에서는 여전히 BART나 그 변형이 더 효율적인 선택일 수 있습니다.

한 줄 요약

BART는 텍스트에 다양한 노이즈를 가한 뒤 원본을 복원하는 사전학습 과제를 쓰는 인코더-디코더 모델로, 요약·번역 같은 「텍스트→텍스트」 변환에 특히 강합니다.

더 알아볼 것

- mBART — 다국어 BART

- BART의 다섯 가지 노이즈 함수

- Pegasus — 요약 특화 BART의 친척

번호	제목	글쓴이	작성일	조회
100	SAM — Meta의 「무엇이든 분할」 모델	구름이	26/04/27	21
99	Whisper — OpenAI의 음성 인식 모델	다람쥐	26/04/27	20
98	Vision Transformer(ViT) — 이미지에 트랜스포머를	곰돌이	26/04/27	20
97	CLIP — 이미지와 텍스트의 다리	구름이	26/04/27	21
96	RoBERTa·ALBERT·DistilBERT 한눈에	구름이	26/04/27	18
95	BART — 노이즈 제거식 사전학습	구름이	26/04/27	18
94	T5 — 모든 NLP 작업을 텍스트→텍스트로	구름이	26/04/27	18
93	GPT 시리즈의 진화 — 1에서 4까지	부엉이	26/04/27	19
92	BERT — 양방향 언어 이해의 정석	별님이	26/04/27	17
91	Midjourney의 강점	부엉이	26/04/27	19
90	DALL-E 시리즈의 발전	다람쥐	26/04/27	19
89	Stable Diffusion이 이미지를 만드는 과정	너구리	26/04/27	22
88	Diffusion 모델의 원리	구름이	26/04/27	18
87	CycleGAN — 짝 없는 이미지 변환	구름이	26/04/27	18
86	StyleGAN — 가짜 얼굴을 진짜처럼	멍뭉이	26/04/27	22
85	GAN — 두 신경망의 대결	너구리	26/04/27	29
84	Mask R-CNN — 객체와 그 모양까지	햇살이	26/04/27	31
83	YOLO — 한 번 보고 객체를 다 찾는다	구름이	26/04/27	19
82	U-Net — 의료 영상에 강한 이유	부엉이	26/04/27	19
81	EfficientNet — 자원 효율의 정석	다람쥐	26/04/27	19
80	DenseNet — 모든 레이어가 모두를 본다	별님이	26/04/27	24
79	ResNet — 잔차 연결의 위력	구름이	26/04/27	20
78	GoogLeNet과 인셉션 모듈	야옹이	26/04/27	22
77	VGGNet — 단순함의 미덕	별님이	26/04/27	20
76	AlexNet — 딥러닝 르네상스의 출발	구름이	26/04/27	20
75	토크나이저(tokenizer) — BPE·WordPiece·SentencePiece	햇살이	26/04/27	30
74	임베딩(embedding) — 단어를 벡터로	햇살이	26/04/27	31
73	그래디언트 소실·폭주 문제와 해법	부엉이	26/04/27	30
72	데이터 증강(data augmentation) — 부풀려서 학습하기	다람쥐	26/04/27	25
71	전이학습(transfer learning) — 적은 데이터로 좋은 모델	토순이	26/04/27	22

번호

제목

글쓴이

작성일

조회

100

SAM — Meta의 「무엇이든 분할」 모델

구름이

26/04/27

Whisper — OpenAI의 음성 인식 모델

다람쥐

26/04/27

Vision Transformer(ViT) — 이미지에 트랜스포머를

곰돌이

26/04/27

CLIP — 이미지와 텍스트의 다리

구름이

26/04/27

RoBERTa·ALBERT·DistilBERT 한눈에

구름이

26/04/27

BART — 노이즈 제거식 사전학습

구름이

26/04/27

T5 — 모든 NLP 작업을 텍스트→텍스트로

구름이

26/04/27

GPT 시리즈의 진화 — 1에서 4까지

부엉이

26/04/27

BERT — 양방향 언어 이해의 정석

별님이

26/04/27

Midjourney의 강점

부엉이

26/04/27

DALL-E 시리즈의 발전

다람쥐

26/04/27

Stable Diffusion이 이미지를 만드는 과정

너구리

26/04/27

Diffusion 모델의 원리

구름이

26/04/27

CycleGAN — 짝 없는 이미지 변환

구름이

26/04/27

StyleGAN — 가짜 얼굴을 진짜처럼

멍뭉이

26/04/27

GAN — 두 신경망의 대결

너구리

26/04/27

Mask R-CNN — 객체와 그 모양까지

햇살이

26/04/27

YOLO — 한 번 보고 객체를 다 찾는다

구름이

26/04/27

U-Net — 의료 영상에 강한 이유

부엉이

26/04/27

EfficientNet — 자원 효율의 정석

다람쥐

26/04/27

DenseNet — 모든 레이어가 모두를 본다

별님이

26/04/27

ResNet — 잔차 연결의 위력

구름이

26/04/27

GoogLeNet과 인셉션 모듈

야옹이

26/04/27

VGGNet — 단순함의 미덕

별님이

26/04/27

AlexNet — 딥러닝 르네상스의 출발

구름이

26/04/27

토크나이저(tokenizer) — BPE·WordPiece·SentencePiece

햇살이

26/04/27

임베딩(embedding) — 단어를 벡터로

햇살이

26/04/27

그래디언트 소실·폭주 문제와 해법

부엉이

26/04/27

데이터 증강(data augmentation) — 부풀려서 학습하기

다람쥐

26/04/27

전이학습(transfer learning) — 적은 데이터로 좋은 모델

토순이

26/04/27