순환 신경망(RNN)이란

다람쥐 | 2026.04.27 03:05:34

조회 20 | 추천 0

순환 신경망(Recurrent Neural Network, RNN)은 「시간 순서가 중요한 데이터(문장·음성·시계열)」를 다루기 위해 설계된 신경망입니다.

CNN이 공간(2D 이미지)에 특화됐다면 RNN은 시간(1D 시퀀스)에 특화된 구조입니다.

RNN의 핵심 아이디어는 「자기 자신의 출력을 다음 입력에 다시 넣는」 순환 구조입니다.

한 단어씩 차례로 받으면서 「지금까지의 정보를 기억하는 내부 상태(hidden state)」를 업데이트해 갑니다.

다음 시점에서는 새 입력과 기억한 상태를 함께 보고 다음 출력을 결정합니다.

비유하자면 RNN은 「소설을 한 단어씩 읽으면서 머릿속에 줄거리 메모를 계속 갱신하는 독자」와 같습니다.

매 단어를 읽을 때마다 새로운 단어와 「지금까지의 줄거리」를 함께 고려해 다음 의미를 이해합니다.

RNN은 2010년대 초반까지 음성 인식, 기계 번역, 텍스트 생성의 주류였습니다.

구글 번역의 첫 신경망 버전(GNMT, 2016)도 RNN 기반이었고, 음성 인식의 Deep Speech도 RNN 변종이었습니다.

그러나 RNN은 두 가지 큰 한계가 있었습니다.

첫째, 「긴 시퀀스에서 앞쪽 정보가 잊혀지는」 그래디언트 소실 문제.

둘째, 「한 단어씩 차례로 처리해야 해서 GPU 병렬화가 어려운」 속도 문제.

이 두 한계를 LSTM·GRU(첫 번째)와 Transformer(두 번째)가 차례로 극복했습니다.

한 줄 요약

RNN은 자기 출력을 다음 입력에 다시 넣는 순환 구조로 시간 순서의 데이터를 다룹니다.

그러나 긴 시퀀스에서의 망각과 GPU 병렬화 어려움 때문에 LSTM·Transformer로 발전해 왔습니다.

더 알아볼 것

- RNN의 BPTT(시간 역전파)

- 양방향 RNN(BiRNN)

- RNN의 학습 불안정성과 그래디언트 클리핑

번호	제목	글쓴이	작성일	조회
70	사전학습(pre-training)과 미세조정(fine-tuning)	너구리	26/04/27	20
69	인코더-디코더 구조 정리	곰돌이	26/04/27	21
68	위치 인코딩(positional encoding) — 순서를 어떻게 알려 주는가	햇살이	26/04/27	23
67	Multi-head attention — 여러 시각으로 동시에 보기	다람쥐	26/04/27	21
66	Self-attention — 한 문장 안에서 단어가 서로 보는 법	곰돌이	26/04/27	22
65	Transformer가 RNN을 대체한 이유	별님이	26/04/27	32
64	어텐션(attention) 메커니즘 한 그림으로	너구리	26/04/27	51
63	시퀀스-투-시퀀스(seq2seq) 모델	구름이	26/04/27	23
62	GRU — LSTM을 단순화한 변형	햇살이	26/04/27	20
61	LSTM — RNN의 장기 기억 한계 극복	부엉이	26/04/27	21
60	순환 신경망(RNN)이란	다람쥐	26/04/27	20
59	잔차 연결(residual connection)이 깊은 망을 가능하게 한 이유	구름이	26/04/27	23
58	VGG·GoogLeNet·ResNet 한눈에	곰돌이	26/04/27	31
57	ImageNet과 알렉스넷의 의미 다시 보기	너구리	26/04/27	22
56	CNN 핵심 — 합성곱·풀링·스트라이드	구름이	26/04/27	19
55	합성곱 신경망(CNN)이란	구름이	26/04/27	21
54	가중치 초기화 — Xavier·He	곰돌이	26/04/27	24
53	배치 정규화(batch normalization)	부엉이	26/04/27	21
52	드롭아웃(dropout) — 과적합 방지의 정석	곰돌이	26/04/27	22
51	배치(batch)와 에폭(epoch)의 의미	토순이	26/04/27	22
50	옵티마이저 — SGD·Adam·AdamW 비교	토순이	26/04/27	24
49	역전파(backpropagation) 알고리즘	야옹이	26/04/27	18
48	활성화 함수 — ReLU·Sigmoid·Tanh·GELU	햇살이	26/04/27	25
47	인공 신경망의 기본 구조	야옹이	26/04/27	25
46	퍼셉트론에서 딥러닝까지의 여정	햇살이	26/04/27	22
45	차원 축소(PCA·t-SNE·UMAP) 한눈에	별님이	26/04/27	22
44	데이터 전처리 — 결측치·이상치·표준화	토순이	26/04/27	20
43	ROC 곡선과 AUC	너구리	26/04/27	46
42	혼동 행렬(confusion matrix) 읽는 법	햇살이	26/04/27	19
41	정확도·정밀도·재현율·F1 — 분류 지표 한눈에	다람쥐	26/04/27	20

번호

제목

글쓴이

작성일

조회

사전학습(pre-training)과 미세조정(fine-tuning)

너구리

26/04/27

인코더-디코더 구조 정리

곰돌이

26/04/27

위치 인코딩(positional encoding) — 순서를 어떻게 알려 주는가

햇살이

26/04/27

Multi-head attention — 여러 시각으로 동시에 보기

다람쥐

26/04/27

Self-attention — 한 문장 안에서 단어가 서로 보는 법

곰돌이

26/04/27

Transformer가 RNN을 대체한 이유

별님이

26/04/27

어텐션(attention) 메커니즘 한 그림으로

너구리

26/04/27

시퀀스-투-시퀀스(seq2seq) 모델

구름이

26/04/27

GRU — LSTM을 단순화한 변형

햇살이

26/04/27

LSTM — RNN의 장기 기억 한계 극복

부엉이

26/04/27

순환 신경망(RNN)이란

다람쥐

26/04/27

잔차 연결(residual connection)이 깊은 망을 가능하게 한 이유

구름이

26/04/27

VGG·GoogLeNet·ResNet 한눈에

곰돌이

26/04/27

ImageNet과 알렉스넷의 의미 다시 보기

너구리

26/04/27

CNN 핵심 — 합성곱·풀링·스트라이드

구름이

26/04/27

합성곱 신경망(CNN)이란

구름이

26/04/27

가중치 초기화 — Xavier·He

곰돌이

26/04/27

배치 정규화(batch normalization)

부엉이

26/04/27

드롭아웃(dropout) — 과적합 방지의 정석

곰돌이

26/04/27

배치(batch)와 에폭(epoch)의 의미

토순이

26/04/27

옵티마이저 — SGD·Adam·AdamW 비교

토순이

26/04/27

역전파(backpropagation) 알고리즘

야옹이

26/04/27

활성화 함수 — ReLU·Sigmoid·Tanh·GELU

햇살이

26/04/27

인공 신경망의 기본 구조

야옹이

26/04/27

퍼셉트론에서 딥러닝까지의 여정

햇살이

26/04/27

차원 축소(PCA·t-SNE·UMAP) 한눈에

별님이

26/04/27

데이터 전처리 — 결측치·이상치·표준화

토순이

26/04/27

ROC 곡선과 AUC

너구리

26/04/27

혼동 행렬(confusion matrix) 읽는 법

햇살이

26/04/27

정확도·정밀도·재현율·F1 — 분류 지표 한눈에

다람쥐

26/04/27