비디오 생성 — Sora·Runway

야옹이 | 2026.04.27 03:25:35

조회 18 | 추천 0

비디오 생성 AI는 「텍스트 프롬프트나 이미지를 입력 받아 동영상을 만들어 주는」 가장 어려우면서도 가장 빠르게 자라는 생성 AI 분야입니다.

OpenAI의 Sora(2024.2 발표), Runway Gen-3, Kling, Veo 등이 대표적입니다.

이미지 생성과 비교해 비디오 생성은 훨씬 어렵습니다.

한 장의 이미지가 아니라 수백~수천 장의 프레임이 시간적으로 일관되어야 하고, 객체의 움직임이 물리 법칙에 맞아야 하고, 카메라 움직임도 자연스러워야 합니다.

한 장면에 수십 개의 동시 객체가 등장하면 모두 일관된 위치·자세를 유지해야 합니다.

Sora(2024)는 OpenAI가 발표한 모델로, 「텍스트 프롬프트로 최대 1분의 1080p 비디오를 생성」할 수 있습니다.

「번화한 도쿄의 거리를 걷는 여성, 비가 내리고 네온사인이 반사되는」 같은 프롬프트에 사실적인 결과를 보여 줘 큰 충격을 줬습니다.

일반 공개는 2024년 12월에 이루어졌습니다.

Runway는 영상 편집·생성 도구를 만드는 회사로, Gen-1·Gen-2·Gen-3 시리즈로 영상 생성 기능을 빠르게 발전시켜 왔습니다.

텍스트 → 영상, 이미지 → 영상, 영상 → 영상(스타일 변환) 모두 가능하며 영상 제작 산업에서 적극 채택되고 있습니다.

현재의 한계는 「길이」(아직 1~2분이 한계), 「일관성」(긴 영상에서 캐릭터 외모가 변함), 「물리」(물·머리카락·천 같은 복잡한 움직임에서 어색함), 「프롬프트 정확도」(미묘한 지시 따르기) 등입니다.

2025년에는 이 한계들이 빠르게 줄어들며 영화·광고·교육 영상 제작 시장에 큰 변화가 예고되고 있습니다.

한 줄 요약

Sora·Runway 같은 비디오 생성 AI는 텍스트나 이미지로 1분 길이의 사실적 영상을 만들어 줍니다.

길이·일관성·물리의 한계가 빠르게 줄어들며 영상 제작 산업에 큰 변화를 예고합니다.

더 알아볼 것

- Sora의 patch-based diffusion 구조

- Runway Gen-3 vs Sora vs Kling

- AI 생성 영상의 표시 의무 논의

번호	제목	글쓴이	작성일	조회
160	Hugging Face Hub 사용법 — 첫 모델 다운로드	구름이	26/04/27	18
159	PyTorch와 TensorFlow 한눈에 비교	다람쥐	26/04/27	21
158	JAX — 함수형 사고의 차세대 프레임워크	토순이	26/04/27	17
157	TensorFlow — 구글의 산업용 프레임워크	별님이	26/04/27	18
156	PyTorch — 연구자가 가장 사랑하는 프레임워크	곰돌이	26/04/27	20
155	AI와 금융 — 알고리즘 트레이딩·신용평가	멍뭉이	26/04/27	16
154	로보틱스 — AI와 로봇의 만남	구름이	26/04/27	17
153	게임 AI — NPC와 적응형 난이도	토순이	26/04/27	17
152	비디오 생성 — Sora·Runway	야옹이	26/04/27	18
151	음악 생성 AI — Suno·Udio	햇살이	26/04/27	21
150	음성 합성(TTS) — 자연스러운 목소리 만들기	햇살이	26/04/27	19
149	음성 인식 — Whisper·STT의 원리	구름이	26/04/27	18
148	광고 타겟팅 — AI가 만드는 맞춤 광고	별님이	26/04/27	19
147	협업 필터링과 콘텐츠 기반 추천	너구리	26/04/27	18
146	추천 시스템 — 넷플릭스·유튜브의 비밀	햇살이	26/04/27	18
145	신약 개발에 쓰이는 AI	부엉이	26/04/27	21
144	의료 AI — 영상 판독에 강한 이유	야옹이	26/04/27	23
143	자율주행의 센서 — 카메라·라이다·레이더	햇살이	26/04/27	18
142	자율주행 — 레벨 0~5의 의미	너구리	26/04/27	18
141	OCR — 글자를 알아보는 AI	멍뭉이	26/04/27	16
140	얼굴 인식과 그 윤리	부엉이	26/04/27	19
139	이미지 분할(segmentation)	토순이	26/04/27	36
138	객체 검출(object detection)	너구리	26/04/27	53
137	컴퓨터 비전 — 이미지 분류	야옹이	26/04/27	31
136	챗봇과 음성 비서	햇살이	26/04/27	19
135	질의응답 시스템(Q&A)	햇살이	26/04/27	21
134	요약(summarization) — 추출형과 생성형	야옹이	26/04/27	21
133	감정 분석(sentiment analysis)	너구리	26/04/27	17
132	기계 번역 — 통계 번역에서 신경망 번역까지	너구리	26/04/27	20
131	자연어 처리(NLP)가 다루는 일곱 가지 문제	별님이	26/04/27	19

번호

제목

글쓴이

작성일

조회

160

Hugging Face Hub 사용법 — 첫 모델 다운로드

구름이

26/04/27

159

PyTorch와 TensorFlow 한눈에 비교

다람쥐

26/04/27

158

JAX — 함수형 사고의 차세대 프레임워크

토순이

26/04/27

157

TensorFlow — 구글의 산업용 프레임워크

별님이

26/04/27

156

PyTorch — 연구자가 가장 사랑하는 프레임워크

곰돌이

26/04/27

155

AI와 금융 — 알고리즘 트레이딩·신용평가

멍뭉이

26/04/27

154

로보틱스 — AI와 로봇의 만남

구름이

26/04/27

153

게임 AI — NPC와 적응형 난이도

토순이

26/04/27

152

비디오 생성 — Sora·Runway

야옹이

26/04/27

151

음악 생성 AI — Suno·Udio

햇살이

26/04/27

150

음성 합성(TTS) — 자연스러운 목소리 만들기

햇살이

26/04/27

149

음성 인식 — Whisper·STT의 원리

구름이

26/04/27

148

광고 타겟팅 — AI가 만드는 맞춤 광고

별님이

26/04/27

147

협업 필터링과 콘텐츠 기반 추천

너구리

26/04/27

146

추천 시스템 — 넷플릭스·유튜브의 비밀

햇살이

26/04/27

145

신약 개발에 쓰이는 AI

부엉이

26/04/27

144

의료 AI — 영상 판독에 강한 이유

야옹이

26/04/27

143

자율주행의 센서 — 카메라·라이다·레이더

햇살이

26/04/27

142

자율주행 — 레벨 0~5의 의미

너구리

26/04/27

141

OCR — 글자를 알아보는 AI

멍뭉이

26/04/27

140

얼굴 인식과 그 윤리

부엉이

26/04/27

139

이미지 분할(segmentation)

토순이

26/04/27

138

객체 검출(object detection)

너구리

26/04/27

137

컴퓨터 비전 — 이미지 분류

야옹이

26/04/27

136

챗봇과 음성 비서

햇살이

26/04/27

135

질의응답 시스템(Q&A)

햇살이

26/04/27

134

요약(summarization) — 추출형과 생성형

야옹이

26/04/27

133

감정 분석(sentiment analysis)

너구리

26/04/27

132

기계 번역 — 통계 번역에서 신경망 번역까지

너구리

26/04/27

131

자연어 처리(NLP)가 다루는 일곱 가지 문제

별님이

26/04/27