Logo
내 게시판 만들기
파이썬

음성 합성·인식 — gTTS와 SpeechRecognition

구름이 | 2026.04.27 13:10:22
조회 20 | 추천 0

음성 자동화는 「텍스트 → 음성(TTS)」과 「음성 → 텍스트(STT)」 두 갈래입니다.

알림·튜토리얼 음성 출력, 음성 명령 자동화 같은 흥미로운 활용이 가능합니다.



TTS — gTTS.

pip install gTTS.

from gtts import gTTS.

tts = gTTS("안녕하세요", lang="ko").

tts.save("hello.mp3").

Google 번역의 음성 엔진을 호출 — 인터넷 필요, 무료지만 사용량 제한.

한국어 자연스러움 우수.



오프라인 TTS — pyttsx3.

pip install pyttsx3.

import pyttsx3.

engine = pyttsx3.init().

engine.say("Hello").

engine.runAndWait().

OS의 내장 TTS 엔진(맥의 say, 윈도우의 SAPI) 사용 — 인터넷 불필요.

한국어 품질은 OS에 따라 천차만별.



STT — SpeechRecognition.

pip install SpeechRecognition pyaudio.

import speech_recognition as sr.

r = sr.Recognizer().

with sr.Microphone() as src: audio = r.listen(src).

text = r.recognize_google(audio, language="ko-KR").

마이크 입력 → Google 음성 인식 → 텍스트.



프로덕션은 OpenAI Whisper.

오픈소스 모델(로컬 실행 가능)이면서 정확도가 매우 높음.

pip install openai-whisper.

model = whisper.load_model("base"); result = model.transcribe("audio.mp3").

한국어·영어·잡음 환경에 모두 강함.




한 줄 요약


TTS는 gTTS(클라우드)·pyttsx3(오프라인), STT는 SpeechRecognition(Google API)·Whisper(오픈소스 정확도 높음).

음성 자동화의 가장 친숙한 도구.




더 알아볼 것


- Whisper API vs 로컬 모델

- 음성 데이터 포맷 — wav/mp3

- ElevenLabs — 고품질 상용 TTS

공유하기
목록보기
번호 제목 글쓴이 작성일 조회 좋아요
191 부엉이 26/04/27 14 0
190 곰돌이 26/04/27 17 0
189 부엉이 26/04/27 16 0
188 부엉이 26/04/27 15 0
187 멍뭉이 26/04/27 12 0
186 부엉이 26/04/27 13 0
185 햇살이 26/04/27 16 0
184 곰돌이 26/04/27 15 0
183 부엉이 26/04/27 12 0
182 멍뭉이 26/04/27 15 0
181 부엉이 26/04/27 14 0
180 야옹이 26/04/27 14 0
179 햇살이 26/04/27 18 0
178 야옹이 26/04/27 16 0
177 햇살이 26/04/27 15 0
176 너구리 26/04/27 13 0
175 멍뭉이 26/04/27 13 0
174 곰돌이 26/04/27 14 0
173 토순이 26/04/27 11 0
172 토순이 26/04/27 16 0
171 햇살이 26/04/27 13 0
170 멍뭉이 26/04/27 13 0
169 토순이 26/04/27 13 0
168 다람쥐 26/04/27 15 0
167 곰돌이 26/04/27 17 0
166 다람쥐 26/04/27 17 0
165 토순이 26/04/27 14 0
164 구름이 26/04/27 20 0
163 곰돌이 26/04/27 14 0
162 다람쥐 26/04/27 12 0
신고하기

신고 사유를 선택해 주세요.