파이썬

음성 합성·인식 — gTTS와 SpeechRecognition

구름이 | 2026.04.27 13:10:22

조회 20 | 추천 0

음성 자동화는 「텍스트 → 음성(TTS)」과 「음성 → 텍스트(STT)」 두 갈래입니다.

알림·튜토리얼 음성 출력, 음성 명령 자동화 같은 흥미로운 활용이 가능합니다.

TTS — gTTS.

pip install gTTS.

from gtts import gTTS.

tts = gTTS("안녕하세요", lang="ko").

tts.save("hello.mp3").

Google 번역의 음성 엔진을 호출 — 인터넷 필요, 무료지만 사용량 제한.

한국어 자연스러움 우수.

오프라인 TTS — pyttsx3.

pip install pyttsx3.

import pyttsx3.

engine = pyttsx3.init().

engine.say("Hello").

engine.runAndWait().

OS의 내장 TTS 엔진(맥의 say, 윈도우의 SAPI) 사용 — 인터넷 불필요.

한국어 품질은 OS에 따라 천차만별.

STT — SpeechRecognition.

pip install SpeechRecognition pyaudio.

import speech_recognition as sr.

r = sr.Recognizer().

with sr.Microphone() as src: audio = r.listen(src).

text = r.recognize_google(audio, language="ko-KR").

마이크 입력 → Google 음성 인식 → 텍스트.

프로덕션은 OpenAI Whisper.

오픈소스 모델(로컬 실행 가능)이면서 정확도가 매우 높음.

pip install openai-whisper.

model = whisper.load_model("base"); result = model.transcribe("audio.mp3").

한국어·영어·잡음 환경에 모두 강함.

한 줄 요약

TTS는 gTTS(클라우드)·pyttsx3(오프라인), STT는 SpeechRecognition(Google API)·Whisper(오픈소스 정확도 높음).

음성 자동화의 가장 친숙한 도구.

더 알아볼 것

- Whisper API vs 로컬 모델

- 음성 데이터 포맷 — wav/mp3

- ElevenLabs — 고품질 상용 TTS

아뢰옵기도 송구한 히미즈의 신이시여 — 스즈메의 문단속 [1]

장례식은 반드시 가야하는 이유.jpg [1]

목록보기

번호	제목	글쓴이	작성일	조회
191	threading — 스레드 기초	부엉이	26/04/27	14
190	aiohttp와 httpx — 비동기 HTTP	곰돌이	26/04/27	17
189	asyncio.create_task — 백그라운드 태스크	부엉이	26/04/27	16
188	asyncio.gather — 동시 실행의 핵심	부엉이	26/04/27	15
187	async와 await — 비동기 함수의 문법	멍뭉이	26/04/27	12
186	asyncio — 비동기 IO의 표준	부엉이	26/04/27	13
185	타입 검사 — mypy와 ruff	햇살이	26/04/27	16
184	pip · poetry · uv — 패키지 관리의 진화	곰돌이	26/04/27	15
183	conda — 데이터 사이언스 환경	부엉이	26/04/27	12
182	venv — 가상환경의 표준	멍뭉이	26/04/27	15
181	memory_profiler — 메모리 사용 분석	부엉이	26/04/27	14
180	cProfile — 실제 병목 찾기	야옹이	26/04/27	14
179	timeit — 짧은 코드 성능 측정	햇살이	26/04/27	18
178	faulthandler — 세그폴트와 멈춤 추적	야옹이	26/04/27	16
177	traceback — 에러 추적과 분석	햇살이	26/04/27	15
176	ipdb·pudb — 더 친절한 디버거	너구리	26/04/27	13
175	pdb — 표준 디버거	멍뭉이	26/04/27	13
174	디버깅 기초 — print에서 디버거로	곰돌이	26/04/27	14
173	assert문 — 단언과 활용	토순이	26/04/27	11
172	tox — 여러 환경 한꺼번에 테스트	토순이	26/04/27	16
171	coverage — 코드 커버리지 측정	햇살이	26/04/27	13
170	unittest.mock — 외부 의존성 가짜로 만들기	멍뭉이	26/04/27	13
169	parametrize — 데이터 기반 테스트	토순이	26/04/27	13
168	pytest fixture — 테스트 데이터·환경 관리	다람쥐	26/04/27	15
167	pytest — 모던 테스트 프레임워크	곰돌이	26/04/27	17
166	unittest — 표준 테스트 프레임워크	다람쥐	26/04/27	17
165	ETL과 워크플로 자동화 — Airflow 소개	토순이	26/04/27	14
164	음성 합성·인식 — gTTS와 SpeechRecognition	구름이	26/04/27	20
163	OCR — 이미지에서 텍스트 추출	곰돌이	26/04/27	14
162	마우스·키보드 자동화 — pyautogui	다람쥐	26/04/27	12

글쓰기

신고하기

신고 사유를 선택해 주세요.