🔊 TTS Open MOC

1. 프로젝트 목적 (Purpose)

Universal Voice Engine: 영어 학습자에게 자연스러운 원어민 음성을 제공하기 위해 다양한 TTS(Text-to-Speech) API와 로컬 모델을 통합한 범용 음성 합성 시스템.
Shadowing & Listening Support: [[05 Projects/02 F-Drive-Index/English_Worksheet_Agent|English Worksheet Agent]]에서 생성된 텍스트를 즉시 고품질 오디오 파일로 변환하여 학생들의 소리훈련 교재 제작.

2. 주요 기능 및 파이프라인

Multi-Engine Support: Google Cloud TTS, OpenAI Voice, ElevenLabs 등 클라우드 서비스와 VITS, Tortoise 등 로컬 오픈소스 엔진 병행 운용.
Tone & Speed Control: 학습자의 수준에 맞춰 원어민의 발화 속도(Speed)와 톤(Pitch)을 정밀하게 조정하여 최적의 학습 환경 제공.
Automated Audio Tagging: 생성된 오디오 파일에 메타데이터(문장 텍스트, 의미 단위 등)를 삽입하여 [[05 Projects/Homework_2025_MOC|Homework System]]의 소리훈련 모듈과 연계.

3. 기술 스택

Engine: Python / FastAPI (Audio streaming API).
Libraries: Librosa (음성 분석), PyDub (오디오 편집), ElevenLabs SDK.
Integration: [[05 Projects/Starcloud_Studio_MOC|Starcloud Studio]]의 오디오 모듈로 통합 활용.

4. 리소스 및 경로

Source Code Path: F:/dev/tts-open
Voice Presets: [[07 Resources/AI Prompts/5_Audio/Voice_Style_DNA|Standard Voice Configuration]]

Status Note: 다국어 음성 합성 엔진 및 속도 가변 처리 시스템 구축 완료. 매주 발행되는 영어 지문과 연계하여 실시간 오디오 콘텐츠를 공급하는 ‘지능형 발화 엔진’으로 운용 중.

#No Tag

No responses yet

답글 남기기 응답 취소