// Popular Articles

#voice-cloning
Voicebox: Clone Any Voice Locally — A Free Open-Source Alternative to ElevenLabs
#5952025-12-20

Voicebox: Clone Any Voice Locally — A Free Open-Source Alternative to ElevenLabs

Voicebox is a free, MIT-licensed voice studio that runs entirely on your machine. Clone any voice from 3 seconds of audio, generate speech in 23 languages across 7 TTS engines, and drive it all through a local REST API on port 17493 — no subscriptions, no rate limits, no cloud.

voiceboxvoice-cloningopen-source
7 phút đọc
#3272025-08-07

StepAudio 2.5 TTS: Điều khiển cảm xúc giọng đọc bằng câu mô tả, không cần preset

StepFun vừa ra mắt StepAudio 2.5 TTS ngày 16/04/2026 — TTS đầu tiên bỏ tag SSML, cho phép mô tả cảm xúc, nhịp điệu, hơi thở bằng ngôn ngữ tự nhiên. Clone giọng từ 3 giây audio, giữ full timbre + emotion control. Cùng ngày Google tung Gemini 3.1 Flash TTS — ngành TTS chính thức chuyển từ 'chọn tag' sang 'mô tả yêu cầu'.

stepaudiostepfuntext-to-speech
7 phút đọc
MOSS-TTS-Nano: Open TTS 100M params chạy local, 48kHz stereo, không cần GPU
#522025-03-22

MOSS-TTS-Nano: Open TTS 100M params chạy local, 48kHz stereo, không cần GPU

OpenMOSS vừa thả model TTS 0.1B params Apache-2.0, streaming realtime trên CPU 4-core, 48kHz stereo, 20 ngôn ngữ. Bản ONNX mới chạy mượt trên 1 core MacBook Air M4. Đây là bước ngoặt cho on-device voice AI.

moss-tts-nanoopenmossopen-source-tts
7 phút đọc