🐦⬛ BlueMagpie-TTS · 文字轉語音線上試用
OpenFormosa Blue Magpie TTS —— 支援台灣華語與中英混合的文字轉語音模型,輸出 48 kHz 單聲道語音。 模型:OpenFormosa/BlueMagpie-TTS · 程式碼:GitHub
已套用模型官方建議最佳參數:
cfg_value=2.8、inference_timesteps=9、retry_badcase=on。
使用模型內附、已取得李宏毅老師本人授權的語者向量來控制音色(官方最佳參數正是針對此語者調校)。
範例文字
念多句再複製:錄一段你念下面 10 句的聲音(或上傳數段乾淨語音),系統會從中**抽取穩定的語者向量(音色指紋)**再合成你的文字——不需要逐字稿。
念越多句、內容越多元,抽出的音色越穩定、越像(和訓練時的 per-speaker 向量一致;走的是已訓練的 speaker_centroid 路徑,用 ECAPA-TDNN 算出 192 維向量並平均)。
⚠️ 請只使用你已取得授權的聲音,請勿在未經本人同意下複製他人聲音。
請依序念出下面 10 句(錄成一段即可,約 30–60 秒):
- 今天天氣很好,我們一起出去走走。
- 請問最近的捷運站要怎麼走?
- 我週末最喜歡在家裡看電影。
- 這家餐廳的牛肉麵真的很好吃。
- 明天早上八點開會,請不要遲到。
- 台灣有很多美麗的高山和海岸。
- 謝謝你的幫忙,我真的很感激。
- 學習新的語言需要時間和耐心。
- 春天到了,公園裡開滿了櫻花。
- 麻煩你把這份文件印三份給我。
長文逐句串流:把長文切成句子,合成一句就播一句,做出串流(邊聽邊等)效果。第一句很快就能聽到,後面邊播邊合成。用李宏毅語者向量。
ZeroGPU 約 0.44x 實時,句與句之間可能有短暫間隔;每句都套用最佳參數(含自動重試)。單次串流以 ZeroGPU 時間配額為限(約可串數十句),超長會自動截斷並提示分批。
長文範例
合成的語音僅供研究與評估展示用途,輸出可能不完美;正式使用前請人工檢視。 · Apache-2.0