跳转到内容

文字转语音 (Audio Speech)

文字转语音(TTS)接口用于将输入的文本转换为高保真的自然人声语音。支持生成多种语言和不同音色的音频。

POST /v1/audio/speech
参数类型必填默认值说明
modelstring-调用的 TTS 模型 ID(例如 tts-1, tts-1-hd)。
inputstring-需要转换为语音的文本。最长支持 4096 个字符。
voicestring-使用的音色。常用选项有:alloy, echo, fable, onyx, nova, shimmer
response_formatstringmp3返回的音频格式。支持 mp3, opus, aac, flac, wav, pcm
speednumber1.0播放语速,范围为 0.25 到 4.0。
Terminal window
curl https://api.easytakeai.com/v1/audio/speech \
-H "Content-Type: application/json" \
-H "Authorization: Bearer YOUR_API_KEY" \
-d '{
"model": "tts-1",
"input": "您好,欢迎使用 EasyTakeAI 文档中心!",
"voice": "alloy"
}' \
--output speech.mp3

[!TIP] 成功调用后,接口将直接返回二进制音频数据流,可保存为指定 response_format 的音频文件。