@mzzsfy
tts接口 /api/tts?text=你好&download=false
兼容openai的/v1/audio/speech接口

访问/api/tts/list 查看支持模型

tts接口支持参数:
download 默认为true 浏览器打开时下载为文件或者在线播放,长文本不建议在线播放
text 必传 需要tts的文本,如果为<speak>格式的xml,将无视下面所有参数
shardLength 默认1000 分片文本长度
thread 默认5 线程数
fastDownload 默认false 更激进的并发策略,更消耗内存,完成速度更快,更容易出错,仅下载模式且分片很多时可使用

自定义模型参数
audioType 音频编码,如 audio-24khz-48kbitrate-mono-mp3
voiceName 模型名称,如 zh-CN-XiaoxiaoNeural
style SsmlStyle,一般为空
pitch 速度
rate 语调,使用这个参数建议使用自定义xml

支持使用环境变量修改默认参数,DEFAULT_VOICE_NAME,DEFAULT_AUDIO_FORMAT,DEFAULT_AUDIO_STYLE

参考: https://learn.microsoft.com/en-us/azure/ai-services/speech-service/speech-synthesis-markup-voice
    
私有化部署: https://hub.docker.com/r/mzzsfy/tts