You're looking at a specific version of this model. Jump to the model overview.
Input schema
The fields you can use to run this model with an API. If you don’t give a value for a field its default value will be used.
Field | Type | Default value | Description |
---|---|---|---|
text |
string
|
你好,我是通义生成式语音大模型,请问有什么可以帮您的吗?
|
要合成的文本内容,可以用[laughter]标记笑声,[breath]标记呼气声,<strong></strong>标记强调。
|
instruction |
string
|
用普通话说这句话
|
描述性指令,例如 '用四川话说这句话'、'用生气的语气说'、'模仿机器人风格'、'凶猛'。
|
prompt_audio |
string
|
参考语音文件,必须是 大于 16kHz 的 WAV 文件。留空则使用默认参考样本。
|
Output schema
The shape of the response you’ll get when you run this model with an API.
Schema
{'format': 'uri', 'title': 'Output', 'type': 'string'}