跳转到主要内容
对口型生成可以让视频中的人物”说”出您指定的话,支持两种输入方式——文本驱动(内置 TTS 合成语音)或直接使用音频文件驱动。 该接口需要 session_id,必须先调用人脸识别接口获取。

工作流概览

1. identify-face  →  session_id
2. advanced-lip-sync(session_id + 语音输入)  →  task_id
3. 轮询 GET /kling/v1/videos/advanced-lip-sync/{task_id}  →  视频 URL

输入方式

文本驱动——内置 TTS

提供 textvoice_idvoice_language,平台使用指定音色将文字合成为语音,再驱动嘴型。
curl https://www.anyfast.ai/kling/v1/videos/advanced-lip-sync \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "input": {
      "session_id": "YOUR_SESSION_ID",
      "text": "你好,欢迎来到我的频道",
      "voice_id": "girlfriend_1_cn",
      "voice_language": "zh"
    }
  }'

音频驱动——使用已有音频文件

提供 audio_url,直接用音频文件驱动嘴型。
curl https://www.anyfast.ai/kling/v1/videos/advanced-lip-sync \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "input": {
      "session_id": "YOUR_SESSION_ID",
      "audio_url": "https://example.com/speech.mp3"
    }
  }'

请求参数

参数类型必填说明
input.session_idstring人脸识别步骤返回的会话 ID
input.face_image_urlstring人脸参考图片 URL,用于提升人物一致性
input.textstring文本模式必填人物要说的文字内容
input.voice_idstring文本模式必填TTS 音色 ID。可查阅音色 ID 参考文档在线试听并选择合适的音色。
input.voice_languagestring文本模式必填语言代码:zh(中文)或 en(英文)
input.audio_urlstring音频模式必填音频文件的公网 URL

轮询结果

任务创建后,使用 GET /kling/v1/videos/advanced-lip-sync/{task_id} 查询状态,参考任务查询文档。状态流转:queuedprocessingsucceeded / failed 成功后,视频下载链接在 data.data.task_result.videos[0].url

前置步骤:人脸识别

必须先调用此接口获取 session_id。

音色 ID 参考文档

在线试听所有可用音色,选择适合的 voice_id 参数值。

API 参考

查看 Kling 对口型生成的交互式 API 文档。