🚀 快速安装

复制以下命令并运行,立即安装此 Skill:

npx skills add https://skills.sh/inferen-sh/skills/elevenlabs-tts

💡 提示:需要 Node.js 和 NPM

ElevenLabs 文本转语音

通过 inference.sh CLI 提供的优质文本转语音服务,拥有 22 多种声音。

ElevenLabs TTS

快速开始

需要 inference.sh CLI (infsh)。安装说明

infsh login

# 使用 ElevenLabs 生成语音
infsh app run elevenlabs/tts --input '{"text": "你好,欢迎来到我们的产品演示。", "voice": "aria"}'

可用模型

模型 ID 最佳用途 延迟
多语言 v2 eleven_multilingual_v2 最高质量,支持 32 种语言 ~250ms
Turbo v2.5 eleven_turbo_v2_5 速度与质量的平衡 ~150ms
Flash v2.5 eleven_flash_v2_5 超低延迟 ~75ms

语音库

女声

语音 风格
aria 美式,对话式
alice 英式,自信
bella 美式,温暖
jessica 美式,富有表现力
laura 美式,专业
lily 英式,柔和
sarah 美式,友好

男声

语音 风格
george 英式,权威
adam 美式,深沉
bill 美式,成熟
brian 美式,对话式
callum 跨大西洋风格,强烈
charlie 澳式,自然
chris 美式,随意
daniel 英式,威严
eric 美式,友好
harry 美式,年轻
liam 美式,清晰
matilda 美式,温暖
river 美式,自信
roger 美式,权威
will 美式,明亮

示例

基础语音

infsh app run elevenlabs/tts --input '{"text": "欢迎参加我们的季度财报发布会。", "voice": "george"}'

选择模型

# 最高质量
infsh app run elevenlabs/tts --input '{
  "text": "这是我们最好的多语言模型,具有最高质量。",
  "voice": "aria",
  "model": "eleven_multilingual_v2"
}'

# 适用于实时应用的超快模型
infsh app run elevenlabs/tts --input '{
  "text": "Flash 模型适用于低延迟应用。",
  "voice": "brian",
  "model": "eleven_flash_v2_5"
}'

语音调优

infsh app run elevenlabs/tts --input '{
  "text": "根据您的用例微调语音特征。",
  "voice": "bella",
  "stability": 0.3,
  "similarity_boost": 0.9,
  "style": 0.4
}'
参数 范围 效果
stability 0-1 值越高 = 越稳定,值越低 = 越有表现力
similarity_boost 0-1 值越高 = 越接近原始语音特征
style 0-1 值越高 = 风格夸张度越高
use_speaker_boost true/false 增强说话者清晰度

输出格式

# 高质量 MP3
infsh app run elevenlabs/tts --input '{
  "text": "高质量音频输出。",
  "voice": "daniel",
  "output_format": "mp3_44100_192"
}'
格式 描述
mp3_44100_128 MP3 格式,44.1kHz,128kbps(默认)
mp3_44100_192 MP3 格式,44.1kHz,192kbps
pcm_16000 原始 PCM 格式,16kHz
pcm_22050 原始 PCM 格式,22.05kHz
pcm_24000 原始 PCM 格式,24kHz
pcm_44100 原始 PCM 格式,44.1kHz

多语言支持

ElevenLabs 支持 32 种语言,包括英语、西班牙语、法语、德语、意大利语、葡萄牙语、中文、日语、韩语、阿拉伯语、印地语、俄语等。

# 西班牙语
infsh app run elevenlabs/tts --input '{
  "text": "Hola, bienvenidos a nuestra presentación.",
  "voice": "aria",
  "model": "eleven_multilingual_v2"
}'

# 法语
infsh app run elevenlabs/tts --input '{
  "text": "Bonjour, bienvenue à notre démonstration.",
  "voice": "alice",
  "model": "eleven_multilingual_v2"
}'

语音 + 视频工作流

# 1. 生成配音
infsh app run elevenlabs/tts --input '{
  "text": "Introducing the future of AI-powered content creation.",
  "voice": "george"
}' > voiceover.json

# 2. 创建说话头像视频
infsh app run bytedance/omnihuman-1-5 --input '{
  "image_url": "https://portrait.jpg",
  "audio_url": "<audio-url-from-step-1>"
}'

应用场景

  • 配音:产品演示、解说视频、广告
  • 有声读物:使用一致的声音进行长篇叙述
  • 播客:具有自然表达能力的 AI 主持人
  • 在线教育:多语言课程讲解
  • 无障碍辅助:高质量屏幕阅读器内容
  • 交互式语音应答:专业的电话系统信息
  • 视频旁白:纪录片和社交媒体内容

相关技能

# ElevenLabs 多说话人对话
npx skills add inference-sh/skills@elevenlabs-dialogue

# ElevenLabs 变声器
npx skills add inference-sh/skills@elevenlabs-voice-changer

# ElevenLabs 音效
npx skills add inference-sh/skills@elevenlabs-sound-effects

# 所有 TTS 模型(Kokoro, DIA, Chatterbox 等)
npx skills add inference-sh/skills@text-to-speech

# 完整平台技能(150+ 个应用)
npx skills add inference-sh/skills@infsh-cli

浏览所有音频应用:infsh app list --category audio

📄 原始文档

完整文档(英文):

https://skills.sh/inferen-sh/skills/elevenlabs-tts

💡 提示:点击上方链接查看 skills.sh 原始英文文档,方便对照翻译。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。