🚀 快速安装
复制以下命令并运行,立即安装此 Skill:
npx skills add https://skills.sh/inferen-sh/skills/elevenlabs-tts
💡 提示:需要 Node.js 和 NPM
ElevenLabs 文本转语音
通过 inference.sh CLI 提供的优质文本转语音服务,拥有 22 多种声音。

快速开始
需要 inference.sh CLI (
infsh)。安装说明
infsh login
# 使用 ElevenLabs 生成语音
infsh app run elevenlabs/tts --input '{"text": "你好,欢迎来到我们的产品演示。", "voice": "aria"}'
可用模型
| 模型 | ID | 最佳用途 | 延迟 |
|---|---|---|---|
| 多语言 v2 | eleven_multilingual_v2 |
最高质量,支持 32 种语言 | ~250ms |
| Turbo v2.5 | eleven_turbo_v2_5 |
速度与质量的平衡 | ~150ms |
| Flash v2.5 | eleven_flash_v2_5 |
超低延迟 | ~75ms |
语音库
女声
| 语音 | 风格 |
|---|---|
aria |
美式,对话式 |
alice |
英式,自信 |
bella |
美式,温暖 |
jessica |
美式,富有表现力 |
laura |
美式,专业 |
lily |
英式,柔和 |
sarah |
美式,友好 |
男声
| 语音 | 风格 |
|---|---|
george |
英式,权威 |
adam |
美式,深沉 |
bill |
美式,成熟 |
brian |
美式,对话式 |
callum |
跨大西洋风格,强烈 |
charlie |
澳式,自然 |
chris |
美式,随意 |
daniel |
英式,威严 |
eric |
美式,友好 |
harry |
美式,年轻 |
liam |
美式,清晰 |
matilda |
美式,温暖 |
river |
美式,自信 |
roger |
美式,权威 |
will |
美式,明亮 |
示例
基础语音
infsh app run elevenlabs/tts --input '{"text": "欢迎参加我们的季度财报发布会。", "voice": "george"}'
选择模型
# 最高质量
infsh app run elevenlabs/tts --input '{
"text": "这是我们最好的多语言模型,具有最高质量。",
"voice": "aria",
"model": "eleven_multilingual_v2"
}'
# 适用于实时应用的超快模型
infsh app run elevenlabs/tts --input '{
"text": "Flash 模型适用于低延迟应用。",
"voice": "brian",
"model": "eleven_flash_v2_5"
}'
语音调优
infsh app run elevenlabs/tts --input '{
"text": "根据您的用例微调语音特征。",
"voice": "bella",
"stability": 0.3,
"similarity_boost": 0.9,
"style": 0.4
}'
| 参数 | 范围 | 效果 |
|---|---|---|
stability |
0-1 | 值越高 = 越稳定,值越低 = 越有表现力 |
similarity_boost |
0-1 | 值越高 = 越接近原始语音特征 |
style |
0-1 | 值越高 = 风格夸张度越高 |
use_speaker_boost |
true/false | 增强说话者清晰度 |
输出格式
# 高质量 MP3
infsh app run elevenlabs/tts --input '{
"text": "高质量音频输出。",
"voice": "daniel",
"output_format": "mp3_44100_192"
}'
| 格式 | 描述 |
|---|---|
mp3_44100_128 |
MP3 格式,44.1kHz,128kbps(默认) |
mp3_44100_192 |
MP3 格式,44.1kHz,192kbps |
pcm_16000 |
原始 PCM 格式,16kHz |
pcm_22050 |
原始 PCM 格式,22.05kHz |
pcm_24000 |
原始 PCM 格式,24kHz |
pcm_44100 |
原始 PCM 格式,44.1kHz |
多语言支持
ElevenLabs 支持 32 种语言,包括英语、西班牙语、法语、德语、意大利语、葡萄牙语、中文、日语、韩语、阿拉伯语、印地语、俄语等。
# 西班牙语
infsh app run elevenlabs/tts --input '{
"text": "Hola, bienvenidos a nuestra presentación.",
"voice": "aria",
"model": "eleven_multilingual_v2"
}'
# 法语
infsh app run elevenlabs/tts --input '{
"text": "Bonjour, bienvenue à notre démonstration.",
"voice": "alice",
"model": "eleven_multilingual_v2"
}'
语音 + 视频工作流
# 1. 生成配音
infsh app run elevenlabs/tts --input '{
"text": "Introducing the future of AI-powered content creation.",
"voice": "george"
}' > voiceover.json
# 2. 创建说话头像视频
infsh app run bytedance/omnihuman-1-5 --input '{
"image_url": "https://portrait.jpg",
"audio_url": "<audio-url-from-step-1>"
}'
应用场景
- 配音:产品演示、解说视频、广告
- 有声读物:使用一致的声音进行长篇叙述
- 播客:具有自然表达能力的 AI 主持人
- 在线教育:多语言课程讲解
- 无障碍辅助:高质量屏幕阅读器内容
- 交互式语音应答:专业的电话系统信息
- 视频旁白:纪录片和社交媒体内容
相关技能
# ElevenLabs 多说话人对话
npx skills add inference-sh/skills@elevenlabs-dialogue
# ElevenLabs 变声器
npx skills add inference-sh/skills@elevenlabs-voice-changer
# ElevenLabs 音效
npx skills add inference-sh/skills@elevenlabs-sound-effects
# 所有 TTS 模型(Kokoro, DIA, Chatterbox 等)
npx skills add inference-sh/skills@text-to-speech
# 完整平台技能(150+ 个应用)
npx skills add inference-sh/skills@infsh-cli
浏览所有音频应用:infsh app list --category audio
📄 原始文档
完整文档(英文):
https://skills.sh/inferen-sh/skills/elevenlabs-tts
💡 提示:点击上方链接查看 skills.sh 原始英文文档,方便对照翻译。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

评论(0)