Comandos y flujos de trabajo completos de síntesis de voz AI de ElevenLabs para texto a voz y generación de voz.
Autenticación de API
| Comando | Descripción |
|---|
curl -H "xi-api-key: <api-key>" <endpoint> | Autenticación de API |
export ELEVEN_API_KEY=<key> | Establecer variable de entorno |
elevenlabs auth login | Iniciar sesión en la cuenta |
elevenlabs auth logout | Cerrar sesión de la cuenta |
elevenlabs auth status | Verificar estado de autenticación |
API de Texto a Voz
| Endpoint | Descripción |
|---|
POST /v1/text-to-speech/{voice_id} | Generar voz |
POST /v1/text-to-speech/{voice_id}/stream | Transmitir voz |
GET /v1/voices | Lista de voces disponibles |
GET /v1/voices/{voice_id} | Obtener detalles de voz |
POST /v1/voices/add | Agregar voz personalizada |
Gestión de Voces
| Comando | Descripción |
|---|
GET /v1/voices | Listar todas las voces |
GET /v1/voices/{voice_id} | Obtener información de voz |
DELETE /v1/voices/{voice_id} | Eliminar voz personalizada |
POST /v1/voices/{voice_id}/edit | Editar configuración de voz |
GET /v1/voices/settings | Obtener configuración de voz |
Generación de Voz
| Comando | Descripción |
|---|
curl -X POST "https://api.elevenlabs.io/v1/text-to-speech/21m00Tcm4TlvDq8ikWAM" -H "xi-api-key: <key>" -H "Content-Type: application/json" -d '{"text": "Hello world"}' | Generación básica de voz |
curl -X POST "https://api.elevenlabs.io/v1/text-to-speech/21m00Tcm4TlvDq8ikWAM/stream" -H "xi-api-key: <key>" | Streaming de voz |
SDK de Python
| Comando | Descripción |
|---|
pip install elevenlabs | Instalar Python SDK |
from elevenlabs import generate, play | Importar SDK |
generate(text="Hello", voice="Bella") | Generar voz |
play(audio) | Reproducir audio generado |
save(audio, "output.mp3") | Guardar archivo de audio |
Clonación de Voz
| Comando | Descripción |
|---|
POST /v1/voices/add | Clonar voz a partir de muestras |
POST /v1/voices/{voice_id}/samples | Agregar muestras de voz |
DELETE /v1/voices/{voice_id}/samples/{sample_id} | Eliminar muestra de voz |
GET /v1/voices/{voice_id}/samples | Listar muestras de voz |
Configuración de Voz
| Parámetro | Descripción |
|---|
stability | Consistencia de voz (0.0-1.0) |
similarity_boost | Similitud de voz (0.0-1.0) |
style | Estilo de habla (0.0-1.0) |
use_speaker_boost | Mejorar similitud de altavoces |
| Formato | Descripción |
|---|
mp3_44100_128 | MP3 44.1kHz 128kbps |
mp3_22050_32 | MP3 22.05kHz 32kbps |
pcm_16000 | PCM 16kHz |
pcm_22050 | PCM 22.05kHz |
pcm_24000 | PCM 24kHz |
pcm_44100 | PCM 44.1kHz |
Voces Predefinidas
| Voice ID | Nombre | Descripción |
|---|
21m00Tcm4TlvDq8ikWAM | Rachel | Americana femenina |
AZnzlk1XvdvUeBnXmlld | Domi | Americana femenina |
EXAVITQu4vr4xnSDxMaL | Bella | Americana femenina |
ErXwobaYiN019PkySvjV | Antoni | Masculino estadounidense |
MF3mGyEYCl7XYWbV9V6O | Elli | Americana femenina |
TxGEqnHWrfWFTfGW9XjX | Josh | Masculino estadounidense |
VR6AewLTigWG4xSOukaG | Arnold | Masculino estadounidense |
pNInz6obpgDQGcFmaJgB | Adam | Masculino estadounidense |
SDK de Node.js
| Comando | Descripción |
|---|
npm install elevenlabs | Instalar Node.js SDK |
const { ElevenLabsAPI } = require('elevenlabs') | Importar SDK |
const client = new ElevenLabsAPI({ apiKey: 'key' }) | Inicializar cliente |
client.textToSpeech.generate() | Generar voz |
Transmisión de Audio
| Comando | Descripción |
|---|
POST /v1/text-to-speech/{voice_id}/stream | Transmitir audio |
curl -X POST -H "xi-api-key: <key>" --data-raw '{"text":"Hello"}' --output audio.mp3 | Transmitir a archivo |
Características de Voice Lab
| Característica | Descripción |
|---|
Voice Design | Crear voces sintéticas |
Voice Cloning | Clonar voces existentes |
Professional Cloning | Clonación de voz de alta calidad |
Voice Library | Examinar colección de voces |
Límites de Tasa de API
| Plan | Caracteres/Mes | Solicitudes Concurrentes |
|---|
Free | 10.000 | 2 |
Starter | 30.000 | 3 |
Creator | 100.000 | 5 |
Pro | 500.000 | 10 |
Scale | 2.000.000 | 25 |
Manejo de Errores
| Código de Error | Descripción |
|---|
400 | Solicitud Incorrecta |
401 | No autorizado |
403 | Prohibido |
404 | Not Found |
422 | Entidad No Procesable |
429 | Demasiadas Solicitudes |
500 | Error Interno del Servidor |
Parámetros Avanzados
| Parámetro | Descripción |
|---|
model_id | Modelo TTS a utilizar |
voice_settings | Configuración de voz |
pronunciation_dictionary_locators | Pronunciaciones personalizadas |
seed | Generación reproducible |
Configuración de Webhook
| Comando | Descripción |
|---|
POST /v1/webhooks | Crear webhook |
GET /v1/webhooks | Listar webhooks |
DELETE /v1/webhooks/{webhook_id} | Eliminar webhook |
PUT /v1/webhooks/{webhook_id} | Actualizar webhook |
Proyectos y Doblaje
| Comando | Descripción |
|---|
POST /v1/projects | Crear proyecto |
GET /v1/projects | Listar proyectos |
POST /v1/dubbing | Crear proyecto de doblaje |
GET /v1/dubbing/{dubbing_id} | Obtener estado de doblaje |
Análisis de Uso
| Comando | Descripción |
|---|
GET /v1/user/subscription | Obtener información de suscripción |
GET /v1/user | Obtener información del usuario |
GET /v1/usage/character-stats | Obtener estadísticas de uso |
Herramienta CLI
| Comando | Descripción |
|---|
elevenlabs --help | Mostrar ayuda |
elevenlabs tts --text "Hello" --voice Rachel | Generar voz |
elevenlabs voices list | Listar voces |
elevenlabs voices clone --name "MyVoice" | Clonar voz |
| Código | Descripción |
|---|
audio = generate(text="Hello", voice="Bella", model="eleven_monolingual_v1") | Generación básica |
play(audio) | Reproducir audio |
save(audio, "hello.mp3") | Guardar en archivo |
| Código | Descripción |
|---|
const audio = await elevenlabs.generate({ text: "Hello", voice: "Rachel" }) | Generar audio |
fs.writeFileSync("audio.mp3", audio) | Guardar en archivo |
| Paso | Descripción |
|---|
1. Upload samples | Proporcionar muestras de voz |
2. Train model | AI aprende patrones de voz |
3. Test generation | Verificar calidad de voz |
4. Fine-tune settings | Ajustar parámetros |
5. Deploy voice | Usar en producción |
| Práctica | Descripción |
|---|
Clear audio samples | Grabaciones de alta calidad |
Diverse samples | Varias emociones/estilos |
Consistent speaker | La misma persona durante todo el tiempo |
Proper length | 1-5 minutos en total |
Good microphone | Grabación profesional |
| Platform | Integración |
|---|
Discord Bot | Generación de mensajes de voz |
Podcast | Narración automatizada |
E-learning | Locuciones de curso |
Gaming | Voces de personajes |
Accessibility | Texto a voz para personas con discapacidad visual |
| Problema | Solución |
|---|
Poor voice quality | Mejorar la calidad de la muestra |
Rate limit exceeded | Actualizar plan o esperar |
Authentication failed | Verificar clave API |
Voice not found | Verificar ID de voz |
Audio distortion | Ajustar configuración de voz |
| Variable | Descripción |
|---|
ELEVEN_API_KEY | Clave de autenticación API |
ELEVEN_API_URL | URL base de API |
ELEVEN_TIMEOUT | Tiempo de espera de solicitud |
| Archivo | Descripción |
|---|
.elevenlabs.json | Archivo de configuración |
voices.json | Definiciones de voz |
settings.json | Configuración predeterminada |
| Métrica | Descripción |
| --------- | ------------- |
Characters used | Uso mensual |
API calls | Recuento de solicitudes |
Voice generations | Audio creado |
Error rate | Solicitudes fallidas |