Ir al contenido

Comandos de ElevenLabs

Comandos y flujos de trabajo completos de síntesis de voz AI de ElevenLabs para texto a voz y generación de voz.

Autenticación de API

Comando	Descripción
`curl -H "xi-api-key: <api-key>" <endpoint>`	Autenticación de API
`export ELEVEN_API_KEY=<key>`	Establecer variable de entorno
`elevenlabs auth login`	Iniciar sesión en la cuenta
`elevenlabs auth logout`	Cerrar sesión de la cuenta
`elevenlabs auth status`	Verificar estado de autenticación

API de Texto a Voz

Endpoint	Descripción
`POST /v1/text-to-speech/{voice_id}`	Generar voz
`POST /v1/text-to-speech/{voice_id}/stream`	Transmitir voz
`GET /v1/voices`	Lista de voces disponibles
`GET /v1/voices/{voice_id}`	Obtener detalles de voz
`POST /v1/voices/add`	Agregar voz personalizada

Gestión de Voces

Comando	Descripción
`GET /v1/voices`	Listar todas las voces
`GET /v1/voices/{voice_id}`	Obtener información de voz
`DELETE /v1/voices/{voice_id}`	Eliminar voz personalizada
`POST /v1/voices/{voice_id}/edit`	Editar configuración de voz
`GET /v1/voices/settings`	Obtener configuración de voz

Generación de Voz

Comando	Descripción
`curl -X POST "https://api.elevenlabs.io/v1/text-to-speech/21m00Tcm4TlvDq8ikWAM" -H "xi-api-key: <key>" -H "Content-Type: application/json" -d '{"text": "Hello world"}'`	Generación básica de voz
`curl -X POST "https://api.elevenlabs.io/v1/text-to-speech/21m00Tcm4TlvDq8ikWAM/stream" -H "xi-api-key: <key>"`	Streaming de voz

SDK de Python

Comando	Descripción
`pip install elevenlabs`	Instalar Python SDK
`from elevenlabs import generate, play`	Importar SDK
`generate(text="Hello", voice="Bella")`	Generar voz
`play(audio)`	Reproducir audio generado
`save(audio, "output.mp3")`	Guardar archivo de audio

Clonación de Voz

Comando	Descripción
`POST /v1/voices/add`	Clonar voz a partir de muestras
`POST /v1/voices/{voice_id}/samples`	Agregar muestras de voz
`DELETE /v1/voices/{voice_id}/samples/{sample_id}`	Eliminar muestra de voz
`GET /v1/voices/{voice_id}/samples`	Listar muestras de voz

Configuración de Voz

Parámetro	Descripción
`stability`	Consistencia de voz (0.0-1.0)
`similarity_boost`	Similitud de voz (0.0-1.0)
`style`	Estilo de habla (0.0-1.0)
`use_speaker_boost`	Mejorar similitud de altavoces

Formatos de Audio

Formato	Descripción
`mp3_44100_128`	MP3 44.1kHz 128kbps
`mp3_22050_32`	MP3 22.05kHz 32kbps
`pcm_16000`	PCM 16kHz
`pcm_22050`	PCM 22.05kHz
`pcm_24000`	PCM 24kHz
`pcm_44100`	PCM 44.1kHz

Voces Predefinidas

Voice ID	Nombre	Descripción
`21m00Tcm4TlvDq8ikWAM`	Rachel	Americana femenina
`AZnzlk1XvdvUeBnXmlld`	Domi	Americana femenina
`EXAVITQu4vr4xnSDxMaL`	Bella	Americana femenina
`ErXwobaYiN019PkySvjV`	Antoni	Masculino estadounidense
`MF3mGyEYCl7XYWbV9V6O`	Elli	Americana femenina
`TxGEqnHWrfWFTfGW9XjX`	Josh	Masculino estadounidense
`VR6AewLTigWG4xSOukaG`	Arnold	Masculino estadounidense
`pNInz6obpgDQGcFmaJgB`	Adam	Masculino estadounidense

SDK de Node.js

Comando	Descripción
`npm install elevenlabs`	Instalar Node.js SDK
`const { ElevenLabsAPI } = require('elevenlabs')`	Importar SDK
`const client = new ElevenLabsAPI({ apiKey: 'key' })`	Inicializar cliente
`client.textToSpeech.generate()`	Generar voz

Transmisión de Audio

Comando	Descripción
`POST /v1/text-to-speech/{voice_id}/stream`	Transmitir audio
`curl -X POST -H "xi-api-key: <key>" --data-raw '{"text":"Hello"}' --output audio.mp3`	Transmitir a archivo

Características de Voice Lab

Característica	Descripción
`Voice Design`	Crear voces sintéticas
`Voice Cloning`	Clonar voces existentes
`Professional Cloning`	Clonación de voz de alta calidad
`Voice Library`	Examinar colección de voces

Límites de Tasa de API

Plan	Caracteres/Mes	Solicitudes Concurrentes
`Free`	10.000	2
`Starter`	30.000	3
`Creator`	100.000	5
`Pro`	500.000	10
`Scale`	2.000.000	25

Manejo de Errores

Código de Error	Descripción
`400`	Solicitud Incorrecta
`401`	No autorizado
`403`	Prohibido
`404`	Not Found
`422`	Entidad No Procesable
`429`	Demasiadas Solicitudes
`500`	Error Interno del Servidor

Parámetros Avanzados

Parámetro	Descripción
`model_id`	Modelo TTS a utilizar
`voice_settings`	Configuración de voz
`pronunciation_dictionary_locators`	Pronunciaciones personalizadas
`seed`	Generación reproducible

Configuración de Webhook

Comando	Descripción
`POST /v1/webhooks`	Crear webhook
`GET /v1/webhooks`	Listar webhooks
`DELETE /v1/webhooks/{webhook_id}`	Eliminar webhook
`PUT /v1/webhooks/{webhook_id}`	Actualizar webhook

Proyectos y Doblaje

Comando	Descripción
`POST /v1/projects`	Crear proyecto
`GET /v1/projects`	Listar proyectos
`POST /v1/dubbing`	Crear proyecto de doblaje
`GET /v1/dubbing/{dubbing_id}`	Obtener estado de doblaje

Análisis de Uso

Comando	Descripción
`GET /v1/user/subscription`	Obtener información de suscripción
`GET /v1/user`	Obtener información del usuario
`GET /v1/usage/character-stats`	Obtener estadísticas de uso

Herramienta CLI

Comando	Descripción
`elevenlabs --help`	Mostrar ayuda
`elevenlabs tts --text "Hello" --voice Rachel`	Generar voz
`elevenlabs voices list`	Listar voces
`elevenlabs voices clone --name "MyVoice"`	Clonar voz

Código	Descripción
`audio = generate(text="Hello", voice="Bella", model="eleven_monolingual_v1")`	Generación básica
`play(audio)`	Reproducir audio
`save(audio, "hello.mp3")`	Guardar en archivo

Código	Descripción
`const audio = await elevenlabs.generate({ text: "Hello", voice: "Rachel" })`	Generar audio
`fs.writeFileSync("audio.mp3", audio)`	Guardar en archivo

Paso	Descripción
`1. Upload samples`	Proporcionar muestras de voz
`2. Train model`	AI aprende patrones de voz
`3. Test generation`	Verificar calidad de voz
`4. Fine-tune settings`	Ajustar parámetros
`5. Deploy voice`	Usar en producción

Práctica	Descripción
`Clear audio samples`	Grabaciones de alta calidad
`Diverse samples`	Varias emociones/estilos
`Consistent speaker`	La misma persona durante todo el tiempo
`Proper length`	1-5 minutos en total
`Good microphone`	Grabación profesional

Platform	Integración
`Discord Bot`	Generación de mensajes de voz
`Podcast`	Narración automatizada
`E-learning`	Locuciones de curso
`Gaming`	Voces de personajes
`Accessibility`	Texto a voz para personas con discapacidad visual

Problema	Solución
`Poor voice quality`	Mejorar la calidad de la muestra
`Rate limit exceeded`	Actualizar plan o esperar
`Authentication failed`	Verificar clave API
`Voice not found`	Verificar ID de voz
`Audio distortion`	Ajustar configuración de voz

Variable	Descripción
`ELEVEN_API_KEY`	Clave de autenticación API
`ELEVEN_API_URL`	URL base de API
`ELEVEN_TIMEOUT`	Tiempo de espera de solicitud

Archivo	Descripción
`.elevenlabs.json`	Archivo de configuración
`voices.json`	Definiciones de voz
`settings.json`	Configuración predeterminada
Métrica	Descripción
---------	-------------
`Characters used`	Uso mensual
`API calls`	Recuento de solicitudes
`Voice generations`	Audio creado
`Error rate`	Solicitudes fallidas