Experimenta Más Control con Nuestras Nuevas Funciones de “Vista Previa de Audio” y “Pausa”
Jan 12, 2025

La entrega de contenido de video de alta calidad a menudo depende de los detalles más pequeños, como la pronunciación de una palabra o el momento de una pausa dramática. Estamos emocionados de presentar dos nuevas funciones—Vista Previa de Audio y Pausa—que te brindan más precisión y flexibilidad antes de comprometerte a generar un video completo.
¿Por qué Vista Previa de Audio?
Vista Previa de Audio es un cambio radical para cualquiera que quiera asegurarse de que su narración de texto a voz (TTS) suene exactamente como desea antes de gastar créditos para crear un video. En el pasado, pasabas directamente de escribir tu guion a generar el producto final. Aunque este flujo de trabajo era conveniente, no dejaba mucho espacio para ajustes finos, y si detectabas un pequeño error, ya habrías gastado tus créditos. Con Vista Previa de Audio, puedes:
- Verificar Pronunciación y Tono
Escuchar toda la pista de audio generada a partir de tu texto y asegurarte de que coincide con tu estilo deseado. - Ahorra Créditos
Detectar un error en el audio antes de renderizar un video te ayuda a evitar gastos innecesarios. - Evitar Artefactos de Transmisión
Cuando el audio se genera al vuelo para sincronizarse con el video (una “tubería de transmisión”), algunas voces de IA pueden mostrar ligeras inconsistencias de volumen al principio y al final. Al usar primero Vista Previa de Audio, puedes evitar estos artefactos y producir un resultado final más pulido.
Errores Comunes y Consideraciones de Texto: Aunque la tecnología TTS ha avanzado mucho, ciertas complejidades aún pueden presentar desafíos. Presta especial atención a:
- Términos Especializados o Técnicos: La jerga médica, legal o científica puede requerir ajustes adicionales de puntuación o ortografía.
- Abreviaturas: Asegúrate de que el TTS las expanda o pronuncie correctamente.
- Monedas y Números: El narrador podría hablar los números en un formato inesperado o pasar por alto los símbolos de moneda.
- Puntuación Pesada: Los puntos, comas y dos puntos pueden influir en cómo el TTS maneja la entonación y el ritmo.
Cuando notes algún problema, simplemente revisa tu texto, ejecuta Vista Previa de Audio nuevamente y confirma que es perfecto antes de presionar “Generar Video Hablante”.
Presentamos la Función de Pausa
A veces quieres ralentizar las cosas para un efecto dramático, enfatizar una frase o manejar palabras complicadas con precisión. Nuestra nueva opción de Pausa—accesible a través del icono “⏱ +0.5”—te permite insertar un breve descanso en cualquier parte de tu guion. Si necesitas un descanso más largo, simplemente incluye múltiples iconos de pausa en tu texto. Esta pausa manual puede:
- Mejorar la Claridad: Divide oraciones largas para que el oyente entienda claramente cada segmento.
- Mejorar el Énfasis: Construye anticipación antes de una declaración clave o un remate cómico.
- Anular la Pausa Predeterminada del TTS: Si el motor de texto a voz no pausa donde deseas, o agrega una pausa no intencionada, agregar pausas manualmente asegura que la narración final fluya como lo imaginas.
Consejos Importantes
Vista Previa de Audio utiliza una cuota basada en caracteres, que se restablece mensualmente según tu nivel de suscripción. Como pauta general, 1 minuto de discurso equivale aproximadamente a 1,000 caracteres:
- Gratis: 500 caracteres (~0.5 min de audio)
- Lite: 1,000 caracteres (~1 min de audio)
- Pro: 10,000 caracteres (~10 min de audio)
- Avanzado: 50,000 caracteres (~50 min de audio)
- Ultra: 100,000 caracteres (~100 min de audio)
Consejos para la Función de Cronómetro:
- Al usar la función de cronómetro, cada cronómetro representa una pausa de 0.5 segundos, y puedes usarlos consecutivamente para crear pausas más largas, hasta un máximo de 3 segundos.
- Recordatorio: Evita usar más de dos pausas consecutivas dentro de un solo segmento de texto, ya que esto puede causar que la IA produzca sonidos inesperados o artefactos.
Casos de Uso y Beneficios Reales
- Marketing y Publicidad
A los mercadólogos les encanta despertar curiosidad con líneas cortas e impactantes, a menudo seguidas de una pausa bien sincronizada. Ahora puedes pulir tu mensaje de marca y previsualizar diferentes entregas de líneas sin desperdiciar créditos. - E-Learning y Videos Instruccionales
La terminología compleja o los acrónimos son comunes en el contenido educativo. Previsualiza rápidamente cómo se leen, inserta las pausas correctas y asegúrate de que los estudiantes puedan seguir cómodamente. - Narración de Cuentos y Narración
Las voces dramáticas dependen de un ritmo preciso. Una pausa perfectamente colocada puede transmitir suspenso o matices emocionales, algo que el ritmo autogenerado del TTS podría no lograr siempre por sí solo. - Presentaciones Profesionales
Cuando necesitas articular un punto, por ejemplo, en revisiones financieras o presentaciones corporativas, los nombres o números mal pronunciados pueden socavar la credibilidad. Previsualizar y agregar pausas ayuda a asegurar una pista vocal suave y profesional.