Expérimentez Plus de Contrôle avec Nos Nouvelles Fonctionnalités “Aperçu Audio” et “Pause”

Jan 12, 2025

Fonctionnalités d'aperçu audio et de pause pour la création de contenu vidéo

La création de contenu vidéo de haute qualité repose souvent sur les plus petits détails, comme la prononciation d'un mot ou le timing d'une pause dramatique. Nous sommes ravis de vous présenter deux nouvelles fonctionnalités—Aperçu Audio et Pause—qui vous offrent plus de précision et de flexibilité avant de vous engager à générer une vidéo complète.

Pourquoi l'Aperçu Audio ?

L'Aperçu Audio est une révolution pour quiconque souhaite s'assurer que la narration par synthèse vocale (TTS) sonne exactement comme il le souhaite avant d'utiliser des crédits pour créer une vidéo. Auparavant, vous passiez directement de la saisie de votre script à la génération du produit final. Bien que ce flux de travail soit pratique, il ne laissait pas beaucoup de place pour les ajustements—et si vous remarquiez une petite erreur, vous auriez déjà dépensé vos crédits. Avec l'Aperçu Audio, vous pouvez :

  1. Vérifier la Prononciation & le Ton
    Écoutez l'intégralité de la piste audio générée à partir de votre texte et assurez-vous qu'elle correspond à votre style souhaité.
  2. Économiser des Crédits
    Détecter une erreur dans l'audio avant de rendre une vidéo vous aide à éviter des dépenses inutiles.
  3. Éviter les Artéfacts de Streaming
    Lorsque l'audio est généré à la volée pour se synchroniser avec la vidéo (un "pipeline de streaming"), certaines voix AI peuvent présenter de légères incohérences de volume au début et à la fin. En utilisant d'abord l'Aperçu Audio, vous pouvez éviter ces artéfacts et produire un résultat final plus soigné.

Pièges Courants & Considérations Textuelles : Bien que la technologie TTS ait beaucoup progressé, certaines complexités peuvent encore poser des défis. Soyez particulièrement attentif à :

  • Termes Spécialisés ou Techniques : Le jargon médical, juridique ou scientifique peut nécessiter des ajustements de ponctuation ou d'orthographe supplémentaires.
  • Abréviations : Assurez-vous que le TTS les développe ou les prononce correctement.
  • Devises & Nombres : Le narrateur pourrait prononcer les nombres dans un format inattendu ou ignorer les symboles monétaires.
  • Ponctuation Lourde : Les points, virgules et deux-points peuvent influencer la façon dont le TTS gère l'intonation et le rythme.

Lorsque vous remarquez des problèmes, il vous suffit de réviser votre texte, de relancer l'Aperçu Audio, et de confirmer que tout est parfait avant de cliquer sur “Générer Vidéo Parlante.”

Présentation de la Fonctionnalité de Pause

Parfois, vous souhaitez ralentir les choses pour un effet dramatique, mettre en valeur une phrase, ou gérer des mots difficiles avec précision. Notre nouvelle option Pause—accessible via l'icône “⏱ +0.5”—vous permet d'insérer une courte pause n'importe où dans votre script. Si vous avez besoin d'une pause plus longue, il suffit d'inclure plusieurs icônes de pause dans votre texte. Cette pause manuelle peut :

  • Améliorer la Clarté : Découpez les phrases longues pour que l'auditeur comprenne clairement chaque segment.
  • Renforcer l'Emphase : Créez de l'anticipation avant une déclaration clé ou une punchline comique.
  • Remplacer la Pause par Défaut du TTS : Si le moteur de synthèse vocale ne fait pas de pause là où vous le souhaitez—ou ajoute une pause non désirée—ajouter manuellement des pauses garantit que la narration finale se déroule comme vous l'imaginez.

Conseils Importants

L'Aperçu Audio utilise un quota basé sur le nombre de caractères, qui se réinitialise mensuellement selon votre niveau d'abonnement. En règle générale, 1 minute de discours correspond à environ 1 000 caractères :

  • Gratuit : 500 caractères (~0,5 min d'audio)
  • Lite : 1 000 caractères (~1 min d'audio)
  • Pro : 10 000 caractères (~10 min d'audio)
  • Avancé : 50 000 caractères (~50 min d'audio)
  • Ultra : 100 000 caractères (~100 min d'audio)

Conseils pour la Fonctionnalité de Chronomètre :

  • Lors de l'utilisation de la fonctionnalité de chronomètre, chaque chronomètre représente une pause de 0,5 seconde, et vous pouvez les utiliser consécutivement pour créer des pauses plus longues, jusqu'à un maximum de 3 secondes.
  • Rappel : Évitez d'utiliser plus de deux pauses consécutives dans un seul segment de texte, car cela pourrait amener l'IA à produire des sons ou des artéfacts inattendus.

Cas d'Utilisation & Avantages Réels

  • Marketing & Publicité
    Les marketeurs aiment susciter la curiosité avec des phrases courtes et percutantes—souvent suivies d'une pause bien placée. Vous pouvez maintenant peaufiner votre message de marque et prévisualiser différentes livraisons de lignes sans gaspiller de crédits.
  • E-Learning & Vidéos Pédagogiques
    La terminologie complexe ou les acronymes sont courants dans le contenu éducatif. Prévisualisez rapidement comment ils sont lus, insérez les pauses appropriées, et assurez-vous que les apprenants peuvent suivre confortablement.
  • Récits & Narration
    Les voix off dramatiques reposent sur un rythme précis. Une pause parfaitement placée peut transmettre du suspense ou une nuance émotionnelle—quelque chose que le rythme auto-généré du TTS ne parvient pas toujours à capturer.
  • Présentations Professionnelles
    Lorsque vous devez articuler un point—par exemple, lors de revues financières ou de présentations d'entreprise—des noms ou des chiffres mal prononcés peuvent nuire à la crédibilité. Prévisualiser et ajouter des pauses aide à garantir une piste vocale fluide et professionnelle.