Erleben Sie mehr Kontrolle mit unseren neuen „Vorschau-Audio“ und „Pause“ Funktionen
Jan 12, 2025

Die Bereitstellung hochwertiger Videoinhalte hängt oft von den kleinsten Details ab – wie der Aussprache eines Wortes oder dem Timing einer dramatischen Pause. Wir freuen uns, zwei neue Funktionen vorzustellen – Vorschau-Audio und Pause –, die Ihnen mehr Präzision und Flexibilität bieten, bevor Sie sich zur Erstellung eines vollständigen Videos verpflichten.
Warum Vorschau-Audio?
Vorschau-Audio ist ein Wendepunkt für alle, die sicherstellen möchten, dass ihre Text-to-Speech (TTS) Erzählung genau richtig klingt, bevor sie Credits für die Erstellung eines Videos verwenden. In der Vergangenheit sind Sie direkt vom Schreiben Ihres Skripts zur Erstellung des Endprodukts übergegangen. Während dieser Arbeitsablauf bequem war, ließ er wenig Raum für Feinabstimmungen – und wenn Sie einen kleinen Fehler bemerkten, hatten Sie bereits Ihre Credits verbraucht. Mit Vorschau-Audio können Sie:
- Aussprache & Ton überprüfen
Hören Sie sich die gesamte Audiospur an, die aus Ihrem Text generiert wurde, und stellen Sie sicher, dass sie Ihrem gewünschten Stil entspricht. - Credits sparen
Wenn Sie einen Fehler im Audio vor der Videoerstellung entdecken, vermeiden Sie unnötige Ausgaben. - Streaming-Artefakte vermeiden
Wenn Audio in Echtzeit generiert wird, um mit dem Video zu synchronisieren (eine „Streaming-Pipeline“), können einige KI-Stimmen leichte Lautstärkeschwankungen am Anfang und Ende aufweisen. Durch die Verwendung von Vorschau-Audio können Sie diese Artefakte umgehen und ein polierteres Endergebnis erzielen.
Häufige Fallstricke & Textüberlegungen: Während sich die TTS-Technologie stark weiterentwickelt hat, können bestimmte Komplexitäten weiterhin Herausforderungen darstellen. Achten Sie besonders auf:
- Spezialisierte oder technische Begriffe: Medizinische, rechtliche oder wissenschaftliche Fachbegriffe können zusätzliche Interpunktion oder Rechtschreibanpassungen erfordern.
- Abkürzungen: Stellen Sie sicher, dass TTS sie korrekt erweitert oder ausspricht.
- Währungen & Zahlen: Der Erzähler könnte Zahlen in einem unerwarteten Format sprechen oder Währungssymbole übergehen.
- Starke Interpunktion: Punkte, Kommas und Doppelpunkte können beeinflussen, wie TTS Intonation und Tempo handhabt.
Wenn Sie Probleme bemerken, überarbeiten Sie einfach Ihren Text, führen Sie Vorschau-Audio erneut aus und bestätigen Sie, dass alles perfekt ist, bevor Sie „Sprechendes Video generieren“ drücken.
Einführung der Pausenfunktion
Manchmal möchten Sie das Tempo für dramatische Effekte verlangsamen, einen Satz betonen oder schwierige Wörter mit Präzision behandeln. Unsere neue Pause-Option – zugänglich über das „⏱ +0.5“-Symbol – ermöglicht es Ihnen, eine kurze Pause überall in Ihrem Skript einzufügen. Wenn Sie eine längere Pause benötigen, fügen Sie einfach mehrere Pausensymbole in Ihren Text ein. Diese manuelle Pause kann:
- Klarheit verbessern: Lange Sätze aufteilen, damit der Zuhörer jeden Abschnitt klar versteht.
- Betonung verstärken: Spannung vor einer wichtigen Aussage oder einer humorvollen Pointe aufbauen.
- Standard-TTS-Pausen überschreiben: Wenn die Text-to-Speech-Engine nicht dort pausiert, wo Sie es möchten – oder eine unbeabsichtigte Pause einfügt – stellen manuell hinzugefügte Pausen sicher, dass die endgültige Erzählung so fließt, wie Sie es sich vorstellen.
Wichtige Tipps
Vorschau-Audio verwendet ein zeichenbasiertes Kontingent, das sich monatlich gemäß Ihrem Abonnementtarif zurücksetzt. Als allgemeine Richtlinie gilt: 1 Minute Sprache entspricht ungefähr 1.000 Zeichen:
- Gratis: 500 Zeichen (~0,5 Min. Audio)
- Lite: 1.000 Zeichen (~1 Min. Audio)
- Pro: 10.000 Zeichen (~10 Min. Audio)
- Erweitert: 50.000 Zeichen (~50 Min. Audio)
- Ultra: 100.000 Zeichen (~100 Min. Audio)
Tipps für die Stoppuhr-Funktion:
- Bei Verwendung der Stoppuhr-Funktion repräsentiert jede Stoppuhr eine 0,5-sekündige Pause, und Sie können sie nacheinander verwenden, um längere Pausen zu erstellen, bis zu einem Maximum von 3 Sekunden.
- Erinnerung: Vermeiden Sie es, mehr als zwei aufeinanderfolgende Pausen innerhalb eines einzelnen Textsegments zu verwenden, da dies dazu führen kann, dass die KI unerwartete Geräusche oder Artefakte erzeugt.
Anwendungsfälle & Vorteile in der Praxis
- Marketing & Werbung
Marketer lieben es, mit kurzen, wirkungsvollen Zeilen Neugier zu wecken – oft gefolgt von einer gut getimten Pause. Jetzt können Sie Ihre Markenbotschaft verfeinern und verschiedene Zeilenlieferungen vorschauen, ohne Credits zu verschwenden. - E-Learning & Lehrvideos
Komplexe Terminologie oder Akronyme sind in Bildungsinhalten Routine. Überprüfen Sie schnell, wie sie vorgelesen werden, fügen Sie die richtigen Pausen ein und stellen Sie sicher, dass die Lernenden problemlos folgen können. - Geschichtenerzählen & Erzählung
Dramatische Voiceovers verlassen sich auf präzises Timing. Eine perfekt platzierte Pause kann Spannung oder emotionale Nuancen vermitteln – etwas, das das automatisch generierte Timing von TTS nicht immer alleine schafft. - Professionelle Präsentationen
Wenn Sie einen Punkt artikulieren müssen – zum Beispiel in Finanzberichten oder Unternehmenspräsentationen – können falsch ausgesprochene Namen oder Zahlen die Glaubwürdigkeit untergraben. Vorschau und Hinzufügen von Pausen hilft, eine reibungslose, professionelle Sprachspur zu gewährleisten.