새로운 “미리 듣기” 및 “일시 정지” 기능으로 더 많은 제어 경험
Jan 12, 2025

고품질 비디오 콘텐츠 제공은 종종 단어의 발음이나 극적인 일시 정지의 타이밍과 같은 작은 세부 사항에 달려 있습니다. 우리는 전체 비디오를 생성하기 전에 더 많은 정밀성과 유연성을 제공하는 두 가지 새로운 기능인 미리 듣기와 일시 정지를 소개하게 되어 기쁩니다.
왜 미리 듣기인가요?
미리 듣기는 텍스트 음성 변환(TTS) 내레이션이 비디오를 생성하기 전에 정확히 원하는 대로 들리는지 확인하고자 하는 모든 사람에게 획기적인 기능입니다. 과거에는 스크립트를 입력한 후 바로 최종 제품을 생성했습니다. 이 워크플로우는 편리했지만 세부 조정의 여지가 많지 않았고, 작은 실수를 발견했을 때 이미 크레딧을 사용했을 수 있습니다. 미리 듣기를 통해 다음을 수행할 수 있습니다:
- 발음 및 톤 확인
텍스트에서 생성된 전체 오디오 트랙을 듣고 원하는 스타일과 일치하는지 확인하세요. - 크레딧 절약
비디오 렌더링 전에 오디오에서 오류를 발견하면 불필요한 지출을 피할 수 있습니다. - 스트리밍 아티팩트 방지
오디오가 비디오와 동기화되도록 실시간으로 생성될 때(“스트리밍 파이프라인”), 일부 AI 음성은 시작과 끝에서 약간의 볼륨 불일치를 보일 수 있습니다. 미리 듣기를 먼저 사용하여 이러한 아티팩트를 피하고 더 세련된 최종 결과를 얻을 수 있습니다.
일반적인 함정 및 텍스트 고려사항: TTS 기술이 많이 발전했지만, 여전히 특정 복잡성은 도전 과제가 될 수 있습니다. 다음에 주의하세요:
- 전문 용어 또는 기술 용어: 의학, 법률 또는 과학 용어는 추가 구두점이나 철자 조정이 필요할 수 있습니다.
- 약어: TTS가 이를 올바르게 확장하거나 발음하는지 확인하세요.
- 통화 및 숫자: 내레이터가 숫자를 예상치 못한 형식으로 말하거나 통화 기호를 무시할 수 있습니다.
- 과도한 구두점: 마침표, 쉼표, 콜론은 TTS가 억양과 속도를 처리하는 방식에 영향을 줄 수 있습니다.
문제가 발견되면 텍스트를 수정하고 미리 듣기를 다시 실행하여 “말하는 비디오 생성”을 누르기 전에 완벽한지 확인하세요.
일시 정지 기능 소개
때로는 극적인 효과를 위해 속도를 늦추거나, 구문을 강조하거나, 까다로운 단어를 정확하게 처리하고 싶을 때가 있습니다. 새로운 일시 정지 옵션은 스크립트 어디에나 짧은 휴식을 삽입할 수 있는 “⏱ +0.5” 아이콘을 통해 접근할 수 있습니다. 더 긴 휴식이 필요하면 텍스트에 여러 개의 일시 정지 아이콘을 포함하세요. 이 수동 일시 정지는 다음을 수행할 수 있습니다:
- 명확성 향상: 긴 문장을 나누어 청취자가 각 부분을 명확하게 이해할 수 있도록 합니다.
- 강조 강화: 중요한 진술이나 코믹한 펀치라인 전에 기대감을 높입니다.
- 기본 TTS 일시 정지 무시: 텍스트 음성 변환 엔진이 원하는 곳에서 일시 정지하지 않거나 의도하지 않은 휴식을 추가하는 경우, 수동으로 일시 정지를 추가하여 최종 내레이션이 원하는 대로 흐르도록 합니다.
중요한 팁
미리 듣기는 구독 등급에 따라 매월 재설정되는 문자 기반 할당량을 사용합니다. 일반적인 지침으로, 1분의 음성은 대략 1,000자입니다:
- 무료: 500자 (~0.5분의 오디오)
- 라이트: 1,000자 (~1분의 오디오)
- 프로: 10,000자 (~10분의 오디오)
- 고급: 50,000자 (~50분의 오디오)
- 울트라: 100,000자 (~100분의 오디오)
스톱워치 기능에 대한 팁:
- 스톱워치 기능을 사용할 때, 각 스톱워치는 0.5초의 일시 정지를 나타내며, 최대 3초까지 더 긴 일시 정지를 만들기 위해 연속적으로 사용할 수 있습니다.
- 알림: 단일 텍스트 세그먼트 내에서 두 개 이상의 연속적인 일시 정지를 사용하지 마세요. 이는 AI가 예상치 못한 소리나 아티팩트를 생성할 수 있습니다.
사용 사례 및 실제 혜택
- 마케팅 및 광고
마케터들은 종종 짧고 강력한 문장으로 호기심을 자극하고, 잘 타이밍된 일시 정지로 이어집니다. 이제 크레딧을 낭비하지 않고 브랜드 메시지를 다듬고 다양한 문장 전달을 미리 볼 수 있습니다. - 전자 학습 및 교육 비디오
교육 콘텐츠에서는 복잡한 용어 또는 약어가 일상적입니다. 그들이 어떻게 읽히는지 빠르게 미리 보고, 적절한 일시 정지를 삽입하여 학습자가 편안하게 따라갈 수 있도록 합니다. - 스토리텔링 및 내레이션
극적인 음성 해설은 정확한 속도에 의존합니다. 완벽하게 배치된 일시 정지는 서스펜스나 감정적 뉘앙스를 전달할 수 있습니다. 이는 TTS의 자동 생성 속도가 항상 잘 맞지 않을 수 있습니다. - 전문 프레젠테이션
재무 검토나 기업 발표에서 포인트를 명확히 해야 할 때, 잘못 발음된 이름이나 숫자는 신뢰성을 저하시킬 수 있습니다. 미리 보기와 일시 정지를 추가하여 매끄럽고 전문적인 음성 트랙을 보장합니다.