Computer >> 컴퓨터 >  >> 소프트웨어 >> 소프트웨어

축제 - 음성 합성 시스템 - 자습서

텍스트 음성 변환은 그다지 중요하지 않은 것처럼 보일 수 있지만 중요합니다. 시각 장애인이 컴퓨터를 즐길 수 있도록 하는 것 외에도 다른 용도도 있습니다. 당신이 차 안에 있고, 운전하지 않기를 바라며, 책을 읽고 있다고 상상해보세요. 당신이 이것을 시도할 때 어지러워집니다. 또는 긴 텍스트 줄을 음성으로 대체하여 자습서에 오디오 차원을 추가하고 싶을 수도 있습니다.

축제 - 음성 합성 시스템 - 자습서

축제는 그렇게 합니다. 텍스트를 음성으로 변환할 수 있는 음성 합성 시스템입니다. 축제는 매우 편리합니다. 스크립팅이 가능하고 여러 프로그래밍 언어에 대한 API가 있습니다. 현재 페스티벌은 미국 및 영국 영어로 된 여러 남성 및 여성 목소리와 스페인어에 대한 초기 지원을 제공합니다.

한 번 보자.

축제 진행 중

Festival은 대부분의 주요 배포판의 저장소에서 사용할 수 있으므로 설치에는 문제가 없습니다. Festival은 그래픽 인터페이스가 없는 명령줄 도구입니다. 이를 사용하는 데 로켓 과학이 필요하지는 않지만 기본 지침은 온라인 설명서를 참조해야 합니다.

일반적으로 Festival은 대화식 모드로 실행됩니다. 당신은 프로그램을 실행하고 말할 내용을 알려줍니다. 그러나 책이나 논문과 같은 파일에 대해 프로그램을 실행하거나 다른 애플리케이션의 텍스트를 Festival로 파이프할 수도 있습니다.

대화식 모드

명령줄에 festival을 입력하여 Festival을 시작합니다.

그런 다음 말하게 하려면 다음 명령을 실행합니다.

(SayText "여기에 텍스트 입력")

다음은 스크린샷 예입니다.

축제 - 음성 합성 시스템 - 자습서

파일 모드

명령줄에 긴 텍스트 줄을 입력하는 대신 텍스트 줄에 대해 Festival을 실행할 수 있습니다. 오디오북, 세미나 자료 등에 정말 유용합니다.

샘플 파일은 다음과 같습니다.

축제 - 음성 합성 시스템 - 자습서

그런 다음 이 파일에 대해 Festival을 실행합니다.

축제 --tts <파일>

텍스트 음성 변환 녹음

페스티벌 사운드를 사운드 녹음 소프트웨어에 공급하여 오디오 파일을 생성할 수 있으며 나중에 적절하다고 판단되는 대로 처리할 수 있습니다. 예를 들어 Gnome Sound Recorder를 사용하여 그렇게 할 수 있습니다.

축제 - 음성 합성 시스템 - 자습서

다음은 이러한 방식으로 녹음된 12초 샘플입니다.

festival-demo.ogg, 12초, 253KB

이제 가장 중요한 부분은 위의 모든 항목을 실제로 건너뛸 수 있다는 것입니다. Festival은 입력 텍스트에서 .wav 파일을 자동으로 생성하는 내장 스크립트와 함께 제공됩니다. 스크립트는 text2wave라고 합니다.

text2wave <파일> -o <출력.wav>

축제 - 음성 합성 시스템 - 자습서

목소리

사용할 수 있는 여러 가지 음성이 있습니다. 온라인 데모를 통해 어떤 소리가 나는지 확인할 수도 있습니다. 일반적으로 저는 영국식 음성이 더 현실적이고 능률적이며 이해하기 쉽다는 것을 알았습니다. 그러나 그것은 전적으로 당신의 선택입니다.

결론

Festival은 간단하고 유용한 매우 편리한 소프트웨어입니다. 프로그램에서 즉각적인 사용이 보이지 않더라도 오디오-비디오 강의, 자습서 또는 단순한 재미와 같은 실용적인 목적으로 자신의 멀티미디어 도구 모음에 도입하는 것을 고려할 수 있습니다.

이 가이드가 마음에 드셨기를 바랍니다. 텍스트 음성 변환 소프트웨어에 대해 조금 더 알게 되었으므로 곧 Linux의 화면 판독기 소프트웨어인 Orca를 살펴보고 다른 접근성 기능을 살펴보겠습니다. 지금은 시각 장애가 있는 사용자를 위해 특별히 설계된 Knoppix Adriane을 살펴볼 수 있습니다.

건배.