Espeak
Espeak to bezpłatny i open source narzędzie do mowy, którego można użyć do konwersji tekstu na mowę w wielu różnych językach. Jest wyposażony w narzędzie wiersza poleceń, a także bibliotekę, której można użyć we własnej aplikacji. Większość głosów dostępnych w espeak dźwięku roboty. Obsługuje przekształcenie tekstu na mowę w ponad 40 różnych językach, a także możesz zapisać mowę na pliki audio w formacie plików WAV. Jest również wyposażony w wbudowaną obsługę przekształcania tekstu na fonemy, abyś mógł używać ich w innych aplikacjach, w tym innych silnikach tekstowych do mowy.
Możesz zainstalować EpSeak w Ubuntu, używając poniższego polecenia:
$ sudo apt instal espeak
Możesz pobrać espeak w innych dystrybucjach Linux z menedżera pakietów. Więcej opcji pobierania jest dostępnych tutaj.
Aby przekonwertować kawałek tekstu na mowę za pomocą espeak, użyj polecenia w następującym formacie:
$ espeak „tekst zostanie przekonwertowany na mowę."
Możesz zastąpić treść w cytatach własnym pożądanym ciągiem. Aby zsyntetyzować całą zawartość pliku do mowy, uruchom polecenie w następującym formacie:
$ espeak -f nazwa pliku.tekst
Aby zmienić styl języka i głosu, uruchom polecenie w następującym formacie:
$ espeak -v en -gb „tekst zostanie przekonwertowany na mowę."
Możesz zastąpić „EN-GB” swoim żądanym kodem głosowym. Lista wszystkich dostępnych głosów i ich kody można znaleźć, uruchamiając następujące polecenie:
$ espeak -voices
Aby zapisać zsyntetyzowaną mowę na pliku WAV, uruchom polecenie w następującym formacie:
$ espeak -f nazwa pliku.TXT -W wyjście.WAV
Możesz wymienić „wyjście.WAV ”z dowolną inną nazwą twojego wyboru.
Aby dowiedzieć się więcej o innych opcjach wiersza poleceń dostępnych dla ESPEAK, użyj dwóch następujących poleceń:
$ espeak - -help
$ man espeak
Festiwal
Festiwal to kolejny bezpłatny i open source do silnika mowy, który działa podobny do Espeak. Zapewnia narzędzie wiersza poleceń do konwersji tekstu na mowę, a także interfejs API, który można zintegrować we własnej aplikacji. Inne główne cechy festiwalu obejmują obsługę przekształcania tekstu na mowę w wielu językach, wbudowany interaktywny interpreter, interakcja z klientem-serwer w celu uzyskania dostępu do niego oraz własnego silnika skrypowego.
Możesz zainstalować festiwal w Ubuntu, używając wspomnianego poniżej polecenia:
$ sudo apt festival instalacji
Możesz pobrać festiwal w innych dystrybucjach Linux z menedżera pakietów. Więcej opcji pobierania jest dostępnych tutaj. Demo online pokazujące możliwości festiwalu jest dostępne tutaj.
Aby przekonwertować ciąg na mowę, użyj polecenia w następującym formacie:
$ echo „test” | Festiwal - -tts
Możesz wymienić „test” dowolnym innym wybranym przez siebie ciągiem. Aby przekonwertować zawartość pliku tekstowego na mowę za pomocą festiwalu, uruchom polecenie w następującym formacie:
$ Festival -TTS Filename.tekst
Możesz zmienić język głosowy, uruchamiając poniższe polecenie:
$ Festival -Language Americanenglish -Tts Filename.tekst
Możesz zastąpić „Americalenglish” innymi językami wspieranymi przez festiwal. Aby uzyskać listę wszystkich obsługiwanych języków, uruchom poniższe polecenie:
$ ls/usr/share/festival/języki/
Aby uruchomić festiwal w trybie interaktywnym, użyj następującego polecenia:
$ Festival
Możesz dowiedzieć się więcej o poleceń specyficznych dla trybu interaktywnego.
Aby dowiedzieć się więcej o innych opcjach wiersza poleceń dostępnych na festiwal, uruchom następujące dwa polecenia:
$ Festival -Help
$ Man Festival
Pico Tekst do mowy silnik
Pico to bezpłatny i open source tekst do mowy, który jest domyślnie zawarty w Android Open Source Project (AOSP). Style głosowe zawarte w pico tts brzmią mniej robotyczne niż espeak i festiwal. Obecnie PICO TTS obsługuje syntezę mowy w języku angielskim, włoskim, niemieckim, francuskim i hiszpańskim.
Możesz zainstalować PICO TTS w Ubuntu, używając poniższego polecenia:
$ sudo apt Zainstaluj libttspico-pitils
Możesz pobrać Pico TTS w innych dystrybucjach Linux z menedżera pakietów. Alternatywnie możesz skompilować go z kodu źródłowego dostępnego tutaj.
Pico TTS nie ma polecenia, aby bezpośrednio wypowiadać się zsyntetyzowaną mowę ze stdout. Może jednak odczytać zawartość pliku tekstowego lub ciągu i może zapisać zsyntetyzowaną mowę w pliku WAV, który można następnie odtwarzać w dowolnym odtwarzaczu audio.
Aby przekonwertować ciąg na mowę i zapisać wyjście na plik WAV, uruchom polecenie w następującym formacie:
$ pico2Wave -l en -en test.WAV „Test”
Możesz zastąpić „test” własnym pożądanym ciągiem. Aby zmienić język, zastąp „en-en” na kody dla innych obsługiwanych języków. PICO TTS obsługuje następujące kody językowe: EN-US, IT-IT, ES-ES, EN-GB, DE-DE i FR-FR.
Aby odczytać zawartość pliku i przekonwertować go na mowę, uruchom polecenie w następującym formacie:
$ pico2Wave -l en -us -w test.WAV "$ (test CAT.tekst)"
Możesz wymienić „test.txt ”z dowolną inną nazwą pliku.
Aby dowiedzieć się więcej o opcjach wiersza poleceń Pico TTS, uruchom następujące dwa polecenia:
$ pico2Wave -Help
$ Man Pico2Wave
GTTS
GTTS to aplikacja wiersza poleceń i biblioteka oparta na tekście Tłumacz Google na silnik mowy. Na podstawie Pythona można go używać do opracowywania innych aplikacji TTS lub możesz użyć go jako narzędzia wiersza poleceń do syntezy mowy z tekstu. Zawiera znacznie bardziej naturalne głosy dźwiękowe niż inne narzędzia wymienione w tym artykule, ponieważ tekst tłumaczenia Google na silnik mowy jest dość regularnie aktualizowany o nowe algorytmy, naturalne głosy i funkcje.
Możesz zainstalować GTTS w Ubuntu, używając poniższego polecenia:
$ sudo apt instal Python3-gtts
Możesz pobrać GTT w innych dystrybucjach Linux z menedżera pakietów. Alternatywnie możesz go zainstalować z menedżera pakietów PIP.
Aby przekonwertować ciąg na mowę, uruchom polecenie w następującym formacie:
$ gtts-cli „test” --utput test.MP3
Możesz wymienić „test” dowolnym ciągiem. Zsyntetyzowana mowa jest zapisywana w „Testie.plik mp3 ”. Możesz użyć dowolnej nazwy dla pliku wyjściowego.
Aby odczytać zawartość pliku i przekonwertować go na mowę, uruchom polecenie w następującym formacie:
test $ gtts -cli -f.TXT --utput Test.MP3
Możesz wymienić „test.txt ”z dowolną inną nazwą pliku.
Aby określić konkretny język dla syntezy mowy, użyj polecenia w następującym formacie:
$ gtts -cli „test” -l en --utput test.MP3
Możesz zastąpić „EN” kodem dla innych obsługiwanych języków. Aby uzyskać listę wszystkich obsługiwanych kodów językowych, uruchom następujące polecenie:
$ gtts-cli-All
Aby dowiedzieć się więcej o innych opcjach wiersza poleceń dostępnych dla GTT, użyj dwóch następujących poleceń:
$ MAN GTTS-CLI
$ gtts-cli-help
Wniosek
Są to jedne z najlepszych aplikacji tekstowych do mowy dla Linux, które są obsługiwane dla syntezy mowy w wielu językach. Te aplikacje TTS mogą być używane na różne sposoby, ale są one szczególnie przydatne do poprawy dostępności dla osób cierpiących na problemy z zaburzeniami wizualnymi.