Najlepszy tekst poleceń do aplikacji mowy dla Linux

Najlepszy tekst poleceń do aplikacji mowy dla Linux
W tym artykule obejmie listę przydatnych aplikacji tekstowych do mowy (TTS) dostępnych dla Linux. Te aplikacje mogą zidentyfikować kawałek tekstu, konwertować go na mowę, a następnie wypowiadać słowa i zdania za pośrednictwem głośników systemu Linux. Konwertują tekst na mowę za pomocą algorytmów sztucznej inteligencji i preferowanych modeli uczenia maszynowego. Te aplikacje zwykle zapewniają szereg różnych głosów o predefiniowanych tonach, akcentie i sposobu mówienia. Niektóre z tych aplikacji umożliwiają skonfigurowanie parametrów głosowych, takich jak tempo i ton. Tekstowe aplikacje do mowy mają roboty, które nie brzmią jak prawdziwe głosy. Jednak technologia poprawia się, a więcej głosów brzmiących z tych tekstów do aplikacji mowy.

Espeak

Espeak to bezpłatny i open source narzędzie do mowy, którego można użyć do konwersji tekstu na mowę w wielu różnych językach. Jest wyposażony w narzędzie wiersza poleceń, a także bibliotekę, której można użyć we własnej aplikacji. Większość głosów dostępnych w espeak dźwięku roboty. Obsługuje przekształcenie tekstu na mowę w ponad 40 różnych językach, a także możesz zapisać mowę na pliki audio w formacie plików WAV. Jest również wyposażony w wbudowaną obsługę przekształcania tekstu na fonemy, abyś mógł używać ich w innych aplikacjach, w tym innych silnikach tekstowych do mowy.

Możesz zainstalować EpSeak w Ubuntu, używając poniższego polecenia:

$ sudo apt instal espeak

Możesz pobrać espeak w innych dystrybucjach Linux z menedżera pakietów. Więcej opcji pobierania jest dostępnych tutaj.

Aby przekonwertować kawałek tekstu na mowę za pomocą espeak, użyj polecenia w następującym formacie:

$ espeak „tekst zostanie przekonwertowany na mowę."

Możesz zastąpić treść w cytatach własnym pożądanym ciągiem. Aby zsyntetyzować całą zawartość pliku do mowy, uruchom polecenie w następującym formacie:

$ espeak -f nazwa pliku.tekst

Aby zmienić styl języka i głosu, uruchom polecenie w następującym formacie:

$ espeak -v en -gb „tekst zostanie przekonwertowany na mowę."

Możesz zastąpić „EN-GB” swoim żądanym kodem głosowym. Lista wszystkich dostępnych głosów i ich kody można znaleźć, uruchamiając następujące polecenie:

$ espeak -voices

Aby zapisać zsyntetyzowaną mowę na pliku WAV, uruchom polecenie w następującym formacie:

$ espeak -f nazwa pliku.TXT -W wyjście.WAV

Możesz wymienić „wyjście.WAV ”z dowolną inną nazwą twojego wyboru.

Aby dowiedzieć się więcej o innych opcjach wiersza poleceń dostępnych dla ESPEAK, użyj dwóch następujących poleceń:

$ espeak - -help
$ man espeak

Festiwal

Festiwal to kolejny bezpłatny i open source do silnika mowy, który działa podobny do Espeak. Zapewnia narzędzie wiersza poleceń do konwersji tekstu na mowę, a także interfejs API, który można zintegrować we własnej aplikacji. Inne główne cechy festiwalu obejmują obsługę przekształcania tekstu na mowę w wielu językach, wbudowany interaktywny interpreter, interakcja z klientem-serwer w celu uzyskania dostępu do niego oraz własnego silnika skrypowego.

Możesz zainstalować festiwal w Ubuntu, używając wspomnianego poniżej polecenia:

$ sudo apt festival instalacji

Możesz pobrać festiwal w innych dystrybucjach Linux z menedżera pakietów. Więcej opcji pobierania jest dostępnych tutaj. Demo online pokazujące możliwości festiwalu jest dostępne tutaj.

Aby przekonwertować ciąg na mowę, użyj polecenia w następującym formacie:

$ echo „test” | Festiwal - -tts

Możesz wymienić „test” dowolnym innym wybranym przez siebie ciągiem. Aby przekonwertować zawartość pliku tekstowego na mowę za pomocą festiwalu, uruchom polecenie w następującym formacie:

$ Festival -TTS Filename.tekst

Możesz zmienić język głosowy, uruchamiając poniższe polecenie:

$ Festival -Language Americanenglish -Tts Filename.tekst

Możesz zastąpić „Americalenglish” innymi językami wspieranymi przez festiwal. Aby uzyskać listę wszystkich obsługiwanych języków, uruchom poniższe polecenie:

$ ls/usr/share/festival/języki/

Aby uruchomić festiwal w trybie interaktywnym, użyj następującego polecenia:

$ Festival

Możesz dowiedzieć się więcej o poleceń specyficznych dla trybu interaktywnego.

Aby dowiedzieć się więcej o innych opcjach wiersza poleceń dostępnych na festiwal, uruchom następujące dwa polecenia:

$ Festival -Help
$ Man Festival

Pico Tekst do mowy silnik

Pico to bezpłatny i open source tekst do mowy, który jest domyślnie zawarty w Android Open Source Project (AOSP). Style głosowe zawarte w pico tts brzmią mniej robotyczne niż espeak i festiwal. Obecnie PICO TTS obsługuje syntezę mowy w języku angielskim, włoskim, niemieckim, francuskim i hiszpańskim.

Możesz zainstalować PICO TTS w Ubuntu, używając poniższego polecenia:

$ sudo apt Zainstaluj libttspico-pitils

Możesz pobrać Pico TTS w innych dystrybucjach Linux z menedżera pakietów. Alternatywnie możesz skompilować go z kodu źródłowego dostępnego tutaj.

Pico TTS nie ma polecenia, aby bezpośrednio wypowiadać się zsyntetyzowaną mowę ze stdout. Może jednak odczytać zawartość pliku tekstowego lub ciągu i może zapisać zsyntetyzowaną mowę w pliku WAV, który można następnie odtwarzać w dowolnym odtwarzaczu audio.

Aby przekonwertować ciąg na mowę i zapisać wyjście na plik WAV, uruchom polecenie w następującym formacie:

$ pico2Wave -l en -en test.WAV „Test”

Możesz zastąpić „test” własnym pożądanym ciągiem. Aby zmienić język, zastąp „en-en” na kody dla innych obsługiwanych języków. PICO TTS obsługuje następujące kody językowe: EN-US, IT-IT, ES-ES, EN-GB, DE-DE i FR-FR.

Aby odczytać zawartość pliku i przekonwertować go na mowę, uruchom polecenie w następującym formacie:

$ pico2Wave -l en -us -w test.WAV "$ (test CAT.tekst)"

Możesz wymienić „test.txt ”z dowolną inną nazwą pliku.

Aby dowiedzieć się więcej o opcjach wiersza poleceń Pico TTS, uruchom następujące dwa polecenia:

$ pico2Wave -Help
$ Man Pico2Wave

GTTS

GTTS to aplikacja wiersza poleceń i biblioteka oparta na tekście Tłumacz Google na silnik mowy. Na podstawie Pythona można go używać do opracowywania innych aplikacji TTS lub możesz użyć go jako narzędzia wiersza poleceń do syntezy mowy z tekstu. Zawiera znacznie bardziej naturalne głosy dźwiękowe niż inne narzędzia wymienione w tym artykule, ponieważ tekst tłumaczenia Google na silnik mowy jest dość regularnie aktualizowany o nowe algorytmy, naturalne głosy i funkcje.

Możesz zainstalować GTTS w Ubuntu, używając poniższego polecenia:

$ sudo apt instal Python3-gtts

Możesz pobrać GTT w innych dystrybucjach Linux z menedżera pakietów. Alternatywnie możesz go zainstalować z menedżera pakietów PIP.

Aby przekonwertować ciąg na mowę, uruchom polecenie w następującym formacie:

$ gtts-cli „test” --utput test.MP3

Możesz wymienić „test” dowolnym ciągiem. Zsyntetyzowana mowa jest zapisywana w „Testie.plik mp3 ”. Możesz użyć dowolnej nazwy dla pliku wyjściowego.

Aby odczytać zawartość pliku i przekonwertować go na mowę, uruchom polecenie w następującym formacie:

test $ gtts -cli -f.TXT --utput Test.MP3

Możesz wymienić „test.txt ”z dowolną inną nazwą pliku.

Aby określić konkretny język dla syntezy mowy, użyj polecenia w następującym formacie:

$ gtts -cli „test” -l en --utput test.MP3

Możesz zastąpić „EN” kodem dla innych obsługiwanych języków. Aby uzyskać listę wszystkich obsługiwanych kodów językowych, uruchom następujące polecenie:

$ gtts-cli-All

Aby dowiedzieć się więcej o innych opcjach wiersza poleceń dostępnych dla GTT, użyj dwóch następujących poleceń:

$ MAN GTTS-CLI
$ gtts-cli-help

Wniosek

Są to jedne z najlepszych aplikacji tekstowych do mowy dla Linux, które są obsługiwane dla syntezy mowy w wielu językach. Te aplikacje TTS mogą być używane na różne sposoby, ale są one szczególnie przydatne do poprawy dostępności dla osób cierpiących na problemy z zaburzeniami wizualnymi.