Zamierzamy wdrożyć mowę do tekstu w Python. I w tym celu musimy zainstalować następujące pakiety:
Tak więc importujemy rozpoznawanie mowy i inicjowanie rozpoznawania mowy, ponieważ bez inicjowania rozpoznawania nie możemy użyć dźwięku jako wejścia i nie rozpozna dźwięku.
Istnieją dwa sposoby przekazywania audio wejściowego do rozpoznawania:
Tym razem wdrażamy opcję domyślną (mikrofon). Dlatego przynosimy mikrofon modułu, jak pokazano poniżej:
Z Linuxhint.Mikrofon () jako mikrofon
Ale jeśli chcemy użyć wcześniej nagranego dźwięku jako wejścia źródłowego, wówczas składnia będzie taka:
Z Linuxhint.Audiofile (nazwa pliku) jako źródło
Teraz używamy metody rekordu. Składnia metody rekordu to:
Record (źródło, czas trwania)Tutaj źródłem jest nasz mikrofon, a zmienna czasu trwania akceptuje liczby całkowite, czyli sekundy. Mamy czas trwania = 10, który informuje system, ile czasu mikrofon zaakceptuje głos od użytkownika, a następnie zamyka go automatycznie.
Następnie używamy rozpoznaje_google () Metoda, która akceptuje dźwięk i ukrywa dźwięk do formularza tekstowego.
Powyższy kod akceptuje dane wejściowe z mikrofonu. Ale czasami chcemy przedstawić wkład z wcześniej nagranego dźwięku. W tym celu kod jest podany poniżej. Składnia tego została już wyjaśniona powyżej.
Możemy również zmienić opcję języka w metodzie rozpoznawania_google. Gdy zmieniamy język z angielskiego na hindi, jak pokazano poniżej: