Jak uruchomić Tesseract na pliku GIF w Linux

Jak uruchomić Tesseract na pliku GIF w Linux
Tesseract to system OCR (optyczne rozpoznawanie znaków), wśród najlepszych. Oprogramowanie OCR jest w stanie zrozumieć tekst z obrazów i zeskanowanych dokumentów (w tym pismo odręczne, jeśli go przeszkolesz). System OCR może być przydatny do wielu zadań, takich jak zliczanie słów zeskanowane dokumenty, automatyczna transkrypcja, konwersja znaków z obrazu na tekst i więcej.

Linuxhint opublikował już samouczek wyjaśniający, jak zainstalować i rozumieć szkolenie Tesseract.

Ten samouczek pokazuje proces instalacji Tesseract w systemach Debian/Ubuntu, ale nie zostanie rozszerzony w zakresie funkcji szkoleniowych, jeśli nie zapoznasz się z tym oprogramowaniem, czytając wspomniany artykuł, może być dobrym wprowadzeniem. Następnie pokażemy, jak przetworzyć obraz GIF z Tesseract, aby wyciągnąć z niego tekst.

Instalacja Tesseract:

Uruchomić:

Apt Instal Tesseract-COCR

Teraz musisz zainstalować ImageMagick, który jest konwerterem obrazu.

Po zainstalowaniu możemy już przetestować Tesseract, aby go przetestować, znalazłem GIF licencjonowany do ponownego użycia.

Teraz zobaczmy, co się stanie, kiedy uruchomimy Tesseract na obrazie GIF:

Tesseract 2002NY40.GIF 1RESULT

Teraz zrób „mniej” na 1result.tekst

mniej 1result.tekst

Oto obraz z tekstem:

W niniejszym tesseract ́S ustawienia domyślne są dość dokładne, zwykle w celu uzyskania takiej dokładności wymaga szkolenia. Wypróbujmy kolejny darmowy obraz, który znalazłem na Wiki Commons, po pobraniu go:

Tesseract ActiveIzar_Gnulinux_Minal_APT-Get.GIF 2Result

Teraz sprawdź treść pliku.

Mniej 2result.tekst


To był wynik, podczas gdy treść oryginalnego obrazu brzmiała:

Aby poprawić rozpoznawanie znaków, mamy wiele opcji i kroków, które zostały szczegółowo opisane w naszym poprzednim samouczku: usuwanie granicy, usuwanie szumów, optymalizacja rozmiaru i rotacja strony wśród innych funkcji, takich jak uprawa.

W tym samouczku użyjemy TextCleaner, scenariusz opracowany przez Skrypty ImageMagick Freda.

Pobierz skrypt i uruchom:

./TextCleaner -G -e rozciąganie -f 25 -o 10 -s 1
Feelizar_gnulinux_terminal_apt-get.Test GIF.Gif

Notatka: Przed uruchomieniem skryptu daj mu uprawnienia do wykonania, uruchamiając „CHMOD +x TextCleaner”Jako root lub z sudo prefiks.

Gdzie:

TextCleaner: wywołuje program

-G: Konwertuj obraz na skalę szarościową

-mi: Ena się

-F: FilterSize

-S: Sharpamt, ilość wyostrzenia pikseli, które należy zastosować do wyniku.

Informacje i przykłady użycia z TextCleaner Odwiedź http: // www.FMWConcepts.com/ImageMagick/TextCleaner/index.php

Jak widzisz TextCleaner zmienił kolor tła, zwiększając kontrast między czcionką a tłem.

Jeśli uruchomimy Tesseract, prawdopodobnie wynik będzie inny:

Test Tesseract.GIF Testoutput
Mniej testu

Jak widzisz, wynik jest naprawdę poprawiony, nawet jeśli nie jest w pełni dokładny.

Komenda konwertować Dostarczone przez ImageMagick pozwala nam wyodrębniać ramki z obrazów GIF, które zostaną później przetworzone przez Tesseract, jest to przydatne, jeśli istnieje wyjątkowa zawartość w różnych ramach obrazu GIF.

Składnia jest prosta:

konwertować

Wynik zostanie wygenerowany jako liczba plików jako ramek w GIF, w dostarczonym przykładzie wyniki będą: wyjście-0.jpg, wyjście-1.jpg, wyjście-2.jpg, itp.

Następnie możesz je przetworzyć za pomocą Tesseract, instruując go do przetwarzania wszystkich plików za pomocą karty wieloznacznej, zapisując wynik w jednym pliku, uruchamiając:

Dla i w wyjściu-*; do Tesseract $ I OutputResult; zrobione;

ImageMagick ma ogromną różnorodność opcji optymalizacji obrazów i nie ma trybu ogólnego, dla każdego rodzaju scenariusza należy odczytać stronę Convert's Command Man.

Mam nadzieję, że ten samouczek na temat Tesseract przydał się.