Główne cechy EasyChor
EasyCr może wykryć tekst w ponad 80 językach i skryptach. Zawiera wstępnie wyszkolone modele dla tych języków, ale możesz użyć EasyCr do szkolenia własnych modeli od zera. Oprócz cyfrowej i drukowanej treści na podstawie tekstów znalezionych na zdjęciach, EasyCr może również wykrywać i wyodrębnić odręczny tekst. Inne główne cechy EasyCr obejmują możliwość przetwarzania wielu obrazów jednocześnie, możliwość ograniczenia i blokowania niektórych znaków z języka, opcja konwersji wyodrębnionych linii na akapity, możliwość rozmiaru i powiększania obrazów w celu poprawy dokładności wykrywania, i tak dalej.
Instalowanie Easyocr in Linux
Możesz zainstalować EasyCr w Linux za pomocą menedżera pakietów PIP. Aby zainstalować menedżer pakietów PIP w Ubuntu, użyj następującego polecenia:
$ sudo apt instal Python3-Pip
Menedżer pakietów PIP jest dostępny w oficjalnych repozytoriach wielu dystrybucji Linux, dzięki czemu można go zainstalować z menedżera pakietów. Możesz także śledzić oficjalne instrukcje instalacji dostępne tutaj, aby zainstalować menedżer pakietów PIP w systemie Linux.
Po pomyślnym zainstalowaniu Menedżera pakietów PIP, uruchom następujące polecenie, aby zainstalować EasyCr w Linux:
$ PIP3 Zainstaluj EasyCr
Korzystanie z Easyocr in Linux
Poniższy obraz zostanie użyty do wyodrębnienia tekstu za pomocą różnych poleceń EasyCr wyjaśnionych poniżej:
Aby wyodrębnić tekst z powyższego obrazu, musisz uruchomić polecenie w następującym formacie:
$ easyocr -l en -f obraz.png
Pierwszą opcję „-L” można użyć do określenia języka treści tekstu, który chcesz zostać uchwycony przez EasyCr. Możesz określić wiele języków za pomocą kodów językowych oddzielonych poleceń. Przełącznik „-F” służy do określenia pliku obrazu wejściowego. Lista wszystkich języków obsługiwanych przez EasyCr i ich kody można znaleźć tutaj (przewiń w dół, aby je zobaczyć).
Po uruchomieniu powyższego polecenia należy zobaczyć następujące dane wyjściowe w terminalu:
Wyjście pokazuje określone liczby i tekst wyodrębniony z obrazu. To wyjście można odczytać w następującym formacie: Współrzędne poszczególnych elementów tekstu> Wykryty tekst> Poziom ufności. Tak więc liczby po lewej stronie reprezentują współrzędne zidentyfikowanych pól tekstowych, podczas gdy liczba po prawej stronie najwięcej wskazuje, jak dokładny jest wyodrębniony tekst.
Jeśli chcesz uzyskać wykryty tekst w ludzkiej czytelnej formie, dodaj „-Detail 0” przełącz do powyższego polecenia:
$ easyCr -l en - -detail 0 -f obraz.png
Po uruchomieniu powyższego polecenia powinieneś uzyskać pewne dane wyjściowe do tego:
Jak widać na wyjściu, wyodrębniony tekst nie jest w odpowiedniej kolejności. Możesz wypróbować opcję wiersza polecenia „-paragrafa”, aby dołączyć do poszczególnych elementów i zdań w odpowiednich kolejności.
$ easyCr -l en - -DETAIL 0 -SPARAGRAGH True -f obraz.png
Po uruchomieniu powyższego polecenia powinieneś uzyskać pewne dane wyjściowe do tego:
Zauważ, że w zależności od jakości i przejrzystości obrazu oraz treści tekstu obrazu, pewne niedokładności mogą być zawsze obecne w wyodrębnionym tekście i być może będziesz musiał dokonać ręcznych poprawek, aby je naprawić.
Aby zapisać zidentyfikowany tekst w pliku zewnętrznym, użyj symbolu „>” i podaj nazwę pliku wyjściowego. Oto przykładowe polecenie:
$ easyCr -l en - -DETAIL 0 -SPARAGRAGH True -f obraz.PNG> Wyjście.tekst
Aby dowiedzieć się więcej o wszystkich opcjach wiersza poleceń obsługiwanych przez EasyCr, użyj następującego polecenia:
$ easyocr - -Help
Korzystanie z EasyCr w programach Python
EasyCr jest również dostępny jako biblioteka Python, dzięki czemu możesz zaimportować jej główny moduł w programach Python. Poniżej znajduje się próbka kodu ilustrująca jego użycie w programie Python:
importować EasyCr
czytnik = easyCr.Czytelnik ([„en”])
wynik = czytelnik.readText („obraz.png ', detal = 0, akapit = true)
z otwartym („wyjście.txt "," w ") jako f:
dla linii w wyniku:
druk (linia, file = f)
Pierwsze oświadczenie służy do importowania modułu „EasyCh” w programie Python. Następnie powstaje nowa instancja klasy „Reader” (klasa podstawowa), dostarczając listę języków obsługiwanych przez EasyCr jako główny argument. Jeśli obraz zawiera tekst w wielu językach, możesz dodać więcej kodów językowych do listy. Następnie metoda „Readtext” jest wywoływana w instancji „czytnik”, a ścieżka pliku obrazu jest dostarczana jako pierwszy parametr. Ta metoda zidentyfikuje i wyodrębni tekst z dostarczonego obrazu. Dwa opcjonalne argumenty, „szczegóły” i „akapit” są takie same jak opcje wiersza poleceń wyjaśnione powyżej. Upraszczają tekst, usuwając niepotrzebne elementy.
Po uruchomieniu powyższego polecenia powinieneś mieć następujący wiersz w „Wyjście.plik txt ”:
Możesz przeczytać więcej o API Python Easyoct Stąd. Do przetestowania dostępnej jest online wersja EasyCr.
Wniosek
EasyCr to narzędzie do ekstrakcji tekstu wiersza poleceń, które jest wyposażone w wstępnie wyszkolone modele dla wielu języków. Ułatwia to użytkownikom końcowym szybkie identyfikację i wyodrębnienie tekstu z obrazów bez posiadania własnych modeli językowych. Zapewnia również szczegółowe współrzędne dla ograniczających pudełek wokół zidentyfikowanych i tokenizowanych słów, co ułatwia analizę poszczególnych tekstów.