Ten samouczek pokazuje, jak konwersja JPG i inne typy obrazów na PDF, w tym funkcję OCR w rozkładach Linux opartych na debian, takich jak Ubuntu.
Po przeczytaniu tego samouczka wiedzisz, jak konwertować obrazy na PDF za pomocą GUI i interfejsu wiersza poleceń. Graficzny sposób pozwala wdrożyć funkcję OCR, wyodrębniając obrazy z obrazów w celu wygenerowania edytowalnych plików PDF.
Przekształcanie obrazów JPG w PDF wyodrębniają znaki za pomocą PDF2GO:
Pierwsza metoda wyjaśniona w tym samouczku obejmuje PDF2GO, oprogramowanie, które pozwala nam konwersja obrazów na pliki PDF i wyodrębniać znaki podawane jako wyjście edytowalny plik PDF; W tym celu ten program używa Tesseract.
Aby zainstalować PDF2GO, najpierw musisz zainstalować Elder; W dystrybucjach Linux opartych na Debian możesz uzyskać Snapd, uruchamiając poniższe polecenie.
sudo apt instinst instaluj snapd
Utwórz symboliczny link do SNAP i zainstaluj PDF2GO, uruchamiając następujące polecenia.
sudo ln -s/var/lib/snapd/snap/snap
sudo snap instalacja pdf2go
Notatka: W moim przypadku nie znalazłem skrótu PDF2GO; Musiałem zalogować się i zalogować się z powrotem, aby znaleźć ikonę.
Użyj pola wyszukiwania aplikacji, aby znaleźć i wykonać PDF2GO, jak pokazano poniżej.
Po otwarciu pdf2go, jak pokazano na poniższym obrazku. Zobaczysz pasek do wpisania adresu URL obrazu, który chcesz przekonwertować. Opcjonalnie możesz kliknąć ikonę folderu, aby przesłać plik.
Po przesłaniu pliku lub skopiowaniu jego adresu URL kliknij ikonę rakiety obok ikony folderu.
Pojawi się pasek ładowania, a po zakończeniu zobaczysz ekran podzielony obrazem po lewej stronie i wyodrębniony tekst po prawej stronie.
Obok ikony folderu zobaczysz tę ikonę; Kliknij go, aby wybrać język tekstowy.
Proces wyjaśniony w tym samouczku można zastosować do innych typów obrazów.
NOTATKA: Chcę podziękować deweloperowi PDF2GO Rishabh Bhardwaj, który w przypadku problemu z instalacją zapewnił natychmiastowe wsparcie. Jego wsparcie nie zostało uwzględnione w tym samouczku, ponieważ zdałem sobie sprawę z błędu z mojej strony. Dla nas w Linux wskazówka była bardzo ważna, aby zawierać opcję zdolną do wydobywania tekstu z obrazów, ponieważ nie ma zbyt wielu samouczków na ten temat.
Przekształcanie obrazów JPG w PDF z CLI za pomocą ImageMagick (bez OCR):
W tej sekcji wyjaśniono, jak używać ImageMagick z wiersza poleceń do konwersji JPG lub innych typów obrazów na PDF. W takim przypadku dane wyjściowe nie będzie edytowalne, a w tym procesie nie jest uwzględnione OCR.
Aby zainstalować ImageMagick w dystrybucjach Linux opartych na Debian, takich jak Ubuntu, uruchom poniższe polecenie.
sudo apt instaluj ImageMagick
Po zainstalowaniu ImageMagick użyj polecenia konwertowania, a następnie obraz, który chcesz przekonwertować, oraz wyjściowy plik pdf, jak pokazano na poniższym obrazku.
Notatka: Jeśli miałem problem zasadowy podczas próby wykonania poniższego polecenia, jeśli podzielisz ten sam problem, przejdź do końca tej sekcji, aby zobaczyć rozdzielczość.
Sudo Convert ZaratustraJpg.JPG ZARATUSTRA.PDF
Jak widać, obraz został poprawnie przekonwertowany.
Możesz użyć ImageMagick do konwersji wielu plików na PDF; Składnia jest taka sama; Po prostu zdefiniuj wszystkie obrazy, które chcesz przekonwertować, jak pokazano poniżej.
Konwertuj ZaratustraJpg.JPG ZARATUSTRAJPG2.Wyjście JPG.PDF
Naprawienie błędu zasad ImageMagick:
Jak wspomniano wcześniej, napotkałem błąd, próbując wykonać ImageMagick; Błąd brzmi: „Konwertuj: Próba wykonywania operacji niedozwolonej przez zasady bezpieczeństwa„ PDF ” @ Error/Constite.c/iscoderauthorized/408 ”.
Aby go rozwiązać, edytuj plik/etc/imagemagick-6/politykę.xml; Możesz użyć następującego polecenia, aby edytować plik za pomocą edytora tekstu nano.
sudo nano/etc/imagemagick-6/polityka.XML
Po wejściu do pliku dodaj wiersz przed końcem pliku, jak pokazano na poniższym obrazku.
Teraz ImageMagick musi działać.
Przekształcanie obrazów JPG w PDF z CLI za pomocą IMG2PDF (bez OCR):
Ta metoda obejmuje oprogramowanie IMG2PDF. Aby zainstalować go w dystrybucjach Linux opartych na Debian, w tym Ubuntu, uruchom następujące polecenie.
sudo apt instal IMG2PDF -y
Aby przekonwertować obrazy na PDF za pomocą IMG2PDF, składnia jest bardzo podobna do ImageMagick; Po prostu dodaj opcję -O, aby zdefiniować nazwę pliku wyjściowego, jak pokazano w poniższym przykładzie.
IMG2PDF ZARATUSTRAJPG.Jpg -o Zaratustra3.PDF
Podobnie jak w przypadku ImageMagick, możesz użyć IMG2PDF do konwersji kilku obrazów; Składnia jest podobna, jak pokazano w poniższym przykładzie.
IMG2PDF ZARATUSTRAJPG.JPG ZARATUSTRAJPG2.JPG -O Wyjście.PDF
Konwersja obrazów na PDF za pomocą JPG2PDF (GUI):
Ostatnie narzędzie wyjaśnione w tym samouczku jest JPG2PDF
Sudo Snap Instaluj JPG2PDF
Podobnie jak w przypadku PDF2GO, użyj pola wyszukiwania aplikacji, aby znaleźć JPG2PDF, jak pokazano na poniższym obrazku.
Po uruchomieniu programu kliknij ikonę Dodaj obrazy pokazane na poniższym obrazku i wybierz obrazy do konwersji.
Plik lub pliki, które chcesz przekonwertować, zostaną dodane do listy. Najlepiej byłoby, gdybyś oznaczył mały kwadrat kolumny ST, jak pokazano poniżej.
Po wybraniu obrazów do konwersji, po prostu naciśnij przycisk Uruchom konwert. Po zakończeniu procesu konwersji pudełko zaoferuje otwarcie pliku PDF lub katalogu zawierającego go.
Jak widać, proces zakończył się powodzeniem.
Wniosek:
Jak widać, użytkownicy Linux mają wiele opcji konwersji obrazów na PDF. Wszystkie wyjaśnione powyżej techniki obsługują dodatkowe rozszerzenia obrazu, takie jak .png. Każdy poziom użytkownika Linux może łatwo użyć wyjaśnionych metod. Pierwsza opcja, umożliwiająca konwersja obrazów tekstowych na edytowalne pliki PDF, jest bardzo przydatna do wyodrębnienia tekstu.
Mam nadzieję, że ten samouczek wyjaśniający, jak konwertować obrazy na PDF w Linux, był przydatny. Kontynuuj podążanie za Linux, aby uzyskać dodatkowe porady i samouczki Linux.