Polecenie iconv w Linux

Polecenie iconv w Linux
Upewnij się, że zaktualizuj maszynę Linux przed wdrożeniem tego artykułu. Do aktualizacji użyj narzędzia „Apt” Linux z słowem kluczowym „Aktualizacja” i uruchom tę instrukcję za pomocą uprawnień „sudo”. Chociaż możemy teraz przejść do implementacji, wolimy również ulepszyć ten system, ja.mi., Ulepszenie zmniejszy szansę na wystąpienie błędów, a system byłby w stanie dokładniej rozwiązać problemy. Dlatego użyj narzędzia „apt” w instrukcji „aktualizacji”.

Spójrzmy teraz na narzędzie ICONV Linux w jego konsoli terminalowej. Tak więc wykonaliśmy instrukcję „iconv” z flagą „-L”, aby wyświetlić wszystkie znane i najczęściej używane zestawu znaków na naszym ekranie terminalu. Wyświetli zakodowane zestawy znaków wraz z ich aliasami. Możesz zobaczyć długą listę zakodowanych zestawów znaków po nieco przewijaniu.

Teraz nadszedł czas, aby rozpocząć wdrożenie polecenia ICONV w Linux. Po pierwsze, potrzebujemy różnych rodzajów plików w naszym systemie, aby przekonwertować jeden typ pliku na inny typ. W ten sposób używamy zapytania „dotyk” na terminalu konsoli, aby utworzyć trzy różne pliki, i.mi., Typ Java, typ C i typ tekstu. Wymieniając aktualną zawartość katalogu, znajdziesz w niej nowo wygenerowane pliki.

Następnie przyjrzymy się typowi każdego pliku osobno za pomocą zapytania „Plik” wraz z nazwą każdego pliku. To zapytanie wymaga opcji „-i” do wyświetlenia typu kodowania zestawu znaków dla każdego pliku osobno. Jeśli zapomniałeś użyć opcji „-i”, zamiast tego użyj flagi „-Mime”. Zarówno flagi „-i”, jak i „-mime” działają tak samo.

Teraz, po wykonaniu instrukcji „Plik” dla pliku typu „TXT”, otrzymaliśmy kodowanie typu znaków „US-ASCII”. Podczas korzystania z tej samej instrukcji dla plików Java i C, pokazuje, że oba pliki zawierają kodowanie typu postaci „binarnego”. Oprócz tego ta instrukcja pokazuje, że wszystkie te trzy pliki są puste.

Teraz zilustrujemy użycie instrukcji ICONV w konsoli do konwersji określonego zestawu zestawu znaków kodowania na inny zestaw znaków znaków. Wcześniej musimy dodać do naszych plików trochę kodu lub danych. Dlatego dodaliśmy kod Java w „tekście.plik Java ”, kod C w„ Tekstie.plik C ”i dodał dane tekstowe w„ Test.plik txt ”. Zapytanie CAT zostało tutaj użyte do wyświetlania zawartości wszystkich trzech plików, jak przedstawiono poniżej:

Teraz, gdy pomyślnie dodaliśmy dane, ponownie zobaczymy kodowanie zestawu znaków tych plików. Wypróbowaliśmy więc tę samą instrukcję pliku w powładzie z flagą „-i” i nazwami plików, i.mi., test.TXT, test.Java i testuj.C. Uruchamianie tych trzech instrukcji osobno dla wszystkich trzech plików pokazuje, że kodowanie zestawu znaków zostało zaktualizowane dla plików Java i C, pozostając to samo dla pliku tekstowego, i.mi., US-ASCII. Kodowanie plików Java i C było wcześniej „binarne”; Teraz jest to „US-ASCII”. Pokazuje również, że plik tekstowy zawiera proste dane tekstowe, podczas gdy pozostałe dwa pliki kodu zawierają skrypty jako treść.

Czas wykonać rzeczywiste zadanie potrzebne do tego artykułu, ja.mi., Konwertuj jeden kodowanie na drugi za pomocą polecenia iconv w skorupce. W ten sposób używamy instrukcji „iconv” w terminalu Shell z uprawnieniami „sudo”. To polecenie przyjmuje opcję „-f” oznacza „z”, a opcja „-t” oznacza „to”, i.mi., od jednego kodowania do drugiego.

Po opcji „-f” musisz określić kodowanie pliku już ma, ja.mi., US-ASCII. Podczas gdy po opcji „-T” musisz określić kodowanie, które chcesz zastąpić starym kodowaniem, i.mi., Unicode. Musisz określić nazwę pliku używanego jako źródło z opcją -o do utworzenia obrazu obiektu. Obraz obiektu byłby kolejnym plik, i.mi., "nowy.c ”, tego samego typu, ale z nowym kodowaniem i tymi samymi danymi.

Po wykonaniu poniższej instrukcji otrzymasz nowy plik w tym samym katalogu, ja.mi., Zgodnie z zapytaniem „LS”. Teraz sprawdzimy kodowanie zestawu znaków nowego pliku generowanego za pomocą instrukcji iconv. Ponownie użyjemy instrukcji „Plik” z opcją „-i” i nową nazwą pliku, i.mi., nowy.C.

Zobaczysz, że zestaw znaków dla tego nowego pliku różni się od zestawu znaków starego pliku, i.mi., Zestaw znaków UTF-16LE. Dzieje się tak, ponieważ przetłumaczyliśmy kodowanie US-ASCII na kodowanie Unicode za pomocą instrukcji iconv dla naszego nowego.plik C. Zapytanie „CAT” wyświetliło ten sam kod C w pliku, ale zaczęło się od niektórych znaków Unicode, jak już przedstawiono.

W bardzo podobny sposób zmienimy kodowanie testu.plik tekstowy TXT. Instrukcja pliku pokazuje, że ma kodowanie zestawu znaków US-ASCII. Polecenie iconv zostało użyte z tym samym formatem do konwersji kodowania testu.plik txt z US-ASCII do Turkish8. Zobaczysz, że nie zmienia to amerykańs-ascii na turecki.

Następnie użyliśmy tego samego polecenia do pokrycia kodowania zestawu znaków US-ASCII do UTF-32. Tym razem działa. Dzieje się tak, ponieważ czasami może wystąpić problem przekształcający jeden zestaw kodowania na inny, lub drugi kodowanie może go nie obsługiwać.

Wniosek

W tym artykule omówiono, jak korzystać z instrukcji ICONV Linux, aby przekonwertować jeden zestaw znaków kodujących na inny za pomocą ich aliasów. W ten sposób musieliśmy utworzyć niektóre pliki różnych typów.