Jak używać modułu tekstu w Python

Jak używać modułu tekstu w Python
W tym artykule obejmie przewodnik po użyciu modułu „TextWrap” w Python. Jak sama nazwa wskazuje, ten moduł można użyć do „owinięcia” tekstu, aby linie lub zdania mogły być dopasowane w predefiniowanych ograniczeniach długości. Zwykle odbywa się to poprzez skrócenie kawałka tekstu i przenoszenie dłuższych części do następnego wiersza, aby wszystkie linie przylegały do ​​granic znaków. Wykorzystanie modułu TextWrap można najlepiej zrozumieć za pomocą przykładów. Poniżej znajdują się próbki kodu, które ilustrują użycie modułu tekstu i jego metod. Te próbki kodu są testowane z Python 3.9.5 na Ubuntu 21.04.

Owijanie tekstu za pomocą progu limitu znaków

Spójrz na poniższą próbkę kodu:

importować TextWrap
Para =."
wredny_para = TextWrap.Wrap (para)
Drukuj (owinięty_para)
dla linii w owiniętej_para:
druk (linia, len (linia))

Pierwsza instrukcja importuje moduł „TextWrap”. Zmienna „para” zawiera kawałek tekstu, który zostanie owinięty w wiele linii. Następnie wywoływana jest metoda „Wrap” z modułu TextWrap, dostarczając zmienną para jako argument. Ta metoda służy do owinięcia i dzielenia tekstu na wiele wierszy. Dwa instrukcje „wydruku” pokazują wyjście owiniętego tekstu.

Po uruchomieniu powyższej próbki kodu należy uzyskać następujące dane wyjściowe:

[„Lore ipsum dolor sit amet, konsektowo -adipiscing elit, sed do”, „Eiusmod Tempor incididunt Ubre et Dolore Magna Aliqua.']
LoreM ipsum dolor sit amet, konsektowo -adipiscing elit, sed do 63
Eiusmod Tempor Incididunt ut Labore et Dolore Magna Aliqua. 59

Metoda WRAP zwraca listę segmentowanego para, jak pokazano w pierwszym wierszu wyjścia. Możesz uruchomić różne operacje na liście, aby przedstawić tekst w dowolny sposób. Ostatnie dwa linie w wyjściu pokazują wyjście poszczególnych segmentowanych linii i ich liczbę znaków. Domyślnie metoda WRAP stosuje limit znaków 70 znaków. Możesz zmienić ten limit, dostarczając dodatkowy argument „szerokości” o własnej wartości niestandardowej, jak pokazano w poniższej próbce kodu:

importować TextWrap
Para =."
wredny_para = TextWrap.Wrap (para, szerokość = 90)
Drukuj (owinięty_para)
dla linii w owiniętej_para:
druk (linia, len (linia))

Przy limicie znaków 90 znaków teraz powyższa próbka kodu daje teraz inne wyjście:

[„LOREM ipsum dolor sit amet, konsektowo -adipiscing elit, sed do eiusmod tempor incididunt”, „Ut Labore et Dolore Magna Aliqua.']
LoreM ipsum dolor sit amet, konsektowo -adipiscing elit, sed do eiusmod tempor incididunt 89
UT Labore et Dolore Magna Aliqua. 33

Za pomocą metody wypełnienia do wytworzenia fragmentu owiniętego tekstu

Jeśli nie chcesz listy segmentowanego tekstu i bezpośrednio chcesz użyć opakowanego tekstu wieloletniego, możesz użyć metody „wypełnij” dostępną w module TextWrap.

importować TextWrap
Para =."
wredny_para = TextWrap.Wypełnij (para, szerokość = 90)
Drukuj (owinięty_para)

Po uruchomieniu kodu powyżej kodu należy uzyskać następujące dane wyjściowe:

LoreM ipsum dolor sit amet, konsektowo -adipiscing elit, sed do eiusmod tempor incididunt
UT Labore et Dolore Magna Aliqua.

Metoda wypełnienia oddziela każdą segmentową linię z nowym znakiem „\ n”. Jest to metoda wygody zawarta w module tekstu. Możesz osiągnąć ten sam efekt za pomocą metody WRAP, łącząc segmentowane linie na liście za pomocą znaku „\ n”.

importować TextWrap
Para =."
wredny_para = "\ n".dołącz (TextWrap.Wrap (para, szerokość = 90))
Drukuj (owinięty_para)

Skracanie lub obcięcie tekstu

Możesz obcinać lub skrócić tekst za pomocą metody „skróconej” dostępnej w module TextWrap. Zetnie tekst do określonego limitu znaku określonego jako argument. Na końcu tekstu zostaną dodane trzy kropki (elipsa), aby wskazać, że jest to tylko krótkie podsumowanie tekstu, a nie pełny akapit lub zdanie. Zauważ, że metoda skrótu może nie działać poprawnie z tekstami, które nie zawierają odpowiednich słów oddzielonych przestrzeni. Jeśli między słowami jest wiele białej listy, zostaną one zredukowane do jednej białej listy.

Spójrz na poniższą próbkę kodu:

importować TextWrap
Para =."
wredny_para = TextWrap.Store (para, szerokość = 90)
Drukuj (owinięty_para)

Kod jest dość prosty. Wywołujesz metodę Shorten, dostarczając zmienną PARA jako obowiązkowy argument i określając limit znaków. Po uruchomieniu powyższej próbki kodu należy uzyskać następujące dane wyjściowe:

LORM ipsum dolor sit amet, konsektowo -adipiscing elit, sed do eiusmod tempor […]

Dodaj i usuń wcięcie

Możesz użyć metody „dedent” do usuwania i „wcięcia”, aby dodać wiodące wcięcie do każdego wiersza w kawałku tekstu. Poniższa próbka kodu pokazuje użycie metody dedent:

importować TextWrap
Para =.
Sed do eiusmod tempor incididunt ut labore et dolore magna aliqua."
Drukuj (para)
wredny_para = TextWrap.dedent (para)
Drukuj (owinięty_para)

Zmienna PARA zawiera teraz dwie linie, każda z wiodącym wcięciem znaku TAB (około czterech przestrzeni). String zawinięty w potrójne cytaty zachowują odstępy, a te struny są prezentowane „tak, jak są” bez żadnych modyfikacji i bez ucieczki od znaków specjalnych. Metoda dedyna jest następnie wywoływana przez dostarczanie jej zmiennej para jako argumentu. Po uruchomieniu powyższej próbki kodu należy uzyskać następujące dane wyjściowe:

LORM ipsum dolor sit amet, konsektowo -adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.
Sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.
LORM ipsum dolor sit amet, konsektowo -adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.
Sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.

Pierwsze dwa wiersze pokazują oryginalny tekst z wiodącymi wcięciami. Ostatnie dwa linie w wyjściu pokazują te same dwie linie z usuniętymi wiodącymi wgłębieniami.

Metoda „wcięcia” działa w podobny sposób, ale teraz musisz określić wiodący ciąg wcięcia lub prefiks jako dodatkowy argument.

importować TextWrap
para = "LORM ipsum dolor sit amet, konsektowo -adipiscing elit.
Sed do eiusmod tempor incididunt ut labore et dolore magna aliqua."
Drukuj (para)
wredny_para = TextWrap.wcięcie (para, „\ t”)
Drukuj (owinięty_para)

Tutaj znak „\ t” służy do dodania zakładki przed każdym wierszem w tekście. Po uruchomieniu powyższej próbki kodu należy uzyskać następujące dane wyjściowe:

LoreM ipsum dolor sit amet, konsektoniczny adipiscing elit.
Sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.
LoreM ipsum dolor sit amet, konsektoniczny adipiscing elit.
Sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.

Wniosek

Moduł TextWrap zapewnia szereg wygodnych metod, które pozwalają skrócić tekst na różne sposoby. Korzystanie z tych metod w akapitach może poprawić ich formatowanie i czytelność, szczególnie w interfejsach użytkownika z ograniczeniami przestrzeni.