Pandas Str Wymień

Pandas Str Wymień
Wartości w ramce danych lub innych obiektach pandy można wymienić za pomocą metody zastępczej () w pandy. W Python możemy użyć tej metody do manipulacji danymi i czyszczenia danych. Ten samouczek nauczy Cię, w jaki sposób możemy zastąpić wartości lub danych z danej ramki danych za pomocą Pandas Str.Funkcja zamień (). W DataFrame możemy zastąpić dane ciągów, a nawet wyrażenia regularne (Regex) za pomocą PandaS DataFrame.str.Funkcja zamień (). Podobnie jak funkcja zastępcza () Pythona, STR.Metoda zastępcza () w pandy działa również w serii.

str.zastępować()

Metoda str.Wymień () służy do zastąpienia łańcucha lub wyrażenia regularnego wartością ciągu lub danych. Funkcja zastępcza () może zastąpić wszystkim innym, a także ciągami i odtwarzaniem. Spójrz na Str.Składnia funkcji zamień ().

Składnia

Pandy.Seria.str.zamień (Pat, Rep, n = -1, case = brak, flagi = 0, Regex = Brak)

Parametry:

  1. poklepać: skompilowany Regex lub Str. Wyrażenia regularne lub sekwencje znaków mogą być używane jako struny.
  2. repl: Callable lub STR. Zastąpić ciąg lub nazywany. Ciąg zastępczy musi zostać zwrócony przez telefon, który można go użyć po otrzymaniu obiektu dopasowania regularności.
  3. N: Domyślnie ustaw jako -1, int. Całkowite zamienniki do dokonania.
  4. sprawa: Nie domyślnie, bool. Dowiaduje się, czy „zastąpienie” jest wrażliwe na wielkość:
    1. Wrażliwy na sprawę, choć prawdziwy.
    2. W przypadku niewrażliwości na przypadki, ustawiony na false
    3. Jeśli PAT jest określony jako skompilowana regex, można go ustawić.
  5. flagi: Domyślnie 0 lub bez flag, int. Flagi w module Regex, takie jak Re.IgnorCase. Jeśli PAT jest określony jako skompilowana regex, nie można go ustawić.
  6. Regex: Domyślnie prawda, bool. Identyfikuje, czy wyrażenie regularne jest obecne w przełomie: jeśli jest to prawda, przekazany wzór jest uważany za wyrażenie regularne. W przeciwnym razie wzór jest traktowany jako dosłowny ciąg.

Scenariusz 1: Str.Zamień () w danych danych

Zastosujemy tę funkcję w kolumnach Pandas DataFrame, aby zastąpić pojedyncze/wiele wartości. W tym scenariuszu zobaczymy kilka przykładów.

Składnia:
Pojedynczy -

DataFrame_Object ['kolumna'].str.Wymień („stary”, „nowy”)

Wiele-

DataFrame_Object ['kolumna'].Wymień ([stare wartości…], [nowe wartości…])

Tutaj stary to istniejący ciąg i nowy to nowy ciąg, który zastępuje istniejący.

Przykład 1: Wymień pojedynczy ciąg
W tym przykładzie mamy ramkę danych o nazwie kolumny „Records”, które zawierają „chemikalia”, „alfabet” i „valency”. Wymień „wodór” na „chemikalia wodoru” w kolumnie chemicznej.

importować pandy
Records = pandy.DataFrame („Chemical”: [„Wodorogość”, „azot”, „tlen”, „wodór”, „sod”],
„Alphabet”: [„hy”, „n”, „o”, „hy”, „na”],
„Valency”: [10, 2, 3, 4, 11])
Drukuj (rekordy)
# Wymień „wodór” na „chemikalia wodoru” w kolumnie chemicznej.
Records [„Chemical”] = Records [„Chemical”].str.zastępować(
„Wodór”, „wodór chemiczny”)
wydrukować()
Drukuj (rekordy)

Wyjście:

Wyjaśnienie
W kolumnie chemicznej istnieją dwa ciągi z „wodorem”. Tak więc oba zostały zastąpione „chemikalia wodoru”.

Przykład 2: Wymień pojedynczy znak
W tym przykładzie mamy ramkę danych o nazwie kolumny „Records”, które zawierają „chemiczne” i „alfabet”. Wymień „O” na „O” w kolumnie alfabetu.

importować pandy
Records = pandy.DataFrame („Chemical”: [„wodór”, „azot”, „tlen”, „wodór”],
„Alphabet”: [„hy”, „n”, „o”, „no”])
Drukuj (rekordy)
# Wymień „o” na „o” w kolumnie alfabetu.
Records ['alphabet'] = Records ['alphabet'].str.zamień („o”, „o”)
wydrukować()
Drukuj (rekordy)

Wyjście:

W kolumnie alfabetu są dwa znaki. Tak więc oba zostały zastąpione „O”.

Przykład 3: Wymień wiele ciągów
Zastąpmy „wodór” na „wodór”, „tlen” z „tle” i „siarką” z „s” w kolumnie chemicznej

importować pandy
Records = pandy.DataFrame („Chemical”: [„Wodorogość”, „azot”, „tlen”, „wodór”, „siarka”]],
„Alphabet”: [„hy”, „n”, „o”, „no”, „sul”])
Drukuj (rekordy)
# Wymień wiele wartości na raz.
Records [„Chemical”] = Records [„Chemical”].Wymień („wodór”, „tlen”, „siarka”], [„wodór”, „oksy”, „s”]))
wydrukować()
Drukuj (rekordy)

Wyjście:

2 struny „wodoru” są zastępowane „wodorem”, 1 „tlen” i „siarka” zastępuje się „tlen” i „s”.

Przykład 4: Wymień wiele ciągów za pomocą słownika
Zastąpmy „wodór” na „kwas” i „siarkę” na „zasadę” w kolumnie chemicznej

importować pandy
Records = pandy.DataFrame („Chemical”: [„Wodorogość”, „azot”, „tlen”, „wodór”, „siarka”]],
„Alphabet”: [„hy”, „n”, „o”, „no”, „sul”])
Drukuj (rekordy)
# Wymień wiele wartości na raz.
Records [„Chemical”] = Records [„Chemical”].zamień („wodogen”: „kwas”, „siarka”: „baza”)
wydrukować()
Drukuj (rekordy)

Wyjście:

2 struny „wodoru” są zastępowane „kwasem”, a 1 „siarka” zastępuje się „zasadą”.

Scenariusz 2: Str.Zamień () w serii

Utwórzmy serię pandy i zastąp strunach nowymi strunami na wzór wyrabiania. Możemy określić podłoże, które należy wymienić w RE.Metoda compile () i można to przekazać w metodzie zastępczej () jako pierwszy parametr i nowy ciąg jako drugi parametr, który zastępuje podłoże.

Składnia:

Single - seria_object.str.Wymień (ponownie.kompila („stary),„ nowy ”)

Tutaj stary to istniejący ciąg i nowy to nowy ciąg, który zastępuje istniejący.

Przykład: Wymień pojedynczy ciąg
W tym przykładzie mamy serię o nazwie „Record”, która zawiera 4 ciągniki.
Wymień podłoże - „gen” na „i”.

importować pandy
import re
# Utwórz serię pandy z 4 ciągami
Record = pandy.Seria („wodór”, „azot”, „hy”, „n”])
# Wymień podłoże - „gen” na „i”.
Drukuj (zapis.str.Wymień (ponownie.kompila („gen”), „i”))
wydrukować()
# Wymień podłoże - „gen” na „i”, ignorując sprawę.
Drukuj (zapis.str.Wymień (ponownie.kompila („gen”, flagi = re.IgnorCase), „i”))

Wyjście:

Wyjaśnienie

  1. Na pierwszym wyjściu nie ignorujemy wrażliwości na sprawę. Tak więc „gen” i „gen” są różne. Ponieważ „gen” nie istnieje w serii, nie dokonuje się zastąpienia.
  2. W drugim wyjściu ignorujemy wrażliwość na przypadek, ustawiając „flagi = re.IgnorCase ”. Tak więc „gen” i „gen” są takie same. Jest zastępowany „i”. Stąd zaktualizowane struny to - „Hydroand” i „Nitroand”.

Wniosek

Uczymy Cię, jak zastąpić/zastąpić wartości łańcucha w pandy. Omówiliśmy składnię STR.Metoda zastąpiona () w celu zrozumienia jej funkcjonalności. W tym samouczku zaimplementowaliśmy kilka przykładów, aby nauczyć Cię, jak zastąpić wartości ciągów danymi ciągu, zastępować sekwencję pod substring lub znakami warta.Funkcje zamień () i zamień (). Także, jak wymienić ciągi z serii za pomocą Regex.