Znajdź sznurki w pandy

Znajdź sznurki w pandy

W tym artykule pomoże Ci zrozumieć różne metody, których możemy użyć do wyszukiwania ciągu w Pandy DataFrame.

Pandy zawierają metodę

Pandy dostarczają nam funkcji zawierającej (), która umożliwia wyszukiwanie, jeśli podłoże jest zawarte w serii pandy lub ramce danych.

Funkcja przyjmuje dosłowny ciąg lub wzór wyrażenia regularnego, który jest następnie dopasowany do istniejących danych.

Składnia funkcji jest jak pokazana:

Seria.str.zawiera (wzór, case = true, flagi = 0, na = brak, Regex = true)

Parametry funkcji są wyrażone jak pokazano:

  1. wzór - odnosi się do sekwencji znaków lub wzorca regularnego do wyszukiwania.
  2. sprawa - Określa, czy funkcja powinna być przestrzegana wrażliwość na przypadek.
  3. flagi - Określa flagi, aby przejść do modułu Regex.
  4. na - wypełnia brakujące wartości.
  5. Regex - Jeśli prawda, traktuje wzór wejściowy jako wyrażenie regularne.

Wartość zwracana

Funkcja zwraca serię lub wskaźnik wartości logicznych wskazujących, czy wzór/podłoże znajduje się w ramce danych lub serii.

Przykład

Załóżmy, że mamy przykładową ramkę danych pokazaną poniżej:

# Importuj pandy
importować pandy jako PD
df = pd.DataFrame („Full_names”: [„Irene Coleman”, „Maggie Hoffman”, „Lisa Crawford”, „Willow Dennis”, „Emmett Shelton”]))
df

Wyszukaj ciąg

Aby wyszukać ciąg, możemy przekazać podłoże jako parametr wzorca, jak pokazano:

Wydrukuj (DF.pełne nazwy.str.zawiera („Shelton”))

Kod powyżej sprawdza, czy ciąg „Shelton” jest zawarty w kolumnach Full_Names.

Powinno to zwrócić serię wartości logicznych wskazujących, czy ciąg znajduje się w każdym rzędzie określonej kolumny.

Przykładem jest jak pokazano:

Aby uzyskać faktyczną wartość, możesz przekazać wynik metody Contein () jako wskaźnik DataFrame.

wydrukować (df [df.pełne nazwy.str.zawiera („Shelton”)])

Powyższe powinno powrócić:

pełne nazwy
4 Emmett Shelton

Wyszukiwanie wrażliwe na sprawę

Jeśli czułość przypadku jest ważna w wyszukiwaniu, możesz ustawić parametr przypadku na true, jak pokazano:

Wydrukuj (DF.pełne nazwy.str.zawiera („Shelton”, case = true))

W powyższym przykładzie ustawiamy parametr przypadku na true, umożliwiając wyszukiwanie wrażliwe na sprawę.

Ponieważ szukamy małej litery „shelton”, funkcja powinna zignorować dopasowanie wieloletnich i zwrócić false.

Wyszukiwanie Regex

Możemy również wyszukać za pomocą wzoru wyrażenia regularnego. Prosty przykład jest jak pokazany:

Wydrukuj (DF.pełne nazwy.str.zawiera („wi | em”, case = false, regex = true)))

Szukamy dowolnego ciągu pasującego do wzorów „wi” lub „em” w powyższym kodzie. Zauważ, że ustawiamy parametr sprawy na fałszywe, ignorując wrażliwość na sprawę.

Kod powyżej powinien zwrócić:

Zamknięcie

W tym artykule omówiono sposób wyszukiwania substring w ramce danych pandas za pomocą metody ContrenAns (). Sprawdź więcej dokumentów.