Pandas Str zawiera

Pandas Str zawiera
„Ten artykuł nauczy Cię, w jaki sposób Python można użyć do ustalenia, czy określona część ciągu jest zawarta w wartości ciągu, czy nie. Python ma wiele metod znajdowania podłańca w ciągu ciągu, takich jak sprawdzanie wzorców, niewrażliwość na przypadki i więcej. Każdy poziom programisty powinien być w stanie poradzić sobie z strunami w Python."

Po zakończeniu tego samouczka dowiesz się:

  • Python Metody i operatorzy w celu ustalenia, czy ciąg obejmuje podłoże, czy nie.
  • Filtrowanie ramki danych, gdy w kolumnie występuje podłoże w kolumnie
  • Za pomocą Regex ustal, czy ciąg obejmuje podłoże wzorce.

Jak znaleźć, jeśli podłoże lub wyrażenie istnieje w wartości łańcucha w pandy?

Aby ustalić, czy ciąg składa się z określonego podłacia, czy nie, istnieje kilka funkcji, które możemy zrobić, aby to zrobić.

Przykład nr 1: Sprawdź, czy określony podłoże jest zawarty w danych ciągu za pomocą operatora w

W Python operator in -in -Iterable, taki jak listy i struny. Służy do ustalenia, czy element jest obecny w iteralnym, czy nie. Znaleziony element jest wskazany przez operatora powracającego true. Jeśli nie, zwraca fałsz. Operator in -in jest najszybszym i najbardziej pytalnym podejściem do ustalenia, czy ciąg obejmuje podłoże w Pythonie. Operator wyjaśnia każdemu czytelnikowi kodu, co próbujesz osiągnąć.


Seria Panda została utworzona za pomocą PD.Funkcja serii () po zaimportowaniu modułu PandaS. Nasza seria składa się z wartości sznurkowych „Floor”, „Our”, „Anuluj”, „Sure”, „Tour”, „Store”, „Nero” i „Evil”. Teraz użyjemy operatora In, aby znaleźć, czy określony podłoże istnieje w wartościach ciągów serii pandy, czy nie. W celu iteracji każdej wartości serii pandy, pętla „for” zostanie użyta, jak widać w skrypcie poniżej.

Korzystając z operatora In, otrzymaliśmy wyniki w formie prawdziwej i fałszu. „True” wskazuje na obecność substring dla wartości ciągu, a „Fałsz” wskazuje na brak substring. Możemy również używać operatora w listy pandy i kolumnom DataFrame zawierającym wartości ciągów. Wypróbujmy operatora w kolumnie z ramką danych. Aby utworzyć ramkę danych, użyjemy pand PD.Funkcja dataFrame ().

Po pierwsze, stworzyliśmy słownik Python „DIC” składający się z par kluczowych. Następnie minęliśmy słownik „DIC” w PD.Ramka danych(). Utworzyliśmy naszą ramkę danych z trzema kolumnami, i.mi., Id, nazwa i kurs. Naszym celem jest stwierdzenie, czy w kolumnie String Istnieje się podstępy, czy nie, więc skupimy się tylko na kolumnach ciągów. Istnieją dwie kolumny łańcuchowe w naszym „Nazwa” i „Nazwa” i „kolumnach” o wartości ciągu („Davidson”, „Hendery”, „Henderson”, „Jason”, „Kim”, „Jenson”, „Jackson”, „Carl”, „Carl ”) I („ Python ”,„ Amazon ”,„ Economics ”,„ Business ”,„ Języki ”,„ Baza danych ”,„ Projektowanie ”,„ rysunek ”).

Określiliśmy kolumnę „Nazwa”, która jest iterowana przez pętlę, aby sprawdzić, czy „syn” podjazd jest obecny w wartościach ciągu nazwy kolumny, czy nie. Funkcja generuje wynik, sprawdzając każdą wartość wewnątrz kolumny.

Przykład nr 2: Filtruj ciąg, jeśli obecność jest obecna

Operator In zostanie użyty do filtrowania listy, serii lub danych danych poprzez wyodrębnienie wartości ciągów, jeśli podłoże jest obecne. Aby to osiągnąć, będziemy iterować za pośrednictwem każdego elementu obiektu za pomocą iteratora pętli, aby sprawdzić, czy jest obecny podłoże. Jeśli elementy listy składają się z podłańca, ciągi zostaną dodane do innej listy. Najpierw utworzyj obiekt listy

Po pierwsze, stworzyliśmy listę zawierającą elementy jako wartości ciągów „banan”, „jabłko”, „natura”, „analiza”, „ryba”, „nazwa”, „koszula”, „analog”. Następnie tworzona jest pusta lista „filtrowana”, aby przechowywać wynikające wartości. Wykorzystaliśmy operator w celu ustalenia obecności podłoża. Funkcja dołączania służy do dołączania ciągów wyjściowych (gdzie obecna była podłoże) w pustym ciągu „filtrowanym”. Mamy cztery wartości, i.mi., „Banana”, „Analiza”, „Nazwa”, „analog”, który zawiera podłoże „na”. Teraz wypróbuj to z kolumną DataFrame. Wykorzystamy ramkę danych, którą utworzyliśmy w przykładzie nr 1.

Tym razem sprawdzimy kolumnę kursu.

Określiliśmy kolumnę kursu, która ma zostać iterowana przez pętlę, aby sprawdzić, czy podłoże „ON” jest zawarte w kolumnie kursu w ramce danych. Wartości, w których istnieje podłoże, są dołączane do pustej listy „filtrowanej”, którą wydrukowaliśmy jako wyjście.

Serie.Funkcja STR może uzyskać wartości serii jako ciągi i wykonywać różne operacje. Aby sprawdzić, czy wzorzec lub regularność jest obecna w indeksie, czy serii, możemy użyć serii „.str.zawiera funkcję () ”w pandy. W zależności od tego, czy określony wzór lub regularność jest obecna w wartości ciągu lub indeksu, metoda zwraca indeks logiczny lub serię.

Składnia: Seria.str.zawiera (pat, case = true, flagi = 0, na = nan, regex = true)

Gdzie,

poklepać: Wyrażenie regularne lub sekwencja znaków.

sprawa: wrażliwy przypadek, jeśli jest ustawiony na true.

Flagi: Flagi, które mają zostać przekazane przez moduł Re, na przykład.IgnorCase.

NA: Aby wypełnić brakujące lub zerowe wartości.

Regex: Pat jest uważany za wyrażenie regularne, jeśli jest prawdziwe.

Przykład nr 4: Użyj serii.str.zawiera funkcję () w celu ustalenia, czy podłoże jest obecne w danych

Najpierw utworzymy listę z wartościami ciągu. Wraz z panami zaimportujemy również ponowne moduły. Ponowne moduł oferuje zestaw wydajnych funkcji wyrażenia regularnego, które pozwalają łatwo określić, czy dostarczony ciąg pasuje lub zawiera określony wzór przy użyciu metody dopasowania i za pomocą metody wyszukiwania odpowiednio.

Utworzyliśmy listę z PD.Series () funkcja z wartościami stringowymi „Team_a”, „Team_ab”, „Team_b”, „Team_alpha”, „Team_ace”, „Team_stars” i „Team_C”. Określiliśmy również indeks naszej serii „SR” jako „Team 1”, „Team 2”, „Team 3”, „Team 4”, „Team 5”, „Team 6” i „Team 7”. Teraz użyjmy serii.str.zawiera funkcję (), aby znaleźć, czy podłoże jest obecne w wartościach ciągów listy.

Wewnątrz str.zawierają funkcję (), określiliśmy parametr PAT jako „Team_a”, aby sprawdzić, czy podłoże „Team_a” jest zawarte w wartościach ciągów listy. Wyjście pokazuje, że obiekt szeregowy zawierający wartości logiczne jest zwracane przez serię.str.zawiera funkcję (). Tam, gdzie dostarczony wzór znajduje się w ciągu, jest to prawdą; W przeciwnym razie Fałsz zostaje zwrócony.

Przykład nr 5: Użyj serii.str.zawiera funkcję () w celu ustalenia, czy wzór jest obecny w danych

Teraz sprawdzimy, czy określony wzorzec istnieje w danych ciągów podstawowego obiektu serii. Utwórzmy łańcuch zawierający wartości ciągów.

Stworzyliśmy serię z wartościami „Mickey”, „Rickon”, „Alex”, „Nick”, „Rov”, „Tim” i „Danny”. Aby ustalić, czy wzorzec jest zawarty w danych łańcuchowych obiektu serii, użyjemy teraz „serii.str.zawiera funkcję () ”.

Określiliśmy ścieżkę = „i [a-z]”, aby znaleźć, czy w serii „s” jest wartość ciągów, mając literę „i”, a następnie jakikolwiek mały alfabet.

Wniosek

W tym samouczku staraliśmy się nauczyć, jak ustalić, czy ciąg obejmuje podłoże w pandy. Można to zrobić przy użyciu kilku metod, ale omówiliśmy kilka z nich w przykładach. Wdrożyliśmy przykłady, aby nauczyć cię, jak ustalić, czy ciąg zawiera określony podłoże przy użyciu operatora in, filtruje ciąg, jeśli podłoże jest obecne w serii lub ramce danych, i używać STR.zawiera funkcję () w celu ustalenia, czy podłoże lub wyrażenie jest obecne w danych.