Filtr serii pandy

Filtr serii pandy

Seria pandaS to jednowymiarowa tablica z etykietami i wartościami indeksu. W razie potrzeby możemy filtrować serię pandy dla określonych warunków. Do filtrowania serii zastosujemy dwie techniki, które są „serii.Filter () ”i„ Seria.loc [] ”.

Składnia dla „serii.Filter () ”Metoda to:

Aby zastosować właściwość „LOC []”, podaną poniżej składnię należy przestrzegać:

Przykład nr 1: Wykorzystanie metody Filter () do filtrowania serii pandy

Na tej ilustracji będziemy zastosować serię pandy.Filter () ”Metoda filtrowania serii pandy.

Narzędzie Spyder jest uruchamiane w celu utworzenia przykładowych kodów. Podstawowym wymogiem budowania programu jest załadowanie wymaganych bibliotek. W takim przypadku potrzebujemy tylko jednego pakietu, który jest określany przez „pandy”. Aby wprowadzić tę bibliotekę do naszego pliku Python, użyliśmy scenariusza jednolinowego „Importuj pandy jako PD”. Ten skrypt ma dwie części: „import pandy” załaduje się do zestawu narzędzi do pandas do naszego pliku programu, a część „jako PD” skryptu stworzona „PD” do użycia jako alias „pand” w programie Python.

Następny wiersz wywołał „PD.Metoda serii () ”. „PD” odnosi się do pandy, podczas gdy „seria” odnosi się do inicjalizacji szeregowej procedury budowy. Zastosowaliśmy tę metodę i określiliśmy w niej niektóre wartości całkowite, aby utworzyć serię z tymi wartościami. Wartości to „23”, „34”, „56”, „39”, „78”, „61”, „36”, „92”, „54” ​​i „11”. Włożyliśmy 10 wartości w „PD.Metoda serii () ”.

Oprócz określenia szeregu wartości użyliśmy „nazwy”. Argument „Nazwa” ustawia etykietę dla tej tablicy wartości. Dlatego określiliśmy etykietę jako „liczby całkowite”. „Ps.Funkcja serii () ”zbuduje serię, ale nie będzie w stanie utrzymać tej serii. Następnym razem, gdy wywołamy tę metodę w danym programie, straci wcześniej utworzoną serię. Aby uzyskać tę aktualnie wygenerowaną serię, obiekt serii jest tworzony i nazwany „informacjami” i przypisany wynik wygenerowany z ćwiczenia „PD.Metoda serii () ”. Nasza seria będzie przechowywana w obiekcie serii „Informacje” i można go uzyskać później, wspominając tę ​​nazwę obiektu w dowolnym miejscu w programie.

Seria zostanie wygenerowana z określonymi wartościami i domyślną listą indeksu. Ale nie chcemy korzystać z domyślnej listy sekwencyjnej. Zamiast tego musimy umieścić listę indeksu zdefiniowaną przez użytkownika. W tym celu stworzyliśmy zmienne „ptaki” i zainicjowaliśmy go z tymi wartościami „gołębi”, „papugi”, „wróbla”, „pEA_Cock”, „Crow”, „sowa”, „king_fisher”, „łabędź”, „”, „”, „”, „ Dove ”i„ Wood_pecker ”. Liczba wartości musi być równa liczbie wartości dla serii, która wynosi 10, ponieważ wartości te zostaną ustawione jako lista indeksu.

Aby przekonwertować tę listę wartości na listę indeksu, zastosowaliśmy „serię.Indeks ”właściwość. Tutaj nasza nazwa serialu to „informacje” wspomniane z „.Indeks ”właściwość. Następnie przypisano do niego wartości, które trzyma zmienna „ptaków”. Właściwość „indeks” przyjmie wartości i ustawi je jako listę indeksu dla serii zamiast sekwencyjnej listy indeksu. Zrobiliśmy serię, ustaloną nazwę i listę indeksu. Teraz chcemy to zobaczyć w oknie wyjściowym. Można to zrobić, stosując funkcję Python „print ()”. Podaliśmy naszą serię „Informacje” jako dane wejściowe do wydrukowania jej treści.

Wystarczy nacisnąć klawisze „Shift+Enter” razem, aby uruchomić program. Wyświetli się serię wyjściową z podanymi wartościami i określoną listą indeksu na konsoli Python.

Teraz filtrujemy tę serię, wykorzystując „serię.Filter () ”funkcja. Pomiędzy nawiasami metody zdefiniujemy listę wartości do filtrowania z serii.

Serie.Filter () ”Metoda jest wywoływana. Musimy podać naszą nazwę serii zamiast słowa „seria”. Napisaliśmy to jako „Informacje.filtr()". Zastosowaliśmy tę metodę do serii. Załóżmy, że chcemy przeszukać listę etykiet indeksu, abyśmy zidentyfikowali te etykiety indeksu w tej funkcji. Aby zidentyfikować etykiety indeksu, użyliśmy argumentu „Pozycje”. Ten parametr „pozycji” zabierze wartości do filtrowania z serii. Przypisaliśmy mu dwie etykiety indeksowe „Crow” i „Swan”. Z serii „Info” będzie wyszukiwać te dwie etykiety indeksu, a jeśli zostanie znalezione, wyodrębni je odpowiednimi wartościami. Następnie, aby przechowywać filtrowane wyjście, mamy zmienną „alfa”. Funkcja „print ()” wyświetli wynik na terminalu.

Na obrazie załączonym poniżej widać, że na widoku dwóch rekordów posiadały określone etykiety indeksu.

Teraz użyjemy tej samej metody do filtrowania etykiet indeksu o określonym wyrażeniu regularnym.

W tym celu wywołaliśmy „serię.Metoda filtru () ”. I w ramach aparatów ortodontycznych jest używany parametr „Regex”. To wymaga wyrażenia w celu filtrowania etykiet indeksu zawierających je. Wyrażenie, które określliśmy do wyszukiwania, to „_” (podkreślenie), aby znaleźć etykiety indeksu, które mają to wyrażenie. Wynik zostanie przechowywany w zmiennej „beta” i wystawiany metodą „print ()”.

Seria filtrowana pokazuje trzy rekordy, których etykiety indeksowe miały wyrażenie „_”.

Przykład nr 2: Wykorzystanie właściwości loc () do filtrowania serii pandy

Inną metodą filtrowania serii pandy według wartości jest „seria.Loc [] ”. Określimy warunek w „serii.lokal [] ”właściwość wyodrębnia rekordu, który określa określony warunek.

Najpierw zaimportowaliśmy bibliotekę pandy, a następnie zastosowaliśmy „PD. Seria () ”funkcja generowania serii z tymi wartościami„ 1 ”,„ 25 ”,„ 93 ”,„ 44 ”,„ 51 ”,„ 6 ”,„ 72 ”,„ 18 ”,„ 99 ”,„ 12 ”,„ 12 ”,„ 64 ”,„ 44 ”,„ 16 ”,„ 77 ”,„ 19 ”,„ 44 ”i„ 22 ”. Powstała seria jest przechowywana w obiekcie serii „Y”. Aby zaprezentować go na ekranie, przekazaliśmy ten obiekt do metody „print ()”.

To daje nam następującą serię jako wyjście:

Przywołaliśmy „serię.lokal [] ”właściwość i określono w nim warunek za pomocą funkcji„ lambda ”. Warunkiem, który zdefiniowaliśmy, polega na każdej wartości z serii, aby sprawdzić, czy wartość jest równa „44”. Następnie przechowuj wygenerowany wynik w zmiennej „Cond” i pokazaj go za pomocą funkcji „print ()”.

Wynik pokazuje 3 rekordy w indeksie „3”, „11” i „15”, które mają wartość równą 44.

Do demonstracji zastosujemy warunek „lub” z właściwością „LOC []”.

Między nawiasami nieruchomości „Seria.loc [] ”, użyliśmy funkcji„ lambda ”, aby określić warunek, które stwierdzają, że wyodrębniają wartości mniejsze niż 30. Lub wartości większe niż 50, gdzie „x” to dowolna wartość w serii „Y”. Zmienna „Z” utrzyma wyjście.

Oto dane wyjściowe renderowane w poniższej migawce pokazujące tylko te wartości, które spełniły określony warunek.

Wniosek

W tym artykule opracowaliśmy koncepcję filtrowania serii pandy z określonymi warunkami. Wyjaśniliśmy dwie metody, aby to zrobić: „Seria.filtr () ”i„ Seria.Loc [] ”. Pierwsza ilustracja wyjaśniła „serię.Filter () ”Funkcja filtrowania etykiet indeksowych w serii pandy, dostarczając listę etykiet indeksu, a także przy użyciu wyrażenia regularnego obecnego w etykietach indeksu. 2Nd Instancja pracowała nad korzystaniem z „serii.lokal [] ”właściwość wyszukiwania wartości w serii, która spełnia określony warunek.