Zapytanie o pandas DataFrame

Zapytanie o pandas DataFrame
Pakiet Python sprawia, że ​​jest to świetny język do prowadzenia analizy danych. Jednym z programów, które pozwalają na pozyskiwanie i analizę danych znacznie prostsze, są pandy. Mamy ramkę danych i filtrujemy dane zgodnie z naszymi potrzebami z tej formy danych w pandy. Analiza danych wymaga licznych technik filtrowania. Istnieje wiele sposobów filtrowania danych z określonej ramki danych przy użyciu metod PandaS. Jednym z nich jest metoda „Query ()”, która pomaga nam w filtrowaniu niektórych danych z DataFrame. Możemy zapytać o ramkę danych, używając funkcji „Query ()” w pandy. Wyrażenie zapytania jest przekazywane do funkcji „Query ()” i zwraca wynik przez zwrócone instrukcja zapytania. W tym przewodniku wykorzystamy metodę „Query ()” i wyjaśnimy, w jaki sposób pomaga w pandach w filtrowaniu pożądanych danych z DataFrame.

Składnia:

Ramka danych.zapytanie (expr, inplace = false, ** kwargs)

Tutaj stawiamy warunek jako pierwszy parametr metody „zapytanie ()”. INPHINGE jest opcjonalnie. Jeśli tego nie dodamy, jego domyślna wartość to „Fałsz”, która jest dostosowana automatycznie. Możemy również ustawić go na „true”, co aktualizuje ramkę danych.

Teraz przeprowadzamy się, aby wykorzystać metodę „Query ()” w pandy w tym przewodniku i wyjaśnimy ją tutaj.

Przykład 1:

W tym przewodniku demontujemy metodę „Query ()” w pandy. Używamy aplikacji „Spyder” do napisania kodu panda. Wiemy, że musimy zaimportować niektóre metody pandy jako „PD”. Opracowujemy „List_data” i umieszczamy „P_Name” i „P_AGE” w „List_data”. „P_name” zawiera „Smith, Oscar, Mary, Theo, Teddy i John”. „P_AGE” zawiera w nim „50, 33, 56, 29, 45 i 30”. Zmieniamy listę zagnieżdżoną „list_data” na „my_df”. Zmieniamy to w ramce danych, ponieważ musimy zastosować metodę „zapytanie ()” do DataFrame. Tak więc tworzono tutaj „my_df”, który jest również wyświetlany, ponieważ wstawiamy go w następującej funkcji „print ()”.

Teraz wykorzystujemy metodę „Query ()” do wyodrębnienia niektórych danych. Dostajemy dane, których wiek jest większy niż 30. W tym celu dodamy warunek w metodzie „Query ()” i używamy tej metody w druku. Wynik również dla nas renderuje. Teraz filtruje dane, których wiek jest większy niż 30 i wyświetla je na wyjściu.

Istnieją dwie metody uruchamiania pożądanego kodu, gdy kompilujemy i uruchamiamy go w „Spyder”. Jednym z nich jest naciśnięcie „Shift+Enter”. Inną metodą jest użycie ikony „Uruchom” aplikacji „Uruchom” do wykonania kodu. Otrzymujemy określone dane wyjściowe po wykonaniu. Po pierwsze, renderowana jest kompletna ramka danych. Następnie filtrujemy dane z tego, że wiek jest większy niż 30. Przefiltrowane dane są również pokazane następująco. Filtrujemy te dane tylko za pomocą metody „Query ()” w pandy.

Przykład 2:

Tworzymy listę zagnieżdżoną listą „Player_data” i dodajemy kolumnę „Player_name”, w której mamy „Emma, ​​Samuel, Robert, Smith, Noah, Jessica i Harper”. Następnie dodajemy kolumnę „Player_age”, która ma w sobie „22, 26, 21, 25, 29, 24 i 28”. Następnie pojawia się kolumna „Score_1” zawierająca „29, 28, 16, 17, 35, 20 i 15”. Kolumna „Score_2” zawiera „28, 45, 49, 62, 70, 55 i 40”. „Score_3” zawiera „24, 13, 59, 62, 72, 64 i 66”. A ostatnim, jaki mamy, to kolumna „Score_4”, która ma „38, 44, 69, 72, 81, 71 i 79”. Ta lista „Player_data” jest przekształcana w ramkę danych przy użyciu metody PandaS. Nazwamy tę strumień danych „gracz_df”.

Gdy dodajemy „gracz_df” do następującej funkcji „print ()” i wyświetla się. Teraz uwzględniamy warunek w funkcji „Query ()” i wykorzystujemy tę metodę w metodzie druku (), aby uzyskać dane, których „score_1” wynosi ponad 20. Umieściliśmy go w „druku”, co również udziela rezultatu dla nas. Dane, których „Score_1” wynosi ponad 20, są teraz filtrowane i wyświetlane na konsoli.

Jak widać, istnieją tylko trzy rzędy, w których „score_1” jest większe niż 20. Tak więc ta metoda „Query ()” renderuje te dane na ekranie po wyświetleniu pełnej ramki danych.

Przykład 3:

Tworzone jest „owoce_data”. Dodaje się „fruit_name” i „fruit_quantity”. „Apple, Orange, Mango, Apple, Banana, Apple, Lychee i Apple” są wymienione w „Fruits_name”. Ich ilości, które są „5 kg, 7 kg, 2 kg, 4 kg, 5 kg, 7 kg, 2 kg i 4 kg”, są wymienione w „Fruits_quantity”. Przekształcamy zagnieżdżoną listę „owoce_data” w ramkę danych „owoce_df.„Ten„ owoce_df ”powstaje tutaj i jest również wyświetlany, ponieważ wprowadzamy go w następującej funkcji„ print () ”. Teraz filtrujemy niektóre dane za pomocą techniki „Query ()”. Chcemy odfiltrować „jabłko” z tej formy danych, więc umieszczamy warunek, w którym „owoce_nazwa” jest równa „Apple”. Wyświetlamy również „jabłka” na terminalu.

W tym wyniku, po udzieleniu całej ramki danych, rzędy zawierające „jabłko” są odfiltrowane. Przefiltrowane dane są również wyświetlane na poniższej ilustracji. Używamy metody Pandas Query () do filtrowania tych danych.

Przykład 4:

Opracowujemy listę zagnieżdżoną „result_9th” po zaimportowaniu metody pandas. Dodajemy kolumnę „Nazwa” do naszej zagnieżdżonej listy „Result_9th” i wypełniamy ją „Samuel, George, James, Melissa, William, Farnham i Smith”. Kolumna „subj1” zawiera wartości „47, 30, 54, 71, 68, 16 i ab”. „Subj2” jest następnie dodawane z następującymi wartościami: „81, 23, 48, 34, 21, 15 i ab”. Kolumna „subj3” Conatynuje następujące wartości: „29, 14, 28, 55, 29, 27 i ab”. Kolumna „subj4” zawiera następujące wartości: „59, 27, 58, 75, 59, 17 i ab”. „Subj5” zawiera następujące wartości: „90, 4, 82, 85, 95, 22 i AB”. Następnie dodajemy również kolumnę „Pass/Fail”, która zawiera status „Pass” i „Fail” uczniów.

Używamy tutaj techniki PandaS, aby przekonwertować tę listę „Result_9th” w ramkę danych, którą nazywaliśmy „wynik_9th_DF ”. „Wynik_9th_df ”jest renderowany w wyniku naszego dodatku do następującej metody„ print () ”. Teraz filtrujemy dane ucznia, o którym nazywa się „James”. Umieszczamy tę nazwę jako warunek metody „Query ()”. Umieszczamy nazwę kolumny „Nazwa” i równa jej „Jamesowi”. Następnie przechowujemy dane „Jamesa” studenta w „DF2”. Następnie umieszczamy ten „DF2” w „wydruku”, aby wyświetlić dane „Jamesa”.

Pierwsza ramka danych zawiera wynik 7 studentów, które dodamy do DataFrame. Wyodrębniamy dane „Jamesa” z tego DataFrame. W ten sposób możemy łatwo wyodrębnić lub odfiltrować dane, które chcemy uzyskać z DataFrame w pandy.

Wniosek

Ten przewodnik jest tutaj, aby zbadać metodę „Query ()” w pandy. Wykazaliśmy różne przykłady w tym przewodniku i szczegółowo wyjaśniliśmy każdy z nich, aby zapewnić prawidłowe zrozumienie metody „zapytania ()”. Omówiliśmy wykorzystanie metody „Query ()” do filtrowania określonych danych z DataFrame. Dla Twojej korzyści każdy przykład w tym przewodniku i składnia tej metody „zapytanie ()” są tutaj starannie przedstawione. Powinieneś być w stanie nauczyć się tej koncepcji „zapytanie ()” w pandy za pomocą tego przewodnika.