Pandas DataFrame Wybierz wiersze według warunków

Pandas DataFrame Wybierz wiersze według warunków
„W„ Python ”mamy bibliotekę Open_Source, która jest biblioteką„ Pandas ”. W „Pandy” możemy łatwo i wydajnie wykonywać wiele zadań. Jak wiemy, że możemy tworzyćFrame w „Pandy”, wykorzystując metody „pand”. Więc po utworzeniu ramek danych możemy wybrać wiersze, stosując warunki. Możemy wykorzystać różne metody, które „pandy” przewidują wybór wierszy strumienia danych w zależności od warunku, który dodaliśmy w metodach „pandy”. Omówimy wszystkie metody, które możemy użyć do wyboru wierszy w ramce danych w „Pandy” w tym przewodniku."

Metody wyboru wierszy danych danych według warunków

„Pandy” zapewnia cztery różne metody wyboru wierszy strumienia danych według warunków. Te metody są tutaj:

  • Ramka danych.Metoda zapytania ().
  • Ramka danych.Metoda loc ().
  • Ramka danych.Metoda isin ().
  • Ramka danych.Metoda filtra ().
  • DataFarme.metoda ILOC ().
  • Ramka danych.Zastosuj () metodę.

Wszystkie te metody są wykorzystywane w „Pandy” do wyboru wierszy „Pandy” Dataframe. Umieszczamy również warunek w tych metodach, a one wybiorą one w zależności od tego warunku. Wykorzystamy te metody i wybierzemy wiersze w tym przewodniku i wyjaśnimy tutaj każdy kod tutaj.

Przykład nr 01
Narzędziem, którego użyjemy w tym przewodniku do opracowania kodu „Pandy”, jest narzędzie „Spyder”. Generujemy kod „pandy”, importując moduły „pandy”, a następnie opracowujemy listę o nazwie „Matric_class”, która ma „nazwę”, która zawiera nazwy studentów takich jak „Peter, George, Bromley, Samuel, Leo , Farnham i Lily ”.

Następnie dodajemy kilka znaków tych uczniów w różnych tematach, a te przedmioty to „angielski, komputer, fizyka, chemia i biologia”. W „English” dodaliśmy „46, 32, 54, 71, 68, 31 i 54”, w „komputerze” dodaliśmy „82, 23, 48, 34, 32, 15 i 33”, a następnie Przychodzi „Fizyka”, w której dodaliśmy „29, 31, 27, 55, 29, 20 i 32”, a następnie „chemia” zawiera „59, 32, 57, 85, 59, 55 i 81 i 81 ”,„ Biologia ”jest następna, w której znaki to„ 90, 31, 84, 95, 98, 72 i 77 ”. To jest zagnieżdżona lista „matric_class”.

Teraz musimy przekonwertować tę zagnieżdżoną listę na ramkę danych, więc w tym celu zastosowaliśmy metodę „Pandy”, która pokazano również poniżej „PD.Ramka danych". Ta metoda zmienia listę „Matric_class” w ramkę danych o nazwie „Matric_class_df”. Ten „matric_class_df” jest następnie umieszczany w metodzie „print ()”. Tutaj oprawa danych jest zakończona, a także renderowana.

Teraz musimy wykonać ten kod. Tak więc, ponieważ pracujemy nad narzędziem „Spyder”, dlatego nacisamy ikonę „Uruchom” tego narzędzia do wykonania; Następnie renderowany jest następujący wynik, w którym renderowana jest. Teraz wybierzemy niektóre wiersze z tego ramki danych, wykorzystując metodę „pandy” w zależności od niektórych warunków, które dodamy do metody „pandy”.

Tutaj filtrujemy niektóre wiersze, umieszczając nazwę DataFrame, a warunek, który dodaliśmy w tej metodzie, jest to, że „nazwa” jest równa „Bromley”, więc będzie to wiersz, w którym nazwa ucznia jest „Bromley” i przechowuj wiersz „Bromley” w „Result_DF”. Wynik „Bromley” jest teraz renderowany na ekranie, umieszczając go w „print ()”.

Pokazany jest tutaj pełny wiersz, który zawiera dane „Bromley”. Przefiltrowaliśmy ten wiersz z ramki danych, umieszczając stan w metodzie „pandy”.

Przykład nr 02
Ponownie używamy „matric_class_df” i tutaj wybieramy wiersze inne niż „Bromley”. Tak więc warunek, który tutaj stawiamy, polega na tym, że „nazwa” ucznia nie jest równa „Bromley”. Wybierze lub odfiltruje wszystkie wiersze, w których nazwa ucznia nie jest „Bromley”, a także renderuje wszystkie wiersze oprócz wiersza zawierającego nazwę „Bromley” w kolumnie „Nazwa”.

Tutaj wybiera wszystkie wiersze z oryginalnej ramki danych, z wyjątkiem 2 wiersza indeksu, ponieważ w tym wierszu kolumna „Nazwa” zawiera „Bromley”. Tak więc ignoruje ten wiersz i wybiera wszystkie inne rzędy DataFrame i renderuje je tutaj.

Przykład nr 03
Teraz tworzymy nową listę nowego przykładu tutaj, w którym utworzona lista to „ABC_LIST”. W kolumnie „Nazwa” dodajemy „James, Milli, Farnham, Lily, Leo, Samuel i Fuller”. Następnie mamy „kody”, w których wstawiamy „ABC19, ABC34, ABC39, ABC45, ABC59, ABC62 i ABC15”. Potem nadchodzi „miesiąc”, który zawiera „lipiec, kwiecień, lipiec, sierpień, wrzesień, lipiec i październik”. „Jednostki” mają „19, 14, 9, 16, 15, 10 i 13”. Ta lista jest przekonwertowana na ramkę danych, a następnie renderowana jest.

Następnie wykorzystujemy „DataFrame.Metoda Query () ”do wyboru niektórych wierszy. Umieszczamy warunek „miesiąca == lipca”, co oznacza, że ​​wybiera wszystkie te wiersze, w których „miesiąc” to „lipiec”. Te wiersze są zapisywane w „ABC_DF2”, a następnie wyświetlamy te rzędy zawierające miesiąc „lipiec” za pomocą „print ()”

Oryginalna ramka danych zawiera 7 wierszy i wybieramy te rzędy, w których miesiąc jest „lipca”, więc w tej formie danych obecnych jest tylko trzy wiersze, które zawierają „lipiec”, a te trzy wiersze są również renderowane osobno po oryginalnej ramce danych danych danych.

Przykład nr 04
Malka danych utworzona w tym przykładzie nazywa się „pacjentem”, zawierającym w nim „Nazwa, miasto, posiedzenie_no i opłatę/siedzenie”. Nazwiska pacjentów znajdują się w „Imię”, którym to „James, Noah, Peter, Bromley i Samuel”. Miasta tych pacjentów są wstawiane do „City”, które to „Nowy Jork, Birmingham, Nowy Jork, Los Angeles i Banglore”. Następnie umieszczamy liczbę posiedzeń w „Portings_no”, które są „2, 6, 4, 4 i 3”. Wkładamy również opłatę za siedzenie tych pacjentów, które wynoszą „6000, 6000, 6900, 7400 i 6300”.

Następnie lista „pacjentów” jest również zmieniana na „pacjent_df”, który jest tutaj ramką danych. Następnie drukujemy „pacjent_df”, a po wydrukowaniu przeprowadzamy się tutaj, aby wykorzystać metodę „LOC”, która pomaga nam w wyborze wierszy. Warunkiem, który tutaj ustawiliśmy, polega na tym, że wybiera rzędy, w których „posiedzenia_no” pacjenta to „4”, a także pokazuje te wiersze na terminalu.

W ramce danych znajdują się tylko dwa rzędy, w którym „posiedzenia_no” pacjenta wynosi „4”, a także można zauważyć te wiersze w poniższym wyjściu.

Przykład nr 05
Teraz podajemy kolejny przykład tutaj i bezpośrednio tworzymy tutaj „nauczyciel_df”, w których dodane kolumny to „Examin_code, Examiner_name, Examiner_Duty_num, Exam_room_No i Exam_Block”. Wkładamy również dane we wszystkich kolumnach w taki sam sposób, jak wyjaśniliśmy w naszych poprzednich kodach. Następnie renderujemy „nauczyciel_df”, tutaj filtrujemy rzędy za pomocą metody „isin ()”. Zainicjujemy zmienną „dane” z „a i c”, a następnie umieszczamy „dane” w metodzie „isin ()”, a także umieszczamy nazwę kolumny, w której sprawdza te wartości danych. Nazwa kolumny to „Exam_block” tutaj, więc sprawdzi kolumnę „Exam_block” i wybierze te wiersze, w których „egzamin_block” to „A” lub „C”, a następnie wydrukuje te wiersze, w których ten warunek jest spełniony.

Ta metoda „isin ()” wybiera wszystkie kolumny, w których „egzamin_block” to „a” lub „c”. W tym ramie danych pojawiają się tylko pięć wierszy, które spełniają ten warunek, a także są wyświetlane tutaj.

Wniosek

Ten przewodnik przedstawia koncepcję „Wybór wierszy danych według stanu w pandach”. Omówiliśmy różne metody, które są używane do wyboru wierszy w pandach w zależności od niektórych warunków. W naszych kodach wykorzystaliśmy cztery metody, a także wyjaśniliśmy każdą z nich szczegółowo. Pokazaliśmy, w jaki sposób umieszczamy warunek w tych metodach i jak zwracają lub wybierają rzędy DataFrame. Omówiliśmy, że kiedy stawiamy warunek w dowolnej metodzie, którą wyjaśniliśmy tutaj, aby wybrać wiersze, sprawdza to warunek i wybiera te wiersze z DataFrame, co spełnia dany warunek. W tym przewodniku wyświetliśmy dane wyjściowe wraz ze skryptem kodowym.