Pandy Wybierz wiersz według wartości

Pandy Wybierz wiersz według wartości
Rzędy z pandas DataFrame można wybrać na podstawie kilku kryteriów lub wartości kolumnowych. W tym artykule zawiera wyjaśnienia i przykłady licznych podejść do osiągnięcia tego
Sprawdź dołączone metody w tym celu:
  • Indeksowanie boolowskie
  • Loc [] właściwość
  • Metoda zapytania ()
  • Metoda isin ()

Zbadajmy praktyczne wdrożenie tych technik.

Tworzenie ramki danych

Do wdrożenia przykładów wykorzystujemy narzędzie Spyder. Po uruchomieniu narzędzia zaimportowaliśmy wymaganą bibliotekę, jaką jest „Pandy” i aliasowaliśmy „PD”. Teraz, korzystając z funkcji pandas, najpierw utworzymy przykładową ramkę danych, która będzie używana we wszystkich ilustracjach w tym przewodniku.

Przywołaliśmy metodę panda „PD.DataFrame () ”, który rozpoczyna proces tworzenia danych danych. Zainicjowaliśmy go z 4 kolumnami „Marks”, „St_name”, „ST_ID” i „Punkty”. Każda kolumna przechowuje listę zdefiniowanych wartości. Kolumna „Marks” ma wartości „100”, „92”, „79”, „92”, „73”, „82” i „90”. W kolumnie „St_name” mamy wartości ciągów „Adam”, „Albert”, „Elsa”, „Ronald”, „Maya”, „George” i „Jessica”. Kolumna „ST_ID” zawiera wartości, które zdefiniowaliśmy jako „10”, „11”, „12”, „13”, „14”, „15” i „16”. Wartości „14”, „13”, „14”, „12”, „11”, „10” i „9” zostały zapisane w kolumnie „punkty”.

Długość wartości dla kolumn wynosi 7 w tym przypadku. „PD.Metoda dataFrame () ”wygeneruje ramkę danych z określonymi kolumnami i wartościami. Teraz, aby przechowywać tę ramkę danych, utworzyliśmy obiekt DataFrame „Test” i przypisaliśmy go wyniki wynikające z wywołania metody konstruktora konstruktora PandaS DataFrame. Odtąd możemy uzyskać dostęp do tej formy danych, używając obiektu „test” jako nazwy DataFrame dla wszystkich ilustracji. Ostatecznie wyświetlana jest na ekranie, wykorzystując metodę Pythona „print ()”.

Polecenie „Uruchom plik” zapewni nam wynikowy ramkę danych przedstawioną w konsoli Python.

Przykład 1: Wybór wierszy w ramce danych na podstawie wartości kolumny

Pierwszą metodą, aby wybrać wiersze w ramce danych, jest technika indeksowania boolowskiego. W tej metodzie sprawdziliśmy każdy wiersz jako „true lub false” w ramce danych dla określonego warunku zdefiniowanego kolumny. Niezależnie od tego, w jakimkolwiek wierszu (y) odpowiada warunku, który daje „prawdziwy” i zostanie wybrany jako wyjście.

Składnia tej metody wykonywania programu jest:

Aby nauczyć się jej praktycznej demonstracji, zajrzyjmy do tych łatwych kroków. Musimy to skryptować jako nazwę DataFrame; operator indeksu dolnego; i w nawiasach kwadratowych napisz nazwę i warunek kolumny. Nasza strumienia danych, jak wspomniano powyżej, to „test”, a kolumna, którą wybraliśmy, aby zastosować warunek, to „znaki”. Zastosowaliśmy warunek, aby wybrać wiersze, w których nazwa kolumny to „znaki”, a jej wartość jest równa „92”. Musimy więc po prostu wyodrębnić wiersze oparte na kolumnie „Znaki” wartości „92”. Aby zaoszczędzić wynik, zmienna została wygenerowana i nazwana „manekinem”. Przekażemy tę zmienną „manekin” do metody „print ()”, aby pokazać jej zawartość na terminalu, gdy zostanie powołana.

Wyjście pokazuje 2 wiersze wybrane z ramki danych po sprawdzeniu warunku. Widać, że określonym przez nas warunkiem były wybrane wiersze, w których znaki to „92”. Tutaj mamy 2 rekordy ze wszystkimi wyświetlonymi danymi, których znaki to „92”. Pierwszy to „Albert”, a drugi to „Ronald”.

Przykład 2: Wybór wierszy w ramce danych na podstawie wartości kolumny za pomocą właściwości LOC []

Drugą metodą, której używamy do pobierania wierszy za pomocą wartości kolumny, jest „DF.loc [] ”z„ DF.Wartości ”właściwość.

Wykorzystaliśmy „DF.Wartości ”właściwość sprawdzenia warunku. Kolumna, którą wybraliśmy do sprawdzenia wartości, to „ST_Name” z „testu” danych danych. Warunkiem, który tutaj ustawiliśmy, polega na wybraniu wiersza, w którym wartość kolumny „ST_NAME” jest równa „Ronaldowi”. Aby przechowywać wynik, utworzyliśmy zmienną „kopię”. Tak więc ta właściwość sprawdzi warunek i wykryje wiersze zawierające wymagane dane.

Następnie zastosowaliśmy właściwość „LOC []” DataFrame. Dostarczana jest nazwa ramki danych jako „test” z właściwością „loc []”. Pomiędzy kwadratowymi nawiasami tego atrybutu przekazaliśmy zmienną „kopię”, w której wiersze pasują do określonego warunku. „DF.właściwość loc [] ”po prostu odzyska wiersze, które trzyma zmienna„ kopiuj ”. Aby zachować wynik, mamy zmienną „dane”. Aby zobaczyć ostateczne wyjście, "wydrukować()" Metoda jest wywoływana ze zmienną „danych” jako parametrem wyświetlania jej zawartości.

Dostajemy jeden wiersz jako wyjście, które spełnia określony warunek. Ponieważ jest tylko jeden wpis z wartością „Ronald” w kolumnie „St_name” w DataFrame.

Przykład 3: Wybór wierszy w ramce danych za pomocą wartości kolumny za pomocą DF.Funkcja zapytania ()

Kolejną techniką filtrowania wierszy w ramce danych opartej na wartościach kolumnowych jest użycie "zapytanie()" metoda. Ta metoda przyjmuje wyrażenie, które zwróci wartość logiczną, sprawdza warunek wszystkich wierszy w ramce danych i zwraca ramkę danych tylko z tymi wierszami, które spełniają warunek.

Przywołaliśmy „DF.Funkcja zapytania () ”. Tutaj „DF” to DataFrame, który nazywa się „testem”. Pomiędzy nawiasami metody określiliśmy warunek. Wyrażenie, które zdefiniowaliśmy, pochodzi z „st_id”, gdzie id jest równy „10”. Funkcja „Query ()” wyodrębni wszystkie wiersze w „Test” DataFrame, które pasują do tego warunku. Wynik zostanie zapisany w zmiennej „wyciągu”. Wreszcie dane przechowywane w zmiennej „wyciąg” są wyświetlane przez wywołanie metody „print ()”.

Ekran wyjściowy wykazuje jeden wiersz, ponieważ istnieje tylko jeden rekord powiązany z „ST_ID” jako „10”. Możesz zobaczyć, że rekord znajduje się w indeksie „0”, który jest pierwszym wierszem w ramce danych.

Przykład 4: Wybór wierszy w ramce danych za pomocą wartości kolumny za pomocą metody ISIN ()

Ostatnią strategią, o której tutaj omawiamy, aby wybrać wiersze, jest metoda „isin ()”. Wymaga serii lub listy wartości i wyodrębnia wiersze na podstawie wartości listy.

Zdefiniowaliśmy listę wartości jako „iterację”, która ma te wartości: „Adam”, „Elsa” i „George”. „DF.Funkcja isin () ”jest wywoływana. Nazwa DataFrame i nazwa kolumny są dostarczane metodą „isin ()”. Pomiędzy aparatem ortodontyczny. Tak więc sprawdzi kolumnę „Test” „ST_Name” dla wartości przechowywanych na liście. Jeśli znajdzie wartości, po prostu zwróci wybrany wiersz. Zachowaliśmy wynik w zmiennej „Przechodź” i wyświetliśmy ją za pomocą metody „print ()”.

To daje nam trzy wiersze, które pasowały do ​​wartości na liście.

Wniosek

Wybór określonych wierszy według wartości w ramce danych jest pomocną techniką. Wykazaliśmy różne metody pobierania wierszy na podstawie wartości kolumnowych. Najpierw sprawiłeś, że poznałeś budowę ramki danych, a następnie opracowaliśmy 4 przykłady wykorzystujące różne strategie wyodrębnienia wierszy. Wszystkie ilustracje zostały skompilowane i wykonane na Spyder.