Pandas DataFrame Groupby

Pandas DataFrame Groupby
Aby zgrupować dane na kategorie i zastosować funkcję do kategorii, używamy metody pandas „grupa ()”. Pomaga również skuteczna agregacja danych. Funkcja GroupBy () jest wykorzystywana do podziału danych na grupy na podstawie określonych kryteriów. Obiekty „pandy” można podzielić wzdłuż dowolnej osi. Można powiedzieć, że w metodzie „grupy ()” obiekt jest podzielony, stosuje się funkcję, a ich wyniki są łączone. Duże dane można pogrupować za pomocą metody „grupy ()”, a operacje można również obliczyć w tych grupach. Niniejszy przewodnik szczegółowo wyjaśni metodę „GroupBy ()” i poda odpowiednie wytyczne dotyczące metody „grupy ()”.

Przykład nr 01:

Wdrażamy również tę funkcję „GroupBy ()” w kodzie „Pandy” w tym przewodniku, więc szybciej dowiesz się o funkcji „GroupBy ()”. Najpierw importujemy „Pandy jako PD” w narzędziu „Spyder”, a następnie generujemy listę o nazwie „Dane” tutaj i wkładamy do niej niektóre informacje. Nazwa „Zespół” umieściliśmy jako nagłówek kolumny, a zespoły, które do niej dodamy, to „Jeźdźcy, jeźdźcy, diabły, diabły, królowie, królowie, królowie, królowie, jeźdźcy, Royals, Royals, jeźdźcy”. Następna kolumna, którą tutaj tworzymy, to kolumna „roku”, w której dodajemy dane roku jako „2014, 2015, 2014, 2015, 2014, 2015, 2016, 2017, 2016, 2014, 2015, 2014”.

Teraz jest to nasza lista i zmieniamy tę listę „danych” na DataFrame. W tym celu wykorzystaliśmy „PD.Funkcja dataFrame () ”, która konwertuje tę listę w„ Pandy ”DataFrame. Utworzona tutaj strumienia danych jest przechowywana w zmiennej „DF” i drukujemy ją, umieszczając „DF” jako parametr „print ()”. Teraz głównym celem napisania tego kodu jest wdrożenie metody „grupy ()” na tych danych. Korzystamy z metody „GroupBy ()” i stosujemy ją do „roku”. Będzie to zgrupować dane na podstawie lat, które wprowadziliśmy. Po grupowaniu stosuje metodę „Count ()” do tej grupy. Będzie to liczyć te same lata, a następnie przechowywać je w „DF1”. Następnie mamy „wydruk”, który to uczyni.


Aby uzyskać wyjście, po prostu kliknij przycisk „Uruchom” w aplikacji „Spyder”. Przedstawia zespoły i lata danych są najpierw renderowane, a następnie grupuje te same lata, liczy je i wyświetla liczbę liczby przed grupą każdego roku. Ponieważ grupuje rok „2014” i wyświetla „5”, co oznacza, że ​​rok „2014” pojawia się pięciokrotnie w tym ramie danych. Ta grupa odbywa się, ponieważ wykorzystujemy metodę „GroupBy ()” na tej ramce danych.

Przykład nr 02:

Po zaimportowaniu „Pandy jako PD”, bezpośrednio generujemy ramkę danych o nazwie „Animals” i zawiera dwie kolumny: „zwierzę” i „maksymalna prędkość”. Kolumna „Zwierzęta” ma w sobie „Sparrow, Falcon, Parrot, Parrot, Sparrow i Falcon”. Kolumna „Max Prędkość” zawiera „210, 30, 37, 24, 260 i 390”. Tworzy ramkę danych zawierającą te kolumny, ponieważ użyliśmy „PD. Metoda dataFrame () ”tutaj.

Następnie wyświetlamy ten „zwierzę”. Następnie stosujemy metodę „grupy ()” do „zwierząt” i wstawiamy kolumnę „zwierzęcych” jako parametr. To sprawi, że grupy zależą od tych samych nazw zwierząt. Następnie wykorzystujemy tutaj funkcję „Mean ()”, która znajdzie średnią z tych grup, które są tutaj utworzone, i zainicjujemy zmienną „grupową” z tą metodą „GroupBy ()”, więc wynik, który otrzymamy po grupowaniu będzie w nim przechowywany. Chcemy również pokazać wynik, który jest przechowywany w „grupie”, więc w tym celu ponownie używamy funkcji „print ()”.


Zwierzęta i ich maksymalne prędkości są wyświetlane w pierwszej ramce danych bez grupowania. Następnie stosuje się tutaj funkcję „grupy ()” i grupuje wszystkie zwierzęta o tej samej nazwie, a następnie znajduje ich średnią i wyświetla je poniżej.

Przykład nr 03:

Tworzymy nową listę w tym kodzie, która jest listą „Summer_courses” i dodaje do niej cztery unikalne kolumny. Nazwy nagłówków kolumn to „podmiot, sub_fee, dni i dis_amount”. Dodajemy również nazwiska tematy, opłaty tematyczne, czas trwania kursu w ciągu dnia i kwota rabatów na opłatę w tych kolumnach. W „temat” dodajemy tutaj „Rozwój stron internetowych, Wengineeringing, CSS, HTML, CSS, Web Development, CSS, HTML, a także Na”. „Sub_fee” zawiera opłatę „22000, 25000, 23000, 24000, 25000, 26000, 25000, 25000, 22000 i 15000”. Dni, w których tu wchodzimy, to „30, 50, 55, 40, 60, 35, 30, 50 i 40”, a także kolumna „dis_amount” zawiera „1000, 2300, 1000, 1200, 2500, none, 1400, 1600 i 0 ”.

Teraz musimy zmienić tę listę na ramkę danych. Aby przekonwertować listę na DataFrame, używamy „PD.DataFrame () ”Funkcja i nazwij ramę danych„ Summer_course_df ”. Tutaj renderujemy „Summer_course_df”. Zmienna „Summer_course1” jest inicjowana przy użyciu techniki „grupy ()”, aby wyniki grupowania zostały zapisane. Metoda „grupy ()” jest następnie stosowana do kolumny „podmiot”.

W rezultacie zostaną utworzone grupy oparte na podobnych nazwach. Funkcja „sum ()” jest następnie wykorzystywana do obliczenia suma grup badanych, które zostały właśnie utworzone. Ta „sum ()” oblicza sumę opłat, dni i kwot rabatowych dla tych samych przedmiotów. Chcemy również wyświetlić wynik zapisany w „Summer_course1”, więc ponownie skorzystamy z funkcji „print ()”.


Tutaj możesz zauważyć, że renderuje wszystkich przedmiotów osobno w pierwszej ramce danych. Następnie łączy te same tematy lub tworzy grupy o tych samych nazwach, a także wyświetla ten sam temat nazwy. Stosuje funkcję sumy do kolumn Sub_fee, Days i Dis_amount o tych samych nazwach i czyni ich kwoty tutaj.

Przykład nr 04:

W tym kodzie używamy ramki danych poprzedniego przykładu, ale tutaj wykonujemy funkcję „GroupBy ()” w wielu kolumnach. Przekazujemy dwie nazwy kolumn do funkcji „Groupby ()”, które są „podmiotem” i „dni”. Następnie umieść „sum ()”, który wykona sumowanie grup, które są tutaj tworzone i zapisz je w zmiennej „Summer_courses2”. Następnie na końcu renderujemy „Summer_courses2”.


Ten wynik pokazuje, że wykonuje funkcję „GroupBy ()” zarówno w kolumnach „podmiot”, jak i „dni” i renderuje wynik tutaj po grupowaniu.

Wniosek:

Możesz skorzystać z tego przewodnika, aby zbadać, jak korzystać z funkcji „grupy ()” w „Pandy”, a także dowiedzieć się o składni tej metody „grupy ()” tutaj. Naszym głównym celem jest podanie zwięzłego i zrozumiałego wyjaśnienia idei metody „grupy ()” w „Pandy”. Wyjaśniliśmy, że ta metoda pomaga nam w tworzeniu grup w zależności od określonych kryteriów. Zrobiliśmy cztery przykłady w tym przewodniku, w którym tworzymy grupy, wykorzystując metodę „GroupBy ()” w „Pandy”. Po przeczytaniu tego samouczka będziesz mieć skromny stopień wiedzy, z którego możesz awansować do doskonałego etapu.