Przykład nr 01:
Wdrażamy również tę funkcję „GroupBy ()” w kodzie „Pandy” w tym przewodniku, więc szybciej dowiesz się o funkcji „GroupBy ()”. Najpierw importujemy „Pandy jako PD” w narzędziu „Spyder”, a następnie generujemy listę o nazwie „Dane” tutaj i wkładamy do niej niektóre informacje. Nazwa „Zespół” umieściliśmy jako nagłówek kolumny, a zespoły, które do niej dodamy, to „Jeźdźcy, jeźdźcy, diabły, diabły, królowie, królowie, królowie, królowie, jeźdźcy, Royals, Royals, jeźdźcy”. Następna kolumna, którą tutaj tworzymy, to kolumna „roku”, w której dodajemy dane roku jako „2014, 2015, 2014, 2015, 2014, 2015, 2016, 2017, 2016, 2014, 2015, 2014”.
Teraz jest to nasza lista i zmieniamy tę listę „danych” na DataFrame. W tym celu wykorzystaliśmy „PD.Funkcja dataFrame () ”, która konwertuje tę listę w„ Pandy ”DataFrame. Utworzona tutaj strumienia danych jest przechowywana w zmiennej „DF” i drukujemy ją, umieszczając „DF” jako parametr „print ()”. Teraz głównym celem napisania tego kodu jest wdrożenie metody „grupy ()” na tych danych. Korzystamy z metody „GroupBy ()” i stosujemy ją do „roku”. Będzie to zgrupować dane na podstawie lat, które wprowadziliśmy. Po grupowaniu stosuje metodę „Count ()” do tej grupy. Będzie to liczyć te same lata, a następnie przechowywać je w „DF1”. Następnie mamy „wydruk”, który to uczyni.
Aby uzyskać wyjście, po prostu kliknij przycisk „Uruchom” w aplikacji „Spyder”. Przedstawia zespoły i lata danych są najpierw renderowane, a następnie grupuje te same lata, liczy je i wyświetla liczbę liczby przed grupą każdego roku. Ponieważ grupuje rok „2014” i wyświetla „5”, co oznacza, że rok „2014” pojawia się pięciokrotnie w tym ramie danych. Ta grupa odbywa się, ponieważ wykorzystujemy metodę „GroupBy ()” na tej ramce danych.
Przykład nr 02:
Po zaimportowaniu „Pandy jako PD”, bezpośrednio generujemy ramkę danych o nazwie „Animals” i zawiera dwie kolumny: „zwierzę” i „maksymalna prędkość”. Kolumna „Zwierzęta” ma w sobie „Sparrow, Falcon, Parrot, Parrot, Sparrow i Falcon”. Kolumna „Max Prędkość” zawiera „210, 30, 37, 24, 260 i 390”. Tworzy ramkę danych zawierającą te kolumny, ponieważ użyliśmy „PD. Metoda dataFrame () ”tutaj.
Następnie wyświetlamy ten „zwierzę”. Następnie stosujemy metodę „grupy ()” do „zwierząt” i wstawiamy kolumnę „zwierzęcych” jako parametr. To sprawi, że grupy zależą od tych samych nazw zwierząt. Następnie wykorzystujemy tutaj funkcję „Mean ()”, która znajdzie średnią z tych grup, które są tutaj utworzone, i zainicjujemy zmienną „grupową” z tą metodą „GroupBy ()”, więc wynik, który otrzymamy po grupowaniu będzie w nim przechowywany. Chcemy również pokazać wynik, który jest przechowywany w „grupie”, więc w tym celu ponownie używamy funkcji „print ()”.
Zwierzęta i ich maksymalne prędkości są wyświetlane w pierwszej ramce danych bez grupowania. Następnie stosuje się tutaj funkcję „grupy ()” i grupuje wszystkie zwierzęta o tej samej nazwie, a następnie znajduje ich średnią i wyświetla je poniżej.
Przykład nr 03:
Tworzymy nową listę w tym kodzie, która jest listą „Summer_courses” i dodaje do niej cztery unikalne kolumny. Nazwy nagłówków kolumn to „podmiot, sub_fee, dni i dis_amount”. Dodajemy również nazwiska tematy, opłaty tematyczne, czas trwania kursu w ciągu dnia i kwota rabatów na opłatę w tych kolumnach. W „temat” dodajemy tutaj „Rozwój stron internetowych, Wengineeringing, CSS, HTML, CSS, Web Development, CSS, HTML, a także Na”. „Sub_fee” zawiera opłatę „22000, 25000, 23000, 24000, 25000, 26000, 25000, 25000, 22000 i 15000”. Dni, w których tu wchodzimy, to „30, 50, 55, 40, 60, 35, 30, 50 i 40”, a także kolumna „dis_amount” zawiera „1000, 2300, 1000, 1200, 2500, none, 1400, 1600 i 0 ”.
Teraz musimy zmienić tę listę na ramkę danych. Aby przekonwertować listę na DataFrame, używamy „PD.DataFrame () ”Funkcja i nazwij ramę danych„ Summer_course_df ”. Tutaj renderujemy „Summer_course_df”. Zmienna „Summer_course1” jest inicjowana przy użyciu techniki „grupy ()”, aby wyniki grupowania zostały zapisane. Metoda „grupy ()” jest następnie stosowana do kolumny „podmiot”.
W rezultacie zostaną utworzone grupy oparte na podobnych nazwach. Funkcja „sum ()” jest następnie wykorzystywana do obliczenia suma grup badanych, które zostały właśnie utworzone. Ta „sum ()” oblicza sumę opłat, dni i kwot rabatowych dla tych samych przedmiotów. Chcemy również wyświetlić wynik zapisany w „Summer_course1”, więc ponownie skorzystamy z funkcji „print ()”.
Tutaj możesz zauważyć, że renderuje wszystkich przedmiotów osobno w pierwszej ramce danych. Następnie łączy te same tematy lub tworzy grupy o tych samych nazwach, a także wyświetla ten sam temat nazwy. Stosuje funkcję sumy do kolumn Sub_fee, Days i Dis_amount o tych samych nazwach i czyni ich kwoty tutaj.
Przykład nr 04:
W tym kodzie używamy ramki danych poprzedniego przykładu, ale tutaj wykonujemy funkcję „GroupBy ()” w wielu kolumnach. Przekazujemy dwie nazwy kolumn do funkcji „Groupby ()”, które są „podmiotem” i „dni”. Następnie umieść „sum ()”, który wykona sumowanie grup, które są tutaj tworzone i zapisz je w zmiennej „Summer_courses2”. Następnie na końcu renderujemy „Summer_courses2”.
Ten wynik pokazuje, że wykonuje funkcję „GroupBy ()” zarówno w kolumnach „podmiot”, jak i „dni” i renderuje wynik tutaj po grupowaniu.
Wniosek:
Możesz skorzystać z tego przewodnika, aby zbadać, jak korzystać z funkcji „grupy ()” w „Pandy”, a także dowiedzieć się o składni tej metody „grupy ()” tutaj. Naszym głównym celem jest podanie zwięzłego i zrozumiałego wyjaśnienia idei metody „grupy ()” w „Pandy”. Wyjaśniliśmy, że ta metoda pomaga nam w tworzeniu grup w zależności od określonych kryteriów. Zrobiliśmy cztery przykłady w tym przewodniku, w którym tworzymy grupy, wykorzystując metodę „GroupBy ()” w „Pandy”. Po przeczytaniu tego samouczka będziesz mieć skromny stopień wiedzy, z którego możesz awansować do doskonałego etapu.