Pandas Agg

Pandas Agg
„Pandy” zapewnia funkcję „agg ()”. Korzystając z funkcji „agg ()”, możemy użyć różnych funkcji. Jest wykonywany na osi indeksu wiersza, który jest automatycznie wstawiany do ramki danych. Domyślne zachowanie funkcji Numpy „agg ()” (średnia, mediana, sum, sum, std, var), które oceniają Agg () spłaszczonej tablicy, różni się od tego zachowania. Możemy dodać dane za pomocą funkcji agg (). W tym przewodniku wykorzysta funkcję „Pandas agg ()” i pokaże funkcjonowanie tej funkcji „agg ()” w „pandach”.

Składnia

Składnia tej funkcji to:

#ramka danych.AGG (FUNC, AXIS, ARGS, KWARGS)

Przykład nr 01

Mamy aplikację „Spyder” do wykonywania naszych kodów „pandy”. Opracowując kod „Pandy”, musimy „zaimportować” metody „pandy” jako „PD”. Ten „PD” pozwala nam uzyskać dostęp do metod lub funkcji „pandy”, dodając „PD” zamiast „pandy”. Generujemy dane i przechowujemy je w „Data1”. Piszemy „x1” i w „x1”. Dodajemy „60”, „50” i „40”. Mamy w nim „Y1” i dodajemy „900”, „1212” i „51”. Umieszczamy również „Z1”. W tym wstawiamy „200”, „300” i „800”. Zmieniamy ten „Data1” na „DataFrame” i piszemy „PD” z „DataFrame”, aby wspierać nas w dostępie do tej funkcji „pandy”.

Przekazujemy „dane 1” jako parametr „PD.Ramka danych ()". Generuje dla nas „DataFrame”, a także używa zmiennej tutaj „DFA”, która przechowuje w niej tę ramkę danych. Następnie dodajemy „Drukuj (DFA)”, aby to renderować. Below, we utilize the “agg ()” function for performing some operations on this DataFrame. Stosujemy „sumę” w tej funkcji „agg ()”. Wynik, który uzyskujemy po przechowywaniu suma w zmiennej „Ans”. Drukujemy również tę sumę, umieszczając „print ()”.

Wklejamy również wyjście tutaj. Wyjście to jest wyodrębnione na terminalu „Spyder”, naciskając „Shift+Enter”. Najpierw wyświetla dane, gdy są wkładane do kodu i dodaje wartości „x1”, a następnie wyświetla się w poniższym „x1”. Wartości „Y1” są również dodawane, a wynik jest wyświetlany w kolumnie „Y1”. Wreszcie, operacja sumy jest również wykonywana na wartościach „Z1”. Wynik po podsumowaniu jest renderowany w kolumnie „Z1”.

Przykład nr 02

Produkujemy ramkę danych po zaimportowaniu „pandy” jako „PD”. Rama danych nazywa się „Dane”. Najpierw wprowadzamy trzy wiersze i dodajemy „9, 8, 7” do pierwszego rzędu; „4, 5, 6” do drugiego rzędu; a także „1, 2, 3” do trzeciego rzędu. Następnie wstawiamy nazwę nagłówka do każdej kolumny, wykorzystując słowo kluczowe „kolumny”. Przypisujemy „A1” jako nagłówek pierwszej kolumny. „A2” jako nagłówek drugiej kolumny. I „A3” dla trzeciej kolumny. Drukujemy „dane” na terminalu aplikacji Spyder.

Nazwa „Dane” umieszczamy metodę „agg ()” z tym „danymi”. Mamy dwie funkcje, które chcemy zastosować do ramki danych: „suma” i „min”. „Suma” doda liczby każdej kolumny osobno. „Min” znajdzie minimalną wartość kolumny. Następnie będzie przechowywać sumę i wartość minuta w „wyniku”, który stworzyliśmy. Wreszcie, wydrukuje „wynik”, ponieważ włożyliśmy również „wydruk”.

Suma kolumny „A1” to „14”, a minimalna wartość tej kolumny to „1”. Suma drugiej kolumny „A2” to „15”. Jego minimalna wartość to „2”. Suma ostatniej kolumny „A3” to „16”, a minimalna wartość, którą mamy dla tej kolumny, to „3”, która jest wyświetlana.

Przykład nr 03

Powtarzamy pierwszy wiersz w tym przykładzie i konstruujemy „Informacje” DataFrame. Następnie umieść dane w wierszach jako „3, 8, 7” jest tutaj włożone do pierwszego rzędu. „4, 1, 6” i „7, 2,3” są wstawiane odpowiednio do drugiego i trzeciego wiersza. Przypisujemy również niektóre nazwy indeksu do wszystkich kolumn jako „col1”, „col2” i „col3” odpowiednio dla pierwszej, drugiej i trzeciej kolumny. Renderujemy te „informacje” za pomocą „drukuj”. Stosujemy różne agregacje do kolumn.

W metodzie „agg ()” wymieniamy nazwę kolumny, a następnie umieszczamy operację, którą chcemy zastosować do tej wspomnianej kolumny. Jeśli chodzi o „col1”, używamy operacji „suma” i „min”. W „col2” stosujemy operacje „min” i „max”. Ale nie wspominamy o „col3”, więc żadna funkcja AGG nie jest stosowana do „col3”. Używamy również zmiennej „ostatecznej” do przechowywania tego wyniku, a następnie renderowania.

„Suma” i „min” są stosowane do „col1”, ale w „Max” drukuje „nan”, ponieważ nie zastosowaliśmy „maks.” Do tego „col1”. Następnie są tutaj „min” i „maksymalne” wartości „col2”, ale blok suma zawiera „nan”, ponieważ stosujemy tylko „maks.” I „min” do tego „col2”. „Col3” nie ma tutaj, ponieważ nie zastosowaliśmy żadnej metody „agg ()” do tego „col3”.

Przykład nr 04

Stosujemy różne funkcje w kolumnach, a także aktualizujemy nazwę indeksu po wyniku. W tym celu zbudowaliśmy „surowe dane” danych i mamy trzy rzędy zawierające niektóre liczby, które są „22, 82, 27” w pierwszym rzędzie; „14, 23, 36” tutaj w drugim rzędzie; i „77, 29, 34” jest w trzecim rzędzie. Nazwy dodanych kolumn to „Data1”, „Data2” i „Data2”. Poniżej mamy metodę „print ()”.

Teraz wykorzystujemy metodę „agg ()” „pand” i ustawiamy „x”, która służy do zmiany nazwy indeksu wiersza po zastosowaniu funkcji agregacji na kolumnę „Data1”. Stosujemy funkcję „maks.” Do „Data1”. Wybieramy „Y”, aby zastąpić nazwę indeksu wiersza po wykonaniu funkcji agregacji. Aby „Data2”, stosujemy funkcję „min”. W „Data3” umieszczamy funkcję „Mean” i ustawiamy nazwę indeksu wiersza na „Z”, która została zastąpiona po zastosowaniu funkcji agregacji. Następnie mamy również „print ()”, więc „obliczenia” zostaną dla nas wyświetlone.

W „Data1” zastosowano tylko funkcję „maks.”, A pozostałe dwie wartości to „NAN”. Ponadto wartość indeksu jest zmieniana na „x”. Kolumna „Data2” po prostu wyświetla wynik funkcji „min”, a pozostałe wartości to „NAN”, a jej nazwa wiersza to „Y”. Teraz jedyna średnia jest stosowana do „Data3”, a jego indeks wierszy jest zmieniany na „Z”.

Wniosek

Ten przewodnik dotyczy funkcji „AGG” w „Pandy”. Wyjaśniliśmy, że funkcja „AGG”, która jest używana w pandy do stosowania różnych funkcji. Ustanowiliśmy cztery instancje, do których zastosowaliśmy metodę „AGG”.

.