Pandas Groupby Sum

Pandas Groupby Sum
Pandy zapewnia różnorodne pomocne możliwości, które pomogą nam w przekształceniu danych w pożądany format. Jednym z nich jest funkcja grupy, która dzieli rzędy ramki danych na grupy na podstawie wartości poszczególnych kolumn. Pandy są najlepszym narzędziem w tej sprawie, ponieważ mogą obsługiwać nieprzewidywalny charakter rzeczywistych danych. Metoda „Groupby ()” Pythona dla pandy jest wyrafinowanym i przydatnym narzędziem. Umożliwia podzielenie danych na kilka grup i uruchomienie obliczeń w celu dokładniejszej analizy.

Metoda pandas sum ()

Suma wartości dla osi wymaganej przez użytkownika jest zwracana przez funkcję sum (). Jeśli wartość wejściowa jest osiem indeksującym, wszystkie wartości w tej kolumnie są dodawane. Dotyczy to wszystkich kolumn. Powoduje to serię zawierającą sumę wartości każdej kolumny. Możesz bezpośrednio użyć metody pandas sum () na wybranych kolumnach z wyjścia grupy pandas, aby uzyskać sumę lub sumę każdej grupy. Ta metoda przedstawia sumę wierszy i kolumn wejścia.

Metoda Pandas Groupby Sum ()

Istnieje kilka następujących kroków, aby znaleźć pandas grupę sum ():

  • Utwórz danych, który jest dwuwymiarowy, możliwy do rozmiaru i może zawierać duże zestawy danych.
  • Wyświetl wejście DataFrame, DF.
  • Za pomocą DF. Groupby sum (), znajdź grupę sum (). Ta funkcja sortuje wartości w danej kolumnie. Wartości innych kolumn są następnie sortowane w zależności od sortowanych wartości.
  • Suma dla grupy.

Składnia dla metody grupy sum ()

Ta podstawowa składnia służy do obliczenia suma wartości w funkcji grupy SUM ().

Przykład 1: Utwórz obiekt grupy za pomocą DataFrame

Potrzebujemy oprogramowania lub narzędzi, aby dać nam platformę, na której możemy uruchomić ten program, aby zastosować przykładowe kody Pythona. W ten sposób używane jest narzędzie „Spyder”. Musimy otworzyć nowy plik, gdy pojawi się interfejs. W interfejsie narzędzi „Spyder” wybraliśmy opcję „Nowy plik” do wykonania kodu. Daje nam również dodatkowe opcje otwierania plików. Dlatego możesz go również otworzyć za pomocą „Ctrl+N”.

Musimy zaimportować te „pandy jako PD”, aby uruchomić kod Panda. Sekcja „PD” kodu instruuje Pythona, aby przypisał panel pandę „PD.Ramka danych.GroupBy () ”jako nazwa funkcji jako DataFrame„ GroupBy () ”. Korzystając z GroupBy, grupujemy Pandas DataFrame. Funkcja Groupera wybiera wymaganą kolumnę. Korzystając z mapera lub zestawu kolumn, funkcja GroupBy () grupuje ramkę danych i zwraca obiekt GroupBy. Duże ilości danych w tych grupach można łączyć lub przekształcić, stosując różne metody i funkcje niestandardowe do obiektów grupy.

Utworzyliśmy ramkę danych, której rozmiar to „6, 2”, a jej nazwy kolumn to „alfabet” i „wartość”. W tym przykładzie zmienne, które mamy, to „K”, „L” i „M”, a ich wartości to „36”, „21”, „42”, „8”, „9” i „3”. Aby zastosować funkcje agregatów, metoda „grupy ()” Pandas grupuje podobne dane w grupę. Ta metoda zwraca obiekt grupy DataFrame, który ma łączne metody, takie jak suma i inne podobne. „Df.GroupBy ([„Alphabet”] ”, na przykład, dodaje wszystkie kolumny wartości w ramce danych razem i oblicza ich sumy. Użycie „grupy.hrabia () ”Metoda otrzymania liczby dla każdej grupy, ignorując wartości Brak i Nan, aby zgrupować wiersze według kolumny. Ponadto funkcjonuje z danymi typu nie pływających. Z liczbami wartości dla każdej grupy w grupie, skonstruuj nową serię lub ramkę danych.

W tym kodzie użyliśmy „grupy.suma()". Ta funkcja sortuje wartości w danej kolumnie. Wartości innych kolumn są następnie sortowane w zależności od sortowanych wartości. To tworzy tabelę, której nazwy kolumn to „alfabet” i „wartości” alfabetu, który jest napisany poniżej alfabetu i pisze ich wartości przed nimi. Korzystając z „grupy.sum () ”, podobne alfabety łączą swoje wartości i sprawiają, że suma. Korzystając z „grupy.sum () ”, podobne alfabety łączą swoje wartości i sprawiają, że suma.

Po uruchomieniu kodu pokazał swój wynik, w którym „grupa.count () ”Funkcja utworzyła tabelę, zliczając„ alfabety ”i„ wartości ”. W następnym wierszu zbiera podobne alfabety i podsumowuje ich grupy za pomocą „grupy.sum () ”funkcja. Teraz wartość „K” to „99”, wartość dla „L” to „17”, a wartość dla „M” wynosi 3.

Przykład 2: Znajdź i sumuj prędkość niektórych zwierząt za pomocą funkcji grupy SUM ()

Ten scenariusz jest również porównywalny z pierwszym. Do funkcji, które użyliśmy w poprzednim przykładzie, używamy tego samego w tym kodzie. W tym celu stworzyliśmy ramkę danych, która ma dwie kolumny. Nazwa jednej kolumny to „zwierzę”, a druga to „prędkość”.

W tym kodzie mamy również te same funkcje, które mieliśmy w poprzednim programie - „grupa.hrabia () ”i„ grupa.suma()". Sumę każdej grupy można uzyskać za pomocą metody pand „sum ()” bezpośrednio na wybranych kolumnach z wyjścia grupy PandaS. DataFrame reprezentuje funkcję Pandas DataFrame. Na liście zwierząt wzięliśmy trzy zwierzęta - „małpę”, „Lion” i „Tiger”. W drugiej kolumnie napisaliśmy ich prędkość. Rzeka danych jest podzielona na grupy przy użyciu metody „DataFrame Groupby ()”. Oblicza liczbę podobnych zliczeń danych, które są obecne w określonej kolumnie DataFrame.

Za pomocą „DF.GroupBy () ”, obiekt jest podzielony, zastosowana jest funkcja, a produkty są łączone. Duża ilość danych można zgrupować za pomocą tego, a operacje można obliczyć w tych grupach. Możesz zgrupować swoje dane za pomocą metody „grupy ()” i wykonywać operacje w tych grupach. Grupa.Count () ”Funkcja zwraca całkowitą liczbę wartości nie-nan. Rama danych jest zwracana, jeśli istnieje wiele kolumn. Liczenie jest najprostszą podstawową techniką łączącą. Zastosowanie funkcji hrabia pand do całego zwierząt Szybko ujawnia, ile „małp”, „lwów” i „tygrysów” jest tam w grupie „zwierząt”.

Sprawdź wyniki pliku źródłowego, uruchom ten kod i podaj wiarygodne dane wyjściowe. To wyjście wyświetla trzy tabele za pomocą trzech różnych funkcji. Jeśli policzymy prędkość trzech „małp”, będzie to „105”. Prędkość dwóch „lwów” to „160”, a prędkość jednego „tygrysa” to „65”.

Wniosek

Biorąc pod uwagę te informacje, ten artykuł służy jako przykład pomysłu i konieczności uproszczenia rzeczy dla Ciebie. Zdefiniowaliśmy tutaj dwie funkcje. To są aplikacje dla „grupy.sum () ”i„ grupa.liczba ”funkcji w pandy. Prawdopodobnie możesz zrozumieć, jak niesamowita i pomocna „grupa.sum () ”i„ grupa.Count () ”Funkcje służą do zbadania danych. W tym samouczku widzieliśmy, jak połączyć te same dane za pomocą „DF.grupa ”i podsumowanie. Zapewniliśmy temu przewodnika dobre i proste wyjaśnienie wszystkich metod, dzięki czemu łatwiej jest uzyskać nasz punkt. Możesz wybrać jedną z dwóch dostępnych technik opartych na twoich potrzebach, ale opanowanie obu jest niezbędne i dlatego poprawia umiejętności Python Pandy.