Pandas Groupby Max

Pandas Groupby Max
„Panda” to biblioteka Python. „Grupa” służy do grupowania danych składających się z jednej lub więcej niż jednej kolumny według kategorii dostarczających etykiety dla każdego mapowania grupy. W Pandas Python DataFrame, jeśli chcesz znaleźć wartość „maks.” Określonej grupy, możesz to zrobić po prostu za pomocą funkcji „grupa by () i max ()”. Pomaga to znaleźć maksymalne wartości bez zgiełku jak w firmach; Dane są na ogromnej skali, która staje się trudna do obsługi ręcznego. Co jeśli chcesz znaleźć określony obszar z całych danych? Trudno jest wykonać statystyki samodzielnie. Zatrzymuje dużo czasu, a także cierpliwość konkretnego, więc zamiast tego użyj funkcji Groupby Max w PandaS DataFrame. W Pandas Python DataFrame, jeśli chcesz znaleźć wartość „maks.” Grupy, możesz to zrobić po prostu za pomocą funkcji „grupa by () i max ()”."

Składnia
# df.GroupBy („kolumn_nazwa”).Max ()

„DF” reprezentuje tutaj ramkę danych, grupa śledzona z nazwą kolumny, w której musisz napisać nazwę kolumny, nad którą chcesz popracować. „Max” napisane na końcu, dotyczy wykrywania wartości maksymalnych w kolumnie wybranej z „DF."

Groupby Max z pojedynczych i wielu kolumn w pandy można wykonać na różne maniery. Zróbmy je jeden po drugim.

Omówimy i omówimy wszystkie następujące sposoby:

  • Groupby Max - Pojedyncza kolumna
  • Groupby Max - wiele kolumn
  • Groupby Max - przy użyciu funkcji PIVOT
  • Groupby Max - przy użyciu funkcji agregacji
  • Groupby Max - za pomocą funkcji RESET_INDEX (jedno i wiele kolumn oba)

Tworzenie ramki danych do wdrożenia funkcji GroupBy Max

Najpierw utwórzmy ramkę danych, aby zastosować funkcje i jasno zrozumieć każdą metodę. „DF” „DF” składa się z miast, produktów i ich sprzedaży. Potrzebujemy narzędzia Pythona, aby uruchomić nasze kody. Tutaj używane oprogramowanie jest Spyder do wdrożenia. Musisz najpierw pobrać go bezpośrednio z Google, spełnić wymagania instalacyjne po procesie instalacji i uruchomić narzędzie. Otwórz plik i rozpocznij wykonywanie kodu, co jest łatwe. Opis wszystkich sposobów korzystania z kodu Groupby Max Panda Python jest zdefiniowany krótko w poniższych przykładach.

W domenie Pythona pandy jako „PD” i Numpy jako „NP” to biblioteki zaimportowane w przykładowym kodzie. Numpy jest używany do danych numerycznych w Pythonie, podczas gdy pandy są używane do interpretacji danych.

Korzystając z poniższego wiersza kodu, będziemy pracować nad każdym z przykładów obejmujących:

# df1 = pd.DataFrame (dane, kolumny = [„miast”, „produkty”, „sprzedaż”])

Zgodnie z ramką danych kolumny to miasta, produkty i ich sprzedaż; Podobnie składnia składa się ze wszystkich trzech w reprezentacji kolumny.

Kod powinien wyglądać tak na ekranie konsoli.

Wyjście pokazuje listę kolumn składających się z miast, produktów i brak sprzedaży. Pokazuje również numer seryjny.

Przykład nr 01: Groupby Max Pandas - Pojedyncza kolumna

Rozpoczynając praktyczną implementację pojedynczej kolumny Groupby Max za pomocą kodu Pythona w PandaS DataFrame, potrzebujemy określonego narzędzia i do tego będziemy używać Spyder, jak wspomniano wcześniej w powyższym opisie. Teraz, po otwarciu Spyder na laptopie/komputerach stacjonarnych, potrzebujesz rozszerzenia pliku jako „.py ”jest to odniesienie do Pythona, ponieważ nasz kod jest w języku Python.

Rozpoczynając część kodu, istnieje słowo panda, które jest również pierwszym słowem naszego artykułu, więc oznacza to, że coś z biblioteką pandy powinno być do tego zaimplementowane; Musimy napisać „Panda” jako „PD”, która zaimportuje wszystkie funkcje biblioteki Panda w naszym pliku roboczym.

Grupa z pojedynczą kolumną Max działa, wywołując „Groupby ()” i pisząc nazwę kolumny, którą chcesz z ramki danych, która jest „miastami” w „DF”, a następnie wybór pola dla maksymalnego oszacowania „Max () ”Funkcja.

Wyjście to „miasta” z pojedynczą kolumną, jak wybieraliśmy, pokazując maksymalne wartości każdego.

Przykład nr 02: Groupby Max Pandas - Wiele kolumn

Teraz otwórz nowy plik przykładowy implementacja wielu kolumn w Groupby Max, ponieważ można znaleźć maksymalną wartość każdej grupy odnoszącej się do różnych kolumn z „DF” w Pandas Groupby Max. Wybierz kolumny; Tutaj możesz wybrać więcej niż jedną kolumnę, ponieważ podnosi wiele kolumn z „DF” zgodnie z potrzebami.

Kod zastosowany dla wielokrotnego maxa jest:

Wyjście, jak widać, wyświetla maksymalne wartości obu kolumn.

Przykład nr 03: Groupby Max Pandy - za pomocą funkcji PIVOT

Ponownie, otwieranie nowego pliku dla działającego przykładu funkcji PIVOT w Groupby Max Pandas. Funkcja Pivot () polega na zorganizowaniu „DF” w ładnej reprezentowalnej formie. Możesz nad tym pracować z pojedynczą lub wieloma kolumnami, jak chcesz. Tutaj implementacja znajduje się na wielu kolumnach grupy, ale jeśli chcesz wykonać jedną kolumnę Pivot Groupby Max Panda, musisz dodać jedną kolumnę w grupie () dodaj zamiast wielu kolumn; Możesz również uzyskać prostą reprezentację kolumny.

Kod Pivot () w kodzie MAX Groupby to:

Korzystając z funkcji PIVOT (), wyświetlacz wyjściowy wygląda jak osiedlone osoby.

Przykład nr 04: Groupby Max - przy użyciu funkcji agregatów

Musisz otworzyć kolejny plik z pliku i przejść do nowego pliku. Teraz szukamy przykładu przy użyciu funkcji agregatów w grupie przez Max Pandy. Funkcja łączna w kodzie, którą piszemy jako agg (), działa, biorąc „maks.” Jako wejście, które wykona MAX GroupBy w „DF” i stworzy określoną strukturę „DF”.

Grupa funkcji agregatów Max Panda dla kodu wielu kolumn to:

Funkcja agg () umożliwia wszystkie agregacja kolumny z wartościami maksymali.

Przykład nr 05: Groupby Max - Za pomocą funkcji RESET_INDEX (dla pojedynczych i wielu kolumn)

Wskaźnik resetowania według nazwy wyjaśnia, że ​​jego funkcja resetuje indeks, a także zapewni nowy indeks do ramki danych, czyniąc go bardziej odpowiednią strukturą.

Kod dla funkcji RESET_INDEX Pojedyncza kolumna w Pandaas to:

Tutaj resetowanie „df” odbywa się za pomocą funkcji RESET () wybranej kolumny, czyli miast pokazujących wartości maksymalne.

W przypadku wielu kolumn reset_function w pandy kod to:

Wyjście wyświetla obie kolumny resetujące „df” w pandy za pomocą grupy reset () MAX.

Wniosek

Funkcja Panda Groupby Max jest bardzo pomocna i uproszczona. Ponieważ może wykryć maksymalną wartość wyboru kolumny za pomocą „.funkcja max () ”i może obliczyć maks. wartości w ramce danych. W tym artykule wyjaśniliśmy wszystkie metody, za pomocą których działa max () funkcja grupa (), i.mi., Groupby Max na pojedynczych i wielu kolumnach, a możemy zresetować indeks obu z nich, podobnie jak agregat i funkcja obrotowa działająca zgodnie z najlepszym wyjaśnieniem z przykładami dla lepszego zrozumienia. Każda część tego samouczka podkreśla łatwe zrozumienie i wyczyszczenie koncepcji.