Pandy otrzymują najczęstszą wartość

Pandy otrzymują najczęstszą wartość
Celem tego artykułu jest pokazanie najczęstszej wartości w zestawie liczb. Podsumowując liczbę razy, gdy pojawia się element lub liczba, używana jest funkcja Pythona Value_Counts (). Metodę trybu () można następnie zastosować do uzyskania najczęściej występującego elementu. Jeśli chcesz różne sposoby uzyskania najczęstszych wartości w Pythonie, ten artykuł zawiera wszystkie wytyczne.

Jaka jest metoda wartości_counts () w Pythonie?

Unikalne wartości obiektu pandas są liczone za pomocą metody wartości (). W Python zasadniczo stosujemy tę technikę do sprzątania danych, a także do eksploracji danych.

Metoda Value_Counts () może działać z różnymi obiektami pandas. Kolumny Pandas Series, Pandas DataFrame i DataFrame to ich przykłady (które są obiektami serii pandas).

Jednak w zależności od rodzaju obiektu, z którym pracujesz, sposób, w jaki zaimplementujesz metodę wartości_counts (), będzie się nieznacznie różnić.

Inne opcjonalne argumenty można użyć do zmiany funkcjonalności metody wartości_counts ().

Składnia funkcji Pandas Series ()

W serii pandy najczęstszą wartością jest po prostu tryb serii. Metoda Pandas Series Mode () służy do pozyskiwania informacji o trybie. Składnia jest następująca. Tryby serii są zwracane w sortowanej kolejności.

# df [„kolumna”].tryb()

Składnia funkcji pandas value_counts ()

Aby pobrać najwyższą wartość liczby, użyj funkcji Pandas value_counts () i idxmax (). Składnia jest następująca:

# df [„kolumna”].value_counts ().idxmax ()

Teraz spójrzmy na niektóre praktyczne przykłady, aby zobaczyć, w jaki sposób możesz osiągnąć najczęstsze wartości, wykonując kroki.

Przykład 1:

Najpierw musimy ustalić ramkę danych przed przejściem do kroków określania najczęstszej wartości z trybem (). To jest ramka danych z polem kategorii, którego użyjemy do reszty samouczka. Frame „D_Frame” zawiera nazwy („Kim”, „Kourtney”, „Scott”, „Rob”, „Kendall”, „Gathie”, „Phill”) i Informacje zespołu („A”, „B”, ',', ',', ',', ',', ',', ',', ',', ',', ',', ',', ',', ',', ',', ',', ',', ',', 'b', ',', 'b', ' C ', „d”, „e”, „a”, „b”, „a”, „b”, „a”). Kolumna „Zespół” DataFrame to pole kategorii z wartościami oznaczającymi zespół przypisany każdemu uczniowi.

Moduł panda jest importowany na początku kodu w poniższym kodzie referencyjnym. Następnie generowany jest i prezentowany na ekranie.

importować pandy
d_frame = pandy.Ramka danych(
„Nazwa”: [„Kim”, „Kourtney”, „Scott”, „Rob”, „Kendall”, „Gathie”, „Phill”],
„Zespół”: [„A”, „B”, „C”, „D”, „E”, „A”, „B”]
)
Drukuj (d_frame)

Na poniższym zdjęciu nazwiska uczniów są wyświetlane razem z nazwą zespołu, do której zostały przypisane.

Pokazamy, jak korzystać z funkcji tryb (), aby określić najczęstszą wartość. Tryb, który jest statystyką opisową, jest zasadniczo najczęstszą wartością w zestawie danych. Daje ci informacje o zespole, który ma najwięcej studentów.

Najpierw zaimportowaliśmy moduł panda i wygenerowaliśmy ramkę danych, jak widać w kodzie. Nazwiska uczniów i zespołu są zawarte w DataFrame.

importować pandy
d_frame = pandy.Ramka danych(
„Nazwa”: [„Kim”, „Kourtney”, „Scott”, „Rob”, „Kendall”, „Gathie”, „Phill”],
„Zespół”: [„A”, „B”, „C”, „D”, „E”, „A”, „B”]
)
Drukuj (d_frame ['zespół'].tryb())

Daje serię pandy oraz tryb kolumny. Ponieważ „A” i „B” są najczęstszymi wartościami w polu „Team”, otrzymujemy „A” i „B” jako tryb.

Należy pamiętać, że możesz zdobyć tryb każdej kolumny w PandaS DataFrame za pomocą metody tryb ().

Przykład 2:

Pokażemy, jak używać wartości_counts (), aby uzyskać najczęstszą wartość w tym przykładzie. Do uzyskania liczby można użyć funkcji wartości_counts (.

Reszta kodu, z wyjątkiem ostatniego wiersza, jest identyczna z powyższym. Pokazuje, w jaki sposób funkcja (wartość_counts) jest używana do znalezienia wartości o najwyższej liczbie.

importować pandy
d_frame = pandy.Ramka danych(
„Nazwa”: [„Kim”, „Kourtney”, „Scott”, „Rob”, „Kendall”, „Gathie”, „Phill”],
„Zespół”: [„A”, „B”, „C”, „D”, „E”, „A”, „A”]
)
Drukuj (d_frame ['zespół'].value_counts ().idxmax ())

Zobacz wynikowy ekran poniżej. Otrzymujemy wartość w kolumnie „Zespół” z maksymalną liczbą wartości.

Przykład 3:

Ten przykład pokaże, co się stanie, jeśli ramka danych zawiera najczęściej występujące wartości. Zmieńmy ramkę danych, aby kolumna „zespołu” zawierała powtarzane tryby. Zmieniamy wartość „Rob” z „D” na „B” tutaj.

importować pandy
d_frame = pandy.Ramka danych(
„Nazwa”: [„Kim”, „Kourtney”, „Scott”, „Rob”, „Kendall”, „Gathie”, „Phill”],
„Zespół”: [„A”, „B”, „C”, „D”, „E”, „A”, „F”]
)
d_frame.w [3, „Team”] = „B”
Drukuj (d_frame)

Mamy teraz powtarzające się tryby, jak widać. „A” pojawia się dwa razy w kolumnie „zespołu” w naszym scenariuszu.

Nazwa zespołu studenta „Rob” została zmieniona z „D” na „A” na obraz towarzyszący.

Przykład 4:

Zobaczmy, co zwracają metody wartości () i idxmax (). Zaktualizowaliśmy wartościFrame DataFrame w tym przykładowym kodzie. Zauważ, że zespół „A” i „B” pojawiają się dwa razy. Następnie wykorzystaliśmy wartość.Funkcje Counts () i IdXmax () w celu ustalenia najczęstszej wartości w ramce danych. Oto kod referencyjny.

importować pandy
d_frame = pandy.Ramka danych(
„Nazwa”: [„Kim”, „Kourtney”, „Scott”, „Rob”, „Kendall”, „Gathie”, „Phill”],
„Zespół”: [„A”, „B”, „C”, „D”, „E”, „A”, „B”]
)
Drukuj (d_frame ['zespół'].value_counts ().idxmax ())

Zauważ, że nawet jeśli występuje wiele trybów, ta metoda zwraca tylko jedną wartość. Stało się tak, ponieważ funkcja idxmax () zapewnia tylko jeden wynik - „Jeśli wiele wartości pasuje do maksimum, tytuł jednego rzędu z tą wartością jest zwracany.„Aby odzyskać najczęstszą wartość w serii pandy, musisz zastosować funkcję„ Mode () ”Pandas Series.

Wniosek:

W tym artykule przyjrzeliśmy się, jak znaleźć najczęstszą wartość w kolumnie lub serii pandas przy użyciu niektórych przykładów. Omówiliśmy różne funkcje, które można wykorzystać do osiągnięcia tego celu. Tryb (), wartość () i idxmax () to niektóre z tych metod. Jeśli jesteś nowy w tej koncepcji i potrzebujesz przewodnika krok po kroku po rozpoczęciu pracy, nie idź dalej niż ten artykuł.