Jaka jest metoda wartości_counts () w Pythonie?
Unikalne wartości obiektu pandas są liczone za pomocą metody wartości (). W Python zasadniczo stosujemy tę technikę do sprzątania danych, a także do eksploracji danych.
Metoda Value_Counts () może działać z różnymi obiektami pandas. Kolumny Pandas Series, Pandas DataFrame i DataFrame to ich przykłady (które są obiektami serii pandas).
Jednak w zależności od rodzaju obiektu, z którym pracujesz, sposób, w jaki zaimplementujesz metodę wartości_counts (), będzie się nieznacznie różnić.
Inne opcjonalne argumenty można użyć do zmiany funkcjonalności metody wartości_counts ().
Składnia funkcji Pandas Series ()
W serii pandy najczęstszą wartością jest po prostu tryb serii. Metoda Pandas Series Mode () służy do pozyskiwania informacji o trybie. Składnia jest następująca. Tryby serii są zwracane w sortowanej kolejności.
# df [„kolumna”].tryb()Składnia funkcji pandas value_counts ()
Aby pobrać najwyższą wartość liczby, użyj funkcji Pandas value_counts () i idxmax (). Składnia jest następująca:
# df [„kolumna”].value_counts ().idxmax ()Teraz spójrzmy na niektóre praktyczne przykłady, aby zobaczyć, w jaki sposób możesz osiągnąć najczęstsze wartości, wykonując kroki.
Przykład 1:
Najpierw musimy ustalić ramkę danych przed przejściem do kroków określania najczęstszej wartości z trybem (). To jest ramka danych z polem kategorii, którego użyjemy do reszty samouczka. Frame „D_Frame” zawiera nazwy („Kim”, „Kourtney”, „Scott”, „Rob”, „Kendall”, „Gathie”, „Phill”) i Informacje zespołu („A”, „B”, ',', ',', ',', ',', ',', ',', ',', ',', ',', ',', ',', ',', ',', ',', ',', ',', 'b', ',', 'b', ' C ', „d”, „e”, „a”, „b”, „a”, „b”, „a”). Kolumna „Zespół” DataFrame to pole kategorii z wartościami oznaczającymi zespół przypisany każdemu uczniowi.
Moduł panda jest importowany na początku kodu w poniższym kodzie referencyjnym. Następnie generowany jest i prezentowany na ekranie.
importować pandyNa poniższym zdjęciu nazwiska uczniów są wyświetlane razem z nazwą zespołu, do której zostały przypisane.
Pokazamy, jak korzystać z funkcji tryb (), aby określić najczęstszą wartość. Tryb, który jest statystyką opisową, jest zasadniczo najczęstszą wartością w zestawie danych. Daje ci informacje o zespole, który ma najwięcej studentów.
Najpierw zaimportowaliśmy moduł panda i wygenerowaliśmy ramkę danych, jak widać w kodzie. Nazwiska uczniów i zespołu są zawarte w DataFrame.
importować pandyDaje serię pandy oraz tryb kolumny. Ponieważ „A” i „B” są najczęstszymi wartościami w polu „Team”, otrzymujemy „A” i „B” jako tryb.
Należy pamiętać, że możesz zdobyć tryb każdej kolumny w PandaS DataFrame za pomocą metody tryb ().
Przykład 2:
Pokażemy, jak używać wartości_counts (), aby uzyskać najczęstszą wartość w tym przykładzie. Do uzyskania liczby można użyć funkcji wartości_counts (.
Reszta kodu, z wyjątkiem ostatniego wiersza, jest identyczna z powyższym. Pokazuje, w jaki sposób funkcja (wartość_counts) jest używana do znalezienia wartości o najwyższej liczbie.
importować pandyZobacz wynikowy ekran poniżej. Otrzymujemy wartość w kolumnie „Zespół” z maksymalną liczbą wartości.
Przykład 3:
Ten przykład pokaże, co się stanie, jeśli ramka danych zawiera najczęściej występujące wartości. Zmieńmy ramkę danych, aby kolumna „zespołu” zawierała powtarzane tryby. Zmieniamy wartość „Rob” z „D” na „B” tutaj.
importować pandyMamy teraz powtarzające się tryby, jak widać. „A” pojawia się dwa razy w kolumnie „zespołu” w naszym scenariuszu.
Nazwa zespołu studenta „Rob” została zmieniona z „D” na „A” na obraz towarzyszący.
Przykład 4:
Zobaczmy, co zwracają metody wartości () i idxmax (). Zaktualizowaliśmy wartościFrame DataFrame w tym przykładowym kodzie. Zauważ, że zespół „A” i „B” pojawiają się dwa razy. Następnie wykorzystaliśmy wartość.Funkcje Counts () i IdXmax () w celu ustalenia najczęstszej wartości w ramce danych. Oto kod referencyjny.
importować pandyZauważ, że nawet jeśli występuje wiele trybów, ta metoda zwraca tylko jedną wartość. Stało się tak, ponieważ funkcja idxmax () zapewnia tylko jeden wynik - „Jeśli wiele wartości pasuje do maksimum, tytuł jednego rzędu z tą wartością jest zwracany.„Aby odzyskać najczęstszą wartość w serii pandy, musisz zastosować funkcję„ Mode () ”Pandas Series.
Wniosek:
W tym artykule przyjrzeliśmy się, jak znaleźć najczęstszą wartość w kolumnie lub serii pandas przy użyciu niektórych przykładów. Omówiliśmy różne funkcje, które można wykorzystać do osiągnięcia tego celu. Tryb (), wartość () i idxmax () to niektóre z tych metod. Jeśli jesteś nowy w tej koncepcji i potrzebujesz przewodnika krok po kroku po rozpoczęciu pracy, nie idź dalej niż ten artykuł.