Przykładowe dane
Przed omówieniem, jak określić liczbę unikalnych wartości w ramce danych, będziemy potrzebować przykładowych danych.
Przykładowy kod pokazano poniżej:
# Importuj pandyPowyższy kod powinien utworzyć przykładową ramkę danych, której możemy użyć w tym samouczku. Powstała forma tabelaryczna danych jest taka jak pokazano:
#1 Pandy Unikalna metoda
Funkcja unikalna () jest pierwszą metodą, której możemy użyć do określenia liczby unikalnych wartości w ramce danych.
Funkcja przyjmuje serię jako wejście i zwraca listę unikalnych wartości.
Na przykład, aby obliczyć unikalne elementy w kolumnie pensji, możemy zrobić:
Wydrukuj (PD.unikalny (df [„pensja”]))Kod powyżej powinien zwrócić unikalne elementy w kolumnie „wynagrodzenie”.
[120000 100000 90000 110000 56000]Jeśli chcesz liczby unikalnych wartości, możesz uzyskać długość listy, jak pokazano:
Drukuj (f „unikalne elementy: len (PD.unikalny (df ['pens'])) ")Kod powyżej powinien zwrócić:
Unikalne przedmioty: 5#2 Funkcja Pandas Nunique
Funkcja Nunique () pozwala uzyskać liczbę unikalnych wartości wzdłuż określonej osi.
Przykładem jest jak pokazano:
drukuj (f "[liczba unikalnych elementów/kolumny] \ n df.Nunique (axis = 0) ")Kod powyżej powinien zwrócić liczbę unikalnych elementów w każdej kolumnie. Powstałe wyjście jest jak pokazano:
[Liczba unikalnych elementów/kolumny]Możesz także pobrać liczbę unikalnych elementów w określonej kolumnie, jak pokazano:
Wydrukuj (DF.wynagrodzenie.nunique ())Powyższe powinno zwrócić liczbę unikalnych elementów w kolumnie pensji.
#3 pandas value_counts ()
Pandy zapewnia nam również funkcję wartości_count (). Ta funkcja zwraca liczbę unikalnych wartości w określonej kolumnie.
Przykładem jest jak pokazano:
res = lista (df.wynagrodzenie.value_counts ())Funkcja wartości_counts () zwraca liczbę każdej wartości w kolumnie. Następnie konwertujemy wynik na listę i otrzymujemy długość.
Powinno to uzyskać liczbę unikalnych elementów w kolumnie:
Unikalne przedmioty: 5Wniosek
W tym artykule omówiono różne metody i techniki, których możemy użyć do określenia liczby unikalnych wartości w PandaS DataFrame.