Liczba pandy wyraźna

Liczba pandy wyraźna
W tym artykule zostanie zbadane różne sposoby i metody określania liczby unikalnych elementów w PandaS DataFrame.

Przykładowe dane

Przed omówieniem, jak określić liczbę unikalnych wartości w ramce danych, będziemy potrzebować przykładowych danych.

Przykładowy kod pokazano poniżej:

# Importuj pandy
importować pandy jako PD
df = pd.Ramka danych(
„Wynagrodzenie”: [120000, 100000, 90000, 110000, 120000, 100000, 56000],
„Departament”: [„Deweloper gier”, „programista bazy danych”, „deweloper front-end”, „programista pełny stos”, „programista bazy danych”, „Security Badacz”, „Cloud-Engineer”],
„Ocena”: [4.3, 4.4, 4.3, 3.3, 4.3, 5.0, 4.4],
index = [„Alice”, „Michael”, „Joshua”, „Patricia”, „Peter”, „Jeff”, „Ruth”])
df

Powyższy kod powinien utworzyć przykładową ramkę danych, której możemy użyć w tym samouczku. Powstała forma tabelaryczna danych jest taka jak pokazano:

#1 Pandy Unikalna metoda

Funkcja unikalna () jest pierwszą metodą, której możemy użyć do określenia liczby unikalnych wartości w ramce danych.

Funkcja przyjmuje serię jako wejście i zwraca listę unikalnych wartości.

Na przykład, aby obliczyć unikalne elementy w kolumnie pensji, możemy zrobić:

Wydrukuj (PD.unikalny (df [„pensja”]))

Kod powyżej powinien zwrócić unikalne elementy w kolumnie „wynagrodzenie”.

[120000 100000 90000 110000 56000]

Jeśli chcesz liczby unikalnych wartości, możesz uzyskać długość listy, jak pokazano:

Drukuj (f „unikalne elementy: len (PD.unikalny (df ['pens'])) ")

Kod powyżej powinien zwrócić:

Unikalne przedmioty: 5

#2 Funkcja Pandas Nunique

Funkcja Nunique () pozwala uzyskać liczbę unikalnych wartości wzdłuż określonej osi.

Przykładem jest jak pokazano:

drukuj (f "[liczba unikalnych elementów/kolumny] \ n df.Nunique (axis = 0) ")

Kod powyżej powinien zwrócić liczbę unikalnych elementów w każdej kolumnie. Powstałe wyjście jest jak pokazano:

[Liczba unikalnych elementów/kolumny]
Wynagrodzenie 5
Departament 6
Ocena 4
DTYPE: INT64

Możesz także pobrać liczbę unikalnych elementów w określonej kolumnie, jak pokazano:

Wydrukuj (DF.wynagrodzenie.nunique ())

Powyższe powinno zwrócić liczbę unikalnych elementów w kolumnie pensji.

#3 pandas value_counts ()

Pandy zapewnia nam również funkcję wartości_count (). Ta funkcja zwraca liczbę unikalnych wartości w określonej kolumnie.

Przykładem jest jak pokazano:

res = lista (df.wynagrodzenie.value_counts ())
print (f "unikalne elementy: len (res)")

Funkcja wartości_counts () zwraca liczbę każdej wartości w kolumnie. Następnie konwertujemy wynik na listę i otrzymujemy długość.

Powinno to uzyskać liczbę unikalnych elementów w kolumnie:

Unikalne przedmioty: 5

Wniosek

W tym artykule omówiono różne metody i techniki, których możemy użyć do określenia liczby unikalnych wartości w PandaS DataFrame.