Liczba wartości pandy

Liczba wartości pandy

Użyj funkcji „wartości_count ()” w Python Panda, aby policzyć liczbę unikalnych wartości i ciągów. Zwraca obiekty, które pojawiają się najczęściej na liście. Za pomocą jego parametru „sortowanie indeksu” z „wartością_count” może policzyć wartości i zamówić indeks w kolejności rosnącej lub sekwencji.

Składnia metody Count_Values ​​()

Przykład 1: Policz ciąg za pomocą funkcji Count_Value ()

W tym przykładzie zliczymy ciąg podanych danych w programie za pomocą funkcji „Count_Value ()”. Sekwencja zawierająca liczbę odrębnych wartości jest wynikiem techniki „wartość_counts ()”. Ta metoda zwraca zatem liczbę unikalnych wpisów w każdej kolumnie ramki danych dla dowolnej kolumny. Podczas próby ustalenia częstotliwości prawidłowych wartości istniejących w kolumnach dotyczących konkretnej kolumny w pandy używane jest „count ()”. Podczas gdy wartość „liczba_value ()” jest używana do określenia liczby serii.

Aby uruchomić kod, używamy narzędzia „Spyder”. Musimy najpierw zaimportować bibliotekę pandy jako „PD”, zanim będziemy mogli wykonać kod. W tym przykładzie „PD.Indeks ”jest używany do utworzenia listy indeksów. Ta lista jest określana jako „osoba”. Wartości, które dokonaliśmy dla tej listy, to „Watson”, „Emma”, „Enna”, „Watson”, „Jhon”, „Smith”, „Jack”, „Emma”, „Isabella” i „Daniel”. Zainicjujemy zmienną „id”, aby zachować indeks. Dlatego „PD.Indeks ”jest wywoływany w celu utworzenia tego DataFrame.

Aby policzyć ciągi w tym kodzie, użyjemy teraz „identyfikatora.wartość_counts () ”. Poda nam kilka liczb dla każdego ciągu używanego na liście indeksu. Ponieważ niektóre ciągi na liście indeksu są powtarzane, możemy łatwo policzyć liczbę powtarzanych przez nich za pomocą „value_count ()”. Teraz użyjemy funkcji „print ()”, aby wyświetlić „identyfikator.count_value ”na ekranie.

Dwie kolumny, lista indeksu i liczba zliczeń służą do wyświetlania wyników. Lista indeksu jest wyświetlana z „Nazwa: osoba”, a danych danych dla tego indeksu jest „INT64”. Wyświetlał numer ciągu przed strunami, jak widać. Watson pojawia się z „2” przed nim, ponieważ słowo jest używane dwukrotnie w ciągu. Podobnie jak „Emma” pojawia się dwukrotnie na liście, „2” jest wyświetlany przed nią. „Enna” pojawia się tylko raz na liście, więc „1” jest wyświetlany przed „enna”, reszta będzie zgodna z tą samą procedurą.

Przykład 2: Wykorzystanie metody wartości wartości (), aby zliczyć liczbę wartości liczb całkowitych

W tej ilustracji podbijamy liczbę wartości indeksu. W porównaniu z poprzednim przykładem, który pokazuje, jak znaleźć liczbę ciągów, w tym przypadku określamy całkowitą liczbę wartości.

Musimy najpierw zaimportować bibliotekę panda. Najpierw musimy wygenerować listę indeksu za pomocą „PD.Indeks". Mamy pewne wartości w postaci liczb na tej liście. Dołączamy wartości liczb całkowitych do wartości indeksu. Wartości to „61”, „28”, „28”, „98”, „52”, „43”, „52”, „98”, „1”, „4”, „9” i „61”. Następnie zmienna „id” jest przypisywana do przechowywania utworzonego indeksu. Metoda „print ()” jest następnie używana do wyświetlania tej listy indeksu.

Następnie używamy teraz „value_counts ()” do zliczenia liczby wartości liczb całkowitych obecnych na liście indeksu. Da liczbę każdej wartości zawartej na liście indeksu. Wyświetli „1” w wyjściu, jeśli liczba jest używana tylko raz i wyświetli liczbę powtarzanych liczb przed tym liczbą, jeśli liczba jest używana więcej niż raz. Teraz wyświetlimy „identyfikator.wartość_count ”za pomocą funkcji„ print () ”.

Jak widać, na ekranie wyświetlana jest lista indeksu pojedynczego rzędu. Ta lista wyświetla liczbę „61”, „28”, „28”, „98”, „52”, „43”, „52”, „96”, „1”, „4”, „9” i „ 61 ”z danych„ INT64 ”. Lista indeksu jest pierwszą kolumną w następującym wierszu, podczas gdy druga kolumna pokazuje liczbę wartości liczb całkowitych. Rama ta definiuje liczby „61”, „28”, „98” i „52” używają dwa razy na liście indeksów; podczas gdy liczby „43”, „1”, „4” i „9” wykorzystują jeden czas na liście indeksu. Funkcja „count_value ()” najpierw wyświetla powtarzane wartości przed przejściem do pojedynczych wartości.

Przykład 3: Korzystanie z wartości_pliku do zliczenia liczby wartości liczb całkowitych i sortowania ich w kolejności rosnącej

W tym przykładzie będziemy policzyć liczbę wartości liczb całkowitych obecnych w kolumnie DataFrame i sortuje je za pomocą indeksów wartości liczb całkowitych. Przekazując funkcję, która sortuje zgodnie z wymaganym indeksem listy wewnętrznej jako słowo kluczowe, funkcja „sort ()” służy do wykonywania tego wariantu sortowania.

Patrząc na trzeci przykład w tym artykule, pierwszą rzeczą, którą musimy zrobić, jest import biblioteki Panda jako „PD”. Poniższym krokiem jest wygenerowanie ramki danych. Rama danych nazywa się „Dane”. Ta konstrukcja danych zawiera jedną kolumnę o nazwie „Liczby”. Dodaliśmy kilka wartości liczb całkowitych do kolumny „Numpy”. Wartości to „1”, „2”, „4”, „8”, „8”, „1” i „0”. Za pomocą „PD.DataFrame „Polecamy teraz DataFrame. Następnie używamy teraz funkcji „print ()” do wyświetlania „danych” danych na ekranie.

Teraz jesteśmy „danymi.Liczby.value_count () ”, aby zliczyć liczby obecne w kolumnie„ liczba ”tego kompletu danych. Weryfikuje każdą liczbę, aby ustalić, ile został powtórzony, a jeśli tak, wyświetli te informacje jako nową kolumnę na obrazie wyjściowym. Następnie drukujemy instrukcję „wartości_prawdziny” i wyświetlamy „dane.numer.Wartość () ”przy użyciu metody„ print () ”. Teraz wywołujemy funkcję „value_count ()” i jej parametr „sort_index”. Sortowanie to metoda umieszczania danych w określonej kolejności, aby ułatwić znalezienie danych. Wskaźnik wartości zliczania zostanie następnie posortowany sekwencyjnie lub wznoszący się. Wynik ten jest przechowywany w zainicjowanej zmiennej „id”. Wreszcie, używając funkcji „print ()”, pokazujemy końcowy wynik na ekranie.

Trzy ramki są wyświetlane w wyniku wyniku. Pierwszy wyświetla ramkę danych, którą utworzyliśmy, mają „liczby” z pojedynczą kolumną. Według indeksu ta kolumna wyświetla swoje wartości. Liczba strumienia danych jest pokazana w drugim wierszu poniżej wartości_ponatu instrukcji. Liczby, które nie są powtarzane, są wyświetlane w kolumnie po powtarzanych liczbach. Łatwo jest zobaczyć, że liczby „1” i „8” pojawiają się dwa razy na liście kolumny „Numer”. „Int64” jest wyświetlany jako danych danych. Ostatnim etapem jest sortowanie wskaźnika wartości zliczania, które są teraz umieszczane w kolejności rosnącej. Teraz indeks to „0”, „1”, „2”, „4” i „8”.

Wniosek

Funkcja „value_count ()” służy do zliczania wszystkich wartości całkowitych lub ciągów zawartych w kolumnach lub listy indeksu danych danych. W pierwszych dwóch przykładach „PD.Indeks ”został użyty do wygenerowania listy indeksu. Aby określić liczbę, używamy wartości liczb całkowitych na drugiej liście i wartości ciągu na pierwszej liście indeksu. W trzecim przykładzie tworzymy ramkę danych i stosujemy „wartość_count ()” z jego parametrem „indeks_sort”. Strategie stosowane w artykule są stosunkowo podstawowe i przyjazne dla użytkownika.