Pandas Agg Count

Pandas Agg Count
W „Pandy” możemy utworzyć ramki danych zawierające ROWS_AND_COLUMNS. Duże ilości danych tabelarycznych są ogólnie badane i organizowane przy użyciu programu Pandas. „Pandy” zapewnia nam kilka metod, a jedną z nich jest „liczba”, możemy zobaczyć, ile wartości jest dla każdej kolumny w ramie danych za pomocą metody Count Method.

Metoda liczby jest wykorzystywana do zlokalizowania niekompletnych kolumn. Stamtąd możesz wybrać, czy przejść przez kolumny w swoich procesach, czy w razie potrzeby, podać im wartości domyślne. W tym przewodniku zbadamy liczbę panów i wartości_.

Przykład nr 01

Zaczynamy od korzystania z aplikacji „Spyder”. Pomoże nam to w wykonywaniu kodów „pandy”. W edytorze tekstu rozpoczynamy nasz pierwszy kod, importując „Pandy jako PD”. Ten „PD” jest wykorzystywany do dostępu do metod „pandy”, których chcemy. Teraz nie musimy pisać pełnej nazwy „pandy”, aby uzyskać dostęp do jej funkcji. Zamiast tego piszemy „PD”.

Następnie tworzymy zmienną, a także inicjujemy ją, dodając niektóre dane. Dodajemy dane w kolumnie, ustawiając pierwszą nazwę kolumny jako „nazwy”, a nazwy, które tutaj dodamy, to „Ray”, „James”, „Mole”, „Smith”, „Jay”, „Milli”, „William” i „Rick”. Następna kolumna nazywa się „podmiotami”, która zawiera nazwy przedmiotów, takie jak „matematyka”, „ekonomia”, „nauka”, „matematyka”, „statystyka”, „statystyka”, „statystyka” i „komputer”.

Poniżej zmiennej tworzymy „liczbę” i używamy „PD.Metoda dataFrame () ”. Używamy „PD”, aby uzyskać metodę Panda „DataFrame”. Zmieniamy dane „kursy” na „DataFrame” i aktualizujemy jego nazwę jako „numer”. Następnie metoda „print ()” pomaga wyświetlać ramkę danych. Poniżej najpierw wykorzystujemy metodę „Groupby ()”. Umożliwia nam podzielenie danych na wiele kategorii, abyś mógł uruchomić obliczenia w celu dokładniejszej analizy. „Grupujemy” tę ramkę danych, umieszczając „podmioty”, a następnie wykorzystujemy metodę „Count ()”.

Funkcja Count () podaje jednostkę szeregową z wynikiem dla każdego wiersza po zliczeniu liczby wartości nieokreślonych dla każdego wiersza. Umieszczamy obie metody w funkcji „print ()”, aby była wyświetlana na terminalu.

Najpierw wyświetla oryginalną ramkę danych, a następnie „grupy” i zlicza liczbę przedmiotu. Dodaje również te same tematy i pisze go tutaj. W tym zakresie danych dwie kolumny zawierają podmiot „matematyki”, więc wyświetla on „matematyki” i podmiot „statystyki” „3”.

Przykład nr 02

Teraz importujemy „pandy”, a następnie generujemy dane i przechowujemy te dane w zmiennej „Data123”. Mamy tutaj kolumny „Pracownik” i „Adres”. W „Pracownik” wstawiamy nazwiska pracowników, które są „Ray”, „James”, „Mole”, „Smith”, „Jay”, „Milli”, „William” i „Rick”. W „Adresie” umieszczamy adresy tych pracowników, które są „Londynem”, „Ameryka”, „Sodan”, „Londyn”, „Sodan”, „Sodan”, „Ameryka” i „Ameryka”.

Następnie deklarujemy, a także inicjujemy „to samo”, która jest zmienną i inicjuje ją za pomocą „PD.Ramka danych". Przekazujemy również parametr „Data123” do tego „PD.Ramka danych". Używamy poniżej metody „value_count ()”. Technika liczby wartości jest lepsza. Ta technika poda całkowitą liczbę różnych wartości dla danej kolumny. Podajemy tutaj kolumnę „Adres”.

Mamy nazwę DataFrame, która jest „sama” i dodaje nazwę kolumny, która jest „adresem”. Następnie napisz funkcję „wartość_count ()” lub metodę. Dodajemy tę pełną instrukcję w metodzie „print ()”, aby renderował również na ekranie konsoli.

Po utworzeniu ramki danych w tym wyniku, liczy te same adresy pracowników i wyświetla je poniżej i usuwa nazwę pracowników lub usuwa kolumnę „pracownika”. Pokazuje tylko adres i ich liczby, które są obecne w tym ramie danych.

Przykład nr 03

Dane tutaj są wstawiane do pięciu kolumn. Tworzymy ramkę danych o nazwie „Uczniowie”, a kolumny, które mamy, to „Roll_NO”, „S_Name”, „S_instructor”, „S_Course” i „Credit_hrs”. W kolumnie „Roll_no” mamy „A1, A2, A3, A4 i A5”. Teraz, w następnej kolumnie „S_name”, dodajemy nazwiska uczniów „Smith, Noah, Joseph, Mishi i William”. Następnie umieszczamy nazwy instruktora: „Peter, Taylor, James, Robert i Olivia”. Kursy, które tutaj wkładamy, to „angielski, brytyjski, angielski, arabski i angielski”.

Do kolumny „Credit_hrs” dodajemy do niej „4, 5, 4, 3 i 4”. Zmieniamy wszystkie te dane w ramce danych i nazywamy tę ramkę danych lub przechowujemy tę ramkę danych w zmiennej „studenci”. Następnie stosujemy „print ()”, który renderuje tenframe danych. Poniżej umieszczamy metody „GroupBy ()” i „Count ()”. I umieść w nim „S_Couse”, aby zliczał kursy i wyświetla je.

Mamy 1 kurs „arabski”, 1 kurs „brytyjski” i 3 kursy „angielskiego” tutaj w tym ramie danych. Otrzymujemy tę liczbę, stosując metodę „count ()”.

Przykład nr 04

W tym przykładzie utworzona ramka danych zawiera „upload_date”, w którym dodajemy niektóre daty dodawane do pięciu dat. Następnie wstaw inną kolumnę „Viewter_ids”, w której dodajemy identyfikatory widzów jako „v1, v2, v3, v4 i v5”. Podajemy nazwę „wideo” do tego DataFrame. Najpierw użyj „grupy”, które grupują dane na podstawie „upload_date”, a następnie użyć „count ()”, który policzy te dane na podstawie „upload_time”. Na koniec wyświetl wynik.

Jest to wynik tego kodu i liczy dane na podstawie „czasu przesyłania” filmów. Filmy przesyłane na „2022-07-21” to dwa w całkowitej liczbie.

Przykład nr 05

„Badanie” to zmienna zawierająca dane, które znajdują się w formularzach kolumnowych i wierszy. Nazwy kolumn to „kursy, c_fee i c_duration”. Kolumna „kursów” zawiera „Pandy, Ubuntu, Linux, Python, Pandas, Linux, Spark, Python, Ubuntu, Python i Python” w IT. Kolumna „C_fee” zawiera „22000, 25000, 23000, 24000, 26000, 25000, 25000, 22000, 25000, 24000 i 24000”. Kolumna „C_Duration” zawiera dane, które są „30 dni, 50 dni, 35 dni, 40 dni, 60 dni, 35 dni, 30 dni, 50 dni, 50 dni, 40 dni i 40 dni”.

Zmień je w ramce danych, a także wydrukuj DataFrame. „Groupby ()” „kursy i c_duration” i policz je, stosując „Count ()”. Te metody „Groupby” i „Count” będą zgrupować dane na podstawie kolumn na kursy i czas trwania. Następnie oblicz liczbę.

Tutaj grupuje dane dotyczące kursów i ich czasu trwania, a następnie zlicza te kursy, wykorzystując metodę „count ()”.

Wniosek

Ten przewodnik opiera się na koncepcji funkcji „AGG Count” w „Pandy.„Opisaliśmy, w jaki sposób funkcja„ liczba agg ”w pandy jest używana do liczenia. Metoda „AGG Count” została zastosowana do pięciu ustanowionych przypadków.