Histogram serii pandy

Histogram serii pandy

„Rozkład częstotliwości macierzy numerycznej jest zazwyczaj reprezentowany przez histogram, który jest zorganizowany w dyskretne pojemniki o równej wielkości. Metoda „Pandy.Seria.Hist () ”i„ Pandy.Seria.wykres () ”są szeroko używane. Można je wykorzystać do szybkiego wykonywania histogramów za pomocą serii pandy."

Seria składni.następuje metoda hist () ”:

Składnia dla „serii.Funkcja fabuły () ”:

Ten artykuł pokaże wdrożenie obu tych metod wykreślania histogramów.

Przykład nr 1: Wykorzystanie serii.Hist () metoda wykreślania histogramu

Możemy wykreślić serię pandy, stosując serię pandy.metoda hist () ”. Praktyczne wykonanie tej techniki można zaobserwować w tej demonstracji.

Wprowadziliśmy narzędzie „Spyder” do kompilacji programów Pythona do naszego systemu. Uruchomienie narzędzia przenosi nas do interfejsu. Domyślnie otworzy plik o nazwie „Temp.py ”. Możesz zmodyfikować nazwę i „.Py ”to rozszerzenie plików Pythona.

W tym pliku Pythona zainicjowaliśmy skrypt, najpierw załadując niezbędne pakiety. Biblioteka, którą sprowadziliśmy do naszego środowiska Python, to „pandy”. To pytanie może pojawić się w twoim umyśle, dlaczego importujemy pandy z szerokiej gamy pakietów, które oferuje Python? Załadowaliśmy ten zestaw narzędzi, ponieważ będziemy pracować nad wykreśleniem histogramów z serią Pandas.

Aby wygenerować serię, zastosujemy metodę panda „PD.Seria () ”i wykreślić histogram z tej serii, kolejna metoda pandas„ Seria.Hist () ”zostanie wykonane w tym przewodniku. Tak więc zaimportowaliśmy „Pandy jako PD” do naszego pliku Pythona. Teraz przejdziemy do rozpoczęcia scenariusza.

W celu wykreślenia histogramów pandy za pomocą serii, początkowym wymogiem jest wygenerowanie serii pandy. Aby zbudować serię pandy, „PD.Metoda serii () ”jest wywoływana. Użyliśmy dwóch parametrów dla tej funkcji: „Dane” i „Nazwa”. Wartości serii zostaną zawarte w „danych”, podczas gdy nazwa tej listy wartości jest przypisana w „Nazwie”. Wartości „Dane” to „12, 32, 45, 65, 76, 32, 19, 34, 76, 89, 45, 35, 76, 89, 90, 44, 14, 33, 56, 69, 65 , 44, 36, 57, 23, 41, 78, 32, 47, 81 ”. Tak więc nasza seria zostanie wygenerowana z 30 wartościami. Nazwaliśmy tę listę „sprzedaż”. „PD.Funkcja serii () ”konstruuje serię z dołączonymi wartościami, ale nie ma w niej żadnej pamięci, aby utrzymać tę serię do późniejszego użycia.

W tym celu utworzyliśmy obiekt szeregowy, nazwał go „import_report” i przypisaliśmy wynik wygenerowany z wywoływania „PD.Metoda serii () ”. Prezentacja tej nowo skonstruowanej serii może być możliwa, wykorzystując metodę Pythona „print ()”. Ta metoda działa, przyjmując wszelkie dane wejściowe i przetwarzanie jej w celu wykazania wyniku na terminalu. Tutaj użyliśmy „.metoda Head () ”z nazwą serii, ponieważ rekord przechowywany w serii jest zbyt długi, więc woli widzieć tylko niektóre wartości początkowe. „„.metoda head () ”, domyślnie, wyświetla pierwsze 5 wpisów.

Poniższy obraz przedstawia serię renderowaną w oknie wyjściowym, mając na widoku pierwszych 5 wartości. Nazwa listy jest wymieniona poniżej, a jej danych jest identyfikowana jako „INT64”.

Aby zmapować histogram z serii pandy, otrzymaliśmy funkcję „seria.Hist () ”z zestawu narzędzi pandy. Ta metoda po prostu przyjmuje wartości z serii i przedstawia histogram za pomocą ich. Aby wdrożyć tę metodę, wywołaliśmy ją w naszym programie Python. Nazwa serii „Import_report” jest dostarczana do „.metoda hist () ”. Następnie właśnie utworzyliśmy program, osiągając opcję „Uruchom plik”.

Wygeneruje to wykres na ekranie, który jest wyświetlany z słupkami. Wartości na osi y wynoszą od 0-8, co reprezentuje częstotliwość, podczas gdy oś x ma odstępy od 10-90.

Możemy dostosować ten histogram, zmieniając liczbę pojemników. W tym celu mamy parametr „bin”. Przekazaliśmy ten parametr do „serii.Funkcja hist () ”. Pandy domyślnie tworzą pojemniki, ale w razie potrzeby możemy je zmodyfikować. Tak więc dostarczyliśmy „pojemniki” wartość „8”. Rozkłada nasze dane na 8 pasków na histogramie.

Możesz zauważyć, że poprzedni obraz miał 10 pojemników, ale ten ma 8 barów.

Przykład nr 2: Wykorzystanie serii.Metoda wykresu histogramu

Inną techniką, której zamierzamy użyć w tym samouczku, jest seria pandas.metoda wykresu () ”. Domyślnie tworzy wykres liniowy, ale możemy szczególnie określić rodzaj wykresu, z którym chcemy wizualizować nasze dane.

Program tej metody rozpoczyna się od importowania biblioteki pandy. Załadowaliśmy moduł pandas i stworzyliśmy jego pseudonim jako „PD”. Obecnie będziemy mieć dostęp do dowolnej metody pandy, której potrzebujemy, pisząc „PD” zamiast „Pandy”. Pierwszą metodą, którą przywołaliśmy z zestawu narzędzi panda, jest „PD.Seria () ”dla budowy serii pandy. „PD.Metoda serii () ”jest stosowana z dwoma atrybutami:„ Dane ”i„ Nazwa ”.

Lista wartości jest przechowywana w „Data”, a tytuł listy jest zdefiniowany w „Nazwie”. Wartości, które dostarczyliśmy do tworzenia serii to „20, 34, 45, 67, 64, 78, 98, 72, 12, 34, 17, 92, 56, 77, 63, 37, 29, 11, 20, 80, 44, 21, 37, 65, 48, 88, 24, 37, 33, 19, 74, 26 ”. Całkowita liczba wartości przechowywanych na tej liście wynosi 32. Nazwa, którą zdefiniowaliśmy dla listy wartości to „wartości”. Seria zostanie zachowana w obiekcie serii, aby umożliwić nam użycie go później. Stworzyliśmy obiekt serii „my_series” i przydzieliliśmy go nowo utworzonej serii.

Ponieważ generowaliśmy serię, jest bardzo długa i nie można jej zobaczyć w jednej migawce, dlatego postanowiliśmy wyświetlić tylko początkowe wpisy, ćwicząc „serię.metoda head () ”w funkcji„ print () ”.

Nazwa serii, danych z serii i wartości serii zostały wystawione na konsoli Python.

Teraz użyjemy tej serii, aby stworzyć jej wizualną reprezentację za pomocą fabuły.

Serie.Metoda wykresu () ”jest wywoływana. Tutaj wspomnieliśmy o nazwie naszej serii jako „my_series” z „.funkcja wykres () ”. Pomiędzy nawiasami tej metody stosuje się parametr „rodzaj”. Ten atrybut zdefiniuje rodzaj wykresu, który zostanie wyciągnięty. Ponieważ chcemy wykreślić histogram, określiliśmy „rodzaj” jako „hist”.

Nasz histogram jest generowany na ekranie, który zawiera 10 pojemników dla rozkładu wartości.

Możemy zmienić formatowanie naszej fabuły. W tym celu stworzyliśmy zmienną „kontener”, aby zapisać w nim histogram. Następnie zastosowaliśmy „set_xlabe () l”, aby zidentyfikować etykietę „lista wartości”, która zostanie pokazana na osi x. Dodatkowo, aby ustawić etykietę histogramu, zastosowaliśmy metodę „set_title ()” do tytułu wykresu jako „to jest nasza fabuła demonstracyjna”.

Możesz zobaczyć wyniki w poniższym przedstawionym wykresie histogramu wizualnym.

Wniosek

Wizualizacja serii danych poprzez tworzenie działek jest bardzo pomocną techniką do szybkiej analizy danych. Ta lekcja wprowadziła Cię do dwóch metod wykreślania histogramu za pomocą serii pandy. Pierwszą techniką, którą omówiliśmy, jest „Seria.metoda hist () ”, która również bada koncepcję zmiany pojemników. Drugą funkcją jest „seria.metoda wykresu () ”. W tej technice nauczyliśmy się zmieniać formatowanie fabuły zgodnie z naszymi potrzebami.