Warunek wstępny
Jeśli jesteś nowym użytkownikiem Pythona, najpierw będziesz musiał skonfigurować środowisko, aby pokazać wyjście wykresu pudełka. Możesz użyć dowolnego interpretera Python do wykonywania kodu. W tym samouczku użyję Spyder3 Aby wykonać kod. Jeśli nie zainstalowałeś Pandy I Seorborn Biblioteki wcześniej, następnie należy uruchomić następujące polecenie z terminala, aby zainstalować te biblioteki:
$ PIP3 Zainstaluj pandy morskieDziałki z pandami
boksplot () metoda Pandy służy do generowania cyfr wykresu opartych na ramce danych. Ta metoda zawiera wiele argumentów; Niektóre z tych argumentów są używane w poniższych przykładach. Ta część samouczka będzie zawierać dwa przykłady, które pokażą, jak tworzyć wykresy pudełkowe Pandy. Możesz użyć losowo wygenerowanych danych w bibliotece Numpy lub danych z pliku CSV, aby wygenerować wykres pudełkowy Pandy.
Przykład 1: Wykresy pudełkowe na podstawie losowych wartości
Wykresy pudełka w poniższym przykładzie zostały wygenerowane przy użyciu za pomocą Numpy I Pandy. Biblioteka Numpy jest używana w skrypcie do utworzenia obiektu ramki danych poprzez generowanie dwuwymiarowej tablicy losowych wartości, które zawierają 5 wierszy i 5 kolumn. Zawartość ramki danych zostanie wydrukowana za pomocą głowa() metoda. Następnie boksplot () Metoda służy do generowania wykresów pudełkowych o niebieskim kolorze, wielkości czcionki 10 i 30 stopni obrotowego do wyświetlania wartości kolumny.
#!/usr/bin/env python3Wyjście
Następujące dane wyjściowe pojawią się po wykonaniu kodu.
Przykład 2: Wykresy pudełkowe na podstawie danych CSV
Wykresy pudełka w poniższym przykładzie zostały wygenerowane na podstawie danych CSV. Utwórz plik CSV o nazwie Bank.CSV Korzystanie z następujących danych.
Bank.CSV
SL, nazwa_ klienta, konto_typ, płeć, saldoW poniższym skrypcie matplotlib Biblioteka została użyta do skonfigurowania rozmiaru figury wykresu pudełka i do wyświetlenia wyjściowego. Wszystkie zapisy bank.CSV Plik załadowano za pomocą read_csv () metoda Pandy. Pierwsze 8 rekordów ramki danych zostały następnie wydrukowane za pomocą głowa() metoda. boksplot () Metodę zastosowano w poniższej instrukcji, aby narysować figurę pola przy użyciu czerwonego koloru w oparciu o 'Typ konta' z kolumną nazwaną 'Balansować.'
#!/usr/bin/env python3Wyjście
Następujące dane wyjściowe pojawią się po wykonaniu kodu.
Działki z Seborn
Kolejną biblioteką Python powszechnie używaną do rysowania działek jest biblioteka Seorborn. Jedną z ważnych funkcji tej biblioteki jest to, że ma ona wiele wbudowanych przykładowych zestawów danych do testowania różnych zadań. Następne dwa przykłady obejmują użycie dwóch różnych przykładowych zestawów danych do rysowania wykresów pudełkowych za pomocą Seorborn biblioteka.
Przykład 3: Wykresy pudełkowe oparte na parametrze x
Poniższy przykład używa przykładowego zestawu danych, o nazwie 'Diamenty, ' z Seorborn Biblioteka do wygenerowania działki pudełkowej. Tutaj styl siatki jest zdefiniowany za pomocą set_style () metoda. load_dataset () Metoda jest używana do załadowania danych ''diamenty ' Zestaw danych. Pierwsze pięć rekordów jest wydrukowane z zestawu danych i boksplot () Następnie stosuje się metodę do narysowania wykresu pola na podstawie nazwy kolumny 'głębokość,„Z niebieskim kolorem.
# Importuj bibliotekę morską, aby wygenerować fabułę pudełkaWyjście
Następujące dane wyjściowe pojawią się po wykonaniu kodu.
Przykład 4: Wykresy pudełkowe na podstawie parametrów x i y
Poniższy przykład używa przykładowego zestawu danych o nazwie 'loty„Aby narysować fabułę pudełka. Tutaj, zarówno parametry x i y The Boxplot () Metoda służy do narysowania rysunku. Pozostałe stwierdzenia są podobne do poprzedniego przykładu.
# Importuj bibliotekę morską, aby wygenerować fabułę pudełkaWyjście
Następujące dane wyjściowe pojawią się po wykonaniu kodu.
Wniosek
Podczas pracy z dużą ilością danych możesz chcieć podsumować dane za pomocą schematu, takiego jak wykres pudełkowy. W tym samouczku wykorzystano kilka przykładów, aby pokazać, jak generować wykresy pudełkowe z dwiema bibliotekami Python.