Wykres rozproszenia matplotlib w Pythonie

Wykres rozproszenia matplotlib w Pythonie
Człowiek może lepiej zrozumieć wizualne w porównaniu z formą tekstową. Dlatego ludzie zawsze sugerują narysowanie wykresu Big Data, aby go zrozumieć w bardzo łatwy sposób. Istnieją różne rodzaje wykresów na rynku, takie jak wykresy słupkowe, histogramy, wykresy kołowe itp. Te różne wykresy są używane zgodnie z zestawem danych i wymagań. Na przykład, jeśli masz zestaw danych o wydajności firmy z ostatnich 10 lat, wykres wykresu barowego poda więcej informacji o rozwoju firmy. Tak więc wybór wykresu zależy od zestawu danych i wymagań.

Jeśli jesteś naukowcem z danych, czasami musisz obsługiwać duże zbiory danych. W tych dużych zbiorach danych przetwarzasz dane, analizujesz dane, a następnie generujesz raport na ten temat. Aby wygenerować raport na ten temat, musisz potrzebować jasnego obrazu danych, a tutaj pojawiają się wykresy.

W tym artykule wyjaśnimy, jak korzystać z Wykres rozproszenia matplotlib w Pythonie.

wykres punktowy jest powszechnie używany przez analizy danych w celu znalezienia związku między dwoma numerycznymi zestawami danych. W tym artykule zobaczy, jak używać matplotlib.Pyplot, aby narysować wykres rozproszenia. W tym artykule podano pełne szczegóły, które musisz popracować na działce rozproszonej.

Matplotlib.PYPOLT oferuje różne sposoby wykreślenia wykresu. Aby wykreślić wykres jako rozproszenie, używamy funkcji rozproszenia ().

Składnia do użycia funkcji rozproszenia () jest:

matplotlib.Pyplot.Rozproszenie (x_data, y_data, s, c, marker, cmap, vmin, vmax, alpha, lineWidths, edgecolors)

Wszystkie powyższe parametry zobaczymy w nadchodzących przykładach, aby lepiej zrozumieć.

importować matplotlib.Pyplot as Plt
plt.rozproszenie (x_data, y_data)

Dane, które przekazaliśmy na rozproszeniu x_data, należą do osi x, a Y_DATA należy do osi y.

Przykłady

Teraz zamierzamy wykreślić wykres rozproszenia () za pomocą różnych parametrów.

Przykład 1: Korzystanie z domyślnych parametrów

Pierwszy przykład opiera się na ustawieniach domyślnych funkcji rozproszenia (). Po prostu mijamy dwa zestawy danych, aby stworzyć związek między nimi. Tutaj mamy dwie listy: jedna należy do wysokości (h), a druga odpowiada ich ciężarom (w).

# Scatter_default_ARGuments.py
# Zaimportuj wymaganą bibliotekę
importować matplotlib.Pyplot as Plt
Dane # H (wysokość) i W (waga)
H = [165, 173, 172, 188, 191, 189, 157, 167, 184, 189]
W = [55, 60, 72, 70, 96, 84, 60, 68, 98, 95]
# Wykres wykres rozproszenia
plt.rozproszenie (H, W)
plt.pokazywać()

Wyjście: Scatter_default_arguments.py

Na powyższym wyjściu możemy zobaczyć dane wag (w) na osi y i wysokości (h) na osi x.

Przykład 2: Wykres rozproszony z ich wartościami etykiet (osi x i oś y) i tytuł

W przykładzie_1 po prostu rysujemy wykres rozproszenia bezpośrednio za pomocą ustawień domyślnych. Teraz zamierzamy dostosować funkcję wykresu rozproszenia jeden po drugim. Przede wszystkim dodamy etykiety do wykresu, jak pokazano poniżej.

# labels_title_scatter_plot.py
# Zaimportuj wymaganą bibliotekę
importować matplotlib.Pyplot as Plt
# H i W dane
H = [165, 173, 172, 188, 191, 189, 157, 167, 184, 189]
W = [55, 60, 72, 70, 96, 84, 60, 68, 98, 95]
# Wykres wykres rozproszenia
plt.rozproszenie (H, W)
# Ustaw nazwy Labable Axis
plt.xlabel („waga (w) w kg”)
plt.YLABEL („Wysokość (h) w cm”)
# Ustaw tytuł nazwy wykresu
plt.Tytuł („Wykres rozproszenia wysokości i wagi”)
plt.pokazywać()

Linia 4 do 11: Importujemy bibliotekę matplotlib.Pyplot i utwórz dwa zestawy danych dla osi x i osi y. I przekazujemy oba zestawy danych do funkcji wykresu rozproszenia.

Linia 14–19: Ustawiamy nazwy etykiet osi x i osi y. Ustawiliśmy również tytuł wykresu rozrzutu fabuły.

Wyjście: etyels_title_scatter_plot.py

Na powyższym wyjściu widzimy, że wykres rozproszenia ma nazwy etykiet osi i tytuł rozrzutu.

Przykład 3: Użyj parametru znacznika, aby zmienić styl punktów danych

Domyślnie marker jest okrągłością solidną, jak pokazano na powyższym wyjściu. Tak więc, jeśli chcemy zmienić styl markera, możemy go zmienić na ten parametr (znacznik). Nawet my możemy również ustawić rozmiar znacznika. Więc zobaczymy o tym w tym przykładzie.

# marker_scatter_plot.py
# Zaimportuj wymaganą bibliotekę
importować matplotlib.Pyplot as Plt
# H i W dane
H = [165, 173, 172, 188, 191, 189, 157, 167, 184, 189]
W = [55, 60, 72, 70, 96, 84, 60, 68, 98, 95]
# Wykres wykres rozproszenia
plt.rozproszenie (h, w, marker = "v", s = 75)
# Ustaw nazwy Labable Axis
plt.xlabel („waga (w) w kg”)
plt.YLABEL („Wysokość (h) w cm”)
# Ustaw tytuł nazwy wykresu
plt.Tytuł („Działka rozproszona, gdzie zmiana markera”)
plt.pokazywać()

Powyższy kod jest taki sam, jak wyjaśniono w poprzednich przykładach, z wyjątkiem poniższej linii.

Linia 11: Przekazujemy parametr markera i nowy znak używany przez wykres rozproszenia, aby narysować punkty na wykresie. Ustawiamy również rozmiar znacznika.

Poniższe wyjście pokazuje punkty danych z tym samym markerem, który dodaliśmy w funkcji rozproszenia.

Wyjście: marker_scatter_plot.py

Przykład 4: Zmień kolor wykresu rozproszenia

Możemy również zmienić kolor punktów danych zgodnie z naszym wyborem. Domyślnie pokazuje niebieski kolor. Teraz zmienimy kolor punktów danych rozrzutu, jak pokazano poniżej. Możemy zmienić kolor cyfki rozproszenia za pomocą dowolnego koloru, który chcesz. Możemy wybrać dowolny krotek RGB lub RGBA (czerwony, zielony, niebieski, alfa). Zakres wartości każdego elementu krotnego będzie pomiędzy [0.0, 1.0] i możemy również reprezentować RGB lub RGBA w formacie szesnastkowym, takim jak #FF5733.

# Scatter_plot_Colour.py
# Zaimportuj wymaganą bibliotekę
importować matplotlib.Pyplot as Plt
# H i W dane
H = [165, 173, 172, 188, 191, 189, 157, 167, 184, 189]
W = [55, 60, 72, 70, 96, 84, 60, 68, 98, 95]
# Wykres wykres rozproszenia
plt.rozproszenie (h, w, marker = „v”, s = 75, c = „czerwony”)
# Ustaw nazwy Labable Axis
plt.xlabel („waga (w) w kg”)
plt.YLABEL („Wysokość (h) w cm”)
# Ustaw tytuł nazwy wykresu
plt.Tytuł („Zmiana koloru rozproszenia”)
plt.pokazywać()

Ten kod jest podobny do poprzednich przykładów, z wyjątkiem poniższego wiersza, w którym dodajemy dostosowywanie kolorów.

Linia 11: Przekazujemy parametr „C”, który jest dla koloru. Przypisaliśmy nazwę koloru „czerwony” i otrzymaliśmy wyjście w tym samym kolorze.

Jeśli chcesz używać koloru krotki lub szesnastkowego, po prostu przekazaj tę wartość do słowa kluczowego (C lub koloru), jak poniżej:

plt.rozproszenie (h, w, marker = "v", s = 75, c = "#ff5733")

W powyższej funkcji rozproszenia przekazaliśmy heksadecimal kod kolorów zamiast nazwy koloru.

Wyjście: Scatter_plot_Colour.py

Przykład 5: Zmiana koloru wykresu rozproszonego według kategorii

Możemy również zmienić kolor punktów danych według kategorii. W tym przykładzie to wyjaśnimy.

# Colour_change_by_category.py
# Zaimportuj wymaganą bibliotekę
importować matplotlib.Pyplot as Plt
# H i W zbierają się z dwóch krajów
H = [165, 173, 172, 188, 191, 189, 157, 167, 184, 189]
W = [55, 60, 72, 70, 96, 84, 60, 68, 98, 95]
# Ustaw nazwę kraju 1 lub 2, który pokazuje wysokość lub wagę
# Dane należą do jakiego kraju
country_category = ['country_2', 'country_2', 'country_1' ',
„country_1”, „country_1”, „country_1”,
„country_2”, „country_2”, „country_1”, „country_2”]
# Mapowanie kolorów
Colours = 'country_1': „Orange”, „country_2”: „niebieski”
Colour_List = [Colours [i] dla i w country_category]
# Wydrukuj listę kolorów
Drukuj (Colour_List)
# Wykres wykres rozproszenia
plt.Rozproszenie (h, w, marker = "v", s = 75, c = Colour_List)
# Ustaw nazwy Labable Axis
plt.xlabel („waga (w) w kg”)
plt.YLABEL („Wysokość (h) w cm”)
# Ustaw tytuł nazwy wykresu
plt.Tytuł („Zmiana koloru rozproszenia dla kategorii”)
plt.pokazywać()

Powyższy kod jest podobny do poprzednich przykładów. Linie, w których dokonaliśmy zmian, wyjaśniono poniżej:

Linia 12: Umieszczamy całe punkty danych albo w kategorii Country_1 lub Country_2. To tylko założenia, a nie prawdziwa wartość, aby pokazać demo.

Linia 17: Stworzyliśmy słownik koloru, który reprezentuje każdą kategorię.

Linia 18: Mapujemy kategorię kraju o ich nazwę kolorów. A poniższa instrukcja drukowania pokaże takie wyniki.

[„niebieski”, „niebieski”, „pomarańczowy”, „pomarańczowy”, „pomarańczowy”, „pomarańczowy”, „niebieski”, „blue”, „pomarańczowy”, „blue”]

Linia 24: W końcu przekazujemy kolor Colour (wiersz 18) do funkcji rozproszenia.

Wyjście: Colour_change_by_category.py

Przykład 6: Zmień kolor krawędzi punktu danych

Możemy również zmienić kolor krawędzi punktu danych. W tym celu musimy użyć słowa kluczowego Edge Color („Edgecolor”). Możemy również ustawić szerokość linii krawędzi. W poprzednich przykładach nie użyliśmy żadnego edgecolor, który nie jest domyślnie brak. Więc nie pokazuje żadnego domyślnego koloru. Dodamy kolor krawędzi punkt danych, aby zobaczyć różnicę między poprzednimi przykładami wykresu wykresu rozrzutu z wykresem wykresu punktów danych krawędziowych.

# edgecolour_scatterplot.py
# Zaimportuj wymaganą bibliotekę
importować matplotlib.Pyplot as Plt
# H i W dane
H = [165, 173, 172, 188, 191, 189, 157, 167, 184, 189]
W = [55, 60, 72, 70, 96, 84, 60, 68, 98, 95]
# Wykres wykres rozproszenia
plt.rozproszenie (h, w, marker = „v”, s = 75, c = „czerwony”, edgecolor = „czarny”, lineWidth = 1)
# Ustaw nazwy Labable Axis
plt.xlabel („waga (w) w kg”)
plt.YLABEL („Wysokość (h) w cm”)
# Ustaw tytuł nazwy wykresu
plt.Tytuł („Zmiana koloru rozproszenia”)
plt.pokazywać()

Linia 11: W tym wierszu po prostu dodajemy kolejny parametr, który nazywamy Edgecolor i LineWidth. Po dodaniu obu parametrów, teraz nasz wykres rozrzutu wygląda jak coś, jak pokazano poniżej. Widać, że zewnętrzny punkt danych jest teraz graniczny z czarnym kolorem z linią = 1.

Wyjście: edgecolour_scatterplot.py

Wniosek

W tym artykule widzieliśmy, jak korzystać z funkcji wykresu rozproszenia. Wyjaśniliśmy wszystkie główne pojęcia wymagane do narysowania wykresu rozproszenia. Może istnieć inny sposób na narysowanie wykresu rozproszenia, jak jakiś bardziej atrakcyjny sposób, w zależności od tego, jak używamy różnych parametrów. Ale większość parametrów, które omówiliśmy, miała na celu bardziej profesjonalne narysowanie fabuły. Nie używaj również zbyt wielu złożonych parametrów, które mogą mylić rzeczywiste znaczenie wykresu.

Kod tego artykułu jest dostępny pod poniższym linkiem GitHub:

https: // github.com/shekharpandey89/rozproszony-matplotlib.Pyplot