Jeśli jesteś naukowcem z danych, czasami musisz obsługiwać duże zbiory danych. W tych dużych zbiorach danych przetwarzasz dane, analizujesz dane, a następnie generujesz raport na ten temat. Aby wygenerować raport na ten temat, musisz potrzebować jasnego obrazu danych, a tutaj pojawiają się wykresy.
W tym artykule wyjaśnimy, jak korzystać z Wykres rozproszenia matplotlib w Pythonie.
wykres punktowy jest powszechnie używany przez analizy danych w celu znalezienia związku między dwoma numerycznymi zestawami danych. W tym artykule zobaczy, jak używać matplotlib.Pyplot, aby narysować wykres rozproszenia. W tym artykule podano pełne szczegóły, które musisz popracować na działce rozproszonej.
Matplotlib.PYPOLT oferuje różne sposoby wykreślenia wykresu. Aby wykreślić wykres jako rozproszenie, używamy funkcji rozproszenia ().
Składnia do użycia funkcji rozproszenia () jest:
matplotlib.Pyplot.Rozproszenie (x_data, y_data, s, c, marker, cmap, vmin, vmax, alpha, lineWidths, edgecolors)Wszystkie powyższe parametry zobaczymy w nadchodzących przykładach, aby lepiej zrozumieć.
importować matplotlib.Pyplot as PltDane, które przekazaliśmy na rozproszeniu x_data, należą do osi x, a Y_DATA należy do osi y.
Przykłady
Teraz zamierzamy wykreślić wykres rozproszenia () za pomocą różnych parametrów.
Przykład 1: Korzystanie z domyślnych parametrów
Pierwszy przykład opiera się na ustawieniach domyślnych funkcji rozproszenia (). Po prostu mijamy dwa zestawy danych, aby stworzyć związek między nimi. Tutaj mamy dwie listy: jedna należy do wysokości (h), a druga odpowiada ich ciężarom (w).
# Scatter_default_ARGuments.pyWyjście: Scatter_default_arguments.py
Na powyższym wyjściu możemy zobaczyć dane wag (w) na osi y i wysokości (h) na osi x.
Przykład 2: Wykres rozproszony z ich wartościami etykiet (osi x i oś y) i tytuł
W przykładzie_1 po prostu rysujemy wykres rozproszenia bezpośrednio za pomocą ustawień domyślnych. Teraz zamierzamy dostosować funkcję wykresu rozproszenia jeden po drugim. Przede wszystkim dodamy etykiety do wykresu, jak pokazano poniżej.
# labels_title_scatter_plot.pyLinia 4 do 11: Importujemy bibliotekę matplotlib.Pyplot i utwórz dwa zestawy danych dla osi x i osi y. I przekazujemy oba zestawy danych do funkcji wykresu rozproszenia.
Linia 14–19: Ustawiamy nazwy etykiet osi x i osi y. Ustawiliśmy również tytuł wykresu rozrzutu fabuły.
Wyjście: etyels_title_scatter_plot.py
Na powyższym wyjściu widzimy, że wykres rozproszenia ma nazwy etykiet osi i tytuł rozrzutu.
Przykład 3: Użyj parametru znacznika, aby zmienić styl punktów danych
Domyślnie marker jest okrągłością solidną, jak pokazano na powyższym wyjściu. Tak więc, jeśli chcemy zmienić styl markera, możemy go zmienić na ten parametr (znacznik). Nawet my możemy również ustawić rozmiar znacznika. Więc zobaczymy o tym w tym przykładzie.
# marker_scatter_plot.pyPowyższy kod jest taki sam, jak wyjaśniono w poprzednich przykładach, z wyjątkiem poniższej linii.
Linia 11: Przekazujemy parametr markera i nowy znak używany przez wykres rozproszenia, aby narysować punkty na wykresie. Ustawiamy również rozmiar znacznika.
Poniższe wyjście pokazuje punkty danych z tym samym markerem, który dodaliśmy w funkcji rozproszenia.
Wyjście: marker_scatter_plot.py
Przykład 4: Zmień kolor wykresu rozproszenia
Możemy również zmienić kolor punktów danych zgodnie z naszym wyborem. Domyślnie pokazuje niebieski kolor. Teraz zmienimy kolor punktów danych rozrzutu, jak pokazano poniżej. Możemy zmienić kolor cyfki rozproszenia za pomocą dowolnego koloru, który chcesz. Możemy wybrać dowolny krotek RGB lub RGBA (czerwony, zielony, niebieski, alfa). Zakres wartości każdego elementu krotnego będzie pomiędzy [0.0, 1.0] i możemy również reprezentować RGB lub RGBA w formacie szesnastkowym, takim jak #FF5733.
# Scatter_plot_Colour.pyTen kod jest podobny do poprzednich przykładów, z wyjątkiem poniższego wiersza, w którym dodajemy dostosowywanie kolorów.
Linia 11: Przekazujemy parametr „C”, który jest dla koloru. Przypisaliśmy nazwę koloru „czerwony” i otrzymaliśmy wyjście w tym samym kolorze.
Jeśli chcesz używać koloru krotki lub szesnastkowego, po prostu przekazaj tę wartość do słowa kluczowego (C lub koloru), jak poniżej:
plt.rozproszenie (h, w, marker = "v", s = 75, c = "#ff5733")W powyższej funkcji rozproszenia przekazaliśmy heksadecimal kod kolorów zamiast nazwy koloru.
Wyjście: Scatter_plot_Colour.py
Przykład 5: Zmiana koloru wykresu rozproszonego według kategorii
Możemy również zmienić kolor punktów danych według kategorii. W tym przykładzie to wyjaśnimy.
# Colour_change_by_category.pyPowyższy kod jest podobny do poprzednich przykładów. Linie, w których dokonaliśmy zmian, wyjaśniono poniżej:
Linia 12: Umieszczamy całe punkty danych albo w kategorii Country_1 lub Country_2. To tylko założenia, a nie prawdziwa wartość, aby pokazać demo.
Linia 17: Stworzyliśmy słownik koloru, który reprezentuje każdą kategorię.
Linia 18: Mapujemy kategorię kraju o ich nazwę kolorów. A poniższa instrukcja drukowania pokaże takie wyniki.
[„niebieski”, „niebieski”, „pomarańczowy”, „pomarańczowy”, „pomarańczowy”, „pomarańczowy”, „niebieski”, „blue”, „pomarańczowy”, „blue”]Linia 24: W końcu przekazujemy kolor Colour (wiersz 18) do funkcji rozproszenia.
Wyjście: Colour_change_by_category.py
Przykład 6: Zmień kolor krawędzi punktu danych
Możemy również zmienić kolor krawędzi punktu danych. W tym celu musimy użyć słowa kluczowego Edge Color („Edgecolor”). Możemy również ustawić szerokość linii krawędzi. W poprzednich przykładach nie użyliśmy żadnego edgecolor, który nie jest domyślnie brak. Więc nie pokazuje żadnego domyślnego koloru. Dodamy kolor krawędzi punkt danych, aby zobaczyć różnicę między poprzednimi przykładami wykresu wykresu rozrzutu z wykresem wykresu punktów danych krawędziowych.
# edgecolour_scatterplot.pyLinia 11: W tym wierszu po prostu dodajemy kolejny parametr, który nazywamy Edgecolor i LineWidth. Po dodaniu obu parametrów, teraz nasz wykres rozrzutu wygląda jak coś, jak pokazano poniżej. Widać, że zewnętrzny punkt danych jest teraz graniczny z czarnym kolorem z linią = 1.
Wyjście: edgecolour_scatterplot.py
Wniosek
W tym artykule widzieliśmy, jak korzystać z funkcji wykresu rozproszenia. Wyjaśniliśmy wszystkie główne pojęcia wymagane do narysowania wykresu rozproszenia. Może istnieć inny sposób na narysowanie wykresu rozproszenia, jak jakiś bardziej atrakcyjny sposób, w zależności od tego, jak używamy różnych parametrów. Ale większość parametrów, które omówiliśmy, miała na celu bardziej profesjonalne narysowanie fabuły. Nie używaj również zbyt wielu złożonych parametrów, które mogą mylić rzeczywiste znaczenie wykresu.
Kod tego artykułu jest dostępny pod poniższym linkiem GitHub:
https: // github.com/shekharpandey89/rozproszony-matplotlib.Pyplot