Samouczek Python Seaborn

Samouczek Python Seaborn
W tej lekcji na temat biblioteki Python Seaborn przyjrzymy się różnym aspektom tej biblioteki wizualizacji danych, których możemy użyć z Pythonem do generowania pięknych i intuicyjnych wykresów, które mogą wizualizować dane w formie, których biznes chce od platformy. Aby ukończyć tę lekcję, omówimy następujące sekcje:
  • Co to jest Python Searborn?
  • Rodzaje działek, które możemy zbudować z morską
  • Praca z wieloma działkami
  • Niektóre alternatywy dla Pythona Seorborda

To wygląda na wiele do omówienia. Zacznijmy już teraz.

Co to jest biblioteka Python Seaorn?

Seaborn Library to pakiet Python, który pozwala nam tworzyć infografiki na podstawie danych statystycznych. Jak jest wytwarzany na Matplotlib, więc jest z nim z natury kompatybilny. Ponadto obsługuje strukturę danych Numpy i Pandy, aby wykreślić bezpośrednio z tych kolekcji.

Wizualizacja złożonych danych jest jedną z najważniejszych rzeczy, o które opiekuje się Searn. Gdybyśmy porównać Matplotlib z Seaborn, Seaorn jest w stanie ułatwić te rzeczy, które trudno jest osiągnąć za pomocą matplotlib. Należy jednak zauważyć, że zauważa Seorborn nie jest alternatywą dla matplotlibu, ale jego uzupełnieniem. Podczas tej lekcji będziemy korzystać z funkcji MATPlotlib również w fragmentach kodu. Wybierzesz współpracę z Seaborn w następujących przypadkach użycia:

  • Masz statystyczne dane szeregów czasowych, które należy wykreślić z reprezentacją niepewności wokół szacunków
  • W celu wizualnego ustalenia różnicy między dwoma podzbiorami danych
  • Wizualizować rozkłady jednoczynnikowe i dwuwymiarowe
  • Dodając znacznie więcej wizualnego uczucia na wykresach Matplotlib z wieloma wbudowanymi tematami
  • Aby dopasować i wizualizować modele uczenia maszynowego poprzez regresję liniową ze zmiennymi niezależnymi i zależnymi

Tylko notatką przed rozpoczęciem jest to, że używamy wirtualnego środowiska do tej lekcji, którą wykonaliśmy za pomocą następującego polecenia:

Python -m Virtualenv Seorborn
Źródło morskie/bin/aktywuj

Gdy środowisko wirtualne będzie aktywne, możemy zainstalować bibliotekę Seaorn w wirtualnej Env, aby można było wykonać przykłady:

PIP Instaluj Seaorn

Możesz również użyć AnaConda, aby uruchomić te przykłady, co jest łatwiejsze. Jeśli chcesz zainstalować go na swoim komputerze, spójrz na lekcję opisującą „Jak zainstalować Anaconda Python na Ubuntu 18.04 lts ”i podziel się swoją opinią. Teraz przejdźmy do różnych rodzajów działek, które można zbudować za pomocą Python Searn.

Za pomocą zestawu danych Pokemon

Aby utrzymać tę lekcję, użyjemy zestawu danych Pokemon, który można pobrać z Kaggle. Aby zaimportować ten zestaw danych do naszego programu, będziemy korzystać z Biblioteki Pandy. Oto wszystkie import, który wykonujemy w naszym programie:

importować pandy jako PD
z matplotlib import Pyplot jako PLT
Importuj Seaorn jako SNS

Teraz możemy zaimportować zestaw danych do naszego programu i pokazać niektóre przykładowe dane z panami jako:

df = pd.read_csv ('pokemon.csv ', index_col = 0)
df.głowa()

Zauważ, że aby uruchomić powyższy fragment kodu, zestaw danych CSV powinien być obecny w tym samym katalogu co sam program. Po uruchomieniu powyższego fragmentu kodu zobaczymy następujące dane wyjściowe (w notatniku Anaconda Jupyter):

Wykreślanie krzywej regresji liniowej

Jedną z najlepszych rzeczy w Seatorn jest inteligentne funkcje wykonywania, które zapewnia, które nie tylko wizualizują dostarczany przez nas zestaw. Na przykład możliwe jest skonstruowanie wykresu regresji liniowej z pojedynczym wierszem kodu. Oto jak to zrobić:

Sns.lmplot (x = „atak”, y = „obrona”, data = df)

Po uruchomieniu powyższego fragmentu kodu zobaczymy następujące dane wyjściowe:

Zauważyliśmy kilka ważnych rzeczy w powyższym fragmencie kodu:

  • W Seborn dostępna jest dedykowana funkcja wykresu
  • Zastosowaliśmy funkcję dopasowania i wykresu Searorn, która zapewniła nam linię regresji liniowej, którą sama się modelowała

Nie bój się, jeśli pomyślałeś, że nie możemy mieć fabuły bez tej linii regresji. Możemy ! Wypróbujmy teraz nowy fragment kodu, podobny do ostatniego:

Sns.lmplot (x = „atak”, y = „obrona”, data = df, fit_reg = false)

Tym razem nie zobaczymy linii regresji w naszej fabule:

Teraz jest to o wiele bardziej jasne (jeśli nie potrzebujemy linii regresji liniowej). Ale to jeszcze nie koniec. Searorn pozwala nam stworzyć inną tę działkę i to właśnie będziemy robić.

Konstruowanie działek

Jedną z największych cech w Searnorn jest to, jak łatwo akceptuje strukturę Pandas DataFrame do wykreślania danych. Możemy po prostu przekazać ramkę danych do biblioteki Seaorn, aby mogła z niej zbudować:

Sns.boxplot (data = df)

Po uruchomieniu powyższego fragmentu kodu zobaczymy następujące dane wyjściowe:

Możemy usunąć pierwsze odczyt Total, ponieważ wygląda to trochę niezręcznie, gdy faktycznie wykreślamy poszczególne kolumny tutaj:

Stats_df = df.Drop ([„ogółem”], oś = 1)
# Nowy pudełko za pomocą stats_df
Sns.boxplot (data = stats_df)

Po uruchomieniu powyższego fragmentu kodu zobaczymy następujące dane wyjściowe:

Fabuła roju z morską

Możemy zbudować intuicyjną działkę roju z Seborn. Ponownie będziemy używaćframe danych z pandy, które załadowaliśmy wcześniej, ale tym razem będziemy nazywać funkcję pokazową Matplotlib, aby pokazać wykonany przez nas działek. Oto fragment kodu:

Sns.set_context („papier”)
Sns.Swararmplot (x = „atak”, y = „obrona”, data = df)
plt.pokazywać()

Po uruchomieniu powyższego fragmentu kodu zobaczymy następujące dane wyjściowe:

Korzystając z kontekstu morskiego, pozwalamy Searornowi dodać osobisty dotyk i płynną konstrukcję fabuły. Możliwe jest jeszcze bardziej dostosowanie tego wykresu do niestandardowego rozmiaru czcionki używanej do etykiet w fabule, aby ułatwić odczyt. Aby to zrobić, będziemy przekazywać więcej parametrów do funkcji set_context, która działa tak jak to, co brzmią. Na przykład, aby zmodyfikować rozmiar czcionki etykiet, skorzystamy z czcionki.Parametr rozmiaru. Oto fragment kodu do modyfikacji:

Sns.set_context („papier”, font_scale = 3, rc = "czcionka.rozmiar „: 8” osie.LATELESIZE ": 5)
Sns.Swararmplot (x = „atak”, y = „obrona”, data = df)
plt.pokazywać()

Po uruchomieniu powyższego fragmentu kodu zobaczymy następujące dane wyjściowe:

Rozmiar czcionki dla etykiety został zmieniony na podstawie dostarczonych parametrów i wartości powiązanej z czcionką.Parametr rozmiaru. Jedną rzeczą, w której Seborn jest ekspertem, jest uczynienie fabuły bardzo intuicyjnym dla praktycznego wykorzystania, a to oznacza, że ​​Searorn to nie tylko pakiet Python, ale w rzeczywistości coś, co możemy wykorzystać w naszych wdrażaniach produkcyjnych.

Dodanie tytułu do działek

Łatwo jest dodać tytuły do ​​naszych działek. Musimy tylko zastosować prostą procedurę korzystania z funkcji poziomu osi, w których wywołamy set_title () funkcjonuj tak, jak pokazujemy w fragmencie kodu tutaj:

Sns.set_context („papier”, font_scale = 3, rc = "czcionka.rozmiar „: 8” osie.LATELESIZE ": 5)
my_plot = sns.Swararmplot (x = „atak”, y = „obrona”, data = df)
my_plot.set_title („LH Swarm Fout”)
plt.pokazywać()

Po uruchomieniu powyższego fragmentu kodu zobaczymy następujące dane wyjściowe:

W ten sposób możemy dodać o wiele więcej informacji do naszych działek.

Seaorn vs Matplotlib

Gdy spojrzeliśmy na przykłady w tej lekcji, możemy określić, że Matplotlib i Searbor. Jedną z funkcji, które zajmują Searorn 1 krok do przodu, jest sposób, w jaki Seaorn może wizualizować dane statystycznie.

Aby najlepiej wykorzystać parametry morskie, gorąco polecamy spojrzenie na dokumentację Seaorn i dowiedzieć się, jakiego parametry użyć, aby Twoja fabuła była jak najbliżej potrzeb biznesowych.

Wniosek

W tej lekcji przyjrzeliśmy się różnym aspektom tej biblioteki wizualizacji danych, których możemy użyć z Pythonem do generowania pięknych i intuicyjnych wykresów, które mogą wizualizować dane w formie, których firma chce od platformy. Seborm jest jedną z najważniejszych biblioteki wizualizacji, jeśli chodzi o inżynierię danych i prezentację danych w większości form wizualnych, zdecydowanie umiejętność, którą musimy mieć za pasem, ponieważ pozwala nam budować modele regresji liniowej.

Udostępnij swoją opinię na temat lekcji na Twitterze z @SBMaggarwal i @linuxhint.