To wygląda na wiele do omówienia. Zacznijmy już teraz.
Co to jest biblioteka Python Seaorn?
Seaborn Library to pakiet Python, który pozwala nam tworzyć infografiki na podstawie danych statystycznych. Jak jest wytwarzany na Matplotlib, więc jest z nim z natury kompatybilny. Ponadto obsługuje strukturę danych Numpy i Pandy, aby wykreślić bezpośrednio z tych kolekcji.
Wizualizacja złożonych danych jest jedną z najważniejszych rzeczy, o które opiekuje się Searn. Gdybyśmy porównać Matplotlib z Seaborn, Seaorn jest w stanie ułatwić te rzeczy, które trudno jest osiągnąć za pomocą matplotlib. Należy jednak zauważyć, że zauważa Seorborn nie jest alternatywą dla matplotlibu, ale jego uzupełnieniem. Podczas tej lekcji będziemy korzystać z funkcji MATPlotlib również w fragmentach kodu. Wybierzesz współpracę z Seaborn w następujących przypadkach użycia:
Tylko notatką przed rozpoczęciem jest to, że używamy wirtualnego środowiska do tej lekcji, którą wykonaliśmy za pomocą następującego polecenia:
Python -m Virtualenv SeorbornGdy środowisko wirtualne będzie aktywne, możemy zainstalować bibliotekę Seaorn w wirtualnej Env, aby można było wykonać przykłady:
PIP Instaluj SeaornMożesz również użyć AnaConda, aby uruchomić te przykłady, co jest łatwiejsze. Jeśli chcesz zainstalować go na swoim komputerze, spójrz na lekcję opisującą „Jak zainstalować Anaconda Python na Ubuntu 18.04 lts ”i podziel się swoją opinią. Teraz przejdźmy do różnych rodzajów działek, które można zbudować za pomocą Python Searn.
Za pomocą zestawu danych Pokemon
Aby utrzymać tę lekcję, użyjemy zestawu danych Pokemon, który można pobrać z Kaggle. Aby zaimportować ten zestaw danych do naszego programu, będziemy korzystać z Biblioteki Pandy. Oto wszystkie import, który wykonujemy w naszym programie:
importować pandy jako PDTeraz możemy zaimportować zestaw danych do naszego programu i pokazać niektóre przykładowe dane z panami jako:
df = pd.read_csv ('pokemon.csv ', index_col = 0)Zauważ, że aby uruchomić powyższy fragment kodu, zestaw danych CSV powinien być obecny w tym samym katalogu co sam program. Po uruchomieniu powyższego fragmentu kodu zobaczymy następujące dane wyjściowe (w notatniku Anaconda Jupyter):
Wykreślanie krzywej regresji liniowej
Jedną z najlepszych rzeczy w Seatorn jest inteligentne funkcje wykonywania, które zapewnia, które nie tylko wizualizują dostarczany przez nas zestaw. Na przykład możliwe jest skonstruowanie wykresu regresji liniowej z pojedynczym wierszem kodu. Oto jak to zrobić:
Sns.lmplot (x = „atak”, y = „obrona”, data = df)Po uruchomieniu powyższego fragmentu kodu zobaczymy następujące dane wyjściowe:
Zauważyliśmy kilka ważnych rzeczy w powyższym fragmencie kodu:
Nie bój się, jeśli pomyślałeś, że nie możemy mieć fabuły bez tej linii regresji. Możemy ! Wypróbujmy teraz nowy fragment kodu, podobny do ostatniego:
Sns.lmplot (x = „atak”, y = „obrona”, data = df, fit_reg = false)Tym razem nie zobaczymy linii regresji w naszej fabule:
Teraz jest to o wiele bardziej jasne (jeśli nie potrzebujemy linii regresji liniowej). Ale to jeszcze nie koniec. Searorn pozwala nam stworzyć inną tę działkę i to właśnie będziemy robić.
Konstruowanie działek
Jedną z największych cech w Searnorn jest to, jak łatwo akceptuje strukturę Pandas DataFrame do wykreślania danych. Możemy po prostu przekazać ramkę danych do biblioteki Seaorn, aby mogła z niej zbudować:
Sns.boxplot (data = df)Po uruchomieniu powyższego fragmentu kodu zobaczymy następujące dane wyjściowe:
Możemy usunąć pierwsze odczyt Total, ponieważ wygląda to trochę niezręcznie, gdy faktycznie wykreślamy poszczególne kolumny tutaj:
Po uruchomieniu powyższego fragmentu kodu zobaczymy następujące dane wyjściowe:
Fabuła roju z morską
Możemy zbudować intuicyjną działkę roju z Seborn. Ponownie będziemy używaćframe danych z pandy, które załadowaliśmy wcześniej, ale tym razem będziemy nazywać funkcję pokazową Matplotlib, aby pokazać wykonany przez nas działek. Oto fragment kodu:
Sns.set_context („papier”)Po uruchomieniu powyższego fragmentu kodu zobaczymy następujące dane wyjściowe:
Korzystając z kontekstu morskiego, pozwalamy Searornowi dodać osobisty dotyk i płynną konstrukcję fabuły. Możliwe jest jeszcze bardziej dostosowanie tego wykresu do niestandardowego rozmiaru czcionki używanej do etykiet w fabule, aby ułatwić odczyt. Aby to zrobić, będziemy przekazywać więcej parametrów do funkcji set_context, która działa tak jak to, co brzmią. Na przykład, aby zmodyfikować rozmiar czcionki etykiet, skorzystamy z czcionki.Parametr rozmiaru. Oto fragment kodu do modyfikacji:
Po uruchomieniu powyższego fragmentu kodu zobaczymy następujące dane wyjściowe:
Rozmiar czcionki dla etykiety został zmieniony na podstawie dostarczonych parametrów i wartości powiązanej z czcionką.Parametr rozmiaru. Jedną rzeczą, w której Seborn jest ekspertem, jest uczynienie fabuły bardzo intuicyjnym dla praktycznego wykorzystania, a to oznacza, że Searorn to nie tylko pakiet Python, ale w rzeczywistości coś, co możemy wykorzystać w naszych wdrażaniach produkcyjnych.
Dodanie tytułu do działek
Łatwo jest dodać tytuły do naszych działek. Musimy tylko zastosować prostą procedurę korzystania z funkcji poziomu osi, w których wywołamy set_title () funkcjonuj tak, jak pokazujemy w fragmencie kodu tutaj:
Sns.set_context („papier”, font_scale = 3, rc = "czcionka.rozmiar „: 8” osie.LATELESIZE ": 5)Po uruchomieniu powyższego fragmentu kodu zobaczymy następujące dane wyjściowe:
W ten sposób możemy dodać o wiele więcej informacji do naszych działek.
Seaorn vs Matplotlib
Gdy spojrzeliśmy na przykłady w tej lekcji, możemy określić, że Matplotlib i Searbor. Jedną z funkcji, które zajmują Searorn 1 krok do przodu, jest sposób, w jaki Seaorn może wizualizować dane statystycznie.
Aby najlepiej wykorzystać parametry morskie, gorąco polecamy spojrzenie na dokumentację Seaorn i dowiedzieć się, jakiego parametry użyć, aby Twoja fabuła była jak najbliżej potrzeb biznesowych.
W tej lekcji przyjrzeliśmy się różnym aspektom tej biblioteki wizualizacji danych, których możemy użyć z Pythonem do generowania pięknych i intuicyjnych wykresów, które mogą wizualizować dane w formie, których firma chce od platformy. Seborm jest jedną z najważniejszych biblioteki wizualizacji, jeśli chodzi o inżynierię danych i prezentację danych w większości form wizualnych, zdecydowanie umiejętność, którą musimy mieć za pasem, ponieważ pozwala nam budować modele regresji liniowej.
Udostępnij swoją opinię na temat lekcji na Twitterze z @SBMaggarwal i @linuxhint.