Samouczek Python Python

Samouczek Python Python
Plotly to firma analityczna znana z opracowywania analizy, statystyki i grafiki w czasie rzeczywistym do aplikacji internetowych i samodzielnych skryptów Python. W tej lekcji przyjrzymy się podstawowym przykładom z fabuły i zbudujemy proste i intuicyjne wykresy danych, które będą miały w 100% interaktywne, a jednocześnie łatwe do zaprojektowania. Te wykresy mogą być używane w prezentacjach, ponieważ są w pełni interaktywne i gotowe do zabawy.

Istnieje również opcja zapisania projektu wykresu w trybie offline, aby można je było łatwo wyeksportować. Istnieje wiele innych funkcji, które bardzo ułatwia wykorzystanie biblioteki:

  • Zapisz wykresy dla użytkowania offline jako grafiki wektorowe, które są wysoce zoptymalizowane do celów drukowania i publikacji
  • Eksportowane wykresy są w formacie JSON, a nie w formacie obrazu. Ten JSON można załadować do innych narzędzi do wizualizacji, takich jak Tableau łatwo lub manipulować Pythonem lub R
  • Ponieważ wykresy eksportowane mają charakter JSON, praktycznie bardzo łatwo jest osadzić te wykresy w aplikację internetową
  • Plotly jest dobrą alternatywą dla Matplotlib do wizualizacji

Aby rozpocząć korzystanie z pakietu Planly, musimy zarejestrować konto na stronie wspomnianej wcześniej, aby uzyskać prawidłową nazwę użytkownika i klawisz API, z którym możemy zacząć korzystać z jego funkcji. Na szczęście plan bezpłatny jest dostępny na spiski, z którymi mamy wystarczającą liczbę funkcji, aby wykonać wykresy klasy produkcyjnej.

Instalowanie plotly

Tylko notatka przed rozpoczęciem, możesz użyć środowiska wirtualnego do tej lekcji, którą możemy wykonać za pomocą następującego polecenia:

Python -m Virtualenv plotly
Źródło Numpy/Bin/Aktywuj

Gdy środowisko wirtualne jest aktywne, możesz zainstalować bibliotekę fabularną w Virtual Env, aby można było wykonać przykłady:

PIP instaluj plotly

W tej lekcji skorzystamy z Anacondy i Jupytera. Jeśli chcesz zainstalować go na swoim komputerze, spójrz na lekcję opisującą „Jak zainstalować Anaconda Python na Ubuntu 18.04 lts ”i podziel się swoją opinią, jeśli napotykasz jakiekolwiek problemy. Aby zainstalować plotly z Anaconda, użyj następującego polecenia w terminalu z Anaconda:

CDEDA instaluj -C reltyntnie

Widzimy coś takiego, kiedy wykonujemy powyższe polecenie:

Po zainstalowaniu i zakończeniu wszystkich potrzebnych pakietów możemy zacząć od korzystania z biblioteki plotly z następującą instrukcją importu:

importować fabuły

Po zorganizowaniu konta na plotkom potrzebujesz dwóch rzeczy - nazwy użytkownika konta i klucza API. Może być tylko jeden klucz API należący do każdego konta. Więc dbaj o to, jakbyś go zgubił, musisz zregenerować klucz, a wszystkie stare aplikacje za pomocą starego klucza przestaną działać.

We wszystkich programach Python, które piszesz, wspomnij o poświadczeniach w następujący sposób, aby rozpocząć pracę z fabułą:

spiski.narzędzia.set_credentials_file (nazwa użytkownika = „nazwa użytkownika”, api_key = „your-ap-key”)

Zacznijmy teraz z tą biblioteką.

Rozpoczęcie działalności

Będziemy korzystać z następującego importu w naszym programie:

importować pandy jako PD
importować Numpy jako NP
Importuj Scipy jako SP
importować fabuły.spiskuj jak Py

Korzystamy z:

  • Pandy do skutecznego odczytu plików CSV
  • Numpy za proste operacje tabelaryczne
  • Scipy do obliczeń naukowych
  • Dowód do wizualizacji

W przypadku niektórych przykładów skorzystamy z własnych zestawów danych Planly dostępnych w GitHub. Na koniec należy pamiętać, że możesz włączyć tryb offline również do spisku, gdy trzeba uruchomić skrypty plotly bez połączenia sieciowego:

importować pandy jako PD
importować Numpy jako NP
Importuj Scipy jako SP
importować fabuły
spiski.offline.init_notebook_mode (podłączony = true)
importować fabuły.offline jak Py

Możesz uruchomić następującą instrukcję, aby przetestować instalację fabularną:

Drukuj (fabuły.__wersja__)

Widzimy coś takiego, kiedy wykonujemy powyższe polecenie:

W końcu pobramy zestaw danych z panami i wizualizujemy go jako tabelę:

importować fabuły.Figura_Factory jako ff
df = pd.read_csv ("https: // raw.Githubusercontent.com/plotly/danych/master/szkoła_
zyski.CSV ”)
Tabela = ff.create_table (df)
py.iplot (tabela, nazwa pliku = „tabela”)

Widzimy coś takiego, kiedy wykonujemy powyższe polecenie:

Teraz skonstruujmy Wykres słupkowy Aby wizualizować dane:

importować fabuły.Graph_ObJs jak Go
data = [Go.Pasek (x = df.Szkoła, y = df.Kobiety)]
py.Iplot (dane, nazwa pliku = „Women-Bar”)

Widzimy coś takiego, kiedy wykonujemy powyższy fragment kodu:

Gdy zobaczysz powyższą tabelę z notebookiem JUPYTER, otrzymasz różne opcje powiększania/out nad określoną sekcją wykresu, Box & Lasso.

Zgłoszone wykresy barowe

Wiele wykresów barowych można bardzo łatwo zgrupować w celu porównywania z fabuły. Skorzystajmy z tego samego zestawu danych i pokazujmy różnice mężczyzn i kobiet obecności na uniwersytetach:

Kobiety = idź.Pasek (x = df.Szkoła, y = df.Kobiety)
mężczyźni = idź.Pasek (x = df.Szkoła, y = df.Mężczyźni)
dane = [mężczyźni, kobiety]
Layout = Go.Layout (BARMODE = "Group")
Fig = Go.Rysunek (dane = dane, Layout = Layout)
py.Iplot (ryc.)

Widzimy coś takiego, kiedy wykonujemy powyższy fragment kodu:

Chociaż wygląda dobrze, etykiety w prawym górnym rogu nie są, prawda! Poprawmy je:

Kobiety = idź.Pasek (x = df.Szkoła, y = df.Kobiety, nazwa = „Women”)
mężczyźni = idź.Pasek (x = df.Szkoła, y = df.Mężczyźni, nazwa = „Men”)

Wykres wygląda teraz znacznie bardziej opisowo:

Spróbujmy zmienić Barmode:

Layout = Go.Layout (BARMODE = "CONTATING")
Fig = Go.Rysunek (dane = dane, Layout = Layout)
py.Iplot (ryc.)

Widzimy coś takiego, kiedy wykonujemy powyższy fragment kodu:

Wykresy kołowe z plotly

Teraz postaramy się zbudować wykres kołowy z fabułą, która ustanawia podstawową różnicę między odsetkiem kobiet na wszystkich uniwersytetach. Nazwa uniwersytetów będzie to etykiety, a rzeczywiste liczby zostaną użyte do obliczenia procentu całości. Oto fragment kodu dla tego samego:

Trace = Go.Ciasto (etykiety = df.Szkoła, wartości = df.Kobiety)
py.iplot ([trace], nazwa pliku = „pie”)

Widzimy coś takiego, kiedy wykonujemy powyższy fragment kodu:

Dobrą rzeczą jest to, że plotly ma wiele funkcji powiększania i wychodzenia oraz wieloma innymi narzędziami do interakcji z skonstruowaną tabelą.

Wizualizacja danych szeregów czasowych za pomocą fabuły

Wizualizacja danych szeregowych jest jednym z najważniejszych zadań, które pojawia się, gdy jesteś analitykiem danych lub inżynierem danych.

W tym przykładzie skorzystamy z oddzielnego zestawu danych w tym samym repozytorium GitHub, ponieważ wcześniejsze dane nie dotyczyły żadnych danych złożonych w czasie. Podobnie jak tutaj, z czasem wykreślamy odmianę akcji rynkowych Apple:

Financial = Pd.read_csv ("https: // raw.Githubusercontent.com/plotly/danych/master/
Finanse-Marts-Apple.CSV ”)
data = [Go.Rozproszenie (x = finansowe.Data, y = finanse ['aapl.Zamknąć'])]
py.Iplot (dane)

Widzimy coś takiego, kiedy wykonujemy powyższy fragment kodu:

Po unoszeniu myszy nad linią zmiany wykresu możesz określić szczegóły punktu:

Możemy użyć przycisków powiększania i wychodzenia, aby zobaczyć dane specyficzne dla każdego tygodnia.

Wykres OHLC

Wykres OHLC (otwarty niski blisko) służy do wykazania zmienności jednostki w okresie czasu. Jest to łatwe do zbudowania za pomocą Pyplot:

z datetime import datetime
Open_Data = [33.0, 35.3, 33.5, 33.0, 34.1]
high_data = [33.1, 36.3, 33.6, 33.2, 34.8]
Low_Data = [32.7, 32.7, 32.8, 32.6, 32.8]
close_data = [33.0, 32.9, 33.3, 33.1, 33.1]
Daty = [datetime (rok = 2013, miesiąc = 10, dzień = 10),
DateTime (rok = 2013, miesiąc = 11, dzień = 10),
DateTime (rok = 2013, miesiąc = 12, dzień = 10),
DateTime (rok = 2014, miesiąc = 1, dzień = 10),
DateTime (rok = 2014, miesiąc = 2, dzień = 10)]
Trace = Go.OHLC (x = daty,
Open = Open_Data,
High = High_Data,
Low = Low_Data,
Close = Close_Data)
dane = [śledzenie]
py.Iplot (dane)

Tutaj dostarczyliśmy przykładowe punkty danych, które można wywnioskować w następujący sposób:

  • Otwarte dane opisują stopę akcji po otwarciu rynku
  • Wysokie dane opisują najwyższą stawkę akcji osiągniętą w danym okresie czasu
  • Niskie dane opisują najniższą stopę akcji osiągniętej w danym okresie czasu
  • Zamknięte dane opisują tempo zapasów zamykających, gdy dany przedział czasowy się skończył

Teraz uruchommy fragment kodu, który podaliśmy powyżej. Widzimy coś takiego, kiedy wykonujemy powyższy fragment kodu:

Jest to doskonałe porównanie sposobu ustanowienia porównań czasowych podmiotu z własnym i porównywaniem go z wysokimi i niskimi osiągnięciami.

Wniosek

W tej lekcji przyjrzeliśmy się innej bibliotece wizualizacji, która jest doskonałą alternatywą dla Matplotlib w aplikacjach klasy produkcyjnej, które są eksponowane jako aplikacje internetowe, Plotly jest bardzo dynamiczną i bogatą w funkcje bibliotekę do użytku do celów produkcyjnych, więc zdecydowanie jest to zdecydowanie jest to umiejętność, którą musimy mieć za pasem.

Znajdź cały kod źródłowy użyty w tej lekcji na GitHub. Udostępnij swoją opinię na temat lekcji na Twitterze z @SBMaggarwal i @linuxhint.