Samouczek Anaconda Python

Samouczek Anaconda Python

Anaconda to platforma nauki danych i uczenia maszynowego dla języków programowania Python i R. Został zaprojektowany, aby proces tworzenia i dystrybucji projektów jest prosty, stabilny i powtarzalny w systemach i jest dostępny w systemie Linux, Windows i OSX. Anaconda to platforma oparta na Python, która kursuje główne pakiety nauki danych, w tym pandy, scikit-learn, scipy, numpy i platforma uczenia maszynowego Google, Tensorflow. Jest pakowany z CONDA (narzędzie instalacyjne PIP), Anaconda Navigator dla GUI wrażenia i spyder do IDE.Ten samouczek przejdzie przez niektóre podstawy Anacondy, Conda i Spyder dla języka programowania Pythona i przedstawi się w koncepcjach potrzebnych do tworzenia własnych projektów.

Instalacja

Na tej stronie znajduje się wiele świetnych artykułów do instalowania Anacondy w różnych systemach zarządzania pakietami Distro i Native. Z tego powodu podam kilka linków do tej pracy poniżej i pominę się do pokrycia samego narzędzia.

  • Centos
  • Ubuntu

Podstawy konda

CDADA to narzędzie do zarządzania pakietami i środowiskiem Anaconda, które jest rdzeniem Anaconda. To bardzo podobne do PIP z wyjątkiem, że jest zaprojektowany do pracy z zarządzaniem pakietami Python, C i R. CDADA zarządza również środowiskami wirtualnymi w sposób podobny do VirtualeNV, o których tu napisałem.

Potwierdź instalację

Pierwszym krokiem jest potwierdzenie instalacji i wersji w systemie. Poniższe polecenia sprawdzą, czy Anaconda jest zainstalowana, i wydrukuj wersję na terminalu.

$ ceda --version

Powinieneś zobaczyć podobne wyniki do poniżej. Obecnie mam wersję 4.4.7 Zainstalowane.

$ ceda --version
CDADA 4.4.7

Zaktualizuj wersję

CDADA można aktualizować za pomocą argumentu aktualizacji CDA, jak poniżej.

$ CDADA Aktualizacja CDADA

To polecenie zaktualizuje CDADA do najbardziej aktualnej wersji.

Postępuj ([y]/n)? y
Pobieranie i wyodrębnienie pakietów
CDADA 4.4.8: #########################################################. ########## | 100%
Openssl 1.0.2n: ##########################################################################. ####### | 100%
Certifi 2018.1.18: #######################################################. ##### | 100%
CA-Certificates 2017.08.26: ############################################# ° | 100%
Przygotowanie transakcji: gotowe
Weryfikacja transakcji: gotowe
Wykonanie transakcji: gotowe

Ponownie uruchamiając argument wersji, widzimy, że moja wersja została zaktualizowana do 4.4.8, który jest najnowszą wersją narzędzia.

$ ceda --version
CDADA 4.4.8

Tworzenie nowego środowiska

Aby utworzyć nowe wirtualne środowisko, uruchom poniżej serię poleceń.

$ ceda create -n samoorialconda python = 3 $ postęp ([y]/n)? y

Możesz zobaczyć pakiety, które są zainstalowane w nowym środowisku poniżej.

Pobieranie i wyodrębnienie pakietów
Certifi 2018.1.18: #######################################################. ##### | 100%
SQLITE 3.22.0: #####################################################. ######## | 100%
koło 0.30.0: #####################################################. ######### | 100%
TK 8.6.7: ######################################################. ############## | 100%
Readline 7.0: #####################################################. ######### | 100%
NCURSES 6.0: #####################################################. ########## | 100%
Libcxxabi 4.0.1: ######################################################. ###### 100%
Python 3.6.4: #########################################################. ######### | 100%
Libffi 3.2.1: ######################################################. ######### | 100%
Setuptools 38.4.0: #####################################################. ##### | 100%
LIDITIT 3.1: ######################################################. ########## | 100%
XZ 5.2.3: ########################################################. ############## | 100%
Zlib 1.2.11: #########################################################. ########## | 100%
Pip 9.0.1: ######################################################. ############ 100%
Libcxx 4.0.1: ######################################################. ######### | 100%
Przygotowanie transakcji: gotowe
Weryfikacja transakcji: gotowe
Wykonanie transakcji: gotowe
#
# Aby aktywować to środowisko, użyj:
#> Źródło Aktywuj samoorialconda
#
# Aby dezaktywować aktywne środowisko, użyj:
#> źródło dezaktywuj
#

Aktywacja

Podobnie jak VirtualeNV, musisz aktywować swoje nowo utworzone środowisko. Poniższe polecenie aktywuje twoje środowisko w Linux.

Źródło Aktywuj samoorialconda Bradleys-Mini: ~ Bradleypatton $ Source Aktywuj samouczkową
(Tutorialconda) Bradleys-Mini: ~ Bradleypatton $

Instalowanie pakietów

Polecenie listy CDA. Możesz dodać dodatkowe pakiety i ich zależności za pomocą polecenia instalacji.

$ CONDA LIST # pakiety w środowisku AT/Użytkownicy/Bradleypatton/Anaconda/Envs/TutorialConda:
#
# Nazwa wersja Kanał kompilacji
CA-Certificates 2017.08.26 HA1E5D58_0
Certifi 2018.1.18 PY36_0
Libcxx 4.0.1 H579ED51_0
Libcxxabi 4.0.1 HEBD6815_0
LIDITIT 3.1 HB4E282D_0
Libffi 3.2.1 H475C297_4
NCURSES 6.0 HD04F020_2
Openssl 1.0.2N HDBC3D79_0
Pip 9.0.1 PY36H1555ECD_4
Python 3.6.4 HC167B69_1
Readline 7.0 HC1231FA_4
Setuptools 38.4.0 PY36_0
SQLITE 3.22.0 H3EFE00B_0
TK 8.6.7 H35A86E2_3
koło 0.30.0 PY36H5EB2C71_1
XZ 5.2.3 H0278029_2
Zlib 1.2.11 HF3CBC9B_2

Aby zainstalować pandy w bieżącym środowisku, wykonasz poniższe polecenie powłoki.

$ CDADA Zainstaluj pandy

Pobiera i zainstaluje odpowiednie pakiety i zależności.

Pobrane zostaną następujące pakiety:
pakiet | zbudować
---------------------------|-----------------
LibgFortran-3.0.1 | H93005F0_2 495 KB
Pandas-0.22.0 | PY36H0A44026_0 10.0 MB
Numpy-1.14.0 | PY36H8A80B8C_1 3.9 MB
Python-Dateutil-2.6.1 | PY36H86D2ABB_1 238 KB
MKL-2018.0.1 | HFBD8650_4 155.1 MB
Pytz-2017.3 | PY36HF0BF824_0 210 KB
Six-1.11.0 | PY36H0E22D5E_1 21 KB
Intel-Openmp-2018.0.0 | H8158457_8 493 KB
------------------------------------------------------------
Ogółem: 170.3 MB
Zostaną zainstalowane następujące nowe pakiety:
Intel-Openmp: 2018.0.0-H8158457_8
LibgFortran: 3.0.1-H93005F0_2
MKL: 2018.0.1-HFBD8650_4
Numpy: 1.14.0-PY36H8A80B8C_1
Pandy: 0.22.0-PY36H0A44026_0
Python-Dateutil: 2.6.1-PY36H86D2ABB_1
Pytz: 2017.3-PY36HF0BF824_0
Six: 1.11.0-PY36H0E22D5E_1

Wykonując ponownie polecenie listy, widzimy instalację nowych pakietów w naszym środowisku wirtualnym.

Lista $ CDADA
# pakiety w środowisku AT/Users/Bradleypatton/Anaconda/Envs/TutorialConda:
#
# Nazwa wersja Kanał kompilacji
CA-Certificates 2017.08.26 HA1E5D58_0
Certifi 2018.1.18 PY36_0
Intel-Openmp 2018.0.0 H8158457_8
Libcxx 4.0.1 H579ED51_0
Libcxxabi 4.0.1 HEBD6815_0
LIDITIT 3.1 HB4E282D_0
Libffi 3.2.1 H475C297_4
LibgFortran 3.0.1 H93005F0_2
MKL 2018.0.1 HFBD8650_4
NCURSES 6.0 HD04F020_2
Numpy 1.14.0 PY36H8A80B8C_1
Openssl 1.0.2N HDBC3D79_0
Pandy 0.22.0 PY36H0A44026_0
Pip 9.0.1 PY36H1555ECD_4
Python 3.6.4 HC167B69_1
Python-Dateutil 2.6.1 PY36H86D2ABB_1
Pytz 2017.3 PY36HF0BF824_0
Readline 7.0 HC1231FA_4
Setuptools 38.4.0 PY36_0
sześć 1.11.0 PY36H0E22D5E_1
SQLITE 3.22.0 H3EFE00B_0
TK 8.6.7 H35A86E2_3
koło 0.30.0 PY36H5EB2C71_1
XZ 5.2.3 H0278029_2
Zlib 1.2.11 HF3CBC9B_2

W przypadku pakietów nie jest część repozytorium Anaconda, możesz użyć typowych poleceń PIP. Nie będę tego tutaj omawiać, ponieważ większość użytkowników Pythona będzie znana z poleceniami.

Anaconda Navigator

Anaconda obejmuje aplikację nawigatora opartego na GUI, która ułatwia życie dla rozwoju. Zawiera notatnik Spyder IDE i JUPYTER jako projekty wstępnie zainstalowane. To pozwala szybko zwolnić projekt ze środowiska komputerowego GUI.

Aby rozpocząć pracę z naszego nowo utworzonego środowiska z nawigatora, musimy wybrać nasze środowisko pod paskiem narzędzi po lewej stronie.

Następnie musimy zainstalować narzędzia, których chcielibyśmy użyć. Dla mnie to jest mianowicie Spyder Ide. Tutaj wykonuję większość moich prac naukowych i dla mnie jest to wydajna i produktywna Python IDE. Po prostu kliknij przycisk Instaluj na płytce Dock dla Spyder. Navigator zrobi resztę.

Po zainstalowaniu możesz otworzyć IDE z tej samej płytki dokującej. To uruchomi Spyder ze środowiska komputerowego.

Spyder

Spyder jest domyślną IDE dla Anacondy i jest potężny zarówno dla projektów standardowych, jak i danych w Python. Spyder IDE ma zintegrowany notebook iPython, okno edytora kodu i okno konsoli.

Spyder zawiera również standardowe możliwości debugowania i zmiennego odkrywcy, aby pomóc, gdy coś nie idzie dokładnie tak, jak planowano.

Jako ilustracja uwzględniłem małą aplikację Sklearn, która wykorzystuje losową regresję Forresta do przewidywania przyszłych cen akcji. Dołączyłem również niektóre wyjście notebookowe ipython, aby zademonstrować przydatność narzędzia.

Mam kilka innych samouczków, które napisałem poniżej, jeśli chcesz kontynuować badanie nauki o danych. Większość z nich jest napisana z pomocą Anacondy, a Spyder Abnd powinien bezproblemowo działać w środowisku.

  • Pandy-data-frame-tutorial
  • Psycopg2-Weutoral
  • Kwant
importować pandy jako PD
z danych importowania pandas_datareader
importować Numpy jako NP
importować talib jako ta
ze Sklearn.cross_validation import Train_Test_Split
ze Sklearn.Linear_model import liniowy
ze Sklearn.Metryki import Mean_Squared_error
ze Sklearn.Ensemble Import RandomForeStregressor
ze Sklearn.Metryki import Mean_Squared_error
def get_data (symbole, start_date, end_date, symbol):
Panel = dane.Datareader (symbole, „yahoo”, start_date, end_date)
df = panel [„zamknij”]
Wydrukuj (DF.głowa (5))
Wydrukuj (DF.ogon (5))
Wydrukuj df.loc [„2017-12-12”]
Wydrukuj df.loc [„2017-12-12”, symbol]
Wydrukuj df.loc [:, symbol]
df.Fillna (1.0)
df [„rsi”] = ta.RSI (NP.tablica (DF.ILOC [:, 0]))
df [„SMA”] = Ta.SMA (NP.tablica (DF.ILOC [:, 0]))
df [„bbandsu”] = ta.Bbands (NP.tablica (DF.ILOC [:, 0])) [0]
df [„bbandsl”] = ta.Bbands (NP.tablica (DF.ILOC [:, 0])) [1]
df [„rsi”] = df [„rsi”].Shift (-2)
df [„SMA”] = df [„SMA”].Shift (-2)
df [„bbandsu”] = df [„bbandsu”].Shift (-2)
df [„bbandsl”] = df [„bbandsl”].Shift (-2)
df = df.Fillna (0)
Wydrukuj df
pociąg = df.próbka (FRAC = 0.8, Random_State = 1)
test = df.loc [~ df.indeks.isin (pociąg.indeks)]
Drukuj (pociąg.kształt)
Drukuj (test.kształt)
# Pobierz wszystkie kolumny z DataFrame.
kolumny = df.kolumny.notować()
Drukuj kolumny
# Przechowuj zmienną, na której będziemy przewidywać.
cel = symbol
# Zainicjuj klasę modelu.
Model = RandomForeStregressor (N_ESTIMators = 100, min_samples_leaf = 10, losowo_state = 1)
# Dopasuj model do danych treningowych.
Model.fit (pociąg [kolumny], trening [cel])
# Wygeneruj nasze prognozy dla zestawu testowego.
prognozy = model.przewidy (test [kolumny])
Wydrukuj „Pred”
Prognozy wydruku
#df2 = pd.DataFrame (data = prognozy [:])
#print df2
#df = pd.Conat ([test, df2], oś = 1)
# Błąd obliczania między naszymi prognozami testowymi a wartościami rzeczywistymi.
Wydrukuj „Mean_squared_error:” + str (Mean_squared_error (prognozy, test [cel])))
zwrócić df
def normalize_data (df):
zwróć DF / DF.ILOC [0,:]
def plot_data (df,):
ax = df.Wykres (tytuł = tytuł, fontsize = 2)
topór.set_xlabel („data”)
topór.set_ylabel („cena”)
działka.pokazywać()
def tutorial_run ():
#Choleose Symbole
symbol = "egrx"
symbole = [symbol]
#otrzymać dane
df = get_data (symbole, „2005-01-03”, „2017-12-31”, symbol)
Normalize_Data (DF)
Plot_Data (DF)
Jeśli __name__ == "__main__":
Tutorial_run () Nazwa: EGRX, długość: 979, Dtype: float64
Egrx rsi SMA Bbandsu Bbandsl
Data
2017-12-29 53.419998 0.000000 0.000000 0.000000 0.000000
2017-12-28 54.740002 0.000000 0.000000 0.000000 0.000000
2017-12-27 54.160000 0.000000 0.000000 55.271265 54.289999
Wniosek

Anaconda to świetne środowisko dla nauki danych i uczenia maszynowego w Python. W zestawie repozytorium wyselekcjonowanych pakietów, które są zaprojektowane do współpracy dla potężnej, stabilnej i powtarzalnej platformy nauki danych. Pozwala to programistom rozpowszechniać swoją treść i zapewnić, że przyniesie on te same wyniki między maszynami i systemami operacyjnymi. Jest wyposażony w wbudowane narzędzia, aby ułatwić życie, tak jak nawigator, który pozwala łatwo tworzyć projekty i przełączać środowiska. To mój cel opracowywania algorytmów i tworzenia projektów do analizy finansowej. Uważam nawet, że używam większości moich projektów Python, ponieważ znam środowisko. Jeśli chcesz zacząć w Python i Data Science, Anaconda jest dobrym wyborem.