Wdrażaj podstawowe modele uczenia maszynowego za pomocą Turi Create w Linux

Wdrażaj podstawowe modele uczenia maszynowego za pomocą Turi Create w Linux

Turi Create to biblioteka Python, która jest tworzona przez Apple w celu łatwego wdrażania kompleksowych algorytmów uczenia maszynowego i analizy danych. Jest to biblioteka open source, która pozwala użytkownikom skorzystać z tego potężnego narzędzia bezpłatnie. Zawiera implementacje zarówno dla technik uczenia się nadzorowanego, jak i bez nadzoru, które obejmują zadania klasyfikacyjne, zadania regresji, algorytmy grupowe, zadania wykrywania obiektów i wiele innych. Umożliwia także użytkownikom tworzenie niestandardowych algorytmów uczenia maszynowego poprzez włączenie podstawowych podstaw uczenia maszynowego i analizy danych.

Pomimo tego, że Apple jest dostępny na wszystkich trzech głównych platformach, w tym Apple, Linux i Windows, co dodatkowo zwiększa jego użyteczność w świecie uczenia się z obfitych danych. Podstawową zaletą, którą tworzy Turi, oferuje swoim użytkownikom w innych tradycyjnych bibliotekach i frameworkach analityczny. Osoby, które nie są dokładnie biegłe dzięki złożonym uczeniu maszynowym i analizie danych, mogą skorzystać z tej biblioteki ze względną łatwością i wykonywać swoje zadania bez znacznego wysiłku w naukę tajników tych algorytmów. Jednym z głównych konkurentów tej biblioteki jest Scikit Learn, który jest obficie używany w większości zadań uczenia maszynowego, ale jest nieco złożony do nauki i wdrażania.

Najważniejszym warunkiem rozpoczęcia od Turi Create jest pobieżna znajomość Pythona i jego podstaw programowania. Turi Create pozwala użytkownikom pracować z różnymi formami danych, w tym danych tabelarycznych, danych tekstowych, wykresów i innych. Oferując niestandardowe typy danych dla kontenerów, które przypominają niektóre z najczęściej używanych typów danych, takich jak DataFrame, ta biblioteka sprawia, że ​​przechowywanie i przetwarzanie danych jest naprawdę proste i łatwe.

Należy zauważyć, że Turi Create jest dostępny w następujących wersjach Python: 2.7, 3.5, 3.6, 3.7 i 3.8. Nadaje się do udostępnienia go nowszymi wersjami.

Przewodnik instalacyjny

Aby rozpocząć od instalacji Turi Utwórz, musisz najpierw upewnić się, że wcześniej uruchamiasz wersję Pythona z wymienionej listy. Jeśli używasz starszej lub nowszej wersji, musisz zaktualizować lub obniżyć do innej wersji, aby móc uruchomić Turi Create. W przeciwnym razie otrzymasz następujący błąd, jeśli spróbujesz go zainstalować z inną wersją Pythona niż te, które są wymienione:


Ponieważ Turi Create to pakiet biblioteki Python, można go używać tylko poprzez kod Python. Dlatego, aby go zainstalować, korzystamy z menedżera pakietów Python o nazwie „PIP”. Możesz także użyć „CDADA” do zainstalowania tej biblioteki, jeśli używasz platformy AnaConda do swojego Python Development. Do celów tego przewodnika instalacyjnego używamy PIP.

Notatka: Zawsze dobrym pomysłem jest zainstalowanie dowolnego pakietu we własnym środowisku, aby nie powodował żadnego błędu i problemu z innymi pakietami w globalnym zakresie pakietu Python.

1. Uruchom następujące polecenie w terminalu, aby zainstalować Turi Utwórz za pomocą PIP:

$ PIP Instaluj turirat

Dzięki temu Turi Create powinien zostać pobrany i zainstalowany na komputerze Linux za pomocą menedżera pakietów PIP dla Pythona.

Podręcznik użytkownika

Jak wspomniano wcześniej, ponieważ Turi Create to pakiet Python, można go używać za pomocą kodu Pythona. Aby rozpocząć pracę z Turi Create, tworzymy plik Python (.PY) lub notatnik Python (.ipynb).

Zaczynamy od importu Turi Create do naszego środowiska pracy:

Zamębiaj turicreate jako TC


Teraz, gdy zaimportowaliśmy Turi Create, importujemy zestaw danych do pracy. Może to być każdy zestaw danych, który spełnia wymagania dotyczące rodzajów danych, z którymi tworzy Turi. Używamy zestawu danych ADNI dla pacjentów z chorobą Alzheimera. Ten zestaw danych jest klasycznym przykładem klasyfikacji dla nadzorowanych zadań edukacyjnych.

Data = TC.Sframe.read_csv ("./12_Months_Joint.CSV ”)


Słowo kluczowe SFrame to implementacja typu danych, która jest bardzo zbliżona do jego funkcjonalności jako ramka danych. Podczas ładowania danych do srame z pliku wartości oddzielonej przecinka, dane są przechowywane w formie tabeli z funkcjami tabeli jako nazwy kolumn i rekordów jako wierszy.

Możemy teraz podzielić te dane na próbki szkoleniowe i testujące przy użyciu metody „landom_split” i określić procent potrzebnych danych w próbce szkoleniowej.

Train_Data, test_data = dane.Random_split (0.8)


Teraz, gdy dane są przetwarzane w próbkach szkoleniowych i testowych, możemy zacząć od wdrożenia binarnego klasyfikatora na tych danych, abyśmy mogli później przetestować i określić wydajność naszego modelu.

binary_classifier = tc.logistic_classifier.Utwórz (Train_Data, Target = „Cov”)


Dzięki temu model zaczyna się uczyć i powoli zbiega się do najbardziej optymalnego rozwiązania, jakie można znaleźć. Możemy uzyskać podsumowanie modelu i uczenie się, uruchamiając następujące polecenie:

Binary_classifier.streszczenie()


Możemy dalej zapytać model, który stworzyliśmy o przewidywanie wyników danych testowych za pomocą następującego fragmentu kodu:

Prognozy = binary_classifier.przewidy (test_data)


Możemy porównać przewidywane wartości z oryginalnymi wartościami docelowymi w test_data, aby znaleźć wydajność tego modelu.

Możemy dodatkowo użyć innej biblioteki, takiej jak Matplotlib, aby stworzyć wyspecjalizowane wizualizacje wydajności, takie jak macierze pomieszania i wykresy.

Wniosek

Z wieloma złożonymi bibliotekami i pakietami uczenia maszynowego, z którymi można pracować, może stać się męczącym i wyczerpującym zadaniem łatwe wdrożenie algorytmów uczenia się. Biblioteki takie jak Sklearn wdrażają najbardziej inteligentne algorytmy, ale są one z krzywą uczenia się, z którą większość ludzi nie czuje się komfortowo. Turi Create zapewnia łatwe wdrożenie większości tych technik uczenia się bez kompleksowych ćwiczeń uczenia się. Jego łatwa implementacja algorytmiczna i jeszcze prostsze wykonywanie sprawiają, że jest to bardzo łatwa biblioteka do polecania uczenia maszynowego i analizy. Dla nowych początkujących i początkujących analityków ta biblioteka jest najlepszym rozwiązaniem dla wszystkich ich potrzeb analitycznych.