Jak instalować i używać MOA w Linux

Massive Online Analytics (MOA) to bezpłatne korzystanie z oprogramowania typu open source, które pozwala użytkownikom pracować ze strumieniami danych. Strumienie danych to ciągłe pakiety danych, które są nadawane w czasie rzeczywistym, aby być używane podczas ich odbierania. To, co sprawia, że MoA jest wyjątkowe, jest to, że jest on w stanie odbierać strumienie danych jako dane wejściowe i skalować wykonywanie podstawowego algorytmu, aby pasować do potrzeb przychodzących danych.

MOA jest szeroko wykorzystywany przez społeczność nauki danych do generowania wglądu na dane, które mają charakter ciągły. Zawiera klastrowanie, klasyfikację, regresję, wykrywanie odstające, dryf koncepcyjny i aktywne algorytmy uczenia się, które mogą wykorzystywać przychodzące strumienie danych do generowania cennych wniosków. Wnioski te można następnie ocenić za pomocą wbudowanych algorytmów oceny.

Narzędzia takie jak MOA, które są wyposażone w intuicyjne graficzne interfejsy użytkownika, ułatwiają wszystkim tworzenie złożonych algorytmów, które są w stanie generować przydatne informacje na temat danych, które w przeciwnym razie wymagałyby kodowania w języku programowym. MOA pozwala osobom z tła nieprogramowania na pracę ze złożonymi modelami uczenia maszynowego, a także umożliwia im uzyskanie cennych wyników jako wyjść w różnych formach, w tym wykresy, tabelach i wykresach.

Instalacja

Aby zainstalować MOA na dowolnym komputerze Linux, zaczynamy od pobrania pliku MOA.

1. Pobierz plik na stronie MOA.

2. Po pobraniu pliku wyodrębniamy pobrany plik i umieszczamy go tam, gdzie go potrzebujemy.

3. Teraz otwieramy wyodrębniony folder i przechodzimy do katalogu głównego dla MOA.

4. Po przejściu do katalogu głównego otwieramy tutaj instancję terminala, klikając prawym przyciskiem myszy i wybierając Otwarte w terminalu opcja.

5. Teraz uruchamiamy następujące polecenie, aby wykonać MOA na dowolnym komputerze Linux:

$ bin/moa.cii

Powinieneś uzyskać wyjście terminala podobne do tego:

Dzięki temu instancja MOA powinna rozpocząć wykonanie na maszynie Linux.

Wygląda na coś podobnego do tego:

Podręcznik użytkownika

Z Moa Teraz zainstalowany i gotowy do użycia na komputerze Linux, możesz rozpocząć budowanie przepływu pracy analizy danych.

Na początek, musisz kliknąć Skonfiguruj opcja u góry graficznego interfejsu użytkownika MOA. Zapewnia to różne kategorie i opcje, które możesz wybrać i wybrać na podstawie tego, jaki rodzaj modelu eksploracji danych wymaga konkretnej aplikacji.

Do tego eksperymentu tworzymy Klasyfikacja Model, wybierając opcję klasyfikacji po lewej stronie.

Trzy główne kategorie, które możesz zmienić, a raczej wybrać, to Uczeń, Strumień, I Ewaluator.

Uczeń

To określa, jakiego rodzaju modelu chcesz wykorzystać swój przepływ pracy do szkolenia danych. Istnieje wiele opcji do wyboru, z których niektóre to:

1. NaiveBayes
2. MultinomialnaiveBayes
3. Klasa większościowa
4. DriftdetectionMethodclassifer

Do tego eksperymentu używamy MultinomialnaiveBayes Model.

Strumień

To określa, jakie instancje danych chcemy, aby nasz model wygenerował. Istnieje wiele opcji do wyboru, które obejmują:

1. RandomTreeGenerator
2. StagGenerator
3. Seagenerator
4. FAVEFORMGEELOROR

Ta opcja zależy w szczególności od rodzaju wygenerowanych instancji wymaganych przez Twój przypadek użycia.

Używamy FAVEFORMGEELOROR dla tego przewodnika.

Ewaluator

Określa to rodzaj oceny, przez którą chcemy, aby wygenerowane wyniki przeszły. Istnieją trzy główne opcje do wyboru w tej kategorii, które obejmują:

1. BasicClassificationPerformanceEvaluator
2. FadingFactorClassificationPerformanceEvaluator
3. WindowClassificationPerformanceEvaluator

Używamy Klasyfikacja okien ewaluator z precyzją, przywołaniem, precyzją na klasę, wycofanie na klasę i wynik F1 na klasę, wszystkie są wyniki w wyniku. Te wskaźniki wydajności pomagają nam lepiej zrozumieć cenę rozmieszczenia klasy i wyniki wydajności indywidualnie dla naszych danych.

Istnieją inne opcje po trzech głównych opcjach związanych z modelem, które możemy również poprawić. Obejmują one takie rzeczy, jak ograniczenie liczby wystąpień do modelu i informacji o tym, gdzie wyświetlić wyniki prognozy generowane przez model. Zostawimy ich do ich domyślnych ustawień, ponieważ nie są one wymagane do celów tego eksperymentu.

Po zakończeniu konfiguracji modelu w celu spełnienia naszych dokładnych potrzeb klikamy Uruchomić opcja, która zasadniczo wykonuje model takim. Ponieważ ciągłe dane są przekazywane przez strumienie danych, nadal uruchamia iteracje modelu, ponieważ nadal odbiera dane jako dane wejściowe. Z każdą uruchamianą iteracją wyniki, które generuje, są wyświetlane na ekranie.

Poniższy obraz pokazuje różne wyniki, które wygenerował model. Obejmują one kategorie takie jak liczba przypadków, które wyszkolił model, oraz czas oceny, który procesor przyjmował w celu wygenerowania wyników tych danych.

Jeśli przewijamy dalej, możemy zobaczyć, jak mądre wskaźniki wydajności są wysyłane. Te wskaźniki wydajności mówią nam, że klasy precyzji, wycofania i wyniki F1. Z których wszystkie są włączone podczas etapu konfiguracji w tworzeniu modelu.

Wniosek

Świat analizy danych ma wiele narzędzi, które można wykorzystać do realizacji przepływów pracy w zakresie eksploracji danych. Niektóre z nich są zawierane z graficznymi interfejsami użytkownika, podczas gdy inne są oparte na ściśle programowaniu. Ogromna analityka online jest jednym z takich narzędzi, które korzysta z intuicyjnego GUI. Pomaga to osobom o niewielkim lub żadnym doświadczeniu programowania, aby również tworzyć i wykonywać złożone inteligentne modele, które pomagają im generować wyniki w ich strumieniach danych.

Kluczową zaletą korzystania z MOA jest to, że umożliwia użytkownikom pracę ze strumieniami danych. Oznacza to, że algorytmy analizy danych w czasie rzeczywistym można tworzyć i wykorzystywać dla niektórych przypadków użycia. W rezultacie to narzędzie stało się rozwiązaniem dla większości aplikacji generowania wnioskowania w czasie rzeczywistym.

Pyton

Python Chmod

„OS.Chmod () ”Funkcja modułu OS służy do zmiany własności pliku Pythona poprzez akceptowanie ścieżki...

Maja Kucharski

Pyton

MATPLOTLIB 2D Histogram

W Python „plt.Hist2d () ”funkcja modułu„ Pyplot ”w bibliotece„ Matplotlib ”służy do wykreślania hist...

Maja Kucharski

Siły sprzedaży

Salesforce Data Loader

Samouczek na temat wstawienia, usuwania i aktualizacji danych Salesforce oraz jak importować/wyekspo...

Larysa Witczak