Jak instalować i używać Apache Mahout w Linux

Jak instalować i używać Apache Mahout w Linux

Kornak to projekt open source przez Apache Software Foundation. Służy do tworzenia algorytmów uczenia maszynowego i analiz statystycznych lub matematycznych. Mahout jest w stanie podjąć dość duże zadania eksploracji danych i uczenia maszynowego ze względu na rozproszone podejście do obliczeń do takich problemów. Korzystając z Hadoopa w tle, Mahout jest w stanie podzielić zadania dotyczące wydobywania dużych danych na mniejsze podtasy, które następnie mają działać w różnych instancjach. Umożliwia to użytkownikowi stosunkowo szybkie wykonanie złożonego zadania poprzez podzielenie go na mniejsze zadania i uruchamianie ich wszystkich w różnych przypadkach aplikacji za pomocą infrastruktury w chmurze.

Mahout zapewnia użytkownikom szereg różnych funkcji. Obejmują one techniki związane z uczeniem maszynowym i analizy danych, z których niektóre są rekomendacje modele, Klasyfikacja techniki i grupowanie modele. Ponieważ jest zbudowany na Hadoop, umożliwia użytkownikom korzystanie z rozproszonego przetwarzania w chmurze Hadoopa. Pracując bezproblemowo wraz z Hadoopem, Mahout jest w stanie naprawdę szybko wykonać duże zadania eksploracji i analizy, co czyni go jednym z najlepszych rozwiązań dużych problemów z eksploracją danych.

Instalacja

Używać Kornak, Najpierw potrzebujesz wersji 1 Java (JDK).7, Maven wersja 3.0 lub więcej i wywrócenie. Bez tych trzech zależności Apache Mahout nie będzie działać na komputerze Linux.

Instalacja Java JDK

1. Przejdź do strony pobierania Java, klikając ten link.

2. Wybierz Linux x64: JDK-7U45-Linux-X64.smoła.GZ, zaakceptuj warunki licencjonowania i pobierz plik.

3. Przejdź do katalogu, w którym pobrałeś plik i otwórz terminal tutaj.


Uruchom następujące polecenie:

$ sudo CP JDK-7U45-Linux-x64.smoła.GZ/usr/local/lib/

To kopiuje wyodrębniony folder do /usr/local/lib/.

4. Przejść do /usr/local/lib/ folder, uruchamiając następujące polecenie:

$ cd/usr/local/lib/

5. Uruchom następujące polecenie w terminalu, aby wyodrębnić zawartość sprężonego folderu:

$ sudo tar -xzvf JDK-7U45-Linux-x64.smoła.GZ


6. Usuń skompresowany plik, który właśnie wyodrębniliśmy:

$ sudo rm jdk-7u45-linux-x64.smoła.GZ

7. Przejdź do swojego Strona główna/nazwa użytkownika/ Uruchamiając następujące polecenie:

$ cd /home //

8. Dodaj dom Java do ścieżki, wykonując następujące kroki:

Uruchom następujące polecenie:

$ nano .profil

Dodaj następujące dwa linie na końcu profil że właśnie otworzyliśmy.

Eksport java_home = "/usr/local/lib/jdk1.7.0_45 "
Eksport ścieżka = "$ java_home/bin: $ ścieżka"


Instalacja Maven

1. Po zainstalowaniu Java JDK instalujemy teraz Maven, który jest drugim wymogiem uruchomienia Kornak.

Uruchom następujące polecenie w terminalu:

$ sudo apt-get instaluj maven

Powinieneś zobaczyć wyjście podobne do następującej ilustracji:

Aby sprawdzić, czy Maven został pomyślnie zainstalowany na twoim komputerze, uruchom następujące polecenie w terminalu:

$ mvn -v



Instalacja subwersji

1. Z Maven teraz pomyślnie zainstalowany, instalujemy Subversion. Subversion to bezpłatny korzystanie z systemu sterowania oprogramowaniem. Umożliwia użytkownikom śledzenie różnych wersji kodu źródłowego na swoich maszynach.

Uruchom następujące polecenie:

$ sudo apt-get instal instaluj

Powinieneś zobaczyć podobne dane wyjściowe w swoim terminalu:

Uruchom następujące polecenie, aby sprawdzić, czy subwersja została pomyślnie zainstalowana:

$ svn --version


2. Po zainstalowaniu subwersji pomyślnie zainstalowaliśmy wszystkie zależności dla Kornak.

Teraz będziemy pobierać i zainstalować Mahout.

Najpierw przejdź do katalogu, w którym chcesz zainstalować Mahout.

Uruchom następujące polecenie:

$ svn co http: // svn.Apache.org/repos/ASF/Mahout/Trunk

Powinieneś zobaczyć podobne wyjście terminala:

Teraz przeprowadzamy się do pień informator:

$ CD TRUNK

Teraz uruchom następujące polecenie:

$ mvn -dskiptests

Powinieneś teraz przygotować Apache Mahout do użycia na swoim komputerze Linux.

Podręcznik użytkownika

Mahout używa interfejsu programowania do odblokowania potencjału obliczeń rozproszonych Mahout. Językiem, który jest używany do interakcji z tą ramą, jest Java.

Mahout to kompleksowe rozwiązanie złożonych zadań uczenia maszynowego i eksploracji danych. Ponieważ nie zapewnia interaktywnego interfejsu użytkownika, użytkownicy muszą znać użycie języka Java, aby uwolnić pełny potencjał tej ramy.

Oznacza to, że Mahout nie może być używany przez osoby, które nie są biegle płynne w Javie. Nie oznacza to jednak, że nie trzeba próbować. Nauka nowego języka programowania jest czymś, co nie jest dziś złożone. Dzięki łatwo dostępnym zasobom można łatwo nauczyć się Java i wchodzić w interakcje z frameworkiem Mahout w celu tworzenia algorytmów, które można wykorzystać z dużymi zestawami danych, aby znaleźć rozwiązania i wzorce problemów w rozproszonym środowisku.

Wniosek

Istnieje wiele ramy eksploracji danych i uczenia maszynowego, które są dziś dostępne na rynku. Kornak przez Apache jest jednym z tych frameworków. Mahout słynie z umożliwienia korzystania z rozproszonego środowiska za pomocą Hadoop przez chmurę do podziału złożonych zadań wydobywania danych na mniejsze podędzi, które można uruchomić w wielu przypadkach aplikacji. Powoduje to, że większe zadanie zostanie zakończone w krótszym czasie, a jednocześnie zmniejszając ogólną moc obliczeniową, która jest używana do mniejszych jednostek.

Mahout jest używany przez pisanie kodu w Javie, który jest językiem, który nadał swoją nazwę, przeżywając testy czasu. To sprawia, że ​​Java jest bardzo przydatną umiejętnością. Nauka Java do korzystania z tej funkcji oferowanej przez Apache to coś, co większość danych naukowców robi w pewnym momencie swojej kariery. Podczas gdy większość specjalistów ds. Miningów danych nigdy nie będzie musiała korzystać z rozproszonej przetwarzania w chmurze w dziedzinie nauki danych, istnieje jednak dla niewielkiej ilości zadań wymagających bardziej skalowalnego rozwiązania rozproszonego.