Uczenie się zespołu w Pythonie według przykładu

Uczenie się zespołu w Pythonie według przykładu

Nie ma tajemnicy, że uczenie maszynowe jest coraz lepsze z czasem i modeli predykcyjnych. Modele predykcyjne stanowią rdzeń uczenia maszynowego. Dobrze jest poprawić dokładność modelu, aby uzyskać lepsze wyniki w modelu uczenia maszynowego. Do zwiększenia wydajności i dokładności modelu stosuje się technikę zwaną „Ensemble Machine”.

Ensemble Learning wykorzystuje różne modele uczenia maszynowego do próby lepszych prognoz na zbiorze danych. Prognozy modelu są łączone w modelu zespołu w celu uzasadnienia końcowej prognozy. Jednak wiele osób nie zna zespołu uczenia maszynowego. Czytaj poniżej; Wyjaśniamy wszystko na temat tej techniki uczenia maszynowego za pomocą Pythona z odpowiednimi przykładami.

Załóżmy, że bierzesz udział w grze ciekawostek i masz dobrą wiedzę na niektóre tematy, ale nie wiesz nic innych tematów. Członek zespołu byłby zobowiązany do omówienia wszystkich tematów gry, jeśli chcesz uzyskać maksymalny wynik w grze. Jest to podstawowa idea uczenia się zespołu, w której łączymy prognozy z różnych modeli dla dokładnego wyjścia.

Zdjęcie pokazuje przykład schematy zespołu. Na powyższym obrazie tablica wejściowa jest wypełniona trzema rurociągami wstępnymi. Wszystkie zespoły łączą prognozy podstawowych uczniów w ostateczną tablicę prognoz „P”.

Załóżmy, że myślisz o połączeniu wszystkich prognoz. Jeśli weźmiemy pod uwagę powyższy przykład, łatwo odpowiedzieć na zespół; Uczenie maszynowe jest takie samo jak problemy z klasyfikacją. W uczeniu maszynowym system przyjmuje najczęstszą prognozę etykiet klasowych równoważną zasadzie większości. Istnieją jednak różne sposoby łączenia różnych prognoz i możesz użyć modelu do nauki, aby odpowiednio połączyć prognozy.

Czym jest uczenie się zespołu?

Uczenie maszynowe i statystyki rozprzestrzeniają się na całym świecie, więc potrzebujemy różnych technik, aby zwiększyć wydajność modelu predykcyjnego dla lepszej dokładności. Uczenie się zespołu to procedura stosowania różnych modeli uczenia maszynowego i konstruowania strategii rozwiązywania konkretnego problemu.

Zespół łączy różne zestawy modeli improwizacji w zakresie mocy predykcyjnej i stabilności. Według modeli opartych na zespole, istnieją dwa różne scenariusze, i.mi., wyższa lub niższa ilość danych.

Zrozumiemy uczenie się zespołu przy użyciu przykładu; Załóżmy, że chcemy zainwestować w firmę „ABC”, ale nie jesteśmy pewni jej wyników. Dlatego skorzystamy z porady różnych ludzi na temat wyników firmy „ABC”. Możemy skorzystać z porady:

Pracownicy firmy „ABC”: Pracownicy firmy wiedzą wszystko o wewnętrznej funkcjonalności firmy i wszystkich informacji wewnętrznych. Jednak pracownicy nie mają szerszego punktu widzenia konkurencji, ewolucji technologii oraz wpływu na produkt firmy „ABC”. Zgodnie z informacjami i wcześniejszymi doświadczeniami, porady od pracowników jest 65% razy w porządku.

Doradcy finansowi firmy „ABC”: Doradcy finansowi mają szerszą perspektywę na środowisko konkurencyjne. Jednak porady doradcy finansowego spółki były w przeszłości 75% razy prawidłowe.

Handlowcy giełdowe: Ci handlowcy zawsze obserwują cenę akcji spółki i znają sezonowe trendy i ogólne wyniki rynkowe. Opracowują również zapaloną instytucję o odmianach zapasów w czasie. Mimo to porady handlowców giełdowych były w przeszłości 70% razy pomocne.

Pracownicy firmy konkurenta: Pracownicy ci znają wewnętrzne funkcje firmy konkurenta i są świadomi konkretnych zmian. Nie mają jednak żadnego widoku swojej firmy i czynników zewnętrznych związanych ze wzrostem konkurenta. Mimo to pracownicy spółki konkurenta byli w przeszłości 60% razy w przeszłości.

Zespół badań rynku: Ten zespół pracuje nad analizą preferencji klienta produktu firmy „ABC” nad konkurentami. Ten zespół zajmuje się stroną klienta, aby nie zdawać sobie sprawy z tego, że firma „ABC” przyniesie ze względu na dostosowanie do swoich celów. Jednak zespół badań rynku był 75% razy pomocny w przeszłości.

Zespół ekspertów ds. Mediów społecznościowych: Ten zespół jest korzystny, aby zrozumieć, w jaki sposób produkty firmy „ABC” są umieszczone na rynku. Analizują także nastroje klienta zmieniające się z firmą z czasem. Zespół ekspertów ds. Mediów społecznościowych nieświadomy wszelkich informacji poza marketingiem cyfrowym. Tak więc w przeszłości są 65% razy.

W powyższym scenariuszu mamy różne aspekty podejmowania dobrej decyzji, ponieważ wskaźnik dokładności może wynosić 99%. Jednak założenia, których użyliśmy powyżej, są niezależne i nieco ekstremalne, ponieważ oczekuje się, że będą skorelowane.

Metody zespołowe

Omówmy teraz pełne informacje o różnych technikach uczenia się zespołów w Pythonie:

Podstawowa metoda zespołu

Istnieją trzy rodzaje technik w podstawowej metodzie zespołu i są one:

Max głosowanie

Główne prace głosowania Max jest wykorzystywane do rozwiązywania problemów z klasyfikacją. Ta metoda ma wiele niezależnych modeli, a indywidualne dane wyjściowe jest znane jako „głosowanie”. Do przewidywania każdego punktu danych używanych jest wiele modeli. Klasa z maksymalnym głosem powróci jako wyjście. Prognozy, które użytkownicy otrzymują przez większość modelu, zostanie wykorzystana jako ostateczna prognoza.

Na przykład mamy pięciu ekspertów do oceny produktu, zapewnili takie oceny:

Ekspert 1 Ekspert 2 Ekspert 3 Ekspert 4 Ekspert 5 Ostateczna ocena
4 5 4 5 4 4

Oto przykładowy kod dla powyższego przykładu:

Model1 = drzewo.DecydenTreeclassifier ()
Model2 = KneighborsClassifier ()
model3 = logisticreGression ()
Model1.fit (x_train, y_train)
Model2.fit (x_train, y_train)
Model3.fit (x_train, y_train)
Pred1 = Model1.przewidy (x_test)
Pred2 = Model2.przewidy (x_test)
Pred3 = Model3.przewidy (x_test)
final_pred = np.szyk([])
Dla i w zakresie (0, len (x_test)):
final_pred = np.append (final_pred, tryb ([pred1 [i], pred2 [i], pred3 [i]))))

W powyższym kodzie przykładowym X_TRAIN jest niezależną zmienną danych szkoleniowych, a Y_TRAIN jest docelową zmienną danych szkoleniowych. Tutaj x_train, x_test i y_test to zestawy sprawdzania poprawności.

Uśrednianie

Istnieje wiele prognoz dla każdego punktu danych w uśrednianiu; jest używany do problemu regresji. W tej technice znajdujemy średnią z wielu prognoz z danych modeli, a następnie wykorzystuje tę średnią do uzyskania ostatecznej prognozy.

Metoda uśredniania ma niezależne modele, które są używane do znalezienia średniej prognoz. Zasadniczo połączone wyjście jest dokładniejsze niż indywidualne wyjście, ponieważ wariancja jest zmniejszona. Ta metoda służy do dokonywania odpowiednich prognoz w problemie regresji lub znalezienia możliwości problemu klasyfikacji.

Jeśli weźmiemy pod uwagę powyższy przykład, średnia ocen będzie

Ekspert 1 Ekspert 2 Ekspert 3 Ekspert 4 Ekspert 5 Ostateczna ocena
4 5 4 5 4 4

średnia ocen = (4+5+4+5+4+4)/5 = 4.4

Przykładowy kod powyższego problemu będzie:

Model1 = drzewo.DecydenTreeclassifier ()
Model2 = KneighborsClassifier ()
model3 = logisticreGression ()
Model1.fit (x_train, y_train)
Model2.fit (x_train, y_train)
Model3.fit (x_train, y_train)
Pred1 = Model1.PREDICT_PROBA (x_test)
Pred2 = Model2.PREDICT_PROBA (x_test)
Pred3 = Model3.PREDICT_PROBA (x_test)
FinalPred = (Pred1+Pred2+Pred3)/3

Średnia ważona

Ta metoda jest rozszerzonym typem średniej metody, ponieważ modele przypisane są różne wagi, które określają znaczenie każdego modelu dla właściwej prognozy. Na przykład, jeśli zespół ma dwóch ekspertów i dwóch początkujących, znaczenie zostanie przywiązane do ekspertów zamiast początkujących.

Wynik średniej ważonej można obliczyć jako [(5 × 0.24) + (4 × 0.24) + (5 × 0.19) + (4 × 0.19) + (4 × 0.19)] = 4.68.

Czynniki Ekspert 1 Ekspert 2 Ekspert 3 Ekspert 4 Ekspert 5 Ostateczna ocena
waga 0.24 0.24 0.19 0.19 0.19
ocena 5 4 5 4 4 4.68

Przykładowy kod dla powyższego przykładu średniej ważonej:

Model1 = drzewo.DecydenTreeclassifier ()
Model2 = KneighborsClassifier ()
model3 = logisticreGression ()
Model1.fit (x_train, y_train)
Model2.fit (x_train, y_train)
Model3.fit (x_train, y_train)
Pred1 = Model1.PREDICT_PROBA (x_test)
Pred2 = Model2.PREDICT_PROBA (x_test)
Pred3 = Model3.PREDICT_PROBA (x_test)
finalpred = (Pred1*0.3+Pred2*0.3+Pred3*0.4)

Zaawansowane metody zespołu

Układanie

Metoda układania w stos, wiele modeli, takich jak regresja lub klasyfikacja, są łączone przez meta-model. Innymi słowy, ta metoda wykorzystuje różne prognozy z różnych modeli do budowania nowego modelu. Wszystkie modele podstawowe są prawidłowo przeszkolone na zestawie danych, a następnie meta-model jest odpowiednio wyszkolony w zakresie funkcji zwróconych z modeli podstawowych. Stąd model podstawowy w stosowaniu jest szczególnie inny, a meta-model jest korzystny dla znalezienia cech z modelu podstawowego w celu uzyskania dużej dokładności. Układanie ma określony etap algorytmu, jak poniżej:

  • Najpierw wytań zestaw danych w części n.
  • Model podstawowy zostanie zamontowany w części N-1, a prognozy są podzielone w n -. Wymaga to wykonania dla każdej n -. części zestawu pociągu.
  • Model zostanie zamontowany w kompletnym zestawie danych kolejowych, a ten model zostanie użyty do przewidywania zestawu danych testowych.
  • Następnie prognoza w zestawie danych pociągów zostanie wykorzystana jako funkcja do utworzenia nowego modelu.
  • Wreszcie końcowy model zostanie wykorzystany do przewidywania na zestawie danych testowych.

Mieszanie

Mieszanie jest takie samo jak metoda układania, ale wykorzystuje zestaw przechowalni z zestawu pociągu do dokonywania prognoz. Krótko mówiąc, mieszanie używa zestawu danych sprawdzania poprawności i utrzymuje go w celu dokonywania prognoz zamiast używania kompletnego zestawu danych do szkolenia modelu podstawowego. Oto algorytmiczne kroki, których możemy użyć w mieszaniu:

  • Po pierwsze, musimy podzielić zestawy danych szkoleniowych na różne zestawy danych, takie jak test danych testowy, sprawdzanie poprawności i szkolenia.
  • Teraz dopasuj model podstawowy według zestawu danych treningowych.
  • Następnie przewiduj zestaw danych testowych i sprawdzania poprawności.
  • Powyższe prognozy są używane jako funkcja budowania modelu drugiego poziomu.
  • Wreszcie model drugiego poziomu jest używany do dokonywania prognoz na teście i meta-fucie.

Parcianka

Worki nazywane jest również metodą ładowania początkowego; Łączy wyniki różnych modeli do uzyskania uogólnionych wyników. W tej metodzie model podstawowy działa na torbach lub podzbiorach, aby uzyskać sprawiedliwy rozkład kompletnego zestawu danych. Te torby są podzbiorami zestawu danych z wymianą do tworzenia wielkości torby podobnej do kompletnego zestawu danych. Wyjście workowania powstaje po połączeniu wszystkich modeli podstawowych dla wyjścia. Istnieje konkretny algorytm błagania, jak poniżej:

  • Najpierw utwórz różne zestawy danych z zestawu danych szkoleniowych, wybierając obserwacje z zamiennikiem.
  • Teraz uruchom modele podstawowe na każdym utworzonym zestawie danych niezależnie.
  • Na koniec połącz wszystkie prognozy modelu podstawowego z każdym końcowym wynikiem.

Wzmocnienie

Wzmocnienie działa, aby zapobiec wpływowi niewłaściwego modelu podstawowego na ostateczne wyjście, zamiast łączyć model podstawowy, zwiększając skupienie się na tworzeniu nowego modelu zależnego od poprzedniego. Ten nowy model usuwa błędy wszystkie poprzednie modele, a każdy model jest znany jako słaby uczeń. Ostateczny model nazywa się silnym uczniem, stworzonym przez uzyskanie ważonej średniej słabych uczniów. Jest to procedura sekwencyjna, w której każdy kolejny model działa na korygowanie błędów poprzednich modeli. Poniżej znajdują się sekwencyjne kroki algorytmu do zwiększania:

  • Najpierw weź podzbiór zestawu danych szkoleniowych, a następnie wytań model podstawowy na zestawie danych.
  • Teraz użyj trzeciego modelu do dokonywania prognoz na kompletnym zestawie danych.
  • Następnie oblicz błąd według przewidywanej i rzeczywistej wartości.
  • Po obliczeniu błędu, a następnie zainicjuj punkt danych o tej samej wadze.
  • Teraz przypisz wyższą wagę do niepoprawnie przewidywanego punktu danych.
  • Następnie wykonaj nowy model, usuwając poprzednie błędy i dokonaj odpowiednich prognoz według nowego modelu.
  • Musimy utworzyć różne modele modelu, korygując błędy ostatnich modeli.
  • Wreszcie silny uczeń lub ostateczny model jest ważoną średnią poprzedniego lub słabego ucznia.

Wniosek

To kończy nasze szczegółowe wyjaśnienie uczenia się zespołów z odpowiednimi przykładami w Pythonie. Jak wspomnieliśmy wcześniej, uczenie się zespołu ma wiele prognoz, więc innymi słowy, używamy wielu modeli, aby znaleźć możliwe najdokładniejsze wyjście. Wspominaliśmy o rodzajach uczenia się zespołów z ich przykładami i algorytmami. Istnieje wiele metod znalezienia wyników przy użyciu wielu prognoz. Według wielu naukowców z danych, uczenie się zespołu oferuje najdokładniejszy możliwy wynik, ponieważ wykorzystuje wiele prognoz lub modeli.