Scipy K-MANS

Scipy K-MANS
Język programowania Pythona jest obecnie najczęściej używanym językiem, ponieważ jego biblioteki wolne od open source przyciągają programistów. Początkujący i eksperci programiści wolą pracować w Python niż w jakimkolwiek innym języku programowania na wysokim poziomie. Scipy to jedna z tych niesamowitych bibliotek Pythona, która sprawia, że ​​programowanie jest łatwiejsze i proste. Biblioteka Scipy jest zbudowana na bibliotece Numpy, rozszerzając jej funkcje i metody. Tutaj zbadamy metodę Scipy K-MANS. Aby pomóc Ci zrozumieć funkcje algorytmu K-MANS w programie Python, pokażemy kilka jasnych i praktycznych przykładów.

Co się skupia w Python003f?

Ogólna koncepcja grupowania polega na tworzeniu grup podobnych rodzajów danych. Jest to proces oddzielania danych o tych samych cechach na różne typy klastrów. Opieka zdrowotna, finanse, detaliczne i inne dziedziny często wykorzystują techniki klastrowania do wykonywania różnych zadań analitycznych. Grupowanie w Pythonie wykonuje te same funkcje za pomocą niezwykle prostych algorytmów. Istnieje wiele metod grupowania w Pythonie, ale SCIPY zapewnia tylko dwa moduły do ​​grupowania, które są ke-średnią i klastrowaniem hierarchicznym. Poświęcamy ten artykuł module K-MANS. Dlatego przy pomocy przykładów dowiemy się o klastrowaniu K-MANS.

Jaki jest algorytm grupowania K-MANS?

Zestaw zestawu danych i liczba klastrów, które należy wykonać jako wejście i zwraca określoną liczbę klastrów danych danych. Wynika to z mechanizmu odległości euklidesowej, aby tworzyć klastry. Najpierw algorytm K-MANS znajduje Centroid klastra, a następnie podziela każdy element do najbliższej średniej, powtarza proces podanej liczby czasów klastrów i tworzy określoną liczbę klastrów danych danych.

Co to jest klaster scipy k-mins?

Biblioteka Scipy zapewnia technikę grupowania K-średnich, która jest tym samym podejściem do partycjonowania, w którym każda klaster danych jest reprezentowana za pomocą obliczonego środka ciężkiego. W obliczonym centroidzie wszystkie punkty danych mają tę samą średnią odległość od środka klastra. Biblioteka Scipy oferuje dwa pakiety klastrowania, VQ i hierarchię, które oferują różne metody klastrowania. Klaster.Pakowanie do klastrowania VQ to moduł kwantyzacji wektorowej, który zapewnia metodę klastrowania K-średnim K. Kwantyzacja wektorów jest bardzo pomocna w zniekształceniu i zmniejszeniu poprawy dokładności. Aby tworzyć klastry metodą K-MANS w bibliotece Scipy, musimy wykonać następujące kroki:

Najpierw zainstaluj pakiet Scipy z następującą instrukcją:

Bardzo ważne jest, aby wszystkie biblioteki zostały zainstalowane przed użyciem dowolnej metody funkcji biblioteki. Stąd, jeśli jeszcze nie zainstalowałeś biblioteki Scipy, zainstaluj ją z instrukcją instalacji PIP. Następnie podaj dane do tworzenia klastra i liczby klastra, który ma być również wykonany. Następnie normalizuj dane za pomocą następującego stwierdzenia:

Tutaj funkcja Whiten pakietów VQ jest używana do normalizacji danych. Parametr „danych” reprezentuje dane wejściowe, a parametr „CF” służy do sprawdzenia, czy dane wejściowe zawierają tylko liczby skończone, czy nie. Następnym krokiem jest zlokalizowanie środka ciężkości dostarczonych danych. Poniższe instrukcje służy do obliczenia centroidu danych:

Parametry „Dane” i „CF” są takie same jak funkcja Whiten i reprezentują te same informacje. Dodatkowe parametry to „k”, „iteracje” i „próg”, w których k reprezentuje liczbę klastrów, które należy wykonać, iteracja reprezentuje liczbę iteracji, które należy wykonać przez funkcję, a próg reprezentuje wartość progową do zakończenia funkcji. Teraz zademonstrujmy przykład, abyśmy mogli praktycznie zobaczyć, jak działa funkcja K-średnia.

Przykład:

Tutaj podamy przykład, aby zademonstrować kroki, które wyjaśniliśmy wcześniej. Kiedy masz pełny praktyczny przykład, możesz łatwo zrozumieć koncepcję. Odnieczmy się do podanego kodu na poniższym zrzucie ekranu:

Ponieważ już zainstalowaliśmy bibliotekę Scipy, nie trzeba jej wyraźnie zainstalować ponownie. Pierwszy wiersz kodu służy do importowania biblioteki Numpy jako „NP” w programie. Potem scipy.grupa.Pakiet VQ jest importowany do programu w celu korzystania z modułów Whiten, Kmeans i VQ. Zmienna „danych” jest inicjowana za pomocą tablicy 2-D, która jest następnie przekazywana do funkcji Whiten w celu normalizacji danych. Znormalizowane dane można wyświetlić w wyjściu, ponieważ instrukcja drukowania jest używana do wyświetlania.

Funkcja Kmeans () oblicza centroid podanych danych. Podane dane są przekazywane do funkcji KMeans z liczbą klastrów, które należy wykonać. Wartość centroid dla każdego elementu danych można również wyświetlić w wyjściu, ponieważ instrukcja drukowania służy do ich wyświetlania. Średnia danych jest również pobierana i wyświetlana w wyjściu z instrukcją drukowania.

Wreszcie, do klastrowania używana jest funkcja VQ. Podane dane i obliczone wartości centroidu są przekazywane do funkcji VQ i wyświetlane w wyjściu za pomocą instrukcji PRINT. Aby uzyskać pełne wyjście w jednym miejscu, możesz zapoznać się z następującym zrzutem ekranu:

Jak widać, najpierw mamy znormalizowane dane, które są zwracane przez funkcję Whiten. Następnie mamy centroidy dla każdej wartości danych. Następnie podano średnią danych, a następnie indeksy klastra. Możesz wykonać ten kod w dowolnym kompilatorze Python w twoim systemie, takim jak Spyder, PyPy, Jowisz itp. Możesz także korzystać z kompilatorów online, takich jak Collaboratory, które jest również znane jako colab.

Wniosek

Ten artykuł jest poświęcony algorytmowi klastrowania K-MANS. Tutaj dowiedzieliśmy się o klastrowaniu, klastrowaniu K-średnich i klastrowaniu K-MANS z Biblioteką Scipy. Po pierwsze, nauczyliśmy się podstawowej koncepcji grupowania. Następnie zbadaliśmy konkretną metodę klastra K-średnich. Na koniec nauczyliśmy się kompletnej metody K-MANS dostarczonej przez Bibliotekę Scipy. Wykazaliśmy również przykład, aby wyjaśnić każdy krok.