Co się skupia w Python003f?
Ogólna koncepcja grupowania polega na tworzeniu grup podobnych rodzajów danych. Jest to proces oddzielania danych o tych samych cechach na różne typy klastrów. Opieka zdrowotna, finanse, detaliczne i inne dziedziny często wykorzystują techniki klastrowania do wykonywania różnych zadań analitycznych. Grupowanie w Pythonie wykonuje te same funkcje za pomocą niezwykle prostych algorytmów. Istnieje wiele metod grupowania w Pythonie, ale SCIPY zapewnia tylko dwa moduły do grupowania, które są ke-średnią i klastrowaniem hierarchicznym. Poświęcamy ten artykuł module K-MANS. Dlatego przy pomocy przykładów dowiemy się o klastrowaniu K-MANS.
Jaki jest algorytm grupowania K-MANS?
Zestaw zestawu danych i liczba klastrów, które należy wykonać jako wejście i zwraca określoną liczbę klastrów danych danych. Wynika to z mechanizmu odległości euklidesowej, aby tworzyć klastry. Najpierw algorytm K-MANS znajduje Centroid klastra, a następnie podziela każdy element do najbliższej średniej, powtarza proces podanej liczby czasów klastrów i tworzy określoną liczbę klastrów danych danych.
Co to jest klaster scipy k-mins?
Biblioteka Scipy zapewnia technikę grupowania K-średnich, która jest tym samym podejściem do partycjonowania, w którym każda klaster danych jest reprezentowana za pomocą obliczonego środka ciężkiego. W obliczonym centroidzie wszystkie punkty danych mają tę samą średnią odległość od środka klastra. Biblioteka Scipy oferuje dwa pakiety klastrowania, VQ i hierarchię, które oferują różne metody klastrowania. Klaster.Pakowanie do klastrowania VQ to moduł kwantyzacji wektorowej, który zapewnia metodę klastrowania K-średnim K. Kwantyzacja wektorów jest bardzo pomocna w zniekształceniu i zmniejszeniu poprawy dokładności. Aby tworzyć klastry metodą K-MANS w bibliotece Scipy, musimy wykonać następujące kroki:
Najpierw zainstaluj pakiet Scipy z następującą instrukcją:
Bardzo ważne jest, aby wszystkie biblioteki zostały zainstalowane przed użyciem dowolnej metody funkcji biblioteki. Stąd, jeśli jeszcze nie zainstalowałeś biblioteki Scipy, zainstaluj ją z instrukcją instalacji PIP. Następnie podaj dane do tworzenia klastra i liczby klastra, który ma być również wykonany. Następnie normalizuj dane za pomocą następującego stwierdzenia:
Tutaj funkcja Whiten pakietów VQ jest używana do normalizacji danych. Parametr „danych” reprezentuje dane wejściowe, a parametr „CF” służy do sprawdzenia, czy dane wejściowe zawierają tylko liczby skończone, czy nie. Następnym krokiem jest zlokalizowanie środka ciężkości dostarczonych danych. Poniższe instrukcje służy do obliczenia centroidu danych:
Parametry „Dane” i „CF” są takie same jak funkcja Whiten i reprezentują te same informacje. Dodatkowe parametry to „k”, „iteracje” i „próg”, w których k reprezentuje liczbę klastrów, które należy wykonać, iteracja reprezentuje liczbę iteracji, które należy wykonać przez funkcję, a próg reprezentuje wartość progową do zakończenia funkcji. Teraz zademonstrujmy przykład, abyśmy mogli praktycznie zobaczyć, jak działa funkcja K-średnia.
Przykład:
Tutaj podamy przykład, aby zademonstrować kroki, które wyjaśniliśmy wcześniej. Kiedy masz pełny praktyczny przykład, możesz łatwo zrozumieć koncepcję. Odnieczmy się do podanego kodu na poniższym zrzucie ekranu:
Ponieważ już zainstalowaliśmy bibliotekę Scipy, nie trzeba jej wyraźnie zainstalować ponownie. Pierwszy wiersz kodu służy do importowania biblioteki Numpy jako „NP” w programie. Potem scipy.grupa.Pakiet VQ jest importowany do programu w celu korzystania z modułów Whiten, Kmeans i VQ. Zmienna „danych” jest inicjowana za pomocą tablicy 2-D, która jest następnie przekazywana do funkcji Whiten w celu normalizacji danych. Znormalizowane dane można wyświetlić w wyjściu, ponieważ instrukcja drukowania jest używana do wyświetlania.
Funkcja Kmeans () oblicza centroid podanych danych. Podane dane są przekazywane do funkcji KMeans z liczbą klastrów, które należy wykonać. Wartość centroid dla każdego elementu danych można również wyświetlić w wyjściu, ponieważ instrukcja drukowania służy do ich wyświetlania. Średnia danych jest również pobierana i wyświetlana w wyjściu z instrukcją drukowania.
Wreszcie, do klastrowania używana jest funkcja VQ. Podane dane i obliczone wartości centroidu są przekazywane do funkcji VQ i wyświetlane w wyjściu za pomocą instrukcji PRINT. Aby uzyskać pełne wyjście w jednym miejscu, możesz zapoznać się z następującym zrzutem ekranu:
Jak widać, najpierw mamy znormalizowane dane, które są zwracane przez funkcję Whiten. Następnie mamy centroidy dla każdej wartości danych. Następnie podano średnią danych, a następnie indeksy klastra. Możesz wykonać ten kod w dowolnym kompilatorze Python w twoim systemie, takim jak Spyder, PyPy, Jowisz itp. Możesz także korzystać z kompilatorów online, takich jak Collaboratory, które jest również znane jako colab.
Wniosek
Ten artykuł jest poświęcony algorytmowi klastrowania K-MANS. Tutaj dowiedzieliśmy się o klastrowaniu, klastrowaniu K-średnich i klastrowaniu K-MANS z Biblioteką Scipy. Po pierwsze, nauczyliśmy się podstawowej koncepcji grupowania. Następnie zbadaliśmy konkretną metodę klastra K-średnich. Na koniec nauczyliśmy się kompletnej metody K-MANS dostarczonej przez Bibliotekę Scipy. Wykazaliśmy również przykład, aby wyjaśnić każdy krok.