Scipy K-MANS

Justyna Flak

Język programowania Pythona jest obecnie najczęściej używanym językiem, ponieważ jego biblioteki wolne od open source przyciągają programistów. Początkujący i eksperci programiści wolą pracować w Python niż w jakimkolwiek innym języku programowania na wysokim poziomie. Scipy to jedna z tych niesamowitych bibliotek Pythona, która sprawia, że programowanie jest łatwiejsze i proste. Biblioteka Scipy jest zbudowana na bibliotece Numpy, rozszerzając jej funkcje i metody. Tutaj zbadamy metodę Scipy K-MANS. Aby pomóc Ci zrozumieć funkcje algorytmu K-MANS w programie Python, pokażemy kilka jasnych i praktycznych przykładów.

Co się skupia w Python003f?

Ogólna koncepcja grupowania polega na tworzeniu grup podobnych rodzajów danych. Jest to proces oddzielania danych o tych samych cechach na różne typy klastrów. Opieka zdrowotna, finanse, detaliczne i inne dziedziny często wykorzystują techniki klastrowania do wykonywania różnych zadań analitycznych. Grupowanie w Pythonie wykonuje te same funkcje za pomocą niezwykle prostych algorytmów. Istnieje wiele metod grupowania w Pythonie, ale SCIPY zapewnia tylko dwa moduły do grupowania, które są ke-średnią i klastrowaniem hierarchicznym. Poświęcamy ten artykuł module K-MANS. Dlatego przy pomocy przykładów dowiemy się o klastrowaniu K-MANS.

Jaki jest algorytm grupowania K-MANS?

Zestaw zestawu danych i liczba klastrów, które należy wykonać jako wejście i zwraca określoną liczbę klastrów danych danych. Wynika to z mechanizmu odległości euklidesowej, aby tworzyć klastry. Najpierw algorytm K-MANS znajduje Centroid klastra, a następnie podziela każdy element do najbliższej średniej, powtarza proces podanej liczby czasów klastrów i tworzy określoną liczbę klastrów danych danych.

Co to jest klaster scipy k-mins?

Biblioteka Scipy zapewnia technikę grupowania K-średnich, która jest tym samym podejściem do partycjonowania, w którym każda klaster danych jest reprezentowana za pomocą obliczonego środka ciężkiego. W obliczonym centroidzie wszystkie punkty danych mają tę samą średnią odległość od środka klastra. Biblioteka Scipy oferuje dwa pakiety klastrowania, VQ i hierarchię, które oferują różne metody klastrowania. Klaster.Pakowanie do klastrowania VQ to moduł kwantyzacji wektorowej, który zapewnia metodę klastrowania K-średnim K. Kwantyzacja wektorów jest bardzo pomocna w zniekształceniu i zmniejszeniu poprawy dokładności. Aby tworzyć klastry metodą K-MANS w bibliotece Scipy, musimy wykonać następujące kroki:

Najpierw zainstaluj pakiet Scipy z następującą instrukcją:

Bardzo ważne jest, aby wszystkie biblioteki zostały zainstalowane przed użyciem dowolnej metody funkcji biblioteki. Stąd, jeśli jeszcze nie zainstalowałeś biblioteki Scipy, zainstaluj ją z instrukcją instalacji PIP. Następnie podaj dane do tworzenia klastra i liczby klastra, który ma być również wykonany. Następnie normalizuj dane za pomocą następującego stwierdzenia:

Tutaj funkcja Whiten pakietów VQ jest używana do normalizacji danych. Parametr „danych” reprezentuje dane wejściowe, a parametr „CF” służy do sprawdzenia, czy dane wejściowe zawierają tylko liczby skończone, czy nie. Następnym krokiem jest zlokalizowanie środka ciężkości dostarczonych danych. Poniższe instrukcje służy do obliczenia centroidu danych:

Parametry „Dane” i „CF” są takie same jak funkcja Whiten i reprezentują te same informacje. Dodatkowe parametry to „k”, „iteracje” i „próg”, w których k reprezentuje liczbę klastrów, które należy wykonać, iteracja reprezentuje liczbę iteracji, które należy wykonać przez funkcję, a próg reprezentuje wartość progową do zakończenia funkcji. Teraz zademonstrujmy przykład, abyśmy mogli praktycznie zobaczyć, jak działa funkcja K-średnia.

Przykład:

Tutaj podamy przykład, aby zademonstrować kroki, które wyjaśniliśmy wcześniej. Kiedy masz pełny praktyczny przykład, możesz łatwo zrozumieć koncepcję. Odnieczmy się do podanego kodu na poniższym zrzucie ekranu:

Ponieważ już zainstalowaliśmy bibliotekę Scipy, nie trzeba jej wyraźnie zainstalować ponownie. Pierwszy wiersz kodu służy do importowania biblioteki Numpy jako „NP” w programie. Potem scipy.grupa.Pakiet VQ jest importowany do programu w celu korzystania z modułów Whiten, Kmeans i VQ. Zmienna „danych” jest inicjowana za pomocą tablicy 2-D, która jest następnie przekazywana do funkcji Whiten w celu normalizacji danych. Znormalizowane dane można wyświetlić w wyjściu, ponieważ instrukcja drukowania jest używana do wyświetlania.

Funkcja Kmeans () oblicza centroid podanych danych. Podane dane są przekazywane do funkcji KMeans z liczbą klastrów, które należy wykonać. Wartość centroid dla każdego elementu danych można również wyświetlić w wyjściu, ponieważ instrukcja drukowania służy do ich wyświetlania. Średnia danych jest również pobierana i wyświetlana w wyjściu z instrukcją drukowania.

Wreszcie, do klastrowania używana jest funkcja VQ. Podane dane i obliczone wartości centroidu są przekazywane do funkcji VQ i wyświetlane w wyjściu za pomocą instrukcji PRINT. Aby uzyskać pełne wyjście w jednym miejscu, możesz zapoznać się z następującym zrzutem ekranu:

Jak widać, najpierw mamy znormalizowane dane, które są zwracane przez funkcję Whiten. Następnie mamy centroidy dla każdej wartości danych. Następnie podano średnią danych, a następnie indeksy klastra. Możesz wykonać ten kod w dowolnym kompilatorze Python w twoim systemie, takim jak Spyder, PyPy, Jowisz itp. Możesz także korzystać z kompilatorów online, takich jak Collaboratory, które jest również znane jako colab.

Wniosek

Ten artykuł jest poświęcony algorytmowi klastrowania K-MANS. Tutaj dowiedzieliśmy się o klastrowaniu, klastrowaniu K-średnich i klastrowaniu K-MANS z Biblioteką Scipy. Po pierwsze, nauczyliśmy się podstawowej koncepcji grupowania. Następnie zbadaliśmy konkretną metodę klastra K-średnich. Na koniec nauczyliśmy się kompletnej metody K-MANS dostarczonej przez Bibliotekę Scipy. Wykazaliśmy również przykład, aby wyjaśnić każdy krok.

Doker

Jaka jest różnica między Dockerem a Podmanem?

Docker używa architektury klient-serwer, podczas gdy Podman jest silnikiem Daemon mniej kontenerowym...

Renata Borowiec

Baza danych Oracle

Czy Oracle Fusion uważane za lepsze niż sap?

Oracle Fusion (ERP oparty na chmurze) ma przyjazny interfejs, podczas gdy SAP (Cloud and On-Premises...

Larysa Witczak

Golang

Jakie są struktury w Golang

W Golang struktura to złożony typ danych, który składa się z zerowych lub bardziej nazwanych pól, z ...

Igor Skrzypek