Scipy Mann Whitney

Scipy Mann Whitney
Język programowania Pythona jest powszechnie używany w naukach danych i analizie danych. Proste, przydatne, bezpłatne i łatwe do zrozumienia algorytmy języka programowania Python pozwala nam przeprowadzić dogłębną analizę danych. Algorytmy używane w naukach danych są również bardzo proste do nauczenia się i wdrożenia. Ponadto język programowania Pythona oferuje również kilka przydatnych pakietów, funkcji i metod wykonywania obliczeń matematycznych i statystycznych. Ten artykuł opiera się na badaniu funkcji testowej Mann Whitney U w Pythonie.

Mann Whitney U test

Jest to nieParametryczny test hipotezy statystycznej, który jest stosowany do porównywania dwóch próbek o niewielkich rozmiarach i posiadania nienormalnego rozkładu próbki. Jest uważany za równy testowi t z dwóch próbek, w których dwie próbki są losowo wybierane i ustalane, czy należą do tej samej populacji, czy nie. Ponieważ jest to test nieparametryczny, nie przyjęto założeń dla rozkładu próbki. Jednak niektóre domniemania, takie jak losowe zbieranie próbek, wzajemna niezależność w próbkach, pomiary skali porządkowej itp. są zrobione.

Python Scipy Mann Whitney Funkcja

Język programowania Pythona ma niesamowitą bibliotekę do automatycznego i szybkiego wykonywania jakichkolwiek funkcji matematycznych i statystycznych. Ta biblioteka jest scipy, która jest dobrze znana zarówno wśród doświadczonych, jak i początkujących programistów. Zapewnia funkcję Mannwhitneyu () do wykonania testu Mann Whitney U. Składnia funkcji Mannwhitneyu () jest następująca:

Parametry funkcji mannwhitneyu () są używane do definiowania danych i funkcji zastosowanych do danych. Parametry „x” i „y” są używane do przekazywania dwóch wielowymiarowych tablic próbek reprezentujących dane przykładowe. Parametr „alternatywny” określa alternatywną hipotezę dla próbek - mniej, większa lub dwustronna. Parametr „użyj_continity” służy do deklarowania, czy zastosować korekcję ciągłości, czy nie. Parametr „oś” określa oś, na której obliczanie statystyki musi wykonać. Parametr „nan_policy” określa, jak radzić sobie z wartościami nan w próbkach, takich jak podnieś wyjątek, pomiń lub propagować.

I na koniec parametr „metody” określa sposób obliczania wartości p, takiej jak automatyczne, dokładne lub asymptotyczne. W zamian funkcja Mannwhitneyu () podaje wartość p i statystyki próbek. Zrozumiemy, jak zaimplementować funkcję Mannwhitneyu () w programie Python.

Przykład 1:

Ten przykład pobiera dwie próbki i przekazuje je do funkcji Mannwhitneyu () bez określenia żadnego innego parametru. Sprawdzimy wynik funkcji mannwhitneyu () z wartościami domyślnymi dla każdego parametru opcjonalnego. Rozważmy podany przykład z następującego fragmentu kodu:

z statystyk importu Scipy
x = [5, 4, 10, 2, 9, 18, 20]
y = [12, 15, 25, 2, 9, 11, 13]
Stat, p_value = statystyki.Mannwhitneyu (x, y)
Drukuj („Wartość statystyki próbek to =”, Stat)
druk („wartość p próbek to =”, p_value)

Tutaj dołączamy bibliotekę Scipy wraz z pakietem statystyk, abyśmy mogli użyć funkcji Mannwhitneyu (). Pisząc dowolny program Python, musisz pamiętać, że biblioteki muszą zostać zaimportowane do programu przed użyciem jakiejkolwiek funkcji z nimi. Niektóre wbudowane funkcje mogą być używane bez wyraźnego wywołania swoich bibliotek. Ale większości funkcji nie można użyć w programie, jeśli przegapisz w dodaniu ich bibliotek w programie. Upewnij się, że wszystkie wymagane biblioteki są zawarte przed użyciem funkcji.

Po dodaniu bibliotek dwa przykładowe zestawy są zadeklarowane w X i Y. Próbki te są przekazywane do funkcji Mannwhitenyu (). Teraz sprawdźmy statystykę i wartość P_ podanych próbek w następującym wyjściu:

Przykład 2:

W tym przykładzie wyraźnie zadeklarujmy wartość jednego z opcjonalnych parametrów. Jak omówiono wcześniej, możesz określić alternatywną hipotezę dla danych przykładowych i może być mniej, większa lub dwustronna. Domyślnie funkcja Mannwhitneyu () używa wartości „dwustronnej” dla parametru „alternatywnego”. W tym przykładzie przetestujemy każdą wartość dla alternatywnego parametru, aby zrozumieć, jak działają z przykładowymi danymi. Rozważ następujący przykład przykładowy:

z statystyk importu Scipy
x = [5, 4, 10, 2, 9, 18, 20, 4, 9, 11, 18, 20, 25, 30]
y = [12, 15, 25, 2, 9, 11, 13, 2, 5, 10, 18, 4, 30, 6]
Stat, p_value = statystyki.Mannwhitneyu (x, y)
Drukuj („Wartość statystyki próbek to =”, Stat)
druk („wartość p próbek to =”, p_value)

Tutaj nie określamy wartości parametru „alternatywnego”. Odbywa się to w celu porównania wyniku domyślnej wartości „alternatywnej” ze wszystkimi innymi opcjami. Oto, co zwraca funkcja Mannwhitneyu (), gdy nie określamy wartości dla żadnego parametru:

Domyślna wartość funkcji Mannwhitneyu () jest „dwustronna”, która określa, że ​​podane próbki nie są równe. Tutaj podajemy „dwustronną” wartość dla parametru „alternatywnego” w celu porównania wyników. Ta sama wartość p jest zwracana, jak w poprzednim przykładzie. Sprawdźmy następujący wynik:

z statystyk importu Scipy
x = [5, 4, 10, 2, 9, 18, 20, 4, 9, 11, 18, 20, 25, 30]
y = [12, 15, 25, 2, 9, 11, 13, 2, 5, 10, 18, 4, 30, 6]
Stat, p_value = statystyki.Mannwhitneyu (x, y, alternatywa = „dwustronny”)
Drukuj („Wartość statystyki próbek to =”, Stat)
druk („wartość p próbek to =”, p_value)

Porównując oba wyniki, możemy stwierdzić, że wyniki są takie same.

„Większa” wartość dla parametru „alternatywnego” sprawdza próbki w stosunku do hipotezy, że podana próbka x jest stochastycznie większa niż podana próbka Y. Podajmy „większą” wartość dla parametru „alternatywnego”, aby sprawdzić obliczoną wartość p:

z statystyk importu Scipy
x = [5, 4, 10, 2, 9, 18, 20, 4, 9, 11, 18, 20, 25, 30]
y = [12, 15, 25, 2, 9, 11, 13, 2, 5, 10, 18, 4, 30, 6]
Stat, p_value = statystyki.Mannwhitneyu (x, y, alternatywa = „większa”)
Drukuj („Wartość statystyki próbek to =”, Stat)
druk („wartość p próbek to =”, p_value)

Oto wyjście „większej” wartości parametru „alternatywnego”:

Jak widać, wartość p różni się od wartości p w poprzednich wyjściach.

Na koniec mamy „mniej” wartość dla parametru „alternatywnego”. Wartość „mniej” określa, że ​​podana próbka x jest stochastycznie mniejsza niż podana próbka Y. Przekażmy wartość „mniej” dla parametru „alternatywnego” i zobacz Wynik:

z statystyk importu Scipy
x = [5, 4, 10, 2, 9, 18, 20, 4, 9, 11, 18, 20, 25, 30]
y = [12, 15, 25, 2, 9, 11, 13, 2, 5, 10, 18, 4, 30, 6]
Stat, p_value = statystyki.Mannwhitneyu (x, y, alternatywa = „mniej”)
Drukuj („Wartość statystyki próbek to =”, Stat)
druk („wartość p próbek to =”, p_value)

Dane wyjściowe wartości „mniej” dla parametru „alternatywnego” jest następujące:

Wniosek

Ten przewodnik to szybki przegląd testu Mann Whitney U, który jest również znany jako Wilcoxon Mann Whitney (MWW), test sum rankingu Wilcoxona i testu Wilcoxon Mann Whitney. Jest to test nieparametryczny, który losowo wybiera niezależne próbki i porównuje je z hipotezą w celu określenia, czy należą do tej samej populacji, czy nie, czy mają tę samą medianę, czy nie. Ponadto nie podejmuje żadnego konkretnego domniemania rozkładu w celu obliczenia statystyki wartości p i testu. Biblioteka Scipy zapewnia funkcję Mannwhitneyu () do wykonania testu Mann Whitney na podanych danych. Za pomocą prostych i łatwych przykładów wykazaliśmy, jak wdrożyć funkcję Mannwhitneyu () w programie Python.