Mann Whitney U test
Jest to nieParametryczny test hipotezy statystycznej, który jest stosowany do porównywania dwóch próbek o niewielkich rozmiarach i posiadania nienormalnego rozkładu próbki. Jest uważany za równy testowi t z dwóch próbek, w których dwie próbki są losowo wybierane i ustalane, czy należą do tej samej populacji, czy nie. Ponieważ jest to test nieparametryczny, nie przyjęto założeń dla rozkładu próbki. Jednak niektóre domniemania, takie jak losowe zbieranie próbek, wzajemna niezależność w próbkach, pomiary skali porządkowej itp. są zrobione.
Python Scipy Mann Whitney Funkcja
Język programowania Pythona ma niesamowitą bibliotekę do automatycznego i szybkiego wykonywania jakichkolwiek funkcji matematycznych i statystycznych. Ta biblioteka jest scipy, która jest dobrze znana zarówno wśród doświadczonych, jak i początkujących programistów. Zapewnia funkcję Mannwhitneyu () do wykonania testu Mann Whitney U. Składnia funkcji Mannwhitneyu () jest następująca:
Parametry funkcji mannwhitneyu () są używane do definiowania danych i funkcji zastosowanych do danych. Parametry „x” i „y” są używane do przekazywania dwóch wielowymiarowych tablic próbek reprezentujących dane przykładowe. Parametr „alternatywny” określa alternatywną hipotezę dla próbek - mniej, większa lub dwustronna. Parametr „użyj_continity” służy do deklarowania, czy zastosować korekcję ciągłości, czy nie. Parametr „oś” określa oś, na której obliczanie statystyki musi wykonać. Parametr „nan_policy” określa, jak radzić sobie z wartościami nan w próbkach, takich jak podnieś wyjątek, pomiń lub propagować.
I na koniec parametr „metody” określa sposób obliczania wartości p, takiej jak automatyczne, dokładne lub asymptotyczne. W zamian funkcja Mannwhitneyu () podaje wartość p i statystyki próbek. Zrozumiemy, jak zaimplementować funkcję Mannwhitneyu () w programie Python.
Przykład 1:
Ten przykład pobiera dwie próbki i przekazuje je do funkcji Mannwhitneyu () bez określenia żadnego innego parametru. Sprawdzimy wynik funkcji mannwhitneyu () z wartościami domyślnymi dla każdego parametru opcjonalnego. Rozważmy podany przykład z następującego fragmentu kodu:
z statystyk importu ScipyTutaj dołączamy bibliotekę Scipy wraz z pakietem statystyk, abyśmy mogli użyć funkcji Mannwhitneyu (). Pisząc dowolny program Python, musisz pamiętać, że biblioteki muszą zostać zaimportowane do programu przed użyciem jakiejkolwiek funkcji z nimi. Niektóre wbudowane funkcje mogą być używane bez wyraźnego wywołania swoich bibliotek. Ale większości funkcji nie można użyć w programie, jeśli przegapisz w dodaniu ich bibliotek w programie. Upewnij się, że wszystkie wymagane biblioteki są zawarte przed użyciem funkcji.
Po dodaniu bibliotek dwa przykładowe zestawy są zadeklarowane w X i Y. Próbki te są przekazywane do funkcji Mannwhitenyu (). Teraz sprawdźmy statystykę i wartość P_ podanych próbek w następującym wyjściu:
Przykład 2:
W tym przykładzie wyraźnie zadeklarujmy wartość jednego z opcjonalnych parametrów. Jak omówiono wcześniej, możesz określić alternatywną hipotezę dla danych przykładowych i może być mniej, większa lub dwustronna. Domyślnie funkcja Mannwhitneyu () używa wartości „dwustronnej” dla parametru „alternatywnego”. W tym przykładzie przetestujemy każdą wartość dla alternatywnego parametru, aby zrozumieć, jak działają z przykładowymi danymi. Rozważ następujący przykład przykładowy:
z statystyk importu ScipyTutaj nie określamy wartości parametru „alternatywnego”. Odbywa się to w celu porównania wyniku domyślnej wartości „alternatywnej” ze wszystkimi innymi opcjami. Oto, co zwraca funkcja Mannwhitneyu (), gdy nie określamy wartości dla żadnego parametru:
Domyślna wartość funkcji Mannwhitneyu () jest „dwustronna”, która określa, że podane próbki nie są równe. Tutaj podajemy „dwustronną” wartość dla parametru „alternatywnego” w celu porównania wyników. Ta sama wartość p jest zwracana, jak w poprzednim przykładzie. Sprawdźmy następujący wynik:
z statystyk importu ScipyPorównując oba wyniki, możemy stwierdzić, że wyniki są takie same.
„Większa” wartość dla parametru „alternatywnego” sprawdza próbki w stosunku do hipotezy, że podana próbka x jest stochastycznie większa niż podana próbka Y. Podajmy „większą” wartość dla parametru „alternatywnego”, aby sprawdzić obliczoną wartość p:
z statystyk importu ScipyOto wyjście „większej” wartości parametru „alternatywnego”:
Jak widać, wartość p różni się od wartości p w poprzednich wyjściach.
Na koniec mamy „mniej” wartość dla parametru „alternatywnego”. Wartość „mniej” określa, że podana próbka x jest stochastycznie mniejsza niż podana próbka Y. Przekażmy wartość „mniej” dla parametru „alternatywnego” i zobacz Wynik:
z statystyk importu ScipyDane wyjściowe wartości „mniej” dla parametru „alternatywnego” jest następujące:
Wniosek
Ten przewodnik to szybki przegląd testu Mann Whitney U, który jest również znany jako Wilcoxon Mann Whitney (MWW), test sum rankingu Wilcoxona i testu Wilcoxon Mann Whitney. Jest to test nieparametryczny, który losowo wybiera niezależne próbki i porównuje je z hipotezą w celu określenia, czy należą do tej samej populacji, czy nie, czy mają tę samą medianę, czy nie. Ponadto nie podejmuje żadnego konkretnego domniemania rozkładu w celu obliczenia statystyki wartości p i testu. Biblioteka Scipy zapewnia funkcję Mannwhitneyu () do wykonania testu Mann Whitney na podanych danych. Za pomocą prostych i łatwych przykładów wykazaliśmy, jak wdrożyć funkcję Mannwhitneyu () w programie Python.