Procedura
W artykule użyjemy funkcji chi-kwadrat z biblioteki Scipy i wyciągniemy kilka testów dla danych. Informacje dotyczące użycia tej funkcji w skrypcie Pythona zostaną również omówione i zastosowane do różnych przykładów w tym artykule.
Składnia
Ponieważ przeprowadzimy dwa testy, aby sprawdzić związek między zmiennymi przy użyciu metody chi-kwadrat, omówimy dwie różne składni dla tej funkcji.
Test Chi Square -> $ chisquare (F_OBS, ddof = 1, f_exp = brak, oś = 1)
Test niezależności Chi Square -> $ chi2_contingency (obserwowany, lambda_ = brak korekcji = false)
Wartość zwracana
Ta funkcja zwraca wartość P i wartość statystyki Square Chi w swoim wyjściu.
Przykład nr 01
Przeprowadzimy pierwszy test przy użyciu kwadratu chi, który omówiliśmy w składni jako test chi_square. Ten test mówi nam o związku między zmiennymi kategorycznymi. Ta funkcja używa modułu atrybutu „statystyki” z SCIPY. Statystyki obliczają test, w którym musimy założyć hipotezę zerową, a kwadrat chi testuje tę hipotezę zerową, czy dane zawierają określone częstotliwości. Zajmuje obserwowane i oczekiwane częstotliwości jako jego parametry, a jeśli te dwie częstotliwości są mniejsze niż przynajmniej „pięć”, test jest uważany za nieprawidłowy.
Wykonamy ten sam test w przykładzie, kompilator, którego będziemy używać do wdrożenia przykładu, jest „Google Collab”, który służy jako kompilator typu open source. Uruchamia program bez rat w pakietach bibliotecznych, ponieważ ma już zainstalowane pakiety. Po otwarciu kompilatora po prostu utwórz projekt o unikalnej nazwie, a następnie przejdź do następnego kroku, w którym zaimportujemy pakiety biblioteczne, aby uruchomić test Chi Square.
Test Chi Square jest podany w module statystyk Python Scipy, więc zaimportujemy „statystyki” z Scipy do naszego projektu. Po zaimportowaniu tej biblioteki zdefiniujemy tablicę mającą elementy jako częstotliwości co najmniej większe lub równe pięciu. Zatem zdefiniujemy tablicę o nazwie „tablica” o obserwowanych częstotliwościach jako „[3, 4, 6, 8, 10, 2]”. Po pomyślnym utworzeniu tej tablicy wywołamy funkcję chi Square z prefiksem „statystykami” jako „statystyki. Chisquare () ”. Do argumentu wejściowego tej funkcji przekazamy tablicę, którą jest F_OBS (obserwowana częstotliwość) parametr funkcji kwadratu chi.
Po uruchomieniu kodu wymienionego w fragmencie poniżej, otrzymamy dane wyjściowe jako statystyki chi Square i wartość p. Ten test Chisquare będzie ważny, ponieważ zdefiniowaliśmy co najmniej pięć obserwowanych częstotliwości w parametrze tej funkcji.
z statystyk importu ScipyPrzykład nr 02
Funkcja Chi Square ma kolejny test dla zmiennych kategorycznych o nazwie „test chi_square dla niezależności”. Teraz ten test różni się nieco od testu chi-kwadrat, który omówiliśmy w powyższym przykładzie, ponieważ ten test sprawdza, czy istnieje jakikolwiek znaczący związek między dwiema zmiennymi klasy kategorialnej. W tym teście Chi_Square używa funkcji modułu statystycznego „Chisquare Apersency” z Python Scipy. Test jest przeprowadzany w celu wykazania, czy zmienne są od siebie niezależne, czy nie. Aby pracować z tą funkcją, stwórzmy kolejną nową tablicę. Aby utworzyć i zdefiniować tę nową tablicę, będziemy musieli zaimportować Numpy z nazwą „NP”, abyśmy mogli wywołać „NP” w kodzie później.
Kolejnym ważnym pakietem bibliotecznym, który musi zostać zaimportowany w celu właściwego działania testu awaryjnego Chi, jest „statystyki”. Zaimportujemy moduł statystyk z biblioteki Scipy z języka Pythona. Dzięki udanego importu wymaganych bibliotek dla projektu lub testu niezależności Chi Square, w następnym kroku zdefiniujemy tablicę o nazwie „us_array”. Użyjemy „NP. array () ”metoda utworzenia tej tablicy, a wymiary tablicy będą ustawione na 2-wymiarowe, a elementy, które ta tablica będzie zawierać, będą„ ([2, 2, 2], [8, 8, 8] ) ”. Ta tablica będzie używana jako obserwacja, która jest parametrem wejściowym dla funkcji CHI_2 COSTENCY ().
Aby wywołać test awaryjny dla niezależności dwóch zmiennych należących do klas kategorycznych, użyjemy statystyk prefiks.Chi2_Contingency (us_array) „. Wykonamy następujący kod, który jest pokazany na rysunku, aby uzyskać wyniki dla testu niezależności funkcji awaryjnej Chi.
importować Numpy jako NPTa funkcja zwraca wartość statystyki testu Chi, wartość p testu i wartości tych częstotliwości, które są oczekiwane dla obserwacji, które przekazujemy w parametrach funkcji. Wyjście funkcji jest wyświetlane na poniższym rysunku.
Wniosek
Artykuł zawiera szczegółowe informacje na temat metody Chi Square, która wykorzystuje moduł „statystyki” z biblioteki Scipy. Przeprowadziliśmy dwa rodzaje testów metod Chi Square, wdrażając dwa różne przykłady w skrypcie Pythona i pokazaliśmy, jak wygląda dane wyjściowe lub wartości powrotu tej funkcji i co oznaczają w kontekście SCIPY Chi Square ( ) metoda.