Scipy Chi-Square

Scipy Chi-Square
Python to dobrze znany język programowania o wysokiej wydajności, który umożliwia różne funkcje inżynierskie, techniczne, obiektowe i matematyczne oraz operacje. Python zapewnia liczne biblioteki dla użytkowników, a jednym z najbardziej znanych i open source programów jest „Scipy”. Biblioteka Scipy zawiera informacje i stosuje swoje działalność do różnych metod uczenia maszynowego E.G., Algorytmy uczenia maszynowego i optymalizatorów, których używamy w sztucznie inteligentnych systemach. Używamy modułu chi-kwadrat z biblioteki Scipy, aby wyjąć różne testy dla danych kategorycznych.

Procedura

W artykule użyjemy funkcji chi-kwadrat z biblioteki Scipy i wyciągniemy kilka testów dla danych. Informacje dotyczące użycia tej funkcji w skrypcie Pythona zostaną również omówione i zastosowane do różnych przykładów w tym artykule.

Składnia

Ponieważ przeprowadzimy dwa testy, aby sprawdzić związek między zmiennymi przy użyciu metody chi-kwadrat, omówimy dwie różne składni dla tej funkcji.

Test Chi Square -> $ chisquare (F_OBS, ddof = 1, f_exp = brak, oś = 1)

Test niezależności Chi Square -> $ chi2_contingency (obserwowany, lambda_ = brak korekcji = false)

Wartość zwracana

Ta funkcja zwraca wartość P i wartość statystyki Square Chi w swoim wyjściu.

Przykład nr 01

Przeprowadzimy pierwszy test przy użyciu kwadratu chi, który omówiliśmy w składni jako test chi_square. Ten test mówi nam o związku między zmiennymi kategorycznymi. Ta funkcja używa modułu atrybutu „statystyki” z SCIPY. Statystyki obliczają test, w którym musimy założyć hipotezę zerową, a kwadrat chi testuje tę hipotezę zerową, czy dane zawierają określone częstotliwości. Zajmuje obserwowane i oczekiwane częstotliwości jako jego parametry, a jeśli te dwie częstotliwości są mniejsze niż przynajmniej „pięć”, test jest uważany za nieprawidłowy.

Wykonamy ten sam test w przykładzie, kompilator, którego będziemy używać do wdrożenia przykładu, jest „Google Collab”, który służy jako kompilator typu open source. Uruchamia program bez rat w pakietach bibliotecznych, ponieważ ma już zainstalowane pakiety. Po otwarciu kompilatora po prostu utwórz projekt o unikalnej nazwie, a następnie przejdź do następnego kroku, w którym zaimportujemy pakiety biblioteczne, aby uruchomić test Chi Square.

Test Chi Square jest podany w module statystyk Python Scipy, więc zaimportujemy „statystyki” z Scipy do naszego projektu. Po zaimportowaniu tej biblioteki zdefiniujemy tablicę mającą elementy jako częstotliwości co najmniej większe lub równe pięciu. Zatem zdefiniujemy tablicę o nazwie „tablica” o obserwowanych częstotliwościach jako „[3, 4, 6, 8, 10, 2]”. Po pomyślnym utworzeniu tej tablicy wywołamy funkcję chi Square z prefiksem „statystykami” jako „statystyki. Chisquare () ”. Do argumentu wejściowego tej funkcji przekazamy tablicę, którą jest F_OBS (obserwowana częstotliwość) parametr funkcji kwadratu chi.

Po uruchomieniu kodu wymienionego w fragmencie poniżej, otrzymamy dane wyjściowe jako statystyki chi Square i wartość p. Ten test Chisquare będzie ważny, ponieważ zdefiniowaliśmy co najmniej pięć obserwowanych częstotliwości w parametrze tej funkcji.

z statystyk importu Scipy
tablica = [3,4,8,10,12]
statystyki.Chisquare (tablica)

Przykład nr 02

Funkcja Chi Square ma kolejny test dla zmiennych kategorycznych o nazwie „test chi_square dla niezależności”. Teraz ten test różni się nieco od testu chi-kwadrat, który omówiliśmy w powyższym przykładzie, ponieważ ten test sprawdza, czy istnieje jakikolwiek znaczący związek między dwiema zmiennymi klasy kategorialnej. W tym teście Chi_Square używa funkcji modułu statystycznego „Chisquare Apersency” z Python Scipy. Test jest przeprowadzany w celu wykazania, czy zmienne są od siebie niezależne, czy nie. Aby pracować z tą funkcją, stwórzmy kolejną nową tablicę. Aby utworzyć i zdefiniować tę nową tablicę, będziemy musieli zaimportować Numpy z nazwą „NP”, abyśmy mogli wywołać „NP” w kodzie później.

Kolejnym ważnym pakietem bibliotecznym, który musi zostać zaimportowany w celu właściwego działania testu awaryjnego Chi, jest „statystyki”. Zaimportujemy moduł statystyk z biblioteki Scipy z języka Pythona. Dzięki udanego importu wymaganych bibliotek dla projektu lub testu niezależności Chi Square, w następnym kroku zdefiniujemy tablicę o nazwie „us_array”. Użyjemy „NP. array () ”metoda utworzenia tej tablicy, a wymiary tablicy będą ustawione na 2-wymiarowe, a elementy, które ta tablica będzie zawierać, będą„ ([2, 2, 2], [8, 8, 8] ) ”. Ta tablica będzie używana jako obserwacja, która jest parametrem wejściowym dla funkcji CHI_2 COSTENCY ().

Aby wywołać test awaryjny dla niezależności dwóch zmiennych należących do klas kategorycznych, użyjemy statystyk prefiks.Chi2_Contingency (us_array) „. Wykonamy następujący kod, który jest pokazany na rysunku, aby uzyskać wyniki dla testu niezależności funkcji awaryjnej Chi.

importować Numpy jako NP
z statystyk importu Scipy
us_array = np.tablica ([[2, 2, 2], [8, 8, 8]])
statystyki.Chi2_Contingency (us_array)

Ta funkcja zwraca wartość statystyki testu Chi, wartość p testu i wartości tych częstotliwości, które są oczekiwane dla obserwacji, które przekazujemy w parametrach funkcji. Wyjście funkcji jest wyświetlane na poniższym rysunku.

Wniosek

Artykuł zawiera szczegółowe informacje na temat metody Chi Square, która wykorzystuje moduł „statystyki” z biblioteki Scipy. Przeprowadziliśmy dwa rodzaje testów metod Chi Square, wdrażając dwa różne przykłady w skrypcie Pythona i pokazaliśmy, jak wygląda dane wyjściowe lub wartości powrotu tej funkcji i co oznaczają w kontekście SCIPY Chi Square ( ) metoda.