W Python w bibliotece Scipy znajduje się pakiet dla funkcji statystycznych. Scipy Sub-Package nazywa się Scipy.statystyki. Jest to głównie stosowane do procedur statystycznych i rozkładów probabilistycznych. Rodzaje funkcji prawdopodobieństwa są liczne. Natura open source biblioteki pozwala na rozszerzenie jej zdolności statystycznej. Możemy pracować z różnorodnymi rozkładami, w tym rozkładami dwumianowymi, jednolitymi i ciągłymi. Mamy funkcje zarówno dla zmiennych ciągłych, jak i dyskretnych. Dodatkowo możemy uruchomić test t i obliczyć wynik T. Dzięki wielu przykładom dowiedzmy się więcej o funkcjach SCIPY STATS.
SCIPY STATS Wyjaśnienie
Liczne rozkłady prawdopodobieństwa, statystyki częstotliwości i podsumowujące, funkcje korelacji i testy statystyczne, oszacowanie gęstości jądra, statystyki zamaskowane, quasi-miesięczne funkcjonalność Carlo i inne cechy są zawarte w tym module.
Istnieje wiele obszarów w rozległym dziedzinie statystyk, które wykraczają poza zakres Scipy'ego i są obsługiwane przez inne pakiety. Wśród najważniejszych są:
Scipy.Podpakowanie statystyk zawiera wszystkie procedury statystyczne, a funkcja Info (STATS) zwraca dość kompleksową listę tych funkcji. Pakiety STATS STATS dodatkowo zawierają listę dostępnych zmiennych losowych. Ten moduł zawiera znaczny zbiór rozkładów prawdopodobieństwa oprócz rozszerzającego się zbioru funkcji statystycznych.
Jaki jest normalny ciągły losowy rozkład w Scipy?
Aby obejmować zarówno dyskretne, jak i ciągłe zmienne losowe, opracowano dwie ogólne klasy rozkładu. Normalny ciągły losowy rozkład jest jednym z rodzajów, które tutaj zamierzamy omówić.
Zmienna może mieć dowolną wartość w tego rodzaju rozkładu prawdopodobieństwa. Dlatego jest znana jako ciągła zmienna losowa.
Przykład 1:
Pierwszy przykład pokazuje, jak działają koncepcje omówione w poprzednich sekcjach. Importujemy funkcję Norm, która pochodzi z klasy RV_Continous, w tym przykładowym kodzie. Funkcje zawierają podejścia i informacje w celu rozwiązania określonego dystrybucji ciągłej.
Aby obliczyć CDF na tablicy, używamy funkcji Norm. Dokonajmy zrozumienia linii kodu po wierszu.
W pierwszym wierszu kodu importujemy normę z scipy.Biblioteka statystyk. Następnie biblioteka Numpy jest importowana do wykonania programu. Następnie powstaje zmienna o nazwie „Check”, w której przechowywana jest utworzona tablica Numpy. Wreszcie, instrukcja drukowania jest używana, w której norma.Funkcja cdf () jest wykonywana w określonej tablicy. Uruchom kod i zobaczmy, jaki wynik wytwarza.
od Scipy.Statystyki importowe Norma
Importuj Numpy
Check = Numpy.tablica ([4, -2,3,2,5,0])
Drukuj (norma.CDF (sprawdź))
Tutaj możesz zobaczyć wynik generowany z wcześniej pisanego kodu.
Jeszcze jedna rzecz, którą możemy zrobić, jest użycie funkcji punktu procentowego do określenia mediany rozkładu. Wersja CDF to PPF, który jest skrócony jako PPF.
Tutaj możesz zobaczyć medianę wartości CDF, które są generowane w poprzednim kodzie.
Jak generować jednolity rozkład w Scipy
Mówiąc najprościej, jednolity rozkład oznacza płaskie, stałe prawdopodobieństwo, że wartość mieści się w określonym zakresie. Możliwe jest tworzenie jednolitego rozkładu. Po zaimportowaniu funkcji jednolitej musimy utworzyć CDF tablicy.
Skala i słowa kluczowe pozwalają nam rozszerzyć funkcjonalność. Słowo kluczowe LOC definiuje wartość średnią, podczas gdy słowo kluczowe skali definiuje odchylenie standardowe. Oto kod:
Najpierw importujemy moduł Numpy i jednolity. Następnie tworzymy zmienną, w której przechowujemy stworzoną tablicę Numpy. Wreszcie można zobaczyć instrukcję drukowania, w którym mundur.Zastosowana jest funkcja CDF.
Importuj Numpy
od Scipy.Statystyki importujące mundur
Check_Res = Numpy.tablica ([7,4,9,5,4])
Drukuj (mundur.cdf (check_res, loc = 5, skala = 3))
Podłączony jest wyjście dla Twojej pomocy.
Jak wygenerować rozkład dwumianowy w Scipy
Dodatkowo, importując binom, instancję klasy RV dyskretnej, możemy wytworzyć rozkład dwumianowy. Składa się z informacji i metod klasowych. Kod jest dość taki sam jak w poprzednim kodzie, z wyjątkiem tego, że używamy Bunom.Funkcja cdf () tutaj, która zawiera trzy parametry, które można zobaczyć w ostatnim wierszu kodu.
Importuj Numpy
od Scipy.Statystyki importowe Binom
wyjście = Numpy.tablica ([7,4,5,5,4])
Drukuj (binom.CDF (wyjście, n = 1, p = 3))
Oto wynik:
Jakie są statystyki opisowe?
Wyniki podstawowych statystyk, takich jak Min, Max, Średnia i wariancja, są zwracane przy użyciu tablicy Numpy jako wejścia. Poniższa tabela zawiera garść podstawowych operacji statystycznych zawartych w Scipy.Pakiet statystyk.
Nazwa funkcji | Opis |
opisać() | Opisowe statystyki podanej tablicy są obliczane za pośrednictwem tej opcji. |
gmean () | Średnia geometryczna określonej osi jest obliczana z tą opcją. |
hmean () | Wzdłuż wybranej osi średnia harmoniczna jest obliczana przez funkcję hmean (). |
kurtosis () | Ta funkcja oblicza kurtozę. |
tryb() | Ta metoda zwraca wartość modalną. |
krzywy() | Metoda Skew () testuje skośność określonych danych. |
f_oneway () | Ta metoda wykonuje 1-kierunkową ANOVA. |
IQR () | Określa zakres międzykwartylowy danych wzdłuż wybranej osi. |
ZSCORE () | Oblicza wynik Z każdej wartości próbki. Jest to w stosunku do średniej próbki, a także odchylenia standardowego. |
SEM () | Określa liczby w standardowym błędy tablicy wejściowej średniej. |
Co to jest test t?
Test t jest jednym z najlepszych sposobów oceny, czy dwa średnie różnią się od siebie, czy nie. Test t jest również ważnym tematem dyskusji w kategoriach różnic grupowych.
Wynik T
Wynik T mierzy stosunek dwóch grup, a także wariancję w grupach. Wynik T odzwierciedla, jak podobne lub różne są grupy; Im mniejszy wynik T, tym bardziej znaczący wynik T i tym większa różnica między grupami.
Tutaj otrzymujemy dwie próbki, które mogą pochodzić z tego samego rozkładu lub dwóch różnych rozkładów. I chcemy ustalić, czy mają one te same cechy statystyczne. Zobacz następujący kod, który jest dołączony tutaj:
z statystyk importu Scipy
RVS_RES = Stats.norma.RVS (loc = 4, skala = 8, rozmiar = (30,4))
Drukuj („Oto wynik porównania dwóch próbek:”)
Drukuj (statystyki.ttest_1samp (RVS_RES, 4.0))
Dołączony jest wyjście:
Wartość p w poprzednim wyjściu reprezentuje prawdopodobieństwo, że wyniki z danych przykładowych nastąpiły przypadkowo. Zakres wartości p wynosi od 0% do 100%.
Wniosek
Funkcje statystyk Scipy były tematem tego artykułu. Moduł statystyk Scipy jest kluczowym elementem. Pomocne jest uzyskanie rozkładów probabilistycznych. Korzystając z statystyk SCIPY, można wytworzyć dyskretne lub ciągłe liczby losowe. Zawiera także inne dodatkowe funkcje, które zapewniają opisowe wartości statystyczne. W tym poście omówiliśmy zmienne losowe, ciągłe i losowe. Omówiono funkcje interakcji z różnymi typami dystrybucji. Dodatkowo opisaliśmy, w jaki sposób możesz przeanalizować dane za pomocą testu t w celu ustalenia wartości średniej.