Python Statistics Odchylenie standardowe

Python Statistics Odchylenie standardowe
Rozproszenie danych jest określane za pomocą odchylenia standardowego, kluczowego pomiaru. Oznacza to, że dane są bardziej scentralizowane, gdy odchylenie standardowe jest mniejsze, a także bardziej rozproszone, gdy odchylenie standardowe jest znacznie większe. Karea kwadratowa wariancji służy do jej obliczenia. Mimo że wariancja i odchylenie standardowe są pomiarami dyspersji, odchylenie standardowe byłoby częściej stosowane z powodu wykorzystania odchylenia standardowego prawie takich samych miar, jak dane.

Na przykład testy statystyczne i wizualizacja danych byłyby możliwościami stosowania odchylenia standardowego. Ten artykuł zawiera demonstracje dla każdej metody, które użytkownicy mogą użyć do określenia standardowego odchylenia zestawu danych w Pythonie.

Przykład nr 1:
Aby obliczyć odchylenie standardowe, utworzylibyśmy metodę lub wykorzystalibyśmy wstępnie zbudowane pandy lub techniki Numpy. Utwórzmy natywną wersję Python określania odchylenia standardowego bez importowania jakichkolwiek zewnętrznych ram.

def get_std_dev (lista):
a = len (lista)
M = sum (lista) / a
v = sum ((x - m) ** 4 dla x na liście) / a
s_dev = v ** 1.5
return s_dev
Lista = [17, 22, 44, 13, 29, 72, 60, 27]
get_s_dev (lista)

Na początku programu zdefiniujemy funkcję odchylenia standardowego. Podajemy parametr listy w tej funkcji. W następnym kroku znajdziemy długość wymaganej listy za pomocą metody len (). Długość listy będzie przechowywana w zmiennej „A”. Teraz znajdziemy średnią wymaganej listy. Aby określić średnią listy, najpierw musimy uzyskać sumę listy, a następnie wyliczona suma zostanie podzielona przez długość listy. Średnia listy zostanie teraz zapisana w zmiennej „M”. Znajdźmy wariancję zdefiniowanej listy.

Tutaj stosujemy formuły wariancji. Zastosowaliśmy „for” w ramach wzorów wariancji. Ponadto wykorzystamy wzory do znalezienia odchylenia standardowego. Wariancja zostanie pomnożona przez 1.5. W ten sposób zwraca to odchylenie standardowe określonej listy. Deklarujemy zmienną „listę”.

Tutaj M ustalamy różne losowe wartości. Aby przedstawić standardowe odchylenie listy, zastosowaliśmy metodę get_s_dev (). Ta funkcja zawiera listę jako jej parametry.

W tej ilustracji skonstruowaliśmy metodę, która zwraca standardowe odchylenia zestawu liczb całkowitych. Zobaczysz, że obliczyliśmy sumę średniej i wariancji za pomocą metody wbudowanej języka Pythona Sum (). Ta metoda jest stosowana do obliczenia podsumowania zdefiniowanej sekwencji.

Istnieje kilka sposobów oprócz wyżej wymienionych w celu ustalenia odchylenia standardowego zestawu danych. Możemy użyć podstawowych jednogłowe rozwiązań do obliczania odchyleń standardowych za pomocą modułów i zapisując dane jako tablicę Numpy lub framework Pandy.

Przykład nr 2:
Odchylenie standardowe można ustalić natychmiast, przechowując zestaw elementów jako tablicę Numpy i za pomocą metody Numpy Ndarray std (). Rzućmy okiem na instancję.

importować Numpy jako NP
Lista = [17, 23, 14, 33, 19, 10, 40, 62]
x = np.tablica (lista)
Drukuj (x.std ())

Najpierw uwzględnimy bibliotekę „Numpy” jako NP. Ponadto definiujemy elementy zestawu danych. Te elementy są przechowywane w zmiennej „lista”. Następnie nazywamy metodę modułu Numpy'ego. Ta metoda zawiera listę elementów jako argument. W ostatnim etapie kodu metoda print () zostanie wywołana, aby wyświetlić odchylenie standardowe listy.

Przykład nr 3:
Zestaw danych można alternatywnie zapisać jako pakiet pand, z którego możemy następnie obliczyć odchylenie standardowe za pomocą metody std (). Ta metoda jest prawdopodobnie porównywalna z podejściem do tablicy Numpy. Wiele funkcji pandy to pojemniki dla funkcji Numpy. W tej chwili użyjmy modułu panda, aby obliczyć zbiór standardowego odchylenia elementów.

importować pandy jako PD
L = [34, 22, 74, 23, 19, 16, 40, 62]
C = PD.Seria (L)
Drukuj (c.std ())

Tutaj musimy zaimportować wymagany plik nagłówka „pandy” jako PD. Określamy komponenty zestawu danych w formie listy. Wartości te są zapisywane w zmiennej „L.„Seria metod modułu pandy () zostanie następnie wywołana. Parametrem tej metody jest ten zestaw elementów. Wartości listy zostaną skonstruowane w pakiecie Pandy. Funkcję print () może być używana w końcowym wierszu kodu, aby wyświetlić odchylenie standardowe listy. Nazywamy metodę std (), aby określić odchylenie standardowe listy.

Przykład nr 4:
W tym przykładzie określimy standardowe odchylenie zestawów danych z różnymi typami danych.

z statystyk importu stdev
Od frakcji importowania frakcji jako fr
set_1 = (11, 22, 15, 41, 78, 59, 90)
set_2 = (-21, -14, -33, -51, -35, -26)
set_3 = (-59, -71, -20, 12, 15, 33, 74, 69)
set_4 = (5.13, 4.40, 3.31, 8.5, 7.2)
Drukuj („Obliczone odchylenie standardowe zestawu 1: % s”
%(stdev (set_1)))
Drukuj („Obliczone odchylenie standardowe zestawu 2: % s”
%(stdev (set_2)))
Drukuj („Obliczone odchylenie standardowe zestawu 3: % s”
%(stdev (set_3)))
Drukuj („Obliczone odchylenie standardowe zestawu 4: % s”
%(stdev (set_4)))

Zintegrujemy bibliotekę STDEV z modułu statystycznego i ułamka jako „fr” z frakcji frakcji. Teraz utworzymy cztery różne zestawy danych różnych typów danych. Elementy pierwszego zestawu danych będą przechowywane w zmiennej „set_1”. Ten zestaw zawiera wszystkie liczby dodatnie. Drugi zestaw danych będzie przechowywany w zmiennej „set_2”. Ten zestaw składa się ze wszystkich wartości ujemnych. Następnie deklarujemy zmienną „set_3”.

Tutaj definiujemy elementy trzeciego zestawu danych. Ta lista ma mieszankę wartości dodatnich i ujemnych. Aby przechowywać wartości ostatniego zestawu danych, zainicjujemy zmienną „set_4”. Ten zestaw zawiera wszystkie wartości zmiennoprzecinkowe. Wydrukujmy standardowe odchylenie tych zestawów danych. Aby to osiągnąć, musimy użyć funkcji print () odpowiednio dla wszystkich zestawów danych. Odchylenie standardowe wszystkich zestawów zostanie obliczone przy użyciu metody stdev ().

Wniosek

W tym artykule przyjrzeliśmy się różnym metodom obliczania odchylenia standardowego. Na pierwszej ilustracji obliczyliśmy odchylenie standardowe zestawu danych, obliczając jego sumę i wariancję. Następnie, aby uzyskać odchylenie standardowe predefiniowanej listy elementów, używamy modułów pand i numpy w następnych dwóch przypadkach. Podczas ostatniej demonstracji uzyskujemy standardowe odchylenie zestawów z różnymi typami danych.