Scipy zamaskowane tablice

Scipy zamaskowane tablice

Kiedy chcesz wykonać jakiekolwiek obliczenia statystyczne lub naukowe w Python, zawsze biegniesz w kierunku biblioteki Scipy. Biblioteka Scipy jest jedną z najczęściej używanych bibliotek Pythona, ponieważ zapewnia odpowiednią funkcję dla każdego rodzaju obliczeń matematycznych, statystycznych i naukowych. To nie tylko biblioteka, ale cały ekosystem bibliotek, które są łączone razem, abyś mógł łatwo i szybko wykonać dowolne proste lub złożone zadanie. Ten przewodnik pozwoli ci zbadać funkcje Scipy, które można użyć z zamaskowanymi tablicami.

Co to jest zamaskowana tablica?

Zamaskowana tablica to tablica, która może mieć nieprawidłowe lub brakujące wpisy. W różnych zdarzeniach zestawy danych lub tablice mogą być skażone lub niekompletne przez obecność nieprawidłowych danych. Na przykład czujnik zarejestrował nieprawidłowe dane z wielu powodów lub mogło nie rejestrować żadnych danych. Teraz mamy pusty zestaw danych lub zestaw danych pełen nieprawidłowych wpisów. Prostym sposobem radzenia sobie z takimi zestawami danych jest maskowanie tych tablic. Biblioteka Numpy zapewnia prostą funkcję maskowania do maskowania tego rodzaju tablic. Sama biblioteka Scipy nie zapewnia żadnej funkcji maskowania, której można użyć do maskowania zestawu danych. Zapewnia jednak wiele funkcji do użycia z tablicami maski.

W tym przewodniku najpierw poprowadzimy Cię, w jaki sposób możesz użyć biblioteki Numpy, aby zamaskować zestaw danych. Następnie pokażemy, w jaki sposób funkcje biblioteki Scipy można użyć z zamaskowanymi tablicami. W Numpy zamaskowana tablica to połączenie standardowej ndarray i maski. Wartością maski może być albo nomaszk lub lista logicznych, które określają maskowanie dla każdej wartości w zestawie danych. Na przykład, jeśli określisz Nomask dla wartości maski, oznacza to, że w zestawie danych nie ma nieprawidłowej wartości. Podczas gdy określisz tablicę logiczną dla zestawu danych, każda wartość określa prawidłową lub nieprawidłową wartość powiązaną z danym zestawem danych. Jeśli wartość maski jest fałszywa, odpowiednia wartość w zestawie danych jest poprawna, więc nie zostanie zamaskowana. Jeśli wartość maski jest prawdziwa, odpowiednia wartość jest nieprawidłowa, więc zostanie zamaskowana. Teraz zobaczmy przykład, aby mieć jasne zrozumienie.

Przykład 1:

W tym przykładzie poprowadzimy Cię, jak zamaskować tablicę za pomocą funkcji maskowania Numpy. Zbadamy, jak „Numpy.Funkcja MA ”działa w programie w celu maskowania danego zestawu danych. Rozważ dany przykładowy kod:

importować Numpy jako NP
Importuj Numpy.Ma jako Ma
Data = NP.tablica ([2, 5, 8, -9, -7])
maska ​​= ma.Masked_Array (dane, maska ​​= [0, 0, 0, 1, 1],
Dtype = NP.int8)
Drukuj („zamaskowana tablica to: \ n”, maska)
Drukuj („\ n”)
MASK_NA = NP.mama.Wypełniony (maska.Astype (float), NP.nan)
Drukuj („Zastąpiony nan: \ n”, mask_na)

Po pierwsze, biblioteka Numpy jest importowana do programu, aby korzystać z funkcji tablicy i MA. Tablica jest zadeklarowana za pomocą NP.funkcja array (). Następnie MA.MASKED_ARRAY () służy do maskowania tablicy. Następnie używamy NP.mama.wypełniona () funkcja zastępująca nieprawidłowe wartości nan wartości. Spójrzmy teraz na następujący wynik:

Przykład 2:

Ponieważ rozumiemy, w jaki sposób funkcje Numpy są używane do maskowania zestawu danych, zobaczmy, jak korzystać z funkcji Scipy w zamaskowanej tablicy, aby wykonać obliczenia zgodnie z naszymi wymaganiami. W tym przykładzie zamaskujemy tablicę z funkcjami Numpy i używanie funkcji Scipy z zamaskowanymi tablicami. Rozważ następujący przykładowy kod:

importować Numpy jako NP
Importuj Numpy.Ma jako Ma
od Scipy.statystyki.Import MSTATS Opisz
Data = NP.tablica ([2, 5, 8, -9, -7])
maska ​​= ma.Masked_Array (dane, maska ​​= [0, 0, 0, 1, 1],
Dtype = NP.int8)
Drukuj („zamaskowana tablica to: \ n”, maska)
Drukuj („\ n”)
MASK_NA = Opisz (maska)
Drukuj („Opis tablicy: \ n”, Mask_na)

Biblioteka Numpy jest importowana do programu, ponieważ musimy użyć MA.MASSED_ARRAY () FUNKCJA MASKA Zestaw danych. Biblioteka Scipy, jej pakiet statystyk i klasa MSTATS jest importowana do programu, aby użyć funkcji „Opisz”. Funkcja „Opisz” służy do uzyskania opisu statystycznego określonej tablicy lub zestawu danych. Składnia funkcji opisu () jest następująca:

Parametr „tablica” przyjmuje dane wejściowe. Parametr „osi” służy do zdefiniowania osi do użycia do opisu. Parametr „DDOF” służy do znalezienia stopnia swobody. A parametr „uprzedzeń” służy do zdefiniowania stronniczości statystycznej. Zobaczmy teraz wyjście funkcji opisu w następującym fragmencie:

Przykład 3:

Skorzystajmy z innej funkcji Scipy w zamaskowanej tablicy, aby zrozumieć działanie funkcji z zamaskowanymi tablicami. W tym przykładzie pokażemy użycie funkcji trybu wraz z zamaskowaną tablicą. Rozważ następujący przykładowy kod:

importować Numpy jako NP
Importuj Numpy.Ma jako Ma
od Scipy.Statystyki importu MSTATS
Data = NP.tablica ([2, 5, 8, -9, -7])
maska ​​= ma.Masked_Array (dane, maska ​​= [0, 0, 0, 1, 1],
Dtype = NP.int8)
Drukuj („zamaskowana tablica to: \ n”, maska)
Drukuj („\ n”)
MASK_NA = MSTATS.tryb (maska)
Drukuj („Tryb tablicy: \ n”, Mask_na)

Pierwsza sekcja programu jest ta sama, której użyliśmy w poprzednim przykładzie. Zestaw danych i metoda maskowania tablicy są również takie same. Zmieniliśmy tylko metodę. Tutaj używamy funkcji trybu, aby znaleźć tryb zamaskowanej tablicy. Składnia funkcji trybu jest następująca:

Parametr „tablica” służy do dostarczania zestawu danych. Parametr „osi” służy do zdefiniowania osi do użycia do znalezienia trybu danych. Teraz zobaczmy tryb zamaskowanej tablicy:

Przykład 4:

Następną funkcją biblioteki Scipy, której można użyć z zamaskowaną tablicą, jest ZSCORE (). Funkcja ZSCORE służy do obliczenia Zscore podanych danych. Rozważ następujący przykład przykładowy:

importować Numpy jako NP
Importuj Numpy.Ma jako Ma
z statystyk importu Scipy
Data = NP.tablica ([2, 5, 8, -9, -7])
maska ​​= ma.Masked_Array (dane, maska ​​= [0, 0, 0, 1, 1],
Dtype = NP.int8)
Drukuj („zamaskowana tablica to: \ n”, maska)
Drukuj („\ n”)
MASK_NA = statystyki.Zscore (maska)
Drukuj („ZSCORE IS: \ N”, MASK_NA)

Ponownie używamy tego samego programu i po prostu zmieniliśmy funkcję SCIPY, która ma być używana z zamaskowaną tablicą. Jak widać, przekazujemy zamaskowaną tablicę do funkcji ZSCORE. Składnia funkcji ZSCORE jest następująca:

Parametr „tablica” służy do dostarczenia danych do funkcji Szcore. Parametr „osi” utrzymuje oś, która ma być używana do obliczania Zscore. Parametr „DDOF” służy do zdefiniowania stopnia korekcji swobody. Na koniec parametr „nan_policy” służy do zdefiniowania sposobu obsługi wartości NAN. Zobaczmy teraz następujący wynik funkcji ZSCORE:

Wniosek

Ten artykuł w Python jest szybkim przeglądem tablicy Scipy Masped. Dowiedzieliśmy się, że SCIPY nie zapewnia żadnej funkcji ani metody maskowania tablicy. Zapewnia jednak listę prostych i przydatnych funkcji, których można użyć z zamaskowanymi tablicami. Biblioteka Numpy oferuje MA.MASSED_ARRAY () Funkcja maskowania tablicy i że zamaskowana tablica może być przekazana do dowolnej funkcji Scipy, aby wykonać pożądaną operację na zamaskowanych danych.