Skumulowane pand produktu

Skumulowane pand produktu
Python to przyjazny dla użytkownika język programowania wysokiego poziomu uważany za najlepiej do przeprowadzania analizy danych. Głównym powodem tego jest to, że Python zapewnia świetny ekosystem pakietów zorientowanych na dane, takich jak pandy. Pandy w Python ułatwiają importowanie i analizę danych.

Jedną z funkcji pandy jest seria.cumprod (). Ta metoda służy do obliczenia skumulowanego produktu serii. W tym artykule wyjaśnimy, jak obliczyć skumulowany produkt za pomocą biblioteki Panda w Python.

Co to jest skumulowany produkt?

Skumulowany produkt jest iteracyjnym produktem każdego elementu w tablicy. Dana sekwencja jest iteracyjnie mnożona przez każdy element w tej sekwencji. Każda wynikowa wartość jest sumą bieżących i poprzednich wartości tablicy. Na przykład mamy sekwencję 3 elementów [x, y, z], a skumulowanym produktem będzie [x, xy, xyz].

Pandy w Pythonie zapewniają kilka funkcji do obliczenia skumulowanego produktu serii. cumprod () jest jedną z tych funkcji, które są powszechnie używane do znalezienia skumulowanego produktu serii w Pythonie. Frame lub seria elementów podanych do funkcji cumprod () oblicza kumulatywny produkt i zwraca ten sam rozmiar ramki danych lub serii zawierających kumulatywny produkt.

Jaka jest składnia serii.metoda cumprod ()?

Oto składnia serii.Metoda cumprod ():

Serie.cumprod () przyjmuje dwa parametry; Oś i Skipna. Wartość osi wynosi 0 lub 1; lub jest to indeks lub kolumna, 0 i indeks, oba reprezentują operację wiersza, a zarówno 1, jak i kolumna reprezentują operację kolumnową. Ponadto wartość Skipna jest wartością logiczną (prawda lub fałsz). Służy do pomijania wartości Na w ramie danych. Serie.cumprod () zwraca ten sam rozmiar serii co wejście.

Teraz kontynuujmy przykłady, aby zobaczyć, jak możemy zaimplementować funkcję cumprod () w Python.

Przykład 1

W tym przykładzie utworzymy małą serię liczb, która zawiera również wartość NA. Wartość NA jest przechowywana w serii, aby zobaczyć, jak reaguje na nią cumprod (). Ponadto dla parametru Skipna nie podano żadnej wartości, dzięki czemu cumprod () używa domyślnej wartości Skipna jest prawdziwa. Zobacz kod poniżej.

Jak wspomniano wcześniej, skumulowany produkt jest produktem bieżącej wartości i wszystkich poprzednich wartości w tablicy. Pierwszy element w oryginalnej tablicy jest zawsze równy pierwszego skumulowanego produktu. Druga wartość jest iloczyn pierwszej i drugiej wartości, 2 * 3 = 6, a trzecia wartość jest iloczyn pierwszych trzech wartości, 2 * 3 * 5 = 30.

Teraz, jeśli czwarta wartość to NAN, Skipna była prawdziwa, co sprawiło, że cumprod () pominął wartość NA i posunął się do przodu, zwracając NA bieżącą wartość. Ten sam proces skumulowanego produktu jest obserwowany przez resztę wartości w tablicy.

importować pandy jako PD
importować Numpy jako NP
num = [2, 3, 5, NP.Nan, 7, 9, 1, 0]
S = PD.Seria (num)
cumprod = s.cumprod ()
Drukuj (cumprod)

Zobacz następujące dane wyjściowe, aby poznać skumulowany produkt każdej wartości w tablicy:

Przykład 2

W poprzednim przykładzie nie dostarczyliśmy wartości Skipna, aby domyślnie tra. Teraz podamy FAŁSZ dla Skipna, aby cumprod () nie pominął NA, i możemy zobaczyć, co się stanie w takim przypadku.

Podając fałszywą wartość dla Skipna, zmuszamy cumprod () do zauważenia wartości Na w dowolnym momencie i porównywania za każdym razem w jego wystąpieniu. Zobacz następujący kod, aby dowiedzieć się, jak podać fałszywą wartość dla parametru Skipna:

importować pandy jako PD
importować Numpy jako NP
num = [2, 3, 5, NP.Nan, 7, 9, 1, 0]
S = PD.Seria (num)
cumprod = s.cumprod (skipna = false)
Drukuj (cumprod)

Oto dane wyjściowe poprzedniego kodu:

Zauważ, że pierwsze cztery wartości są takie same jak poprzedni przykład. Jednak piąta wartość staje się Na, jak podaliśmy Skipna = Fałsz, co oznacza, że ​​Na nie jest ignorowane i porównywane, gdy wystąpiła na liście. Zatem tworzenie wszystkich pozostałych wartości.

Przykład 3

W poprzednich przykładach widzieliśmy skumulowany produkt prostej tablicy. Przyjrzyjmy się, jak możemy obliczyć skumulowany produkt tablicy w zależności od osi. Ten przykład zapewni dwie kolumny w tablicy i znajdzie ich skumulowany produkt. Oto kod do tego:

importować Numpy jako NP
ARR = NP.tablica ([[1, 3, 5, 7], [2, 4, 6, 8]))
print („tablica wejściowa to =”, arr)
res = np.cumprod (ARR)
Drukuj („skumulowany produkt tablicy wejściowej jest =”, res)

Należy zauważyć, że wynikowa tablica jest sumą długości obu kolumn, czyli 4 + 4 = 8. Zobacz dane wyjściowe poniżej:

Przykład 4

Teraz wiemy, że możliwe jest obliczenie skumulowanego produktu tablicy na podstawie osi, możemy zdecydować, czy chcemy obliczyć kumulatywny produkt całej osi, czy tylko 1 osi jednocześnie. Zobacz poniższy kod, aby wiedzieć, jak możemy to osiągnąć.

Jak można zauważyć, dostarczyliśmy tylko dodatkowy parametr osi do funkcji cumprod (). Wartość dla parametru osi wynosi 1, co oznacza obliczenie kumulatywnego iloczyn 1 osi. Krótko mówiąc, cumprod () weźmie pierwszą kolumnę, obliczy jego skumulowany produkt i zwróci wynik. Następnie weź drugą kolumnę, uruchom nowy kumulatywny produkt, oblicz skumulowany produkt każdego elementu i zwróć wynik dla drugiej kolumny.

importować Numpy jako NP
ARR = NP.tablica ([[1, 3, 5, 7], [2, 4, 6, 8]))
print („tablica wejściowa to =”, arr)
res = np.cumprod (ARR, oś = 1)
Drukuj („skumulowany produkt tablicy wejściowej jest =”, res)

Oto obraz wyjściowy:

Wniosek

W tym artykule omówiliśmy podstawową koncepcję obliczania skumulowanego produktu. Wspomnialiśmy również o wytycznych dotyczących obliczania skumulowanego produktu za pomocą pandy w Python. Pandy w Pythonie zapewniają funkcję cumprod () do obliczenia skumulowanego produktu serii.