PYSPARK - SMILE SERII SMILE

PYSPARK - SMILE SERII SMILE
„W Python PYSPARK to moduł Spark używany do zapewnienia podobnego rodzaju przetwarzania, takiego jak Spark przy użyciu serii, który będzie przechowywał dane dane w tablicy (kolumna w Pyspark wewnętrznie).

Pyspark - Pandas Series reprezentuje serię panda, ale wewnętrznie zawiera kolumnę Pyspark.

Struktura danych serii obsługująca pandy, a pandy są importowane z modułu PYSPARK.

Wcześniej musisz zainstalować moduł PYSPARK."

Komenda

PIP Instaluj PYSPARK

Składnia do importu

od Pyspark Import Pandas

Następnie możemy utworzyć lub korzystać z serii z modułu PandaS.

Składnia do tworzenia serii pandy

Pyspark.Pandy.Seria()

Możemy przekazać listę lub listę list z wartościami.

Utwórzmy serię pandy za pośrednictwem PYSPARK, który ma pięć wartości liczbowych.

#Import pandy z modułu PYSPARK
od Pyspark Import Pandas
#Create Series z 5 elementami
PYSPARK_SERIES = PANDA.Seria ([90,56,78,54,0])
Drukuj (Pyspark_Series)

Wyjście

Teraz wejdziemy do naszego samouczka.

Skumulowane operacje są używane do zwracania skumulowanych wyników w zakresie wartości w serii Pyspark Pandy.

Zobaczmy je jeden po drugim.

Pyspark.Pandy.Seria.cumsum ()

cumsum () zwróci skumulowaną sumę serii dla każdego elementu. Można go zastosować do całej serii Pyspark Pandy.

Składnia

PYSPARK_SERIES.cumsum ()

Gdzie Pyspark_Series to seria Pyspark Pandy

Przykład
W tym przykładzie przeprowadzimy skumulowaną operację sumy w serii.

#Import pandy z modułu PYSPARK
od Pyspark Import Pandas
#Create Series z 5 elementami
PYSPARK_SERIES = PANDA.Seria ([90,56,78,54,0])
#Return Sumulacyjna suma
Drukuj (pyspark_series.cumsum ())

Wyjście

Pracujący:
90
90+56 = 146
90+56+78 = 224
90+56+78+54 = 278
90+56+78+54+0 = 278

Pyspark.Pandy.Seria.cumprod ()

cumprod () zwróci skumulowany produkt serii dla każdego elementu. Można go zastosować do całej serii Pyspark Pandy.

Składnia

PYSPARK_SERIES.cumprod ()

Gdzie Pyspark_Series to seria Pyspark Pandy

Przykład
W tym przykładzie przeprowadzimy skumulowaną operację produktu w serii.

#Import pandy z modułu PYSPARK
od Pyspark Import Pandas
#Create Series z 5 elementami
PYSPARK_SERIES = PANDA.Seria ([90,56,78,54,0])
#RETURN Skumulowany produkt
Drukuj (pyspark_series.cumprod ())

Wyjście

Pracujący:
90
90*56 = 5040
90*56*78 = 393120
90*56*78*54 = 21228480
90*56*78*54*0 = 0

Pyspark.Pandy.Seria.Cummin ()

Cummin () zwróci skumulowaną minimalną wartość serii dla każdego elementu. Można go zastosować do całej serii Pyspark Pandy.

Składnia

PYSPARK_SERIES.Cummin ()

Gdzie Pyspark_Series to seria Pyspark Pandy

Przykład
W tym przykładzie przeprowadzimy skumulowaną operację minimalną w serii.

#Import pandy z modułu PYSPARK
od Pyspark Import Pandas
#Create Series z 5 elementami
PYSPARK_SERIES = PANDA.Seria ([90,56,78,54,0])
#Return Skumulowane minimum
Drukuj (pyspark_series.cummin ())

Wyjście

Pracujący:
90
minimum (90,56) = 56
minimum (90,56,78) = 56
minimum (90,56,78,54) = 54
minimum (90 56,78,54,0) = 0

Pyspark.Pandy.Seria.Cummin ()

Cummin () zwróci skumulowaną minimalną wartość serii dla każdego elementu. Można go zastosować do całej serii Pyspark Pandy.

Składnia

PYSPARK_SERIES.Cummax ()

Gdzie Pyspark_Series to seria Pyspark Pandy

Przykład
W tym przykładzie przeprowadzimy skumulowaną maksymalną operację w serii.

#Import pandy z modułu PYSPARK
od Pyspark Import Pandas
#Create Series z 5 elementami
PYSPARK_SERIES = PANDA.Seria ([90,56,78,54,0])
#RETURN Skumulowane maksimum
Drukuj (pyspark_series.cummax ())

Wyjście

Pracujący:
90
Maksymalnie (90,56) = 90
Maksymalnie (90,56,78) = 90
Maksymalnie (90 56,78,54) = 90
Maksymalnie (90 56,78,54,0) = 90

Wniosek

W tym samouczku Pyspark Pandas omówiliśmy skumulowane operacje wykonane w serii Pyspark Pandy. cumsum () służy do zwrócenia kumulatywnej sumy, cumprod () służy do zwrócenia kumulatywnego produktu w, cummin () jest używany do zwrócenia kumulatywnej wartości minimalnej, a Cummax () jest używany do zwrócenia skumulowanej maksymalnej wartości wartości.