PYSPARK - Operacje arytmetyczne serii pandy

PYSPARK - Operacje arytmetyczne serii pandy
„W Python PYSPARK to moduł Spark używany do zapewnienia podobnego rodzaju przetwarzania, takiego jak Spark przy użyciu serii, który będzie przechowywał dane dane w tablicy (kolumna w Pyspark wewnętrznie).

Pyspark - Pandas Series reprezentuje serię panda, ale wewnętrznie zawiera kolumnę Pyspark.

Struktura danych serii obsługująca pandy, a pandy są importowane z modułu PYSPARK.

Wcześniej musisz zainstalować moduł PYSPARK."

Komenda

PIP Instaluj PYSPARK

Składnia do importu

od Pyspark Import Pandas

Następnie możemy utworzyć lub korzystać z serii z modułu PandaS.

Składnia do tworzenia serii pandy

Pyspark.Pandy.Seria()

Możemy przekazać listę lub listę list z wartościami.

Utwórzmy serię pandy za pośrednictwem PYSPARK, który ma pięć wartości liczbowych.

#Import pandy z modułu PYSPARK
od Pyspark Import Pandas
#Create Series z 5 elementami
PYSPARK_SERIES = PANDA.Seria ([90,56,78,54,0])
Drukuj (Pyspark_Series)

Wyjście

Teraz wejdziemy do naszego samouczka.

Operacje arytmetyczne są używane do wykonywania operacji, takich jak dodanie, odejmowanie, mnożenie, podział i moduł. Seria Pyspark Pandas obsługuje wbudowane funkcje używane do wykonywania tych operacji.

Zobaczmy je jeden po drugim.

Pyspark.Pandy.Seria.dodać()

add () w serii Pyspark Pandy służy do dodawania elementów w całej serii o wartości.

Bierze wartość jako parametr.

Składnia

PYSPARK_SERIES.dodać wartość)

Gdzie,

  1. PYSPARK_SERIES to seria Pyspark Pandas
  2. Wartość wymaga dodania wartości liczbowej do PYSPARK_SERIE.

Przykład
W tym przykładzie dodamy 5 do serii.

#Import pandy z modułu PYSPARK
od Pyspark Import Pandas
#Create Series z 5 elementami
PYSPARK_SERIES = PANDA.Seria ([90,56,78,54,0])
#add 10 do każdej serii elementu I
Drukuj (pyspark_series.Dodaj (10))

Wyjście

Widzimy, że 10 jest dodawane do każdego elementu z serii.

Pyspark.Pandy.Seria.pod()

Sub () w serii Pyspark Pandy służy do odejmowania elementów w całej serii o wartości.

Bierze wartość jako parametr.

Składnia

PYSPARK_SERIES.sub (wartość)

Gdzie,

  1. PYSPARK_SERIES to seria Pyspark Pandas
  2. Wartość wymaga odejmowania wartości liczbowej od Pyspark_Series.

Przykład
W tym przykładzie odjęmy 10 od serii.

#Import pandy z modułu PYSPARK
od Pyspark Import Pandas
#Create Series z 5 elementami
PYSPARK_SERIES = PANDA.Seria ([90,56,78,54,0])
#Subtract 10 z każdego elementu w szeregu
Drukuj (pyspark_series.sub (10))

Wyjście

Widzimy, że 10 jest odejmowane od każdego elementu z serii.

Pyspark.Pandy.Seria.MUL ()

MUL () w serii Pyspark Panand jest używany do pomnożenia elementów w całej serii o wartości.

Bierze wartość jako parametr.

Składnia

PYSPARK_SERIES.MUL (wartość)

Gdzie,

  1. PYSPARK_SERIES to seria Pyspark Pandas
  2. Wartość wymaga pomnożenia wartości liczbowej za pomocą PYSPARK_SERIES.

Przykład
W tym przykładzie pomnożymy 10 z serią.

#Import pandy z modułu PYSPARK
od Pyspark Import Pandas
#Create Series z 5 elementami
PYSPARK_SERIES = PANDA.Seria ([90,56,78,54,0])
#multiply 10 do każdego elementu w szeregu
Drukuj (pyspark_series.MUL (10))

Wyjście

Widzimy, że 10 jest mnożone przez każdy element z serii.

Pyspark.Pandy.Seria.div ()

Div () w serii Pyspark Pandy służy do podziału elementów w całej serii według wartości. Zwraca iloraz.

Bierze wartość jako parametr.

Składnia

PYSPARK_SERIES.div (wartość)

Gdzie,

  1. PYSPARK_SERIES to seria Pyspark Pandas
  2. Wartość wymaga pomnożenia wartości liczbowej za pomocą PYSPARK_SERIES.

Przykład
W tym przykładzie podzielimy serię przez 10.

#Import pandy z modułu PYSPARK
od Pyspark Import Pandas
#Create Series z 5 elementami
PYSPARK_SERIES = PANDA.Seria ([90,56,78,54,0])
#Divide Series by 10
Drukuj (pyspark_series.Div (10))

Wyjście

Widzimy, że każdy element z serii jest podzielony przez 10 i zwrócony iloraz.

Pyspark.Pandy.Seria.mod ()

Div () w serii Pyspark Pandy służy do podziału elementów w całej serii według wartości. Zwraca resztę.

Bierze wartość jako parametr.

Składnia

PYSPARK_SERIES.mod (wartość)

Gdzie,

  1. PYSPARK_SERIES to seria Pyspark Pandas
  2. Wartość wymaga pomnożenia wartości liczbowej za pomocą PYSPARK_SERIES.

Przykład
W tym przykładzie podzielimy serię przez 10.

#Import pandy z modułu PYSPARK
od Pyspark Import Pandas
#Create Series z 5 elementami
PYSPARK_SERIES = PANDA.Seria ([90,56,78,54,0])
#Divide Series by 10
Drukuj (pyspark_series.mod (10))

Wyjście

Widzimy, że każdy element z serii jest podzielony przez 10 i zwróciła resztę.

Wniosek

W tym samouczku Pyspark Panand omówiliśmy operacje arytmetyczne wykonane w serii Pyspark Pandy. add () służy do dodania wszystkich wartości w całej serii, a sub () służy do odjęcia wartości od całej serii Pyspark Pandy. MUL () służy do pomnożenia wszystkich wartości w całej serii o wartości, a div () służy do podziału wszystkich wartości przez wartość w serii Pyspark Pandas i zwrócić iloraz. mod () służy do podziału wszystkich wartości przez wartość w serii Pyspark Pandy i zwrócić resztę. Różnica między mod () a div () to mod () zwraca resztę, ale Div () zwraca iloraz.