Funkcja Signum Pyspark

Funkcja Signum Pyspark
Główną zaletą funkcji Signum jest dostarczanie znaku danym wartościom. W Pyspark DataFrame z kolumnami numerycznymi, jeśli wartość jest mniejsza niż 0, wówczas Signum zwraca -1. Jeśli wartość jest równa 0, wówczas signum zwraca 0. W przeciwnym razie zwraca 1.

signum () funkcja

Funkcja signum () jest funkcją matematyczną stosowaną w Pyspark. Jest dostępny w Pyspark.SQL.Moduł funkcji.

Można go używać z metodą Select, ponieważ wybierz () wyświetla wartości signum w Pyspark DataFrame.

Składnia:
DataFrame_Obj.Wybierz (signum (dataFrame_Obj.kolumna))

Parametr:
Nazwa kolumny jako parametr zwraca wartości signum dla tej kolumny.

Teraz zobaczymy kilka przykładów, aby lepiej zrozumieć tę funkcję.

Przykład 1
Utwórzmy Pyspark DataFrame z 3 wierszami i 4 kolumnami, a także wszystkie typy liczbowe i zwracaj wartości signum.

Import Pyspark
Importuj matematyka
od Pyspark.SQL Import Sparksession
od Pyspark.SQL.Funkcje importu signum
Spark_App = Sparksession.budowniczy.Nazwa aplikacji('_').getorCreate ()
#Utworz wartości matematyczne
wartości = [(matematyka.PI, 0,7.8120),
(Matematyka.PI/2,1,0.5 180),
(Matematyka.PI/3, -5, -12.9 360)
]
#Passign Columns poprzez tworzenie PYSPARK DATAFRAME
DataFrame_Obj = Spark_App.CreatedATAframe (wartości, [„wartość1”, „wartość2”, „value3”, „value4”])
DataFrame_Obj.pokazywać()
#Zadzwoń Wartości Signum kolumny Value1
DataFrame_Obj.Wybierz (signum (dataFrame_Obj.wartość 1)).pokazywać()

Wyjście:

Tak więc dla wartości kolumny1 zwróciliśmy wartości signum.
3.141592653589793 jest większy niż 0. Tak więc signum to 1.
1.5707963267948966 jest większy niż 0. Tak więc signum to 1.
1.0471975511965976 jest większy niż 0. Tak więc signum to 1.

Przykład 2
Teraz zwrócimy wartości Signum dla kolumn wartości2 i wartości3.

Import Pyspark
Importuj matematyka
od Pyspark.SQL Import Sparksession
od Pyspark.SQL.Funkcje importu signum
Spark_App = Sparksession.budowniczy.Nazwa aplikacji('_').getorCreate ()
#Utworz wartości matematyczne
wartości = [(matematyka.PI, 0,7.8120),
(Matematyka.PI/2,1,0.5 180),
(Matematyka.PI/3, -5, -12.9 360)
]
#Passign Columns poprzez tworzenie PYSPARK DATAFRAME
DataFrame_Obj = Spark_App.CreatedATAframe (wartości, [„wartość1”, „wartość2”, „value3”, „value4”])
DataFrame_Obj.pokazywać()
#Kolumna Signum Wartości Wartości2 i Value3
DataFrame_Obj.Wybierz (signum (dataFrame_Obj.wartość2), signum (dataFrame_Obj.wartość3)).pokazywać()

Wyjście:

Kolumna - wartość2:

0 to 0. Tak więc signum to 0.
1 jest większy niż 0. Tak więc signum to 1.
-5 jest mniej niż 0. Tak więc podpis to -1.

Kolumna - wartość3:

7.8 jest większy niż 0. Tak więc signum to 1.
0.5 jest większe niż 0. Tak więc signum to 1.
-12.9 jest mniej niż 0. Tak więc podpis to -1.

Notatka: signum () funkcja zwróci NULL, jeśli zastosujesz ją do wartości ciągu. Działa tylko na danych numerycznych.

Wniosek

W tym samouczku Pyspark omówiliśmy funkcję signum (). signum () to funkcja matematyczna, która może być używana w Pyspark. Jest dostępny w Pyspark.SQL.Moduł funkcji. W kolumnie DataFrame, jeśli wartość jest mniejsza niż 0, wówczas Signum zwraca -1. Jeśli wartość jest równa 0, signum zwraca 0. W przeciwnym razie zwraca 1.