Pyspark między funkcją

Pyspark między funkcją
Funkcja między () w PYSPARK służy do wyboru wartości w określonym zakresie. Można go używać z metodą Select ().

Zwróci prawdziwie we wszystkich wartościach w określonym zakresie.

W przypadku wartości, które nie są w określonym zakresie, False jest zwracany.

Składnia
DataFrame_Obj.Wybierz (DataFrame_Obj.wiek.między (niski, wysoki)))

Gdzie,
DataFrame_Object to Pyspark DataFrame.

Parametry:
Wymaga dwóch parametrów.

  1. Niski będzie zakres początkowy
  2. Wysokość będzie końcem.

Powrót:
Zwraca wszystkie wiersze z wartościami logicznymi (prawda/fałsz).

Przyjrzymy się różnym przykładom.

Przykład 1
Tutaj otrzymamy wartości w kolumnie wiekowej, które znajdują się w zakresie od 10 do 21.

Import Pyspark
od Pyspark.SQL Import *
Spark_App = Sparksession.budowniczy.Nazwa aplikacji('_').getorCreate ()
studenci = [(4, „Sravan”, 23, „Php”, „Testowanie”),
(2, „Sravan”, 23, „Oracle”, „Testing”),
(46, „Mounika”, 22, '.Net ', „html”),
(12, „Deepika”, 21, „Oracle”, „html”),
(46, „Mounika”, 22, „Oracle”, „Testing”),
(12, „Chandrika”, 23, „Hadoop”, „C#”),
(12, „Chandrika”, 22, „Oracle”, „Testing”),
(45, „Sravan”, 23, „Oracle”, „C#”),
(4, „Deepika”, 21, „php”, „c#”),
(46, „Mounika”, 22, '.Net ', „testowanie”)
]
DataFrame_Obj = Spark_App.CreatedATAframe (studenci, [„Temat_id”, „nazwa”, „wiek”, „technologia1”, „technologia 2”])
Drukuj („--- rzeczywista ramka danych ---”)
DataFrame_Obj.pokazywać()
Drukuj („--- Wartości w kolumnie wiekowej od 10 do 21 ---”)
DataFrame_Obj.Wybierz (DataFrame_Obj.Wiek, DataFrame_Obj.wiek.między (10, 21)).pokazywać()

Wyjście:

Widać, że wartości w kolumnie wiekowej zwróciły prawdziwe między 10 a 21. Reszta wartości zwróciła fałsz.

Przykład 2
Tutaj będziemy mieli wartości w kolumnie tematycznej, które znajdują się w zakresie od 40 do 46.

Import Pyspark
od Pyspark.SQL Import *
Spark_App = Sparksession.budowniczy.Nazwa aplikacji('_').getorCreate ()
studenci = [(4, „Sravan”, 23, „Php”, „Testowanie”),
(2, „Sravan”, 23, „Oracle”, „Testing”),
(46, „Mounika”, 22, '.Net ', „html”),
(12, „Deepika”, 21, „Oracle”, „html”),
(46, „Mounika”, 22, „Oracle”, „Testing”),
(12, „Chandrika”, 23, „Hadoop”, „C#”),
(12, „Chandrika”, 22, „Oracle”, „Testing”),
(45, „Sravan”, 23, „Oracle”, „C#”),
(4, „Deepika”, 21, „php”, „c#”),
(46, „Mounika”, 22, '.Net ', „testowanie”)
]
DataFrame_Obj = Spark_App.CreatedATAframe (studenci, [„Temat_id”, „nazwa”, „wiek”, „technologia1”, „technologia 2”])
Drukuj („--- rzeczywista ramka danych ---”)
DataFrame_Obj.pokazywać()
Drukuj („--- Wartości w kolumnie tematu_id między 40 a 46 ---”)
DataFrame_Obj.Wybierz (DataFrame_Obj.UTATES_ID, DataFrame_Obj.temat_id.między (40,46)).pokazywać()

Wyjście:

Widać, że wartości w kolumnie tematu_id zwróciły true, które wynoszą od 40 do 46. Pozostałe wartości są zwracane fałsz.

Przykład 3
Tutaj otrzymamy wartości w kolumnie tematu_id, które znajdują się w zakresie od 60 do 100.

Import Pyspark
od Pyspark.SQL Import *
Spark_App = Sparksession.budowniczy.Nazwa aplikacji('_').getorCreate ()
studenci = [(4, „Sravan”, 23, „Php”, „Testowanie”),
(2, „Sravan”, 23, „Oracle”, „Testing”),
(46, „Mounika”, 22, '.Net ', „html”),
(12, „Deepika”, 21, „Oracle”, „html”),
(46, „Mounika”, 22, „Oracle”, „Testing”),
(12, „Chandrika”, 23, „Hadoop”, „C#”),
(12, „Chandrika”, 22, „Oracle”, „Testing”),
(45, „Sravan”, 23, „Oracle”, „C#”),
(4, „Deepika”, 21, „php”, „c#”),
(46, „Mounika”, 22, '.Net ', „testowanie”)
]
DataFrame_Obj = Spark_App.CreatedATAframe (studenci, [„Temat_id”, „nazwa”, „wiek”, „technologia1”, „technologia 2”])
Drukuj („--- rzeczywista ramka danych ---”)
DataFrame_Obj.pokazywać()
Drukuj („--- Wartości w kolumnie tematu_id między 60 a 100 ---”)
DataFrame_Obj.Wybierz (DataFrame_Obj.UTATES_ID, DataFrame_Obj.temat_id.między (60 100)).pokazywać()

Wyjście:

Widać, że wartości braku wartości w kolumnie UTATS_ID nie są w określonym zakresie. Tak więc, dla wszystkich wierszy, False jest zwracany.

Wniosek

W tym samouczku Pyspark omówiliśmy funkcję między (). Gdzie funkcja między () wybiera wartości w określonym zakresie. Można go używać z metodą Select (). Zwróci prawdziwie we wszystkich wartościach, które znajdują się wewnątrz w określonym zakresie. W przypadku wartości, które nie są w określonym zakresie, False jest zwracany.