Można je używać z klauzulą filtra lub w miejscu, w którym klauzula. Zobaczymy je jeden po drugim z różnymi przykładami.
jak () funkcja
Funkcja podobna () w PYSPARK służy do sprawdzenia, czy w kolumnie Pyspark DataFrame istnieje ciąg lub wzór. Jeśli istnieje, dopasowane wiersze zostaną zwrócone. W przeciwnym razie zwracana jest pusta ramka danych. To jest wrażliwe na wielkość.
Składnia
DataFrame_Object.filtr (DataFrame_Obj.kolumna.jak (wzór/string))Gdzie,
DataFrame_Object to Pyspark DataFrame.
Parametr:
tak jak() Funkcja ma jeden parametr.
Może to być wzorzec lub ciąg, tak że funkcja podobna () sprawdzi, czy określona wartość jest obecna w kolumnie DataFrame.
Powrót:
Na podstawie tej wartości kolumny cały wiersz jest zwracany.
Najpierw utworzymy Pyspark DataFrame z 10 wierszy i 5 kolumnami.
Import PysparkWyjście:
Teraz zastosujmy funkcję podobną () w Pyspark DataFrame, aby zwrócić wyniki.
Przykład 1
Podamy ciąg „Sravan”, w kolumnie nazwy wewnątrz metody podobnej () i zwrócimy wszystkie wiersze pasujące do tego ciągu.
Wyjście:
Widać, że Sravan znajduje się trzy razy, a rzędy zostały zwrócone.
Przykład 2
Podamy ciąg „php” w kolumnie technologii1 w metodzie podobnej () i zwrócimy wszystkie wiersze pasujące do tego ciągu.
Wyjście:
Widać, że PHP nie znajduje się w kolumnie technologii1. Stąd zwrócono 0 wierszy.
funkcja iLike ()
Funkcja ILIKE () w PYSPARK służy do sprawdzenia, czy w kolumnie Pyspark DataFrame istnieje ciąg lub wzór. Jeśli istnieje, dopasowane wiersze zostaną zwrócone. W przeciwnym razie pusta strumienia danych jest zwracana. Jest to niewrażliwe.
Składnia
DataFrame_Object.filtr (DataFrame_Obj.kolumna.iLike (wzór/string))Gdzie,
DataFrame_Object to Pyspark DataFrame.
Parametr:
Funkcja iLike () ma jeden parametr.
Może to być wzór lub ciąg, tak że funkcja iLike () sprawdzi, czy określona wartość jest obecna w kolumnie DataFrame.
Powrót:
Na podstawie tej wartości kolumny cały wiersz jest zwracany.
Przykład 1
Podamy ciąg „Sravan”, w kolumnie nazwy wewnątrz metody iLike () i zwrócimy wszystkie wiersze pasujące do tego ciągu.
Wyjście:
Wyjaśnienie
Widać, że Sravan znajduje się trzy razy, a rzędy zostały zwrócone.
Przykład 2
Podamy ciąg „php” w kolumnie technologii1 w metodzie podobnej () i zwrócimy wszystkie wiersze pasujące do tego ciągu.
Wyjście:
Wyjaśnienie
Widać, że PHP nie znajduje się w kolumnie technologii1. Ale iLike () jest niewrażliwy dla przypadków. Tak więc wymaga PHP i PHP jako takie same. Więc wiersze zostały zwrócone.
Wniosek
W tym samouczku PYSPARK widzieliśmy dwie funkcje, które zwracają wartości na podstawie dopasowania ciągów w kolumnie PYSPARK DATEFrame. Funkcje podobne () i iLike () służą do sprawdzenia, czy w kolumnie Pyspark DataFrame istnieje ciąg lub wzór. Różnica jest taka jak () jest wrażliwość na przypadek, a iLike () jest bezwrażliwy.