PYSPARK - Pandas DataFrame reprezentuje pandas DataFrame, ale wewnętrznie utrzymuje Pyspark DataFrame.
Pandy obsługują strukturę danych danych, a pandy są importowane z modułu PYSPARK.
Wcześniej musisz zainstalować moduł PYSPARK."
Komenda
PIP Instaluj PYSPARKSkładnia do importu
od Pyspark Import PandasNastępnie możemy utworzyć lub użyć ramki danych z modułu pandaas.
Składnia do tworzenia pandas DataFrame
Pyspark.Pandy.Ramka danych()Możemy przekazać słownik lub listę list z wartościami.
Utwórzmy Pandas DataFrame za pośrednictwem PYSPARK, który ma cztery kolumny i pięć wierszy.
#Import pandy z modułu PYSPARKWyjście
Teraz wejdziemy do naszego samouczka.
Zobaczmy je jeden po drugim.
PYSPARK - PANDAS DATEFRAME: NSMALLEST ()
Pyspark.Pandy.Ramka danych.nsmallest ()NSMALLEST () w Pyspark Pandas DataFrame służy do zwrócenia pierwszych wierszy, które są minimalne na podstawie kolumny. Zwróci więc pierwsze całe minimalne rzędy obecne w Pyspark Pandy DataFrame. Wymaga dwóch parametrów.
Składnia
PYSPARK_PANDAS.nsmallest (n, kolumna)Parametry
Przykład 1
W tym przykładzie otrzymamy pierwsze 2 minimalne rzędy na podstawie kolumny Mark1.
Wyjście
Tutaj 54 i 67 to pierwsze 2 najmniej (minimalne) wartości obecne w kolumnie Mark1. Zatem odpowiednie 2 wiersze zostały zwrócone.
Przykład 2
W tym przykładzie otrzymamy pierwsze 4 minimalne rzędy na podstawie kolumny Student_lastname.
Wyjście
Tutaj Chamundi, Hyna, Kapila i Lehara to pierwsze 4 najmniej (minimalne) wartości obecne w kolumnie Student_name. Zatem odpowiednie 4 wiersze zostały zwrócone.
PYSPARK - PANDAS DATEFRAME: NLASTAND ()
Pyspark.Pandy.Ramka danych.nlANDAST ()NLASTAND () w Pyspark Pandas DataFrame służy do zwracania pierwszych wierszy, które są maksymalne na podstawie kolumny. Zwróci więc pierwsze całe maksymalne rzędy obecne w Pyspark PandaSframe. Wymaga dwóch parametrów.
Składnia
PYSPARK_PANDAS.NLIEGDALNE (n, kolumna)Parametry
Przykład 1
W tym przykładzie otrzymamy pierwsze 2 maksymalne rzędy na podstawie kolumny Mark1.
Wyjście
Tutaj 90 i 90 to pierwsze 2 duże (maksymalne) wartości obecne w kolumnie Mark1. Zatem odpowiednie 2 wiersze zostały zwrócone.
Przykład 2
W tym przykładzie otrzymamy pierwsze 4 maksymalne wiersze na podstawie kolumny Student_lastname.
Wyjście
Tutaj Manasa, Lehara, Kapila i Hyna są pierwszymi 4 wysokimi (maksymalnymi) wartościami obecnymi w nazwie Studenta.kolumna. Zatem odpowiednie 4 wiersze zostały zwrócone.
Wniosek
W tym samouczku Pyspark Pandas DataFrame widzieliśmy, jak uzyskać pierwsze minimalne i maksymalne wartości przy użyciu funkcji NSMallest () i. Funkcje te obejmują nazwę kolumny, która zwróci wiersze na podstawie tej kolumny.