PYSPARK - PANDA SERIIS NSMALLEST & NLANDANIE

PYSPARK - PANDA SERIIS NSMALLEST & NLANDANIE

„W Python PYSPARK to moduł Spark używany do zapewnienia podobnego rodzaju przetwarzania, takiego jak Spark przy użyciu serii, który będzie przechowywał dane dane w tablicy (kolumna w Pyspark wewnętrznie).

Pyspark - Pandas Series reprezentuje serię panda, ale wewnętrznie zawiera kolumnę Pyspark.

Struktura danych serii obsługująca pandy, a pandy są importowane z modułu PYSPARK.

Wcześniej musisz zainstalować moduł PYSPARK."

Komenda

PIP Instaluj PYSPARK

Składnia do importu

od Pyspark Import Pandas

Następnie możemy utworzyć lub korzystać z serii z modułu PandaS.

Składnia do tworzenia serii pandy

Pyspark.Pandy.Seria()

Możemy przekazać listę lub listę list z wartościami.

Utwórzmy serię pandy za pośrednictwem PYSPARK, który ma pięć wartości liczbowych.

#Import pandy z modułu PYSPARK
od Pyspark Import Pandas
#Create Series z 5 elementami
PYSPARK_SERIES = PANDA.Seria ([90,56,78,54,0])
Drukuj (Pyspark_Series)

Wyjście

Teraz wejdziemy do naszego samouczka.

Pyspark.Pandy.Seria.nsmallest ()

NSMALLEST () w serii Pyspark Pandas służy do zwrócenia pierwszych wartości, które są minimalne. Po prostu zwróci pierwsze najmniejsze wartości z serii wartości. Wymaga jednego parametru.

Składnia

PYSPARK_SERIES.nsmallest (n)

Gdzie Pyspark_Series to seria Pyspark Pandy

Parametr
N służy do zwrócenia liczby wartości minimalnych z całej serii PYSPARK na podstawie kolumny

Przykład 1
Zwróć pierwsze 2 najmniejsze wartości z serii Pyspark Pandy.

#Import pandy z modułu PYSPARK
od Pyspark Import Pandas
#Create Series z 5 elementami
PYSPARK_SERIES = PANDA.Seria ([90,56,78,54,0])
#return Pierwsze 2 małe wartości
Drukuj (pyspark_series.nsmallest (2))

Wyjście

Pierwsze 2 małe wartości to 0 i 54.

Przykład 2
Zwróć pierwsze 4 najmniejsze wartości z serii Pyspark Pandy.

#Import pandy z modułu PYSPARK
od Pyspark Import Pandas
#Create Series z 5 elementami
PYSPARK_SERIES = PANDA.Seria ([90,56,78,54,0])
#return Pierwsze 4 małe wartości
Drukuj (pyspark_series.nsmallest (4))

Wyjście

Pierwsze 4 małe wartości to 0, 54, 56 i 78.

Pyspark.Pandy.Seria.nlANDAST ()

NLASTANIEL () w serii Pyspark Pandy służy do zwrócenia pierwszych wartości, które są maksymalne. Po prostu zwróci pierwsze największe wartości z serii wartości. Wymaga jednego parametru.

Składnia

PYSPARK_SERIES.NLIELDZIE (N)

Gdzie Pyspark_Series to seria Pyspark Pandy

Parametr
n służy do zwrócenia liczby maksymalnych wartości z całej serii PYSPARK na podstawie kolumny

Przykład 1
Zwróć pierwsze 2 największe wartości z serii Pyspark Pandy.

#Import pandy z modułu PYSPARK
od Pyspark Import Pandas
#Create Series z 5 elementami
PYSPARK_SERIES = PANDA.Seria ([90,56,78,54,0])
#return Pierwsze 2 duże wartości
Drukuj (pyspark_series.NLIELDZIE (2))

Wyjście

Pierwsze 2 duże wartości to 90 i 78.

Przykład 2
Zwróć pierwsze 4 największe wartości z serii Pyspark Pandy.

#Import pandy z modułu PYSPARK
od Pyspark Import Pandas
#Create Series z 5 elementami
PYSPARK_SERIES = PANDA.Seria ([90,56,78,54,0])
#return Pierwsze 4 duże wartości
Drukuj (pyspark_series.NLIEGDANIE (4))

Wyjście

Pierwsze 4 małe wartości to 90 78,56 i 54.

Wniosek

W tym samouczku serii Pyspark Pandy widzieliśmy, jak uzyskać pierwsze minimalne i maksymalne wartości przy użyciu funkcji NSMallest () i NLAND (). Funkcje te przyjmują jeden parametr, który odnosi się do liczby wierszy do zwrócenia (minimalne rzędy dla NSMallest () i maksymalne wiersze dla NLANGUAN ()).