PYSPARK - Pokaż metodę

PYSPARK - Pokaż metodę
W Python PYSPARK to moduł Spark używany do zapewnienia podobnego rodzaju przetwarzania, takiego jak Spark za pomocą DataFrame. Zapewnia metodę show (), która wyświetla ramkę danych w formacie tabelarycznym.

Składnia:

Ramka danych.Pokaż (n, pionowy, obcięty)

Gdzie DataFrame jest wejściem PYSPARK DataFrame

Parametry:

1. n jest pierwszym opcjonalnym parametrem reprezentującym wartość liczb całkowitych, aby uzyskać górne wiersze w ramce danych, a n reprezentuje liczbę górnych wierszy do wyświetlania. Domyślnie wyświetli wszystkie rzędy z DataFrame

2. Parametr pionowy pobiera wartości logiczne, które są używane do wyświetlania ramki danych w parametrze pionowym, gdy jest ustawiony na true. i wyświetl ramkę danych w formacie poziomym, gdy jest ustawiony na false. Domyślnie będzie wyświetlany w formacie poziomym

3. obcinanie służy do uzyskania liczby znaków z każdej wartości w danych danych. Zajmie to liczbę całkowitą, ponieważ niektóre znaki będą wyświetlane. Domyślnie wyświetli wszystkie znaki.

Przykład 1:

W tym przykładzie utworzymy Pyspark DataFrame z 5 wierszami i 6 kolumnami i wyświetlimy ramkę danych za pomocą metody show () bez żadnych parametrów.

Dlatego powoduje to w tabeli danych, wyświetlając wszystkie wartości w DataFrame

#Wportu na moduł PYSPAPRK
Import Pyspark
#Import Sparksession do tworzenia sesji
od Pyspark.SQL Import Sparksession
#Utworz aplikację o nazwie Linuxhint
Spark_App = Sparksession.budowniczy.AppName („Linuxhint”).getorCreate ()
# Utwórz dane ucznia z 5 wierszy i 6 atrybutów
studenci = [„Rollno”: „001”, „nazwa”: „Sravan”, „wiek”: 23, „wysokość”: 5.79, „waga”: 67, „Adres”: „Guntur”,
„Rollno”: „002”, „nazwa”: „Ojaswi”, „wiek”: 16, „wysokość”: 3.79, „waga”: 34, „Adres”: „Hyd”,
„Rollno”: „003”, „nazwa”: „Gnanesh Chowdary”, „wiek”: 7, „wysokość”: 2.79, „waga”: 17, „Adres”: „Patna”,
„Rollno”: „004”, „Nazwa”: „Rohith”, „wiek”: 9, „wysokość”: 3.69, „waga”: 28, „Adres”: „hyd”,
„Rollno”: „005”, „nazwa”: „Sridevi”, „wiek”: 37, „wysokość”: 5.59, „waga”: 54, „Adres”: „Hyd”]
# Utwórz ramkę danych
df = Spark_App.CreatedataFrame (studenci)
# ramka danych
df.pokazywać()

Wyjście:

Przykład 2:

W tym przykładzie utworzymy Pyspark DataFrame z 5 wierszami i 6 kolumnami i wyświetlimy ramkę danych za pomocą metody show () z parametrem n. Ustawiliśmy wartość N na 4, aby wyświetlić 4 górne rzędy z DataFrame.

Powoduje to więc w tabeli danych, wyświetlając 4 wartości w ramce danych.

#Wportu na moduł PYSPAPRK
Import Pyspark
#Import Sparksession do tworzenia sesji
od Pyspark.SQL Import Sparksession
#Utworz aplikację o nazwie Linuxhint
Spark_App = Sparksession.budowniczy.AppName („Linuxhint”).getorCreate ()
# Utwórz dane ucznia z 5 wierszy i 6 atrybutów
studenci = [„Rollno”: „001”, „nazwa”: „Sravan”, „wiek”: 23, „wysokość”: 5.79, „waga”: 67, „Adres”: „Guntur”,
„Rollno”: „002”, „nazwa”: „Ojaswi”, „wiek”: 16, „wysokość”: 3.79, „waga”: 34, „Adres”: „Hyd”,
„Rollno”: „003”, „nazwa”: „Gnanesh Chowdary”, „wiek”: 7, „wysokość”: 2.79, „waga”: 17, „Adres”: „Patna”,
„Rollno”: „004”, „Nazwa”: „Rohith”, „wiek”: 9, „wysokość”: 3.69, „waga”: 28, „Adres”: „hyd”,
„Rollno”: „005”, „nazwa”: „Sridevi”, „wiek”: 37, „wysokość”: 5.59, „waga”: 54, „Adres”: „Hyd”]
# Utwórz ramkę danych
df = Spark_App.CreatedataFrame (studenci)
# Uzyskaj 4 najlepsze wiersze w ramce danych
df.pokaz (4)

Wyjście:

Przykład 3:

W tym przykładzie utworzymy Pyspark DataFrame z 5 wierszami i 6 kolumnami i wyświetlimy ramkę danych za pomocą metody show () z parametrem pionowym. Ustawiamy pionowe na false, aby wyświetlić ramkę danych w widoku poziomym.

Powoduje to więc w tabeli danych, wyświetlając wszystkie wartości w widoku poziomym.

#Wportu na moduł PYSPAPRK
Import Pyspark
#Import Sparksession do tworzenia sesji
od Pyspark.SQL Import Sparksession
#Utworz aplikację o nazwie Linuxhint
Spark_App = Sparksession.budowniczy.AppName („Linuxhint”).getorCreate ()
# Utwórz dane ucznia z 5 wierszy i 6 atrybutów
studenci = [„Rollno”: „001”, „nazwa”: „Sravan”, „wiek”: 23, „wysokość”: 5.79, „waga”: 67, „Adres”: „Guntur”,
„Rollno”: „002”, „nazwa”: „Ojaswi”, „wiek”: 16, „wysokość”: 3.79, „waga”: 34, „Adres”: „Hyd”,
„Rollno”: „003”, „nazwa”: „Gnanesh Chowdary”, „wiek”: 7, „wysokość”: 2.79, „waga”: 17, „Adres”: „Patna”,
„Rollno”: „004”, „Nazwa”: „Rohith”, „wiek”: 9, „wysokość”: 3.69, „waga”: 28, „Adres”: „hyd”,
„Rollno”: „005”, „nazwa”: „Sridevi”, „wiek”: 37, „wysokość”: 5.59, „waga”: 54, „Adres”: „Hyd”]
# Utwórz ramkę danych
df = Spark_App.CreatedataFrame (studenci)
# Uzyskaj ramkę danych w sposób poziomy
df.show (vertical = false)

Wyjście:

Przykład 4:

W tym przykładzie utworzymy Pyspark DataFrame z 5 wierszami i 6 kolumnami i wyświetlimy ramkę danych za pomocą metody show () z parametrem pionowym. Ustawiamy pionowe na true, aby wyświetlić ramkę danych w widoku pionowym.

Powoduje to więc w tabeli danych, wyświetlając wszystkie wartości w widoku pionowym.

#Wportu na moduł PYSPAPRK
Import Pyspark
#Import Sparksession do tworzenia sesji
od Pyspark.SQL Import Sparksession
#Utworz aplikację o nazwie Linuxhint
Spark_App = Sparksession.budowniczy.AppName („Linuxhint”).getorCreate ()
# Utwórz dane ucznia z 5 wierszy i 6 atrybutów
studenci = [„Rollno”: „001”, „nazwa”: „Sravan”, „wiek”: 23, „wysokość”: 5.79, „waga”: 67, „Adres”: „Guntur”,
„Rollno”: „002”, „nazwa”: „Ojaswi”, „wiek”: 16, „wysokość”: 3.79, „waga”: 34, „Adres”: „Hyd”,
„Rollno”: „003”, „nazwa”: „Gnanesh Chowdary”, „wiek”: 7, „wysokość”: 2.79, „waga”: 17, „Adres”: „Patna”,
„Rollno”: „004”, „Nazwa”: „Rohith”, „wiek”: 9, „wysokość”: 3.69, „waga”: 28, „Adres”: „hyd”,
„Rollno”: „005”, „nazwa”: „Sridevi”, „wiek”: 37, „wysokość”: 5.59, „waga”: 54, „Adres”: „Hyd”]
# Utwórz ramkę danych
df = Spark_App.CreatedataFrame (studenci)
# Zdobądź ramkę danych w sposób pionowy
df.show (vertical = true)

Wyjście:

Przykład 5:

W tym przykładzie utworzymy Pyspark DataFrame z 5 wierszami i 6 kolumnami i wyświetlimy ramkę danych za pomocą metody show () z parametrem skróconym. Ustawiliśmy wartość obcięcia na 1, aby wyświetlić pierwszy znak w każdym rzędzie DataFrame.

Powoduje to zatem w tabeli danych, wyświetlając pierwszy znak w widoku poziomym.

#Wportu na moduł PYSPAPRK
Import Pyspark
#Import Sparksession do tworzenia sesji
od Pyspark.SQL Import Sparksession
#Utworz aplikację o nazwie Linuxhint
Spark_App = Sparksession.budowniczy.AppName („Linuxhint”).getorCreate ()
# Utwórz dane ucznia z 5 wierszy i 6 atrybutów
studenci = [„Rollno”: „001”, „nazwa”: „Sravan”, „wiek”: 23, „wysokość”: 5.79, „waga”: 67, „Adres”: „Guntur”,
„Rollno”: „002”, „nazwa”: „Ojaswi”, „wiek”: 16, „wysokość”: 3.79, „waga”: 34, „Adres”: „Hyd”,
„Rollno”: „003”, „nazwa”: „Gnanesh Chowdary”, „wiek”: 7, „wysokość”: 2.79, „waga”: 17, „Adres”: „Patna”,
„Rollno”: „004”, „Nazwa”: „Rohith”, „wiek”: 9, „wysokość”: 3.69, „waga”: 28, „Adres”: „hyd”,
„Rollno”: „005”, „nazwa”: „Sridevi”, „wiek”: 37, „wysokość”: 5.59, „waga”: 54, „Adres”: „Hyd”]
# Utwórz ramkę danych
df = Spark_App.CreatedataFrame (studenci)
# Uzyskaj ramkę danych, zdobywając tylko pierwszą postać w każdym rzędzie
df.show (truncate = 1)

Wyjście:

Wniosek

W tym artykule omówiono metodę show () w Pyspark i jej funkcjonalność. Rozważyliśmy wszystkie parametry z wartościami dlaFrame Data, aby wyświetlić ramkę danych w formacie tabelarycznym.