W Python PYSPARK to moduł Spark używany do zapewnienia podobnego rodzaju przetwarzania, takiego jak Spark za pomocą DataFrame. Zapewnia metodę show (), która wyświetla ramkę danych w formacie tabelarycznym.
Składnia:
Ramka danych.Pokaż (n, pionowy, obcięty)
Gdzie DataFrame jest wejściem PYSPARK DataFrame
Parametry:
1. n jest pierwszym opcjonalnym parametrem reprezentującym wartość liczb całkowitych, aby uzyskać górne wiersze w ramce danych, a n reprezentuje liczbę górnych wierszy do wyświetlania. Domyślnie wyświetli wszystkie rzędy z DataFrame
2. Parametr pionowy pobiera wartości logiczne, które są używane do wyświetlania ramki danych w parametrze pionowym, gdy jest ustawiony na true. i wyświetl ramkę danych w formacie poziomym, gdy jest ustawiony na false. Domyślnie będzie wyświetlany w formacie poziomym
3. obcinanie służy do uzyskania liczby znaków z każdej wartości w danych danych. Zajmie to liczbę całkowitą, ponieważ niektóre znaki będą wyświetlane. Domyślnie wyświetli wszystkie znaki.
Przykład 1:
W tym przykładzie utworzymy Pyspark DataFrame z 5 wierszami i 6 kolumnami i wyświetlimy ramkę danych za pomocą metody show () bez żadnych parametrów.
Dlatego powoduje to w tabeli danych, wyświetlając wszystkie wartości w DataFrame
#Wportu na moduł PYSPAPRK
Import Pyspark
#Import Sparksession do tworzenia sesji
od Pyspark.SQL Import Sparksession
#Utworz aplikację o nazwie Linuxhint
Spark_App = Sparksession.budowniczy.AppName („Linuxhint”).getorCreate ()
# Utwórz dane ucznia z 5 wierszy i 6 atrybutów
studenci = [„Rollno”: „001”, „nazwa”: „Sravan”, „wiek”: 23, „wysokość”: 5.79, „waga”: 67, „Adres”: „Guntur”,
„Rollno”: „002”, „nazwa”: „Ojaswi”, „wiek”: 16, „wysokość”: 3.79, „waga”: 34, „Adres”: „Hyd”,
„Rollno”: „003”, „nazwa”: „Gnanesh Chowdary”, „wiek”: 7, „wysokość”: 2.79, „waga”: 17, „Adres”: „Patna”,
„Rollno”: „004”, „Nazwa”: „Rohith”, „wiek”: 9, „wysokość”: 3.69, „waga”: 28, „Adres”: „hyd”,
„Rollno”: „005”, „nazwa”: „Sridevi”, „wiek”: 37, „wysokość”: 5.59, „waga”: 54, „Adres”: „Hyd”]
# Utwórz ramkę danych
df = Spark_App.CreatedataFrame (studenci)
# ramka danych
df.pokazywać()
Wyjście:
Przykład 2:
W tym przykładzie utworzymy Pyspark DataFrame z 5 wierszami i 6 kolumnami i wyświetlimy ramkę danych za pomocą metody show () z parametrem n. Ustawiliśmy wartość N na 4, aby wyświetlić 4 górne rzędy z DataFrame.
Powoduje to więc w tabeli danych, wyświetlając 4 wartości w ramce danych.
#Wportu na moduł PYSPAPRK
Import Pyspark
#Import Sparksession do tworzenia sesji
od Pyspark.SQL Import Sparksession
#Utworz aplikację o nazwie Linuxhint
Spark_App = Sparksession.budowniczy.AppName („Linuxhint”).getorCreate ()
# Utwórz dane ucznia z 5 wierszy i 6 atrybutów
studenci = [„Rollno”: „001”, „nazwa”: „Sravan”, „wiek”: 23, „wysokość”: 5.79, „waga”: 67, „Adres”: „Guntur”,
„Rollno”: „002”, „nazwa”: „Ojaswi”, „wiek”: 16, „wysokość”: 3.79, „waga”: 34, „Adres”: „Hyd”,
„Rollno”: „003”, „nazwa”: „Gnanesh Chowdary”, „wiek”: 7, „wysokość”: 2.79, „waga”: 17, „Adres”: „Patna”,
„Rollno”: „004”, „Nazwa”: „Rohith”, „wiek”: 9, „wysokość”: 3.69, „waga”: 28, „Adres”: „hyd”,
„Rollno”: „005”, „nazwa”: „Sridevi”, „wiek”: 37, „wysokość”: 5.59, „waga”: 54, „Adres”: „Hyd”]
# Utwórz ramkę danych
df = Spark_App.CreatedataFrame (studenci)
# Uzyskaj 4 najlepsze wiersze w ramce danych
df.pokaz (4)
Wyjście:
Przykład 3:
W tym przykładzie utworzymy Pyspark DataFrame z 5 wierszami i 6 kolumnami i wyświetlimy ramkę danych za pomocą metody show () z parametrem pionowym. Ustawiamy pionowe na false, aby wyświetlić ramkę danych w widoku poziomym.
Powoduje to więc w tabeli danych, wyświetlając wszystkie wartości w widoku poziomym.
#Wportu na moduł PYSPAPRK
Import Pyspark
#Import Sparksession do tworzenia sesji
od Pyspark.SQL Import Sparksession
#Utworz aplikację o nazwie Linuxhint
Spark_App = Sparksession.budowniczy.AppName („Linuxhint”).getorCreate ()
# Utwórz dane ucznia z 5 wierszy i 6 atrybutów
studenci = [„Rollno”: „001”, „nazwa”: „Sravan”, „wiek”: 23, „wysokość”: 5.79, „waga”: 67, „Adres”: „Guntur”,
„Rollno”: „002”, „nazwa”: „Ojaswi”, „wiek”: 16, „wysokość”: 3.79, „waga”: 34, „Adres”: „Hyd”,
„Rollno”: „003”, „nazwa”: „Gnanesh Chowdary”, „wiek”: 7, „wysokość”: 2.79, „waga”: 17, „Adres”: „Patna”,
„Rollno”: „004”, „Nazwa”: „Rohith”, „wiek”: 9, „wysokość”: 3.69, „waga”: 28, „Adres”: „hyd”,
„Rollno”: „005”, „nazwa”: „Sridevi”, „wiek”: 37, „wysokość”: 5.59, „waga”: 54, „Adres”: „Hyd”]
# Utwórz ramkę danych
df = Spark_App.CreatedataFrame (studenci)
# Uzyskaj ramkę danych w sposób poziomy
df.show (vertical = false)
Wyjście:
Przykład 4:
W tym przykładzie utworzymy Pyspark DataFrame z 5 wierszami i 6 kolumnami i wyświetlimy ramkę danych za pomocą metody show () z parametrem pionowym. Ustawiamy pionowe na true, aby wyświetlić ramkę danych w widoku pionowym.
Powoduje to więc w tabeli danych, wyświetlając wszystkie wartości w widoku pionowym.
#Wportu na moduł PYSPAPRK
Import Pyspark
#Import Sparksession do tworzenia sesji
od Pyspark.SQL Import Sparksession
#Utworz aplikację o nazwie Linuxhint
Spark_App = Sparksession.budowniczy.AppName („Linuxhint”).getorCreate ()
# Utwórz dane ucznia z 5 wierszy i 6 atrybutów
studenci = [„Rollno”: „001”, „nazwa”: „Sravan”, „wiek”: 23, „wysokość”: 5.79, „waga”: 67, „Adres”: „Guntur”,
„Rollno”: „002”, „nazwa”: „Ojaswi”, „wiek”: 16, „wysokość”: 3.79, „waga”: 34, „Adres”: „Hyd”,
„Rollno”: „003”, „nazwa”: „Gnanesh Chowdary”, „wiek”: 7, „wysokość”: 2.79, „waga”: 17, „Adres”: „Patna”,
„Rollno”: „004”, „Nazwa”: „Rohith”, „wiek”: 9, „wysokość”: 3.69, „waga”: 28, „Adres”: „hyd”,
„Rollno”: „005”, „nazwa”: „Sridevi”, „wiek”: 37, „wysokość”: 5.59, „waga”: 54, „Adres”: „Hyd”]
# Utwórz ramkę danych
df = Spark_App.CreatedataFrame (studenci)
# Zdobądź ramkę danych w sposób pionowy
df.show (vertical = true)
Wyjście:
Przykład 5:
W tym przykładzie utworzymy Pyspark DataFrame z 5 wierszami i 6 kolumnami i wyświetlimy ramkę danych za pomocą metody show () z parametrem skróconym. Ustawiliśmy wartość obcięcia na 1, aby wyświetlić pierwszy znak w każdym rzędzie DataFrame.
Powoduje to zatem w tabeli danych, wyświetlając pierwszy znak w widoku poziomym.
#Wportu na moduł PYSPAPRK
Import Pyspark
#Import Sparksession do tworzenia sesji
od Pyspark.SQL Import Sparksession
#Utworz aplikację o nazwie Linuxhint
Spark_App = Sparksession.budowniczy.AppName („Linuxhint”).getorCreate ()
# Utwórz dane ucznia z 5 wierszy i 6 atrybutów
studenci = [„Rollno”: „001”, „nazwa”: „Sravan”, „wiek”: 23, „wysokość”: 5.79, „waga”: 67, „Adres”: „Guntur”,
„Rollno”: „002”, „nazwa”: „Ojaswi”, „wiek”: 16, „wysokość”: 3.79, „waga”: 34, „Adres”: „Hyd”,
„Rollno”: „003”, „nazwa”: „Gnanesh Chowdary”, „wiek”: 7, „wysokość”: 2.79, „waga”: 17, „Adres”: „Patna”,
„Rollno”: „004”, „Nazwa”: „Rohith”, „wiek”: 9, „wysokość”: 3.69, „waga”: 28, „Adres”: „hyd”,
„Rollno”: „005”, „nazwa”: „Sridevi”, „wiek”: 37, „wysokość”: 5.59, „waga”: 54, „Adres”: „Hyd”]
# Utwórz ramkę danych
df = Spark_App.CreatedataFrame (studenci)
# Uzyskaj ramkę danych, zdobywając tylko pierwszą postać w każdym rzędzie
df.show (truncate = 1)
Wyjście:
Wniosek
W tym artykule omówiono metodę show () w Pyspark i jej funkcjonalność. Rozważyliśmy wszystkie parametry z wartościami dlaFrame Data, aby wyświetlić ramkę danych w formacie tabelarycznym.