SEABORD DataFrame

SEABORD DataFrame
„Seorborn pomaga w eksploracji danych i rozumienia danych. Jego funkcje wykresów działają z ramami danych i tablic zawierających całe zestawy danych, wykonując wymaganą agregację statystyczną i mapowanie semantyczne, aby budować przydatne wykresy. Stowarzyszenia statystyczne można zaobserwować przy pomocy Seorbor. Analiza statystyczna służy do ustalenia, w jaki sposób parametry w zestawie danych odnoszą się ze sobą i jak na to połączenie wpływają inne zmienne. Ta analiza statystyczna pomaga w wizualizacji trendów, a także w identyfikacji różnych funkcji w zestawie danych.

Domyślnie Pandas DataFrame służy do ładowania zestawu danych. Ta oprawa danych jest używana przez dowolną funkcję Pandas DataFrame. Ramy danych to prostokątne siatki, które przechowują dane i umożliwiają łatwe przeglądanie danych. Każda kolumna wzoru siatki jest wektorem, który przechowuje dane dla pojedynczej zmiennej, a każdy wiersz siatki ma wartości instancji. Oznacza to, że wartości w wierszach danych danych nie muszą mieć tego samego typu danych; Mogą być arytmetyczne, tekstowe, logiczne lub cokolwiek innego. Ramy danych to dwuwymiarowe kontenery danych z adnotacjami z różnorodnymi rodzajami kolumn, które są pakowane z modułem pandas dla Pythona.

Biblioteka w Seborn zawiera kilka kluczowych zestawów danych. Zestawy danych przesyłane automatycznie po zainstalowaniu Seorborda. Potrzebny zestaw danych można załadować z pomocą kolejnej funkcji.

load_dataset ()

Ta funkcja zapewnia szybki dostęp do ograniczonej liczby przykładowych zestawów danych, których można użyć do dokumentowania Seaorn lub tworzenia powtarzalnych przykładów raportowania błędów. Normalne użycie nie wymaga tego."

Przykład 1

W naszym pierwszym przykładzie używamy wykresu pudełka do wyobrażenia sobie rekordów. Mamy moduły Seaorn i Matplotlib do planowania wykresu liniowego. Następnie zmienna jest zadeklarowana jako dane, a wewnątrz tej zmiennej wywołuje Seaorn Load_Dataset. Load_dataset przyjmuje ramkę danych wskazówek, która jest domyślnie obecna w Pythonie. Teraz możemy wywołać dowolną kolumny z zestawu danych Titanic do renderowania fabuły. Wykres pola bierze X jako argument, do którego ustawiliśmy kolumnę Total_Bill z przykładowego zestawu danych Titanic.

Importuj Seaorn jako SNS
importować matplotlib.Pyplot as Plt
Data = SNS.load_dataset („końcówki”)
Sns.boxplot (dane ['total_bill'])
plt.pokazywać()

Pudełko ramy danych Titanic są wizualizowane na poniższym rysunku.

Przykład 2

Możemy wykreślić ramkę danych z dowolną działką morską. W tym przykładzie mamy wykres skrzypc. Wykres pudełkowy i wykres skrzypiec są porównywalne. Porównuje rozkłady wielu ilościowych punktów danych między jedną lub więcej czynnikami kategorii.

Ponieważ używamy funkcji Seaorn Load_Dataset, musimy zaimportować moduł Python Seaorn, a dla wykresu mamy moduł Matplotlib. Tam stylizujemy tło fabuły do ​​ciemnej siatki. Następnie wywoływana jest funkcja load_dataset, gdzie ponownie użyliśmy przykładowych wskazówek dotyczących zestawu danych.

Z przykładowych wskazówek dotyczących zestawu danych bierzemy dwie kolumny, total_bill i czas, dla osi X i Y. Aby użyć tych kolumn do wykresu, mamy tutaj wykres na skrzypcach morskich, który przyjmuje X jako total_bill dla osi i y jako czas dla osi y. Te określone kolumny są porównywane ze sobą na wykresie.

Importuj Seaorn jako SNS
importować matplotlib.Pyplot as Plt
Sns.set (style = „darkgrid”)
DF = SNS.load_dataset („końcówki”)
Sns.Piolinplot (x = "total_bill", y = "czas", data = df)
plt.pokazywać()

Rama danych jest wizualizowana na poniższym rysunku.

Przykład 3

Tutaj pokazaliśmy wykres DataFrame z wykresem punktowym. Wykres punktowy może wskazywać na oszacowanie z przedziałami ufności za pomocą grafiki wykresu rozproszenia. Punkt określa szacunkową istotność statystyczną dla punktu danych opartego na punkcie położenia wykresu rozproszenia i zawiera słupki błędów wskazujące na poziom niepewności.

W poniższym skrypcie ustawiliśmy styl Dark Grid dla tła fabuły. Następnie mamy funkcję load_dataset, tym razem mamy zestaw danych IRIS do generowania wykresu. Przeszliśmy kolumny sepal_length i sepal_width do parametru x i y dla wykresu punktowego.

Gimport Seaorn
importować matplotlib.Pyplot as Plt
Seorborn.set (style = „Whitegrid”)
Data = Seaborn.Load_Dataset („Iris”)
Seorborn.PointPlot (x = "sepal_length", y = "sepal_width", data = data)
plt.pokazywać()

Wykres punktowy IRIS jest pokazany w następujący sposób:

Przykład 4

Dwuwymiarowa ramka danych Pandas jest odpowiednia dla struktury statystycznej z oznaczonymi osiami, które mogą być zróżnicowane i podlegają rozmiarowi (wiersze i kolumny). Aby utworzyć ramkę danych pandy, długości wszystkich tablic muszą być równe. Jeśli indeks jest zdefiniowany, powinien mieć taką samą długość jak tablice. Jeśli żaden indeks nie jest ustawiony w zakresie (n), to domyślnie używany jest n, który jest długością tablicy.

W danym fragmencie kodu zaimportowaliśmy moduł pandy, a następnie nazwaliśmy pandas DataFrame Constructor, w którym dwie tablice są określone jako List1 i List2. Mamy zbiór liczb losowych w szeregu równej długości. Aby wykonać wykres powyższych danych, mamy wykres KDE. Pokazuje gęstość prawdopodobieństwa zmiennej ciągłej na różnych poziomach. Możemy również utworzyć osobny wykres dla kilku próbek, co ułatwia wizualizację danych. Właściwość danych jest wywoływana przez pól, które ma w ramce danych.

importować matplotlib.Pyplot as Plt
Importuj Seaorn jako SNS
importować pandy
Data = pandy.DataFrame („List1”: [23, 30, 14, 15, 20],
„List2”: [19, 20, 16, 26, 11])
Sns.KDEPLOT (dane [„LIST1 '], Data [' LIST2 '])
plt.pokazywać()

Wykres KDE pokazuje porównanie ramki danych pandów wewnątrz rysunku.

Wniosek

Teraz masz krótki artykuł ramy danych Seaborn Data. Możemy sami stworzyć ramkę danych dzięki ramce danych pandy. Ramy danych w pandy są silnymi zestawami danych czytelników, których należy użyć, aby uzyskać głębsze zrozumienie swoich informacji. Możemy również wykorzystać wbudowane ramy danych morskich, używając funkcji Load_Dataset. Ta ramka danych można wykreślić na każdym wykresie morskim, ponieważ pokazaliśmy liczne przykłady, które wykreślają ramki danych.