Jak wykreślić dane w Pandas Python

Jak wykreślić dane w Pandas Python
Wizualizacja danych odgrywa ważną rolę w analizie danych. Pandy to silna biblioteka analizy danych w Python dla danych naukowych. Zapewnia różne opcje wizualizacji danych .metoda wykresu (). Nawet jeśli jesteś początkującym, możesz łatwo wykreślić swoje dane za pomocą biblioteki PandaS. Musisz zaimportować pandy i matplotlib.Pakiet pyplot do wizualizacji danych.

W tym artykule zbadamy różne metody wykreślenia danych za pomocą Pythona Pandas. Wykonaliśmy wszystkie przykłady w edytorze kodu źródłowego Pycharm za pomocą matplotlib.Pakiet pyplot.

Planowanie w Pandas Python

W Pandy, .PTOT () ma kilka parametrów, których można użyć na podstawie swoich potrzeb. Przeważnie, używając parametru „rodzaj”, możesz zdefiniować, który typ wykresu utworzysz.

Składnia do wykreślenia danych za pomocą pandas Python

Poniższa składnia służy do wykreślania ramki danych w Pandas Python:

# Importuj pandy i matplotlib.Pakiety pyplot
importować pandy jako PD
importować matplotlib.Pyplot as Plt
# Przygotuj dane do utworzenia DataFrame
data_frame =
„Kolumna1”: [„Field1”, „Field2”, „Field3”, „Field4”,…],
„Kolumna 2”: [„Field1”, „Field2”, „Field3”, „Field4”,…]

var_df = pd.DataFrame (data_frame, kolumns = ['kolumn1', 'kolumna2])
Drukuj (zmienna)
# wykres wykresu słupków
var_df.działka.pasek (x = „kolumna1”, y = 'kolumna2')
plt.pokazywać()

Możesz także zdefiniować rodzaj wykresu, używając tego rodzaju parametru w następujący sposób:

var_df.wykres (x = 'kolumna1', y = 'kolumna2', cind = 'bar')

Obiekty Pandas DataFrame mają następujące metody wykresu:

  • Rozproszenie się: działka.rozpraszać()
  • Księstwo barowe: działka.bar (), fabuła.Barh (), gdzie H reprezentuje wykres poziomych słupków.
  • Księstwo linii: działka.linia()
  • Pieczak: działka.ciasto()

Jeśli użytkownik używa tylko metody PTOT () bez użycia żadnego parametru, tworzy domyślny wykres linii.

Teraz szczegółowo opracujemy niektóre główne rodzaje wykresów za pomocą niektórych przykładów.

Rozproszenie spisku w pandy

W tego rodzaju wykresach reprezentowaliśmy związek między dwiema zmiennymi. Weźmy przykład.

Przykład

Na przykład mamy dane dotyczące korelacji między dwiema zmiennymi PDP_Growth i Oil_Price. Aby wykreślić relację między dwiema zmiennymi, wykonaliśmy następujący kawałek kodu w naszym edytorze kodu źródłowego:

importować matplotlib.Pyplot as Plt
importować pandy jako PD
GDP_CAL = PD.Ramka danych(
„PKB_Growth”: [6.1, 5.8, 5.7, 5.7, 5.8, 5.6, 5.5, 5.3, 5.2, 5.2],
„Oil_Price”: [1500, 1520, 1525, 1523, 1515, 1540, 1545, 1560, 1555, 1565]
)
df = pd.DataFrame (gdp_cal, kolumny = ['oil_price', 'gdp_growth'])
Drukuj (DF)
df.Wykres (x = 'olej_price', y = 'gdp_growth', cind = 'scapt', color = 'czerwony')
plt.pokazywać()

Wykresy liniowe w pandach

Wykres wykresu liniowego jest podstawowym rodzajem wykresu, w którym podane informacje wyświetla się w serii punktów danych, które są dalej połączone segmentami linii prostych. Korzystając z wykresów liniowych, możesz także wyświetlać trendy w nadgodzinach.

Przykład

W poniżej wspomnianym przykładzie wzięliśmy dane dotyczące stopy inflacji w ubiegłym roku. Najpierw przygotuj dane, a następnie utwórz DataFrame. Poniższy kod źródłowy wykres wykres linii dostępnych danych:

importować pandy jako PD
importować matplotlib.Pyplot as Plt
Infl_cal = 'Year': [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011],
„Inf_rate”: [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

data_frame = pd.DataFrame (inf_cal, kolumny = [„rok”, 'inf_rate'])
ramka danych.Wykres (x = „rok”, y = „inf_rate”, cind = „linia”)
plt.pokazywać()

W powyższym przykładzie musisz ustawić rodzaj = „linia” dla wykresu wykresu liniowego.

Metoda 2# za pomocą wykresu.Metoda linii ()

Powyższy przykład, możesz również zaimplementować przy użyciu następującej metody:

importować pandy jako PD
importować matplotlib.Pyplot as Plt
inf_cal = 'rok: [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011],
„Inflat_rate”: [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

data_frame = pd.DataFrame (inf_cal, kolumny = ['inflating_rate'], index = [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011])
ramka danych.działka.linia()
plt.Tytuł („Podsumowanie stawki inflacji z ostatnich 11 lat”)
plt.yLabel („inflat_rate”)
plt.xlabel („rok”)
plt.pokazywać()

Poniższy wykres liniowy wyświetli się po uruchomieniu powyższego kodu:

Wykres wykresu barowego w pandy

Wykres wykresu słupkowy służy do przedstawienia danych kategorycznych. W tego typu wykresie prostokątne pręty o różnych wysokościach są wykreślane na podstawie podanych informacji. Wykres słupkowy można wykreślić w dwóch różnych kierunkach poziomych lub pionowych.

Przykład

W następnym przykładzie przyjęliśmy wskaźnik umiejętności czytania i pisania. Utworzone sąFrame DataFrame, w których „Country_names” i „Alteracy_rate” to dwie kolumny DataFrame. Korzystając z pandy, możesz wykreślić informacje w kształcie wykresu słupkowego w następujący sposób:

importować pandy jako PD
importować matplotlib.Pyplot as Plt
lit_cal =
„Country_names”: [„Pakistan”, „USA”, „China”, „India”, „UK”, „Austria”, „Egipt”, „Ukraina”, „Saudia”, „Australia”,
'Malezja'],
„litr_rate”: [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

data_frame = pd.DataFrame (lit_cal, kolumny = ['country_names', „litr_rate '])
print (data_frame)
ramka danych.działka.bar (x = 'country_names', y = 'litr_rate')
plt.pokazywać()

Możesz także zaimplementować powyższy przykład przy użyciu następującej metody. Ustaw w tym wierszu wykresy wykresu baru dla wykresu baru:

ramka danych.wykres (x = 'country_names', y = 'litr_rate', cind = 'bar')
plt.pokazywać()

WYKRESA WYKRESU WYKORZYSTAJĄCE

Możesz także wykreślić dane na poziomych słupkach, wykonując następujący kod:

importować matplotlib.Pyplot as Plt
importować pandy jako PD
data_chart = 'litr_rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]
df = pd.DataFrame (data_chart, kolumny = ['litr_rate'], index = [„Pakistan”, „USA”, „China”, „India”, „UK”, „Austria”, „Egipt”, „Ukraina”, „Saudycja” , 'Australia',
'Malezja'])
df.działka.Barh ()
plt.Tytuł („Wskaźnik umiejętności czytania w różnych krajach”)
plt.yLabel („country_names”)
plt.xlabel („litr_rate”)
plt.pokazywać()

W df.działka.Barh (), Barh jest używany do wykresu poziomego. Po uruchomieniu powyższego kodu następujący wykres słupkowy wyświetla się w oknie:

Wykres ciast w pandach

Wykres kołowy reprezentuje dane w okrągłym kształcie graficznym, w którym dane wyświetlają się w plasterkach na podstawie danej ilości.

Przykład

W poniższym przykładzie wyświetliśmy informacje o „ziemia_materialu” w różnych plasterkach na wykresie kołowym. Najpierw utwórz ramkę danych, a następnie za pomocą pandy, wyświetl wszystkie szczegóły na wykresie.

importować pandy jako PD
importować matplotlib.Pyplot as Plt
Material_per = 'Earth_part': [71,18,7,4]
DataFrame = PD.DataFrame (Material_per, Columns = ['earth_part'], index = [„woda”, „mineral”, „piasek”, „metale”])
ramka danych.działka.Pie (y = „earth_part”, rysunek = (7, 7), autopct = '%1.1f %% ', startangle = 90)
plt.pokazywać()

Powyższy kod źródłowy przedstawia wykres kołowy dostępnych danych:

Wniosek

W tym artykule widziałeś, jak wykreślić ramki danych w Pandas Python. W powyższym artykule wykonywane są różne rodzaje wykresów. Wykreślić więcej rodzajów, takich jak pudełko, heksbina, hist, kDE, gęstość, obszar itp., Możesz użyć tego samego kodu źródłowego, zmieniając rodzaj wykresu.