Ten samouczek Pandas nauczy Cię, jak przekształcić tablicę Numpy w obiekt Pandas Dataframe. Wartości w wielu wymiarach można przechowywać za pomocą tablic wielowymiarowych. Tablicę 3D można porównać do sześcianu, podczas gdy tablica w dwóch wymiarach można porównać do matrycy.
Pandy.Konstruktor dataFrame () służy do konwersji tablicy Numpy, podobnej do konwersji słownika.
Składnia:
DataFrame_Object = pandy.DataFrame (numpy_array, index = ['a', 'b'], kolumna = ['num', 'chr'])
Parametry:
- Pierwszy parametr, dane, jest jedynym niezbędnym. Tablica, która jest wymagana do przekształcenia się w ramkę danych, jest teraz umieszczona tutaj.
- Indeks: To jest indeks lub indeks podobny do tablicy. Jeśli nie użyjemy tego parametru, RangeIndex jest domyślnie używany.
- Kolumny: Są to etykiety dla kolumn w ramce danych indeksu lub tablicy. Ponownie RangeIndex (0, 1, 2,…, n) jest domyślnie używany, jeśli nie użyjemy tego argumentu.
Przykład 1:
Zróbmy tablicę Numpy o nazwie „rzeczywistą” o 5 wierszy i przekonwertuj ją na DataFrame, przekazując tablicę Numpy.
importować pandy
Importuj Numpy
# Rozważ tablicę Numpy
Rzeczywiste = Numpy.Array ([[1, „Cooking”, 200], [2, „Music”, 3004], [3, „Hand Loom”, 1000], [4, „Hand Loom”, 2000], [5, „ubieranie się ", 3000]])
print („Numpy Array:”, rzeczywiste, „\ n”)
# Konwertuj powyższą tablicę na pandy danych pandas
konwertowane = pandy.DataFrame (faktyczne)
# Wyświetl konwertowaną ramkę danych
Drukuj (przekonwertowany)
Wyjście:
Wyjaśnienie:
Po konwersji na pandy danych wskaźników wskaźniki wynoszą [0,1,2,3,4], a kolumny to [0,1,2].
Przykład 2: z parametrem kolumn
Teraz przekazujemy nazwy kolumn do DataFrame wraz z tablicą Numpy.
importować pandy
Importuj Numpy
# Rozważ tablicę Numpy
Rzeczywiste = Numpy.Array ([[1, „Cooking”, 200], [2, „Music”, 3004], [3, „Hand Loom”, 1000], [4, „Hand Loom”, 2000], [5, „ubieranie się ", 3000]])
# Przekształć powyższą tablicę na Pandas DataFrame według nazw kolumn passign
konwertowane = pandy.DataFrame (rzeczywisty, kolumny = ['id', 'work', „płace '])
# Wyświetl konwertowaną ramkę danych
Drukuj (przekonwertowany)
Wyjście:
Wyjaśnienie:
Teraz możesz zobaczyć nazwy kolumn w konwertowanej ramce danych. Są to [„id”, „praca”, „płaca”].
Przykład 3: z parametrem indeksu
Teraz przekazujemy wartości indeksu, indeks = [„osobista 1”, „osoba 2”, „osoba 3”, „osoba 4”, „osoba 5”], wraz z tablicą Numpy do parametru indeksu parametru indeksu.
importować pandy
Importuj Numpy
# Rozważ tablicę Numpy
Rzeczywiste = Numpy.Array ([[1, „Cooking”, 200], [2, „Music”, 3004], [3, „Hand Loom”, 1000], [4, „Hand Loom”, 2000], [5, „ubieranie się ", 3000]])
# Przekształć powyższą tablicę na Pandas DataFrame, dodając indeks
konwertowane = pandy.DataFrame (faktyczne, kolumny = [„id”, „robocie”, „płace”], index = [„osobista 1”, „osoba 2”, „osoba 3”, „osoba 4”, „osoba 5”])
# Wyświetl konwertowaną ramkę danych
Drukuj (przekonwertowany)
Wyjście:
Wyjaśnienie:
Wcześniej wskaźniki wynosiły [0,1,2,3,4]. Teraz możesz zobaczyć wskaźniki dla każdego wiersza.
Przykład 4: Konwertuj konkretny rząd
Zróbmy tablicę Numpy z 2 wierszami i przekonwertuj tylko pierwszy wiersz na pandas DataFrame.
importować pandy
Importuj Numpy
# Rozważ tablicę Numpy
Rzeczywiste = Numpy.Array ([„„ Health_clinic ”,„ Delhi ”, 522554], [„ Medi View ”,„ France ”, 434456]]))
# Konwertuj tylko pierwszy wiersz tablicy Numpy na DataFrame
konwertowane = pandy.DataFrame ([faktyczne [0]], kolumny = [„szpital”, „adres”, „pincode”], index = ['h1'])
# Wyświetl konwertowaną ramkę danych
Drukuj (przekonwertowany)
Wyjście:
Wyjaśnienie:
Tutaj musimy przekazać czapkę indeksu wiersza, aby zostać przekonwertowanym na tablicę Numpy.
Aby przekonwertować tylko pierwszy wiersz na DataFrame, musimy przekazać indeks jako 0.
Wniosek
Nauczyłeś się, jak przekonwertować tablicę w ramkę danych w tym samouczku PandaS. Najpierw studiowałeś na temat obiektów Pandas DataFrame i tablic Numpy. Omówiono składnię i klasęFrame DataFrame, które możemy wykorzystać do generowania obiektów ramki danych. Następnie przyjrzeliśmy się trzem przypadkom, w których przekształciliśmy tablice Numpy w pandy danych pandas.