Pandy to_records

Pandy to_records
Pandas DataFrame to heterogeniczny dwuwymiarowy format danych tabelarycznych o rozmiarze z nazwanymi osiami. W przypadku operacji matematycznych etykiety wierszy i kolumn muszą być zawsze wyrównane. Podstawowa struktura danych panda jest porównywalna z decydentami, ponieważ działa jako kontener dla elementów szeregowych.

DataFrame jest konwertowany na tablicę rekordów Numpy za pomocą Pandas DataFrame.do rejestracji () funkcji. Indeks jest zwykle podawany jako początkowe pole rekordu. Omówimy metodę panda to_records () z przykładami w tym artykule.

Co to jest ramka danych?

Pandy jest popularnym pakietem nauki o danych Python z jakiegoś powodu: zapewnia potężne, ekspresyjne i elastyczne struktury danych, które ułatwiają manipulację danymi i analizą, między innymi,. DataFrame jest jedną z tych struktur.

Rama danych jest dwuwymiarową strukturą danych, w której dane są reprezentowane w postaci wierszy i kolumn. Pandas DataFrame składa się z trzech podstawowych komponentów: danych, wierszy i kolumn.

Ponieważ zapewniają elastyczny i łatwy sposób przechowywania i pracy z danymi, DataFrame są jedną z najczęściej używanych struktur danych w nowoczesnej analizie danych.

Aby utworzyć pandas dataframe, listy, serie, dyktmy, numpy ndarrays i inną ramkę danych można użyć do utworzenia pandas DataFrame.

Jaka jest składnia pand.Ramka danych.Funkcje to_records ()?

Metoda to_records () jest przeznaczona. Funkcja to_records () w panwie ma następującą składnię.

# Ramka danych.to_records (index = true, kolumn_dtypes = brak, index_dtypes = brak)

Wszystkie szczegóły dotyczące parametrów znajdują się w poniższej sekcji.

Indeks

Dołącz indeks w wynikowej tablicy rekordów, który można przechowywać w polu „indeks” lub uzyskać dostęp za pomocą etykiety indeksu, jeśli jeden jest ustawiony.

Kolumn_dtypes

Jeśli typ danych to ciąg lub typ, zostanie on używany do przechowywania wszystkich kolumn.

Index_dtypes

Jeśli typ danych jest ciągiem lub typem, zostanie użyty do przechowywania wszystkich poziomów indeksu. Jeśli jest to słownik, mapowanie nazw poziomów indeksu, a także wskaźniki, są używane do określenia typów danych. Tylko jeśli indeks = prawda jest używana to mapowanie.

Omówmy ten temat dogłębnie z różnymi przykładami. Możesz wdrożyć te przykłady i lepiej zrozumieć ogólną koncepcję.

Przykład 1:

MAME DATAFRAME.To_records () Funkcja Pythona polega na zmianie określonej ramki danych w tablicę rekordów Numpy. Rozważ podany kod poniżej jako przykład.

Skonstruowaliśmy ramkę danych o wartościach trzech różnych cech: „wynagrodzenie, nazwa pracownika i wiek”; 39000, 44000, 25000 i 55000 to wartości pensji nieruchomości.„Alex, Andrew, Zack i Kim należą do wartości imienia pracownika atrybutu”.'

W ten sam sposób atrybut wiekowy zawiera wartości 39, 44, 25 i 55. Indeks został skonstruowany i ustawiony. Następnie drukowanie jest drukowane.

importować pandy
d_frame = pandy.DataFrame („wynagrodzenie”: [39000, 44000, 25000, 55000],
„Nazwa pracownika”: [„Alex”, „Andrew”, „Zack”, „Kim”],
„Wiek”: [39, 44, 25, 55])
indeks_ = pandy.data_range („2020-08-05 07:30”, okresy = 4, freq = „h”)
d_frame.indeks = indeks_
Drukuj (d_frame)

Wynagrodzenie, nazwa pracownika i wartości wieku, a także data i godzina, pokazano na zrzucie ekranu poniżej.

Na poniższym zrzucie ekranu pokazano określoną ramkę danych do odpowiedniej reprezentacji tablicy rekordów Numpy.

importować pandy
d_frame = pandy.DataFrame („wynagrodzenie”: [39000, 44000, 25000, 55000],
„Nazwa pracownika”: [„Alex”, „Andrew”, „Zack”, „Kim”],
„Wiek”: [39, 44, 25, 55])
indeks_ = pandy.data_range („2020-08-05 07:30”, okresy = 4, freq = „h”)
d_frame.indeks = indeks_
Drukuj (d_frame)
wynik = d_frame.to_records ()
Drukuj (wynik)

Następny załączony obraz wyjaśnia, że ​​DataFrame.Funkcja to_records () jest wykorzystywana do zmiany ramki danych na odpowiednią reprezentację tablicy rekordów Numpy.

Przykład 2:

Przyjrzymy się, jak korzystać z DataFrame.Funkcja to_records () w drugim przykładzie. Kod jest podobny do tego wspomnianego powyżej. Tym razem najpierw zaimportowaliśmy moduł panda, a następnie wygenerowaliśmy ramkę danych.

Następnie indeks został utworzony, jak pokazano w kodzie: index_ = [„pierwszy wiersz”, „drugi wiersz”, „trzeci wiersz”, „czwarty rząd” i „piąty rząd”]. Wreszcie ustawiliśmy indeks i wydrukowaliśmy wyniki DataFrame. Spójrz na ostatnią linię kodu.

importować pandy
dta_frame = pandy.DataFrame („1”: [9, 3, 4, brak, 6],
„2”: [8, 1, 22, 35, brak],
„3”: [19, 9, 17, 6, 9],
„4”: [55, 2, brak, 1, 9])
index_ = [„First_row”, „Second_Row”, „trzeci_row”, „czwarty_row”, „Fifth_row”]
DTA_FRAME.indeks = indeks_
Drukuj (dta_frame)

Możesz zobaczyć wynik tutaj, który obejmuje indeks i ramkę danych.

Korzystając z DataFrame.Aby rejestrować (), konwertowaliśmy daną ramkę danych. Możesz go wyświetlić na poniższym załączonym zrzucie ekranu.

importować pandy
dta_frame = pandy.DataFrame („1”: [9, 3, 4, brak, 6],
„2”: [8, 1, 22, 35, brak],
„3”: [19, 9, 17, 6, 9],
„4”: [55, 2, brak, 1, 9])
index_ = [„First_row”, „Second_Row”, „trzeci_row”, „czwarty_row”, „Fifth_row”]
DTA_FRAME.indeks = indeks_
Drukuj (dta_frame)
Wynik = DTA_FRAME.to_records ()
Drukuj (wynik)

Po wprowadzeniu minimalnych zmian w powyższym kodzie odniesienia jest to wynik. MAME DATAFRAME.Funkcja to_records () zmienia określoną ramkę danych na odpowiednią reprezentację tablicy rekordów Numpy.

Przykład 3:

W naszym ostatnim przykładzie przyjrzymy się, jak przekonwertować ramkę danych pandas za pomocą techniki Numpy-Pandy. Metodę TO_Numpy można użyć do przekształcenia tej struktury danych w tablicę Numpy.

W kodzie można zobaczyć, że zaimportowaliśmy moduły pandy i numpy, które są niezbędne do uruchomienia kodu. Zbudowaliśmy ramkę danych po zaimportowaniu modułów. W danych danych znajduje się 5 wierszy i 3 kolumny danych.

Następnie oprawa danych jest przekształcana w tablicę Numpy. Przekształcona ramka danych i jego typ są wyświetlane.

importować pandy
Importuj Numpy
data_frame = pandy.Ramka danych(
Data = Numpy.losowy.Randint (
0, 10, (5,3)),
kolumny = [„a”, „b”, „c”])
cls_res = data_frame.to_numpy ()
Drukuj (CLS_RES)
print (typ (cls_res))

Wyjście znajduje się na następnym zrzucie ekranu. Wartości danych w ramach konstruowanej 5 rzędów i 3 kolumn można zobaczyć tutaj. Klasa jest również wyświetlana w ostatniej linii wyjściowej. Jak pokazano powyżej, Metoda Pandas DataFrame to Numpy () zamienia ramkę danych w tablicę Numpy.

Wniosek:

Funkcja To_Record () w Pythonie jest opisana w tym artykule. Pandas Pandas DataFrame jest również dobrze nauczany z przykładami. Wyjaśniono również kroki konwersji ramki danych za pomocą metody DataFrame to_Records ().