Pandas DataFrame z listy dyktów

Pandas DataFrame z listy dyktów
„Dwuwymiarowa” struktura danych etykiet o nazwie „Pandas DataFrame” ma kolumny, które mogą być w wielu rodzajach. Zazwyczaj najczęściej wykorzystywany jest obiekt „pandy”. „Pandy” zapewnia różne metody generowania pandasframe. Ten samouczek został przedstawiony tutaj, który odkryje, jak utworzyć ramkę danych z kolekcji słowników „pandy”. Słowniki można konwertować na strony danych na różne sposoby za pomocą „pandy”. Omówimy wszystkie metody z pełnym i szczegółowym wyjaśnieniem każdego z nich w tym samouczku.

Metody tworzenia ram danych z list DICT w „Pandy”

Metody zastosowane do tworzenia ramki danych z list słowników podano poniżej. W tym przewodniku wykorzystamy również wszystkie te metody w naszych praktycznych przykładach i wyjaśnimy je szczegółowo tutaj. Te metody to:

  • Pd.Ramka danych()
  • Pd.Ramka danych.from_dict ()
  • Pd.Ramka danych.from_records ()
  • Pd.Jason_normalize ()

Teraz przechodzimy, aby wykorzystać te metody w naszym kodzie „pandy” i do tego mamy narzędzie „Spyder”, w którym uruchomimy nasz kod „Pandy”. Zobaczmy następujące przykłady:

Przykład 01

Ilekroć chcemy wygenerować ramkę danych, musimy mieć listy słowników. Przed utworzeniem list musimy zaimportować „pandy” jako „PD”, ponieważ pracujemy w „Pandy”, więc w celu uzyskania dostępu do funkcji pand po prostu umieszczamy „PD” zamiast pełnej formy „Pandy”. Wkładamy niektóre dane do list słowników. „List Inventory_list” jest tutaj tworzony i umieszczamy „SKU”, który pojawia się jako nazwa nagłówka kolumny. W tej kolumnie dodajemy „SR7546” Nazwa lub klawisz następnej kolumny to „Opis” tutaj. Następnie umieszczamy „pozycję 1”, a następnie pojawia się następny nagłówek lub klucz kolumny, czyli „bin#”, i dodajemy w nim „S234”, ostatnią kolumną, którą mamy, to „lokalizacja”, i dodajemy adres w nim który jest „ABC Plaza Street 1”.

Teraz dodajemy więcej danych do tych kolumn, umieszczając nazwę każdego nagłówka lub klawiszu kolumny, a następnie wkładając do niej dane. Wkładamy „Tw1234” w „Sku”, „pozycja 2” w „Opis”, „S456” w „Bin#” i „CDE Plaza Street 2” w kolumnie „Lokalizacja”. Następnie umieściliśmy „SV4253, pozycję 3, S67 i Xys Plaza Street 2” odpowiednio w kolumnie „SKU, Opis, Bin#i Lokalizacja”. Ostatecznie wstawiamy jeszcze jeden rekord „STM2634, pozycja 4, S97 i MNO Plaza Street 6”.

Tutaj „lista Inventory_list” jest zakończona, a teraz konwertujemy ten „lista inwentaryzacji” na DataFrame. Korzystamy z „PD.Metoda konwersji listy DICTS na DataFrame ”. Umieszczamy „list inwentaryzacji” jako parametr „PD.Metoda dataFrame () ”i przechowujemy ją w zmiennej„ Inventory_df ”. Ten inwentaryzator_df jest używany tak, że gdy listy DICTS przekształcają się w ramkę danych, wówczas tenframe danych jest przechowywane w tym „Inventory_df”. Teraz listy DICT są konwertowane na DataFrame, a my przeprowadzamy się do wydrukowania DataFrame, który otrzymujemy po zastosowaniu tego „PD.Metoda dataFrame () ”. Drukujemy ten „Inventory_df”, wykorzystując funkcję „print ()” w „Pandy”.

Ponieważ używamy narzędzia „Spyder”, dla wyjścia, po prostu nacisnęliśmy „Shift+ Enter”, a wyjście jest wyświetlane na jego terminalu. Tutaj dane, które wstawiamy na listach DICTS, są przedstawione w ramce danych w wierszach i kolumnach. Nazwy nagłówków są również dodawane do góry każdej kolumny.

Przykład nr 02

W poprzednim przykładzie generujemy tutaj „Student_list” w taki sam sposób. Najpierw zaimportowaliśmy „Pandy jako PD” i przenieśliśmy je do „Studenci_list”. Mamy „S#”, który pokazuje, że jest to nazwa nagłówka kolumny. W tym umieszczamy „G6255”, następna nazwa lub klawisz nagłówka kolumny jest dostosowywana jako „nazwa”, a także umieszczamy dane jako „George”. „Adres” to także nazwa nagłówka, w której dodajemy „ABC246”. Następne trzy nazwy lub klawisze nagłówków kolumn to „Mid_marks, Final_marks i Pass/Fail”, dane, które dodaliśmy w tych kolumnach, to odpowiednio „33, 47 i przełóż”.

W ten sam sposób dodamy „G6256, Peyton, Def789, 38, 57” w pierwszych pięciu kolumnach, ale nie dodajemy żadnych danych w kolumnie „Pass/Fail” tutaj tutaj. Below, we insert data in all six columns as “G6257, Elle, MNO456, 36, 55, and Pass”. W czwartym rzędzie ponownie wkładamy dane w zaledwie pięć kolumn i nie wspominamy o szóstej kolumnie. Umieszczamy tylko „G6258, Smith, XYZ123, 31 i 67”, które są odpowiednio danymi z pięciu kolumn „S#, Nazwa, Adres, Adres, Mid_marks i Final_marks”. Zmieniamy ten „Student_list” w ramkę danych, umieszczając „PD.DataFrame ”i nazywanie ramki danych jako„ student_df ”.

Renderowanie „Student_df” z pomocą „print ()”. Na wyjściu zobaczymy, jak renderuje te komórki, w których nie dodaliśmy żadnych danych.

„Student_df” jest renderowany w tym wyniku. Wartości NAN są dodawane do powstałej ramki danych, ponieważ DICT nie zawiera żadnych wartości i kolumn, które pasują. Tutaj wyświetla „NAN” w tych komórkach, w których nie wstawialiśmy żadnych danych, i nie ma wpływu na całą ramkę danych, jeśli nie ma pasujących wartości klawiszy w ramce danych.

Przykład nr 03

Jak wiemy, podczas generowania ramki danych z listy DICTS, kolumny w powstałej ramce danych zawierają klawisze pojawiające się na nagłówku kolumny. Klucze, które generujemy w tym przykładzie, to „Std_id, Student_name, Father_name, Mids, Finals i Total”. Dopasowywanie klawiszy to kolumny, a ich wartości to rzędy ramki danych. Wkładamy również wartości pojawiające się na wierszach. Tworzymy „stdnt_list” i wkładamy do niego dane jako klucze i ich wartości.

Następnie konwertujemy ten „STDNT_LIST” na ramkę danych „STDNT_DATAFRAME”. Ustawiamy również wartości indeksu dla tego DataFrame, którym jest „STD_1, STD_2, STD_3 i STD_4”. Następnie renderuj „stdnt_dataframe”, który również renderuje wartości indeksu.

W tym wyniku pojawiają się wskaźnik danych i wartości indeksu, które wprowadziliśmy do naszego kodu.

Przykład nr 04

Używamy innej metody zmiany listy DICTS na DataFrame. Korzystamy z „PD.Ramka danych.From_Records () ”, która przekonwertuje naszą listę DICTS na ramkę danych i uczyni wynikowy ramkę danych.

Oto wynikowy strumień danych, który otrzymujemy za pomocą „PD.Ramka danych.From_Records () ”. Ta metoda pomaga nam również zmienić listę dyktantów na DataFrame.

Przykład nr 05

Teraz przełączamy się z listy DICTS na ramkę danych przy użyciu innej techniki. Nasza lista DICT zostanie przekonwertowana na ramkę danych za pomocą „PD.Ramka danych.From_dict () ”w tym przykładzie, a my również wyświetlimy wynikowy ramkę danych.

Jest to ramka danych wyprodukowana w wyniku wykorzystania „PD.Ramka danych.From_dict () ”. Ta metoda pomaga w konwersji listy DICTS w ramkę danych.

Przykład nr 06

Tutaj wykorzystujemy inną i ostatnią metodę, aby przejść z listy dyktmy do ramki danych. Używamy „PD.JSON_NORMALASE () ”, aby przekształcić naszą listę DICTS w ramkę danych w tym kodzie i wyświetlić wynikową ramkę danych, umieszczając funkcję„ print () ”na końcu.

Rama danych jest tworzona, gdy „PD.stosuje się metodę JSON_NORMALASE () ”. Ta technika pomaga również wygenerować ramkę danych z listy dyktmy w „Pandy”.

Wniosek

W tym samouczku opisano, jak korzystać z konwersji z „listy dyktów na DataFrame” w „Pandy”, więc możesz go wykorzystać, aby nauczyć się tego zrobić. Naszym głównym celem jest dostarczenie ci dogłębnego, zwięzłego i jasnego wyjaśnienia koncepcji „Przekształcenie listy dyktmy na DataFrame”. Omówiliśmy cztery odrębne metody, które pomagają nam przekonwertować listę dyktantów na DataFrame. Wykazaliśmy przykłady i wykorzystaliśmy wszystkie metody, o których wspomnialiśmy w tym samouczku, aby uzyskać ramkę danych z listy dyktmy.