Pandas DataFrame od DICT

Pandas DataFrame od DICT
Prowadź danych pandas można wygenerować za pomocą Python Dict (Słownik), który jest parą kluczową. W czasie rzeczywistym zwykle produkujemy ramkę danych pandas, importując plik CSV lub inny zasób, ale możliwe jest wygenerowanie go również za pomocą obiektu DICT (słownika).

Python pandy są często wdrażane zarówno w zadaniach dotyczących nauki/przetwarzania danych, jak i uczenia maszynowego. Jest opracowany na podstawie Numpy, kolejnej wybitnej biblioteki Python, która wspiera obliczenia naukowe. W Python pandasframe są niezwykle przydatne do pracy z danymi 2D (dwuwymiarowe). Pandas Pandas może być konstruowany w różnych metodach, jeden z nich jest wyodrębnienie danych z danego słownika.

Przykład 1: Wykorzystanie domyślnego konstruktora PD.DataFrame () w celu wygenerowania ramki danych ze słownika

Podejście to zaczyna się od wygenerowania słownika Pythona z list, które następnie przekazujemy do PD.Metoda dataFrame (). The Last, ale nie mniej więcej, PD.Metoda dataFrame () wyświetla obiekt Pandas DataFrame zawierający zawartość ze słownika list.

Teraz zatrzymajmy to w praktyce za pomocą skryptu Pythona.

W pliku Pythona najpierw importujemy niezbędną bibliotekę, jaką jest pandy na tej ilustracji, ponieważ będziemy korzystać z funkcji pandas tutaj.

Następnie tworzymy słownik „Dane” i inicjujemy je odpowiednio z trzema listami z tytułami „Nazwa”, „Age” i „Instytut”. Przypisujemy każdą listę z czterema wartościami. Wzywamy metodę print () do wyświetlania słownika na terminalu.

Wyjście, które otrzymujemy, uruchamiając poprzedni kod, jest dołączone tutaj:


Teraz konwertujemy ten słownik pandas na pandas -frame.

W celu wygenerowania ramki danych ze słownika używamy najprostszej metody. Tutaj stosujemy domyślny konstruktor pandy, aby wygenerować ramkę danych. Obiekt DataFrame z nazwą „wyjście” jest tworzony i przypisuje się wyjście wywołujące PD.Funkcja dataFrame (). DICT „Dane”, które wcześniej utworzyliśmy, są przekazywane jako parametr do PD.Funkcja dataFrame (). Instrukcja print () z obiektem „wyjście” jako argument wykonuje się w celu wyświetlania ramki danych utworzonej z określonego słownika.

To daje nam następujące wynikające z tego pandasframe:

Przykład 2: Wykorzystanie indeksów zdefiniowanych przez użytkownika do generowania ramki danych ze słownika

Korzystając z słownika zawierającego indeksy zdefiniowane przez użytkownika, możemy skonstruować obiekt Pandas DataFrame w Python. Ta technika rozpoczyna się od generowania słownika Pythona, który jest następnie przekazywany jednocześnie z listą indeksu na PD.Metoda dataFrame (). PD.Metoda dataFrame () ostatecznie zwraca obiekt Pandas DataFrame zawierający zawartość słownika wraz z indeksami z podanej listy indeksu.

Zbadamy tutaj, w jaki sposób kod Pythona jest używany do wykonania.

Aby utworzyć ramkę danych z dykt, które wykorzystują wskaźniki zdefiniowane przez użytkownika, najpierw musimy mieć listę słownika. Ponieważ w poprzednim przykładzie wygenerowaliśmy słownik, w tym przypadku użyjemy tego samego słownika.

Teraz, aby skonstruować ramkę danych z DICT, stosujemy ten sam konstruktor Pandas DataFrame, ale z jeszcze jedną innowacją, ponieważ chcemy, aby wyświetlana jest z indeksami zamiast jej predefiniowanych indeksów. Korzystamy z parametru „indeksu” wewnątrz nawiasu z nazwą delikt, oddzieloną przecinkiem. Przypisujemy wartości do parametru „indeks” za pomocą operatora przypisania „=” i umieszczamy wartości wewnątrz nawiasów. Wreszcie, stosujemy metodę print () do wykazania wyniku programu.

Poniższy obraz pokazuje wyjściową ramkę danych zdefiniowanych przez użytkownika wskaźników „R, x, y, z” zamiast metody indeksowania 0.

Przykład 3: Wygeneruj ramkę danych ze słownika z potrzebnymi kolumnami

W trzeciej instancji niektóre kolumny są ignorowane, gdy generujemy ramkę danych ze słownika. Parametr kolumn sprawia, że ​​wykonanie tego zadania jest proste. Jako parametr ten argument akceptuje listę, elementy, które są określonymi kolumnami. Zwraca ramkę danych tylko z wybranymi kolumnami.

Sprawdźmy po prostu sposób napisania skryptu Pythona, aby wygenerować ramkę danych za pomocą wybranych kolumn słownika.

W tym przykładzie dodaliśmy jeden nowy rekord do wcześniej utworzonego „danych” jako „ROLL” i przypisaliśmy go z taką samą długością wartości, jak użyliśmy dla pozostałych trzech rekordów. Teraz zbiorowo mamy dyktę z 4 rekordami. Kiedy uruchamiamy metodę print (), tym razem otrzymujemy słownik z czterema rekordami.

To jest wyjście:

Teraz badamy, w jaki sposób możemy skonstruować ramkę danych ze słownika z niektórymi określonymi kolumnami.

Funkcja Pandas DataFrame zapewnia nam parametr „kolumnę” do określenia nazw kolumn, które szczególnie chcesz w ramach danych. Między aparatem ortodontycznym PD.Metoda dataFrame (), przeszliśmy argument „kolumny” i przypisaliśmy nazwy kolumn w nawiasach. Tutaj wybraliśmy dwie kolumny: „Nazwa” i „Instytut”. Instrukcja print () jest prezentowana na terminalu jako ramka danych, która przechowuje tylko wspomniane wcześniej kolumny.

Otrzymaliśmy naszą strumień z dwiema wybranymi kolumnami.

Przykład 4: Wygeneruj ramkę danych ze słownika ze zmienioną orientacją, wykorzystując funkcję from_dict ()

Podobnie jak w poprzednim sposobie, najpierw generujemy słownik list.From_dict () Method. Ostatecznie obiekt Pandas DataFrame zawierający informacje na temat słownika list jest zwracane przez DataFrame.From_dict () Method. Istnieją różne alternatywy, gdy używa się konkretnie funkcji z Dict () do skonstruowania ramki danych ze słownika. Klucze Dict będą domyślnie jego kolumny, podobnie jak zwykłe zachowanie. Klucze słownika są pokazane jako wiersze, gdy orientacja jest „wskaźnikiem."

Tutaj najpierw widzimy ustawienia domyślne, a następnie zmieniamy orientację na „indeks”.

Korzystamy z „DICT”. Aby wygenerować ramkę danych ze słownika, zamiast tego używamy metody from_dict (). Klawisze słownika są domyślnie używane jako nazwy kolumn, gdy używasz metody from_dict (). Wpisy ze słownika są wykorzystywane jako wartości danych danych. Tak więc uruchamiamy tę metodę z ustawieniem domyślnym i przekazujemy ją nazwę „DICT”. Widzimy wyjście za pośrednictwem funkcji print ().

Poniżej znajduje się wynik wygenerowany z poprzedniego skryptu Pythona:

Teraz, aby zmienić orientację ramki danych wygenerowanej z dostarczonej listy słowników, zmieniamy ustawienia domyślne funkcji from_dict ().

Kiedy dostarczasz argument orienta = „indeks”, konstruowana jest ramka danych przy użyciu wartości z wartości DICT, jeśli wolisz używać klawiszy DICT jako wierszy. W ten sposób dodaliśmy parametr „orienta”, aby zmienić orientację i przypisać wartość „indeks”. Oznacza to, że orientacja wartości indeksu jest zmieniana z kolumn na wiersze.

To jest wyjście tego programu:

Wniosek

Niniejszy przewodnik wyjaśnia generowanie ramki danych z listy słowników. Opracowaliśmy wszystkie różne sposoby i aspekty korzystania z tego podejścia. Dzięki praktycznym przykładom sprawiliśmy, że zrozumiałeś, jak zastosować funkcję Pandas DataFrame, a także funkcję pand z. Dane wdrożenie krok po kroku pomoże Ci uzyskać najlepsze doświadczenie edukacyjne w Python.