Pandas Multiindex

Pandas Multiindex
Kiedy rozmawiamy o bibliotekach „Python” w open source, „pand” jest jednym z nich. Korzystamy z tej biblioteki, gdy musimy manipulować i analizować dane. Możemy użyć modułów „pandy” do tworzenia różnych serii lub strumienia danych. Czasami musimy dostosować wiele kolumn jako kolumny indeksu w DataFrame. „Pandy” zapewnia metodę „Multiindex” do utworzenia więcej niż jednego indeksu. Metoda „Multiindex” daje możliwość wyboru wielu wierszy lub kolumn jako indeksów tego DataFrame. W tym przewodniku dowiemy się o metodach „Multiindex”, a także wykonamy niektóre kody, w których używamy metod „wielokrotności” „pandy”, aby utworzyć wiele indeksów.

Metody Multiindex Pandas

„Pandy” zapewnia wiele metod „Multiindex”, które wykorzystujemy do tworzenia wielu indeksów. To są:

  • Multiindex.From_frame
  • Multiindex.from_product
  • Multiindex.From_Arrays
  • Multiindex.from_tuples

Teraz idziemy naprzód i wykorzystujemy te metody „wielokrotności”, o których wspominaliśmy wcześniej w kodzie „Pandy” tutaj.

Przykład 1:

Pierwszy kod tego przewodnika jest podany tutaj. Zrobiliśmy wszystkie kody, które omówimy w tym przewodniku w narzędziu „Spyder”. Ilekroć chcemy opracować kod „pandy”, musimy zaimportować niektóre moduły „pandy”. Możemy je zaimportować, po prostu wykorzystując słowo kluczowe „importować” i napisać „Pandy jako PD”. Teraz w tym kodzie otrzymujemy funkcje „pandy”, umieszczając „PD”. Tworzymy tutaj tablice. Pierwsza tablica nazywa się „Raw_names” i zawiera „Smith, James, Bromley, Peter i Samuel”. Następna tablica nazywa się „Raw_ages”, w której przechowujemy wartości „10, 11, 15, 12 i 13”. Ostatnią tablicą, którą mamy, to „Raw_marks”, który zawiera „90, 92, 83, 74 i 88”.

Po utworzeniu tych tablic wykorzystujemy tutaj metodę „Multiindex”, która jest „Multiindex.From_Arrays () ”. W tej metodzie umieszczamy nazwę wszystkich trzech tablic, co oznacza, że ​​te trzy tablice są łączone, aby komponenty z każdej tablicy można było wykorzystać do utworzenia wielu indeksów. W imionach przekazujemy „imiona, wieki i znaki”. Teraz wyświetlamy wynik wspomnianego kodu tutaj, wykorzystując funkcję „print ()”.

Po osiągnięciu „shift+enter” otrzymujemy ten wynik. Gdy kod jest bezbłędny, na ekranie renderowany jest następujący wynik. Wyświetla tutaj Multiindex, który stworzyliśmy w tym kodzie:

Przykład 2:

W tym kodzie tworzymy ramkę danych. Tutaj tworzymy listę „Worker_information”. Dodajemy „nazwę”, która pojawia się jako nazwa kolumny, gdy konwertujemy ją w DataFrame i wstawiamy „William, Timmy, James, Alexander i Graham”. „Praca” zawiera „Inżynier oprogramowania, tester oprogramowania, gracz, sprzedawca i nauczyciel”. Następnie mamy „Monthly_salary”, w którym stawiamy pensję pracowników „1500 USD, 1200 USD, 1100 USD, 1300 USD i 1500 USD”. Następnie konwertujemy tę zagnieżdżoną listę w ramce danych. Korzystamy z „PD.DataFrame () ”tutaj do tego.

Następnie „print ()” pomaga nam w renderowaniu tego ramki danych. Teraz mamy tutaj zmienną o nazwie „wynik” i wykorzystujemy „Multiindex.From_frame () ”metoda tworzenia wszystkich kolumn jako indeksu. Tworzy multiindex tego danego ramki danych za pomocą tej metody. Następnie dodajemy tę zmienną w „print ()”, więc renderuje ona po wykonaniu.

W tym przypadku wyświetlana jest pierwsza w tym wyniku, a multiindex jest wyświetlany wraz z następującymi wartościami. Otrzymujemy te wiele indeksów, wykorzystując „Multiindex.From_Frame () ”.

Przykład 3:

Ponownie wykorzystujemy „robotnik_df” w tym przykładzie. Tym razem dodajemy jedną nową kolumnę do tej formy danych, która jest „W_NO”. Dodajemy również niektóre dane do tej kolumny, która to „W101, W102, W103, W104 i W105”. Teraz wykorzystujemy inną metodę tutaj, aby utworzyć wiele indeksów tej formy danych. Używamy „DF.Metoda set_index ”, w której umieszczamy nazwy dwóch kolumn, które są„ w_no i nazwa ”. Następnie dodajemy „ince” i „dołączamy” zarówno do „True”, jak i „upuść” do „Fałszyw”. Tak więc nie upuszczy kolumn.

Te kolumny pojawiają się dwa razy w ramce danych. Indeks, a także kolumna, pojawia się tutaj. Następnie stosujemy „print ()” do „robotnika_df”. „Worker_df” jest renderowany. Teraz wyświetlamy również indeksy osobno, umieszczając „Worker_df.indeks ”w„ Drukuj ”po wyświetleniu zaktualizowanej nazwy danych, w której ustawiamy te wiele indeksów.

W pierwszej ramce danych pojawia się tylko domyślny indeks i nie ma innej kolumny indeksu w tym ramie danych. Ale poniższa ramka danych pokazuje wiele indeksów. Możesz łatwo zobaczyć indeksy „w_no i nazwa”, które utworzyliśmy w kodzie. Indeksy te wraz z wartościami są wyświetlane osobno na końcu.

Przykład 4:

Ponownie konstruujemy różne tablice w tym kodzie. „Callum, Tyler, Chloe, Lewis, Hazel, John i Peter” są wymienione w pierwszej tablicy. „Nazwa_ pacjenta” jest tutaj nazywana. Poniższa tablica „Patient_age” zawiera wartości „28, 33, 45, 17, 22, 44 i 29”. Ostatnia tablica nazywa się „Patient_contact” i zawiera liczby „1001234, 1001235, 1001236, 1001237, 1001238, 1001239 i 1001240”.

Tutaj używamy metody „Multiindex”, która jest „Multiindex.From_Arrays () ”po utworzeniu tych tablic. Następnie przekazujemy nazwy tych trzech tablic w „Multiindex.from_arrays ”, aby utworzyć te tablice jako indeksów tutaj. Do nazwisk dodajemy również „rodzic, wiek i kontakt”. Następnie mamy „print ()”, który pomaga nam w renderowaniu danych zmiennej „pacjenta”, w której przechowujemy wiele indeksów po zastosowaniu „Multiindex.From_Arrays ”.

Ten wynik pokazuje wszystkie indeksy, które dodaliśmy do kodu. Nazwa jest również wymieniona tutaj. Wszystkie tablice są tutaj ustawione jako wiele indeksów za pomocą „Multiindex.From_Arrays () ”.

Przykład 5:

Teraz jest ostatni kod tego przewodnika, w którym generujemy ramkę danych i tworzymy wiele indeksów tego kompletu danych. Aby utworzyć ramkę danych, musimy dodać kilka danych tutaj. Dodajemy wszystkie dane w zmiennej „XYZ”. Najpierw dodajemy „xyz_name”, który zawiera „John, Michael, Foster, Samuel, Bromley, Smith i Fuller”. Następnie mamy „XYZ_CODES” i umieściliśmy „XYZ23, XYZ24, XYZ25, XYZ26, XYZ27, XYZ28 i XYZ29”. Teraz pojawia się „XYZ_MONTH”, który zawiera „Jan, luty, marzec, kwiecień, maj, czerwca i lipiec”. Następnie dodajemy „XYZ_Units”, w którym umieszczamy „20, 14, 19, 46, 35, 20 i 53”.

Teraz tworzymy „xyz_dataframe” i umieszczamy „PD.Metoda danych dataFrame () ”, która tworzy ramkę danych„ XYZ ”danych. Następnie wyświetlamy również „XYZ_DataFrame”. Teraz tworzymy wiele indeksów DataFrame, więc używamy „Multiindex.From_Frame () ”. Tworzy to wiele indeksów tej formy danych i przechowuje je w zmiennej „xyz_dataframe1”. Ta zmienna jest również umieszczana w „print ()”, dzięki czemu indeksy te były wyświetlane na terminalu.

Wyświetla „XYZ_DataFrame”. Następnie istnieją indeksy, które są tworzone po zastosowaniu „Multiindex.From_Frame () ”. Wszystkie indeksy wraz z wartościami i nazwami kolumn są wyświetlane w tym wyniku.

Wniosek

Ten przewodnik został napisany tutaj, aby wyjaśnić pojęcie „multiindex” w „Pandy”. Omówiliśmy różne metody „multiindex”, które zapewnia „pandy”. Omówiliśmy również niektóre z nich szczegółowo tutaj. Zastosowaliśmy te metody w kodach „pandy” tutaj i pokazaliśmy, w jaki sposób wiele indeksów jest tworzone w „Panandach” za pomocą metod „Multiindex”. Zastosowaliśmy te metody do tablic i danych danych i szczegółowo wyjaśniliśmy wszystkie te kody. Przed utworzeniem wielu indeksów i po utworzeniu wielu indeksów pokazaliśmy, że wykorzystując metodę wielopoziomową „Pandy”. W tych kodach wyświetliśmy wiele indeksów osobno w tych kodach.