Pandas DataFrame Pivot

Pandas DataFrame Pivot
Pandy to biblioteka Pythona. Używamy pandy do wielu celów. Możemy stworzyć ramkę danych w pandy i obrotu, które podano DataFrame. Aby Privo lub przekształcić ramkę danych, pandy zapewnia metodę „Pivot ()”. Określona ramka danych można zmienić za pomocą metody „PIVOT ()” za pomocą określonych wartości indeksu i kolumny. Kiedy chcemy przekształcić ramkę danych, używamy metody „PIVOT ()”. Kiedy korzystamy z metody „PIVOT ()”, musi użyć unikalnej wartości indeksu. Agregacja danych nie jest obsługiwana metodą „PIVOT ()”; Wiele wartości wytwarzają multiindex w kolumnach. W tym przewodniku szczegółowo badamy metodę „Pivot ()”. I podamy wizualną demonstrację kodów, w których przekształcimy ramkę danych za pomocą „Pivot ()”.

Składnia:

Ramka danych.Pivot (self, index = brak, kolumny = brak, wartości = brak)

Przykład 1:

Pokażmy praktyczny przykład metody „Pivot ()” w pandy. Wykonujemy kod Panda w aplikacji „Spyder”. Jak wiemy, musimy zaimportować niektóre funkcje pandy jako „PD”. Opracowujemy ten kod, więc stosujemy metodę „PIVOT ()”. Ta metoda jest stosowana do ramki danych. Najpierw tworzymy TUTAJ DATAFREME. Opracowywana przez nas tutaj ramka danych nazywa się „cars_data”, w której dodajemy dane związane z samochodami. Tworzymy pierwszą kolumnę z nazwą „CAR_NAME”, w której dodajemy niektóre nazwy samochodów, takie jak „Wagonr, Swift, Lexus, Mehran, Mustang, Alto i Jaguar”.

Wkładamy również więcej kolumn, które nazywają się „car_model, car_no i Challan”. Dane w tych kolumnach są również wstawiane. Kolumna „car_model” zawiera liczby modeli samochodów, które są „2014, 2001, 2010, 2015, 2020, 2012 i 2019”. Kolumna „CAR_NO” zawiera „R123, R456, R162, R102, S127, W190 i Z345”. Następnie mamy kolumnę „Challan”, w której dodajemy wartości „500, 4000, 500, 6000, 2000, 1000 i 2000”. To jest kompletna ramka danych zawierająca cztery kolumny. Następnie ustawiamy wartości indeksu dla wierszy, które są „R1, R2, R3, R4, R5, R6 i R7”. Wprowadzamy te wartości indeksu do „cars_data”, wykorzystując metodę „indeks”.

Następnie umieszczamy go w metodzie „print ()”, aby renderować na konsoli. Nie przekształcamy jeszcze danych danych ani nie stosujemy metody „Pivot ()”. Po prostu wyświetlamy oprawę danych „cars_data”.

Naciśamy „Shift+ Enter”, aby wykonać ten kod. Po naciśnięciu tych klawiszy otrzymujemy dany wynik kodu, który wyświetla ramkę danych, którą opracowaliśmy w kodzie Pandy. Teraz stosujemy metodę „PIVOT ()” do tego kompletu danych i przekształcamy ją zgodnie z naszym wyborem.

Tutaj dodajemy te linie do naszego kodu panda i używamy metody „PIVOT ()”. Ta metoda „Pivot ()” zawiera trzy parametry. W pierwszym parametrze ustawiamy nowy indeks, którym jest „car_model”. Drugi parametr to nazwa kolumny, którą ustawiliśmy tutaj jako „Challan”. A trzeci parametr to parametr wartości, który jako „nazwa CAR”. Teraz „cars_data” jest przekształcona i pojawia się tak, jak definiowaliśmy. Kolumna „car_model” pojawia się jako indeks, kolumna „Challan” pojawia się jako nazwy kolumn, a wartościframe są „nazwą car_name”.

Tutaj pojawia się przekształcona rama danych i wszystkie korekty wartości pojawiają się odpowiednio, które zdefiniowaliśmy w kodzie. Indeks w tym przekształconym ramie danych to „car_model”. Nazwa kolumny to kolumna „Challan”. Cała „nazwa_cina” są tutaj dostosowane jako wartości. „Nan” pojawia się tutaj w pustej komórce.

Przykład 2:

Rzeka danych, którą opracowujemy w tym przykładzie, to „new_interview_df”. Ale najpierw tworzymy zagnieżdżoną listę o nazwie „New_Interview”. A następnie konwertujemy tę zagnieżdżoną listę na DataFrame. Lista „New_Interview” zawiera „Pro_Language”, w którym mamy „Java, C#, Python, Oop i Python”. Ma „Code_office”, w którym umieściliśmy „Bar12, Lon34, Par33, Lon56, Bar53, Lon11 i Bar34”. Następnie mamy „emp_salary” i wstawiamy „18000, 25000, 20000, 15000, 34000, 22000, 31000 i 43000”. „New_Interview” jest przekształcone w „nowy_interview_df” za pomocą „PD.Metoda dataframe ”. Umieszczamy również „nowy_interview_df” w metodzie „print ()”. Pojawia się na konsoli po wykonaniu.

Teraz przekształcimy „new_interview_df” za pomocą metody „PIVOT ()”. Tym razem wspominamy „wartości, indeks i kolumnę” wewnątrz metody „PIVOT ()”. Tutaj ustawiamy „emp_salary” jako wartości, „kod_office” jako indeks i „pro_language” jako kolumny. Następnie drukujemy ten przekształcony ramkę danych.

Pojawiają się tutaj oryginał, a także przekształcone ramki danych. Możesz zauważyć, że nazwy wartości, indeksu i kolumn są zmieniane, a nowa zmiana danych wyświetla się poniżej oryginalnej ramki danych. W przekształconej strumieniu danych, który się tutaj pojawił, indeks to „Code_Office”, nazwy kolumn to „pro_language”, a wartości to „emp_salary”.

Przykład 3:

Ponownie tworzymy inną listę dla tego przykładu. Ta lista nazywa się „TEMP_LIST”, która ma w sobie „miesiąc, miasto, temperatura i wilgotność”. „Miesiąc”, który tutaj wstawiamy, to „Styczeń, maj, czerwca, luty i lipiec”. „Miasto” ma „Nowy Jork, Birmingham, Bombaj, Baljiam i Bangalore”. W „temperaturze” i „wilgotności” dodajemy odpowiednio „62, 68, 70, 77, 69” i „60, 66, 69, 74, 63”. Następnie zmieniamy „TEMP_LIST” na „TEMP_DF”. Następnie renderujemy ten „temp_df” tutaj.

Teraz chcemy się obracać lub przekształcić ten „temp_df”. Metoda „Pivot ()” tutaj pomaga w tym. Ustawiliśmy „miesiąc” jako jego indeks i „miasto” jako nazwę kolumny. Wartości, które tutaj ustawiamy, to zarówno „temperatura”, jak i „wilgotność”. Wyglądają jako dwie oddzielne ramy danych o różnych wartościach.

Ten wynik pokazuje, że po przekształceniu istnieją dwie struki danych oddzielone kropkami. Pierwsza ramka danych zawiera wartości „temperatury”, a druga ramka danych zawiera wartości „wilgotności”. Nazwy indeksów i kolumn dla obu ramek danych są takie same. Indeks obu ramek danych to „miesiąc”, a „kolumny” dla obu to „miasto”.

Przykład 4:

Ten kod zawiera „DF”, w której umieszczamy „A01” jako pierwszą kolumnę i dodajemy „James, James i Minę”. Druga kolumna to „A02”, w której „inżynier, inżynier i nauczyciel”. Trzecia kolumna nosi nazwę „A03”, w której umieściliśmy „44, 63, 21”. Drukujemy „DF” i stosujemy tutaj „Pivot”. „A01” to indeks, „A02” to kolumna, a „A03” to wartość. Teraz sprawdź wyjście tego, co dzieje się z tą strumieniem danych.

Oto wynik tego kodu. Możesz zauważyć, że komunikat o błędzie pojawia się na wyjściu, który mówi, że indeks zawiera duplikat wpisów. Oznacza to, że nie ustawiamy tych kolumn jako indeksu zawierającego zduplikowane wpisy, ponieważ indeksy są unikalnymi wartościami. Uważaj więc na to, obracając się w dowolnej strumieniu danych.

Wniosek

Celem tego przewodnika jest uczynienie logiki funkcji „Panand Pivot ()”. Opisaliśmy tę koncepcję na głębokości, aby łatwo było zastosować funkcję „PIVOT ()” w kodzie Pandy. Wyjaśniliśmy metodę „Pivot ()”. Wykorzystaliśmy tę metodę, aby przekształcić lub obracać ramkę danych w pandy. Wyjaśniliśmy również jego składnię tutaj. W tym przewodniku przyjrzeliśmy się czterema opisowymi i praktycznymi przykładami, ostrożnie patrząc na każdą wiersz kodu. Podaliśmy wynik każdego kodu tutaj wraz ze skryptami.