Wskaźnik zmiany pandy

Wskaźnik zmiany pandy
W tym artykule postaramy się nauczyć, jak ustawić indeks pandas DataFrame za pomocą listy etykiet lub już istniejących kolumn. Obejmujemy wszystkie sytuacje, w których przypisane są nowe etykiety wierszy lub istniejące należy zmienić. Struktura tabelaryczna w pakiecie Pandy nazywa się ramką danych. Każdy wiersz i kolumna jest reprezentowana przez jego etykietę. Indeks to etykieta wierszy, a etykieta kolumnowa jest indeksem kolumn lub nagłówkiem. Python pandy domyślnie zdefiniuj zakres liczb (począwszy od 0) jako indeks wierszy podczas generowania ramki danych. Każdy wiersz jest jednoznacznie zidentyfikowany za pomocą indeksu wiersza. Użyjemy funkcji set_index () do zmiany indeksu wierszy w ramce danych, którą utworzymy lub która została utworzona domyślnie.

Jak zmienić indeks w kolumnach pandas

Możemy zrobić jedną z kolumn w ramce danych do indeksu za pomocą metody pandas set_index. Aby zrozumieć, jak działa metoda set_index (), spójrzmy na jej składnię.

Składnia dla DataFrame.set_index

Ramka danych.set_index (klawisze, upuść = true, append = false, inplace = false, verify_integrity = false)

Parametr

  • Klucze: Nazwa kolumny lub zestaw nazw kolumn.
  • upuszczać: Jeśli prawda, wartość boolean upuszcza kolumnę indeksu.
  • dodać: Jeśli prawda, dodaje kolumnę do już istniejącej kolumny indeksu.
  • w miejscu: Jeśli prawda, zastosuje zmiany w ramce danych.
  • Verify_integrity: Jeśli prawda, sprawdź, czy w nowej kolumnie indeksu są jakieś duplikaty.

Jak widzieliśmy w składni, zobaczymy teraz, jak użyć funkcji set_index (), aby ustawić lub zmienić indeksy ramki danych w następujących przykładach.

Przykład 1: Ustawienie indeksu frame danych za pomocą funkcji set_index ()

Przykładowa struktura danych z niektórymi wierszami i kolumnami jest utworzona najpierw. Utworzona jest tylko prosta struktura danych zawierająca „manekin” studentów. Nazwa, wiek, podmiot i opłata to cztery kolumny lub zmienne w ramce danych „DF."

Najpierw zaimportowaliśmy moduł pandas, aby używać funkcji i funkcji dostarczanych przez bibliotekę. Następnie słownik jest przekazywany w parametrach PD.DataFrame () funkcjonuje jako argument do utworzenia „DF” DataFrame.

Zauważ, że po lewej stronie wyświetlonej ramki danych na początku każdego wiersza znajduje się liczba (liczby od 0 do 6). Te liczby są znane jako indeksy. Teraz używamy metody pandas set_index () do ustawienia indeksu „df” danych danych. Aby to osiągnąć, musimy wpisać nazwę DataFrame, a następnie „kropka”, a następnie nazwa metody, która jest „set index ()”. Używamy nazwy kolumny między nawiasami funkcji set_index ().

Kolumna „Opłaty” zaczęła poprzedni indeks liczby całkowitej (0 do 6). Przeszliśmy kolumnę „Opłata” wewnątrz funkcji set_index () jako argument, aby ustawić ją jako indeks wierszy naszego DataFrame.

Przykład 2: Ustawienie indeksu ramki danych za pomocą listy

Możemy również podać ramę danych z listą etykiet, które mogą być albo ciągami lub liczbami. Używamy funkcji set_index (), aby utworzyć nowy indeks w ramce danych za pomocą obiektu listy. Utwórzmy naszą strumień danych z manekinem po zaimportowaniu modułów pandas.

Nasza DataFrame jest tworzona z trzema kolumnami - „nazwa”, „wiek” i „kraj” - przechowując dane manekina. Teraz, korzystając z listy etykiet, utworzony jest indeks Python, który następnie przejdziemy do DataFrame.Ustaw funkcję index () jako wejście.

Przeszliśmy listę zawierającą etykiety indeksy rowerowej [„r1”, „r2”, „r3”, „r4”, „r5”, „r6”] do PD.indeks () funkcja i przypisano ją do zmiennej „indeks”. Zmienna jest następnie przekazywana jako argument wewnątrz nawiasów funkcji set_index (), aby ustawić indeksy DataFrame.

Jak widać w danej ramce danych, nasza określona lista zastąpiła domyślny indeks DataFrame etykietami („R1”, „R2”, „R3”, „R4”, „R5”, „R6”).

Przykład 3: Ustawienie indeksu ramki danych za pomocą wielu kolumn

Ramy danych w Python Pandas mają więcej niż jeden wiersz lub kolumnę jako indeks, są znane jako Multi-Indeks DataFrame. Za pomocą DataFrame.funkcja set_index (), możemy ustawić kilka kolumn jako etykiety wierszy. Należy rozumieć, że ustawienie więcej niż jednego indeksu sprawia, że ​​nasza konstrukcja jest skomplikowana. Indeks można ustrukturyzować na kilka sposobów. Pokażmy Ci, jak ustawić kilka kolumn jako indeks w prosty sposób. Najpierw utwórzmy naszą ramkę danych.

Nasza DataFrame ma cztery kolumny - „id”, „nazwa”, „kurs” i „kod”.

Z tych kolumn decydujemy, które kolumny są odpowiednie do użycia jako indeksów naszego DataFrame. Po podjęciu decyzji o odpowiednich kolumnach przechodzimy listę z dwiema etykietami wewnątrz funkcji set_index ().

Kolumny „id” i „kod” są ustawione jako indeksy wierszy w danych danych. Korzystając z nazw kolumn wewnątrz listy i przekazując je do set_index (), przypisaliśmy te kolumny jako indeksy. Lista [„id”, „kod”] jest przekazywana jako argument set_index (). Zarówno nazwa, jak i kolumny regionu są nowymi indeksami, jak widać na wyjściu.

Przykład 4: Ustawienie indeksu strumienia danych za pomocą serii Python

Multi-index DataFrame można utworzyć, przypisując nową serię za pomocą „DataFrame.SET_INDEX () ”, gdy musimy zmienić istniejący indeks liczb całkowitych za pomocą niektórych serii pandów, a nie kolumny DataFrame. Najpierw tworzymy ramkę danych, przekazując słownik w PD.Funkcja DataFrame (), aby pokazać, w jaki sposób seria można przekazać jako indeks pierwszego i drugiego poziomu danych DataFrame.

Teraz tworzymy serię, przekazując listę liczb całkowitych w nawiasach PD.Funkcja serii (). Pisujemy tę serię do zmiennej „N”.

Jak widać w danej ramce danych, nasza seria „N” i „N ** 2” jest ustawiona jako pierwsze i indeksy drugiego poziomu.

Przykład 5: Ustawienie indeksu ramki danych za pomocą zakresu Python

Załóżmy, że musimy określić serię liczb całkowitych jako indeks DataFrame, aby mógł zacząć od dowolnej liczby. Na przykład chcemy uruchomić numer identyfikacyjny dla pracowników danych danych o 1. Nie można korzystać z ramki danych.funkcja set_index () z listą wszystkich liczb jako wejścia. Metodę Python Range () można zastosować w tej sytuacji. Korzystając z funkcji Range (), możemy utworzyć indeks pandy, który możemy następnie przejść do DataFrame.Ustaw funkcję index (). Utwórzmy ramkę danych, abyśmy mogli wymienić jego Row_Index za pomocą funkcji Range ().

Utworzyliśmy naszą ramkę danych z kolumnami „Nazwa”, „Rank”, „Bonus” i „Wynagrodzenie”. Teraz ustawmy indeks za pomocą funkcji Range () zamiast domyślnego indeksu liczb całkowitych. Metoda Range () zwraca serię liczb, które domyślnie zaczyna się od 0, wzrasta o 1 (domyślnie), a kończy przed określoną liczbą.

Określiliśmy zakres indeksu, aby rozpocząć się od 1, wzrośnie o 1 i zakończyliśmy przed 6. Po określeniu zakresu indeksu przekazaliśmy zmienną „indeks” w funkcji set_index () jako wejściowe, aby ustawić indeks wierszy naszego DataFrame.

Wniosek

W tym samouczku omówiliśmy indeksy ramki danych i sposób ustawienia nowych indeksów w istniejącej ramce danych. Widzieliśmy, że konstruktor Pythona domyślnie tworzy indeks liczb całkowitych dla każdego wiersza, ale można go zmienić za pomocą funkcji set_index (). W tym samouczku widzieliśmy składnię funkcji set_index (.