Indeks zestawu pandy

Indeks zestawu pandy
Funkcja „set_index” pand jest używana do definiowania ramki danych lub serii jako klucza ramy danych. Funkcja „set_index ()” pandas tworzy wskaźnik DataFrame, wykorzystując istniejące kolumny. Indeks może zastąpić lub rozszerzyć obecny indeks.

Składnia tej metody jest następująca:

Pierwszy parametr „Keys” klasyfikuje nazwę kolumny, którą chcemy ustawić jako indeks. Atrybut „Dodatek” dodaje podaną kolumnę, gdy wartość indeksu jest ustawiona na true. Parametr „upuść” upuszcza kolumny. Jego domyślna wartość jest „prawdziwa”. „INPHING”, wyceniany jako „prawdziwy”, wprowadza zmiany w oryginalnej ramce danych i nie tworzy żadnej kopii. Ostatni parametr „Verify_integrity” sprawdza duplikację nowego indeksu kolumny.

W tym artykule poznamy praktyczne wykonywanie tej metody za pomocą różnych technik.

Przykład nr 1: Wykorzystanie metody set_index () do zmiany kolumny indeksu

Ta demonstracja opracuje zastosowanie pandy „DF.set_index () ”Metoda zmiany domyślnej listy indeksu w ramce danych na zdefiniowaną przez użytkownika kolumnę indeksu.

Narzędzie „Spyder” jest uruchamiane, aby rozpocząć pracę nad kompilacją i wykonaniem skryptu. Najpierw załadowaliśmy wymagane biblioteki do programu. Pakiet, którego potrzebowaliśmy tutaj, to „pandy”. Zatem importowaliśmy jako „PD”.

Wygenerowaliśmy ramkę danych, stosując metodę panda „PD.Ramka danych()". Masz wybór, aby zaimportować plik CSV lub utworzyć ramkę danych za pomocą „PD.Metoda dataFrame () ”. „PD.DataFrame () ”Funkcja wywołana z 4 kolumnami„ Emp_name ”,„ Doświadczenie ”,„ Dochód ”i„ Bonus ”. Każda kolumna przechowuje 11 wartości.

Mamy wartości dla kolumny „emp_name” jako „a”, ”,„ b ”,„ c ”,”, ”,„ e ”,„ f ”,”, ”,„ h ”,„ i ”,„ j ”, i „k”. Wpisy dla kolumny „Doświadczenie” to „5”, „2”, „17”, „21”, „9”, „20”, „11”, „32”, „23”, „14” i „30”. Trzecia kolumna, którą mamy, to „dochód”, który przechowuje te wartości „40000”, „30000”, „100000”, „50000”, „40000”, „70000”, „200000”, „95000”, „60000”, „27000” i „98000”. Kolumna „premiowa” zawiera te wartości „30000”, „40000”, „60000”, „30000”, „86000”, „50000”, „60000”, „95000”, „76000”, „27000” oraz „78000”.

„PD.Metoda dataFrame () ”skonstruuje ramkę danych z tymi dostarczonymi wartościami. Aby przechowywać ramkę danych, utworzyliśmy obiekt DataFrame „Record”. Przydzieliliśmy to wyjście wywołania „PD.Funkcja dataFrame () ”. Na koniec treść jest wystawiana na konsoli, wykonując funkcję „print ()” Pythona.

Kiedy wykonujemy program Python, klikając opcję „Uruchom plik”, widzimy ramkę danych z 4 kolumnami i 11 wierszy. Ta konstrukcja danych została wyświetlona z domyślną listą indeksu, która rozpoczyna się od „0” i idzie do długości DataFrame.

Może być czasami konieczne zmianę kolumny indeksu DataFrame. Tutaj nauczymy się zmieniać kolumnę indeksu w ramce danych za pomocą „DF.metoda set_index () ”. Korzystając z tej metody, zmienimy domyślną kolumnę indeksu z istniejącą kolumną w dostarczonej ramce danych.

Przywołaliśmy „DF.metoda set_index () ”. Nazwa DataFrame jest dostarczana jako „rekord” z funkcją „set_index ()”. Pomiędzy nawiasami tej funkcji podaliśmy nazwę kolumny, którą musimy ustawić jako kolumnę indeksu w wynikającym z tego. Kolumna, o której wspomnialiśmy, to „nazwa emp_name”. Tak więc metoda „set_index ()” zajdzie na „zapis”, znajdzie kolumnę oznaczoną jako „emp_name” i ustaw ją jako kolumnę indeksu po upuszczeniu domyślnej kolumny indeksu. Wynik jest zapisywany w zmiennej „ustawieniu”. Za pomocą funkcji „print ()” wyświetliśmy ją na ekranie.

Kolumna indeksu danych wyjściowych DataFrame jest zmieniana z listy domyślnej na „nazwę emp_name”. Wynikowe dane wyjściowe znajduje się na poniższym obrazku.

Przykład nr 2: Wykorzystanie metody set_index () do zmiany indeksu na wiele kolumn indeksu

Podczas zmiany indeksu DataFrame możemy ustawić jeszcze więcej niż jedną kolumnę jako indeksy DataFrame. Zbadajmy koncepcję za pośrednictwem programu Python.

Do tej ilustracji wykorzystaliśmy ramkę danych utworzoną w poprzednim przykładzie. „DF.Metoda set_index () ”. Nazwiliśmy tę funkcję z następującymi parametrami: „klawiszami”, „inplace”, „dołącz” i „upuszczenie”. Klucze indeksu, które tutaj podaliśmy, to „emp_name” i „dochód”. Wybrano dwie kolumny, ponieważ musimy ustawić więcej niż jedną kolumnę jako indeksy w ramce danych. Parametr „ince” jest ustawiony „true”, co oznacza, że ​​szanse zostaną dokonane w rzeczywistej ramce danych bez tworzenia jego kopii.

Ustawiliśmy wartość „True” dla atrybutu „Dodatek”. Utrzymanie tego prawda dołączy nowe kolumny indeksu z już istniejącą lub domyślną kolumną indeksu. Ostatnią właściwość, której tu użyliśmy, to „upuszczenie” z wartością „fałszywe”. Tak więc nie zrzuci kolumn, które ustawiliśmy dla indeksu z DataFrame. Ponieważ zmiany są preferowane do wprowadzania w rzeczywistej ramie danych, abyśmy nie musieli tworzyć żadnego obiektu. Po prostu drukowanie rzeczywistej ramki danych po ustawieniu indeks wyświetli nam zmiany. Zastosowaliśmy funkcję „print ()”, aby pokazać wynik.

Nasz zaktualizowany faktyczna ramka danych jest wyświetlana, która ma domyślną kolumnę indeksu, a także dwie nowo określone kolumny indeksu jako „emp_name” i „dochód”.

Przykład nr 3: Wykorzystanie metody set_index () do zmiany kolumny indeksu za pomocą kolumny wartości zmiennoprzecinkowej

Możemy również zmienić domyślną kolumnę indeksu i ustawić kolumnę float jako indekser w danych danych. Zobaczymy jego praktyczne wdrożenie tutaj.

Musimy najpierw utworzyć kolumnę z wartościami pływakowymi w DataFrame. Rama danych z pierwszej instancji jest ponownie używana, z wyjątkiem wartości w kolumnie „bonus” są teraz pływane. Dostarliśmy te wartości dla kolumny „bonus”: „30.87 ”,„ 40.16 ”,„ 60.98 ”,„ 30.87 ”,„ 86.32 ”,„ 50.92 ”,„ 60.11 ”,„ 95.12 ”,„ 76.24 ”,„ 27.35 ”i„ 78.52 ”. Następnie wydrukowaliśmy zaktualizowaną ramkę danych za pomocą funkcji „print ()”.

Pokazana jest wyświetlana linia danych z zaktualizowaną kolumną „premiową”.

Przywołaliśmy „DF.metoda set_index () ”i ustaw kolumnę klawisza indeksu jako„ bonus ”. Parametr „w miejscu” jest ceniony jako „prawdziwy”. Tak więc zmiany zostaną wprowadzone w rzeczywistej ramce danych.

Kolumna Float jest ustawiana jako kolumna indeksu w ramce danych, którą można zobaczyć na poniższym obrazku.

Przykład nr 4: Wykorzystanie metody set_index () do ustawienia multiindex w kopii DataFrame

Możemy ustawić Multiindex w DataFrame za pomocą metody „set_index ()”. Metoda „set_index” jest wywoływana z nazwą „zapisu” DataFrame. W ramach okrągłego aparatu zainicjowaliśmy operatora indeksowego i zdefiniowaliśmy nazwy kolumn jako „emp_name” i „Doświadczenie”. Tutaj woleliśmy wykonywać funkcję z ustawieniami domyślnymi, w których „ince” jest ustawione jako „fałszywe”. Manipulacje zostaną przeprowadzone w kopii DataFrame.

Aby przechowywać tę kopię DataFrame, utworzyliśmy zmienną „multi_index”. Na koniec pokazaliśmy zawartość kopii ramki danych przechowywanej w zmiennej „Multi_Index” za pomocą funkcji „print ()”.

Daje nam to następujący wynik:

Wniosek

W tej sesji uczenia się wykazaliśmy potrzebę zmiany kolumny indeksu w ramce danych. Pandy dostarczyły metodę „DF.set_index ”jest wykorzystywany w tym samouczku, aby osiągnąć pożądany wynik. Podaliśmy składnię do zastosowania tej funkcji z krótkim opisem parametrów. Wszystkie techniki wykonywania funkcji „set_index ()” są praktycznie zaimplementowane na narzędziu Spyder. Możemy wykorzystać tę metodę zgodnie z naszą potrzebą, czy chcemy ustawić pojedynczą kolumnę jako klawisz indeksu, czy wiele kolumn.