Indeksowanie Pandas DataFrame

Indeksowanie Pandas DataFrame
W pandy indeksowanie polega na wybraniu określonych kolumn i wierszy danych z ramki danych. Wybieranie wszystkich wierszy, a nawet niektórych kolumn, części wierszy i wszystkich kolumn lub niektórych z każdego z rzędów i kolumn to indeksowanie. Wybór podzbioru to inna nazwa indeksowania. Kiedy budujemy obiekt Pandas DataFrame w Python za pomocą PD.Funkcja DataFrame () z modułu PandaS, adres w indeksach wiersza lub kolumny jest automatycznie wytwarzany, aby symbolizować każdy element/punkt danych wewnątrz DataFrame. Jednak wskaźniki wierszy są indeksem DataFrame, a wskaźniki kolumn są po prostu określane jako kolumny. Indeks obiektu Data -Frame Pandy zasadniczo identyfikuje niektóre wiersze. Rzućmy okiem na zmianę obiektu Data Frame indeksu pandy.

Przykład 1

Opcję indeksu w Python może być użyta do ustawienia indeksu strumienia danych podczas jej tworzenia. Wygenerujemy listę i przekazamy ją do PD.Parametr indeksu metody dataFrame (). Załóżmy to w praktyce z kodem Pythona. Zaimportowaliśmy moduł pandy tutaj. Następnie stworzyliśmy słownik i listę Pythona. Słownik został wykorzystany do rozpoczęcia opracowania DataFrame. Jak widać, użyliśmy funkcji DataFrame z parametrem indeksu, aby kolumna „RR” indeks.

importować pandy jako PD
dd = „name”: [„Alex”, „ramen”, „Zayn”, „Travis”, „Scott”],
„Znaki”: [33, 66, 88, 67, 78],
„City”: [„New York”, „Los Angeles”, „Chicago”, „San Diego”, „Dallas”]
RR = [1, 2, 3, 4, 5]
ff = pd.DataFrame (DD, index = rr)
Drukuj (ff)

Zobacz dane wyjściowe na poniższym obrazie.

Przykład 2

W Python możemy użyć różnych metod, aby indeks dowolnej istniejącej kolumny lub kolumny obiektu Dataframe Pandas. W tym scenariuszu użyjemy argumentu indeksu indeksowego () modułu Python pandas. Argument inceamowy jest domyślnie ustawiony na false. Jednak w tym przypadku ustawimy wartość incewa. Istniejąca kolumna przekazana do PD.Ustaw metodę index (), ponieważ nowy indeks zastępuje stary indeks DataFrame. Zobaczmy, jak to działa.

importować pandy jako PD
dd = „name”: [„Alex”, „ramen”, „Zayn”, „Travis”, „Scott”],
„Rollnum”: [„1”, „2”, „3”, „4”, „5”],
„City”: [„New York”, „Los Angeles”, „Chicago”, „San Diego”, „Dallas”]
ff = pd.DataFrame (DD)
Drukuj („\ nininitial DataFrame:”)
Drukuj (ff)
ff = ff.set_index („Rollnum”)
Drukuj („\ nfinal DataFrame:”)
Drukuj (ff)

Dane wyjściowe podano na poniższym zrzucie ekranu.

Przykład 3

W takim przypadku będziemy używać argumentu upuszczenia funkcji modułu Python Pandas SET INDEX (). Jednak w tym przypadku ustalimy argument upuszczony na fałsz. Tak, abyFrame Data Frame nie tracił kolumny, która została przypisana jako nowy indeks. Udajmy to praktykę z poniższym kodem.

importować pandy jako PD
dd = „Rollnum”: [„1”, „2”, „3”, „4”, „5”],
„Nazwa”: [„Alex”, „ramen”, „Zayn”, „Travis”, „Scott”],
„Znaki”: [33, 66, 88, 67, 78]
ff = pd.DataFrame (DD)
Drukuj („\ nininitial DataFrame:”)
Drukuj (ff)
ff = ff.set_index („name”, upuść = false)
Drukuj („\ nfinal DataFrame:”)
Drukuj (ff)

Oto wynik.

Przykład 4

Tworząc listę nazw kolumn DataFrame i przekazując ją do funkcji SET INDEX (), możemy ustawić kilka kolumn obiektu Pandas DataFrame. W rezultacie w tym scenariusz.

importować pandy jako PD
dd = 'rollnum': [1, 2, 3, 4, 5],
„Nazwa”: [„Alex”, „ramen”, „Zayn”, „Travis”, „Scott”],
„Znaki”: [33, 66, 88, 67, 78],
„City”: [„New York”, „Los Angeles”, „Chicago”, „San Diego”, „Dallas”]
ff = pd.DataFrame (DD)
Drukuj („\ nininitial DataFrame:”)
Drukuj (ff)
ff = ff.set_index ([„rollnum”, „nazwa”])
Drukuj („\ nfinal DataFrame:”)
Drukuj (ff)

Tutaj możesz zobaczyć wyjście kodu podanego powyżej.

Przykład 5

Można zastosować kilka technik do ustawienia pozycji obiektu Pandas DataFrame na dowolny obiekt Python, taki jak lista, zakres, a nawet seria. Za pomocą PD.Index (), ustaw funkcje indeks () i range (), możemy ustawić indeks obiektu DataFrame (pandy) w tym podejściu. Najpierw użyjemy funkcji Range () do zbudowania sekwencji liczb całkowitych Pythona, którą następnie wyślemy do PD.Indeks () funkcja. Ta metoda tworzy obiekt indeksu DataFrame. Zwracający obiekt indeksu DataFrame jest następnie ustawiony jako nowy indeks DataFrame za pomocą funkcji SET INDEX (). Zaimplementujmy ten kod.

importować pandy jako PD
dd = 'rollnum': [1, 2, 3],
„Nazwa”: [„Alex”, „ramen”, „Zayn”],
„Znaki”: [33, 66, 88],
„City”: [„New York”, „Los Angeles”, „Chicago”]
ff = pd.DataFrame (DD)
Drukuj („\ nininitial DataFrame:”)
Drukuj (ff)
my_list = [„i”, „II”, „III”]
idx = pd.Indeks (my_list)
ff = ff.set_index (idx)
Drukuj („\ nfinal DataFrame:”)
Drukuj (ff)

Zobacz dane wyjściowe poniżej.

Przykład 6

Indeks obiektu DataFrame Pandas można ustawić za pomocą SET INDEX () i PD.Metody index (). Zaczniemy od utworzenia listy Python, którą następnie wyślemy do PD.Indeks () funkcja. Ta funkcja poda obiekt indeksu danych danych. Zwracający obiekt indeksu DataFrame jest następnie ustawiony jako nowy indeks DataFrame za pomocą funkcji SET INDEX ().

importować pandy jako PD
dd = 'rollnum': [1, 2, 3, 4, 5],
„Nazwa”: [„Alex”, „ramen”, „Zayn”, „Travis”, „Scott”],
„Znaki”: [33, 66, 88, 67, 78],
„City”: [„New York”, „Los Angeles”, „Chicago”, „San Diego”, „Dallas”]
ff = pd.DataFrame (DD)
Drukuj („\ nininitial DataFrame:”)
Drukuj (ff)
indx = pd.Indeks (zakres (1, 6, 1))
ff = ff.set_index (indx)
Drukuj („\ nfinal DataFrame:”)
Drukuj (ff)

Wynik podano na załączonym zrzucie ekranu.

Przykład 7

Za pomocą PD.Series () i Set Funkcje indeks (), możemy ustawić indeks obiektu DataFrame Pandas w poprzedniej metodzie. Wygeneruj listę i przekazuj ją do PD.Funkcja serii () zwróci szereg seryjny Pandas, który można wykorzystać jako obiekt indeksu DataFrame. Powstała seria panów jest przekazywana do metody SET INDEX (), która ustawia ją jako nowy indeks DataFrame. Zobaczmy następujący kod i zrozum, jak to działa.

importować pandy jako PD
dd = 'rollnum': [1, 2, 3, 4, 5],
„Nazwa”: [„Alex”, „ramen”, „Zayn”, „Travis”, „Scott”],
„Znaki”: [33, 66, 88, 67, 78],
„City”: [„New York”, „Los Angeles”, „Chicago”, „San Diego”, „Dallas”]
ff = pd.DataFrame (DD)
Drukuj („\ nininitial DataFrame:”)
Drukuj (ff)
ser_indx = pd.Seria ([5, 4, 3, 2, 1])
ff = ff.set_index (ser_indx)
Drukuj („\ nfinal DataFrame:”)
Drukuj (ff)

Tutaj możesz zobaczyć wyjście.

Wniosek

Indeksowanie to proces wybierania wartości z określonych wierszy i kolumn w ramce danych. Możemy wybrać wszystkie wiersze i niektóre kolumny lub wiersze i wszystkie kolumny za pomocą indeksowania. W tej sesji omówiono tematy, takie jak indeks i jak możesz ustawić indeks podczas generowania ramki danych, w jaki sposób można ustawić istniejące kolumny DataFrame jako indeks, a nawet multi-index, oraz jak możesz ustawić obiekty Python, takie jak zakres, lista, lista, a nawet szereg jako indeks.