Pandy otrzymują indeks

Pandy otrzymują indeks
„Znalezienie wskaźników wiersza jest konieczne, co jest kluczowe dla inżynierii cech. Te umiejętności mogą pomóc w wyeliminowaniu wartości odstających lub nieprawidłowych liczb z ramki danych. Istotne narzędzie do uzyskania określonych wierszy lub danych kolumnowych z PandaS DataFrame nazywa się indeksem PandaS. Jest odpowiedzialny za skonfigurowanie danych do szybkiego dostępu i organizacji. Inną nazwą indeksu jest wybór podzbioru. Konkretna wartość indeksu jest określana jako etykieta. Wartości indeksu są zapisane odważną czcionką. Możemy być zobowiązani do pobrania nazw wierszy lub indeksu podczas badania prawdziwych zestawów danych, które są często bardzo duże do przeprowadzania określonych operacji. W tym artykule zademonstrujemy, jak wyodrębnić indeksy z panów danych."

Jak uzyskać indeksy z ramki danych w pandy?

Korzystając z różnych funkcji i właściwości, istnieje kilka sposobów pobierania indeksów z ramki danych w pandy. Wyjaśnimy, jak wyodrębnić indeksy z ramkami danych przy użyciu różnych technik w następujących przykładach.

Najpierw zobaczymy DataFrame.właściwość indeksu. Właściwość indeksu pandas DataFrame jest używana do uzyskania indeksu wiersza. Etykieta wiersza danych danych jest zwracana jako obiekt przez DataFrame.funkcja indeksu.

Przykład nr 1: Uzyskanie indeksów poprzez iterowanie indeksów DataFrame

Aby wyodrębnić indeks, najpierw utwórzmy ramkę danych, abyśmy mogli iterować przez jego wskaźniki wiersza. Musimy najpierw załadować moduł panda, importując go, aby użyć jego funkcji, zanim utworzymy ramkę danych. Utworzymy naszą ramkę danych za pomocą PD.Metoda dataFrame ().

Utworzono „DF” DataFrame. „PD.Metoda dataFrame () ”wzięła słownik Python z klawiszami i wartościami jako argument. Funkcja print () służy do zilustrowania ramki danych. W „DF” DataFrame mamy trzy kolumny, „col1”, „col2” i „col3”, przechowując wartości (3, 4, 5, 6, 7, 8, 9), (9, 8, 7 , 6, 5, 4, 3) i (1, 3, 5, 7, 8, 0, 11). Konstruktor Pythona tworzy domyślny wskaźnik wiersza całkowitego po lewej stronie każdego wiersza (zaczyna się od 0). Teraz iterujmy indeksy, aby uzyskać indeksy DataFrame za pomocą DataFrame.właściwość indeksu.

Właściwość indeksu pomyślnie odzyskała indeksy z danych danych. Jak widać, indeksy wierszy w naszej ramce danych rozpoczęły się od 0 i zakończyły się o 6.

Przykład nr 2: Uzyskanie indeksów jako obiektu listy

Najpierw utworzymy ramkę danych z dostosowanymi indeksami. W naszej strumieniu danych określimy etykiety nie-numeryczne dla indeksów wierszy.

Można zauważyć, że indeks wierszy nie jest już indeksem liczb całkowitych, ponieważ określiliśmy listę etykiet jako [„R1”, „R2”, „R3”, „R4”, „R5”, „R6”, „R7 ”] Do parametru indeksu PD.Funkcja dataFrame (). Utworzyliśmy trzy kolumny „C1”, „C2” i C3 ”przechowujące dane manekina (33, 45, 12, 78, 34, 86, 23), (26, 37, 76, 25, 97, 53, 31) i (17, 74, 95, 63, 54, 56, 19) odpowiednio. Teraz użyjemy funkcji List (), aby uzyskać listę etykiet indeksu. Obiekt listy można utworzyć za pomocą funkcji List (). Uporządkowana modyfikowalna kolekcja jest określana jako obiekt listy.

Wewnątrz funkcji listy () użyliśmy właściwości indeksu do odzyskania indeksów DataFrame. Funkcja listy () przechowuje je jako elementy obiektu listy.

Przykład nr 3: Uzyskanie tablicy indeksu za pomocą indeksu.Wartości () metoda

W tym przykładzie indeks.Metoda wartości zostanie zastosowana do pobrania indeksów DataFrame. Zestaw uporządkowany zaimplementowany przez niezmienny ndarray o nazwie Pandas Index. Nazwy osi dla wszystkich obiektów pandy są przechowywane w tym podstawowym obiekcie. Indeks.Atrybut wartości pandy zwraca tablicę zawierającą dane w określonym obiekcie indeksu.

Utworzyliśmy dostosowany indeks, definiując listę etykiety [„i”, „ii”, „iii”, „iv”, „v”, „vi”, „vii”] w parametrze indeksu. W naszej ramce danych są trzy kolumny. Kolumna „X” przechowuje wartości („A”, „B”, „C”, „D”, „E”, „F”, „g”), kolumna „y” zawierająca wartości danych („H” , „i”, „j”, „k”, „l”, „m”, „n”) i kolumna „z” o wartości („o”, „p”, „q”, 'r, „r r. „,„ s ”,„ t ”,„ u ”). Teraz użyjemy indeksu.Metoda wartości uzyskania indeksów z „DF”.

Możemy również użyć funkcji toList () z indeksem.Metoda wartości do pobrania indeksów DataFrame.

Określona tablica można przekształcić w regularny obiekt listy z tymi samymi wartościami, elementami lub elementami za pomocą funkcji toList ().

Przykład nr 4: Uzyskanie indeksów za pomocą metod Query () i ToList ()

Ta technika pozwala nam odzyskać tylko określone indeksy obiektów Data Data Frame, które spełniają określone kryteria. Za pomocą „PD.Metoda dataFrame () ”i metoda zapytań pand, w tej metodzie zostanie utworzona Pandas DataFrame. Zastosowanie metody zapytania () do ramki danych i przekazanie jej warunku powoduje, że zwraca ramkę danych, która zawiera tylko wiersze pasujące do kryteriów/spełniają warunek. Następnie użyjemy metody ToList () wraz z atrybutem indeksu, który zwróci listę zawierającą wartości indeksu DataFrame. Zbadajmy kod Pythona użyty do wykonania tej praktycznej techniki odzyskiwania indeksów obiektu DataFrame, które spełniają określone warunki.

Utworzyliśmy ramkę danych o etykietach indeksowych jako [„01”, „02”, „03”, „04”, „05”, „06”]. Etykiety kolumn DataFrame są określone jako „nazwa”, „wiek” i „wysokość” z wartościami („Alexa”, „Mark”, „Ryan”, „Bob”, „tom”, „Joe”), (21 , 20, 21, 24, 22, 23) i (5.4, 5.8, 5.7, 6.1, 5.9, 6.2) odpowiednio.

Wewnątrz funkcji zapytania () określliśmy warunek pobierania tych wierszy, w których wartość w kolumnie „Wysokość” jest większa niż 5.7. Następnie użyliśmy atrybutu indeksu do wyodrębnienia indeksów pobieranych wierszy, podczas gdy funkcja tolist () przekonwertowała zwrócone indeksy na listę i.mi. [„02”, „04”, „05”, '06].

Przykład nr 5: Uzyskanie wartości indeksu kolumny przez funkcję get_loc () z atrybutem kolumn

W poprzednich przykładach widzieliśmy, jak uzyskać indeksy wierszy danych, ale teraz odzyskujemy wartość indeksu kolumny określonej kolumny za pomocą metody get_loc () wraz z atrybutem kolumn. Wartość indeksu określonej nazwy kolumny w ramce Data Pandas zostanie zwrócona w tym przykładzie. Atrybut kolumn i funkcja get_loc () będą używane do tego zadania. Nazwa zmiennej, którą lubimy wybierać, zostanie określona jako wartość ciągu w metodzie GET LOC.

Używając słownika Pythona w PD.Funkcja dataFrame (), stworzyliśmy naszą dataframe. Można zaobserwować, że w naszej ramce danych jest 5 kolumn, które mają nazwy „A”, „B”, „C”, „D” i „E”. Użyjmy atrybutu kolumny z funkcją get_loc (), aby uzyskać wartość indeksu kolumny „D”.

W tym celu umieścimy nazwę kolumny, ja.mi., „D”, jako ciąg w funkcji get_loc ().

Kolumna „D” jest umieszczana w wartości indeksu 3.

Wniosek

W tym samouczku staraliśmy się nauczyć, w jaki sposób możesz uzyskać indeksy PandaS Dataframe w Python. Omówiliśmy, jakie są indeksy na pandy i jak możesz je odzyskać za pomocą różnych funkcji i atrybutów. Wdrożyliśmy różne przykłady, aby nauczyć Cię, jak uzyskać indeksy poprzez iterowanie indeksów DataFrame, za pomocą atrybutu indeksu za pomocą metod Query () i toList () i za pomocą funkcji get_loc () z atrybutem kolumn.