Pandy otrzymują wartości indeksu

Pandy otrzymują wartości indeksu

Indeksy wierszy są znane jako indeksy DataFrame, podczas gdy indeksy kolumn są znane jako ogólne nazwy kolumn. Indeksy są najczęściej używane do pobierania danych lub przechowywania danych w ramach danych. Możemy jednak również odzyskać sam indeks za pomocą .właściwość indeksu. W tym samouczku nauczymy Cię, jak uzyskać indeks jako obiekt listy, w jaki sposób możesz przekonwertować indeks w kolumnę DataFrame, aby go odzyskać, oraz jak można uzyskać indeks za pomocą wielu warunków i właściwości indeksu pandy.

Jak uzyskać wartości indeksu w pandy?

MAME DATAFRAME.Własność indeksu można wykorzystać do uzyskania indeksu Pandas DataFrame. Obiekt listy indeksu zawierający indeks danych jest zwracany za pomocą DataFrame.właściwość indeksu.

Składnia:

Pandy.Indeks (data = brak, dType = brak, copy = false, name = brak, tupleize_cols = true, ** kwargs)

Gdzie:

dane: podobne do tablicy (jednorazowe)

Dtype: Numpy Dtype. Domyślnie jest to „obiekt”. Wybierzemy DTYPE, który jest odpowiedni dla danych, jeśli Dtype jest „Brak”. Jeśli określono i jest bezpieczny, DTYPE zostanie zmuszony. Jeśli nie, zostanie wyświetlone ostrzeżenie.

Kopiuj: Bool. Zostanie wykonana kopia danego ndarray.

nazwa: obiekt. Nazwa, która jest przechowywana w indeksie.

tupleize_cols: Bool. Domyślnie to prawda. Jeśli prawda, spróbuje stworzyć multiindex.

Metody uzyskania indeksu ramki danych są pokazane w poniższych przykładach.

Przykład nr 01: Wyodrębnij wskaźnik wierszy danych danych za pomocą właściwości NDEX

Najpierw utwórzmy ramkę danych z wieloma wierszami, abyśmy mogli wykazać, jak uzyskać jego indeks wierszy za pomocą właściwości indeksu Pandy. Przed utworzeniem DataFrame zaimportujemy moduł pandas, aby użyć jego funkcji.

importować pandy jako PD
Student_info = [(„Tyson”, 23),
(„Jack”, 25),
(„Bruce”, 25),
(„Peter”, 24),
(„Nick”, 21),
(„Haris”, 26),
(„Randy”, 25)
]
df = pd.DataFrame (student_info, kolumny = [„name”, „wiek”])

Korzystając z listy wewnątrz PD.Funkcja dataFrame (), stworzyliśmy naszą dataframe. W naszej ramce danych są dwie kolumny: nazwa i wiek. Kolumna „Nazwa” przechowuje nazwy niektórych przypadkowych osób („Tyson”, „Jack”, „Bruce”, „Peter”, „Nick”, „Haris”, „Randy”). Podczas gdy kolumna „wiek” składa się z wieków każdej osoby (23, 25, 25, 24, 21, 26, 25). Na początku każdego wiersza domyślnie jest wartość indeksu dla każdego wiersza utworzonego przez konstruktora pandas. Teraz użyjemy właściwości indeksu do wyodrębnienia tej kolumny indeksu.

df.indeks

Dane wyjściowe pokazuje, że wiersze zaczynają się od 0, zwiększają się o 1, a kończą się indeksem przed 7.

Aby wydrukować każdą wartość indeksu, możemy użyć iteratora i wewnątrz niego lub funkcji print ().

i = df.indeks
Dla x w i:
Drukuj (x)

Teraz wydrukowaliśmy wszystkie wartości z indeksu 0 do 7.

Przykład nr 02: Wyodrębnij wskaźnik wierszy danych danych za pomocą warunku

Wartości indeksu można pobrać, określając warunek. Właściwość indeksu będzie pobierać wartości indeksu ramki danych, które spełniają określony warunek. Następnie użyjemy funkcji ToList (), aby zwrócić pobierane wartości jako listę. Za pomocą PD.Funkcja dataFrame (), najpierw utwórzmy naszą danych danych.

importować pandy jako PD
df = pd.Ramka danych(
„Item”: [„A”, „B”, „C”, „D”, „E”, „F”, „G”, „H”],
„Cena”: [100, 200 150, 100, 200, 320, 100, 100],
„kod”: [„q”, „w”, „e”, „r”, „t”, „y”, „u”, „i”]
)

Używając słownika Pythona w PD.Funkcja dataFrame (), utworzyliśmy dataframe. Nasza DataFrame składa się z trzech kolumn i 8 wierszy od 0 do 7. Kolumna „Elementy” przechowuje wartości danych jako ciąg („A”, „B”, „C”, „D”, „E”, „F”, „G”, „H”). Kolumna „cena” zawiera wartości liczbowe reprezentujące kawałek każdego elementu (100, 200, 150, 100, 200, 320, 100, 100). Kod kolumny posiadający wartości danych („q”, „w”, „e”, „r”, „t”, „y”, „u”, ”). Teraz odzyskajmy wartości indeksu za pomocą poniższego skryptu.

i = df.indeks
indeks = df [„cena”] == 100
wynik = i [indeks]
wynik.notować()

Korzystając z właściwości indeksu, pobraliśmy indeksy „DF” DataFrame. Następnie określiliśmy warunek wyodrębnienia danych, w których wartości w kolumnie ceny są równe 100. Po uzyskaniu danych pobraliśmy wartości indeksu wierszy, które spełniają określony warunek. Ostatecznie funkcja tolist () służy do przekształcenia wyjścia w obiekt listy. Funkcja odzyskała listę z czterema wartościami indeksu, [0, 3, 6, 7].

Przykład nr 03: Wyodrębnij indeks kolumny DataFrame za pomocą funkcji get_loc ()

Widzieliśmy, jak pobrać wartości indeksów wierszy danych danych. Możemy jednak również odzyskać wartości indeksów kolumn DataFrame. Aby uzyskać wartość indeksu dowolnej kolumny DataFrame, można użyć funkcji GET loc (). Aby znaleźć indeks, po prostu dostarczamy etykietę kolumnową do funkcji get_loc (). Utwórzmy ramkę danych składającą się z więcej niż jednej kolumny, abyśmy mogli odzyskać jego lokalizację indeksu lub wartość indeksu.

importować pandy jako PD
df = pd.Ramka danych(
„klasa”: [„A”, „A”, „B”, „B”, „C”, „C”, „D”, „D”],
„Członkowie”: [5, 4, 5, 5, 4, 6, 4, 4],
„Wynagrodzenie”: [30000, 28000, 32000, 31000, 30000, 26000, 27000, 28000],
„Koszt”: [12000, 11000, 11500, 13000, 10000, 12500, 10500, 13000]
)

W naszej ramce danych utworzyliśmy cztery kolumny: klasa, członkowie, wynagrodzenie i koszty. Kolumna klasy przechowuje wartości danych („A”, „A”, „B”, „B”, „C”, „C”, „D”, „D”). Członkowie kolumny zawierają wartości (5, 4, 5, 5, 4, 6, 4, 4), podczas gdy pensja i koszt kolumny zawierają liczbowe wartości danych (30000, 28000, 32000, 31000, 30000, 26000, 27000, 28000 ) i (12000, 11000, 11500, 13000, 10000, 12500, 10500, 13000). Załóżmy, że musimy znaleźć wartość indeksu pensji kolumny:

df.kolumny.get_loc („wynagrodzenie”)

Funkcja odzyskała indeks określonej kolumny, 2.

Przykład nr 04: Wyodrębnij określone wartości indeksu wiersza za pomocą funkcji get_loc ()

Możemy również pobrać lokalizację indeksu indeksów wierszy za pomocą funkcji get_loc (), jeśli określono etykiety dla indeksów wierszy. Możemy określić etykiety do naszego indeksu wiersza za pomocą listy zawierającej nazwy dla każdej wartości indeksu wiersza. Dodajmy etykiety indeksu do ramki danych, które utworzyliśmy w przykładzie nr 3.

importować pandy jako PD
df = pd.Ramka danych(
„klasa”: [„a”, „a”, „b”, „b”, „c”, „e”, „d”, „d”],
„Członkowie”: [5, 4, 5, 5, 4, 6, 4, 4],
„Wynagrodzenie”: [30000, 28000, 32000, 31000, 30000, 26008, 27000, 28000],
„Koszt”: [12000, 11000, 11500, 13000, 10000, 12500, 10500, 13000],
index = [„r1”, „r2”, „r3”, „r4”, „r5”, „r6”, „r7”, „r”]))

W środku Pd.Ramka danych() Funkcja, określiliśmy parametr indeksu jako listę zawierającą etykiety od R1 do R8. Etykiety „r1”, „r2”, „r3”, „r4”, „r5”, „r6”, „r7” i „r8” zastąpiły domyślnie indeks całkowitą danych danych danych danych. Teraz odzyskajmy lokalizację indeksu dla określonej etykiety.

Wydrukuj (DF.indeks.get_loc („r5”))

Po pierwsze, właściwość indeksu jest stosowana do ramki danych, aby uzyskać indeksy. Następnie, get_loc () Funkcja stosuje się do wyodrębnienia pozycji indeksu określonej etykiety indeksu wiersza.

Przykład nr 05: Wyodrębnij wartości indeksu wiersza za pomocą funkcji Numpy gdzie ():

Możemy również uzyskać wartości indeksu, określając warunek wewnątrz Gdzie() Funkcja Numpy. Najpierw stwórzmy ramkę danych, zaimportujemy pand, a także bibliotekę Numpy, aby korzystać z jej funkcji.

importować pandy jako PD
importować Numpy jako NP
df = pd.Ramka danych(
„ID”: ['001', „002”, „003”, „004”, „005”, „006”, „007”, „008”],
„Cena”: [100, 150, 130, 200, 120, 170, 120, 140],
„Rabat”: [30, 40, 10, 20, 60, 10, 30, 60])

Po zaimportowaniu wymaganych bibliotek stworzyliśmy naszą strumień danych. W naszej ramce danych mamy trzy kolumny (identyfikator, cena i zniżka). Kolumna identyfikator, cena i rabat przechowuje wartości danych („001”, „002”, „003”, „004”, „005”, „006”, „007”, „008”), (100, 150 , 130, 200, 120, 170, 120, 140) i (30, 40, 10, 20, 60, 10, 30, 60),. Teraz znajdźmy wartość indeksu wiersza za pomocą Gdzie() funkcja w funkcji List ().

Lista (NP.gdzie (df [„rabat”]> 30))
[tablica ([1, 4, 7], dtype = int64)]

Określiliśmy warunek wewnątrz funkcji Where (), aby uzyskać wiersze, w których wartość w kolumnie „rabat” jest większa niż 30. Aby utworzyć listę z zwróconych wartości, zastosowaliśmy metodę List ().

Wniosek

W tym artykule omówiono, jak pobrać wartości indeksu danych w pandy. Wykorzystaliśmy różne funkcje do pobrania indeksu wiersza i kolumny DataFrame. Wdrożyliśmy wiele przykładów, aby nauczyć Cię, jak wyodrębnić indeks wierszy danych za pomocą właściwości indeksu, przy użyciu funkcji get_loc (). Omówiliśmy także, jak uzyskać wartości indeksu kolumny za pomocą funkcji get_loc ().