Jak iterować rzędy w ramce danych w pandy

Jak iterować rzędy w ramce danych w pandy
Iteracja to metoda, która pomaga nam przemierzać wszystkie wartości. W Panand, kiedy tworzymy ramkę danych, zawsze musimy uzyskać dostęp do wartości i gdzie iteracja pomaga. Tak więc w tym artykule przejdziemy do różnych metod iteracji z rzędem danych.

Pandy.Ramka danych

Pandas Pandas można utworzyć za pomocą następującego konstruktora:

Pandy.DataFrame (data = brak, indeks = brak, kolumny = brak, dType = brak, copy = false)

Metoda: Korzystanie z atrybutu indeksu DataFrame

Utworzyliśmy słownik danych z czterema klawiszami, a następnie przekonwertowaliśmy ten słownik danych na DataFrame przy użyciu biblioteki PandaS, jak pokazano poniżej:

W numerze komórkowym [4] po prostu drukujemy tenframe danych, aby zobaczyć, jak wygląda nasza DataFrame:

W numerze komórki [5] wyświetlamy, jaki faktyczny indeks zawiera informacje o ramie danych. Wyjście pokazuje, że indeks przechowuje szczegóły całkowitej ramy danych w postaci zakresu, jak pokazano powyżej w wyjściu.

W numerze komórki [6], jak już wiemy, indeks przechowuje funkcję zakresu, która ma wartości od 0 do 4 (ostatnia wartość nie została zliczona, aby pętla działała od 0 do 3). Więc iterujemy pętlę jako normalnie, a przy każdej iteracji przejdzie do tej konkretnej nazwy kolumny, o której wspomniano jak DF [„Nazwa”], a następnie drukuje określoną wartość indeksu (numer wiersza) tej kolumny.

Metoda: Korzystanie z funkcji loc [] DataFrame

Najpierw zrozummy metodę LOC i ILOC. Utworzyliśmy series_df (seria), jak pokazano poniżej w numerze komórki [24]. Następnie drukujemy serię, aby zobaczyć etykietę indeksu wraz z wartościami. Teraz, pod numerem komórki [26], drukujemy serie_df.loc [4], który daje wyjście C. Widzimy, że etykieta indeksu o 4 wartościach to c. Mamy więc właściwy wynik.

Teraz na numer komórki [27] drukujemy serie_df.ILOC [4], i otrzymaliśmy wynik e, który nie jest etykietą indeksu. Ale jest to lokalizacja indeksu, która liczy się od 0 do końca rzędu. Jeśli więc zaczniemy liczyć od pierwszego wiersza, otrzymamy e w lokalizacji indeksu 4. Więc teraz rozumiemy, jak działają te dwa podobne LOC i ILOC.

Teraz będziemy używać .Metoda LOC w celu iteracji wierszy strumienia danych.

W numerze komórki [7] po prostu drukujemy ramkę danych, którą utworzyliśmy wcześniej. Będziemy również używać tej samej ramki danych do tej koncepcji.

W numerze komórki [8], gdy etykieta indeksu zaczyna się od zera (0), możemy iterować każdy wiersz i uzyskać wartości etykiety indeksu każdej konkretnej kolumny, jak pokazano na powyższym obrazie.

Metoda: przy użyciu metody iterrows () DataFrame

Najpierw zrozummy iterrows () i zobaczmy, jak drukują wartości.

W numerze komórki [32]: Utworzyliśmy DF_TEST DF_TEST.

W numerze komórki [33 i 35]: Drukujemy nasz DF_TEST, abyśmy mogli zobaczyć, jak to wygląda. Następnie zapętamy go przez iterrows () i drukujemy wiersz, który drukuje wszystkie wartości wraz z ich nazwami kolumnowej lewej strony.

W numerze komórki [37], gdy drukujemy wiersz za pomocą powyższej metody, otrzymujemy nazwy kolumn po lewej stronie. Jednak kiedy wspominamy o nazwie kolumny, otrzymujemy wyniki takie jak pokazane w numerze komórki [37]. Teraz wyraźnie rozumiemy, że będzie to iterować rzędowe.

W numerze komórki [9]: Po prostu drukujemy ramkę danych, którą utworzyliśmy wcześniej. Będziemy również używać tej samej ramki danych do tej koncepcji.

W numerze komórki [10]: Iternujemy każdy wiersz za pomocą iterrows () i drukujemy wynik.

Metoda: przy użyciu metody iTertuples () DataFrame

Powyższa metoda jest podobna do iterrows (). Ale jedyną różnicą jest to, w jaki sposób uzyskujemy dostęp do wartości. W numerze komórki [11] możemy zobaczyć, aby uzyskać dostęp do wartości kolumny na każdej iteracji. Używamy wiersza. Nazwa (operator kropki).

Metoda: Korzystanie z funkcji ILOC [] DataFrame

Już wcześniej wyjaśniliśmy, jak .Metoda ILOC działa. Więc teraz użyjemy tej metody bezpośrednio do iterowania wierszy.

W numerze komórki [18]: Po prostu drukujemy DataFrame, którą stworzyliśmy wcześniej dla tej koncepcji.

W liczbie komórki [19]: DF.ILOC [i, 0], w którym należy do lokalizacji i następnej wartości 0, która informuje indeks nazwy kolumny.

Metoda: iteruj rzędy i wydrukuj wraz z nazwami kolumn

W numerze komórki [20]: Po prostu drukujemy DataFrame (DF), który utworzyliśmy wcześniej, aby zrozumieć koncepcję.

W numerze komórki [21]: Iternujemy metodą iTertuples (), którą już wyjaśniliśmy. Ale jeśli nie wspomnieliśmy o żadnych innych informacjach, otrzymujemy dane wyjściowe wraz z ich nazwami kolumn.

Wniosek:

Dzisiaj uczymy się różnych metod powszechnej iteracji na Pandy DataFrame. Dowiedzieliśmy się również o .loc i .Metody ILOC i bliska różnica między nimi. Badaliśmy również metody iTerrows () i iTertuples (). Widzieliśmy również metodę atrybutu indeksu. Wszystkie te powyższe metody mają odpowiednie zalety i wady. Możemy więc powiedzieć, że zależy to od sytuacji, jaka metoda, kiedy trzeba użyć.