Pandy iterują rzędy

Pandy iterują rzędy
W tym artykule odkryjemy różne metody i techniki, których możemy użyć do iteracji nad wierszami w Pandy DataFrame.

Przykładowa ramka danych

Zacznijmy od ustawienia przykładowej ramki danych. Następnie możesz użyć swojej strumienia danych, jak uważasz za stosowne.

df = pd.Ramka danych(
„db”: [„mysql”, „postgresql”, „redis”, „MongoDB”, „SQL Server”],
„Port”: [3306, 5480, 3309, 9001, 5500],
„Rekordy”: [12000, 2344, 4500, 90000, 1000]
)
df

Powyższy kod powinien utworzyć prostą ramkę danych, jak pokazano poniżej:

Metoda 1 - Iteracja wierszy za pomocą iTerrows ()

Pandy dostarczają nam metody iterrows (), która pozwala nam iterować nad rzędami ramki danych. Funkcja zwraca parę indeksu i wiersza jako serię.

Możemy użyć tej funkcji, aby iterować nad wierszami, jak pokazano w poniższym przykładzie:

dla _, wiersz w df.iTerrows ():
print (f "row \ n")

W powyższym przykładowym kodzie używamy funkcji iTerrows (), aby pobrać każdy wiersz z DataFrame. Kod powyżej powinien zwrócić:

Zauważ, że _ w pętli reprezentuje indeks kolumny w ramce danych.

Metoda 2 - Iteracja wierszy za pomocą iTertules ()

Metoda itertuples () w pandaas pozwala nam iterować nad rzędami pandai danych danych. Funkcja zwraca obiekt, aby umożliwić nam iterowanie nazwanych krotek dla każdego wiersza w ramce danych.

Funkcja pozwala również zachować typ danych podczas iteracji. Dlatego uważa się, że jest szybszy niż iTerrows ().

Przykładowa ilustracja pokazano w poniższym kodzie:

dla wiersza w DF.iTertuples ():
Drukuj (wiersz)

Kod powyżej powinien zwrócić krotki dla każdego wiersza w ramce danych. Przykładem jest to, jak pokazano:

Aby wykluczyć indeks z wyniku, możemy ustawić parametr indeksu na false. Przykładem jest jak pokazano:

dla wiersza w DF.iTertups (indeks = false):
Drukuj (wiersz)

Kod powyżej powinien zwrócić:

Myśli

Pandy ogólnie zniechęcają do iteracji strumienia danych. Nigdy nie modyfikuj danych podczas iteracji, ponieważ iteracja zwraca kopię danych, a nie widok.

Jeśli chcesz zmodyfikować dane podczas iteracji, możesz wybrać inne opcje, takie jak:

  1. Lista zrozumienie
  2. Wektoryzacja
  3. Cython procedury.