W tym samouczku R będziemy filtrować wiersze za pomocą funkcji Filter ().
Utwórzmy ramkę danych z czterema wierszami i pięcioma kolumnami.
#Utwórz market danych, który ma 4 wiersze i 5 kolumn.
rynek = dane.ramka (market_id = c (1,2,3,4), market_name = c („m1”, „m2”, „m3”, „m4”), Market_place = c („India”, „USA”, „India „,„ Australia ”), Market_Type = C („ Grocer ”,„ Bar ”,„ Grocery ”,„ Restaurate ”), Market_Squarefeet = C (120 342,220,110))
Rynek #Display
Drukuj (rynek)
Wynik:
Filtrujmy wiersze w tej formie danych.
Składnia:
filtr (DataFrame_Object, warunek)
Parametry:
Wymaga dwóch parametrów:
Możemy określić warunki za pomocą operatorów relacyjnych i logicznych.
Przykład 1:
W tym przykładzie określamy warunek w kolumnie Market_id.
Filtrujemy wiersze, wybierając wartości w tej kolumnie większej niż 3.
#Utwórz market danych, który ma 4 wiersze i 5 kolumn.
rynek = dane.ramka (market_id = c (1,2,3,4), market_name = c („m1”, „m2”, „m3”, „m4”), Market_place = c („India”, „USA”, „India „,„ Australia ”), Market_Type = C („ Grocer ”,„ Bar ”,„ Grocery ”,„ Restaurate ”), Market_Squarefeet = C (120 342,220,110))
#zwróć wiersze tylko wtedy, gdy wartości w kolumnie Market_id są większe niż 3
Drukuj (Filtr (Market, Market_id> 3))
Wynik:
Widzimy, że wiersze są filtrowane i używane operatora większego niż (>) w kolumnie Market_id.
Przykład 2:
W tym przykładzie określamy warunek w kolumnach Market_id i Market_place.
Przefiltrujemy wiersze, wybierając wartości w kolumnie Market_ID większej niż 2 i wartości rynku „Indie”.
#Utwórz market danych, który ma 4 wiersze i 5 kolumn.
rynek = dane.ramka (market_id = c (1,2,3,4), market_name = c („m1”, „m2”, „m3”, „m4”), Market_place = c („India”, „USA”, „India „,„ Australia ”), Market_Type = C („ Grocer ”,„ Bar ”,„ Grocery ”,„ Restaurate ”), Market_Squarefeet = C (120 342,220,110))
#zwróć wiersze tylko wtedy, gdy wartości w kolumnie Market_id są większe niż 3, a miejsce to Indie
Drukuj (Filtr (Market_id> 2 i Market_place == „India”))
Wynik:
Widzimy, że wiersze są filtrowane i używane operatora większego niż (>) w kolumnie Market_id i operatora == w kolumnie Market_place w połączeniu z operatorem i (&).
Przykład 3:
W tym przykładzie określamy warunek w kolumnach Market_id i Market_place.
Odfiltrujemy wiersze, wybierając wartości w kolumnie Market_ID większe niż 2 lub w miejscu „Indie”.
#Utwórz market danych, który ma 4 wiersze i 5 kolumn.
rynek = dane.ramka (market_id = c (1,2,3,4), market_name = c („m1”, „m2”, „m3”, „m4”), Market_place = c („India”, „USA”, „India „,„ Australia ”), Market_Type = C („ Grocer ”,„ Bar ”,„ Grocery ”,„ Restaurate ”), Market_Squarefeet = C (120 342,220,110))
#zwróć wiersze tylko wtedy, gdy wartości w kolumnie Market_id są większe niż 3 lub miejsce to Indie
Drukuj (Filtr (Market_ID> 2 | Market_place == 'India'))
Wynik:
Widzimy, że wiersze są filtrowane i używane operatora większego niż (>) w kolumnie Market_ID i operatora == w kolumnie Market_place w połączeniu z OR OROPERATOR OR OR.
Przykład 4:
W tym przykładzie określamy warunek w kolumnie Market_place.
Filtrujemy wiersze, wybierając wartości w kolumnie Market_place, tak że wartości znajdują się w „Indiach” lub „USA” za pomocą % w % w %.
#Utwórz market danych, który ma 4 wiersze i 5 kolumn.
rynek = dane.ramka (market_id = c (1,2,3,4), market_name = c („m1”, „m2”, „m3”, „m4”), Market_place = c („India”, „USA”, „India „,„ Australia ”), Market_Type = C („ Grocer ”,„ Bar ”,„ Grocery ”,„ Restaurate ”), Market_Squarefeet = C (120 342,220,110))
#zwróć wiersze tylko wtedy, gdy wartości na rynku są tylko Indie i USA
Drukuj (Filtr (Market_place % w % C („India”, „USA”)))
Wynik:
Widzimy, że wiersze są filtrowane i używane % w % w % do sprawdzenia wartości, które są „Indie” lub „USA”.
Wniosek
W tym artykule omówiliśmy cztery różne przykłady filtrowania ramki danych, określając różne warunki za pomocą operatorów relacyjnych, operatorów logicznych i % w % operator.