Podczas pracy z dużą liczbą zestawów danych użytkownicy często napotykają wiele wartości zerowych lub nan. Wartości zerowe reprezentują wartości zerowe w zestawie danych. W Pythonie programiści spotykają się również z wartościami NAN, gdy pracują z panami w Python. Aby filtrować te wartości zerowe, Python zawiera różne funkcje.
Wyniki z tego bloga to:
Co to jest „Pandy” w Pythonie?
W Python „Pandy”Jest najczęściej używaną biblioteką do pracy z Float, DateTime, String itp., Rodzaje zestawów danych. Ma wiele funkcji do odkrywania, analizy, czyszczenia i manipulowania pożądanymi danymi. Innymi słowy, pozwala użytkownikom odfiltrować wiersze o wartości NAN za pomocą „ramka danych”Funkcje, takie jak„ramka danych.Dropna ()", I "ramka danych.Nie jest zerem()" Funkcje.
Jakie są wartości nan?
Prawie każdy zestaw danych ma wartości zerowe, null jest szczególną wartością zmiennoprzecinkową, która oznacza „Nie liczba". Dane mają wiele kształtów i formularzy, w tym puste/brakujące wartości, które są reprezentowane jako NAN. Podobnie jak inne języki programistyczne, Python ma również wiele sposobów reprezentowania brakujących wartości w zestawach danych.
Jak filtrować określone wiersze danych z zestawu danych, które zawierają wartość NAN, wykorzystując Pandas DataFrame w Python?
Aby filtrować określone wiersze z zestawu danych, które zawierają wartości NAN, najpierw utworzymy zestaw danych zawierający wartości NAN. Aby to zrobić, zaimportuj „Numpy", I "Pandy”Moduły biblioteczne i utwórz nowy zestaw danych. Następnie sprawdź nowo utworzony zestaw danych:
importować pandy jako PD
importować Numpy jako NP
DataFrame = PD.DataFrame („Autorzy”: [„Maria”, „Henry”, „Marry”, NP.nan, „Alex”],
„Nazwa użytkownika”: [„fmn018”, np.nan, „fm012”, „mg002”, „MA025”],
„Doświadczenie”: [„1 rok”, „2 rok”, NP.nan, „6 miesięcy”, „9 miesięcy”]
)
ramka danych
Jak widać, utworzony zestaw danych zawiera wiele wartości NAN:
Teraz użyj „Nie jest zerem()„Funkcja filtrowania określonego wiersza z konkretnej kolumny, która zawiera wartości NAN:
DataFrame [DataFrame [„Experience”].Nie jest zerem()]
Wyjście
Jak filtrować wiele wierszy danych z zestawu danych, które zawierają wartość NAN, wykorzystując pandas DataFrame w Python?
Czasami użytkownicy muszą odfiltrować wiele wierszy z dostarczonego zestawu danych z więcej niż jednej kolumny. W tym celu określ żądane nazwy kolumn, a następnie użyj „Wszystko()”Funkcja z„Nie jest zerem()”Funkcja:
kolumny = [„doświadczenie”, „nazwa użytkownika”]
DataFrame [DataFrame [kolumny].Nie jest zerem().Wszystko (1)]
Można zauważyć, że wiele wierszy jest filtrowanych z zestawu danych, który zawiera wartości NAN z określonych kolumn:
Jak odfiltrować wszystkie wiersze z zestawu danych, które zawierają wartość NAN za pomocą PandaS DataFrame w Python?
Jeśli użytkownicy chcą odfiltrować wszystkie wiersze z zestawu danych, które zawierają wartości NAN za pomocą PandaS DataFrame w Python, „The”, „Dropna ()„Można użyć funkcji:
ramka danych.Dropna ()
Wyjście
Zebraliśmy najłatwiejsze sposoby filtrowania wartości NAN w Pythonie.
Wniosek
Aby odfiltrować wiersze o wartości NAN w Pythonie, „ramka danych”Funkcje, takie jak„ramka danych.Nie jest zerem()", I "ramka danych.Dropna ()”Używane są funkcje. Ten blog dostarczył różne sposoby filtrowania wartości NAN w Pythonie.