Filtruj nan pandy

Filtruj nan pandy

Podczas pracy z dużą liczbą zestawów danych użytkownicy często napotykają wiele wartości zerowych lub nan. Wartości zerowe reprezentują wartości zerowe w zestawie danych. W Pythonie programiści spotykają się również z wartościami NAN, gdy pracują z panami w Python. Aby filtrować te wartości zerowe, Python zawiera różne funkcje.

Wyniki z tego bloga to:

  • Co to jest „Pandy” w Pythonie?
  • Jakie są wartości nan?
  • Jak filtrować określony wiersz z zestawu danych, który zawiera wartość nan za pomocą pandas DataFrame w Python?
  • Jak filtrować wiele wierszy z zestawu danych, który zawiera wartość NAN za pomocą PandaS DataFrame w Python?
  • Jak odfiltrować wszystkie wiersze z zestawu danych, które zawierają wartość NAN za pomocą PandaS DataFrame w Python?

Co to jest „Pandy” w Pythonie?

W Python „Pandy”Jest najczęściej używaną biblioteką do pracy z Float, DateTime, String itp., Rodzaje zestawów danych. Ma wiele funkcji do odkrywania, analizy, czyszczenia i manipulowania pożądanymi danymi. Innymi słowy, pozwala użytkownikom odfiltrować wiersze o wartości NAN za pomocą „ramka danych”Funkcje, takie jak„ramka danych.Dropna ()", I "ramka danych.Nie jest zerem()" Funkcje.

Jakie są wartości nan?

Prawie każdy zestaw danych ma wartości zerowe, null jest szczególną wartością zmiennoprzecinkową, która oznacza „Nie liczba". Dane mają wiele kształtów i formularzy, w tym puste/brakujące wartości, które są reprezentowane jako NAN. Podobnie jak inne języki programistyczne, Python ma również wiele sposobów reprezentowania brakujących wartości w zestawach danych.

Jak filtrować określone wiersze danych z zestawu danych, które zawierają wartość NAN, wykorzystując Pandas DataFrame w Python?

Aby filtrować określone wiersze z zestawu danych, które zawierają wartości NAN, najpierw utworzymy zestaw danych zawierający wartości NAN. Aby to zrobić, zaimportuj „Numpy", I "Pandy”Moduły biblioteczne i utwórz nowy zestaw danych. Następnie sprawdź nowo utworzony zestaw danych:

importować pandy jako PD
importować Numpy jako NP
DataFrame = PD.DataFrame („Autorzy”: [„Maria”, „Henry”, „Marry”, NP.nan, „Alex”],
„Nazwa użytkownika”: [„fmn018”, np.nan, „fm012”, „mg002”, „MA025”],
„Doświadczenie”: [„1 rok”, „2 rok”, NP.nan, „6 miesięcy”, „9 miesięcy”]
)
ramka danych

Jak widać, utworzony zestaw danych zawiera wiele wartości NAN:

Teraz użyj „Nie jest zerem()„Funkcja filtrowania określonego wiersza z konkretnej kolumny, która zawiera wartości NAN:

DataFrame [DataFrame [„Experience”].Nie jest zerem()]

Wyjście

Jak filtrować wiele wierszy danych z zestawu danych, które zawierają wartość NAN, wykorzystując pandas DataFrame w Python?

Czasami użytkownicy muszą odfiltrować wiele wierszy z dostarczonego zestawu danych z więcej niż jednej kolumny. W tym celu określ żądane nazwy kolumn, a następnie użyj „Wszystko()”Funkcja z„Nie jest zerem()”Funkcja:

kolumny = [„doświadczenie”, „nazwa użytkownika”]
DataFrame [DataFrame [kolumny].Nie jest zerem().Wszystko (1)]

Można zauważyć, że wiele wierszy jest filtrowanych z zestawu danych, który zawiera wartości NAN z określonych kolumn:

Jak odfiltrować wszystkie wiersze z zestawu danych, które zawierają wartość NAN za pomocą PandaS DataFrame w Python?

Jeśli użytkownicy chcą odfiltrować wszystkie wiersze z zestawu danych, które zawierają wartości NAN za pomocą PandaS DataFrame w Python, „The”, „Dropna ()„Można użyć funkcji:

ramka danych.Dropna ()

Wyjście

Zebraliśmy najłatwiejsze sposoby filtrowania wartości NAN w Pythonie.

Wniosek

Aby odfiltrować wiersze o wartości NAN w Pythonie, „ramka danych”Funkcje, takie jak„ramka danych.Nie jest zerem()", I "ramka danych.Dropna ()”Używane są funkcje. Ten blog dostarczył różne sposoby filtrowania wartości NAN w Pythonie.