Pandy do sprawdzenia wartości komórki to NAN

Pandy do sprawdzenia wartości komórki to NAN
Główna dokumentacja pandy mówi, że wartości zerowe brakuje wartości. Możemy oznaczać brakujące lub zerowe wartości jako NAN w pandy, jak większość programistów. Słowa kluczowe NAN i None są używane przez programistów do wyświetlania brakujących wartości w ramce danych. Najlepszą rzeczą w pandy jest to, że traktuje zarówno NAN, jak i żaden podobnie. Aby sprawdzić brakującą wartość komórki, pandy.Notnull zwróci fałsz w obu przypadkach NAN i żaden, jeśli komórka ma NAN, czy brak.

Tak więc w tym artykule zbadamy różne metody sprawdzenia, czy określona wartość komórki jest zerowa, czy nie (nan czy brak).

Różne metody, które zamierzamy omówić, to:

  1. isnull
  2. isnan
  3. isna
  4. Nie jest zerem

Omówmy szczegółowo każdą metodę.

Metoda 1: za pomocą funkcji isNull

W tej metodzie użyjemy bardzo łatwej metody o nazwie isNull (), aby dowiedzieć się, czy konkretna komórka ma wartość nan.

# Python isnull.py
importować pandy jako PD
importować Numpy jako NP
data = 'x': [1, 2, 3, 4, 5, np.Nan, 6, 7, NP.Nan, 8, 9, 10, NP.nan],
„Y”: [11, 12, NP.Nan, 13, 14, NP.Nan, 15, 16, NP.Nan, NP.Nan, 17, NP.nan, 19]
df = pd.DataFrame (dane)
Drukuj (DF)
nan_in_df = df.isnull (DF.ILOC [5, 0])
drukuj (nan_in_df)

Wyjście: Python Isnull.py

x y
0 1.0 11.0
1 2.0 12.0
2 3.0 nan
3 4.0 13.0
4 5.0 14.0
5 nan nan
6 6.0 15.0
7 7.0 16.0
8 nan nan
9 8.0 nan
10 9.0 17.0
11 10.0 nan
12 Nan ​​19.0
PRAWDA

Linia 3 do 4: Importujemy pandę biblioteczną i Numpy.

Linia 6: Tworzymy słownik z klawiszami x i y i ich wartości z niektórymi NP.Nan.

Linia 8 do 10: Konwertujemy słownik na strumień danych, a następnie drukujemy tenframe, który możemy zobaczyć na powyższym wyjściu.

Linia 12 do 13: Nazywamy metodę DataFrame IsNull i sprawdzamy konkretną komórkę [5, 0] Wartość ramki danych jest zerowa lub nie. W takim przypadku nie sprawdzamy całej ramki danych i wartości pojedynczej komórek. Więc daje to wyjście, które pokazano na powyższym wyjściu. Pierwsza wartość 5 [5, 0], która reprezentuje pozycję indeksu, a druga wartość, 0, reprezentuje nazwę indeksu kolumny.

Metoda 2: Za pomocą metody isnan ()

W powyższym przykładzie sprawdziliśmy wartość NAN za pomocą metody ISNull formy danych danych. Teraz użyjemy innej metody o nazwie Isnan. Ta metoda należy do Numpy, a nie do ramki danych. Poniższy program dotyczy tego, który sprawdza tylko dla konkretnej komórki.

# Możemy również sprawdzić wartość NAN komórki w danych danych
data = 'x': [1, 2, 3, 4, 5, np.Nan, 6, 7, NP.Nan, 8, 9, 10, NP.nan],
„Y”: [11, 12, NP.Nan, 13, 14, NP.Nan, 15, 16, NP.Nan, NP.Nan, 17, NP.nan, 19]
df = pd.DataFrame (dane)
Drukuj (DF)
wartość = df.w [5, „x”] # nan
isnan = np.isnan (wartość)
Drukuj („================”)
druk („jest wartość w df [5,„ x ”] nan:", isnan)

Wyjście:

x y
0 1.0 11.0
1 2.0 12.0
2 3.0 nan
3 4.0 13.0
4 5.0 14.0
5 nan nan
6 6.0 15.0
7 7.0 16.0
8 nan nan
9 8.0 nan
10 9.0 17.0
11 10.0 nan
12 Nan ​​19.0
================
Jest wartością w df [5, „x”] nan: true

Linia 2: Tworzymy słownik z klawiszami x i y i ich wartości z niektórymi NP.Nan.

Linia 4 i 5: Konwertujemy słownik na strumień danych, a następnie drukujemy tenframe, który możemy zobaczyć na powyższym wyjściu.

Linia 6: Filtrowaliśmy konkretną wartość komórki za pomocą nazwy indeksu i kolumny [5, „x”] i przypisaliśmy tę wartość do wartości zmiennej. Pierwsza wartość 5, która reprezentuje pozycję indeksu, a „x” reprezentuje nazwę kolumny.

Linia 7: Sprawdzamy, czy wartość jest nan, czy nie.

Linia 9: W końcu drukujemy nasze dane wyjściowe, które pokazują, że wartość ma NAN jest prawdziwa.

Metoda 3: Wartość NAN komórki w serii za pomocą ISNAN

W poprzednim przykładzie sprawdziliśmy wartość nan w ramce danych komórkowej. Możemy również sprawdzić w serii pandy, jeśli jakakolwiek wartość komórki jest nan, czy nie. Zobaczmy więc, jak możemy to wdrożyć.

# Możemy również sprawdzić wartość NAN komórki w serii DataFrame
series_df = pd.Seria ([2, 3, NP.Nan, 7, 25])
druk (seria_df)
wartość = seria_df [2] # nan
isnan = np.isnan (wartość)
Drukuj („================”)
Drukuj („jest wartość w df [2] nan:", isnan)

Wyjście:

0 2.0
1 3.0
2 Nan
3 7.0
4 25.0
Dtype: Float64
================
Jest wartością w df [2] nan: true

Linia 3: Stworzyliśmy serię pandy.

Linia 6: przypisujemy wartość komórki, którą chcemy sprawdzić do innej zmiennej.

Linia 7: Sprawdzamy albo wartość w tej zmiennej jest nan, albo nie.

Metoda 4: za pomocą pandy.isna

Inną metodą, której możemy użyć, jest sprawdzenie, czy określona wartość komórki danych jest zerowa, czy nie przy użyciu pandy.Metoda ISNA.

data = 'x': [1,2,3,4,5, NP.Nan, 6,7, NP.Nan, 8,9,10, NP.nan],
„y”: [11,12, NP.Nan, 13,14, NP.Nan, 15,16, NP.Nan, NP.Nan, 17, NP.nan, 19]
df = pd.DataFrame (dane)
Drukuj (DF)
Drukuj („Sprawdzanie wartości NAN w komórce [5, 0]”)
Pd.isna (df.ILOC [5,0])

Wyjście:

x y
0 1.0 11.0
1 2.0 12.0
2 3.0 nan
3 4.0 13.0
4 5.0 14.0
5 nan nan
6 6.0 15.0
7 7.0 16.0
8 nan nan
9 8.0 nan
10 9.0 17.0
11 10.0 nan
12 Nan ​​19.0
Sprawdzanie wartości NAN w komórce [5, 0]
PRAWDA

Linia 1: Tworzymy słownik z klawiszami x i y i ich wartości z niektórymi NP.Nan.

Linia 3 do 5: Konwertujemy słownik na strumień danych, a następnie drukujemy tenframe, który możemy zobaczyć na powyższym wyjściu.

Linia 8: Sprawdzamy, czy wartość komórki [5, 0] jest nan, czy nie. Pierwsza wartość 5, która reprezentuje pozycję indeksu, a 0 reprezentuje nazwę kolumny. W końcu drukujemy nasze wyjście, które pokazuje, że wartość ma NAN jest prawdziwa.

Metoda 5: za pomocą pandy.Metoda notnall

Inną metodą, za pomocą której możemy sprawdzić dowolną wartość komórki, jest nan lub nie przy użyciu metody NotNull. W tej metodzie, jeśli wartość komórki nie ma lub brakuje, zwróci logiczną false, jak pokazano w poniższym programie.

data = 'x': [1,2,3,4,5, NP.Nan, 6,7, NP.Nan, 8,9,10, NP.nan],
„y”: [11,12, NP.Nan, 13,14, NP.Nan, 15,16, NP.Nan, NP.Nan, 17, NP.nan, 19]
df = pd.DataFrame (dane)
Drukuj (DF)
Drukuj („Sprawdzanie wartości NAN w komórce [5, 0]”)
Pd.Notnull (DF.ILOC [5,0])

Wyjście:

x y
0 1.0 11.0
1 2.0 12.0
2 3.0 nan
3 4.0 13.0
4 5.0 14.0
5 nan nan
6 6.0 15.0
7 7.0 16.0
8 nan nan
9 8.0 nan
10 9.0 17.0
11 10.0 nan
12 Nan ​​19.0
Sprawdzanie wartości NAN w komórce [5, 0]
FAŁSZ

Linia 1: Tworzymy słownik z klawiszami x i y i ich wartości z niektórymi NP.Nan.

Linia 3 do 5: Konwertujemy słownik na strumień danych, a następnie drukujemy tenframe, który możemy zobaczyć na powyższym wyjściu.

Linia 8: Sprawdzamy, czy wartość komórki [5, 0] nie jest NAN. Pierwsza wartość 5, która reprezentuje pozycję indeksu, a 0 reprezentuje nazwę kolumny. W końcu drukujemy nasze dane wyjściowe, które pokazuje, że wartość ma NAN i zwraca się jako fałszywa, ponieważ sprawdzamy, czy komórka nie jest nienalna, ale komórka faktycznie jest zerowa.

Wniosek

Na tym blogu widzieliśmy różne metody określania określonej wartości komórki to nan lub brak, ponieważ czasami musimy znaleźć wartość komórki, a nie całą ramkę danych. Właśnie dlatego ten blog jest szczególny na skupienie wartości komórki. Widzieliśmy Pandy i Numpy, obie metody sprawdzania brakujących wartości. Koncentrujemy się na koncepcji tylko po to, aby pokazać proste samouczki i nie używać żadnej pętli iteracji. Wszystkie powyższe metody, które omówiliśmy, są szybkie w wykonywaniu, nawet jeśli chcesz sprawdzić całą ramkę danych.

Kod tego bloga jest dostępny na linku Github.