Pandy isna

Pandy isna
„Pandy jest jednym z pakietów języka Pythona, który sprawia, że ​​analiza danych jest znacznie lepsza. W dziedzinie informatyki analiza danych i wstępne przetwarzanie jest prawie na każdym etapie, a w przypadku brakujących danych jest czasochłonny i kluczowy proces do wykonania. Oto „Pandy ISNA”, która jest funkcją używaną do wykrywania brakujących wartości z danych. Działa w sposób, który zwraca boolean podobnego obiektu rozmiar.

Brakujące wartości pokazują jako „NAN” lub „Brak”, jak wyjaśniono. Metoda Pandas ISNA nie ma żadnych parametrów. Typ powrotu to ramka danych z logiką. „NAN” wskazuje wartości „prawdziwe”. W przeciwnym razie każde inne dane są mapowane jako „fałszywe”. Do implementacji kodów będziemy używać narzędzia „Spyder”, które jest w języku „Python”. Pandy ISNA jest nowym obiektem pandy, którego obiekt wejściowy jest tego samego rozmiaru."

Składnia dla pandy isna ()

Możemy użyć metody Panda ISNA na różnych strukturach danych. Pierwsze kroki z składnią.

Ramka danych.isna ()

W powyższej składni pandas isna () DataFrame musimy po prostu wprowadzić nazwę DataFrame, nad którą chcemy popracować. Wywołanie metody odbywa się przy użyciu „kropka isna.„Możemy również zastosować metodę panda isna () do danych serii. W tym celu musimy przypisać nazwę obiektu serii metodą ISNA ().

Zróbmy teraz przykłady, aby lepiej zrozumieć metodę panda ISNA. Poniżej przedstawiamy sposoby wdrożenia w przykładach, aby wykryć brakujące wartości w pandy przy użyciu metody ISNA ():

  • Identyfikacja brakujących wartości w kolumnie z ramką danych za pomocą panda ISNA.
  • Identyfikacja brakujących wartości w całej ramce danych za pomocą panda ISNA.
  • Używanie panda ISNA do zliczenia wartości zerowych w każdej kolumnie z ramki danych.

Tworzenie ramki danych do wdrożenia PandaS isna ()

Po pierwsze, musimy zaimportować bibliotekę pandy, ponieważ pand „PD” jest biblioteką typu open source do manipulowania danymi, a następnie zaimportować bibliotekę Numpy jako „NP”, która jest używana do obliczeń numerycznych danych danych. Po zaimportowaniu bibliotek zaczniemy tworzyć ramkę danych, którą można również napisać jako „DF”. W „DF” mamy nazwę, kraje, sprzedaż i wydatki. Istnieją „cztery” zmienne, w których 2 kolumny mają dane znaków, a pozostałe dwie mają dane liczbowe. Śledź polecenie, aby wydrukować „dane sprzedaży”. „NP.nan ”w kodzie jest„ NP ”, jak wyjaśniono powyżej, a„ NAN ”oznacza nie liczbę; W sumie służy do tworzenia brakujących wartości w ramce danych.

Wyjście pokazuje utworzoną ramkę danych zgodnie z podanymi danymi i widzimy, że niektórych wartości brakuje jako „NAN”. Poniższe przykłady, które będziemy robić, wyjaśni, jak to naprawić.

Przykład 01: Identyfikacja brakujących wartości w kolumnie DataFrame za pomocą pandaS isna ()

Tutaj będziemy identyfikować brakujące wartości w kolumnie. Wybraliśmy kolumnę „sprzedaż”, aby wykryć jej brakujące warunki. Ta metoda pomoże znaleźć brakujące wartości w kolumnie, którą chcemy znać lub pracować zamiast zastosować metodę do całej ramki danych, aby skupić się na warunkach, które musimy wiedzieć. Mamy utworzoną ramkę danych, z której widzimy, że w sprzedaży brakuje wartości, napisanej jako „NP.nan ”; Działa z techniką prawdziwej i fałszu. Pokazuje wartości przypisane jako „fałszywe”, a brakujące jako „prawdziwe”.

Wyjście wyświetla wyniki w boolean, co oznacza prawdziwe i fałszywe. Prawdziwe i fałszywe wartości, w których możemy wyraźnie zobaczyć, gdzie brakuje wartości, są „prawdziwe”.

Przykład 02: Identyfikacja brakujących wartości w całej ramce danych za pomocą metody Pandas ISNA

W tym przykładzie będziemy wykrywać brakujący termin, tak jak to zrobiliśmy w poprzednim przykładzie, ale tutaj będziemy go wdrażać w całej ramce danych. Oznacza to, że wykryjemy brakujące terminy w całym „DF”. Utworzone „DF” ma dane sprzedaży, które składają się z nazwy, nazwy kraju, sprzedaży i wydatków. Kolejny wiersz kodu wyjaśnia dane dotyczące sprzedaży, które są nazwą „DF”. Możemy to wybrać sami, jaką nazwę nadamy Twojemu „DF”, a następnie istnieje „kropka” isna (), metoda i drukuje wyjście jako prawdziwe i fałszywe wykrywanie brakujących terminów w całym „DF ".

Dane wyjściowe pokazuje, że cała ramka danych jest oznaczona jako „prawdziwa” i „false”, pokazując, że brakujące wartości, takie jak sprzedaż (3), jest oznaczone jako „prawdziwe”, a wydatki (2) są również napisane jako „prawdziwe”, co oznacza, że ​​oznacza to To są jednostka strumienia danych, w której brakuje danych.

Przykład 03

Teraz, w tym przykładzie, zliczamy wartości w ramce danych za pomocą metody isna pandas, osiągnięcie tej metody byłoby możliwe przy użyciu dwóch metod pand, pandy „isna” i metody „suma” pandy. Jak wiemy, ISNA () służy do identyfikacji brakującej wartości, a suma, której będziemy używane, jest do zliczania tych brakujących wartości w „DF”. Ta metoda jest bardzo korzystna, niezbyt często używana, ale ponieważ sztuczka jest uznawana, użycie rośnie, ponieważ sprawia, że ​​wyjście procesowe wygląda tak wyraźnie, że nie ma potrzeby liczenia w każdym wierszu lub w każdej kolumnie, liczba wyjściowa Ułatwia zrozumienie liczby brakujących terminów w „DF”.

Jest to trudna metoda składniowa do umieszczenia dwóch różnych metod w tej samej nawiasie, ale z różnymi wierszami. Jest to bardzo pomocna, ale potężna technika dla danych, a analiza przeprowadzona na danych. Możemy to nazwać złożoną metodą, która ułatwia debugowanie i czytanie danych.

Tutaj wyjście wyświetla wersję liczby brakujących wartości, co wyjaśnia, która kolumna i ile brakuje. Kolumna sprzedaży, jak i wydatki mają „2” brakujące wartości. Podczas gdy nazwa i kraj nie brakuje warunków.

Wniosek

W tym artykule dowiedzieliśmy się wszystkich sposobów, w jakie pracują pandy isna (). W „DF” jest to szybki sposób sprawdzenia brakujących wartości. Przeprowadziliśmy przykłady lepszego zrozumienia całej strumienia danych metody isna pandas, ponieważ według pożądania wybranej metody pandas pandas i metody liczby pandy isna. Wszystkie te metody, na ogromną skalę, działają na rzecz poprawy i łatwości użytkowników, ponieważ trudno będzie wykryć brakującą wartość w milionach zestawów danych. Tak więc takie podejście będzie ratownikiem dla wszystkich osób pracujących z ogromną ilością danych na rzecz każdego procesu rozwoju.