Pandas interpolatu

Pandas interpolatu
Interpolacja jest sposobem na oszacowanie nieznanych danych między dwoma znanymi wartościami danych. Metoda „interpolatu” pandy służy do wypełnienia brakujących cech w ramce danych. Nie jest to najlepsza wersja znalezienia brakujących lub nieznanych danych, ponieważ może czasami wpływać na dokładność danych i może mieć krótkoterminowe błędy. Ale istnieje „wielomian”, który jest rodzajem interpolatu pand, który jest używany na wiele sposobów. Python Pandas jest bardzo pomocnym językiem do pracy związanej z danymi informacyjnymi. Będziemy używać narzędzia „Spyder” do wdrażania kodów, które jest przyjaznym oprogramowaniem opartym na języku Python. Interpolacja panda można wykonać w różnych metodach, musimy wiedzieć, która praca musimy wykonać. Dzięki tej wiedzy wdrożymy odpowiednio tę metodę, którą będziemy omawiać z pełnymi przykładami i wyjaśnieniami.

Rodzaje pand interpolowane

Poniżej można wykonać trzy sposoby interpolacji panda:

  • Interpolacja liniowa pandy (do przodu, do tyłu, oba, pojedyncza kolumna, oś, wyściółka i wielomian).
  • Interpolacja wielomianowa pandy.
  • Interpolacja panda przez wyściółkę.

Istnieją pewne parametry, które są następujące:

Limit_direction

„Naprzód”, „do tyłu”, „oba”

Kierunek limitu jest domyślnie, ustawiony jako „do przodu”, co oznacza, że ​​jeśli nie określimy metody, pójdzie z metodą interpolacji do przodu.

Tworzenie ramki danych do wdrożenia metody interpolatu pandy

Najpierw skupimy się na tworzeniu „DF” danych „DF”. Zaimportowaliśmy bibliotekę pandy jako „PD”, która jest biblioteką open source do manipulowania danymi. Następnie zaczniemy tworzyć „DF” za pomocą oprogramowania „Spyder”, w którym mamy dane jak w czterech zmiennych o nazwie „W”, „X”, „Y” i „Z”. Wszystkie z nich mają przypisane oddzielne wartości, takie jak „W”, które mają wartości „18”, „5”, „9”, „3”, „Brak”. „X” ma wartości „Brak”, „89”, „4”, „8” i „Brak”. „Y” ma wartości „30”, „Brak”, „7”, „9”, „12”. Podobnie „Z” z wartościami „11”, „Brak”, „66”, „5” i „8”.

Tutaj, w powyższym kodzie, tworzona jest oprawa danych, którą można zapisać jako „DF”. W pierwszym wierszu kodu biblioteka pandy jest importowana jako „PD”. Następnie tworzona jest ramka danych, w której przypisaliśmy zmienne „w”, „x”, „y” i „z”, biorąc pod uwagę każdą z nich pięć przypisanych wartości. „Nan” w kodzie oznacza „nie liczbę”.

Dane wyjściowe pokazuje wartościFrame Data, gdy przypisaliśmy je w kodzie. Istnieją numery seryjne, a następnie zmienne, zrzucające wartości zgodnie z przypisaniem.

Przykład 01: Metoda interpolacji liniowej liniowej pandy

W interpolacji liniowej metoda interpolatu () działa jako punkty w pobliżu lewej i prawej, po dokonaniu oszacowania. Zakłada się, że te punkty leżą w nieznanym punkcie spotkania. Jak wspomniano powyżej w parametrach, jeśli nie określamy parametru, wówczas domyślnie wykonuje on jako metodę interpolatu do przodu. Poniższy kod jest wyraźnym przykładem domyślnego. Tutaj przyjęliśmy zmienne jako „s”, „t”, „u” i „v” z ich wartościami przypisanymi dlaframe. Mimo to, jeśli chcemy sami określić, możemy przejść do tego samego kodu. Po prostu dodaj, po ostatnim wierszu kodu, DF. interpolate () można zapisać z kierunkiem limitu określającym go jako „do przodu”, aby wyglądało: „DF.interpolatu (limit_direction = „do przodu”) ”.

Poniższe dane wyjściowe pokazuje interpolację do przodu powyższego kodu. Jeśli chodzi o podane szczegóły, domyślnie działa jako „interpolacja do przodu”, dlatego t (0) pokazuje wartość zerową.

Przykład 02: Metoda interpolacji liniowej liniowej pandy

Jeśli chcemy wykonać liniową interpolację wsteczną, możemy to zrobić podobnie, jak to zrobiliśmy powyżej w interpolacji do przodu. Tym razem musimy podać kierunek limitu jako „wsteczny”. Tutaj zmienne, nad którymi będziemy pracować dla DF to: „D”, „Q”, „B” i „J” z przypisanymi ich wartościami.

Wyjście metody interpolacji wstecznej () Q (4) jest zerowa z powodu przeprowadzonej metody interpolacji wstecznej.

Przykład 03: Obie liniowe metody interpolacji pandy

Teraz, co, jeśli chcemy zrobić naprzód i do tyłu oba na tym samym kodzie? Jest to możliwe i możemy to zrobić po prostu za pomocą metody interpolacji „obie”. Tutaj, dla „DF”, mamy zmienne „P”, „u”, „o” i „m” z przypisanymi odpowiednimi wartościami.

Następujące dane wyjściowe składa się z metody interpolacji do przodu, jak i do tyłu.

Przykład 04: Metoda interpolacji pand pojedynczej kolumny

Możemy również zastosować metodę interpolatu na jednej kolumnie zgodnie z potrzebami. Do tworzenia ramek danych wykorzystaliśmy zmienne „N”, „M”, „O” i „P” z przypisanymi wartościami. Kolumna „N” jest wybierana z „DF” do wyświetlania metodą interpolate ().

Wyjście tutaj wyświetla interpolację pandy z pojedynczą kolumną.

Przykład 05: Metoda interpolacji pand osi

Czasami, zgodnie z potrzebą, chcemy interpolować według kolumny, a czasem rzędami, aby atrybut „osi” działał najlepiej. Ta funkcja jest ustawiona domyślnie jako kolumna pierwsza, podczas gdy jeśli chcemy interpolować wiersze, musimy jawnie śledzić oś jako 1. „L”, „F”, „I” i „T” są zmiennymi przypisanymi w tym „DF” z ich wartościami odpowiednio.

Wyjście osi interpolatu ():

Przykład 06: Metoda interpolacji wielomianowej pand

W matematyce wielomian jest wyrażeniem, które składa się z nieokreślonych, które są również nazywane zmiennymi i współczynnikami, które wykonują operacje arytmetyczne. W interpolacji istnieją pewne szanse na błędy, które czasami mogą wystąpić tu i tam. Podczas gdy interpolacja wielomianowa jest najlepszą praktyką, jaka jest wykonywana na temat danych serii. Dane pobrane tutaj są szeregowo: „4”, „5”, „6”, „NP. nan ”,„ 8 ”i„ 9 ”kontynuują metodę interpolową wielomianu. NP.NAN jest definiowany jako NP z Biblioteki Panda, a „NAN” jest określane jako „nie liczba”.

Wynik wyświetla wielomianową metodę interpolatu pandy:

Przykład 07: Interpolacja panda z wyściółką

Interpolacja panda z wyściółką jest zdefiniowana odpowiednio jako „pisanie lub kopiowanie wartości przed brakiem”. W tej metodzie należy zwrócić się do specyfikacji limitu. Limit powinien być maksymalna liczba „NANS”, ponieważ będzie to wypełniały w sposób ciągły. Ta metoda działa tylko w kierunku do przodu, a także w danych szeregowych. „DF” dla tej metody jest w serii jako „2”, „3”, „NP. Nan ”,„ 5 ”,„ 6 ”,„ 7 ”i„ 8 ”, kontynuują metodę„ pad ”do wyściółki.

Wyniki wyjściowe pokazują interpolację panda przez „wypełnienie”.

Wniosek

Metoda interpolowa panda jest bardzo wygodną metodą wypełniania „nan” lub brakujących wartości. W tym artykule nauczyliśmy się różnych rodzajów interpolacji w Pandy DataFrame- czy to jest do przodu, do tyłu, czy oba, z osi, wielomianową i na koniec metodą wyściółki. Wszystkie są używane w określonym celu i łatwości użytkowników pracujących nad ogromnymi ilościami danych.