Rolling pandy średnie

Rolling pandy średnie

„Funkcja obliczania okna toczy się jest dostarczana przez pandas”.walcowanie().metoda () ”. Średnia określonej liczby poprzednich przedziałów w szeregach czasowych jest znana jako średnia."

Do określenia średniej toczenia dla pojedynczych lub wielu kolumn w PandaS DataFrame można użyć następującej składni:

Zbadamy różne techniki, aby zastosować tę metodę w tej lekcji.

Przykład 1

Na tej ilustracji wykorzystamy pandy „DF.walcowanie().Metoda oznaczania () ”do obliczenia średniej toczenia pojedynczej kolumny.

Najpierw musimy uzyskać wymagania dotyczące kompilacji kodu. Potrzebujemy oprogramowania, które zapewnia nam środowisko obsługiwane przez Python, aby skompilować nasz skrypt Python. Zainstalowaliśmy narzędzie „Spyder” w naszym systemie. Po uruchomieniu narzędzia możemy uzyskać dostęp do interfejsu.

Począwszy od programu, początkowo musimy załadować niezbędną bibliotekę. Metoda „Rolling ()”, na której opiera się nasz artykuł, jest funkcja pandas. Aby użyć tej metody w naszym programie, musimy zaimportować bibliotekę „Pandy” i utworzyć „PD” jako alias dla „pandy”.

Po osiągnięciu warunków wstępnych musimy wygenerować pankazę danych pandas za pomocą „PD.Moduł dataFrame () ”dostarczony przez pandach narzędzi. „PD.Metoda dataFrame () ”jest wywoływana z 4 kolumnami, które określaliśmy jako„ lato ”,„ zima ”,„ jesień ”i„ wiosna ”. Każda kolumna przechowuje 8 wartości. Zidentyfikowane wartości kolumny „Summer” to „200”, „130”, „280”, „100”, „270”, „360”, „120” i „311”. Kolumna „zimowa” ma te wartości „12”, „34”, „54”, „67”, „98”, „45”, „78” i „43”. Trzecia kolumna „Autumn” ma wartości jako „12”, „13”, „42”, „32”, „71”, „61”, „77” i „89”. W kolumnie „Spring” wartości to „10”, „29”, „78”, „44”, „76”, „55”, „32” i „22”.

„PD.DataFrame () ”, po wywołaniu, konstruuje ramkę danych przy użyciu tych dostarczonych wartości. Następnie potrzebuje miejsca do przechowywania, w którym może umieścić tę ramkę danych do późniejszego użycia. Nowo utworzona ramka danych jest teraz dostępna, wspominając o obiekcie „sezon”. Kolejnym wymogiem jest pokazanie tej formy danych na ekranie, abyśmy mogli go poprawnie zobaczyć. W tym celu zastosowaliśmy metodę „print ()” Pythona. Pomiędzy jego nawiasami dostarczamy wejście, które należy wyświetlić. Tutaj podaliśmy obiekt „sezonu” jako wejście do metody „print ()” do wyświetlania jej zawartości.

Aby wykonać wyżej wymieniony skrypt, musimy nacisnąć opcję „Uruchom plik”; Alternatywnie możesz również nacisnąć klawisze „Shift+Enter” razem, aby uruchomić kod. To daje nam ramkę danych z 4 kolumnami i 8 wierszy. Lista indeksu rozpoczyna się od „0” domyślnie i kończy się na „7”.

Teraz będziemy wykonywać metodę „Rolling ()” Pandy, aby obliczyć szacunkowe toczenie pojedynczej kolumny w dostarczonej ramce danych. Dowiedzmy się, jak to zdobyć.

Przywołaliśmy „DF.Metoda Rolling () ”. Nazwa nazwy danych „sezon” z „.Metoda Rolling () ”jest napisana. Ponieważ chcemy uzyskać okno toczące się do obliczenia średniej Rolling z jednej kolumny, musimy określić nazwę kolumny o nazwie DataFrame. Kolumna, którą tutaj wybraliśmy, to kolumna „Summer” z „sezonu”. Pomiędzy okrągłymi nawiasami metody „Rolling ()”, mamy zdefiniowaną wartość „3”. Oznacza to, że chcemy obliczyć toczenie kolumny „letniej”.

„„.Funkcja Mean () ”obliczy średnią 3-dniowe rzucenie„ Lato ”. Chcemy przechowywać tę szacunkową sedno kolumny „letniej” w nowej kolumnie. Tak więc, aby utworzyć nową kolumnę, napisaliśmy nazwę DataFrame, operator indeksowy, a następnie nową nazwę kolumny jako „Summer_rolling”. Przydzieliliśmy to w wyniku „sezonu [„ Summer ”].Rolling (3).Mean () ”funkcja. Stąd średnia na 3 dni wartości kolumny „letniej” zostanie zapisana w kolumnie „Summer_rolling”. Na koniec wydrukuj ramkę danych, wywołując metodę „print ()”.

W plonowym migawce możemy zobaczyć, że pierwsze dwa wpisy, które otrzymujemy, są wartościami zerowymi. Wynika to z faktu, że nie możemy oszacować średniej toczenia, ponieważ można go obliczyć tylko wtedy, gdy mamy 3-dniowe okno, ale dla dwóch pierwszych rekordów nie mamy żadnych poprzednich wartości do wypełnienia określonych okien; Stąd wartości NAN są zwracane. W 3r & D Row, otrzymujemy wartość „203.333333 ”, co jest średniego toczenia na 3 dni.

Przykład nr 2

Nauczyliśmy się znajdować średniej kroczące jednej kolumny w pandas DataFrame. Średnia toczenia można również obliczyć dla wielu kolumn. W przypadku wielu kolumn musimy odróżnić metodę przechyłkowania osobno dla każdej kolumny.

Wykonamy metodę toczenia na wcześniej wygenerowanej ramce danych, aby oszacować średnią toczącego się wielu kolumn. „DF.walcowanie().Metoda „” () ”jest wywoływana. Przywołaliśmy tę metodę dwa razy, ponieważ chcemy obliczyć średnią toczenia dla dwóch kolumn. Pierwszy „Rolling ().metoda Mean () ”nazywana jest nazwa DataFrame i Nazwa kolumny jako„ Sezon [„Summer”] ”, a wartość dla dni toczenia jest określona„ 4 ”.

Aby przechowywać obliczoną średnią toczenia w innej kolumnie, zainicjowaliśmy kolumnę „Summer_rolling”. Oznacza to, że chcemy obliczyć środę toczącego się na 4-dniowe okno kolumny „Summer” i przechowywać wynik w kolumnie „Summer_rolling”. Następnie zatrudniliśmy 2Nd „DF.walcowanie().metoda () ”. Kolumna, którą tutaj wybraliśmy, to „jesień”, a okno toczenia jest określone jako „4”. Aby zapisać obliczenia, utworzyliśmy kolumnę „Autumn_rolling” w istniejącym „sezonie” danych „Sezon”. Metoda „print ()” wyświetli ostateczne wyjście na konsoli Python.

Na ekranie wyjściowym można zbadać, że do DataFrame dodano 2 nowe kolumny. Kolumny „Summer_rolling” i „Autumn_rolling” zawierają szacunkową środę toczące się odpowiednio dla kolumn „Summer” i „Autumn”. Pierwsze 3 wartości w obu kolumnach to NAN, ponieważ nie mają wystarczającej liczby wpisów, aby ukończyć 4-dniowe okno, aby obliczyć średnią toczącą. Z 4th Wpis, otrzymuje swoją pierwszą wartość średniej toczenia.

Przykład nr 3

Średnia tocząca się całej kolumny w ramce danych jest obliczana za pomocą pand „DF.walcowanie().metoda Mean () ”jako ostatni krok.

Aby obliczyć średnię toczącego wszystkich kolumn, nie musimy wspominać nazwy żadnej kolumny. Przywołaliśmy „DF.walcowanie().Mean () ”funkcja, po prostu dostarczając nazwę DataFrame jako„ sezon ”i wartość dla okna toczenia jako„ 5 ”. Aby zachować wynik, stworzyliśmy zmienną „wynik”. „Rolling ().Metoda Mean () ”obliczy średnią przechyłkową„ Sezon ”, biorąc 5-dniowe okno i przechowując wynik w kopii DataFrame za pomocą zmiennej„ Wynik ”. Wykorzystaliśmy metodę Pythona „print ()” do wykazania nowej ramki danych.

To daje nam ramkę danych z szacunkową środkiem toczącego dla 5-dniowego okna.

Wniosek

Obliczanie średniej toczenia dla określonego okna w ramce danych to proste podejście. Wykorzystaliśmy pandy „DF.walcowanie().metoda oceny średniej () ”do oszacowania średniej w tym samouczku. Omówiono trzy różne strategie w celu znalezienia średniej toczenia w ramce danych. Pierwsza ilustracja oparta jest na obliczaniu średniej toczenia pojedynczej kolumny, 2Nd Przykład daje pomysł obliczenia średniej toczenia dla wielu kolumn, a ostatnia instancja krótko przeszła do znalezienia średniej toczenia wszystkich kolumn obecnych w ramce danych. Wszystkie techniki zostały praktycznie wdrożone na narzędziu Spyder.