Skumulowane pand

Skumulowane pand
Standardowa wzór matematyki do obliczenia skumulowanego odsetka jest obliczanie kumulatywnej suma dla każdej wartości w kolumnie i dzielą skumulowaną sumę każdej komórki w kolumnie przez sumę matematyczną wszystkich wartości w kolumnie, a następnie pomnożenie go ze 100. Pytanie brzmi teraz, jak to osiągnąć w Pythonie za pomocą pandy.

Ten artykuł został zaprojektowany tak, aby dowiedzieć się, jak znaleźć skumulowane odsetki w Python za pomocą pandy. Zacznijmy od podstawowej formuły lub składni skumulowanego procentu, a następnie przejdź dalej.

Jaka jest składnia skumulowanego procentu?

Poniżej znajduje się składnia skumulowanego odsetka, którą można przestrzegać.

Skumulowane pand

Ramki danych Pandas w Pythonie zapewniają dwie predefiniowane funkcje, sum. Funkcja sum () służy do obliczenia suma wszystkich wartości w kolumnie, a funkcja cumsum () jest używana do obliczenia kumulatywnej suma każdej wartości w kolumnie.

W jaki sposób funkcja cumsum () działa w celu obliczenia kumulatywnej suma w Pythonie?

Cumsum () to wbudowana ramka danych Pythona używana do obliczenia skumulowanej suma elementów tablicy. Zajmuje tablicę jako dane wejściowe i oblicza sekwencję częściowych sum lub, innymi słowy, suma bieżącego. Głównym celem obliczania kumulatywnej sumy jest aktualizacja sumy zestawu danych za każdym razem, gdy do zestawu danych dodawana jest nowa wartość.

Istnieje pięć kroków, które należy wykonać, aby obliczyć sumę skumulowaną z panami w Pythonie, a oto one:

  1. Utwórz ramkę danych lub podaj szereg danych, które chcesz obliczyć skumulowany procent.
  2. Oblicz sumę skumulowaną za pomocą wbudowanej funkcji cumsum ().
  3. Oblicz sumę tablicy za pomocą funkcji wbudowanej sum ().
  4. Podziel obliczoną wartość cumsum () według wartości obliczonej sum ().
  5. Pomnóż każdą obliczoną wartość przez 100, a wynikową wartością będzie skumulowany procent określonej wartości w tablicy.

Zobaczmy teraz kilka przykładów, aby zrozumieć, w jaki sposób cumsum () i sum () pracują nad obliczeniem skumulowanego procentu kolumny za pomocą ramki danych pandas w Pythonie.

Przykład 1:
W pierwszym przykładzie zaczniemy obliczać skumulowaną sumę tylko jednej kolumny, aby łatwo zrozumieć tę funkcję. Najpierw utwórz ramkę danych jako „data_frame” i podaj wartości potrzebne do obliczenia kumulatywnej sumy, a następnie przejdź parametr „data_frame” do PD.DataFrame () podczas określenia wartości kolumny i na koniec użyj funkcji wbudowanych cumsum () i sum (), aby obliczyć skumulowany procent.

importować pandy jako PD
importować Numpy jako NP
data_frame =
„Names”: [„ab”, „bc”, „cd”, „de”, „ef”, „fg”, „gh”],
„MathScore”: [152 187,149,174,128,159,148]
data_frame = pd.DataFrame (data_frame, kolumns = ['name', 'MathScore'])
data_frame ['cum_per'] = 100*(data_frame.MathScore.cumsum () / data_frame.MathScore.suma())
ramka danych

Oto dane wyjściowe powyższego kodu:

Przykład 2:
W tym przykładzie pokażemy ci skumulowaną sumę na każdym kroku. Kod jest dokładnie taki sam jak powyższy przykład, z pewnymi drobnymi modyfikacjami do wydrukowania kumulatywnej suma na każdym etapie. Zobacz przykładowy kod podany poniżej:

importować pandy jako PD
importować Numpy jako NP
data_frame =
„Names”: [„ab”, „bc”, „cd”, „de”, „ef”, „fg”, „gh”],
„MathScore”: [152 187,149,174,128,159,148]
data_frame = pd.DataFrame (data_frame, kolumns = ['name', 'MathScore'])
data_frame [„Sumulative Sum”] = data_frame.MathScore.cumsum ()
_sum = data_frame.MathScore.suma()
data_frame ['cumulative%'] = 100*(cum_sum / _sum)
ramka danych

Oto wyjście. Należy zauważyć, że suma skumulowana jest pokazana w kolumnie każdej wartości „Sum”. A suma wszystkich wartości wynosi 1097. Zobacz ostatni wiersz wyjścia.

Przykład 3:
Widzieliśmy, jak obliczyć skumulowany procent jednej kolumny jednocześnie. Zobaczmy teraz, jak obliczyć sumę dwóch kolumn jednocześnie. Procedura wykonuje te same kroki, co powyższe przykłady.

Najpierw musisz utworzyć ramkę danych, a następnie podać kolumny, w których musisz obliczyć sumę skumulowaną. Następnie znajdź sumę i skumulowaną sumę odpowiednio z wbudowaną funkcją sum () i cumsum () i pomnóż wartości przez 100. Teraz wydrukuj wartości w ramce danych, aby zobaczyć wyjście. Kod podano poniżej:

importować pandy jako PD
importować Numpy jako NP
data_frame =
„Names”: [„ab”, „bc”, „cd”, „de”, „ef”, „fg”, „gh”],
„MathScore”: [152 187,149,174,128,159,148],
„EnglishScore”: [134,167,125,189,192,145,186]
data_frame = pd.DataFrame (data_frame, kolumns = [„Names”, „MathScore”, „EnglishScore”])
data_frame ['cum matematyka suma'] = data_frame.MathScore.cumsum ()
data_frame ['cum eng sum'] = data_frame.Angielski Korator.cumsum ()
Msum = data_frame.MathScore.suma()
Esum = data_frame.Angielski Korator.suma()
data_frame ['McUmulative%'] = 100*(cum_sum / msum)
data_frame ['ecumulative%'] = 100*(data_frame ['cum eng sum'] / esum)
ramka danych

Wyjście powyższego kodu jest następujące:

Przykład 4:
W tym przykładzie wyjaśnimy, jak poradzić sobie z wartościami „nan” w tablicy? I jak cumsum () radzi sobie z wartościami „nan” w ramce danych. Początkowe kroki są takie same jak te podane w przykładach; Jednak dodatkowe kroki podano poniżej w kodzie:

importować pandy jako PD
importować Numpy jako NP
data_frame = pd.Ramka danych(
„Names”: [„ab”, „bc”, „cd”, „de”, „ef”, „fg”, „gh”],
„MathScore”: [152 187,149,174,128,159,148],
indeks = [„1”, „2”, „3”, „4”, „5”, „6”, „7”])
print (data_frame)

Wyjście pokaże teraz kolumnę indeksu:

Jeśli zauważysz, do ramki danych dodano dodatkową kolumnę „indeks”. Następnym krokiem jest znalezienie skumulowanej suma, którą obliczyliśmy w powyższych przykładach.

data_frame [„Sumulative Sum”] = data_frame.MathScore.cumsum ()
print (data_frame)

Oto skumulowana suma przed podaniem wartości „nan”:

Następnie upuśćmy jedną wartość w tablicy i zastąpmy ją wartością „nan”. Spójrz na poniższy kod, aby odkryć, jak zastąpić wartość „nan”.

data_frame = data_frame.upuść („suma skumulowana”, oś = 1)
ramka danych.loc ['3', 'matemscore'] = np.Nan
print (data_frame)

Jak widać na poniższym wyjściu, że wartość na indeksie 3 jest zastąpiona „nan”:

Obliczmy ponownie sumę skumulowaną, aby zobaczyć, jak cumsum () reaguje na wartość „nan” w tablicy.

data_frame [„Sumulative Sum”] = data_frame.MathScore.cumsum ()
print (data_frame)

Oto dane wyjściowe nowej sumy skumulowanej.

Jeśli zauważysz, że cumsum () zignorował „nan” i obliczył skumulowaną sumę wszystkich innych wartości. Ponadto całkowita wartość jest również inna, ponieważ jedna wartość w tablicy jest „nan” i nie przyczynia się do całkowitej wartości.

Wniosek:

Ten artykuł ma na celu dowiedzieć się, jak znaleźć skumulowany odsetek z ramą danych pandas w Python. Najpierw omówiliśmy podstawową formułę matematyczną skumulowanego procentu, a następnie widzieliśmy dwie wbudowane funkcje Pythona, cumsum () i sum (), aby znaleźć skumulowany odsetek w pandach w Python. Suma skumulowana jest sumą sekwencji częściowych sum. Za pomocą przykładów pokazaliśmy, jak użyć funkcji Cumsum () i sum ().