Średnia w r

Średnia w r

Analizy statystyczne są przeprowadzane przy użyciu różnych funkcji wbudowanych w R. Funkcje te są zawarte w pakietach podstawowych R. Aby wygenerować wyniki R wraz z argumentami, wektory są traktowane jako dane wejściowe. Te wbudowane funkcje są wredne, mediany i trybu, ale omówimy tylko średnią w tym poście. Średnia odgrywa ważną rolę, gdy musimy znaleźć, gdzie znajduje się centralna wartość zestawu danych. Średnia zestawu danych przechowuje również informacje o wszystkich danych w zestawie.

Zasadniczo średnia jest zdefiniowana jako suma danych/elementów/obserwacji podzielona przez całkowitą liczbę danych/elementów/obserwacji.

Jaka jest średnia funkcja R w Ubuntu 20.04

Średnia nie może zawierać zarówno znaków numerycznych, jak i danych numerycznych, takich jak tryb. Może generować tylko wyniki jako wartość liczbową. Tryb obliczania jest wbudowaną cechą R, co oznacza, że ​​ma on określoną funkcjonalność w języku programowania R. Te predefiniowane funkcje akceptują wektor jako wejście i dają wynik jako wartość liczbową.

Składnia średniej funkcji jest następująca:

1
Średnie (x, na.RM)

Gdzie x jest wektorem wejściowym i na.RM to wartość logiczna do zignorowania brakujących wartości wektora wejściowego.

Jak oznacza, że ​​R działa w Ubuntu 20.04?

W R, wbudowana średnia funkcja () jest używana do obliczania średniej arytmetycznej elementów wektora numerycznego i pokazuje wynik w formie liczbowej, aby można go było przekazać jako argument.

Pokażemy Ci, jak obliczyć średnią w języku programowania R w Ubuntu 20.04 W tym samouczku. Istnieje wiele przykładów różnych scenariuszy danych.

Przykład nr 1: prosta r wektor

Aby znaleźć średnią wektora, musimy wziąć wektor z danymi liczbowymi. Utwórzmy wektor X, aby nauczyć Cię, w jaki sposób możemy użyć średniej funkcji, gdy musimy znaleźć średnią wektora.

Gdy średnia zostanie zastosowana do wektora x, podsumuje wszystkie wartości w wektorze x i podzieli je przez całkowitą liczbę wartości, która wynosi 9.

Jak widzimy, średnia przyjmuje wektor X jako wejście i generuje wartość liczbową, która wynosi 12.66667. Było to proste, ponieważ w danych nie wiązało się z wartościami zerowymi. Jeśli uwzględniono jakąkolwiek wartość zerową, wynik będzie inny.

Przykład nr 2: Średnia wektora numerycznego o wartości NA w R

Następnie.RM jest opcją używaną do ignorowania wartości zerowych lub NA. Jest to parametr logiczny, który pomaga funkcji zdecydować, czy usunąć wartości Na, czy nie, więc może nie wpływać na wynik po obliczeniach. W funkcji średniej, jeśli na.rm = prawda, eliminuje wartości NA. Następnie.RM nie jest ani operacją, ani funkcją. Jest to parametr używany przez różne funkcje danych ramki.

Aby znaleźć średnią wektora, w którym zaangażowane są wartości NA, możemy spotkać się z typowym problemem.

Po dodaniu wartości NA do wektora x1 przypisaliśmy go do wektora x2, który daje nam następujący wynik:

Wektor x2 wygląda tak samo jak wektor x1. Ale teraz wartość NA jest dodawana na końcu. Gdy zastosujemy średnią do wektora x2, wystąpi następujący problem:

Rezultatem, średnio (x2) zwraca NA, nie jest to, czego się spodziewaliśmy. Jak wspomniano wcześniej, średnia funkcja w R może zawierać tylko dane liczbowe. Ponieważ wartość Na nie jest danymi liczbowymi, NA.RM służy do ignorowania wartości NA, aby uniknąć tego problemu.

Wyraźnie ilustruje, że Na.Opcja RM wyeliminowała problem wartości NA i wygenerowała prawidłową średnią wektora x2, który wynosi 4.625.

Przykład nr 3: Średnia wektora numerycznego z opcją wykończenia

Tak jak Na.RM, Trim jest również parametrem logicznym używanym przez funkcje ramki danych. Ogólnie rzecz biorąc, opcja wykończenia w średniej jest średnia zestawu danych po usunięciu określonego procentu z najmniejszych i największych wartości z zestawu danych. Możesz także powiedzieć, że przed znalezieniem średniej zestawu danych, usunięto określony procent najmniejszych i największych wartości.

Składnia przyciętej średniej jest następująca:

1
średnia (x, trym = 0)

Wypróbujmy 20 -procentowe wykończenie do naszego poprzedniego wektora x1.

Jak widać na poprzednim obrazie, średnia V1 bez wykończenia wynosi 4.625. Ale co, jeśli zastosujemy na nim 20% wykończenia?

Po zastosowaniu wykończenia 20% 20% jest usuwane z największej i najmniejszej wartości zestawu danych, a wartość średnich zmian na 4.8333333.

Przykład nr 4: Średnia w R z przykładowego zestawu danych

Aby zaoferować Ci bardziej realistyczny przykład, zaimplementujemy funkcję średniej do kolumny ramki danych z rzeczywistego zestawu danych. Tutaj wybraliśmy ramkę danych „IRIS”. Najpierw musimy pobrać plik danych, abyśmy mogli zaimplementować średnią funkcję.

Dane (IRIS) pobiera dane z tęczówki.plik CSV do naszej konsoli. Calling the Head () przynosi tytuły głowy do naszych danych IRIS. Zestaw danych jest nam wyświetlany, jak pokazano następująco:

Aby znaleźć średnią pierwszej kolumny z poprzedniej tabeli zestawu danych, można użyć następującego skryptu:

Tak samo jak pierwsza kolumna, możesz również znaleźć wartość średniej dla innych kolumn (i.mi. Sepal.szerokość, płatek.długość i płatek.szerokość). Jak omówiono wcześniej w tym temacie, średnia nie może zawierać danych znakowych. Problem wystąpi, gdy będziemy próbować znaleźć średnią z 5. kolumny, ponieważ w kolumnie gatunków nie ma wartości liczbowej.

Widać, że wynik nie jest dane liczbowe. Zamiast tego pokazuje komunikat ostrzegawczy, że argument nie jest numeryczny ani logiczny.

Wniosek

Po opowieści o tym samouczku powinieneś teraz lepiej zrozumieć średnią. Powinieneś także być w stanie obliczyć średnią za pomocą języka skryptu R w Ubuntu 20.04. Średnia jest jedną z istotnych wskaźników w badaniach statystycznych. Świadomość tego środka może okazać się dla nas pomocne w dalszych badaniach. Jednak zdolność do oceny średniej nie oznacza, że ​​rozumiesz badania statystyczne i zasadę średniej. W R, aby znaleźć średnią zestawu danych, praktycznie zaimplementowaliśmy wiele przykładów średniej z wektorami, parametrami logicznymi i zestawami danych.