Kwantyl w r

Kwantyl w r

Przed skonstruowaniem jakichkolwiek algorytmów uczenia maszynowego na zestawie danych niezbędna jest wniosek o analizie statystycznej. Uzyskanie wniosków statystycznych z danych jest również częścią tego procesu. W statystykach kilka kluczowych pojęć opisuje zmienność zmiennej numerycznej. Niniejsze Warunki to IQR, kwartyle, kwantyle, średnia i mediana. Pomagają w identyfikacji wszelkich anomalii w kolumnie i rozkładu kolumny. Ten post służy do określenia kwantylu kolumny. Zmienność danych jest mierzona za pomocą funkcji kwantowych. Po sortowaniu danych możesz użyć kwantyli do podziału liczb w danym rozkładowi na równe podgrupy. Możemy łatwo obliczyć kwantyle w R za pomocą funkcji kwantylowej, która zwraca wszystkie kwantyle 0%, 25%, 50%, 75%i 100%.

Kwantyle w języku programowania r w Ubuntu 20.04

Quantile to funkcja ogólna, która generuje kwantyle próbki dla określonych prawdopodobieństw. Prawdopodobieństwo 0 odpowiada najmniejszej obserwacji, podczas gdy prawdopodobieństwo 1 odpowiada największemu. Tam mamy składnię dla kwantyli używanych w języku programowania R.

1
Quantile (x, probs = seq (0, 1, 1/4), na.rm = false, nazwy = true, typ = 5, cyfry = 5,…)

Poniżej znajduje się opis poprzedniego argumentu przekazanego w funkcji kwantowej:

X: Element kategorii, dla której określono funkcję, lub wektor numeryczny, w którym wymagane są kwantyle próbki. Chyba że na.RM jest „prawdziwe”, Na wartości NA i NAN nie mogą być używane w wektorach numerycznych.

probs: Prawdopodobieństwo z wartościami w wektorze numerycznym; Wartości poza tym zakresem do „2E-14” są rozpoznawane i przenoszone do następującego najbliższego punktu końcowego.

na.Rm: Jeśli prawda, jakiekolwiek wartości Na i Nan w x są eliminowane przed oceną kwantyli.

Nazwy: W przypadku prawdziwego funkcji zawiera atrybut nazwy. Ustawione na „false”, aby skrócić czas potrzebny na rozwiązanie problemu z dużą liczbą zmiennych.

Cyfry: W przypadku prawdziwych wdrożyć precyzję, aby wykorzystać procenty formatowania. Wewnętrznie, w wersjach R przed 4.0.X, zostało to ustawione na maks. (2, getOption („cyfry”)).

Ten artykuł nauczy Cię, jakie są kwantyle i jak je obliczyć w R (kwartyle, okt., Decyle i percentyle). Aby uzyskać kwantyle próbki dla zestawu danych, użyj narzędzia kwantyle () w R.

Przykład 1: Korzystanie z prostej funkcji kwantycznej do wektorów dojazdowych w R w Ubuntu 20.04

Spójrzmy, jak działa funkcja kwantowa w R z prostym przykładem, który generuje kwantyle wprowadzania danych. Musimy utworzyć dane do zastosowania funkcji kwantycznych. Tutaj zdefiniowaliśmy zmienne dane w środku, które zawierają dane wektora. Następnie stosuje się funkcję kwantową, w której przekazaliśmy wcześniej określone dane wraz z deklarowaną sekwencją. Podczas wykonywania tego polecenia funkcji kwantylowej otrzymaliśmy kwantyle wektorów, jak pokazano w następującym wierszu R:

W poniższej monitu R ponownie wykorzystaliśmy funkcję kwantową do obliczania decyle. W tym celu przekazaliśmy sekwencję 0, 1 i ¼.

Tutaj oceniliśmy zainteresowanie losowymi kwantami. Ustawiliśmy dane w argumencie PROBS, jednocześnie pokazując wyjście percentyla. Należy zauważyć, że funkcja kwantylowa podzieliła dane na równe porcje, przy czym mediana służy jako środek, pozostała dolna połowa służy jako dolny kwartyl, a wyższa połowa służy jako górny kwartyl.

Przykład 2: Korzystanie z funkcji kwantyli do obliczania kolumny w ramce danych w R w Ubuntu 20.04

Możemy również znaleźć kwantyl danej kolumny z ramki danych. Zdefiniowaliśmy dane w funkcji ramki danych w następującym skrypcie R. Wygenerowaliśmy listy z nazwami „List1”, „List2” i „List3” o losowych wartościach liczbowych.

Następnie wywołaj funkcję kwantową i wprowadzić nazwę kolumny z symbolem „$”, tak jak określono „$ list3” dla kwantów. Jak widać, funkcja kwantowa umieszcza wartości wejściowe w kolejności rosnącej.

Możemy użyć funkcji sapply (), jak pokazano w wierszu r, jeśli chcemy ocenić kwantyle wielu kolumn jednocześnie. Przeszliśmy opcję funkcji (x) w funkcji Sapply wraz z funkcją kwantylową, która ma parametry x i probs. Wyjście z tej funkcji wyświetla wszystkie kwantyle kolumn jednocześnie.

Przykład 3: Korzystanie z funkcji kwantyli i obsługa błędu NAN w R w Ubuntu 20.04

NANS można znaleźć w prawie każdej sytuacji. Te NANS, znane również jako brakujące wartości, stają się coraz bardziej powszechne w dzisiejszym cyfrowym świecie. Jeśli dane zawierają te brakujące liczby, wyjście może zawierać NANS lub błędy. Mamy również dane wektorowe, które zawierają niektóre wartości NA o nazwie dane wektorowe w funkcji kwantowej. Wyjątek jest rzucany przez kompilator R pokazany poniżej:

Możemy usunąć ten błąd za pomocą parametru kwantowego na.Rm. Musimy ustawić NA.Wartość RM do „True”, która pomaga nam wyeliminować ten wyjątek NANS. Jak widać na wyjściu, otrzymaliśmy wartości percentyla i pomyślnie usunęliśmy wartości Na.

Przykład 4: Korzystanie z funkcji kwantyli z parametrem Probs w R w Ubuntu 20.04

Istnieje również opcja „probs”, która pozwala określić wymagane percentyle. Argument PROBS, znany również jako argument „prawdopodobieństwa”, powinien wynosić od 0 do 1. Wewnątrz następującego skryptu R użyliśmy opcji PROP z wartościami 33 i 66 w funkcji kwantowej. Wyjście ma komunikat o błędzie, że PROBS są poza zakresem.

Podczas ustawiania opcji ProbS w zakresie 0 i 1, pokazuje wartości percentylowe, a nie wartości fałszywe.

Wniosek

Staraliśmy się dołożyć wszelkich starań, aby opisać i zbadać funkcję R kwant () w kilku wymiarach przy użyciu różnych przykładów. Forma kwantowa jest najcenniejszą funkcją w analizie danych, ponieważ wydajnie pokazuje dodatkowe dane dotyczące określonych informacji. Zilustrowaliśmy niektóre przykłady pokazujące wyraźne działanie funkcji kwantycznej. Mam nadzieję, że teraz rozumiesz funkcję R Quantile () R.