Pudownia w r

Pudownia w r
„Pudownia, powszechnie znana jako wykres pudełka i wąsów, jest rodzajem wykresu w R. Jest to graficzne przedstawienie, które pozwala podsumować podstawowe funkcje danych i ustalić, czy istnieją jakiekolwiek wartości odstające. Kupplot może być również użyty do porównania rozproszenia w gromadzeniu danych, generując pudełko dla każdego. Ocena zakresów jest łatwa za pomocą wykresu pudełkowego. Ponieważ wszystkie centralne, rozproszone i ogólne zakresy są od razu widoczne.

Pudełkowe wykresy to rodzaj wykresu, który pokazuje, w jaki sposób jednolite dane są rozproszone w zestawie danych. Zestaw danych jest podzielony na trzy kwartyle w wyniku tego. Ten wykres przedstawia minimalne, maksymalne, średnią, średnią, drugą i trzecim kwartyle.

Pudełko pudełkowe rozpoczyna się w pierwszym kwartylu (25 procent) i kończy się w trzecim (75 procent). W rezultacie pudełko odzwierciedla połowę (50 procent) danych środkowych przez linię wskazującą średnią. Pomimo składników wartości odstających w ramach, podział jest ukształtowany po obu stronach pudełka na najwyższe dane, jeśli istnieją, będzie reprezentowany przez koła.

Ten samouczek uczy cię, jak korzystać z R do tworzenia wykonywanych wykresów."

Tworzenie pudełka w R

Wykres pudełkowy i wąsów można utworzyć za pomocą funkcji R „BoxPlot ()”. Do tworzenia tego wykresu można użyć różnych wejść, w tym wektory i ramki danych. Na wykresie równoważnym możesz również wprowadzić formułę jako wejście przy tworzeniu wykresów skrzynkowych dla wielu grup.

Tworzenie pudełka za pomocą wektora w R

Jeśli chcesz utworzyć wykres pudełkowy w R z wektora, po prostu przejdź wektor do funkcji „boxplot ()”.

Tutaj utworzyliśmy wektor „s” i przypisaliśmy go lista wartości numerycznych. Korzystając z funkcji „BoxPlot ()”, przekaż ten wektor „S” jako parametr. Pudełka w R jest domyślnie ustawiona na pionową, ale jeśli chcesz zmienić go na poziome, możesz to zrobić, ustawiając wyrażenie „horyzontalne” „prawdziwe."

Pozioma wykres pudełka utworzona z wektora jest wyświetlana poniżej.

Należy pamiętać, że wykresy pudełkowe zaciemniają dystrybucję danych. Aby rozwiązać ten problem, funkcję „stripchart ()” w R może być użyta do wstawienia kropek do pudełka.

Tutaj zastosowaliśmy metodę „Jitter.„PCH” oznacza postacie fabuły. Domyślne „PCH” w R to 1, które tworzy puste koło, podczas gdy „PCH = 19” oznacza solidne kółka. Więc użyliśmy solidnych kółek o pomarańczowym kolorze. Wartości odstające nie zostaną przepełnione, jeśli punkty danych zostaną podtięgowane.

Tworzenie pudełka za pomocą „Notch” w R

Możemy również zrobić pudełko z wycięciem w R. Pomaga nam w ustaleniu, jak dobrze mediany różnych grup danych oddziałują ze sobą. Określając argument Notch do True, możesz zilustrować 95 -procentowe przedziały ufności dla mediany w REKPLOT R. Pudełko reprezentuje górne i dolne granice, podczas gdy linia środkowa może zobaczyć medianę.

„Wycięcie” lub kurczenie się pudełka jest wykorzystywane wokół mediany na wyciętych działkach pudełkowych. Notches może pomóc w określeniu znaczenia rozbieżności w medianach. Jeśli nie ma nakładania się na notowanie 2 pudełek, istnieje duża szansa, że ​​mediany nie są takie same.

Pudownia wyciągnięta z „wycięcia” jest reprezentowana poniżej.

Tworzenie pudełka za pomocą zestawu danych w R

Aby utworzyć pudełko w R, możesz również użyć zestawów danych w funkcji „boxplot ()”. W tym przypadku użyjemy wbudowanego zestawu danych dostarczonej bazy R."

Tutaj możesz zobaczyć zestaw danych w tabeli „kurczewa”. Zawiera 4 kolumny, czas, czas, laska i dieta. Wszystkie kolumny mają w sobie przechowywane wartości liczbowe.

Wybierzemy 2 kolumny, i.mi., waga i dieta z zestawu danych. Korzystając z funkcji „BoxPlot ()”, narysujemy BOXPLOTS dla wybranej daty.

W powyższym kodzie zaprojektowaliśmy wykres „wagi” w stosunku do „diety.„Określiliśmy nazwy zmiennych o nazwie zestawu danych. Wewnątrz aparatów ortodontycznych funkcji „boxplot ()” użyliśmy nazwy DataFrame „Chick wweight”, operatora „$” do określenia kolumny i nazwy kolumny „waga”, a następnie kolumna z nazwąFrame „ChickWeight $ diet $ diet $ diet."

Wynikowy wykres pudełkowy wyraźnie pokazuje dyspersję Outlinera.

Aby ten wykres pudełkowy wizualnie był lepszy i bardziej szczegółowy, możesz dodawać kropki. Możesz to osiągnąć za pomocą funkcji „Stripchart ()”.

Możesz zobaczyć kropki, które utworzyliśmy, aby pokazać niezbędny podział danych w każdymplot pola.

Tworzenie wielu pudełek w R

Tworzenie wielu wykresów to kolejna technika, której można użyć w programowaniu R. Aby zaimplementować tę metodę, używamy wbudowanego zestawu danych w bazie R.

Zestaw danych, którego tu użyliśmy, to „drzewa” dostarczone przez R Base. Możemy również dodać kolory do pudełka. W funkcji „Boxplot ()” ustawiamy kolor „Col” jako „Rainbow”, który umieści różne kolory dla każdego wykresu bokserskiego.

Jeśli chcesz wykreślić odrębny pupplot dla każdej kolumny w ramce R, możesz to zrobić za pomocą funkcji „Lapply ()”.

W tym przykładzie podzielimy grafikę „par” na wiersz, a także liczbę kolumn w zestawie danych. Z drugiej strony można wykreślić poszczególne wykresy. Funkcja „Invisible ()” zapobiega widocznej widocznej tekstu funkcji „Lapply”.

Poniższy obraz pokazuje pudełko utworzone dla każdej kolumny danych indywidualnie.

Wniosek

Programowanie R zapewnia różnorodne operacje, które można wykonać. Tworzenie pudełka to kolejna przydatna i prosta metoda do wizualnego wyświetlania danych na wykresach. W tym artykule omówiliśmy, czym są wykresy i jak wyświetlają dane. Wyjaśniliśmy cztery różne techniki, których można użyć do rysowania wykresów w R, przy użyciu RStudio w Ubuntu 20.04. W tym za pomocą prostych wektorów do tworzenia wykresów pudełkowych, wykorzystanie „Notch”, za pomocą DataFrame, a także tworzenie wielu wykresów bokserskich. Wykazaliśmy każdą metodę, opracowując różne przykłady kodów. Dzięki temu nauka R do tworzenia wykonywanych wykresów.