Pudełkowe wykresy to rodzaj wykresu, który pokazuje, w jaki sposób jednolite dane są rozproszone w zestawie danych. Zestaw danych jest podzielony na trzy kwartyle w wyniku tego. Ten wykres przedstawia minimalne, maksymalne, średnią, średnią, drugą i trzecim kwartyle.
Pudełko pudełkowe rozpoczyna się w pierwszym kwartylu (25 procent) i kończy się w trzecim (75 procent). W rezultacie pudełko odzwierciedla połowę (50 procent) danych środkowych przez linię wskazującą średnią. Pomimo składników wartości odstających w ramach, podział jest ukształtowany po obu stronach pudełka na najwyższe dane, jeśli istnieją, będzie reprezentowany przez koła.
Ten samouczek uczy cię, jak korzystać z R do tworzenia wykonywanych wykresów."
Tworzenie pudełka w R
Wykres pudełkowy i wąsów można utworzyć za pomocą funkcji R „BoxPlot ()”. Do tworzenia tego wykresu można użyć różnych wejść, w tym wektory i ramki danych. Na wykresie równoważnym możesz również wprowadzić formułę jako wejście przy tworzeniu wykresów skrzynkowych dla wielu grup.
Tworzenie pudełka za pomocą wektora w R
Jeśli chcesz utworzyć wykres pudełkowy w R z wektora, po prostu przejdź wektor do funkcji „boxplot ()”.
Tutaj utworzyliśmy wektor „s” i przypisaliśmy go lista wartości numerycznych. Korzystając z funkcji „BoxPlot ()”, przekaż ten wektor „S” jako parametr. Pudełka w R jest domyślnie ustawiona na pionową, ale jeśli chcesz zmienić go na poziome, możesz to zrobić, ustawiając wyrażenie „horyzontalne” „prawdziwe."
Pozioma wykres pudełka utworzona z wektora jest wyświetlana poniżej.
Należy pamiętać, że wykresy pudełkowe zaciemniają dystrybucję danych. Aby rozwiązać ten problem, funkcję „stripchart ()” w R może być użyta do wstawienia kropek do pudełka.
Tutaj zastosowaliśmy metodę „Jitter.„PCH” oznacza postacie fabuły. Domyślne „PCH” w R to 1, które tworzy puste koło, podczas gdy „PCH = 19” oznacza solidne kółka. Więc użyliśmy solidnych kółek o pomarańczowym kolorze. Wartości odstające nie zostaną przepełnione, jeśli punkty danych zostaną podtięgowane.
Tworzenie pudełka za pomocą „Notch” w R
Możemy również zrobić pudełko z wycięciem w R. Pomaga nam w ustaleniu, jak dobrze mediany różnych grup danych oddziałują ze sobą. Określając argument Notch do True, możesz zilustrować 95 -procentowe przedziały ufności dla mediany w REKPLOT R. Pudełko reprezentuje górne i dolne granice, podczas gdy linia środkowa może zobaczyć medianę.
„Wycięcie” lub kurczenie się pudełka jest wykorzystywane wokół mediany na wyciętych działkach pudełkowych. Notches może pomóc w określeniu znaczenia rozbieżności w medianach. Jeśli nie ma nakładania się na notowanie 2 pudełek, istnieje duża szansa, że mediany nie są takie same.
Pudownia wyciągnięta z „wycięcia” jest reprezentowana poniżej.
Tworzenie pudełka za pomocą zestawu danych w R
Aby utworzyć pudełko w R, możesz również użyć zestawów danych w funkcji „boxplot ()”. W tym przypadku użyjemy wbudowanego zestawu danych dostarczonej bazy R."
Tutaj możesz zobaczyć zestaw danych w tabeli „kurczewa”. Zawiera 4 kolumny, czas, czas, laska i dieta. Wszystkie kolumny mają w sobie przechowywane wartości liczbowe.
Wybierzemy 2 kolumny, i.mi., waga i dieta z zestawu danych. Korzystając z funkcji „BoxPlot ()”, narysujemy BOXPLOTS dla wybranej daty.
W powyższym kodzie zaprojektowaliśmy wykres „wagi” w stosunku do „diety.„Określiliśmy nazwy zmiennych o nazwie zestawu danych. Wewnątrz aparatów ortodontycznych funkcji „boxplot ()” użyliśmy nazwy DataFrame „Chick wweight”, operatora „$” do określenia kolumny i nazwy kolumny „waga”, a następnie kolumna z nazwąFrame „ChickWeight $ diet $ diet $ diet."
Wynikowy wykres pudełkowy wyraźnie pokazuje dyspersję Outlinera.
Aby ten wykres pudełkowy wizualnie był lepszy i bardziej szczegółowy, możesz dodawać kropki. Możesz to osiągnąć za pomocą funkcji „Stripchart ()”.
Możesz zobaczyć kropki, które utworzyliśmy, aby pokazać niezbędny podział danych w każdymplot pola.
Tworzenie wielu pudełek w R
Tworzenie wielu wykresów to kolejna technika, której można użyć w programowaniu R. Aby zaimplementować tę metodę, używamy wbudowanego zestawu danych w bazie R.
Zestaw danych, którego tu użyliśmy, to „drzewa” dostarczone przez R Base. Możemy również dodać kolory do pudełka. W funkcji „Boxplot ()” ustawiamy kolor „Col” jako „Rainbow”, który umieści różne kolory dla każdego wykresu bokserskiego.
Jeśli chcesz wykreślić odrębny pupplot dla każdej kolumny w ramce R, możesz to zrobić za pomocą funkcji „Lapply ()”.
W tym przykładzie podzielimy grafikę „par” na wiersz, a także liczbę kolumn w zestawie danych. Z drugiej strony można wykreślić poszczególne wykresy. Funkcja „Invisible ()” zapobiega widocznej widocznej tekstu funkcji „Lapply”.
Poniższy obraz pokazuje pudełko utworzone dla każdej kolumny danych indywidualnie.
Wniosek
Programowanie R zapewnia różnorodne operacje, które można wykonać. Tworzenie pudełka to kolejna przydatna i prosta metoda do wizualnego wyświetlania danych na wykresach. W tym artykule omówiliśmy, czym są wykresy i jak wyświetlają dane. Wyjaśniliśmy cztery różne techniki, których można użyć do rysowania wykresów w R, przy użyciu RStudio w Ubuntu 20.04. W tym za pomocą prostych wektorów do tworzenia wykresów pudełkowych, wykorzystanie „Notch”, za pomocą DataFrame, a także tworzenie wielu wykresów bokserskich. Wykazaliśmy każdą metodę, opracowując różne przykłady kodów. Dzięki temu nauka R do tworzenia wykonywanych wykresów.