Wykres rozrzutu w r

Wykres rozrzutu w r
„Wizualne reprezentacje danych obejmują wykresy i wykresy. Twoim celem jako naukowca danych jest zrozumienie ogromnej ilości informacji. W analizie danych biorą udział trzy procedury. Uzyskanie danych, czyszczenie i zmiana danych jest ważną częścią procesu. Aby dalej ocenić dane, skonstruuj z niego wizualny wyświetlacz. Wizualizacje danych z wykresem to ogromne narzędzia do ułatwiania skomplikowanej analizy. Ale najpierw przejdźmy do podstawowych zasad fabularnych, takich jak fabuły rozproszone. Wykres rozproszony to schemat, który przedstawia poziomy dwóch zmiennych numerycznych w zestawie danych jako punktów geometrycznych na schemacie kartezjańskim."

Jaki jest wykres rozproszenia w języku programowania R w Ubuntu 20.04?

Porównanie zmiennych odbywa się za pomocą wykresów rozproszonych. Kiedy musimy wiedzieć, na jaki dalsza zmienna wpływa inna, musimy porównać dwie zmienne. Wykres rozproszenia to grupa kropkowanych punktów na osiach x i y, które reprezentują wyraźne fragmenty danych. Układ wygenerowanych punktów pokazuje korelację między dwiema zmiennymi, gdy ich wartości są wyświetlane wzdłuż osi x i osi y.

Składnia wykresu rozproszenia w języku programowania R w Ubuntu 20.04

W R możesz zrobić wykres rozrzutu w różnych metodach. Wykres (x, y), w którym parametry x i y są wektorami numerycznymi określającymi pozycje (x, y) do wykresu, jest najbardziej podstawową funkcją.

Wykres (x, y, main, xlab, ylab, xlim, ylim, osie)

Jak wspomniano powyżej, X dowolne parametry x są obowiązkowe do wykresu wykresu rozproszenia, ale wykres rozproszenia obsługuje również niektóre opcjonalne parametry, które są opisane w następujący sposób:

X: Współrzędne poziome są ustawione z tą opcją.

y: Współrzędne pionowe są ustawione z tą opcją.

XLAB: Etykieta osi poziomej.

YLAB: Etykieta osi pionowej.

główny: Temat wykresu jest zdefiniowany przez parametr główny.

xlim: Parametr XLIM służy do przedstawienia x wartości.

ylim: Opcja Ylim jest używana do wykreślania wartości Y.

osie: Ta opcja określa, czy wykres powinien zawierać oba osie.

Jak zbudować wykres rozproszenia w R w Ubuntu 20.04?

Spójrzmy na przykład, aby pokazać, w jaki sposób możemy użyć funkcji fabuły, aby utworzyć wykres rozrzutu. W naszych przykładach wykorzystamy przykładowy zestaw danych, który jest wstępnie skonfigurowanym zestawem danych w środowisku R.

Przykład nr 1: Korzystanie z metody wykresu konstruowania wykresu rozproszenia R w Ubuntu 20.04

Metodę wykresu () w języku programowania R może być użyta do wykonania wykresu rozproszenia.

Aby skonstruować wykres rozproszenia, potrzebujemy zestawu danych. Więc tutaj wstawiliśmy zestaw danych USARRESTS z języka R. Wybraliśmy dwie kolumny z tego zestawu danych do wykonania wykresu rozproszenia. Pierwsze kilka wpisów pokazano z zestawu danych USARRESTS. Następnie mamy funkcję wykresu, w której ustawiane są dwa wejścia, x i y. W przypadku wejścia x wybrano kolumnę „morderstwo”, a dla wejścia Y mamy kolumnę „UrbanPop”. Niektóre opcjonalne wejścia są przekazywane w funkcji, takie jak etykiety dla x i y, są ustawione za pomocą XLAB i yLAB. W zakresie XLIM i Ylim są ustawiane wartości parametrów x i y. Ponadto tytuł wykresu rozproszenia jest ustawiany przez wywołanie opcji „główne."

Wyjście wykresu rozrzutu jest generowane poniżej.

Przykład nr 2: Za pomocą metody pary do konstruowania macierzy wykresu rozproszenia R w Ubuntu 20.04

Używamy macierzy wykresu rozrzutu, gdy mamy wiele zmiennych i chcemy skorelować jedną zmienną z innymi. Matryce wykresu rozrzutu są tworzone za pomocą metody pars ().

Tutaj wybraliśmy przykładowy armat danych z języka r. Następnie wydrukuj sześć najlepszych wpisów zestawu danych IRIS. Do kolumn z zestawu danych IRIS zastosowaliśmy metodę pary. Każda kolumna będzie sparowana z pozostałą kolumną w funkcji pary.

Wskaźniki wykresu rozrzutu są wizualizowane na poniższym rysunku.

Przykład nr 3: Używanie dopasowanych wartości w wykresie rozrzutu w R w Ubuntu 20.04

Możesz rozwinąć wykres, dodając nowy poziom danych. W regresji liniowej możesz wizualizować dopasowaną wartość. Do konstruowania wykresu rozrzutu używamy metod GGPlot () i Geom_Point () Pakiet GGPlot2.

Zacznij od tego przykładu; Zaimportowaliśmy moduł GGPlot2 z R. Następnie zastosowaliśmy metodę GGPlot, w której podana jest nazwa zestawu danych „MTCARS”. Funkcja „AES” jest używana w metodzie GGPlot do tworzenia dzienników dla parametrów x i y. Do regresji liniowej używany jest dodatkowy zestaw funkcji, „Stat_smooth”,. Metoda wygładzania jest kontrolowana przez opcję Stat_ Smooth (). Błąd standardowy (SE) jest trzymany fałszywy, a linia rozmiaru jest ustawiona na wartość 1.

Przykład nr 4: Używając dynamicznej nazwy tytułu rozrzutu w R w Ubuntu 20.04

Nie umieściliśmy jeszcze żadnych danych na działkach. Wymagane są wykresy informacyjne. Bez uciekania się do dodatkowej dokumentacji czytelnik powinien być w stanie zrozumieć wiadomość za analizą danych, rzucając się na działkę. W rezultacie przy użyciu wykresów wymagane są dobre etykiety. Etykiety można dodać za pomocą funkcji labs ().

Mamy tutaj zmienną jako sctrat_graph, do której przypisana jest metoda gglot. GGplot ustaw parametr tak samo jak powyższy przykład, ale dla innego zestawu danych. Używany tutaj zestaw danych to tęczówka. Następnie ponownie wykorzystaliśmy zmienną scatter_garph i tym razem ustawiliśmy dynamiczne nazwy na wykresie rozproszenia.

Możesz zobaczyć dodatkowe informacje na temat wykresu rozrzutu na poniższym rysunku.

Przykład nr 5: Za pomocą metody 3dscatterplot do konstruowania wykresu rozproszenia w R w Ubuntu 20.04

Pakiet Scatterplot3D pozwala na wykonanie trójwymiarowego wykresu rozrzutu. Scatterplot3d jest przydatną techniką, która używa składni (x, y, z).

Uwzględniliśmy moduł Scatterplot3D w naszym skrypcie R powyżej. Teraz możemy użyć funkcji Scatterplot3D. Do funkcji Scatterplot3D przekazaliśmy trzy parametry, które są kolumnami wybranymi z zestawu danych zębów.

Wykres rozrzutu 3D jest renderowany na następującym wykresie Snap.

Wniosek

Ten artykuł ma na celu poinformowanie o działce rozproszonej w R. Wykresy rozproszone to wykresy dyspersyjne używane do wyświetlania punktów danych z parametrów (zwykle dwa, ale trzy są możliwe). Głównym celem wykresu rozpraszania R jest pomoc w wizualizacji danych i czy zmienne liczbowe mają jakikolwiek związek. Widzieliśmy różne podejścia, które pomagają nam stworzyć wykres rozrzutu w najłatwiejszy sposób. Każda metoda ma swoją funkcjonalność i jest bardzo łatwa do zrozumienia.