Pierwsze kroki z RStudio na Ubuntu Linux

Pierwsze kroki z RStudio na Ubuntu Linux
Ten samouczek ilustruje, jak zainstalować RStudio na Ubuntu 20.04.

RStudio zapewnia zintegrowane środowisko programistyczne do obsługi bezpłatnego języka programowania „R”, które są dostępne na licencji GNU. RStudio to idealne środowisko obliczeniowe do generowania szczegółowych wizualizacji statystycznych i jako takie jest używane przez statystyków na całym świecie.

RStudio jest również dostępne jako program i jako aplikacja serwerowa, używana przez różne dystrybucje Linux oraz dla systemu Windows i MacOS.

Pobierz język programowania (Wymagania wstępne)

Aplikacja RStudio Desktop potrzebuje języka programowania R do pracy w Linux Distros. Konieczne jest pobranie wersji R, która jest kompatybilna z systemem operacyjnym Linux. Możesz go pobrać za pomocą repozytorium oprogramowania.

1- Pobieranie R za pomocą przeglądarki internetowej

Jeśli nie możesz uzyskać R z centrum oprogramowania, oznacza to, że repozytorium musi zostać najpierw zaktualizowane. Możesz po prostu pominąć to wszystko i pobrać go z Internetu, wpisując ten link:

https: // cran.studio.com

W polu wyszukiwania w przeglądarce internetowej. Ich strona główna powinna przypominać zrzut ekranu poniżej:

2- Pobieranie R z terminalu Linux

Wprzyj terminal CLI, wpisz polecenie poniżej i naciśnij Enter:

Następnie uruchom aktualizację z poniższymi poleceniami:

Aktualizacja $ sudo apt-get

To polecenie pobranie aktualizacji R i pozyskanie wszystkich odpowiednich plików z głównego repozytorium Ubuntu.

Następnie wydaj następujące polecenie, aby zainstalować R:

Powyższe polecenie przechodzi przez listę pakietów, ujawniając, ile miejsca na dysku wypełni się, a następnie prosi o potwierdzenie. Naciśnij klawisz „Y” na klawiaturze, aby kontynuować instalację.

Wyjście najprawdopodobniej potwierdzi instalację.

Możesz sprawdzić to w polu wyszukiwania, jak pokazano poniżej:

Instalowanie RStudio na Ubuntu 20.04 z terminalem poleceń

Po zainstalowanym języku programowania hosta możemy teraz kontynuować instalację RStudio. Aby zademonstrować instalację, będziemy używać terminala wiersza poleceń.

Rozpal terminal i wydać następujące

$ sudo apt-get instaluj GDEBI-Core

Zostaniesz poproszony o wprowadzenie hasła root. Po wprowadzeniu hasła rozpocznie się instalacja pakietu

$ wget https: // pobierz1.Rstudio.Org/Desktop/Bionic/AMD64/RStudio-1.3.1093-AMD64.Deb

Pakiet online RStudio został teraz podłączony i jest przenoszony na dysk twardy.

Zostaniesz poproszony o ponowne wprowadzenie hasła root. Wprowadź hasło do odczytania i załadowania listy pakietów.

Zainstalowany poprosi o zgodę na kontynuację, naciśnij klawisz Y na klawiaturze.

Wyjście weryfikuje instalację, jak pokazano poniżej.

Pierwsze kroki z RStudio:

Aby uruchomić RStudio, przejdź do pola wyszukiwania i wyszukiwanie rstudio. Zobaczysz to w jednej z list, jak pokazano poniżej:

Kliknij ikonę RStudio, aby ją uruchomić.

Badanie zestawów danych z RStudio

Dzięki RStudio możesz wizualizować dowolne dane w postaci wykresów, tabel i wykresów.

Aby zrozumieć, w jaki sposób dane są reprezentowane wizualnie w RStudio, weźmy przykładową ludność spisu powszechnego z 2010 roku dla każdego kodu pocztowego jako przykład.

Proces analizy danych można niejasno sprowadzić do następujących czterech kroków:

1-import surowych danych

Możesz zaimportować surowe dane bezpośrednio z Internetu do RStudio, wykonując je systematycznie w oknie konsoli z poniższym poleceniem:

$ cpd <- read.csv(url("https://data.lacity.org/api/views/nxs9-385f/rows.csv?accessType=DOWNLOAD")

Po wykonaniu polecenia RStudio uzyska dane jako plik CSV z Internetu, a zawartość zostanie przypisana do zmiennej CPD.

Innym sposobem na importowanie danych do RStudio jest ręczne pobieranie zestawu danych na Twój dysk hard.

Przejdź do opcji Importuj zestaw danych w karcie środowiska i wybierz plik zestawu danych, aby przesłać. Kliknij OK, a zostaniesz wyświetlony okno dialogowe na temat zestawu danych. W tym miejscu określisz parametry, a także nazwy i dziesiętne. Po zakończeniu po prostu kliknij import, a zestaw danych zostanie dodany do RStudio, a zmienna zostanie przypisana do jego nazwy.

Aby zobaczyć, jakie zestawy danych są używane, wydaj poniższe polecenie za pomocą zmiennej przypisanej zestawowi danych:

$ View (cpd)

2 -manipulowanie danymi

Teraz, gdy zaimportowałeś zestaw danych, możesz wiele zrobić, aby przekształcić te dane. Dane są manipulowane przez cechy transformacji. Załóżmy, że chcesz zwiedzić określoną tablicę w zestawie danych. Gdybyśmy pójdzieli do kolumny całkowitej populacji w naszym zestawie danych, wprowadzilibyśmy poniższe polecenie:

$ CPD $ Całkowita populacja

Dane można również pobierać w postaci wektora:

$ CPD [1,3]

Funkcja podzbioru w RStudio pozwala nam zapytać o zestaw danych. Powiedzmy, że musimy podkreślić rzędy, w których stosunek mężczyzn do kobiet jest pozytywny. Aby wybrać te wiersze, wydasz następujące polecenie:

$ a <- subset(cpd , Total Males > Całkowite kobiety)

W powyższym poleceniu pierwszym przypisanym przez nas parametrem musiał być zmienna przypisana zestawowi danych, do którego zastosowaliśmy funkcję. Warunek logiczny jest uważany za drugi parametr. Ponadto warunek logiczny musi być oceniany na każdy rząd. Służy jako czynnik decydujący o tym, czy rząd ma być częścią wyjścia.

3 -wykorzystanie średnich funkcji na zestawie danych

RStudio ma określone funkcje, aby opracować średnie na zestawie danych:

$ Mean (CPD $ Total Males) - oblicza prostą średnią
$ mediana (cpd $ Total samiles) - daje medianę dla kolumny
$ Quantile (CPD $ Całkowita populacja) -daje kwantyl dla kolumny
$ var (cpd $ Total Males) -Works wariancja dla kolumny
$ sd (cpd $ Total Samile) -Gives standardowe odchylenie

Aby uzyskać podsumowany raport z zestawu danych, możesz również uruchomić jedną z tych funkcji w całym zestawie danych.

$ podsumowanie (CPD)

4 -Utworzenie wykresu zestawu danych

Jeśli często zamierzasz pracować z RStudio, znajdziesz narzędzie do wizualizacji bardzo zaradne. Możesz utworzyć wykres z dowolnego importowanego zestawu danych z wykresem i innymi funkcjami wizualizacji w RStudio.

Aby wygenerować wykres rozproszenia zestawu danych, wydasz następujące polecenie:

$ wykres (x = s $ Total Males, y = s $ Total Samile, typ = 'p')

Omówmy teraz parametry tutaj. W każdym parametrze S odnosi się do podzbioru oryginalnego zestawu danych, a dodając „P”, wskazujesz, że chcesz wykreślić wyjście.

Możesz także przedstawić swój zestaw danych w postaci histogramu:

$ Hist (CPD $ Total House Golles)

Podobnie, aby uzyskać wykres słupkowy importowanego zestawu danych:

$ liczy <- table(cpd$Total Population)
$ BARPLOT (Counts, main = „Całkowita rozkład populacji”,
$ xlab = "Liczba całkowitejPopulacji")

Zarządzanie danymi w nierównomiernie rozmieszczonych szeregach czasowych

Aby zarządzać danymi z nierównomiernie rozmieszczonymi szeregami czasowymi, należy zintegrować pakiet zoo z RStudio. Aby uzyskać pakiet zoo, przejdź do prawego dolnego rogu ekranu w RStudio i do komponentu pakietu. Pakiet zoo przekształca nieregularne dane szeregów czasowych w obiekty zoo. Argumenty wstawione do tworzenia obiektów zoo to dane, które są najważniejsze, a następnie wartość do zamówienia.

Obiekty zoo zapewniają łatwość obsługi użytkowania. Wszystko, co musisz zrobić.

Jeśli jesteś zdezorientowany co do tego, co ma do zaoferowania pewna funkcja RStudio, wprowadź nazwę tej funkcji i podążaj za nią „?”Aby zobaczyć monit w menu pomocy. Ponadto naciśnięcie przestrzeni Ctrl+po nazwie funkcji wytwarza okno automatycznego komplecji.

Owinięcie

Ten samouczek zilustrował, w jaki sposób możesz skonfigurować RStudio na Ubuntu 20.04 i objął podstawy reprezentacji statystycznej i manipulacji za pomocą RStudio. Jeśli chcesz lepiej wykorzystać RStudio, zapoznanie się z podstawami programowania R powinno być dobrym pierwszym krokiem. RStudio jest potężnym narzędziem i ma zastosowania w wielu branżach na całym świecie: sztuczna inteligencja i wydobycie danych, aby wymienić kilka.

Poznanie Nitty Ritty R Programming to trochę krzywa uczenia się, ale warto wysiłku.