Utwórz ramkę danych w R

Utwórz ramkę danych w R
W R, DataFrame są najczęściej wykorzystywanym obiektem do przechowywania danych. Jest to zbiór wektorów o identycznych długościach. Rama danych to tabela lub struktura, która przypomina dwuwymiarową tablicę, w której każda kolumna reprezentuje wartość pojedynczej zmiennej, podczas gdy wartości każdej kolumny są reprezentowane w jednym wierszu.

Rama danych musi spełniać pewne cechy, o których wspomnialiśmy w tym akapicie. Kolumny w ramce danych muszą zostać nazwane i nie są puste. Każdy wiersz w ramce danych musi zostać nazwany Wyłącznie.

Tworzenie ram danych w R

R Programowanie zapewnia różne metody tworzenia ramki danych. Możemy skonstruować ramkę danych, wykorzystując wektory z innej ramki danych i importowanie pliku. W tym artykule omówimy te techniki, które pomogą ci w nauce koncepcji tworzenia ramki danych w R.

Korzystanie z wektorów do tworzenia strumienia danych w R

Programowanie r pozwala na zbudowanie ramki danych za pomocą wektorów, które są równe rozmiar. W tym celu R zapewnia wbudowaną funkcję „Dane.rama()".Ta funkcja może złapać tyle wektorów, ile chcemy.

Poniżej znajduje się składnia do wywołania tej funkcji:

df <- data.frame(v1, v2, v3, v4)

W dowolnym ramie danych, kolumna jest reprezentowana przez każdy wektor, a liczba wierszy zostanie określona przez długość dowolnego wektora.

Istnieją 2 sposoby generowania ramki danych za pomocą wektorów, jedno poprzez tworzenie wymaganych wektorów, a następnie przekazywaniu ich do „danych.Funkcja ramki () ”. A dalszym substytutem jest bezpośrednie dostarczanie wektorów „danych.Funkcja ramki () ”i przypisz ich wartości w klamrach funkcyjnych.

Pomożemy Ci zrozumieć obie metody, pokazując praktyczne przykłady w RStudio w Ubuntu 20.04.

Przeprowadzimy przykład, aby stworzyć ramkę danych z wektorów. Najpierw utworzymy wektory, a następnie przekazamy je wszystkie jako parametr „danych.rama()".

W programie, który pokazaliśmy na powyższym obrazie, użyliśmy czterech wektorów. Wszystkie wektory są tworzone za pomocą funkcji „C ()”. Pierwszy wektor, który wygenerowaliśmy, to „nazwa”, która będzie przechowywać nazwy 3 osób o wartości typu znaków. Drugi wektor to „język” i przechowuje nazwy 3 języków programowania. Przechowuje także typy danych znaków. Nasz trzeci wektor to „wiek”, który przechowuje numeryczne typy danych. Ostatni wektor, „płeć”, przechowuj również 3 wartości typu danych znaków. Wszystkie 4 wektory są przekazywane do „danych. ramka () ”funkcja jako parametr. „DF” zapisano dane wyjściowe „danych.Funkcja ramki () ”. W ostatnim etapie kodu użyliśmy instrukcji „print ()”, aby wyświetlić wyjście.

Powstała ramka danych ma 4 kolumny, z których każda ma ten sam rozmiar wektorów.

Inną alternatywną metodą generowania ramki danych w R przy użyciu wektorów jest to, że możesz dostarczyć wektory z wartościami wewnątrz „Dane.Funkcja ramki () ”.

Ten fragment kodu po prostu utworzył wektory i przypisał im wartości wewnątrz ciała „danych.FLAME () ”i przechowywano tę funkcję w DataFrame„ DF.„„ Print () ”wyświetlił wyjście.

Powstała tabela daje to samo wyjście, które można zobaczyć na poniższym obrazku.

Warto powtórzyć, że aby wygenerować ramkę danych z listy wektorów, każdy wektor na liście musi mieć taką samą ilość elementów; W przeciwnym razie skrypt zgłosi błąd.

Korzystanie z innych ram danych do utworzenia ramki danych

Tworzenie ramki danych za pomocą dwóch lub więcej danych danych to inna technika stosowana w programowaniu R. Możemy zrobić dla grupowania kolumn jednej ramki danych do drugiej, a także dołączyć do wierszy.

Wykonamy tutaj dwa programy, jeden dla grupy poziomej, a drugi do grupowania pionowego.

W przypadku kolumn funkcją, której użyjemy, to „cbind ().„Utwórzmy najpierw 2Frame, a następnie połącz je za pomocą funkcji„ cbind () ”.

W pierwszym fragmencie kodu zostaną skonstruowane 2 kolumny, a wartości są przechowywane w ramce danych „DF1”.

Powstała tabela daje to samo wyjście, które można zobaczyć na poniższym obrazku.

Kolejna ramka danych, „DF2”, generuje 2 kolumny, „wiek” i „płeć."

Powstała tabela daje to samo wyjście, które można zobaczyć na poniższym obrazku.

Rama danych „DF3” jest konstruowana i wykorzystuje funkcję „cbind ()” do połączenia „df1” i „df2”.

Ostateczne wyjście pokazuje tabelę wygenerowaną z scalania 2 ramek danych.

Podobnie, aby utworzyć wiersze DataFrame, możemy użyć funkcji „rbind ()”. Wewnątrz funkcji „rbind ()” przekazamy 2 plamę danych jako parametry. Ta funkcja połączy 2 mniejsze pionowe ramki danych w całej tabeli. Należy pamiętać, że liczba wierszy musi być taka sama dla wszystkich tworzonych ramek danych.

Odczytanie pliku w ramce danych

Oprócz generowania ram danych, możesz zrobić jeszcze kilka rzeczy, które możesz zrobić. Możemy zaimportować tabelaryczny zestaw danych i zapisać go jako ramkę danych. Jest to najczęstsza metoda konstruowania ramki danych w programowaniu R.

Utworzyliśmy plik CSV, przechowywane wartości w formacie tabelarycznym i nazwaliśmy go „Tabela.CSV.„Zapisaliśmy ten plik w naszym folderze„ Dokumenty ”. W RStudio przeczytamy go za pomocą „Odczyt.CSV () ”funkcja jako nowa ramka danych o nazwie„ Tabela."

Aby odczytać plik CSV w RStudio, pierwszą rzeczą, którą musisz zrobić, jest skonfigurowanie bieżącego katalogu roboczego. Korzystając z funkcji „getwd ()”, możesz zlokalizować swój obecny katalog roboczy. W następnym kroku musisz ustawić swój katalog na miejsce, w którym uratowałeś „.plik CSV ”. Jeśli nie weźmiesz pod uwagę tych kroków, otrzymasz błąd, starając się odczytać plik.

Po prawidłowym ustawieniu ścieżki bieżącego katalogu roboczego do katalogu, w którym przechowywałeś swój plik CSV, teraz użyjesz „Odczyt.Funkcja csv () ”. Napisz ".Nazwa pliku CSV z znakiem cytatowym („”) wewnątrz „Odczyt.csv () ”i użyj ramki danych o dowolnej nazwie, którą chcesz przechowywać.

Dane, które przechowyliśmy w naszym pliku CSV, są wyświetlane tutaj.

Wniosek

W dzisiejszym temacie badaliśmy tworzenie ramek danych. Ramy danych są niezbędnymi strukturami programowania R. Omówiliśmy różne sposoby konstruowania twoich ramek w RStudio w Ubuntu 20.04 Środowisko poprzez opracowanie każdego z przydatnym przykładem. Umieszczenie praktycznej praktyki do tych przykładowych kodów nie tylko wprowadzi potrzebę korzystania z ramek danych, ale także alternatywnych sposobów ich zbudowania.