Połącz kolumny w R

Połącz kolumny w R
„Istnieje różnorodność scenariuszy, w których zestawy danych są podzielone na liczne tabele i wiele powodów, dla których tak jest. Czasami prostsze jest gromadzenie informacji w mniejszych fragmentach, podczas gdy w niektórych sytuacjach lepiej zminimalizować rozmiar pliku. Niezależnie od tego, dlaczego zestawy danych są rozdrobnione w oddzielne tabele, muszą być ustrukturyzowane w sposób, w jaki powinna istnieć minimum jednej kolumny podobnej między obiema tabelami, umożliwiając w razie potrzeby połączenie.Istnieją trzy główne strategie, które przyjrzymy się, aby zmniejszyć obciążenie pracą i upewnić się, że każda ważna kolumna i parametr z różnych zestawów danych są odpowiednio zintegrowane.Po przejrzeniu wszystkich technik i odpowiednich praktycznych kodów przykładowych, będziesz mógł mocno przyjąć koncepcję łączenia kolumn w R."

Łączenie kolumn w R

R zapewnia nam kilka sposobów łączenia kolumn z ramką danych. W tym artykule zapoznamy z 3 z nich; Za pomocą funkcji „wklej ()” za pomocą funkcji „unite ()” i za pomocą funkcji „str_c ()”.

Połącz kolumny za pomocą funkcji „Paste ()”

Jedną z metod łączenia kolumn w ramce danych w R jest użycie funkcji „wklej ()”. Ta funkcja działa poprzez połączenie kolumn z dwóch różnych danych danych, a także w ramach tej samej ramki danych.

Zanim skupimy się na jego implementacji, najpierw musimy zrozumieć składnię funkcji „wklej ()”.

# Wklej (dane $ c1, dane $ c2, sep = „”)

Składnia funkcji „wklej ()” ma 3 parametry. „Dane” to nazwa DataFrame, którą wprowadziłbyś, a „C1” to nazwa kolumny tego DataFrame. „C2” odnosi się do innej nazwy kolumny w ramce danych, którą musisz połączyć z pierwszą. Podczas gdy „SEP” oznacza separator, który oddziela dwie kolumny i („”) odnosi się do wszystkiego, co separator musi dodać między 2 kolumnami. Tutaj służy do dodawania przestrzeni między obiema kolumnami podczas dołączania do nich.

Utworzyliśmy ramkę danych z 3 kolumnami; „FirstName”, „LastName” i „Wiek.”Za pomocą funkcji„ C () ”przypisz wartości do wszystkich kolumn. „FirstName” i „LastName” mają wartości typu danych znaków, podczas gdy kolumna „wiek” przechowywała wartości typu danych numerycznych. Utworzyliśmy ramkę danych o nazwie „Info” i zapisaliśmy wartości „Dane.Funkcja ramki () ”. Instrukcja „print ()” wyświetli właśnie utworzony, który właśnie utworzyliśmy.

Na ekranie wyjściowym możesz zobaczyć tabelę z 3 kolumnami.

Teraz użyjemy funkcji „wklej ()”. Najpierw napisz nazwę DataFrame, w której przechowywałeś wartości; Jak nazywaliśmy go „informacjami”, następnie dodaj obok niego operator „$”, którego używamy do wyboru kolumny lub do przydzielenia nowej wartości do kolumny. Postępując dalej, tworząc nową kolumnę o nazwie „FullName”, do której przypiszmy połączone wartości 2 różnych kolumn. Wewnątrz funkcji „wklej ()” wspomnij o nazwie formy danych z operatorem „$” i kolumną, którą chcesz wybrać. Po umieszczeniu przecinka napisz nazwę DataFrame, operatora „$” i drugiej kolumny, którą chcesz scalić. „(Sep =„ ”)” doda przestrzeń między obiema kolumnami, łącząc je.

Poniższy obraz pokazuje oba tabele; pierwszy z początkową ramką danych, a drugą z łączną kolumną „Pełna nazwa."

Możesz usunąć poprzednią ramkę danych, eliminując pierwszą instrukcję „print ()”.

Wyjście można znaleźć na poniższym obrazku.

Połącz kolumny za pomocą funkcji „Unite ()”

Inną metodą dołączenia do kolumn w programowaniu R jest użycie funkcji „Unite ()”. Musimy załadować pakiet, który zawiera tę funkcję, która jest pakietem „TiDyr”.

W celu użycia funkcji „Unite ()” składnia, którą będziemy przestrzegać, to:

# UNITE (nazwa DataFrame, łączna nazwa kolumny, C (kolumna1, kolumna2))

Gdzie „nazwa dataframe” to data danych, którą wprowadzisz. „Połączona nazwa kolumny” to nazwa kolumny, w której chcesz przechowywać scalone dane. A wewnątrz funkcji „c ()” są „kolumna 1” i „kolumna2”, kolumny, które musisz połączyć.

W przykładzie najpierw zainstalowaliśmy pakiet „TiDyr” z biblioteki R. Utworzył ramkę danych w taki sam sposób, jak utworzyliśmy ją w powyższym przykładzie. Chcemy połączyć 2 kolumny; "imię i nazwisko.„Wewnątrz funkcji„ Unite () ”zapiszymy nazwę DataFrame, jaką jest„ Info.”Następnie nazwa kolumny, w której połączone wartości kolumny będą przechowywane jako„ FullName.„Korzystanie z funkcji„ C () ”do wywołania 2 kolumn do połączenia. Wreszcie instrukcja „print ()” wyświetli dane wyjściowe.

Nowa kolumna o nazwie „FullName” przechowująca scalanie wartości kolumn „FirstName” i „LastName”.

Połączenie kolumn według funkcji „str_c ()”

Teraz łączymy wiele kolumn z metodą str_c (). W tym celu początkowo musimy zainstalować pakiet „Stringr."

Funkcja „str_c ()” działa z tą składnią:
Str_c (dataFrame $ kolumn1, „”, dataFrame $ kolumn2)

„DataFrame” to stworzona przez nas dane danych. „Kolumna 1” i „kolumna2” to 2 kolumny, które chcemy połączyć. Jeśli zauważyłeś, między nazwami kolumn jest przestrzeń („”). Jeśli nie dodamy tej dodatkowej przestrzeni, połączy to obie kolumny bez miejsca.

Oto przykład tego, co zrobiliśmy.

Na samym początku załadowaliśmy pakiet „Stringr”, który pozwoli nam użyć funkcji „str_c ()”. Wykorzystaliśmy ramkę danych utworzoną w powyższych przykładach i, z tymi samymi krokami, jak wspomniano wcześniej, zapisaliśmy swoje wartości w nowej ramce danych o nazwie „Informacje."

Wewnątrz funkcji „str_c ()” wzięliśmy nazwy obu kolumn jako „info $ $ FirstName” i „Info $ lastName” i dodaliśmy przestrzeń między nimi, aby nie połączyły się po połączeniu.

Można zobaczyć wynikową połączoną kolumnę przykładu pokazanego powyżej.

Wniosek

Łączenie kolumn w programowaniu R to bardzo łatwa i przydatna koncepcja. Można to zrobić za pomocą kilku technik za pomocą RStudio w Ubuntu 20.04. Staraliśmy się przedstawić Ci metody i techniki, które można wykorzystać do połączenia kolumn w R. Pokazując przykładowe kody i opracowując każdy mały szczegół, naszym celowym celem i celem jest poprowadzenie cię po prostu i niezawodnym uczeniem się i cieszenie się kombinacją kolumn w programowaniu R.