Usuń kolumny w R

Usuń kolumny w R
„Rama danych często zawiera kolumny, które nie są istotne dla Twojego dochodzenia. Aby ułatwić podkreślenie pozostałych kolumn, takie kolumny należy usunąć z zestawu danych. Dostarczając nazwy etykiet i powiązane osie lub bezpośrednio definiowanie nazw indeksu lub kolumn, kolumny można wyeliminować. Etykiety na wielu etapach można usunąć za pomocą wielu indeksu, wyznaczając poziom.

W R możesz od czasu do czasu wyeliminować jedną lub wiele określonych kolumn z ramki danych. Na szczęście istnieje jakaś wbudowana metoda z modułu R, która sprawia, że ​​jest to proste. Upuszczenie kolumn z zestawu danych to po prostu metoda usuwania niepotrzebnych kolumn z ramki danych. W tym poście przyjrzymy się różnym odrębnym metodom usuwania kolumn według tytułu z zestawu danych w R."

Jak usunąć kolumny z ramek danych w R w Ubuntu 20.04?

Mechanizm upuszczenia kolumny w R pozwala usunąć niepotrzebne kolumny z ramki danych. W R możesz upuścić kolumnę na swoją nazwę na różne sposoby. Ten artykuł pokazuje, jak usunąć kolumnę z ramki danych za pomocą różnych przypadków w wielu różnych metodach.

Przykład nr 1: Za pomocą metody podzbioru do usuwania kolumn w R w Ubuntu 20.04

Użycie metody podzbioru () z symbolem „-”, który oznacza zmienne upuszczające, jest jednym z najprostszych sposobów upuszczenia kolumn. Ta funkcja w języku programowania R jest używana do budowania podzbiorów ramki danych i do usuwania kolumn z ramki danych. Składnia podzbioru w R jest taka: podzbiór (DF, Expr). Gdzie DF jest ramką danych, a Expr jest oznaczona jako wyrażenie dla podzbioru.

W przykładowym skrypcie utworzyliśmy ramkę danych „Data1”, która zawiera cztery kolumny x1, x2, x3 i x4. Rekord jest wstawiany do tych kolumn. Podczas wykonywania polecenia data1 rama danych jest drukowana, pokazując nazwy kolumn z posiadanymi wpisami. Następnie utworzyliśmy zmienną dane 2 i nazwaliśmy metodą podzbioru wewnątrz. Metoda podzbioru przenosi dane.

Po wykonaniu danych 2 generuje nową ramkę danych, która ma wszystkie kolumny oprócz x1 i x3, ponieważ te kolumny są usuwane za pomocą metody podzbioru.

Przykład nr 2: Za pomocą metody nazwy do usuwania kolumn w R w Ubuntu 20.04

Ta technika tworzy wektor znaku upuszczenia, w którym przechowywane są nazwy kolumn. Później instruujemy R, aby wybrać wszystkie zmienne, z wyjątkiem tych wskazanych w upuszczeniu kolumny. Negacja jest oznaczona przez „!”Symbol. Metoda nazw () w R służy do pobierania lub modyfikacji nazwy obiektu. Ta metoda akceptuje obiekt jako parametr, który może być macierz, wektor lub ramka danych, a także wartość, która zostanie użyta do nazwie obiektu. Długość dostarczonego wektora wartości musi dokładnie dopasować długość obiektu, która ma zostać nazwana, i zwraca wszystkie nazwy kolumn.

W powyższym skrypcie R ustaliliśmy ramkę danych w zmiennej „DF.„Rama danych jest drukowana na ekranie i jak widać, ta ramka danych ma cztery pola z wyraźnymi wpisami. Następnie umieściliśmy polecenie upuść i określliśmy nazwy kolumn wewnątrz wektora. Nowa zmienna jest tworzona jako „new_df”, w której wywoływana jest metoda nazwy, a do metody nazwy () przekazaliśmy naszą ramkę danych „DF.”Należy zauważyć, że użyliśmy % w % operatora po metodzie nazwy i polecenie upuszczenia po prawej stronie % w % w %.

Wykonanie powyższego kodu generuje następującą ramkę danych, w której kolumny Y2 i Y3 zostały usunięte.

Przykład nr 3: Za pomocą metody wyboru do usuwania kolumn w R w Ubuntu 20.04

W tej metodzie użyjemy Select (), importując pakiet DPLYR do R i określając argument w celu pominięcia kolumn zestawu danych. Zasadniczo ta funkcja jedynie zapisuje określone zmienne.

Dołączyliśmy pakiet DPLYR, aby uzyskać dostęp do metody wyboru. Konstruowaliśmy również ramkę danych, z której możemy usunąć kolumny. Rama danych jest generowana w formie tabelarycznej po uruchomieniu polecenia mydata, ponieważ ramka danych jest przechowywana w tej zmiennej. Następnie, na następnym obrazie, wdrożyliśmy metodę wyboru, w której ramka danych jest określona jako argument, a także podana jest nazwa kolumny A1 ze znakiem minus.

Poniżka r interpretuje to polecenie metody wyboru i wyświetla ramkę danych, która ma usunięcie kolumny A1.

Przykład nr 4: Za pomocą metody wyboru do usuwania kolumn przez pozycje kolumny w R w Ubuntu 20.04

Przekażemy pozycję indeksu kolumny jako wektor do metody wyboru ze znakiem ujemnym, aby usunąć pozycję kolumnową po kolumnie, jak pokazano poniżej.

Tutaj najpierw zamieściliśmy moduł DPLYR. A potem wstawiliśmy wbudowaną ramkę R Wbudowaną „Iris.„Rama danych IRIS jest wyświetlana i ma kilka kolumn, jak pokazano w wierszu r. Możemy usunąć dowolną kolumny wewnątrz ramki danych IRIS, określając indeks kolumny. W tym celu mamy metodę Select (), do której przekazaliśmy ramkę danych i wartość indeksu do wektora. Kolumna 3,4 i 5 jest usuwana z tęczówki ramy danych, która jest wyświetlana poniżej.

Przykład nr 5: Za pomocą metody wyboru do usuwania kolumn przez znak początkowy i końcowy kolumny w R w Ubuntu 20.04

Możemy również wybrać kolumny w zależności od ich początkowych i końcowych znaków tutaj. Funkcja start_with () zwraca kolumnę, która zaczyna się od dostarczonego znaku. Aby użyć metody start_with (), musimy śledzić składnię dostarczoną przez język R, który jest wybrany (DataFrame, -Starts_with („Substring”)))). Gdzie DataFrame oznacza źródło, ramkę danych i podłoże oznaczają znak lub ciąg, który go poprzedza.

W tym przykładzie wybraliśmy wzrost zębów ramy danych, ponieważ ma trzy kolumny wydrukowane na ekranie. Teraz, w następnym kroku, mamy metodę start_with () w poleceniu Wybierz. Metoda start_with () ze znakiem minus bierze nazwę kolumny, która zaczyna się od „dawki” w ramce danych zębów. Usunęła kolumnę „dawkę” z ramki danych, gdy wykonano to polecenie wyboru.

Ends_with () to funkcja, która zwraca kolumnę zawierającą dany znak na końcu. Składnia, którą używamy dla metody end_with () jest to: select (dataFrame, -ends_with („substring”)))). GdzieFrame Data odnosi się do wejściowej ramki danych, a podaj odnosi się do znaku lub ciągu, który następuje.

Podobnie jak powyższa metoda start_with (), przekazaliśmy kolumnę „Supp” z metody ramy zębowej do metody ends_with () z znakiem minus. Ta metoda usunęła również kolumnę, która ends_with „Supp."

Wniosek

Język programowania R został użyty do zademonstrowania podejścia do usuwania kolumn z ramki danych. Widzieliśmy wbudowaną metodę R i nazwę R, która usunęła kolumny. W R możesz upuścić kolumnę za pomocą operatora minus przed metodą Select. Również metoda Select () w module DPLYR w R jest używana do wyboru lub usuwania kolumn w oparciu o warunki takie jak zaczyna się, kończy się i upuszczając kolumny oparte na lokalizacji, jest przedstawiana z przykładami.