W R możesz od czasu do czasu wyeliminować jedną lub wiele określonych kolumn z ramki danych. Na szczęście istnieje jakaś wbudowana metoda z modułu R, która sprawia, że jest to proste. Upuszczenie kolumn z zestawu danych to po prostu metoda usuwania niepotrzebnych kolumn z ramki danych. W tym poście przyjrzymy się różnym odrębnym metodom usuwania kolumn według tytułu z zestawu danych w R."
Jak usunąć kolumny z ramek danych w R w Ubuntu 20.04?
Mechanizm upuszczenia kolumny w R pozwala usunąć niepotrzebne kolumny z ramki danych. W R możesz upuścić kolumnę na swoją nazwę na różne sposoby. Ten artykuł pokazuje, jak usunąć kolumnę z ramki danych za pomocą różnych przypadków w wielu różnych metodach.
Przykład nr 1: Za pomocą metody podzbioru do usuwania kolumn w R w Ubuntu 20.04
Użycie metody podzbioru () z symbolem „-”, który oznacza zmienne upuszczające, jest jednym z najprostszych sposobów upuszczenia kolumn. Ta funkcja w języku programowania R jest używana do budowania podzbiorów ramki danych i do usuwania kolumn z ramki danych. Składnia podzbioru w R jest taka: podzbiór (DF, Expr). Gdzie DF jest ramką danych, a Expr jest oznaczona jako wyrażenie dla podzbioru.
W przykładowym skrypcie utworzyliśmy ramkę danych „Data1”, która zawiera cztery kolumny x1, x2, x3 i x4. Rekord jest wstawiany do tych kolumn. Podczas wykonywania polecenia data1 rama danych jest drukowana, pokazując nazwy kolumn z posiadanymi wpisami. Następnie utworzyliśmy zmienną dane 2 i nazwaliśmy metodą podzbioru wewnątrz. Metoda podzbioru przenosi dane.
Po wykonaniu danych 2 generuje nową ramkę danych, która ma wszystkie kolumny oprócz x1 i x3, ponieważ te kolumny są usuwane za pomocą metody podzbioru.
Przykład nr 2: Za pomocą metody nazwy do usuwania kolumn w R w Ubuntu 20.04
Ta technika tworzy wektor znaku upuszczenia, w którym przechowywane są nazwy kolumn. Później instruujemy R, aby wybrać wszystkie zmienne, z wyjątkiem tych wskazanych w upuszczeniu kolumny. Negacja jest oznaczona przez „!”Symbol. Metoda nazw () w R służy do pobierania lub modyfikacji nazwy obiektu. Ta metoda akceptuje obiekt jako parametr, który może być macierz, wektor lub ramka danych, a także wartość, która zostanie użyta do nazwie obiektu. Długość dostarczonego wektora wartości musi dokładnie dopasować długość obiektu, która ma zostać nazwana, i zwraca wszystkie nazwy kolumn.
W powyższym skrypcie R ustaliliśmy ramkę danych w zmiennej „DF.„Rama danych jest drukowana na ekranie i jak widać, ta ramka danych ma cztery pola z wyraźnymi wpisami. Następnie umieściliśmy polecenie upuść i określliśmy nazwy kolumn wewnątrz wektora. Nowa zmienna jest tworzona jako „new_df”, w której wywoływana jest metoda nazwy, a do metody nazwy () przekazaliśmy naszą ramkę danych „DF.”Należy zauważyć, że użyliśmy % w % operatora po metodzie nazwy i polecenie upuszczenia po prawej stronie % w % w %.
Wykonanie powyższego kodu generuje następującą ramkę danych, w której kolumny Y2 i Y3 zostały usunięte.
Przykład nr 3: Za pomocą metody wyboru do usuwania kolumn w R w Ubuntu 20.04
W tej metodzie użyjemy Select (), importując pakiet DPLYR do R i określając argument w celu pominięcia kolumn zestawu danych. Zasadniczo ta funkcja jedynie zapisuje określone zmienne.
Dołączyliśmy pakiet DPLYR, aby uzyskać dostęp do metody wyboru. Konstruowaliśmy również ramkę danych, z której możemy usunąć kolumny. Rama danych jest generowana w formie tabelarycznej po uruchomieniu polecenia mydata, ponieważ ramka danych jest przechowywana w tej zmiennej. Następnie, na następnym obrazie, wdrożyliśmy metodę wyboru, w której ramka danych jest określona jako argument, a także podana jest nazwa kolumny A1 ze znakiem minus.
Poniżka r interpretuje to polecenie metody wyboru i wyświetla ramkę danych, która ma usunięcie kolumny A1.
Przykład nr 4: Za pomocą metody wyboru do usuwania kolumn przez pozycje kolumny w R w Ubuntu 20.04
Przekażemy pozycję indeksu kolumny jako wektor do metody wyboru ze znakiem ujemnym, aby usunąć pozycję kolumnową po kolumnie, jak pokazano poniżej.
Tutaj najpierw zamieściliśmy moduł DPLYR. A potem wstawiliśmy wbudowaną ramkę R Wbudowaną „Iris.„Rama danych IRIS jest wyświetlana i ma kilka kolumn, jak pokazano w wierszu r. Możemy usunąć dowolną kolumny wewnątrz ramki danych IRIS, określając indeks kolumny. W tym celu mamy metodę Select (), do której przekazaliśmy ramkę danych i wartość indeksu do wektora. Kolumna 3,4 i 5 jest usuwana z tęczówki ramy danych, która jest wyświetlana poniżej.
Przykład nr 5: Za pomocą metody wyboru do usuwania kolumn przez znak początkowy i końcowy kolumny w R w Ubuntu 20.04
Możemy również wybrać kolumny w zależności od ich początkowych i końcowych znaków tutaj. Funkcja start_with () zwraca kolumnę, która zaczyna się od dostarczonego znaku. Aby użyć metody start_with (), musimy śledzić składnię dostarczoną przez język R, który jest wybrany (DataFrame, -Starts_with („Substring”)))). Gdzie DataFrame oznacza źródło, ramkę danych i podłoże oznaczają znak lub ciąg, który go poprzedza.
W tym przykładzie wybraliśmy wzrost zębów ramy danych, ponieważ ma trzy kolumny wydrukowane na ekranie. Teraz, w następnym kroku, mamy metodę start_with () w poleceniu Wybierz. Metoda start_with () ze znakiem minus bierze nazwę kolumny, która zaczyna się od „dawki” w ramce danych zębów. Usunęła kolumnę „dawkę” z ramki danych, gdy wykonano to polecenie wyboru.
Ends_with () to funkcja, która zwraca kolumnę zawierającą dany znak na końcu. Składnia, którą używamy dla metody end_with () jest to: select (dataFrame, -ends_with („substring”)))). GdzieFrame Data odnosi się do wejściowej ramki danych, a podaj odnosi się do znaku lub ciągu, który następuje.
Podobnie jak powyższa metoda start_with (), przekazaliśmy kolumnę „Supp” z metody ramy zębowej do metody ends_with () z znakiem minus. Ta metoda usunęła również kolumnę, która ends_with „Supp."
Wniosek
Język programowania R został użyty do zademonstrowania podejścia do usuwania kolumn z ramki danych. Widzieliśmy wbudowaną metodę R i nazwę R, która usunęła kolumny. W R możesz upuścić kolumnę za pomocą operatora minus przed metodą Select. Również metoda Select () w module DPLYR w R jest używana do wyboru lub usuwania kolumn w oparciu o warunki takie jak zaczyna się, kończy się i upuszczając kolumny oparte na lokalizacji, jest przedstawiana z przykładami.