Gdy żadne dane nie są dostępne z jednym lub więcej modułami lub dla całego urządzenia, są one rozpoznawane jako utracone dane. W codziennych środowiskach brakujące wartości są najważniejszym problemem. Wpisy NA (niedostępne) są używane do przedstawienia brakujących rekordów w R. Wiele zestawów danych jest dostępnych w ramce danych z brakującymi wartościami, ponieważ albo istnieją, ale nie zostały nabyte lub ponieważ nigdy nie istniały."
Jak pozbyć się wartości NA w języku programowania R w Ubuntu 20.04?
Symbol Na jest używany w R do oznaczania brakujących wartości (niedostępne). Na może wskazywać puste wartości w kolumnach DataFrame w języku programowania R. Przyjrzymy się, jak pozbyć się wierszy NA w jednej kolumnie w tym artykule.
Przykład nr 1: Używanie IS.Metoda NA usunięcie Na w R w Ubuntu 20.04
Możemy użyć to.na wyeliminowanie takich wartości NA z wektora. Wartości NA są uzyskiwane za pomocą IS.Na () i indeks wektorowy. Wszystkie wartości oprócz NA zostaną zwrócone przez IS.Na ().
W powyższym przykładzie mamy reprezentację wektora, w której uwzględniono niektóre liczby losowe wraz z wartościami Na. Wyjście wygenerowało również wartość NA. Dlatego chcemy je usunąć. W tym celu nazwali v1 wewnątrz funkcji.Na, który wyeliminuje wszystkie istnienie wartości Na w wektorach. Wyjście z tej funkcji wyświetla tylko liczbę.
Przykład nr 2: Za pomocą Na.Metoda RM do usunięcia Na w R w Ubuntu 20.04
Oceniając sumę, średnią i wariancję, możemy również usunąć wartości NA. Następnie.RM to metoda używana do pozbycia się Na. Jeśli na.rm = true, Na jest ignorowane; Jeśli na.rm = false, Na jest rozważane.
Zaczynając od tworzenia kolekcji wektorowej, która ma pewne liczby i wartości NA. Ta kolekcja wektorowa jest przechowywana w zmiennej VEC. Następnie te wartości Na najpierw usuwa się, oceniając wariancję reprezentowaną jako var. Następnie oceniliśmy sumę i mieliśmy na wartości VEC, aby wyeliminować wartości NA. Zauważ, że mamy NA.RM ustawiony na true, który uniknie NA wektor.
Przykład nr 3: Za pomocą metody pomijania do usunięcia Na w R w Ubuntu 20.04
Metoda OMIT () eliminuje bezpośrednio wartości Na, zwracając wartości nie-NA i odrzucone wskaźniki wartości Na. To najprostszy wybór. Następnie.Metoda OMIT () zwraca wynik bez żadnych wartości NA w dowolnym wierszu. W języku R jest to najszybsza technika eliminowania wierszy NA.
Tutaj zainicjowaliśmy zmienne liczby całkowite z wektorami. Następnie, z poleceniem drukowania, wygenerowaliśmy wyjście wektorów. Tak więc, na wyjściu, widzieliśmy pewne wartości NA. Aby usunąć te z z wektora, mamy NA.Pomiń funkcję, która przyjmuje zmienną liczbową jako dane wejściowe do usuwania wartości NA. Następnie sprawdziliśmy instrukcję drukowania, czy wartości Na są usuwane z wektorów. Gdy identyfikator wyjściowy jest generowany, nie pokazuje wartości NA w liczbach całkowitych.
Przykład nr 4: Korzystanie z kompletnego.Metoda przypadków do usunięcia Na w R w Ubuntu 20.04
W przypadku różnych rodzajów analizy danych w języku komputerowym R, wymagana jest szczegółowa ramka danych bez brakujących wartości. Kompletne.Metoda przypadków to otrzyma. Ta funkcja R analizuje ramkę danych i zwraca wektor wyników brakujących wartości w wierszach.
Jak w poprzednim przykładzie, mamy reprezentacje wektorowe. Teraz eliminujemy wartości NA z ramek danych. W tym celu utworzyliśmy ramkę danych, która dla każdej kolumny wstawiliśmy niektóre wartości NA. Następnie zadzwoniliśmy do kompletnego.Funkcja przypadku, która przyjmuje ramkę danych jako opcję wejściową. Data2 utrzymuje tę operację, która jest drukowana i pokazuje, że wartości NA są usuwane.
Przykład nr 5: Za pomocą metody Rowsum do usunięcia Na w R w Ubuntu 20.04
R ma wbudowaną metodę, która generuje sumy dla każdego wiersza w gromadzeniu danych w formacie Rowsums (x). Można określić dodatkowe parametry, z których najważniejszym jest logiczny argument Na.RM, który instruuje funkcję, czy pominąć wartości NA.
Po utworzeniu ramki danych w danych zmiennych zastosowaliśmy metodę Rowsums. Mamy w pamięci.metoda Na i metoda NCOL. Zauważ, że usuwa tylko wartości Na trzeciego rzędu. Ponieważ pozostałe rzędy zawierają również wartości NA.
Przykład nr 6: Za pomocą metody filtra do usunięcia Na w R w Ubuntu 20.04
Możemy również użyć pakietu Tidyvers DPLYR, aby upuścić tylko wiersze, w których brakuje wszystkich wartości. Następnie możemy użyć kombinacji funkcji filtra pakietu DPLYR, a podstawowe r to.funkcja na. Pokazamy, jak usunąć tylko wiersze, w których wszystkie wpisy danych są na.
Korzystając z pakietu DPLYR dla funkcji filtra, utworzyliśmy ramkę danych. Następnie zastosowaliśmy funkcję filtra tej ramki danych i wyświetliliśmy wyjście, która usunęła wartości Na z trzeciego wiersza.
Wniosek
Nauczyliśmy się usuwać Na z języka R, który pojawia się pojedynczo lub wielokrotnie w wektorach lub ramie danych na tym etapie sesji. Omówiliśmy sześć metod, które pomagają nam usunąć NA z podanych danych. Te metody są dość łatwe do wdrożenia w języku skryptowym R, co może usunąć wartości Na z rzędów i kolumn. Ponadto niektóre metody wymagały pakietu R DPLYR do wyeliminowania Na.