Jaki jest plik CSV w języku programowania R w Ubuntu 20.04?
Format pliku CSV (wartości oddzielone przecinki) jest powszechnym sposobem zapisywania danych tabelarycznych w arkuszach kalkulacyjnych i bazach danych. Plik CSV to zwykły dokument tekstowy zawierający dane tabelaryczne (liczba całkowita i tekst). Odpowiednia linia w pliku dotyczy rekordu danych. Przecinek jest wykorzystywany jako separator pola, który nadaje temu formatowi tego formatu pliku. W języku programowania R znajduje się nieodłączny moduł o nazwie CSV, który umożliwia działanie z plikami CSV. Funkcja odczytania pliku CSV w języku programowania R ma następującą składnię.
Czytać.CSV („File_name”)Odczyt.CSV () to metoda opakowania do odczytu.tabela (), która używa przecinka jako separatora. Pierwszy wiersz pliku wejściowego jako nagłówka dla nazw kolumn danej tabeli. W związku z tym jest to ogromny wybór do odczytu plików CSV.
Jak odczytać plik CSV w języku programowania R w Ubuntu 20.04?
W wielu przypadkach odczyt danych z pliku CSV jest niezbędny podczas uruchamiania analizy za pomocą R. Jeśli chodzi o czytanie plików CSV, R jest niezwykle niezawodne. W tym celu potrzebujemy danych do odczytu, zapisu lub zmiany danych w R. Tutaj mamy kilka ilustracji, jak utworzyć plik CSV i go odczytać. Przeprowadziliśmy także różne operacje na pliku CSV, które odczytują te konkretne dane z pliku CSV w języku skryptu R.
Przykład 1: Tworzenie pliku CSV w R w Ubuntu 20.04
Ustawiliśmy ramę danych pracowników z szczegółami niektórych pracowników. Następnie zapisz to w EMP.plik CSV.
Przykład 2: Przeczytaj z pliku CSV w R w Ubuntu 20.04
Odczyt.Funkcja CSV () w R może odczytać pełny tekst pliku CSV jako ramkę danych. Plik CSV do odczytania musi być albo w katalogu roboczym, albo katalog musi zostać odpowiednio ustalony w funkcji s setWd (). Odczyt.Funkcja CSV () może również odczytać plik CSV za pośrednictwem adresu URL.
Jak wyżej, zdefiniowaliśmy zmienną jako emp_data. EMP_DATA jest przypisany do odczytu.funkcja CSV, w której podana jest nazwa pliku. Ponieważ mamy plik EMP.CSV obecne w naszym bieżącym katalogu R może łatwo interpretować ten plik. Kiedyś polecenie wydruku jest podane w wierszu r. Wyświetla zawartość pliku CSV w formie tabelarycznej.
Przykład 3: Oceniono plik CSV w R w Ubuntu 20.04
Odczyt.Funkcja CSV () wytwarza ramkę danych jako domyślne wyjście. Oto szybkie podejście, aby to sprawdzić. Można również sprawdzić częstotliwość kolumn i wierszy danych plików CSV.
W poleceniu drukowania nazwali funkcję NCOL dla kolumn i nrow dla wierszy. Funkcje te są następnie przekazywane ze zmienną emp_data z powyższego przykładu, która ma całą zawartość pliku CSV. Wyjście wygenerowało liczbę kolumn i wierszy wewnątrz EMP.plik CSV. W funkcji nagłówek jest domyślnie ustawiony na true. Wynika to z faktu, że liczba wierszy nie obejmuje głowy; ten CSV ma pięć kolumn i osiem wierszy.
Przykład 4: Przeczytaj wartość miną z pliku CSV w R w Ubuntu 20.04
Dane CSV można wykorzystać do zastosowania funkcji agregatora (.). Znak $ służy do zastosowania funkcji min () do kolumny.
W przypadku danych zmiennych najpierw odczytowaliśmy plik CSV. Następnie mamy funkcję min () zastosowaną do kolumny EMP_DATA. EMP_DATA zwróciła minimalną finansowanie wartości z pliku CSV. Tam mamy drugie zapytanie, które otrzyma maksymalną wartość z określonej kolumny z pliku CSV emp_data.
Czytamy maksymalną wartość z EMP.plik CSV za pomocą funkcji Max w kolumnie EMP_SALARY. Ta funkcja wygeneruje maksymalną pensję z EMP.Tabela CSV.
Przykład 5: Przeczytaj plik CSV i utwórz plik CSV podzbioru w R w Ubuntu 20.04
Funkcję podzbioru () w R może być użyta do wyodrębnienia odpowiedniego wyniku z zapytań SQL na zawartości CSV. Różne zapytania można uruchomić w tym samym czasie, każda oddzielona przez operatora logicznego. W R wynik jest zapisywany jako ramka danych.
Z odczytu.Funkcja CSV, która jest przechowywana w danych zmiennych, odczytowaliśmy EMP.Informacje CSV. Zmienna nowa_csv jest ustalana, gdy nazywaliśmy funkcję podzbioru i do funkcji podzbioru, zastosowaliśmy warunek. Wytworzony podzbiór danych jest zapisywany jako ramka danych, która spełnia warunki określone w argumentach funkcji. W wynikającej z tego ramce liczby wierszy są zachowane.
Wniosek
W tym artykule wyjaśniono, jak czytać z plików CSV. Funkcje w R są obszerne. Odczyt.Funkcja CSV () w R zapewnia nam odczytanie pliku CSV, który jest obecnie w naszym katalogu roboczym. Odczyt.Funkcja csv () bierze nazwę pliku jako argument i zwraca wszystkie zawarte w niej rekordy. Dzięki operacjom CSV widzieliśmy, jak tworzyć i czytać z plików CSV w R. Zapytania SQL są również stosowane do pliku CSV, który odczytał określone kolumny w satysfakcjonujących warunkach.