R Przeczytaj CSV

R Przeczytaj CSV
Plik CSV to zwykły dokument, który może zawierać listę danych oddzielonych przecinkami. Te pliki są często używane do przesyłania danych między aplikacjami. Pliki CSV są powszechnie obsługiwane przez bazy danych i menedżerów kontaktu. Celem jest eksport wyrafinowanych danych z jednej aplikacji do pliku CSV, który można następnie zaimportować do innej aplikacji. W tym artykule poznamy sposób czytania treści z pliku CSV. R powinien być w stanie odczytać plik, jeśli jest umieszczony w bieżącym katalogu zajęty. Możemy oczywiście stworzyć stamtąd nasz nowy katalog i odczytać pliki dokumentów. R pozwala nam odczytać zawartość z plików, które nie są w środowisku R. R W języku programowania może czytać i komponować różne typy plików, w tym CSV, Excel i XML.

Jaki jest plik CSV w języku programowania R w Ubuntu 20.04?

Format pliku CSV (wartości oddzielone przecinki) jest powszechnym sposobem zapisywania danych tabelarycznych w arkuszach kalkulacyjnych i bazach danych. Plik CSV to zwykły dokument tekstowy zawierający dane tabelaryczne (liczba całkowita i tekst). Odpowiednia linia w pliku dotyczy rekordu danych. Przecinek jest wykorzystywany jako separator pola, który nadaje temu formatowi tego formatu pliku. W języku programowania R znajduje się nieodłączny moduł o nazwie CSV, który umożliwia działanie z plikami CSV. Funkcja odczytania pliku CSV w języku programowania R ma następującą składnię.

Czytać.CSV („File_name”)

Odczyt.CSV () to metoda opakowania do odczytu.tabela (), która używa przecinka jako separatora. Pierwszy wiersz pliku wejściowego jako nagłówka dla nazw kolumn danej tabeli. W związku z tym jest to ogromny wybór do odczytu plików CSV.

Jak odczytać plik CSV w języku programowania R w Ubuntu 20.04?

W wielu przypadkach odczyt danych z pliku CSV jest niezbędny podczas uruchamiania analizy za pomocą R. Jeśli chodzi o czytanie plików CSV, R jest niezwykle niezawodne. W tym celu potrzebujemy danych do odczytu, zapisu lub zmiany danych w R. Tutaj mamy kilka ilustracji, jak utworzyć plik CSV i go odczytać. Przeprowadziliśmy także różne operacje na pliku CSV, które odczytują te konkretne dane z pliku CSV w języku skryptu R.

Przykład 1: Tworzenie pliku CSV w R w Ubuntu 20.04

Ustawiliśmy ramę danych pracowników z szczegółami niektórych pracowników. Następnie zapisz to w EMP.plik CSV.

Przykład 2: Przeczytaj z pliku CSV w R w Ubuntu 20.04

Odczyt.Funkcja CSV () w R może odczytać pełny tekst pliku CSV jako ramkę danych. Plik CSV do odczytania musi być albo w katalogu roboczym, albo katalog musi zostać odpowiednio ustalony w funkcji s setWd (). Odczyt.Funkcja CSV () może również odczytać plik CSV za pośrednictwem adresu URL.

Jak wyżej, zdefiniowaliśmy zmienną jako emp_data. EMP_DATA jest przypisany do odczytu.funkcja CSV, w której podana jest nazwa pliku. Ponieważ mamy plik EMP.CSV obecne w naszym bieżącym katalogu R może łatwo interpretować ten plik. Kiedyś polecenie wydruku jest podane w wierszu r. Wyświetla zawartość pliku CSV w formie tabelarycznej.

Przykład 3: Oceniono plik CSV w R w Ubuntu 20.04

Odczyt.Funkcja CSV () wytwarza ramkę danych jako domyślne wyjście. Oto szybkie podejście, aby to sprawdzić. Można również sprawdzić częstotliwość kolumn i wierszy danych plików CSV.

W poleceniu drukowania nazwali funkcję NCOL dla kolumn i nrow dla wierszy. Funkcje te są następnie przekazywane ze zmienną emp_data z powyższego przykładu, która ma całą zawartość pliku CSV. Wyjście wygenerowało liczbę kolumn i wierszy wewnątrz EMP.plik CSV. W funkcji nagłówek jest domyślnie ustawiony na true. Wynika to z faktu, że liczba wierszy nie obejmuje głowy; ten CSV ma pięć kolumn i osiem wierszy.

Przykład 4: Przeczytaj wartość miną z pliku CSV w R w Ubuntu 20.04

Dane CSV można wykorzystać do zastosowania funkcji agregatora (.). Znak $ służy do zastosowania funkcji min () do kolumny.

W przypadku danych zmiennych najpierw odczytowaliśmy plik CSV. Następnie mamy funkcję min () zastosowaną do kolumny EMP_DATA. EMP_DATA zwróciła minimalną finansowanie wartości z pliku CSV. Tam mamy drugie zapytanie, które otrzyma maksymalną wartość z określonej kolumny z pliku CSV emp_data.

Czytamy maksymalną wartość z EMP.plik CSV za pomocą funkcji Max w kolumnie EMP_SALARY. Ta funkcja wygeneruje maksymalną pensję z EMP.Tabela CSV.

Przykład 5: Przeczytaj plik CSV i utwórz plik CSV podzbioru w R w Ubuntu 20.04

Funkcję podzbioru () w R może być użyta do wyodrębnienia odpowiedniego wyniku z zapytań SQL na zawartości CSV. Różne zapytania można uruchomić w tym samym czasie, każda oddzielona przez operatora logicznego. W R wynik jest zapisywany jako ramka danych.

Z odczytu.Funkcja CSV, która jest przechowywana w danych zmiennych, odczytowaliśmy EMP.Informacje CSV. Zmienna nowa_csv jest ustalana, gdy nazywaliśmy funkcję podzbioru i do funkcji podzbioru, zastosowaliśmy warunek. Wytworzony podzbiór danych jest zapisywany jako ramka danych, która spełnia warunki określone w argumentach funkcji. W wynikającej z tego ramce liczby wierszy są zachowane.

Wniosek

W tym artykule wyjaśniono, jak czytać z plików CSV. Funkcje w R są obszerne. Odczyt.Funkcja CSV () w R zapewnia nam odczytanie pliku CSV, który jest obecnie w naszym katalogu roboczym. Odczyt.Funkcja csv () bierze nazwę pliku jako argument i zwraca wszystkie zawarte w niej rekordy. Dzięki operacjom CSV widzieliśmy, jak tworzyć i czytać z plików CSV w R. Zapytania SQL są również stosowane do pliku CSV, który odczytał określone kolumny w satysfakcjonujących warunkach.