Pandy przeczytaj TSV

Pandy przeczytaj TSV

W „Pandy” możemy łatwo odczytać pliki, tak jak możemy odczytać pliki CSV, możemy odczytać pliki TSV, możemy odczytać pliki tekstowe, a także możemy odczytać SQL. Wyjaśniamy tutaj plik TSV. Jest to plik formatu tekstowego, w którym dane tabelaryczne są przechowywane w formacie tekstowym. Możemy łatwo utworzyć lub odczytać plik „Wartość oddzielona na zakładce” w „Pandy”, ponieważ „pandy” zawiera wbudowaną funkcję, która pomaga w tworzeniu i czytaniu plików TSV. W tym samouczku omówimy metody, które „pandy” zapewniają nam do odczytania pliku TSV. Utworzymy i odczytujemy plik TSV, a także konwertujemy jego dane po odczytaniu pliku TSV w DataFrame.

Metody czytania pliku TSV w „Pandy”

Możemy odczytać plik TSV za pomocą dwóch metod „pandy” i wykorzystamy te dwie metody w tym samouczku. Metody podano poniżej:

  • Metoda read_table ().
  • Metoda read_csv ().

Przykład nr 01: Za pomocą metody „read_table ()”

Używamy narzędzia „Spyder”, aby pomóc w generowaniu kodów „pandy”. Przed opisem koncepcji odczytania pliku TSV wyjaśniliśmy, w jaki sposób możemy utworzyć plik TSV w „Pandy”. Importujemy bibliotekę „Pandy”, a następnie tworzymy ramkę danych „new_df”, w której wprowadziliśmy niektóre kolumny. Dane są również wprowadzane do każdej kolumny. Wprowadziliśmy „NEW_NAME, NEW_1, NEW_2, NEW_3, NEW_4 i NEW_5”, które są kolumnami „NEW_DF”.

Następnie dodaliśmy metodę „to_csv ()”, w której dodajemy nazwę pliku. Wkładamy „Newfile.TSV ”, który przekonwertuje ramkę danych, którą utworzyliśmy w tym kodzie na plik TSV i nazwie ten plik„ NewFile.TSV ”. Dostosowaliśmy również parametr „SEP”, w którym dodaliśmy „\ t” jako jego wartość. Teraz „Newfile.TSV ”jest tworzony. Pokażmy również ten plik TSV.

Naciskujemy „Shift+Enter”, który wykonuje kody i „NewFile.Następnie generowany jest TSV ”. Ten plik TSV pokazano poniżej. Tutaj dane z ramki danych są przechowywane w formie tekstowej. Teraz przeczytamy również ten plik TSV.

Ponownie zaimportowaliśmy „pandy” w nowym pliku. Przeczytamy plik TSV, który stworzyliśmy powyżej. Umieszczamy „My_DataFrame”, który po przeczytaniu przechowuje dane pliku TSV. Korzystamy z „PD.read_table () ”i przekazuj nazwę pliku, który musimy odczytać, który jest„ NewFile.TSV ”. Ta metoda odczytuje dane obecne w pliku TSV i wygeneruje ramkę danych danych pliku TSV, a następnie zapisz je w „my_DataFrame”. Następnie „my_dataframe” jest wprowadzany do „print ()”. Tak więc zostanie wydrukowany na terminalu podczas wykonania.

Kiedy uruchamiamy ten kod „pandy”, dane z pliku TSV są wyświetlane jako oprawa danych na terminalu. Dane pliku TSV są pokazane poniżej, które otrzymujemy po odczytaniu pliku TSV.

Przykład nr 02: Za pomocą metody „read_csv ()”

Możemy również odczytać plik TSV, używając metody „read_csv ()”. Tutaj używamy metody „read_csv ()” do czytania „NewFile.TSV ”. Zainicjujemy zmienną „dane” za pomocą metody „read_csv ()”, a także dodaliśmy dwa parametry. Najpierw dodaliśmy nazwę pliku, a następnie ustawiamy parametr „SEP”. Jego wartość jest dostosowywana jako „\ t”. Tutaj drukujemy również „dane” za pomocą „print ()”.

Pokazuje także dane pliku TSV w formacie DataFrame lub możemy powiedzieć, że w formie tabelarycznej. Obie metody działają tak samo i zwracają ten sam wynik.

Przykład nr 03:

Nowy plik TSV jest renderowany poniżej. Teraz musimy odczytać dane z tego pliku TSV, wykorzystując metodę „Pandy”.

Dodaliśmy metodę „read_table ()” do odczytu pliku TSV, ale tym razem dodaliśmy jeszcze jeden parametr. Po dodaniu nazwy pliku TSV, który jest „edukacją.TSV ”, dodaliśmy również parametr„ indeks_col ”, który pomaga w dostosowaniu kolumny indeksu ramki danych, która jest tworzona po odczytaniu pliku TSV. Dostosowujemy kolumnę „losową nazwę” jako indeks DataFrame. Tak więc, gdy kod zostanie wykonany, plik zostanie odczytany, wówczas otrzymany przez nas danych będzie miał „losową nazwę” jako kolumnę indeksu. Po przeczytaniu wyświetlamy również dane pliku TSV za pomocą „print ()”.

Widać tutaj, że powyższe dane pliku TSV są wyświetlane w formie tabelarycznej. Otrzymujemy tę ramkę danych, odczytując plik TSV za pomocą metody „read_table ()”. Należy również zauważyć, że kolumna „losowa nazwa” jest ustawiona tutaj jako kolumna indeksu.

Przykład nr 04:

Teraz mamy kolejny plik TSV, który pokazano poniżej. Plik zawiera dane w formacie tekstowym. Będziemy również przeczytać ten plik.

Stworzyliśmy zmienną „New_Columns”. Dodajemy niektóre nazwy, ponieważ chcemy dostosować te nazwy jako nazwy kolumnów DataFrame, które otrzymujemy po odczytaniu pliku TSV, który pokazano powyżej. Dodane nazwy to „class_mammals, class_fish, class_repatiles, class_amphibians i class_birds”. Następnie zastosowaliśmy metodę „Read_Table”, w której dodaliśmy trzy parametry. Po pierwsze, wstawiliśmy „zwierzęta_data.TSV ”, który jest nazwą pliku TSV, a następnie skorygował„ Brak ”do parametru„ nagłówka ”. Dodaliśmy również „nowe_kolumny”, które zainicjowaliśmy w tym kodzie do parametru „nazw”. Tak więc nazwy, które dodaliśmy powyżej, są dostosowywane jako nazwy kolumnów DataFrame. Następnie renderujemy dane za pomocą „print ()”.

Dane pokazane w formacie tekstowym w powyższym pliku TSV są konwertowane na DataFrame. Nowe nazwy kolumn, które dodaliśmy w kodzie, są renderowane, a poprzednie nazwy kolumn są przekształcane w wiersz lub wartości tych kolumn.

Przykład nr 05:

Czytamy ten sam plik, który pokazaliśmy w przykładzie 4, ale tym razem pomijamy kilka wierszy po przeczytaniu „Animal_data.plik tsv ”. Właśnie dodaliśmy czwarty parametr do metody „read_table ()”, która jest parametrem „skiprows”. Ustaw to na „4”, ponieważ chcemy pominąć cztery pierwsze rzędy danych generowanych po przeczytaniu „Animal_data.TSV ”.

Pramka danych jest ponownie renderowana, ale pierwsze cztery rzędy nie są obecne w tym ramie danych, ponieważ pominęliśmy rzędy „4” DataFrame.

Przykład nr 06:

Ponownie czytamy „zwierzęta_data.plik tsv ”, ale z metodą„ read_csv () ”. Weszliśmy do „zwierząt_data.tsv ”, a następnie ustaw„ SEP ”na„ \ t ”. Ponadto dostosowaliśmy wartość „Brak” dla „nagłówka”, a nazwy, które tutaj dodamy, zostaną ustawione jako nazwy kolumn. Painowaliśmy tylko jeden wiersz za pomocą parametru „Skiprows”.

Otrzymana, którą otrzymujemy, jest wyświetlana, a nazwy kolumn są odpowiednio dostosowane, jak wprowadziliśmy w kodzie. Ponadto pierwszy wiersz jest usuwany z ramki danych tutaj.

Przykład nr 07:

Pokazany jest jeszcze jeden plik TSV. Teraz pokażemy, jak uzyskać wybraną kolumnę po przeczytaniu pliku TSV.

Zastosowaliśmy metodę „read_table ()” i dodaliśmy nowy parametr, który jest parametrami „usecols” i dodaliśmy nazwę kolumny, którą chcemy uzyskać z „samochodów.plik tsv ”. Dodaliśmy „cenę”, która jest nazwą kolumny. Teraz będzie dostępny tylko do danych kolumny „ceny” i zapisuje je w „CarSDF”. Następnie renderujemy dane kolumny „ceny” tutaj.

Wyświetlana jest tylko jedna kolumna, ponieważ dostosowaliśmy parametr „Usecols” w metodzie „read_table ()”. Więc nie pokazało tutaj całych danych pliku TSV.

Wniosek

Możemy odczytać różne pliki w „Pandy” za pomocą metody „pand”. Tak więc napisaliśmy ten samouczek, w którym wyjaśniliśmy, jak odczytać plik TSV w „Pandy”. Najpierw wyjaśniliśmy tworzenie pliku TSV, a następnie omówiliśmy dwie metody w tym samouczku, które pomagają w czytaniu danych pliku TSV. Wyjaśniliśmy tutaj metodę „read_table ()”, a także metodę „read_csv ()” i wyjaśniliśmy, w jaki sposób te metody pomagają odczytać plik TSV w „Pandy”. Wykorzystaliśmy te metody w tym samouczku, dodając różne parametry za każdym razem w każdym kodzie do uzyskania różnych wyników.