Python CSV Skip Header Row

Python CSV Skip Header Row
W tym artykule dowiemy się, w jaki sposób możemy usunąć nagłówek danych plików CSV podczas czytania samego CSV, ponieważ czasami nie potrzebujemy nagłówka danych plików CSV. Dlatego poznamy te cztery metody, które podano poniżej:
  1. Za pomocą metody następnej ()
  2. Użyj metody DicTreader ()
  3. Skiprows pandy na podstawie określonego numeru wiersza
  4. Skiprows pandy na podstawie pozycji indeksu

Wyjaśnijmy szczegółowo każdą z powyższych metod.

Metoda 1: Za pomocą metody Next ()

W tej metodzie użyjemy metody następnej () i zobaczymy, w jaki sposób ta metoda odrzuci wiersz nagłówka, zanim wydrukujemy wszystkie pozostałe dane CSV.

Plik CSV: Poniższy plik CSV (test.CSV) będziemy korzystać z tego bloga.

Miesiąc, 1958 1959 1960
340 360 417
318 342 391
Mar, 362 406,419
348 396,461
340 360 417
318 342 391 import CSV
z otwartym („test.csv ",„ r ”) jako rekord:
# Tworzymy obiekt czytnika CSV
CSVReader_Object = CSV.czytelnik (rekord)
# Linia pominie pierwszy wiersz pliku CSV (wiersz nagłówka)
Dalej (CSVReader_Object)
# Teraz drukujemy wszystkie wiersze, z wyjątkiem pierwszego wiersza CSV
dla wiersza w CSVReader_Object:
Drukuj (wiersz)

Wyjście:

[„Jan”, „340”, „360”, „417”]
[„Feb”, „318”, „342”, „391”]
[„Mar”, „362”, „406”, „419”]
[„APR”, „348”, „396”, „461”]
[„Jan”, „340”, „360”, „417”]
[„Feb”, „318”, „342”, „391”]

Linia 1: Importujemy moduł CSV.

Linia 3 -7: Otwieramy test.Plik CSV w trybie odczytu („R”) jako rekord, a następnie tworzymy obiekt CSV.Metoda Reader (). Metoda następnego (), kiedy ją wywołujemy, automatycznie odrzuca pierwszy wiersz z obiektu czytnika CSV i resztę danych, których możemy użyć, w miarę potrzeb.

Linie 10-11: Teraz iterujemy obiekt czytnika CSV i drukujemy każdy wiersz. Powyższe wyjście pokazuje, że teraz nie ma wiersza nagłówka.

Metoda 2: Za pomocą metody DICTReader ()

Teraz zobaczymy, jak możemy odczytać CSV jako format słownika. Ale po przeczytaniu pliku CSV jako formatu bezpośredniego wydrukujemy tylko wartość, a nie klucz, który rozwiąże nasz problem drukowania wszystkich danych bez wiersza nagłówka. Używamy tego samego testu.plik CSV, jak używaliśmy wcześniej. Przykład tej metody podano poniżej:

Importuj CSV
z otwartym („test.csv ",„ r ”) jako rekord:
# Tworzymy obiekt czytnika CSV
CSVReader_Object = CSV.DicTreader (rekord)
# Linia pominie pierwszy wiersz pliku CSV (wiersz nagłówka)
# Ponieważ działa to jako dykt, a my drukujemy tylko wartości, a nie klawisze
dla wiersza w CSVReader_Object:
Print (wiersz [„miesiąc”], wiersz [„1958”], wiersz [„1959”], wiersz [„1960”])

Wyjście:

340 360 417
318 lutego 342 391
Mar 362 406 419
348 kwietnia 396 461
340 360 417
318 lutego 342 391

Linia 1: Importujemy moduł CSV.

Linia 3 -5: Otwieramy test.Plik CSV w trybie odczytu („R”) jako rekord, a następnie tworzymy obiekt CSV.Metoda dictreader ().

Linie 8-9: Teraz iterujemy obiekt CSV DICTReader i drukujemy w każdym wierszu. Ale ten wiersz automatycznie odrzuca pierwszy wiersz z obiektu czytnika CSV, ponieważ DicTreader przekształca każdy wiersz w formie DICT (klucz i wartość). Kiedy drukujemy tylko wartość, a nie klucz, który pokazuje tylko dane, a nie k, v, co było naszym głównym celem.

Metoda 3: Korzystanie z atrybutów Skiprows pand_csv

W tej metodzie będziemy używać Skiprows atrybutów pandy read_csv. W Skiprows wspomnimy o numerze wiersza nagłówka, który jest oczywiście 1, więc definiujemy wartość Skiprows jako 1, jak pokazano w poniższym programie. W ten sposób możemy zignorować wiersz nagłówka z CSV podczas czytania danych.

importować pandy jako PD
skipheaderdf = pd.read_csv („test testowy.csv ', skiprows = 1)
Drukuj (Skipheaderdf)

Wyjście:

340 360 417
0 lutego 318 342 391
1 marca 362 406 419
2 kwietnia 348 396 461
3 stycznia 340 360 417
4 lutego 318 342 391

Linia 1: Importujemy bibliotekę panda jako PD.

Linia 2: Czytamy plik CSV za pomocą modułu pand_csv, w tym wspominaliśmy o Skiprows = 1, co oznacza pominięcie pierwszego wiersza podczas odczytu danych pliku CSV CSV.

Linia 4: Teraz drukujemy końcowy wynikFrame pokazany na powyższym wyjściu bez wiersza nagłówka.

Metoda 4: Za pomocą pand usuń nagłówek CSV za pomocą pozycji indeksu

W tej metodzie będziemy używać Skiprows atrybutów pandy read_csv. W Skiprows wspomnimy o numerze pozycji indeksu nagłówka, który jest oczywiście 0, więc definiujemy wartość Skiprows w nawiasach kwadratowych ([0]), jak pokazano w poniższym programie. W ten sposób możemy zignorować wiersz nagłówka z CSV podczas czytania danych.

importować pandy jako PD
skipheaderdf = pd.read_csv („test testowy.csv ', skiprows = [0])
Drukuj (Skipheaderdf)

Wyjście:

340 360 417
0 lutego 318 342 391
1 marca 362 406 419
2 kwietnia 348 396 461
3 stycznia 340 360 417
4 lutego 318 342 391

Linia 1: Importujemy bibliotekę panda jako PD.

Linia 2: Odczytujemy plik CSV za pomocą modułu pand_csv i w tym wspomnieliśmy o Skiprows = [0], co oznacza pominięcie pierwszego wiersza podczas odczytu danych pliku CSV.

Linia 4: Teraz drukujemy końcowy wynikFrame pokazany na powyższym wyjściu bez wiersza nagłówka.

Wniosek:

W tym artykule zawarto cztery różne metody pominięcia wiersza nagłówka podczas czytania pliku CSV. Wszystkie metody w powyższym artykule są idealnie w porządku i są używane przez programista Python do pomijania nagłówka pliku CSV podczas odczytu danych CSV. Metoda biblioteki PandaS nie tylko pozwala nam usunąć nagłówek danych pliku CSV, ale może być również używana do usunięcia innych wierszy, jeśli określamy ich numer lub pozycję indeksu do Skiprows. Więc Skiprows będą w stanie usunąć wszystkie te wiersze, których liczby zostaną im przypisane. Moduł pandas do pomijania nagłówka jest najlepszy w użyciu, a także bardzo wygodny do usuwania pozostałych wierszy.

Dostępne są również inne metody wykorzystujące DICTReader i czytnik, ale są one tylko dla wierszy nagłówka, więc jeśli chcemy usunąć inne wiersze, musimy również napisać inny kod.