Jak odczytać plik Excel w Python

Jak odczytać plik Excel w Python

.XLSX jest rozszerzeniem dokumentu Excel, który może przechowywać dużą ilość danych w formie tabelary. Czasami konieczne jest odczytanie danych z dokumentu Excel za pomocą skryptu Python do celów programowania. W Pythonie istnieje wiele modułów, aby przeczytać dokument Excel. Niektóre z przydatnych modułów są xlrd, OpenPyxl, I Pandy. W tym samouczku pokazano sposoby korzystania z tych modułów do odczytania pliku Excel w Pythonie.

Warunek wstępny:

Manekin excel plik z .Rozszerzenie XLSX będzie zobowiązane do sprawdzenia przykładów tego samouczka. Możesz użyć dowolnego istniejącego pliku Excel lub utworzyć nowy. Tutaj, nowy plik Excel o nazwie obroty.XLSX Plik został utworzony z następującymi danymi. Ten plik użył do czytania przy użyciu różnych modułów Pythona w następnej części tego samouczka.

obroty.XLSX

Data sprzedaży Sprzedawca Kwota
12/05/18 Sila Ahmed 60000
06/12/19 Mir Hossain 50000
09/08/20 Sarmin Jahan 45000
07/04/21 Mahmudul Hasan 30000

Przykład-1: Przeczytaj plik Excel za pomocą XLRD

Moduł XLRD nie jest domyślnie zainstalowany z Pythonem. Więc musisz zainstalować moduł przed użyciem. Najnowsza wersja tego modułu nie obsługuje pliku Excel z .Rozszerzenie XLSX. Musisz więc zainstalować 1.2.0 Wersja tego modułu do odczytania pliku XLSX. Uruchom następujące polecenie z terminalu, aby zainstalować wymaganą wersję xlrd.

$ pip instaluj xlrd == 1.2.0

Po zakończeniu procesu instalacji utwórz plik Python z następującym skryptem, aby odczytać obroty.XLSX plik za pomocą XLRD moduł. Open_Workbook () Funkcja jest używana w skrypcie Otwórz plik XLSX do odczytu. Ten plik Excel zawiera tylko jeden arkusz. Więc zeszyt ćwiczeń.arkusz_by_index () Funkcja została użyta w skrypcie z wartością argumentu 0. Następnie zagnieżdżone 'Do' pętla używała do odczytania wartości komórki arkusza roboczego za pomocą wartości wiersza i kolumny. W skrypcie zastosowano dwie funkcje zakresu () do zdefiniowania rozmiaru wiersza i kolumny na podstawie danych arkusza. cell_value () Funkcja użyto do odczytania konkretnej wartości komórki arkusza w każdej iteracji pętli. Każde pole wyjściowe zostanie oddzielone jedną przestrzenią Tab.

# Zaimportuj moduł XLRD
import xlrd
# Otwórz skoroszyt
skoroszyt = xlrd.Open_Workbook („Sprzedaż.xlsx ")
# Otwórz arkusz
Arkusz = skoroszyt.arkusz_by_index (0)
# Iteruj wiersze i kolumny
Dla i w zakresie (0, 5):
dla J w zakresie (0, 3):
# Wydrukuj wartości komórki za pomocą zakładki
Drukuj (arkusz roboczy.cell_value (i, j), end = '\ t')
wydrukować(")

Wyjście:

Następujące dane wyjściowe pojawią się po wykonaniu powyższego skryptu.

Przykład-2: Przeczytaj plik Excel za pomocą OpenPyxl

OpenPyxl to kolejny moduł Python do odczytania pliku XLSX, a domyślnie nie jest on instalowany z Pythonem. Uruchom następujące polecenie z terminala, aby zainstalować ten moduł przed użyciem.

$ pip instaluj openpyxl

Po zakończeniu procesu instalacji utwórz plik Python z następującym skryptem, aby odczytać obroty.XLSX plik. Jak moduł XLRD, Openpyxl moduł ma load_workbook () funkcja, aby otworzyć plik XLSX do odczytu. obroty.XLSX Plik jest używany jako wartość argumentu tej funkcji. Obiekt Wookbook.aktywny został utworzony w skrypcie, aby odczytać wartości max_row i Max_Column nieruchomości. Właściwości te zostały wykorzystane w zagnieżdżonych pętlach do odczytania treści obroty.XLSX plik. Funkcja Range () została użyta do odczytania wierszy arkusza, a funkcja ITER_COLS () została użyta do odczytu kolumn arkusza. Każde pole wyjściowe będzie oddzielone dwiema przestrzeniami TAB.

# Importuj moduł Openyxl
importować OpenPyxl
# Zdefiniuj zmienną, aby załadować Wookbook
Wookbook = OpenPyxl.Load_Workbook („Sprzedaż.xlsx ")
# Zdefiniuj zmienną, aby odczytać aktywny arkusz:
Arkusz = Wookbook.aktywny
# Iteruj pętlę, aby odczytać wartości komórki
Dla i w zakresie (0, arkusz roboczy.max_row):
dla col w arkuszu.ITER_COLS (1, arkusz roboczy.Max_Column):
Drukuj (col [i].wartość, end = "\ t \ t")
wydrukować(")

Wyjście:

Następujące dane wyjściowe pojawią się po wykonaniu powyższego skryptu.

Przykład-3: Przeczytaj plik Excel za pomocą pandy

Moduł pandas nie jest instalowany z Pythonem poprzednim modułem. Więc jeśli nie zainstalowałeś go wcześniej, musisz go zainstalować. Uruchom następujące polecenie, aby zainstalować Pandy z terminalu.

$ pip instaluj pandy

Po zakończeniu procesu instalacji utwórz plik Python z następującym skryptem, aby odczytać obroty.XLSX plik. read_excel () Funkcja pandy służy do odczytu pliku XLSX. Ta funkcja użyła w skrypcie do odczytania obroty.XLSX plik. Ramka danych() Funkcja użyto tutaj do odczytania zawartości pliku XLSX w ramce danych i przechowywania wartości w nazwie zmiennej dane. Wartość danych została wydrukowana później.

# Importuj pandy
importować pandy jako PD
# Załaduj plik XLSX
excel_data = pd.read_excel („sprzedaż.xlsx ')
# Przeczytaj wartości pliku w ramce danych
dane = PD.DataFrame (excel_data, kolumny = [
„Data sprzedaży”, „sprzedawca”, „kwota”])
# Wydrukuj treść
Drukuj („Zawartość pliku to: \ n”, dane)

Wyjście:

Następujące dane wyjściowe pojawią się po wykonaniu powyższego skryptu. Wyjście tego skryptu różni się od dwóch poprzednich przykładów. Liczby wierszy są wydrukowane w pierwszej kolumnie, gdzie wartość wiersza liczyła się od 0. Wartości daty są wyrównane centralnie. Nazwy sprzedawców są w prawo. Kwota jest wyrównana w lewo.

Wniosek:

Użytkownicy Python muszą pracować z plikami XLSX do różnych celów programowania. W tym samouczku pokazano trzy różne sposoby odczytania pliku XLSX za pomocą trzech modułów Python. Każdy moduł ma inne funkcje i właściwości do odczytania pliku XLSX. Ten samouczek pomoże użytkownikom Python w przeczytaniu pliku XLSX za pomocą skryptu Pythona po przeczytaniu tego samouczka.