Hướng dẫn cách để trích xuất dữ liệu từ file excel bằng python.
Hiện thực
Cài đặt gói xlrd
Truy cập https://pypi.org/project/xlrd/#files để tải gói xlrd:

Sau khi tải về, giải nén và truy cập đến thư mục và chạy cmd:

Cửa sổ cmd hiện lên gõ vào dòng lệnh sau để tiến hành cài đặt:
python setup.py install

Sau khi cài đặt thành công:

Đọc dữ liệu
Tạo trước một file excel để demo như sau:

Đọc dữ liệu từ file trên
import xlrd file_location = "D:/data_demo.xlsx" wb = xlrd.open_workbook(file_location) sheet = wb.sheet_by_index(0) print sheet.nrows print sheet.ncols print sheet.cell_value(3, 1)
Giải thích:
- Dòng 1: Import gói
xlrd
. - Dòng 2:
file_location
lưu vị trí của filedata_demo.xlsx
- Dòng 3: Truy cập đến file excel ở trên thông qua biến
wb
. - Dòng 4: Truy cập đến sheet mong muốn trong file. Nếu muốn truy cập đến sheet n của file thì giữa 2 dấu ngoặc tròn là
n-1
. - Dòng 5: In ra số dòng của bảng.
- Dòng 6: In ra số cột của bảng.
- Dòng 7: Giá trị tại vị trí dòng 3+1 cột 1+1. Tức vị trí
B4
trong bảng tính.
Lấy dữ liệu trên một cột hay một dòng
Ví dụ 1:
for rows in range(sheet.nrows): print sheet.cell_value(rows, 0)
Ví dụ in ra tất cả các giá trị của cột đầu tiên.
Ví dụ 2:
for col in range(sheet.ncols): print sheet.cell_value(0, col)
Ví dụ in ra tất cả các giá trị của dòng đầu tiên.
Lấy toàn bộ dữ liệu của bảng
data = [[sheet.cell_value(r, c) for c in range(sheet.ncols)] for r in range(sheet.nrows)]
Dòng lên trên giúp lấy toàn bộ dữ liệu trong bảng lưu vào data
. Biến data
này mang kiểu dữ liệu giống như là một mảng 2 chiều. Vì vậy khi muốn lấy giá trị nào từ bảng, lấy thông qua biến data
này tương tự ví dụ sau:
In ra giá trị của cột B4
tức Mido Lê
:
print data[3][1]
Demo

Kết quả:

Download file demo.zip.