openpyxl主打写入与新建,支持.xlsx等格式并控制样式;xlrd仅读.xls文件,2.0+版不再支持.xlsx;推荐pandas+openpyxl组合处理数据与格式。

用 Python 处理 Excel 文件,openpyxl 和 xlrd 是两个最常用但定位不同的库:前者主打「写入 + 新建 + 格式控制」,后者专注「读取旧版 Excel(.xls)」。现在多数场景推荐优先用 openpyxl(支持 .xlsx/.xlsm/.xltx/.xltm),而 xlrd 自 2.0 版起已停止支持 .xlsx 文件读取,仅能读 .xls —— 这点务必注意,否则会报错 Unsupported format, or corrupt file。
openpyxl:读写 Excel 的主力工具
适合新建表格、修改现有 .xlsx 文件、调整单元格样式、处理公式和图表等。
-
加载工作簿:
from openpyxl import load_workbook;wb = load_workbook("data.xlsx")(默认保留格式);如只需数据可加read_only=True加速大文件读取 -
选工作表:
ws = wb["Sheet1"]或ws = wb.active -
读单元格:
ws["A1"].value或ws.cell(row=1, column=1).value -
写入内容:
ws["B2"] = "Hello";批量写可用ws.append([1, 2, 3])(追加一行) -
保存文件:
wb.save("output.xlsx")(不能覆盖正在打开的 Excel 文件,会报错)
xlrd:只读 .xls 文件的遗留方案
适用于维护老系统中大量 .xls 格式报表,不建议用于新项目。
-
安装注意:必须用
pip install xlrd==1.2.0(高版本不支持 .xlsx) -
读取示例:
import xlrd;book = xlrd.open_workbook("old.xls");sheet = book.sheet_by_name("Sheet1") -
获取数据:
sheet.cell_value(0, 0)(行索引、列索引均从 0 开始);sheet.row_values(1)读整行 - 不支持写入:xlrd 是纯读取库,任何写操作都会报错
替代方案推荐:pandas + openpyxl 组合
日常数据处理中,更高效的方式是用 pandas 做逻辑运算,再用 openpyxl 补充格式或写入多 sheet:
立即学习“Python免费学习笔记(深入)”;
- 读取:
df = pd.read_excel("data.xlsx", sheet_name="Sales") - 计算后写回:
with pd.ExcelWriter("report.xlsx", engine="openpyxl") as writer:
df.to_excel(writer, sheet_name="Summary", index=False)
df.groupby("Region").sum().to_excel(writer, sheet_name="ByRegion") - 后续还能用
writer.book获取 openpyxl 工作簿对象,继续设置字体、边框、冻结窗格等
常见坑与应对
-
日期读出来是数字:openpyxl 默认把 Excel 日期转为
datetime对象;若看到浮点数(如 44562.0),说明该单元格未被识别为日期类型,可手动用xlrd.xldate_as_datetime(cell_value, book.datemode)(xlrd)或检查源文件单元格格式 - 中文乱码:openpyxl 本身无编码参数,乱码多因 Excel 文件本身保存异常,建议用 Excel 软件另存为 UTF-8 兼容格式(.xlsx),或统一用 pandas 读取(自动处理较好)
-
内存占用大:处理超大 Excel(>10 万行)时,避免全量加载,改用
openpyxl.load_workbook(..., read_only=True)+ 迭代读取,或换用pyxlsb(支持 .xlsb)或polars+python-calamine(更快更省内存)










