最稳妥方式是用 PhpSpreadsheet 逐行读取、校验文件类型、跳过空行与表头、构建列名映射、清洗数据(邮箱/日期/数值)、事务内批量插入。

用 PhpSpreadsheet 读取 Excel 文件最稳妥
PHP 原生不支持 Excel 解析,fgetcsv() 只能处理 CSV,对 .xlsx/.xls 格式会直接报错或读出乱码。现在主流且维护活跃的库是 PhpSpreadsheet(PHPExcel 已停止更新)。它支持 xlsx、xls、ods 等格式,且无扩展依赖(纯 PHP 实现)。
安装方式:
composer require phpoffice/phpspreadsheet
注意:memory_limit 要调高(如 256M 或更高),否则大文件会触发 Fatal error: Allowed memory size exhausted;另外,避免用 $_FILES['file']['tmp_name'] 直接传给 IOFactory::load() 后不做校验——若上传的是空文件或非 Excel 类型(比如 .txt 重命名成 .xlsx),会抛出 Could not open ... for reading! File does not exist. 或更隐蔽的解析异常。
读取时跳过空行和表头,用 getActiveSheet()->getRowIterator() 控制粒度
很多人用 $worksheet->toArray() 一把梭,但该方法会把所有空白单元格转成 null 或空字符串,导致后续插入数据库时字段错位。更可控的方式是逐行遍历,手动判断是否为有效数据行。
立即学习“PHP免费学习笔记(深入)”;
- 先用
$spreadsheet->getActiveSheet()->getHighestRow()获取最大行号,避免循环到几万行空行 - 从第 2 行开始遍历(假设第 1 行是表头),用
$row->getCellIterator()遍历每列,再用$cell->getValue()取值 - 对每一行,用
array_filter($rowData, 'strlen')判断是否全为空;若为空,continue -
getValue()默认会自动类型转换(日期变时间戳、数字去零等),如需原始字符串,改用$cell->getFormattedValue()
插入数据库前必须做字段映射和数据清洗
Excel 列名(A列/B列)和数据库字段名通常不一致,硬编码列索引(如 $rowData[0])极易出错:用户调整 Excel 列序、多插入一列、隐藏列,都会导致数据插进错误字段。正确做法是先读取首行作为键名,构建映射关系:
$header = $worksheet->rangeToArray('A1:' . $columnLetters[$highestColumn] . '1')[0];
$columnMap = array_flip(array_map('trim', $header)); // ['用户名' => 0, '邮箱' => 1, ...]
之后每行数据按字段名提取:
$data = [
'username' => $rowData[$columnMap['用户名']] ?? '',
'email' => $rowData[$columnMap['邮箱']] ?? '',
];
关键清洗动作:
- 用
filter_var($email, FILTER_VALIDATE_EMAIL)校验邮箱格式 - 用
mb_trim()(或自定义函数)处理中文空格、全角空格、换行符 - 日期字段用
\PhpOffice\PhpSpreadsheet\Shared\Date::excelToDateTimeObject()转标准DateTime,再格式化为Y-m-d H:i:s - 数值字段用
is_numeric()+(float)强转,避免插入字符串引发 MySQL 类型警告
批量插入要用 PDO::prepare() + execute(),别拼 SQL
逐条 INSERT 插入 1000 行 Excel 数据,可能耗时数秒甚至超时;而用单条 INSERT INTO ... VALUES (),(),() 拼接又容易触发 max_allowed_packet 错误或 SQL 注入风险(尤其当 Excel 含单引号、反斜杠)。
推荐方案:预处理语句 + 批量执行(每次 100~500 行):
$pdo->beginTransaction();
$stmt = $pdo->prepare("INSERT INTO users (username, email, created_at) VALUES (?, ?, ?)");
foreach (array_chunk($allData, 100) as $chunk) {
foreach ($chunk as $row) {
$stmt->execute([$row['username'], $row['email'], $row['created_at']]);
}
}
$pdo->commit();
注意点:
- 务必包裹在事务中,否则中途失败会导致部分写入
- 不要在循环内反复
prepare(),只准备一次 - 如果表有唯一索引,可用
INSERT IGNORE或ON DUPLICATE KEY UPDATE处理重复数据,但需提前确认业务逻辑是否允许覆盖
Excel 导入真正的难点不在读取,而在字段对齐、空值/异常值容忍、事务一致性——这些地方漏掉一个检查,上线后就容易出现“看着导入成功,查数据库却少了几百条”或者“手机号全变成科学计数法”。











