
1. 理解CSV文件导入需求
在web应用开发中,从csv文件导入数据到数据库是常见的需求。csv(comma separated values)文件以纯文本形式存储表格数据,每行记录由逗号或其他特定字符分隔。本教程将以一个包含两列数据的csv文件为例,演示如何将其导入到mysql数据库的users表中。
示例CSV数据格式:
BGYR002217;FK-066 BGYR002218;FK-140
注意,此示例中数据字段的分隔符是分号(;),而非默认的逗号(,)。
2. 核心技术栈
- PHP: 服务器端脚本语言,用于处理文件上传和数据库交互。
- PDO (PHP Data Objects): PHP的数据库抽象层,提供统一的API访问多种数据库,支持预处理语句,增强安全性和性能。
- MySQL/MariaDB: 关系型数据库管理系统,用于存储数据。
3. 构建数据库表结构
首先,我们需要在MySQL数据库中创建一个用于存储CSV数据的表。假设表名为users,包含szam和forras_szam两列。
CREATE TABLE `users` (
`id` INT AUTO_INCREMENT PRIMARY KEY,
`szam` VARCHAR(255) NOT NULL,
`forras_szam` VARCHAR(255) NOT NULL
);4. PHP文件上传与解析
为了导入CSV文件,通常需要一个HTML表单供用户上传文件,然后PHP脚本接收并处理该文件。
立即学习“PHP免费学习笔记(深入)”;
4.1 HTML文件上传表单
创建一个简单的HTML文件(例如 index.html)来提供文件上传功能:
m18麦考林整站 for Ecshop v2.7.3 安装方法: 1,解压rar包上传到网站根目录 2,导入sql数据库文件,到你的数据库里,可以phpmyadmin等软件 3,修改data里config.php里面的数据库 用户名 密码等信息 为你自己的数据库信息 4,安装完毕之后的后台用户名密码为: 后台地址:域名/admin 用户名:admin 密码:admin123 模板使用教程: htt
CSV文件导入
上传CSV文件到MySQL
4.2 PHP处理脚本 (import.php)
这是核心的PHP脚本,负责数据库连接、CSV文件读取、解析和数据插入。
PDO::ERRMODE_EXCEPTION, // 错误报告模式:抛出异常
PDO::ATTR_DEFAULT_FETCH_MODE => PDO::FETCH_ASSOC, // 默认获取模式:关联数组
PDO::ATTR_EMULATE_PREPARES => false // 禁用模拟预处理,使用原生预处理
]
);
} catch (PDOException $ex) {
exit("数据库连接失败: " . $ex->getMessage());
}
// 3. 检查文件上传
if (!isset($_FILES["upcsv"]) || $_FILES["upcsv"]["error"] !== UPLOAD_ERR_OK) {
exit("文件上传失败或未选择文件。错误码: " . ($_FILES["upcsv"]["error"] ?? 'N/A'));
}
$tmpFilePath = $_FILES["upcsv"]["tmp_name"];
if (!is_uploaded_file($tmpFilePath)) {
exit("无效的文件上传。");
}
// 4. 打开并读取CSV文件
// 注意:fgetcsv 默认分隔符是逗号(,), 如果CSV文件使用分号(;)作为分隔符,需要明确指定
$fh = fopen($tmpFilePath, "r");
if ($fh === false) {
exit("无法打开上传的CSV文件。");
}
// 准备SQL插入语句,使用正确的PDO占位符 `?`
// 错误示例:VALUES (?;?)
// 正确示例:VALUES (?,?)
$stmt = $pdo->prepare("INSERT INTO users (szam, forras_szam) VALUES (?, ?)");
$importedRows = 0;
while (($row = fgetcsv($fh, 0, ';')) !== false) { // 明确指定分号作为分隔符
// 检查行数据是否有效,防止空行或格式不符的行导致错误
if (count($row) < 2) {
echo "跳过无效行: " . implode(';', $row) . "
";
continue;
}
try {
// 执行预处理语句,绑定CSV行数据到占位符
$stmt->execute([$row[0], $row[1]]);
$importedRows++;
} catch (PDOException $ex) {
// 捕获并输出每行导入的错误信息,而不是中断整个过程
echo "导入行错误: " . implode(';', $row) . " - " . $ex->getMessage() . "
";
}
}
// 5. 关闭文件句柄
fclose($fh);
echo "导入完成!成功导入 " . $importedRows . " 行数据。";
?>5. 关键点解析与常见问题解决
5.1 PDO占位符的正确使用
原始问题中出现的错误 SQLSTATE[42000]: Syntax error or access violation: 1064 You have an error in your SQL syntax;... VALUES (?;?) 明确指出SQL语法错误。
问题根源: PDO预处理语句中,参数占位符只能是问号(?)或具名参数(例如:param_name)。将分号(;)用作占位符是错误的语法。分号在SQL中通常用作语句的终止符,而不是参数绑定符号。
解决方案: 将SQL语句中的 VALUES (?;?) 改为 VALUES (?,?)。
// 错误示例:
// $stmt = $pdo->prepare("INSERT INTO users (szam, forras_szam) VALUES (?;?)");
// 正确示例:
$stmt = $pdo->prepare("INSERT INTO users (szam, forras_szam) VALUES (?, ?)");5.2 fgetcsv函数与CSV分隔符
原始CSV数据 BGYR002217;FK-066 使用分号作为字段分隔符。fgetcsv函数默认使用逗号(,)作为分隔符。如果CSV文件使用其他字符作为分隔符,必须在fgetcsv函数的第三个参数中明确指定。
问题根源: 如果未指定分隔符,fgetcsv会将 BGYR002217;FK-066 视为单个字段读取到 $row[0] 中,导致 $row[1] 未定义,从而引发 Undefined array key 1 警告,并最终导致 execute 方法参数不足或不正确。
解决方案: 在调用 fgetcsv 时,将分隔符参数设置为分号(;):
// 错误示例(如果CSV使用分号分隔):
// while (($row = fgetcsv($fh)) !== false) { ... }
// 正确示例:
while (($row = fgetcsv($fh, 0, ';')) !== false) { // 0表示最大行长度不限制,';'是分隔符
// ...
}5.3 错误处理与健壮性
在实际应用中,对文件操作和数据库操作进行适当的错误处理至关重要。
- 文件上传错误: 使用 $_FILES["upcsv"]["error"] 检查上传状态,并使用 is_uploaded_file() 确保文件是通过HTTP POST上传的。
- 文件打开错误: 检查 fopen() 的返回值是否为 false。
- PDO连接错误: 使用 try-catch 块捕获 PDOException。
- PDO执行错误: 在循环内部,为每次 execute() 调用添加 try-catch 块,这样即使某一行数据导入失败,也不会中断整个导入过程,可以记录错误并继续处理下一行。
- 数据有效性检查: 在处理 $row 数组之前,检查 count($row) 以确保行数据包含预期的列数,避免 Undefined array key 错误。
6. 最佳实践与注意事项
- 使用预处理语句: 始终使用PDO预处理语句来插入或更新数据,这可以有效防止SQL注入攻击,并提高重复执行相同SQL语句的性能。
- 明确字符集: 在PDO连接字符串中指定charset(例如utf8mb4),并确保数据库、表和列的字符集也一致,以避免乱码问题。
- 错误报告: 在开发环境中,将PDO::ATTR_ERRMODE设置为PDO::ERRMODE_EXCEPTION,以便在出现数据库错误时抛出异常,方便调试。在生产环境中,可以考虑将错误记录到日志文件而非直接输出给用户。
-
处理大文件: 对于非常大的CSV文件,逐行读取并插入可能会导致性能问题或内存耗尽。可以考虑以下优化:
- 事务处理: 每隔N行提交一次事务,减少数据库操作的开销。
- LOAD DATA INFILE: 如果PHP脚本和MySQL服务器在同一台机器上,并且有文件系统权限,LOAD DATA INFILE是导入大量数据最快的方法。
- 分块读取: 如果内存是瓶颈,可以分块读取CSV文件。
- 用户体验: 对于长时间运行的导入任务,考虑在前端显示进度条,或使用AJAX异步处理,避免页面超时。
7. 总结
通过本教程,我们学习了如何使用PHP和PDO将CSV文件导入MySQL数据库。核心要点包括:正确使用PDO预处理语句的占位符(?),以及根据CSV文件的实际分隔符配置fgetcsv函数。同时,强调了错误处理、健壮性设计和性能优化在数据导入过程中的重要性。遵循这些指导原则,将能够构建出高效、安全且稳定的CSV数据导入功能。










