解决人脸识别考勤系统中重复写入CSV文件的问题

DDD

发布时间：2025-10-21 13:04:17

365人浏览过

来源于php中文网

原创

解决人脸识别考勤系统中重复写入csv文件的问题

本文旨在解决在使用OpenCV进行人脸识别考勤时，由于代码逻辑问题导致考勤信息重复写入CSV文件的问题。通过分析问题代码，找出重复写入的原因，并提供修改后的代码示例，确保考勤记录的准确性和唯一性。文章还讨论了进一步优化方案，例如将已记录的名字列表保存在内存中，避免重复读取文件，提高程序效率。

在人脸识别考勤系统中，实时从摄像头捕获图像，识别出人脸并记录考勤信息是常见的需求。然而，在实际应用中，可能会遇到重复记录考勤信息的问题。本文将针对这个问题，提供详细的解决方案和优化建议。

问题分析

原代码的问题在于 markAttendance 函数中，每次检测到人脸时，都会打开 Attendance.csv 文件，读取所有行，然后检查当前识别到的人名是否已存在于列表中。由于 if name not in nameList: 语句位于 for 循环内部，因此每次循环都会进行一次判断，导致在同一帧图像中多次识别到同一张脸时，会重复写入考勤信息。

解决方案

核心思路是将判断人名是否已存在于列表中的逻辑，从 for 循环内部移到循环外部，确保只有在读取完所有已存在的人名后，才进行判断和写入操作。

以下是修改后的 markAttendance 函数代码：

def markAttendance(name):
    with open('Attendance.csv','r+') as f:
        myDataList = f.readlines()
        nameList = []
        for line in myDataList:
            entry = line.split(',')
            nameList.append(entry[0])
        # 循环结束后再进行判断
        if name not in nameList:
            now = datetime.now()
            dtString = now.strftime('%H:%M:%S')
            f.writelines(f'\n{name},{dtString}')

代码解释：

读取所有已存在的人名： 首先，打开 Attendance.csv 文件，读取所有行，并将每行的人名添加到 nameList 列表中。
判断人名是否已存在： 在循环结束后，判断当前识别到的人名 name 是否已存在于 nameList 列表中。
写入考勤信息： 如果 name 不在 nameList 列表中，则获取当前时间，并将人名和时间写入 Attendance.csv 文件。

进一步优化：将已记录的名字列表保存在内存中

每次调用 markAttendance 函数都读取整个 CSV 文件效率较低。更优化的方案是在程序启动时一次性读取所有已记录的名字，并将其保存在内存中。后续的考勤记录直接与内存中的列表进行比较，只有在发现新的人名时才写入文件，并更新内存中的列表。

雪鸮AI

高效便捷的智能绘图辅助工具，一键生成高质量效果图。

下载

以下是优化后的代码示例：

def readNames():
    with open('Attendance.csv', 'r') as f:
        nameList = []
        for line in f:
            entry = line.split(',')
            nameList.append(entry[0])
    return nameList

def markAttendance(name, nameList):
    if name not in nameList:
        nameList.append(name)   # add directly to list
        # write to file
        with open('Attendance.csv', 'a') as f:
            dt = datetime.now().strftime('%H:%M:%S')
            f.writelines(f'\n{name},{dt}')

# --- 程序启动时 ---
nameList = readNames()   # read only once at start

# --- 在主循环中 ---
while True:
    # ...
    if matches[matchIndex]:
        # ...
        markAttendance(name, nameList)

代码解释：

readNames() 函数： 在程序启动时调用，读取 Attendance.csv 文件中的所有人名，并返回一个列表。
markAttendance(name, nameList) 函数： 接收人名和内存中的 nameList 作为参数。如果人名不在 nameList 中，则将其添加到 nameList 中，并将考勤信息写入 Attendance.csv 文件。
程序启动时： 调用 readNames() 函数，将已记录的人名加载到 nameList 列表中。
主循环中： 在检测到人脸后，调用 markAttendance(name, nameList) 函数进行考勤记录。

注意事项：

在多线程或多进程环境中，需要考虑线程安全或进程安全问题，确保对 nameList 的访问是同步的。
如果 Attendance.csv 文件非常大，一次性读取可能会占用大量内存。可以考虑使用数据库或其他更高效的数据存储方式。

总结

本文针对人脸识别考勤系统中重复写入 CSV 文件的问题，提供了两种解决方案：

修改 markAttendance 函数的逻辑，将判断人名是否已存在的逻辑移到循环外部。 这种方法简单易懂，适用于数据量较小的情况。
将已记录的名字列表保存在内存中，避免重复读取文件。 这种方法可以提高程序效率，适用于数据量较大的情况。

选择哪种方案取决于具体的应用场景和性能需求。在实际应用中，可以根据需要进行调整和优化，以达到最佳的考勤效果。

Python爬虫实现APP接口抓取与反调试对抗的关键技术【技巧】

Kivy应用界面不显示？理解并正确使用build()方法返回根部件

Kivy应用UI显示问题：理解并正确使用build()方法的返回值

Kivy 控件显示故障排除：build() 方法的正确使用

在python-socketio事件处理器中安全访问Flask应用上下文

相关专题

if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词，用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章，供大家免费阅读。

723

2023.08.22

线程和进程的区别

线程和进程的区别：线程是进程的一部分，用于实现并发和并行操作，而线程共享进程的资源，通信更方便快捷，切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

478

2023.08.10

Python 多线程与异步编程实战

本专题系统讲解 Python 多线程与异步编程的核心概念与实战技巧，包括 threading 模块基础、线程同步机制、GIL 原理、asyncio 异步任务管理、协程与事件循环、任务调度与异常处理。通过实战示例，帮助学习者掌握如何构建高性能、多任务并发的 Python 应用。

143

2025.12.24

数据库三范式

数据库三范式是一种设计规范，用于规范化关系型数据库中的数据结构，它通过消除冗余数据、提高数据库性能和数据一致性，提供了一种有效的数据库设计方法。本专题提供数据库三范式相关的文章、下载和课程。

340

2023.06.29

如何删除数据库

删除数据库是指在MySQL中完全移除一个数据库及其所包含的所有数据和结构，作用包括：1、释放存储空间；2、确保数据的安全性；3、提高数据库的整体性能，加速查询和操作的执行速度。尽管删除数据库具有一些好处，但在执行任何删除操作之前，务必谨慎操作，并备份重要的数据。删除数据库将永久性地删除所有相关数据和结构，无法回滚。

2072

2023.08.14