0

0

如何在Windows中查找重复文件?(PowerShell脚本)

尼克

尼克

发布时间:2025-12-26 18:01:02

|

421人浏览过

|

来源于php中文网

原创

可利用PowerShell通过计算SHA256哈希值识别重复文件:一、遍历目录分组哈希值;二、导出结果至CSV;三、限定扩展名提升效率;四、自定义函数支持参数配置;五、排除符号链接避免误判。

如何在windows中查找重复文件?(powershell脚本)

如果您希望在Windows系统中快速识别并定位内容完全相同的文件,则可以利用PowerShell脚本通过计算文件哈希值来比对文件内容。以下是几种可直接运行的PowerShell方法:

一、使用Get-FileHash按目录扫描查找重复文件

该方法遍历指定路径下所有文件,为每个文件生成SHA256哈希值,并将相同哈希值的文件分组,从而识别内容重复的文件集合。

1、以管理员身份打开PowerShell。

2、执行以下命令,将C:\TargetFolder替换为您要扫描的实际路径:

3、Get-ChildItem -Path "C:\TargetFolder" -File -Recurse | ForEach-Object { $_ | Get-FileHash -Algorithm SHA256 } | Group-Object -Property Hash | Where-Object Count -gt 1 | ForEach-Object { $_.Group | Select-Object -Property Path, Hash }

二、导出重复文件列表到CSV文件

此方法在识别重复文件的同时,将结果保存为CSV格式,便于后续查看或筛选,避免控制台输出截断问题。

1、在PowerShell中输入以下命令,注意修改C:\TargetFolderC:\Duplicates.csv为实际路径:

2、Get-ChildItem -Path "C:\TargetFolder" -File -Recurse | Get-FileHash -Algorithm SHA256 | Group-Object Hash | Where-Object Count -gt 1 | ForEach-Object { $_.Group | Select-Object Path, Hash } | Export-Csv -Path "C:\Duplicates.csv" -NoTypeInformation -Encoding UTF8

三、仅比较特定扩展名的文件

为提升效率并减少误匹配,可限制脚本仅处理常见文档或媒体类型(如.jpg、.pdf、.docx),跳过系统文件或临时文件。

1、运行以下命令,其中@("*.jpg","*.png","*.pdf","*.docx")可根据需要增删扩展名:

ChatWP
ChatWP

一个AI聊天机器人,可以直接回答你的WordPress问题。

下载

2、$Extensions = @("*.jpg","*.png","*.pdf","*.docx"); Get-ChildItem -Path "C:\TargetFolder" -Include $Extensions -File -Recurse | Get-FileHash -Algorithm SHA256 | Group-Object Hash | Where-Object Count -gt 1 | ForEach-Object { $_.Group | Select-Object FullName, Length, LastWriteTime }

四、使用自定义函数实现更灵活的重复检测

该方案封装为可复用函数,支持指定路径、算法、排除目录及最小文件大小阈值,增强实用性与可控性。

1、在PowerShell中定义函数:

2、function Find-DuplicateFiles { param([string]$Path, [string]$Algorithm = "SHA256", [int]$MinSize = 0); Get-ChildItem $Path -File -Recurse | Where-Object { $_.Length -ge $MinSize } | Get-FileHash -Algorithm $Algorithm | Group-Object Hash | Where-Object Count -gt 1 | ForEach-Object { $_.Group | Select-Object FullName, Length, Hash } }

3、调用函数,例如查找大于1KB的重复文件:

4、Find-DuplicateFiles -Path "C:\TargetFolder" -MinSize 1024

五、跳过符号链接与硬链接以避免误判

PowerShell默认会解析符号链接指向的目标文件,可能导致同一物理文件被多次计入。启用-FollowSymlink参数控制行为可规避该问题。

1、若需忽略符号链接本身、仅处理真实文件,请添加-Attributes !ReparsePoint筛选条件:

2、Get-ChildItem -Path "C:\TargetFolder" -File -Recurse -Attributes !ReparsePoint | Get-FileHash -Algorithm SHA256 | Group-Object Hash | Where-Object Count -gt 1 | ForEach-Object { $_.Group | Select-Object FullName }

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

311

2023.08.02

counta和count的区别
counta和count的区别

Count函数用于计算指定范围内数字的个数,而CountA函数用于计算指定范围内非空单元格的个数。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

191

2023.11.20

php中foreach用法
php中foreach用法

本专题整合了php中foreach用法的相关介绍,阅读专题下面的文章了解更多详细教程。

35

2025.12.04

string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

311

2023.08.02

int占多少字节
int占多少字节

int占4个字节,意味着一个int变量可以存储范围在-2,147,483,648到2,147,483,647之间的整数值,在某些情况下也可能是2个字节或8个字节,int是一种常用的数据类型,用于表示整数,需要根据具体情况选择合适的数据类型,以确保程序的正确性和性能。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

513

2024.08.29

c++怎么把double转成int
c++怎么把double转成int

本专题整合了 c++ double相关教程,阅读专题下面的文章了解更多详细内容。

46

2025.08.29

C++中int的含义
C++中int的含义

本专题整合了C++中int相关内容,阅读专题下面的文章了解更多详细内容。

183

2025.08.29

length函数用法
length函数用法

length函数用于返回指定字符串的字符数或字节数。可以用于计算字符串的长度,以便在查询和处理字符串数据时进行操作和判断。 需要注意的是length函数计算的是字符串的字符数,而不是字节数。对于多字节字符集,一个字符可能由多个字节组成。因此,length函数在计算字符串长度时会将多字节字符作为一个字符来计算。更多关于length函数的用法,大家可以阅读本专题下面的文章。

899

2023.09.19

虚拟号码教程汇总
虚拟号码教程汇总

本专题整合了虚拟号码接收验证码相关教程,阅读下面的文章了解更多详细操作。

25

2025.12.25

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Go 教程
Go 教程

共32课时 | 3万人学习

Go语言实战之 GraphQL
Go语言实战之 GraphQL

共10课时 | 0.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号