0

0

如何用正则与预处理高效拦截带干扰符的恶意域名

霞舞

霞舞

发布时间:2026-01-01 23:06:02

|

997人浏览过

|

来源于php中文网

原创

如何用正则与预处理高效拦截带干扰符的恶意域名

本文介绍一种实用策略:先清理文本中的非字母数字字符,再精确匹配可疑域名根字符串,避免传统正则误杀,有效应对拼接式垃圾链接(如 a#b#c#d#e#f.com)。

在对抗持续性 spam 攻击时,单纯依赖复杂正则(如 (?分两步走:标准化 + 精确匹配。

✅ 第一步:文本净化(Sanitization)

使用 preg_replace 移除所有非字母、非数字字符,保留原始语义骨架:

$cleaned = preg_replace('/[^A-Za-z0-9]/', '', $textfield);
// 示例:
// "a$b$c$d$e$f.com" → "abcdefcom"
// "a b c d e f.com" → "abcdefcom"
// "a#b#c#d#e#f.com" → "abcdefcom"
⚠️ 注意:此操作会合并相邻域名与后缀(如 abcdef.com → abcdefcom),因此第二步需匹配无点号的纯根字符串(如 'abcdef'),而非完整域名 'abcdef.com'。

✅ 第二步:精确子串检测

使用 strpos() 高效判断净化后字符串是否包含目标关键词(区分大小写可选):

家作
家作

淘宝推出的家装家居AI创意设计工具

下载
if (stripos($cleaned, 'abcdef') !== false) {
    // 触发反垃圾逻辑:拒绝提交、标记为垃圾、记录日志等
    throw new Exception('Suspicious obfuscated domain detected.');
}

stripos() 比 preg_match 开销更低,且语义清晰——我们只关心“是否含有该连续字符序列”,不涉及位置、边界或顺序变异。

? 进阶建议

  • 多域名支持:将黑名单存入数组,循环检测:
    $blacklist = ['abcdef', 'xyzspam', 'phishlink'];
    foreach ($blacklist as $domainRoot) {
        if (stripos($cleaned, $domainRoot) !== false) {
            return false;
        }
    }
  • 结合长度/频率限制:对高频出现的异常长字符串(如 >30 字符且含大量符号)追加启发式过滤。
  • 前端+后端双校验:前端做轻量提示,后端强制执行,防止绕过。

该方案兼顾准确性、性能与可维护性,已在多个社区系统中稳定拦截此类“符号分割型”垃圾推广,推荐作为基础防护层的核心逻辑。

相关专题

更多
c#是什么意思
c#是什么意思

C#是一种通用的面向对象编程语言,它在.NET框架上运行,可用于开发各种类型的应用程序。本专题为大家提供c#相关的各种文章、以及下载和课程。

257

2023.08.08

什么是c#
什么是c#

C#(读作C Sharp)是一种现代的、通用的、面向对象的编程语言。它由微软公司开发,于2000年首次发布,主要用于开发Windows桌面应用程序、Web应用程序、移动应用程序以及游戏开发等领域。C#是一种类型安全和托管的编程语言,它结合了C++的强大性能和C语言的简单易学特点,并引入了许多新的特性和概念,如委托、属性、泛型和异步编程等,以提高开发效率和代码可维护性。

177

2023.08.31

C#中base关键字的用法
C#中base关键字的用法

在C#中,base关键字用于访问当前类的基类成员,这包括基类的字段、属性、方法、构造函数、索引器以及事件。想了解更多C#的相关内容,可以阅读本专题下面的文章。

291

2024.03.13

C#Task用法
C#Task用法

Task在C#中是用于表示异步操作的对象,它位于System.Threading.Tasks命名空间中。想了解更多C#中各种用法的相关内容,可以阅读本专题下面的文章。

346

2024.03.14

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

249

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

205

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1435

2023.10.24

字符串介绍
字符串介绍

字符串是一种数据类型,它可以是任何文本,包括字母、数字、符号等。字符串可以由不同的字符组成,例如空格、标点符号、数字等。在编程中,字符串通常用引号括起来,如单引号、双引号或反引号。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

609

2023.11.24

php源码安装教程大全
php源码安装教程大全

本专题整合了php源码安装教程,阅读专题下面的文章了解更多详细内容。

74

2025.12.31

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Node.js 教程
Node.js 教程

共57课时 | 7.7万人学习

CSS3 教程
CSS3 教程

共18课时 | 4.2万人学习

Vue 教程
Vue 教程

共42课时 | 5.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号