re.findall() 是 Python 中用于一次性提取字符串中所有符合正则模式子串的函数,返回列表;含捕获组时仅返回组内内容,多行或大小写匹配需添加对应标志位。

re.findall() 是 Python 中最常用、最直接的正则匹配提取工具,它能一次性找出字符串中所有符合模式的子串,并以列表形式返回,不重叠、不遗漏。
最常见场景是提取所有数字、邮箱、手机号等固定格式内容。例如:
re.findall(r'\d+', '价格:299元,折扣后199.5元') → ['299', '1995'](注意小数点未被包含)re.findall(r'\d+\.\d+|\d+', '原价399.99,现价249') → ['399.99', '249']
re.findall(r'[a-zA-Z]+', 'Hello, 你好!Python3.11 is great.') → ['Hello', 'Python', 'is', 'great']
如果正则表达式中包含一个或多个 捕获组(即圆括号 ()),findall 默认只返回组内匹配的内容,而不是整个匹配项:
re.findall(r'(\d{4})-(\d{2})-(\d{2})', '日期:2023-12-25 和 2024-01-01') → 返回列表套元组:[('2023', '12', '25'), ('2024', '01', '01')]
re.findall(r'(\d{4})-\d{2}-\d{2}', '2023-12-25') → ['2023']
(?:...) 或去掉括号;或者改用 re.finditer() 配合 .group(0)
默认情况下 . 不匹配换行符,^/$ 只匹配字符串首尾。遇到跨行文本时需显式传入标志:
立即学习“Python免费学习笔记(深入)”;
re.findall(r'\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b', text, re.MULTILINE)
re.findall(r'python', 'Python and python', re.IGNORECASE) → ['Python', 'python']
re.findall(pattern, text, re.M | re.I)
对大量文本反复使用同一正则时,推荐先用 re.compile() 编译,避免重复解析:
phone_pattern = re.compile(r'1[3-9]\d{9}'),后续直接调用 phone_pattern.findall(text)
[int(x) for x in re.findall(r'\d+', 'id: 101, score: 87') if x.isdigit()]
掌握 findall 的核心在于理解它的“贪婪全量提取”特性,以及括号对返回结构的影响。写正则时先在在线工具(如 regex101)验证模式,再封装进代码,准确率和可维护性都会明显提高。
以上就是Python查找所有匹配项_findall使用实例讲解【教程】的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号