Python提取字符串中数字的核心是识别连续数字字符,常用正则表达式(如r'-?\d+.?\d*(?:eE?\d+)?'支持整数、小数、科学计数法)、re.findall(r'\d+', text)提取纯数字块、逐字符遍历或filter(str.isdigit, text)获取单个数字字符。

Python 提取字符串中的数字,核心是识别并捕获连续的数字字符(包括整数、负数、小数),常用方法有正则表达式、循环遍历和内置方法组合。关键看你要提取的是纯整数、带符号数,还是支持小数、科学计数法等。
用正则表达式提取所有数字(最常用)
正则表达式灵活高效,适合大多数场景。注意区分不同需求:
- 只提整数(含负数):
re.findall(r'-?\d+', text) - 提小数(含负小数):
re.findall(r'-?\d+\.?\d*', text)(简单匹配,但会匹配123.这类) - 更严谨的小数匹配:
re.findall(r'-?\d+\.?\d+|-?\.\d+', text)或使用r'-?\d*\.?\d+'配合过滤空字符串 - 同时支持整数、小数、科学计数法:
re.findall(r'-?\d+\.?\d*(?:[eE][+-]?\d+)?', text)
示例:
import re
text = "价格:-25.8元,温度:36.5℃,误差±1e-3"
nums = re.findall(r'-?\d+\.?\d*(?:[eE][+-]?\d+)?', text)
print(nums) # ['-25.8', '36.5', '1e-3']
提取连续数字片段(不含小数点)
如果只需要“一串纯数字”(比如身份证、电话号码中的数字块),忽略小数点和符号:
- 用
re.findall(r'\d+', text)提取所有连续数字子串 - 结果是字符串列表,可用
int()转整型(注意溢出和位数)
示例:
text = "房间号A305,订单ID: 987654321"
digits = re.findall(r'\d+', text)
print(digits) # ['305', '987654321']
print([int(x) for x in digits]) # [305, 987654321]
逐字符判断 + 累积拼接(适合自定义逻辑)
不依赖正则时,可手动遍历,控制更细(如跳过千分位逗号、保留原始格式):
- 遍历字符串,用
char.isdigit()判断是否为数字字符(不支持负号、小数点) - 若需支持负号和小数点,需状态机逻辑:记录是否已遇数字、是否允许负号/小数点
- 推荐仅在正则无法满足特殊规则时使用(如“只取第2个数字块”或“跳过带单位的数字”)
用 filter + str.isdigit 提取单个数字字符
如果只是想把字符串中所有**单独的数字字符**('0'~'9')抽出来拼成新字符串(不保留多位数结构):
''.join(filter(str.isdigit, text))- 例如
"a1b2c3"→"123" - 注意:这会打散多位数,
"abc123"变成"123"(结果一样),但"x1y22z333"也变成"122333",丢失分组信息











