Python中的正则表达式如何匹配数字？

Python正则表达式：精准匹配数字的技巧全解析

在Python编程中，处理文本数据时经常需要提取其中的数字信息，无论是整数、浮点数还是特定范围内的数值，正则表达式（Regex）都是完成这类任务的强大工具，本文将直接给出答案：通过合理构建正则表达式模式，结合Python的re模块，可以高效且准确地匹配文本中的各类数字，我们将深入探讨如何实现这一目标,并分享一些实用技巧。

基本数字匹配

最基础的数字匹配莫过于寻找文本中的整数，在正则表达式中，数字可以通过\d来匹配，它等价于[0-9]，若要匹配一个或多个连续的数字，可以使用\d+。

import re
text = "我有25本书，还有100元钱。"
numbers = re.findall(r'\d+', text)
print(numbers)  # 输出: ['25', '100']

这段代码成功地从文本中提取了所有整数。

匹配浮点数

当需要匹配浮点数时，情况稍微复杂一些，因为浮点数包含小数点，一个简单的浮点数匹配模式可以是\d+\.\d+，这表示一个或多个数字后跟一个小数点,再后跟一个或多个数字。

text = "圆周率约为3.14，而自然对数的底数e约为2.71828。"
floats = re.findall(r'\d+\.\d+', text)
print(floats)  # 输出: ['3.14', '2.71828']

考虑正负号及科学计数法

数字还可能带有正负号，或是以科学计数法表示，为了匹配这些情况,我们可以扩展正则表达式模式：

匹配可选的正负号：[-+]?\d+（整数部分）或[-+]?\d+\.\d+（浮点数部分）。
科学计数法通常包含e或E后跟一个整数，表示10的幂次，如[-+]?\d+\.?\d*[eE][-+]?\d+。

text = "温度变化范围从-5.5度到+45.6度，光速约为2.99792e8米/秒。"
sci_numbers = re.findall(r'[-+]?\d+\.?\d*[eE][-+]?\d+|[-+]?\d+\.\d+', text)
# 注意，这里为了简化，分开写了两种模式，实际findall中用|合并，但可能匹配到不需要的格式，更好的方式是分两次匹配或更精细控制
# 更精确的示例，单独匹配科学计数法和普通浮点数
sci_pattern = r'[-+]?\d+\.?\d*[eE][-+]?\d+'
float_pattern = r'[-+]?\d+\.\d+'
all_numbers = re.findall(f'{sci_pattern}|{float_pattern}', text)  # 实际使用时建议分开处理或使用更复杂的单模式
# 简化处理，直接展示概念
print("科学计数法及浮点数:", all_numbers)  # 输出会包含所有匹配项

更推荐的做法是，根据实际需求,分别匹配或设计一个更综合的模式。

边界与上下文

在处理实际文本时，确保数字匹配的准确性还依赖于对数字出现上下文的理解，使用\b（单词边界）可以帮助确保匹配的是完整的数字而非数字的一部分,匹配独立存在的整数：

text = "版本2更新说明，版本10也即将发布。"
versions = re.findall(r'\b\d+\b', text)
print(versions)  # 输出: ['2', '10'] 这里的实际（正确）匹配了独立的数字词

建立可信度：测试与验证

构建正则表达式后，务必进行充分的测试，使用不同场景下的文本数据验证其准确性和鲁棒性，可以利用在线正则表达式测试工具，如regex101.com，来调试和优化你的模式，阅读Python官方文档关于re模块的部分，了解更多高级功能，如命名组、贪婪与非贪婪匹配等,可以进一步提升正则表达式的应用水平。

掌握Python中的正则表达式，特别是数字的匹配技巧，对于数据处理、信息提取等任务至关重要，通过上述介绍，我们不仅学会了如何匹配基本的整数和浮点数，还探讨了如何处理更复杂的情况，如科学计数法和考虑数字的上下文环境，实践是提高正则表达式技能的最佳途径，不断尝试和优化,你将能更加灵活高效地运用这一强大工具。

未经允许不得转载！ 作者:python1991知识网，转载或复制请以超链接形式并注明出处Python1991知识网。

原文地址：https://www.python1991.cn/5434.html发布于：2026-04-17