Python正则表达式和元字符详解

2020-02-15 23:49:37

字体：大中小

来源：转载

供稿：网友

正则表达式

正则表达式是一种强大的字符串操作工具。它是一种领域特定语言 (DSL)，不管是 Python 还是在大多数现代编程语言中都是作为库存在。

它们主要面向两种任务：

- 验证字符串是否与模式匹配（例如，字符串具有电子邮件地址的格式）。
- 在字符串中执行替换（例如将所有大写字母改成小写字母）。

特定于领域的语言是高度专业化的迷你编程语言。

正则表达式是一个例子，SQL（用于数据库操作）是另一个例子。

私有领域特定语言通常用于特定的工业目的。

Python 的正则表达式可以使用 re 模块访问，re 模块是标准库的一部分。

当你定义一个正则表达式，可以使用 re.match 函数用于确定是否匹配字符串的开始部分。如果匹配则 match 函数返回表示匹配的对象，如果不匹配则返回 None。

为了避免在处理正则表达式时出现混淆，我们将 r 添加到字符串前缀。该字符串不需要转义任何东西，使得正则表达式的使用变得更容易。

from re import matchmsg = r"super"if match(msg,"superman!"): print("You are True")else: print("Occur an error! Foolish...")

运行结果：

>>>
You are True
>>>

上面的例子检查模式 super 是否匹配字符串，如果匹配，则打印 You are True。

这里的模式是一种简单的单词，但是有些字符串，在正则表达式中使用它们时会有特殊的意义。

匹配模式的其他函数有 re.match 和 re.findall。

re.match 在字符串中找到匹配。
re.findall 返回一个包含匹配的列表。

import restring = "Hello python!Hello python!Hello python!"pattern = r".python."print(re.match(pattern,string))print(re.findall(pattern,string))

运行结果：

>>>
None
[' python!', ' python!', ' python!']
>>>

从上面的示例中，我们可以得出：

match() 函数是从内容的第一个字符开始匹配，如果匹配不到，就得到None
findall() 函数从全部内容匹配，如果有多个，找出所有匹配的

函数 re.finditer 执行与 re.findall 相同的操作，但它返回一个迭代器，而不是一个列表。

正则表达式的 search 函数返回一个对象，包含几个更详细的信息。

此方法包括返回字符串匹配的值，返回第一次匹配的开始和结束位置，以及以元组形式返回第一个匹配的开始和结束位置的 span 函数。

import restring = "Hello python!Hello python!Hello python!"pattern = r".python."match = re.search(pattern,string)if match: print(match.group()) print(match.start()) print(match.end()) print(match.span())

上一篇：Selenium chrome配置代理Python版的方法

下一篇：在python中只选取列表中某一纵列的方法

学习交流

如何重启打印机打印服务

如何重启打印机打印服务...

热门图片

猜你喜欢的新闻

猜你喜欢的关注

新闻热点

明兮语文停止运营发展资金链断裂

2020-02-16 09:52:44

2006年李俊编写了“熊猫烧香”电脑病毒，现在过得怎么样？

2020-02-15 15:53:44

谷歌合并Alphabet旗下子公司Jigsaw，未来会如何发展？

2020-02-11 22:02:38

NASA说今天地球引力最小能让扫帚立起来？原因很简单

2020-02-11 21:45:12

TCL集团宣布今日起正式更名为“TCL科技”

2020-02-07 10:36:18

黑莓曲终落，情怀价几何？

2020-02-06 12:16:44

疑难解答

图片精选

网友关注