正则表达式+Python re模块详解

　域名预订/竞价，好“米”不错过

正则表达式（Regluar Expressions）又称规则表达式，在代码中常简写为REs，regexes或regexp（regex patterns）。这篇文章主要介绍了正则表达式+Python re模块详解,需要的朋友可以参考下

正则表达式（Regluar Expressions）又称规则表达式，在代码中常简写为REs，regexes或regexp（regex patterns）。它本质上是一个小巧的、高度专用的编程语言。通过正则表达式可以对指定的文本实现

匹配测试、内容查找、内容替换、字符串分割等功能。

re模块介绍

Python中的re模块提供了一个正则表达式引擎接口，它允许我们将正则表达式编译成模式对象，然后通过这些模式对象执行模式匹配搜索和字符串分割、子串替换等操作。re模块为这些操作分别提供了模块级别的函数以及相关类的封装。

Python --> re模块 findall

会优先显示分组内的内容

*****取消优先显示(?:正则)

只能返回第一个符合条件的项

得到的结果需要.group取值

默认获取完整的匹配结果

通过group(n)取第n个分组中的内容

# search 还是按照完整的正则进行匹配,显示也显示匹配到的第一个内容,但是我们可以通过给group方法传参数
# 来获取具体文组中的内容
ret = re.search('9(\d)(\d)','19740ash93010uru')
print(ret) # 变量 -- > <re.Match object; span=(1, 4), match='974'>
if ret:
print(ret.group()) # --> 974
print(ret.group(1)) # --> 7
print(ret.group(2)) # --> 4

# findall
# 取所有符合条件的,优先显示分组中的
# search 只取第一个符合条件的,没有优先显示这件事儿
# 得到的结果是一个变量
# 变量.group() 的结果完全和变量.group(0)的结果一致
# 变量.group(n) 的形式来指定获取第n个分组中匹配到的内容

# 加上括号是为了对真正需要的内容进行提取
ret = re.findall('<\w+>(\w+)</\w+>','<h1>askh930s02391j192agsj</h1>')
print(ret) # --> ['askh930s02391j192agsj']

其他的内容在代码中有详细的注释，大家可以复制我的代码一步一步运行然后实验

以下的内容有：split sub subn math,compile,finditer

# split sub subn math,compile,finditer
# split
res = re.split('\d+', "cyx123456cyxx")
print(res) # --> ['cyx', 'cyxx']
res = re.split('(\d+)', "cyx123456cyxx") # 保留分组
print(res) # --> ['cyx', '123456', 'cyxx']
# sub 替换
res = re.sub('\d+', '我把数字替换了',
"cyx123456cyxxx123456") # 默认全部替换，当然也可以替换一次re.sub('\d+','我把数字替换了',"cyx123456cyxxx123456"，1)
print(res) # --> cyx我把数字替换了cyxxx我把数字替换了
# subn 替换了并显示替换的次数
res = re.subn('\d+', '我把数字替换了', "cyx123456cyxxx123456")
print(res) # --> ('cyx我把数字替换了cyxxx我把数字替换了', 2)
# match 这个就相当与加了个^ (和search差不多) --> 主要用来规定这个字符号必须是什么样的
res = re.match('\d+', 'cyx123456cyxxx')
print(res) # --> None
res = re.match('\d+', '123cyx456cyxxx')
print(res.group()) # --> 123
# compile -- 节省代码的时间的工具
# 假如同一个正则表达式要被使用多次
# 节省了多次解析同一个正则表达式的时间
ret = re.compile("\d+")
res = ret.search("cyx12456cyxXX123")
print(res.group()) # --> 12456
# finditer --> 节省空间
ret = re.finditer("\d+", "cyx123456cyxxx125644")
for r in ret:
print(r.group()) # --> 123456
# 125644
# 怎么又节省时间又节省空间呢？
ret = re.compile('\d+')
res = ret.finditer("cyx222231fddsf45746sdf2123sdf56456sdf10123sdf123132sdf")
for r in res:
print(r.group())
"""
222231
45746
2123
56456
10123
123132
"""
# 分组命名(?P<组名>正则) (?P=组名)
# 有的时候我们要匹配的内容是包含在不想要的内容之中的,
# 只能先把不想要的内容匹配出来,然后再想办法从结果中去掉
# 分组命名的用法 (找两个组里面是一样的内容)
exp = '<abc>asdasf54545645698asdasd</abc>00545sdfsdf</abd>'
ret = re.search('<(?P<tag>\w+)>.*?</(?P=tag)', exp)
print(ret) # -- > <re.Match object; span=(0, 33), match='<abc>asdasf54545645698asdasd</abc'>
# exp2：
import re
ret = re.search('\d(\d)\d(\w+?)(\d)(\w)\d(\d)\d(?P<name1>\w+?)(\d)(\w)\d(\d)\d(?P<name2>\w+?)(\d)(\w)',
'123abc45678agsf_123abc45678agsf123abc45678agsf')
print(ret.group('name1')) # -- > agsf_123abc
print(ret.group('name2')) # -- > agsf

今日小思考

当我们有一个这样的列表：

lis = ['', 'z', 'c', 'asd', 'sdf', '', 'asd']

那么我们如何将里面的空字符删除呢？

ret = filter(lambda n: n, lis)
print(list(ret)) # --> ['z', 'c', 'asd', 'sdf', 'asd']

总结

到此这篇关于正则表达式+Python re模块详解的文章就介绍到这了,更多相关正则表达式 python re模块内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

来源：脚本之家

链接：https://www.jb51.net/article/183375.htm

申请创业报道，分享创业好点子。点击此处，共同探讨创业新机遇！

Eclipse使用正则表达式快速修改代码的方法

这篇文章主要介绍了Eclipse使用正则表达式快速修改代码的方法，本文给大家介绍的非常详细，具有一定的参考借鉴价值,需要的朋友可以参考下

标签：

正则表达式

代码设计
通过正则表达式验证IP和端口格式的正确性

这篇文章主要介绍了正则表达式验证IP和端口格式的正确性，本文给大家介绍的非常详细，具有一定的参考借鉴价值,需要的朋友可以参考下

标签：

正则表达式
java正则表达式判断前端参数修改表中另一个字段的值

这篇文章主要介绍了java正则表达式判断前端参数修改表中另一个字段的值,需要的朋友可以参考下

标签：

正则表达式

java
使用正则表达式生成随机数据的方法

这篇文章主要介绍了使用正则表达式生成随机数据的方法，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧

标签：

正则表达式
js处理网页编辑器转义去除转义去除HTML标签的正则

这篇文章主要介绍了富文本编辑器生成的HTML标签，进行转义，然后写入数据库，防止脚本注入,需要的朋友可以参考下

标签：

正则表达式

html

当前位置：首页 > 站长 > 编程技术 > 正文

正则表达式+Python re模块详解

相关文章

Eclipse使用正则表达式快速修改代码的方法

通过正则表达式验证IP和端口格式的正确性

java正则表达式判断前端参数修改表中另一个字段的值

使用正则表达式生成随机数据的方法

js处理网页编辑器转义去除转义去除HTML标签的正则

热门排行

信息推荐

编辑推荐

VS2019属性管理器没有Microsoft.Cpp.x64.user的解决办法

JS页面动态绘图工具SVG，Canvas，VML介简介

热门标签

当前位置：首页 > 站长 > 编程技术 > 正文

正则表达式+Python re模块详解

相关文章

Eclipse使用正则表达式快速修改代码的方法

通过正则表达式验证IP和端口格式的正确性

java正则表达式判断前端参数修改表中另一个字段的值

使用正则表达式生成随机数据的方法

js处理网页编辑器转义 去除转义 去除HTML标签的正则

热门排行

信息推荐

编辑推荐

VS2019属性管理器没有Microsoft.Cpp.x64.user的解决办法

JS页面动态绘图工具SVG，Canvas，VML介简介

热门标签

js处理网页编辑器转义去除转义去除HTML标签的正则