电子产品世界 » 论坛首页 » 综合技术 » 基础知识 » Python3常用正则表达式整理及详解

共1条 1/1 1 跳转至页

Python3常用正则表达式整理及详解

助工

2020-09-14 14:30:18 打赏

　　今天扣丁学堂Python培训给大家详细介绍一下关于Python3正则表达式详解，首先大多数人都知道正则表达式是一个特殊的字符序列，它能帮助你方便的检查一个字符串是否与某种模式匹配。而Python自1.5版本起增加了re模块，它提供Perl风格的正则表达式模式。

　　re模块使Python语言拥有全部的正则表达式功能。

　　compile函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象。该对象拥有一系列方法用于正则表达式匹配和替换。

　　re模块也提供了与这些方法功能完全一致的函数，这些函数使用一个模式字符串做为它们的第一个参数。

　　re.match函数

　　re.match尝试从字符串的起始位置匹配一个模式，如果不是起始位置匹配成功的话，match()就返回none。

　　函数语法：

　　re.match(pattern,string,flags=0)

　　函数参数说明：

　　参数描述

　　pattern匹配的正则表达式

　　string要匹配的字符串。

　　flags标志位，用于控制正则表达式的匹配方式，如：是否区分大小写，多行匹配等等。

　　匹配成功re.match方法返回一个匹配的对象，否则返回None。

　　我们可以使用group(num)或groups()匹配对象函数来获取匹配表达式。

　　匹配对象方法描述

　　group(num=0)匹配的整个表达式的字符串，group()可以一次输入多个组号，在这种情况下它将返回一个包含那些组所对应值的元组。

　　groups()返回一个包含所有小组字符串的元组，从1到所含的小组号。

　　实例1：

　　#!/usr/bin/python

　　#-*-coding:UTF-8-*-

　　importre

　　print(re.match('www','www.runoob.com').span())#在起始位置匹配

　　print(re.match('com','www.runoob.com'))#不在起始位置匹配

　　以上实例运行输出结果为：

　　(0,3)

　　None

　　实例2：

　　#!/usr/bin/python3

　　importre

　　line="Catsaresmarterthandogs"

　　matchObj=re.match(r'(.*)are(.*?).*',line,re.M|re.I)

　　ifmatchObj:

　　print("matchObj.group():",matchObj.group())

　　print("matchObj.group(1):",matchObj.group(1))

　　print("matchObj.group(2):",matchObj.group(2))

　　else:

　　print("Nomatch!!")

　　以上实例执行结果如下：

　　matchObj.group():Catsaresmarterthandogs

　　matchObj.group(1):Cats

　　matchObj.group(2):smarter

　　re.search方法

　　re.search扫描整个字符串并返回第一个成功的匹配。

　　函数语法：

　　re.search(pattern,string,flags=0)

　　函数参数说明：

　　参数描述

　　pattern匹配的正则表达式

　　string要匹配的字符串。

　　flags标志位，用于控制正则表达式的匹配方式，如：是否区分大小写，多行匹配等等。

　　匹配成功re.search方法返回一个匹配的对象，否则返回None。

　　我们可以使用group(num)或groups()匹配对象函数来获取匹配表达式。

　　匹配对象方法描述

　　group(num=0)匹配的整个表达式的字符串，group()可以一次输入多个组号，在这种情况下它将返回一个包含那些组所对应值的元组。

　　groups()返回一个包含所有小组字符串的元组，从1到所含的小组号。

　　实例1：

　　#!/usr/bin/python3

　　importre

　　print(re.search('www','www.runoob.com').span())#在起始位置匹配

　　print(re.search('com','www.runoob.com').span())#不在起始位置匹配

　　以上实例运行输出结果为：

　　(0,3)

　　(11,14)

　　实例2：

　　#!/usr/bin/python3

　　importre

　　line="Catsaresmarterthandogs";

　　searchObj=re.search(r'(.*)are(.*?).*',line,re.M|re.I)

　　ifsearchObj:

　　print("searchObj.group():",searchObj.group())

　　print("searchObj.group(1):",searchObj.group(1))

　　print("searchObj.group(2):",searchObj.group(2))

　　else:

　　print("Nothingfound!!")

　　以上实例执行结果如下：

　　searchObj.group():Catsaresmarterthandogs

　　searchObj.group(1):Cats

　　searchObj.group(2):smarter

　　re.match与re.search的区别

　　re.match只匹配字符串的开始，如果字符串开始不符合正则表达式，则匹配失败，函数返回None;而re.search匹配整个字符串，直到找到一个匹配。

　　实例：

　　#!/usr/bin/python3

　　importre

　　line="Catsaresmarterthandogs";

　　matchObj=re.match(r'dogs',line,re.M|re.I)

　　ifmatchObj:

　　print("match-->matchObj.group():",matchObj.group())

　　else:

　　print("Nomatch!!")

　　matchObj=re.search(r'dogs',line,re.M|re.I)

　　ifmatchObj:

　　print("search-->matchObj.group():",matchObj.group())

　　else:

　　print("Nomatch!!")

　　以上实例运行结果如下：

　　Nomatch!!

　　search-->matchObj.group():dogs

　　检索和替换

　　Python的re模块提供了re.sub用于替换字符串中的匹配项。

　　语法：

　　re.sub(pattern,repl,string,count=0)

　　参数：

　　pattern:正则中的模式字符串。

　　repl:替换的字符串，也可为一个函数。

　　string:要被查找替换的原始字符串。

　　count:模式匹配后替换的最大次数，默认0表示替换所有的匹配。

　　实例：

　　#!/usr/bin/python3

　　importre

　　phone="2004-959-559#这是一个电话号码"

　　#删除注释

　　num=re.sub(r'#.*$',"",phone)

　　print("电话号码:",num)

　　#移除非数字的内容

　　num=re.sub(r'\D',"",phone)

　　print("电话号码:",num)

　　以上实例执行结果如下：

　　电话号码:2004-959-559

　　电话号码:2004959559

　　repl参数是一个函数

　　以下实例中将字符串中的匹配的数字乘于2：

　　#!/usr/bin/python

　　importre

　　#将匹配的数字乘于2

　　defdouble(matched):

　　value=int(matched.group('value'))

　　returnstr(value*2)

　　s='A23G4HFD567'

　　print(re.sub('(?P\d+)',double,s))

　　执行输出结果为：

　　A46G8HFD1134

　　正则表达式修饰符-可选标志

　　正则表达式可以包含一些可选标志修饰符来控制匹配的模式。修饰符被指定为一个可选的标志。多个标志可以通过按位OR(|)它们来指定。如re.I|re.M被设置成I和M标志：

　　修饰符描述

　　re.I使匹配对大小写不敏感

　　re.L做本地化识别(locale-aware)匹配

　　re.M多行匹配，影响^和$

　　re.S使.匹配包括换行在内的所有字符

　　re.U根据Unicode字符集解析字符。这个标志影响\w,\W,\b,\B.

　　re.X该标志通过给予你更灵活的格式以便你将正则表达式写得更易于理解。

　　正则表达式模式

　　模式字符串使用特殊的语法来表示一个正则表达式：

　　字母和数字表示他们自身。一个正则表达式模式中的字母和数字匹配同样的字符串。

　　多数字母和数字前加一个反斜杠时会拥有不同的含义。

　　标点符号只有被转义时才匹配自身，否则它们表示特殊的含义。

　　反斜杠本身需要使用反斜杠转义。

　　由于正则表达式通常都包含反斜杠，所以你最好使用原始字符串来表示它们。模式元素(如r'\t'，等价于\\t)匹配相应的特殊字符。

　　下表列出了正则表达式模式语法中的特殊元素。如果你使用模式的同时提供了可选的标志参数，某些模式元素的含义会改变。

　　模式描述

　　^匹配字符串的开头

　　$匹配字符串的末尾。

　　.匹配任意字符，除了换行符，当re.DOTALL标记被指定时，则可以匹配包括换行符的任意字符。

　　[...]用来表示一组字符,单独列出：[amk]匹配'a'，'m'或'k'

　　[^...]不在[]中的字符：[^abc]匹配除了a,b,c之外的字符。

　　re*匹配0个或多个的表达式。

　　re+匹配1个或多个的表达式。

　　re?匹配0个或1个由前面的正则表达式定义的片段，非贪婪方式

　　re{n}

　　re{n,}精确匹配n个前面表达式。

　　re{n,m}匹配n到m次由前面的正则表达式定义的片段，贪婪方式

　　a|b匹配a或b

　　(re)G匹配括号内的表达式，也表示一个组

　　(?imx)正则表达式包含三种可选标志：i,m,或x。只影响括号中的区域。

　　(?-imx)正则表达式关闭i,m,或x可选标志。只影响括号中的区域。

　　(?:re)类似(...),但是不表示一个组

　　(?imx:re)在括号中使用i,m,或x可选标志

　　(?-imx:re)在括号中不使用i,m,或x可选标志

　　(?#...)注释.

　　(?=re)前向肯定界定符。如果所含正则表达式，以...表示，在当前位置成功匹配时成功，否则失败。但一旦所含表达式已经尝试，匹配引擎根本没有提高;模式的剩余部分还要尝试界定符的右边。

　　(?!re)前向否定界定符。与肯定界定符相反;当所含表达式不能在字符串当前位置匹配时成功

　　(?>re)匹配的独立模式，省去回溯。

　　\w匹配字母数字

　　\W匹配非字母数字

　　\s匹配任意空白字符，等价于[\t\n\r\f].

　　\S匹配任意非空字符

　　\d匹配任意数字，等价于[0-9].

　　\D匹配任意非数字

　　\A匹配字符串开始

　　\Z匹配字符串结束，如果是存在换行，只匹配到换行前的结束字符串。c

　　\z匹配字符串结束

　　\G匹配最后匹配完成的位置。

　　\b匹配一个单词边界，也就是指单词和空格间的位置。例如，'er\b'可以匹配"never"中的'er'，但不能匹配"verb"中的'er'。

　　\B匹配非单词边界。'er\B'能匹配"verb"中的'er'，但不能匹配"never"中的'er'。

　　\n,\t,等.匹配一个换行符。匹配一个制表符。等

　　\1...\9匹配第n个分组的内容。

　　\10匹配第n个分组的内容，如果它经匹配。否则指的是八进制字符码的表达式。

　　正则表达式实例

　　字符匹配

　　实例描述

　　python匹配"python".

　　字符类

　　实例描述

　　[Pp]ython匹配"Python"或"python"

　　rub[ye]匹配"ruby"或"rube"

　　[aeiou]匹配中括号内的任意一个字母

　　[0-9]匹配任何数字。类似于[0123456789]

　　[a-z]匹配任何小写字母

　　[A-Z]匹配任何大写字母

　　[a-zA-Z0-9]匹配任何字母及数字

　　[^aeiou]除了aeiou字母以外的所有字符

　　[^0-9]匹配除了数字外的字符

　　特殊字符类

　　实例描述

　　.匹配除"\n"之外的任何单个字符。要匹配包括'\n'在内的任何字符，请使用象'[.\n]'的模式。

　　\d匹配一个数字字符。等价于[0-9]。

　　\D匹配一个非数字字符。等价于[^0-9]。

　　\s匹配任何空白字符，包括空格、制表符、换页符等等。等价于[\f\n\r\t\v]。

　　\S匹配任何非空白字符。等价于[^\f\n\r\t\v]。

　　\w匹配包括下划线的任何单词字符。等价于'[A-Za-z0-9_]'。

　　\W匹配任何非单词字符。等价于'[^A-Za-z0-9_]'。

共1条 1/1 1 跳转至页

发新帖

每日签到

有奖活动
「破界·共生」——2026蓝牙技术变革与工程实战思辨会
【“龙虾”创意工坊征集令——用XClaw玩出最出乎意料的智能终端】有奖活动~
2026年“我要开发板活动”第三季，开始了！
硬核工程师专属补给计划——填盲盒
“我踩过的那些坑”主题活动——第002期
【EEPW电子工程师创研计划】技术变现通道已开启~
发原创文章【每月瓜分千元赏金凭实力攒钱买好礼~】
【EEPW在线】E起听工程师的声音！

我要赚赏金打赏帖
片外存储Flash使用方法(Arduino IDE环境)被打赏￥22元
三分钟快速上手ESP-NOW(ArduinoIDE环境)被打赏￥23元
【S32K3XX】LPSPI参数配置说明被打赏￥21元
在WT9932C61-TINY上实现超声波测距被打赏￥22元
基于WT9932C61-TINY的环境构建及OLED屏驱动测试被打赏￥20元
【S32K3XX】Core-to-Core 中断使用被打赏￥21元
「AI编程记录--含源码」用一晚上的时间写一个esp32的示波器被打赏￥19元
STM32C0116DK开发探索记（3）被打赏￥30元
STM32C0116DK开发探索记（2）被打赏￥24元
STM32C0116DK开发探索记（1）被打赏￥29元

热门分类
STM32	MCU
通讯及无线技术	物联网技术
电子DIY	板卡试用
基础知识	软件与操作系统
我爱生活	小e食堂

Python3常用正则表达式整理及详解

回复