lctg.net
当前位置:首页 >> 正则表达式rE.s >>

正则表达式rE.s

Python中字符串前面加上 r 表示原生字符串, 与大多数编程语言相同,正则表达式里使用"\"作为转义字符,这就可能造成反斜杠困扰。假如你需要匹配文本中的字符"\",那么使用编程语言表示的正则表达式里将需要4个反斜杠"\\\\":前两个和后两个分别...

符号 / 和 / 之间是正则表达式的内容 最后面的 g 表示 全局匹配(查找所有匹配),如果没有这个g只查找第一个 < 就是这个符号 \S 查找非空字符 [^>] 查找除>之外的字符 * 是数量词,表示零个或零个以上 > 就是这个符号 合起来是: 1、以之外的任...

整个字符串开始是一个或多个数字,紧接着是一个或多个非空白字符(比如字母数字符号什么的),最后是一个任意字符

\d是匹配数字字符[0-9],+匹配一个或多个 放在一起是匹配一个或多个数字字符,比如:’1‘、’34‘、’9999‘

re.match是从字符串开头进行匹配,re.search可以在字符串任何位置匹配 import re find=re.match(r"world$","hello world") print(find) 没有匹配,结果是None find=re.search(r"world$","hello world") print(find) 匹配,返回一个MatchObject对象

>>> s="""# server xx-3:80 weight=1 max_fails=2 fail_timeout=10s backup; server xx:80 weight=1 max_fails=2 fail_timeout=10s; server yy weight=1 max_fails=2 fail_timeout=10s backup; server 192.168.1.1 weight=1 max_fails=2 fail_ti...

这个是用来匹配不带空格和反斜杠的字符串。 这里的^匹配非中括号里的字符;\s代表空格;\\\代表字符反斜杠(正则表达式需要双反斜杠来转义,因为\在正则表达式中本身就具有含义) line = 'haha \\\\ \\ hehe'matches = re.findall('([^\s\\\]+)'...

实测: >>> res=re.compile(r'\bs*.\Se\b')>>> resl=re.findall(res,txt)>>> resl['site', 'sue', 'see', 'sse', 'ssee']>>> res=re.compile(r'\bs\S*?e\b')>>> resl=re.findall(res,txt)>>> resl['site', 'sue', 'see', 'sse', 'ssee', 'somewh...

import re matchs=re.finditer(r'(.*?)',htmltext,re.S) for match in matchs: print(match.group(1)) 匹配时指定re.S可以让点匹配所有字符,包括换行符

\w匹配的是能组成单词的字符,在python3 中re默认支持的是unicode字符集,当然也支持汉字 如果要让\w仅支持英文,加个re.A标志 print(re.findall(r"\w",s,re.A)) 这样就不会匹配汉字了

网站首页 | 网站地图
All rights reserved Powered by www.lctg.net
copyright ©right 2010-2021。
内容来自网络,如有侵犯请联系客服。zhit325@qq.com