正则表达式基本语法元字符:有特殊含义,如 . 匹配任意字符、^ 匹配行首、$ 匹配行尾等。字符集:可匹配多个字符之一,如 [abc] 匹配 a、b、c 之一。量词:表示匹配次数,如 * 匹配零次或多次、+ 匹配一次或多次、? 匹配零次或一次。分组:将多个字符组合成整体匹配,如 (abc) 匹配 abc 整体。
python正则表达
Python 正则表达式是用于字符串提取的规则,通过特定语法表达规则来匹配字符串,Python 的 re 模块提供了相关功能。以下为你介绍相关知识:
正则表达式基本语法元字符:有特殊含义,如 . 匹配任意字符、^ 匹配行首、$ 匹配行尾等。字符集:可匹配多个字符之一,如 [abc] 匹配 a、b、c 之一。量词:表示匹配次数,如 * 匹配零次或多次、+ 匹配一次或多次、? 匹配零次或一次。分组:将多个字符组合成整体匹配,如 (abc) 匹配 abc 整体。re 模块常用函数re.match():从字符串起始位置匹配,匹配成功返回匹配对象,失败返回 None。re.search():在整个字符串中匹配,成功返回匹配对象,失败返回 None。re.findall():查找字符串中所有匹配的子串,以列表形式返回。re.sub():替换字符串中匹配的子串。re.split():按匹配的子串分割字符串,返回列表。单字符匹配. 匹配任意一个字符,几个点号代表几个字符。d 匹配数字,一个 d 代表一个数字。D 匹配非数字。s 匹配特殊字符,如空白、空格、tab 等。S 匹配非空白。w 匹配单词、字符,如大小写字母、数字、下划线。W 匹配非单词字符。[ ] 匹配其中列举的字符,[^ ] 不匹配其中列举的字符。数量表达*:出现 0 次或无数次。+:至少出现一次。?:出现 1 次或 0 次。{m}:指定出现 m 次。{m,}:至少出现 m 次。{m,n}:指定出现次数在 m - n 次范围。匹配边界$:匹配结尾字符。^:匹配开头字符。b:匹配一个单词的边界。B:匹配非单词边界。匹配分组|:匹配左右任意一个表达式。( ):将括号中字符作为一个分组。贪婪与非贪婪Python 数量词默认贪婪,尝试匹配更多字符,使用 ? 可关闭贪婪模式。
2025-06-20