虽然’PY.*N’匹配字符串’PY1N22N33N’ 可以得到 PY1N, PY1N22N, PY1N22N33N,但是Re库默认采用贪婪匹配,即输出最长的字符串PY1N22N33N
""" # 特别字符 * 表示匹配前面的子表达式零次或多次 # 特别字符 . 匹配除换行符 \n 之外的任何单字符 # PY.*N 表示匹配PY开头N结尾的字符串 """ match = re.search(r'PY.*N', 'PY1N22N33N') # 虽然'PY.*N'匹配字符串'PY1N22N33N' 可以得到 PY1N, PY1N22N, PY1N22N33N # 但是Re库默认采用贪婪匹配,即输出最长的字符串,故输出结果为 PY1N22N33N print(match.group(0))
操作符 | 说明 |
---|---|
*? | 前一个字符串0次或无限次拓展的最小匹配 |
+? | 前一个字符串1次或无限次拓展的最小匹配 |
?? | 前一个字符串0次或1次拓展的最小匹配 |
{m, n} | 拓展前一个字符串m至n(含n)的最小匹配 |
# 如果想要得到最短字符串可以使用操作符 *?,即加一个问号? match = re.search(r'PY.*?N', 'PY1N22N33N') # 最小匹配的输出结果 print(match.group(0))
import requests from bs4 import BeautifulSoup import bs4 import re """ 学习笔记:Re 库的贪婪匹配和最小匹配 笔记的学习视频来源: https://www.bilibili.com/video/BV1pt41137qK?p=39 最小匹配操作符 操作符 说明 *? 前一个字符串0次或无限次拓展的最小匹配 +? 前一个字符串1次或无限次拓展的最小匹配 ?? 前一个字符串0次或1次拓展的最小匹配 {m, n} 拓展前一个字符串m至n(含n)的最小匹配 """ if __name__ == '__main__': """ # 特别字符 * 表示匹配前面的子表达式零次或多次 # 特别字符 . 匹配除换行符 \n 之外的任何单字符 # PY.*N 表示匹配PY开头N结尾的字符串 """ match = re.search(r'PY.*N', 'PY1N22N33N') # 虽然'PY.*N'匹配字符串'PY1N22N33N' 可以得到 PY1N, PY1N22N, PY1N22N33N # 但是Re库默认采用贪婪匹配,即输出最长的字符串,故输出结果为 PY1N22N33N print(match.group(0)) # 如果想要得到最短字符串可以使用操作符 *?,即加一个问号? match = re.search(r'PY.*?N', 'PY1N22N33N') # 最小匹配的输出结果 print(match.group(0))
C:\Users\珞落\AppData\Local\Programs\Python\Python39\python.exe D:/PythonProject/main.py PY1N22N33N PY1N Process finished with exit code 0