python 正则表达式 re findall 方法一也并能列表的形式返回能匹配的子串。 re.findall(pattern, string[, flags]): 搜索string,以列表形式返回基本能匹配的子串。先看个非常非常简单代码: import re p = re.compile(r'\d+') print p.findall('one1two2three3four4') ### output ### # ['1', '2', '3', '4'] 稍微复杂点之类:
info = 'baidu' 让让我们要潜在需求是进行正则表达式提取网址和锚文本,那也可用到
findall()
import re
relink = '(.*)'
info = 'baidu'
cinfo = re.findall(relink,info)
print cinfo
输出的于是:[('http://www.baidu.com', 'baidu')] 返回更让人这个列表,列表底下是匹配的于是初步形成的元组形式。也可你也可用正则替换一旦,也可看下python re sub