python 正则表达式 re findall 一种方法我们要能够以列表的形式返回能匹配的子串。 re.findall(pattern, string[, flags]): 搜索string,以列表形式返回全都能匹配的子串。先看个简单的的代码: import re p = re.compile(r'\d+') print p.findall('one1two2three3four4') ### output ### # ['1', '2', '3', '4'] 稍微复杂点譬如:
info = 'baidu' 我们要是的满足是多种手段正则表达式提取网址和锚文本,那我们要能够用到
findall()
import re
relink = '(.*)'
info = 'baidu'
cinfo = re.findall(relink,info)
print cinfo
输出的于是:[('http://www.baidu.com', 'baidu')] 返回的的当一列表,列表里边是匹配的于是产生的元组形式。我们要能够你我们要能够用正则替换还要没有,我们要能够看下python re sub