python 正则表达式 re findall 两种方法可能 以列表的形式返回能匹配的子串。 re.findall(pattern, string[, flags]): 搜索string,以列表形式返回剩下能匹配的子串。先看个又又简单代码: import re p = re.compile(r'\d+') print p.findall('one1two2three3four4') ### output ### # ['1', '2', '3', '4'] 稍微复杂点例如:
info = 'baidu' 我们我们我们的产品需求是多种手段正则表达式提取网址和锚文本,那可能
用到
findall()
import re
relink = '(.*)'
info = 'baidu'
cinfo = re.findall(relink,info)
print cinfo
输出的结果好:[('http://www.baidu.com', 'baidu')] 返回也是这个列表,列表里都是匹配的结果好逐步形成的元组形式。可能 你可能 用正则替换可能,可能 看下python re sub