Python

Python-提取正则表达式匹配项的一部分

发布于 2021-02-02 23:11:02

我想要一个正则表达式从HTML页面提取标题。目前我有这个：

title = re.search('<title>.*</title>', html, re.IGNORECASE).group()
if title:
    title = title.replace('<title>', '').replace('</title>', '')

是否有一个正则表达式仅提取<title>的内容，所以我不必删除标签？

关注者

被浏览

112

1 个回答

面试哥 2021-02-02

为面试而生，有面试问题，就找面试哥。
用( )在正则表达式和group(1)python中检索捕获的字符串（re.search将返回None如果没有找到结果，所以不要用group()直接）：
```
title_search = re.search('<title>(.*)</title>', html, re.IGNORECASE)

if title_search:
    title = title_search.group(1)
```

知识点

面圈网VIP题库全新上线，海量真题题库资源。 90大类考试，超10万份考试真题开放下载啦