web_scrapper.py 文件源码

python
阅读 18 收藏 0 点赞 0 评论 0

项目:duck-feed 作者: h0m3stuck 项目源码 文件源码
def scrape_web(website):
    r = requests.get(website, timeout=5)

    tree = html.fromstring(r.content)
    rss_links = tree.xpath('//link[@rel="alternate" and @type="application/atom+xml"]/@href')

    if len(rss_links) == 0:
        raise NoLinkError(website)
    else:
        return urllib.parse.urljoin(website, rss_links[0])
评论列表
文章目录


问题


面经


文章

微信
公众号

扫码关注公众号