web_scrapper.py 文件源码

python

阅读 23 收藏 0 点赞 0 评论 0

项目：duck-feed 作者: h0m3stuck 项目源码文件源码

def scrape_web(website):
    r = requests.get(website, timeout=5)

    tree = html.fromstring(r.content)
    rss_links = tree.xpath('//link[@rel="alternate" and @type="application/atom+xml"]/@href')

    if len(rss_links) == 0:
        raise NoLinkError(website)
    else:
        return urllib.parse.urljoin(website, rss_links[0])

评论列表正在加载评论...

文章目录

提
问题

写
面经

写
文章

微信
公众号

扫码关注公众号