获取网站上JavaScript重定向的最终目标

发布于 2021-01-29 15:00:34

我用python解析网站。他们使用大量重定向,并通过调用javascript函数来完成重定向。

因此,当我仅使用urllib解析网站时,它无济于事,因为我无法在返回的html代码中找到目标url。

有没有办法访问DOM并从我的python代码中调用正确的javascript函数?

我需要的只是URL,重定向将我带到了那里。

关注者
0
被浏览
66
1 个回答
  • 面试哥
    面试哥 2021-01-29
    为面试而生,有面试问题,就找面试哥。

    我看着硒。而且,如果您没有运行纯脚本(这意味着您没有显示并且无法启动“正常”浏览器),则解决方案实际上非常简单:

    from selenium import webdriver
    
    driver = webdriver.Firefox()
    link = "http://yourlink.com"
    driver.get(link)
    
    #this waits for the new page to load
    while(link == driver.current_url):
      time.sleep(1)
    
    redirected_url = driver.current_url
    

    对于我的用例来说,这绰绰有余。Selenium还可以与表单交互并将击键发送到网站。



知识点
面圈网VIP题库

面圈网VIP题库全新上线,海量真题题库资源。 90大类考试,超10万份考试真题开放下载啦

去下载看看