如何使用Selenium / Python获取由JavaScript编写的html内容[重复]
这个问题已经在这里有了答案 :
使用Python在Selenium
WebDriver中获取WebElement的HTML源代码 (15个答案)
6年前关闭。
我正在使用Selenium进行网络爬网,我想在Selenium模拟点击假链接后获得由JavaScript编写的元素(例如链接)。
我尝试了get_html_source(),但其中不包含JavaScript编写的内容。
我写的代码:
def test_comment_url_fetch(self):
sel = self.selenium
sel.open("/rmrb")
url = sel.get_location()
#print url
if url.startswith('http://login'):
sel.open("/rmrb")
i = 1
while True:
try:
if i == 1:
sel.click("//div[@class='WB_feed_type SW_fun S_line2']/div/div/div[3]/div/a[4]")
print "click"
else:
XPath = "//div[@class='WB_feed_type SW_fun S_line2'][%d]/div/div/div[3]/div/a[4]"%i
sel.click(XPath)
print "click"
except Exception, e:
print e
break
i += 1
html = sel.get_html_source()
html_file = open("tmp\\foo.html", 'w')
html_file.write(html.encode('utf-8'))
html_file.close()
我使用while循环单击一系列伪造的链接,这些伪造的链接触发js动作以显示额外的内容,而该内容正是我想要的。但是sel.get_html_source()没有提供我想要的东西。
有人可以帮忙吗?非常感谢。