为什么urllib.urlopen.read()与源代码不对应?

发布于 2021-01-29 16:28:15

我正在尝试获取以下网页:

import urllib
urllib.urlopen("http://www.gallimard-jeunesse.fr/searchjeunesse/advanced/(order)/author?catalog[0]=1&SearchAction=1").read()

结果与例如使用Google Chrome浏览器检查网页的源代码时所看到的不一致。

您能告诉我为什么会发生这种情况,以及如何改善代码以解决该问题吗?

感谢您的帮助。

关注者
0
被浏览
47
1 个回答
  • 面试哥
    面试哥 2021-01-29
    为面试而生,有面试问题,就找面试哥。

    您从中得到的urlopen是原始网页,这意味着不执行任何JavaScript。从Chrome(或其他浏览器)获得的最终网页是最终网页,其中包含可执行的javascript(可能会更改HTML),css渲染等。所有这些都不会在urlopen…中发生

    因此区别,希望这是清楚的



知识点
面圈网VIP题库

面圈网VIP题库全新上线,海量真题题库资源。 90大类考试,超10万份考试真题开放下载啦

去下载看看