Python:是否从urllib2.urlopen调用获取HTTP标头?
拨打电话urllib2
时是否提取整个页面urlopen
?
我只想读取HTTP响应标头而不获取页面。看起来像urllib2
打开HTTP连接,然后随后获取实际的HTML页面……还是只是通过urlopen
调用来开始缓冲页面?
import urllib2
myurl = 'http://www.kidsidebyside.org/2009/05/come-and-draw-the-circle-of-unity-with-us/'
page = urllib2.urlopen(myurl) // open connection, get headers
html = page.readlines() // stream page
-
使用该
response.info()
方法获取标题。urllib2.urlopen(url [,data] [,timeout])
…
此函数返回带有两个其他方法的文件状对象:
- geturl()—返回所获取资源的URL,通常用于确定是否遵循了重定向
- info()—以httplib.HTTPMessage实例的形式返回页面的元信息,例如标头(请参阅HTTP标头快速参考)
因此,对于您的示例,请尝试逐步
response.info().headers
查找所需的结果。请注意使用httplib的主要警告.HTTPMessage在python问题4773中进行了说明。