light_daemon_maindomain.py 文件源码

python
阅读 22 收藏 0 点赞 0 评论 0

项目:crawler_old 作者: salmonx 项目源码 文件源码
def procdata_getencoding(seed,headers,content):

    code = utils.get_encoding_from_headers(headers)
    if code:
        if code.lower() == 'gbk' or code.lower() == 'gb2312':
            code = 'gbk'
        elif code.lower() == 'utf-8':
            code = 'utf-8'
        else:
            code = None

    if code == None:
        code = utils.get_encodings_from_content(content)
        print "content",seed,code
        if code:
            code = code[0]
            if code.lower() == 'gbk' or code.lower() == 'gb2312':
                code = 'gbk'

    return code
评论列表
文章目录


问题


面经


文章

微信
公众号

扫码关注公众号