testextraction.py 文件源码

python
阅读 24 收藏 0 点赞 0 评论 0

项目:Malicious_Website_Detection 作者: medhini 项目源码 文件源码
def nofoutofplacefeatures(url):


#   pdb.set_trace()

    if url[:4]=="http":
        r = requests.get(url)
    else:
        url="http://"+url
        r  = requests.get(url)

    #r = requests.get(url)
    data = r.text
    data2=r.content

    document, errors = tidy_document(data,
      options={'numeric-entities':1})

    #print document
    #print errors
    #print "Number of Elements Out of Place : " + str(len(errors))
    return len(errors)
评论列表
文章目录


问题


面经


文章

微信
公众号

扫码关注公众号