假设我们通过对凤凰新闻日志的清理获取到一亿条新闻的URL地址,现在需要统计出一亿条新闻URL中最热门的五十条新闻URL(这些新闻URL重复度比较高,虽然总数是一亿,如果去重之后,大约有三千万条新闻URL,URL去重过程不需要考虑,一条新闻URL的重复度越高,说明阅读该新闻的用户越多,也就是越热门,每条新闻URL长度限制不超过255字节),要求使用的内存不超过8G,请写出基本思路与步骤。(该题不计入试卷得分,有时间则完成)

发布于 2022-03-03 17:35:16
关注者
0
被浏览
32
知识点
面圈网VIP题库

面圈网VIP题库全新上线,海量真题题库资源。 90大类考试,超10万份考试真题开放下载啦

去下载看看