有一批UGC的文本数据,大概几千万条,其中有2万条因为涉及黄暴内容被抓了出...

发布于 2022-03-02 17:07:20

有一批UGC的文本数据,大概几千万条,其中有2万条因为涉及黄暴内容被抓了出来。但是由于人力有限,这几千万条文本中还有很多(可能几十万条)黄暴内容,请设计一个文本分类系统帮助解决这个问题,从数据、算法、系统尽可能考虑周全。
关注者
0
被浏览
35
知识点
面圈网VIP题库

面圈网VIP题库全新上线,海量真题题库资源。 90大类考试,超10万份考试真题开放下载啦

去下载看看