现在需要为一个现存的产品增加文本分类的功能,你决定使用RadomFores...

发布于 2022-03-02 16:54:15

现在需要为一个现存的产品增加文本分类的功能,你决定使用RadomForest模型,产品方能提供的训练数据只有2W,你从外部抓取其它文本相关的分类数据有5W

1)请问如何划分你的 training setvalidation set, testing set ? 

2)假定人去做文本分类的Human ErrorE1, 模型的Training Error E2, Valid/Testing Error E3,请问依据这些信息如果确定模型的改进方向和优化措施?(请举例说明)

关注者
0
被浏览
18
知识点
面圈网VIP题库

面圈网VIP题库全新上线,海量真题题库资源。 90大类考试,超10万份考试真题开放下载啦

去下载看看