背景:预估问题的一种最简单形式是二分类模型。我们考虑这样一个情况:一批样本...

发布于 2022-05-23 17:25:50

背景:预估问题的一种最简单形式是二分类模型。我们考虑这样一个情况:一批样本的预测结果是0/1,我们检查计算得到样本均值是,但是样本方差离 较远。仔细检查后发现是其实样本来源于两个子集,也就是样本存在潜在的分层(A/B两个子集)。在样本(训练集上)可以找到“样本分层”的标签,但在测试集上没有办法直接观测到“样本分层”这个标签。

问题1: 对训练集建模,提出两种估计0/1分类的方式。并从Bias-Variance等角度比较模型优劣和适用范围。

问题2: 以预测为目的,测试集没有这个“样本分层”的标签,那么怎么建模?

问题3: 跳出刚才样本分层,假设模型选择DNN,我们怎么做预测(严格意义叫估计)的方差估计(除了直接计算样本方差,这样非常不准)。




关注者
0
被浏览
46
知识点
面圈网VIP题库

面圈网VIP题库全新上线,海量真题题库资源。 90大类考试,超10万份考试真题开放下载啦

去下载看看