2022年星环科技秋招笔试算法题
时长:120分钟 总分:100分
1400浏览 1人已完成答题
题型介绍
题型 | 简答题 |
---|---|
数量 | 2 |
背景:预估问题的一种最简单形式是二分类模型。我们考虑这样一个情况:一批样本...
背景:预估问题的一种最简单形式是二分类模型。我们考虑这样一个情况:一批样本的预测结果是0/1,我们检查计算得到样本均值是
,但是样本方差离
较远。仔细检查后发现是其实样本来源于两个子集,也就是样本存在潜在的分层(A/B两个子集)。在样本(训练集上)可以找到“样本分层”的标签,但在测试集上没有办法直接观测到“样本分层”这个标签。
问题2: 以预测为目的,测试集没有这个“样本分层”的标签,那么怎么建模?
问题3: 跳出刚才样本分层,假设模型选择DNN,我们怎么做预测(严格意义叫估计)的方差估计(除了直接计算样本方差,这样非常不准)。
阅读下列python 3代码 import math import num...
阅读下列python 3代码
import math
import numpy as np
x = np.resize(np.random.rand(10000), [5000,2])
u = 2.0 * x -1.0
s = np.sum(u*u, axis=1)
result = np.array([math.sqrt((-2.0*math.log(s[ss]))/s[ss])*u[ss,:]
for ssin range(s.size)if s[ss]<1])
Result的结果服从什么分布(几维的什么样的分布)?
为什么?
阐述这段代码的问题,避免for循环,并改写这段代码。