2020第四范式秋招建模笔试题

时长:120分钟 总分:100分

166浏览 0人已完成答题

题型介绍
题型 单选题 填空题
数量 30 2
1.
下列关于boosting和bagging的描述中,错误的是:
问题详情




2.
关于特征选择,下列对Ridge回归和Lasso回归的说法正确的是:
问题详情




3.
K-Means算法不适合对以下哪种分布的样本进行聚类:
问题详情




4.
d维线性分类器的VC维(Vapnik&ndashChervonenkis)是:
问题详情

d维线性分类器的VC维(Vapnik–Chervonenkis)是:




5.
走廊有1000盏灯,序号为1到1000。某个人沿走廊打开所有灯,回到原点后...
问题详情

走廊有1000盏灯,序号为1到1000。某个人沿走廊打开所有灯,回到原点后沿走廊依次关闭序号为2的倍数的灯,即关闭第2、4、6、…、1000盏灯,然后回到原点,在第三次通过走廊时依次翻转序号为3的倍数的灯(即关闭已打开的灯,打开已关闭的灯),如此继续。请问在第1000次通过走廊后,还有多少盏灯还亮着?




6.
圆上任意选三个点组成的三角形覆盖圆心的概率?
问题详情




7.
熵、条件熵、联合熵、互信息之间的关系错误的是?
问题详情




8.
有一种测试疾病A的试剂,得疾病A的人测试有80%的概率是阳性,20%概率是...
问题详情

有一种测试疾病A的试剂,得疾病A的人测试有80%的概率是阳性,20%概率是阴性,正常的人测试有1%概率阳性,99%概率阴性,所有人群中疾病A的发病率35%,如果一个人测试为阳性,其得病的概率?




9.
MAP估计的variance相比MLE估计的variance?
问题详情




10.
下列说法错误的是?
问题详情




11.
机器学习训练时,Mini-Batch 的大小优选为2 的幂,如 256 或...
问题详情

机器学习训练时,Mini-Batch 的大小优选为2 的幂,如 256 或 512。它背后的原因是什么?




12.
下列哪些指标不适合用来评估线性回归模型?
问题详情




13.
下列哪一项在神经网络中引入了非线性?
问题详情




14.
随机数字序列要多长才能使得序列中9出现的概率至少是99%?
问题详情




15.
下列关于正则项的描述中错误的是:
问题详情




16.
树模型中可以反应特征重要性的指标:
问题详情




17.
给定一组数据{(x1,y1), (x2,y2), ... ,(xn, yn...
问题详情

给定一组数据{(x1,y1), (x2,y2), ... ,(xn, yn)},训练一个线性回归模型y=a0+a1*x可以得到系数a1,系数a1的t统计量t-stats,回归系数R2;如果将数据复制一份,然后和原始数据混合,重新训练一个线性回归模型,得到新的a1',t-stats',R2',以下说法正确的是:




18.
有一个随机数生成器,可以生成0到1均匀分布的随机数,前n个随机数的和记为S...
问题详情

有一个随机数生成器,可以生成0到1均匀分布的随机数,前n个随机数的和记为Sn=x1+x2+...+xn,当Sn第一次大于1的时候停止,n的期望值为:




19.
在训练神经网络时,损失函数(loss)在最初的几个epochs时没有下降,...
问题详情

在训练神经网络时,损失函数(loss)在最初的几个epochs时没有下降,最可能的原因是?




20.
使用Ridge回归模型,调整正则化参数&lambda来降低模型复杂度。当 &lambda 增大时,...
问题详情

使用Ridge回归模型,调整正则化参数λ来降低模型复杂度。当 λ 增大时,关于偏差(bias)和方差(variance),下列说法正确的是?




21.
使用逻辑回归进行 n 个类别的分类,使用 One-vs-rest 分类法。...
问题详情

使用逻辑回归进行 n 个类别的分类,使用 One-vs-rest 分类法。下列说法正确的是?




22.
堆排序最坏情况的时间复杂度是?
问题详情




23.
在shell命令行中输入以下命令: x=10 x=11 | e...
问题详情

在shell命令行中输入以下命令:
x=10
x=11 | echo $x
输出结果为:




24.
在建模过程中,正负样本分布极度不均衡,其中负样本数量远大于正样本数量,建模...
问题详情

在建模过程中,正负样本分布极度不均衡,其中负样本数量远大于正样本数量,建模过程中对负样本随机做下采样,抽样率为10%,正样本不做抽样。模型在抽样后的验证集上50%召回率下,准确率为40%,模型在全量样本上50%召回率的准确率最接近以下:




25.
自助法(Bootstraping)是一种从给定训练集中有放回的均匀抽样,也...
问题详情

自助法(Bootstraping)是一种从给定训练集中有放回的均匀抽样,也就是说,每当选中一个样本,它等可能地被再次选中并被再次添加到训练集中。在自助法的采样过程中,对n个样本进行n次自助抽样,当n趋于无穷大时,最终约多少比例的数据从未被选中?




26.
如果观察到神经网络中的某个隐藏层输出了[-0.01],该隐藏层的激活函数可...
问题详情

如果观察到神经网络中的某个隐藏层输出了[-0.01],该隐藏层的激活函数可能是以下哪一个?




27.
在训练Lasso回归模型时,训练数据集有N个特征(X1,X2,&hellip,XN)。...
问题详情

在训练Lasso回归模型时,训练数据集有N个特征(X1,X2,…,XN)。在模型调优阶段的数据预处理时,无意将某个特征XX扩大了20倍,然后用相同的正则化参数对 Lasso 回归进行修正。那么,下列说法正确的是?




28.
一根木棒,随机截成三截,组成三角形的概率是多少?
问题详情




29.
已知有个rand7()的函数,返回1到7随机自然数,构造rand10()的...
问题详情

已知有个rand7()的函数,返回1到7随机自然数,构造rand10()的代码,正确的是:




30.
以下关于逻辑回归说法错误的是:
问题详情




31.
编程题1
问题详情

给定一个由0和1组成的2维矩阵,返回该矩阵中最大的由1组成的正方形的面积 输入描述: 输入一共包括M+1行,第一行输入为两个整数:M和N,分别表示矩阵的行数和列数;第2到第M+1行为矩阵的元素,每一行对应矩阵的一行,每一行包括N个0/1整数,行内元素用逗号分隔,比如一个4 x 5的矩阵输入如下:

4,5

1,0,1,0,0

1,0,1,1,1

1,1,1,1,1

1,0,0,1,0输入样例: 4,5 1,0,1,0,0 1,0,1,1,1 1,1,1,1,1 1,0,0,1,0 输出描述: 输出一个整数,表示面积,上述例子结果为4输出样例 4
32.
编程题2
问题详情

给定一个正整数n,找出最少需要多少个完全平方数,使得他们的和等于n。比如12=4+4+4,返回3
输入描述: 输入为1个正整数输入样例: 12 输出描述: 输出为1个正整数输出样例 3