2020第四范式秋招算法笔试题
时长:120分钟 总分:100分
166浏览 0人已完成答题
题型介绍
题型 | 单选题 | 填空题 |
---|---|---|
数量 | 35 | 2 |
增加以下哪些超参数可能导致随机森林模型过拟合数据? &nbsp&nbsp...
1. 决策树的数量;
2. 决策树的深度;
3. 学习率。
以下哪些方法属于判别式模型(discriminative model) &...
1. 隐马尔科夫模型(HMM)
2. 朴素贝叶斯(Naive Bayes)
3. 隐含狄利克雷分布(LDA)
4. 支持向量机(support vector machine)
在线性回归中使用正则项,你发现解的不少coefficient都是0,则这个...
对于Logistic Regression,其中为loss functio...
下面哪个分类器可以正确分类所有点(正样本:圆圈,负样本:三角) 1....
2. SVM with linear kernel
3. SVM with RBF kernel
4. Decision tree
5. 3-nearest-neighbor classifier (with Euclidean distance).

假设一个数据集中的数据在二维欧式空间中分布如下: 则如果采用...

对于某种疾病,一个诊断检测有95%的概率对一个患者给出阳性诊断,有10%的...
在Linux上,对于多进程,子进程继承了父进程的下列哪些? 1、进程...
2、共享内存
3、信号掩码
4、已打开的文件描述符
5、其他选项都不是
设在内存中有P1,P2,P3三道程序,并按照P1,P2,P3的优先级次序运...
P2:计算120ms---》IO 40ms---》计算40ms
P3:计算40ms---》IO 80ms---》计算40ms
并行完成三道程序比单道运行节省的时间是()
假设系统中有n个进程共享3台扫描仪,并采用PV操作实现进程同步与互斥。若系...
超级区间和
注意最后的数字之和可能非常大,将最后的和除以1,000,000,007的余数输出。
第2行输入N个数字,代表a[0], a[1], ..., a[N-1]。
第3行输入为Q
第4行到第 3+Q 行代表Q组区间,每一行为l[i], r[i]输入样例: 4 1 2 3 4 2 0 2 1 3 输出描述: 输出一个数字,代表最后所有区间的数字之和除以1,000,000,007的余数。输出样例 15
实现朴素贝叶斯分类器
朴素贝叶斯分类器假设在给定样本label的情况下,样本的不同特征之间相互独立。现用朴素贝叶斯分类器进行垃圾邮件识别,数据包含4个特征。现有的训练数据如下表:

正文长度(feature 2):1: [0,10], 2:[10,20], 3: [20,+]
附件含有可执行程序(feature 3):1: 是, 0:否
输入描述: 输入数据如下,第一行一个数字M,表示共有M行训练数据,
第2~M+1行,每行5个数字,分别以空格隔开,前四个数字分别代表四个特征,第5个数字代表这一个样本label值。
第M+2行是一个数字N,表示共有N行测试样本,随后的N行每行4个数字,分别代表四个特征的值。
14
1 1 1 0 1
1 1 1 1 1
2 1 1 0 0
3 2 1 0 0
3 3 0 0 0
3 3 0 1 1
2 3 0 1 0
1 2 1 0 1
1 3 0 0 0
3 2 0 0 0
1 2 0 0 0
2 2 1 1 0
2 1 0 0 0
3 2 1 1 1
5
3 1 0 0
1 1 0 0
2 2 1 1
2 3 1 1
3 3 0 0输入样例: 14 1 1 1 0 1 1 1 1 1 1 2 1 1 0 0 3 2 1 0 0 3 3 0 0 0 3 3 0 1 1 2 3 0 1 0 1 2 1 0 1 1 3 0 0 0 3 2 0 0 0 1 2 0 0 0 2 2 1 1 0 2 1 0 0 0 3 2 1 1 1 5 1 1 0 0 1 1 1 0 1 2 1 0 2 1 0 1 2 2 1 1 输出描述: 使用贝叶斯模型对测试样本进行预测,所有结果按顺序输出到一行,以空格分隔;
0 0 0 0 0输出样例 0 1 1 0 0
给定N个数据样本,对某一机器学习模型,考虑用网格搜索(Grid searc...
以下说法正确的是? 1) 和预测相比,k-NN分类器的训练需要花费更...
2) 一般来说,训练样本越多, k-NN分类器准确率越高
3) k-NN不能用于回归
4) k-NN分类器对异常点(outlier)很敏感
5) k-NN分类器的训练误差(training error)是0