携程2019届秋招专业笔试-大数据方向

时长:120分钟 总分:100分

594浏览 2人已完成答题

题型介绍
题型 单选题 填空题
数量 30 1
1.
以下说法中错误的是
问题详情




2.
为了得到和SVD一样的投射(projection)需要在PCA中怎么做
问题详情




3.
机器学习中做特征选择时,可能用到的方法有
问题详情





4.
假定目标变量的类别非常不平衡,即主要类别占据了训练数据的 99%...
问题详情

假定目标变量的类别非常不平衡,即主要类别占据了训练数据的 99%。现在你的模型在测试集上表现为 99% 的准确度。那么下面哪一项表述是正确的?




5.
某请求被随即分配到四台机器进行处理,分配到每台机器的概率A15% ...
问题详情

某请求被随即分配到四台机器进行处理,分配到每台机器的概率A15% B20% C 30% D 35%, 处理请求的失败概率分别为5% ,4%, 3% 2%,现在请求失败,问由C造成的概率最接近




6.
用0,1,2,3,4,5组成一个4位数,要求每一位都不一样,请问能组成多少...
问题详情

用0,1,2,3,4,5组成一个4位数,要求每一位都不一样,请问能组成多少个四位数





7.
Spark中Stage阶段的Task数量由什么决定
问题详情




8.
关于支持向量机SVM,下列说法错误的是
问题详情




9.
一个合法的表达式由()包围,()可以嵌套和连接,如(())()也是合法&n...
问题详情

一个合法的表达式由()包围,()可以嵌套和连接,如(())()也是合法 表达式;现在有 6 对(),它们可以组成的合法表达式的个数为





10.
下列哪个不属于CRF模型对于HMM和MEMM模型的优势
问题详情




11.
评估模型之后,得出模型存在偏差,下列哪种方法可能解决这一问题()
问题详情




12.
下面哪一项 用决策树法训练大量数据集最节约时间()
问题详情




13.
关于L1正则和L2正则 下面的说法正确的是
问题详情




14.
以下模型不是判别模型的是哪个()
问题详情




15.
以下不属于线性分类器的是()
问题详情




16.
以下哪个是常见的时间序列算法模型()
问题详情




17.
关于logistic回归和SVM不正确的是()
问题详情




18.
下列属于无监督学习的是()
问题详情




19.
在其他条件不变的前提下,以下哪种做法容易引起过拟合问题()
问题详情




20.
以下哪种方法不可以直接用来对文本分类()
问题详情




21.
下列不是SVM核函数的是()
问题详情




22.
下列哪些方法不可以用来对高维数据进行降维()
问题详情




23.
 下面有关分类算法的准确率,召回率,F1-score的描述,错误...
问题详情

 下面有关分类算法的准确率,召回率,F1-score的描述,错误的是()




24.
在Logistic Regression中,如果同时加入L1和L...
问题详情

在Logistic Regression中,如果同时加入L1和L2范数,会产生什么效果()




25.
在一个神经网络里,知道每一个神经元的权重和偏差是最重要的一步。如果以某种方...
问题详情

在一个神经网络里,知道每一个神经元的权重和偏差是最重要的一步。如果以某种方法知道了神经元的准确的权重和偏差,你就可以近似任何函数。实现这个最佳的办法是什么()




26.
下列哪个不属于常用的文本分类的特征选择算法()
问题详情




27.
输入图片大小为200*200,依次经过一层卷积(kernel s...
问题详情

输入图片大小为200*200,依次经过一层卷积(kernel size 5*5, padding 1, stride 2), pooling (kernel size 3*3, padding 0, stride 1),又一层卷积  (kernel size 3*3, padding 1, stride 1)之后,输出特征图的大小为:()




28.
在deep Learning中,涉及到大量矩阵相乘,现在需要计算...
问题详情

在deep Learning中,涉及到大量矩阵相乘,现在需要计算三个稠密矩阵a,b,c的乘机abc,假设三个矩阵的尺寸分别为m*n,n*p,p*q,且m<n<p<q,以下计算顺序效率最高的是()




29.
下列有关模式挖掘算法的描述,错误的是()
问题详情




30.
下列哪种操作实现了和神经网络中Dropout类似的结果()
问题详情




31.
游游的旅行
问题详情


游游和小伙伴结伴而行,途径一处园林,游游与小伙伴决定进去游览。该园林可以看作一张个点(每个点代表一个景点)条边的无向图(无重边,无自环)。旅途中,两人的初始愉悦度皆为0 ,第 i个景点需要耗费分钟的时间,会让游游和小伙伴的愉悦度分别增加 。每条边代表一条路径,第 i 条边连接编号为 的两个景点,从走到或者从走到耗费的时间都是分钟。游游和小伙伴预计在该园林停留 分钟。检票进入园林后,游游和小伙伴会等概率的随机选择一个景点开始游览,每游览完一个景点后,游游和小伙伴会等概率的随机选择一个可以从当前景点直达的且来得及玩的景点作为下一个目的地。如果游览完一个景点后周围没有可以直达的且来得及游览的景点,游游和小伙伴就会提前结束游玩。 请分别计算出游游和小伙伴在游览结束后愉悦度的期望。  


输入描述: 第一行三个整数,分别表示, , ,以空格隔开;
接下来的行,每行三个整数,分别表示 ,,以空格隔开;
接下来的行,每行三个整数,分别表示, ,以空格隔开。输入样例: 5 4 60 25 12 83 30 38 90 16 13 70 22 15 63 50 72 18 2 1 7 3 1 7 4 3 1 5 3 10 输出描述: 输出一行实数,分别表示游游和小伙伴度的期望,精确到小数点后 5位,以空格隔开。输出样例 39.20000 114.40000