面圈网
面试哥
注册登录
搜索
首页
社区
题库
问答广场
求职
职业考试
真题库
新
排行榜
教程
公司
发现
经验笔记
代码片段
技术栈
源码
在线文稿
资源下载
书库
首页
职业考试
美团2021校招算法专属题
美团2021校招算法专属题
时长:120分钟
总分:100分
103浏览
0人已完成答题
开始做题
题型介绍
题型
多选题
数量
30
1.
目前处理非均衡数据分类问题的策略包括()
问题详情
查看答案
目前处理非均衡数据分类问题的策略包括( )
A. 过采样
B. 欠采样
C. 代价敏感学习
D. 集成学习
2.
下列关于k折交叉验证哪些选项正确?()
问题详情
查看答案
下列关于k折交叉验证哪些选项正确? ( )
A. 增大k会导致得到交叉验证结果时间变长
B. 增大k会导致交叉验证结果的置信度增加
C. 如果k=N,那它就是留一法验证,其中N是观测数量。
D. 验证的测试集中数据充足,比较容易得到准确的误报率
3.
以下描述错误的是?()
问题详情
查看答案
A. SVM是这样一个分类器,他寻找具有最小边缘的超平面,因此它也经常被称为最小边缘分类器(minimal margin classifier)
B. 在聚类分析当中,簇内的相似性越大,簇间的差别越小,聚类的效果就越差。
C. 在决策树中,随着树中结点数变得太大,即使模型的训练误差还在继续减低,但是检验误差开始增大,这是出现了模型拟合不足的问题。
D. 聚类分析可以看作是一种非监督的分类。
4.
使用Z-score标准化方法对样本数据进行标准化处理,则处理后的样本数据()
问题详情
查看答案
使用Z-score标准化方法对样本数据进行标准化处理,则处理后的样本数据( )
A. 均值为1
B. 标准差为1
C. 均值为0
D. 方差为0
5.
下列函数可以作为聚类分析中的准则函数的有()
问题详情
查看答案
下列函数可以作为聚类分析中的准则函数的有( )
A.
B.
C.
D.
6.
以下关于优化算法特点描述正确的是()
问题详情
查看答案
A. 随机梯度下降(SGD)是一种较为常见的优化算法,经常应用于大规模和稀疏机器学习问题当中。相对于非随机算法,SGD 能更有效的利用信息,在一定程度上加快了训练速度。
B. Momentum模拟物理里动量的概念,使参数更新的方向不仅由当前的梯度决定,也与此前累积的下降方向有关。可以加速sgd在正确方向的更新,并且抑制震荡。
C. Adagrad把所有梯度平方和开根号来除当前的梯度,在学习率方面进行了约束,每个分量有各自不同的学习率。
D. RMSProp中的衰减系数,让参数更新只关注最近一段时间窗口内的梯度,一定程度上可以避免因分母积累得太大而导致的学习率逐渐为0,进而提前结束训练的情况。
7.
下面关于贝叶斯分类器说法正确的是()
问题详情
查看答案
下面关于贝叶斯分类器说法正确的是( )
A. 贝叶斯的思想是“由因推果”
B. 贝叶斯的思想是“执果溯因”
C. 可以用极大似然估计法解贝叶斯分类器
D. 可以解决无监督学习的问题
8.
关于AUC指标说法正确的是()
问题详情
查看答案
关于AUC指标说法正确的是( )
A. AUC最小值为0
B. TPR=FPR时,AUC为0.5
C. TPR>FPR时,AUC<0.5
D. AUC最大值为1
9.
下列说法正确的是()
问题详情
查看答案
A. 当训练样本数量趋向于无穷大时,在该数据集上训练的模型变化趋是偏差变小
B. bagging降低方差,boosting降低偏差
C. bagging降低偏差,boosting降低方差
D. 泛化误差=方差+偏差+噪声
10.
与BP网络对比,CNN网络具有的不同点是()
问题详情
查看答案
与BP网络对比,CNN网络具有的不同点是( )
A. 神经元之间不存在同层连接
B. 神经元之间不存在跨层连接
C. 权值共享
D. 局部连接
11.
simplerandomsampling、systematicsampli...
问题详情
查看答案
simple random sampling、systematic sampling和stratified sampling的共同特点是( )
A. 抽样过程中每个个体被抽到的可能性相等
B. 都是不放回抽样
C. 适用于总体中的个体较少的情况
D. 都是从总体中逐个抽取来构成研究样本
12.
关于batchnormalization,以下说法错误的是?()
问题详情
查看答案
关于batch normalization,以下说法错误的是?()
A. BN可以加速网络收敛
B. BN可以缓解梯度爆炸问题
C. BN没有可学习的参数
D. BN只能放在激活函数之前
13.
下列哪些因素会对BP神经网络的训练效果产生影响()
问题详情
查看答案
下列哪些因素会对BP神经网络的训练效果产生影响( )
A. 权值初始值
B. 阈值初始值
C. 学习率
D. 隐层神经元个数
14.
下面关于SVM算法叙述正确的是()
问题详情
查看答案
下面关于SVM算法叙述正确的是( )
A. SVM在解决小样本、非线性及高维模式识别问题中具有优势
B. SVM是一种基于经验风险最小化准则的算法
C. SVM求得的解为全局唯一最优解
D. SVM最终分类结果只与少数支持向量有关
15.
关于Xgboost模型的说法,以下正确的是()
问题详情
查看答案
关于Xgboost模型的说法,以下正确的是( )
A. Xgboost模型适合处理稀疏特征
B. Xgboost模型不适合处理稀疏特征
C. Xgboost模型的损失函数由泰勒展开得到
D. Xgboost模型训练时候应使用尽可能多的特征
16.
关于模型的&ldquo泛化&rdquo能力,下列说法正确的是:()
问题详情
查看答案
关于模型的“泛化”能力,下列说法正确的是:( )
A. 表示模型在未知数据上的适用能力
B. 一般地,训练样本越多,模型“泛化”能力越强
C. 无监督学习模型不需要“泛化”能力
D. 模型越复杂,模型的“泛化”能力越强
17.
关于逻辑回归(LR)的损失函数,说法正确的是()
问题详情
查看答案
关于逻辑回归(LR)的损失函数,说法正确的是( )
A. LR的损失函数为交叉熵损失函数
B. LR的损失函数为对数似然损失函数
C. LR的损失函数一般不采用均方误差
D. LR的损失函数为合页损失函数
18.
下列说法正确的是?()
问题详情
查看答案
A. 加入dropout,会使神经网络的训练时间变长
B. dropout跟bagging操作的效果类似
C. dropout跟boosting操作的效果类似
D. 测试时也需要使用dropout,和训练时一样按照一定的概率将网络单元从网络中丢弃
19.
有一张名为&rdquotable&rdquo的表,含&rdquouser&rdquo、&rdquoitem&rdquo、&rdquonum&rdquo和&rdquo...
问题详情
查看答案
有一张名为”table”的表,含”user”、”item”、”num”和”date”四列,统计了某客户购买商品的数量和时间,现要求统计该表有多少条记录,以下哪些HQL语句可以实现:()
A. select count(*) as cnt from table
B. select count(1) as cnt from table
C. select count(user) as cnt from table
D. select count(all) as cnt from table
20.
关于bagging的说法,下面正确的是:()
问题详情
查看答案
A. 在欠拟合的情况下,bagging更能发挥作用
B. 在过拟合的情况下,bagging更能发挥作用
C. bagging的作用是减小模型偏差
D. bagging的作用是减小模型方差
21.
关于DNN中embedding的说法,下面正确的是:()
问题详情
查看答案
A. embedding能降低特征维度
B. embedding有益于网络参数的训练
C. embedding不能降低稀疏的影响
D. embedding用来处理稀疏特征
22.
下面哪些属于推荐算法样本特征的典型特点:()
问题详情
查看答案
D. 稠密
A. 低维
B. 高维
C. 稀疏
23.
关于boosting的说法,下面正确的是:()
问题详情
查看答案
A. 在欠拟合的情况下,boosting更能发挥作用
B. 在过拟合的情况下,boosting更能发挥作用
C. boosting的作用是减小模型偏差
D. boosting的作用是减小模型方差
24.
假定目标变量的类别非常不平衡,即主要类别占据了训练数据的99%。现在你的模...
问题详情
查看答案
假定目标变量的类别非常不平衡,即主要类别占据了训练数据的99%。现在你的模型在测试集上表现为99%的准确度。那么下面哪些表述是正确的?()
A. 准确度并不适合衡量不平衡类别问题
B. 精确率和召回率不适合于衡量不平衡类别问题
C. 通过数据重采样的方式可以缓解不均衡类别问题
D. 通过调整不同类别的权重,可以缓解不均衡类别问题
25.
LSTM中用到以下哪些激活函数:()
问题详情
查看答案
A. sigmoid
B. relu
C. tanh
D. leaky relu
26.
深度学习网络中BatchNormalization的作用是:()
问题详情
查看答案
深度学习网络中Batch Normalization的作用是:()
A. 归一化权重值
B. 归一化输入值
C. 加快模型的收敛速度
D. 是一种有效的误差反向传播方法
27.
以下哪些是LR模型的典型特点:()
问题详情
查看答案
A. 计算简单
B. 需要精细的特征工程
C. 难以构建低阶特征
D. 难以构建高阶特征
28.
以下哪些是hive支持的语法:()
问题详情
查看答案
A. order by
B. distribute by
C. group by
D. sort by
29.
以下哪些是hive支持的语法:()
问题详情
查看答案
A. insert into
B. cluster by
C. insert overwrite
D. partitioned by
30.
MapReduce计算过程中,以下哪些不是reduce任务的主要过程:()
问题详情
查看答案
A. split
B. merge
C. sort
D. partitions
开始测试
×
确定开始答题吗? 一旦开始,将马上开始计时。
提
问题
写
面经
写
文章
微信
公众号
扫码关注公众号
回到
顶部
登录
×
微信登录
账号登录
验证码登录
记住我
登 录
忘记密码?
没有帐户?
立即注册
获取短信验证码
登 录
没有帐户?
立即注册
注册帐号
×
获取短信验证码
我已阅读并同意
《服务协议》
注 册
已有帐号?
立即登录