招商银行信用卡中心2019秋招IT笔试(数据挖掘方向第一批)

时长:120分钟 总分:98分

142浏览 0人已完成答题

题型介绍
题型 单选题 简答题
数量 25 4
1.
关于逻辑回归和 SVM算法,说法不正确的是()
问题详情




2.
下面有关分类算法的准确率、召回率、F1 值的描述,错误的是()
问题详情




3.
下列哪个不属于CRF模型对于HMM和MEMM模型的优势()
问题详情




4.
有关熵的论述不正确的是()
问题详情




5.
在深度学习网络中,以下哪种技术不是主要用来提升模型泛化能力的()
问题详情




6.
有两个随机数A和B,系统将随机为A生成一个均匀分布于0到0.8的值,为B生...
问题详情

两个随机数AB,系统将随机为A生成一个均匀分布于00.8的值,为B生成一个均匀分布于00.2的值,那么最终B大于A的概率为()




7.
有一个箱子,n把钥匙,只有一把钥匙能打开箱子,现在拿钥匙去开箱子,平均多少...
问题详情

一个箱子,n把钥匙,只有一把钥匙能打开箱子,现在拿钥匙去开箱子,平均多少次能打开箱子?




8.
以下crontab命令在什么时间自动执行:03 02 * * 5 sh /...
问题详情

以下crontab命令在什么时间自动执行:03 02 * * 5 sh /home/userA/test.sh




9.
Linux系统中,在给定文件中查找与设定条件相符字符串的命令为()
问题详情




10.
将原始数据进行集成、变换、维度规约、数值规约是以下哪个步骤的任务?
问题详情




11.
以下哪些分类方法可以较好地避免样本的不平衡问题()
问题详情




12.
有一个64个面的骰子,其中30个面是1,34个面是2 ,当你掷出1时的信息...
问题详情

有一个64个面的骰子,其中30个面是1,34个面是2 ,当你掷出1时的信息熵是()




13.
以下哪个不是判别式模型()
问题详情




14.
以下哪项不是用于解决overfitting问题的()
问题详情




15.
关于K均值和DBSCAN的比较,以下说法不正确的是()
问题详情




16.
某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据...
问题详情

某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题()




17.
数据科学家可能会同时使用多个算法(模型)进行预测, 并且最后把这些算法的结...
问题详情

数据科学家可能会同时使用多个算法(模型)进行预测, 并且最后把这些算法的结果集成起来进行最后的预测(集成学习),以下对集成学习说法正确的是()




18.
bootstrap数据是什么意思()
问题详情




19.
下列选项中不属于面向对象设计方法主要特征的是()
问题详情




20.
以下哪个不是spark的组件()
问题详情




21.
协同过滤经常被用于推荐系统,包含基于内存的协同过滤、基于模型的协同过滤以及...
问题详情

协同过滤经常被用于推荐系统,包含基于内存的协同过滤、基于模型的协同过滤以及混合模型。 以下说法不正确的是()




22.
设属性salary的最小最大值分别是7000元和54000元。利用最大-最...
问题详情

设属性salary的最小最大值分别是7000元和54000元。利用最大-最小规范化的方法将属性的值映射到0至1的范围内。对属性salary5的33600元将被转化为()




23.
在基本K均值算法里,当邻近度函数采用( )的时候,合适的质心是簇中各点的中位数。
问题详情




24.
下列特征工程的说法不正确的是()
问题详情




25.
Naive Bayes是一种特殊的Bayes分类器,特征变量是X,类别标签...
问题详情

Naive Bayes是一种特殊的Bayes分类器,特征变量是X,类别标签是C,它的一个假定是()




26.
在分类问题中,经常会遇到正负样本数据量不等的情况,有哪些处理手段?若出现欠...
问题详情

在分类问题中,经常会遇到正负样本数据量不等的情况,有哪些处理手段?若出现欠拟合和过拟合,可能的原因有哪些,该如何避免?
27.
以下是用户A、B、C、D购买过的物品(以小写字母表示)列表,请给出基于用户...
问题详情

以下是用户A、B、C、D购买过的物品(以小写字母表示)列表,请给出基于用户的协同过滤算法计算用户A对c、e的兴趣(用户相似度以余弦相似度度量)。
A: a b d
B: a c
C: b e
D: c d e

28.
请描述随机森林与GBDT的区别。
问题详情
29.
点击通过率CTR(Click-Through-Rate),一般指网络广告的...
问题详情

点击通过率CTR(Click-Through-Rate),一般指网络广告的点击到达率,即该广告的实际点击次数除以广告的展现量。请描述如何用逻辑回归(LR)进行CTR预估,并简述LR中正则化和特征离散化的作用。