招商银行信用卡中心2018春招IT笔试(数据方向第一批)

时长:120分钟 总分:100分

169浏览 0人已完成答题

题型介绍
题型 单选题 多选题 填空题 简答题
数量 18 2 1 4
1.
以下哪个程序员的说法是合理的
问题详情




2.
以下哪个关键字是用来删除表
问题详情




3.
查询client表中的所有非空phone信息, 以下语句正确的是
问题详情




4.
在做数据库的TRUNCATE操作时,下列叙述错误的是
问题详情




5.
有保存学生的课程分数的表STU_SCORE,STU_ID为学号,SCORE...
问题详情

有保存学生的课程分数的表STU_SCORE,STU_ID为学号,SCORE为分数,
以下哪个不能计算出学生的课程平均分




6.
关于Hadoop配置机架感知,下面哪项不正确
问题详情




7.
以下关于Hive基本操作描述正确的是
问题详情




8.
Spark on Yarn模式提交任务后,会进行以下几个过程 ①向Yarn...
问题详情

Spark on Yarn模式提交任务后,会进行以下几个过程
①向Yarn申请executor资源。
②任务构建成DAG图。
③Task发送给executor执行。
④进行Stage划分与TaskSet生成。
⑤启动SparkContext。
⑥executor向SparkContext进行注册。
以上过程发生的先后顺序为




9.
Spark中各Stage的Task数量由什么决定
问题详情




10.
Spark默认的存储级别是
问题详情




11.
Hive 的元数据存储在 derby 和 MySQL 中有什么区别
问题详情




12.
spark 的 master 和 worker 通过什么方式进行通信的
问题详情

spark1.6.0之后 的 master 和 worker 通过什么方式进行通信的




13.
下列哪项不是数据仓库的特点
问题详情




14.
下列哪项不属于数据仓库常用模型
问题详情




15.
以下哪项关于决策树的说法是错误的
问题详情




16.
以下哪种算法在预测时才开始训练
问题详情




17.
下面的决策树中,能解决回归问题的是
问题详情




18.
以下不属于Bagging的特点是
问题详情




19.
A表:上学年学生期末考试成绩(只包含参与考试的学生成绩)B表:上学年学生期...
问题详情

A表:上学年学生期末考试成绩(只包含参与考试的学生成绩)
B表:上学年学生期末考试补考成绩(包括挂科重考、缺考的学生成绩)
A、B表表结构:STU_NO int (PK),RESULT int
要得到补考结束后最新的学生成绩,则正确的是




20.
以下哪些选项HIVE可以避免进行MapReduce
问题详情




21.
在python的类的方法定义中,请描述'self'参数的作用?
问题详情
22.
简述HDFS的Namenode的HA架构特点
问题详情
23.
已知Hive中有人员信息表a: 以及人员信息表b: ...
问题详情

已知Hive中有人员信息表a:
790015fco.jpg
以及人员信息表b:
790015fco.jpg

请用Hive SQL得出表c

790015fco_2.jpg

即实现以下逻辑:

取表a和表b所有人员的信息得出表c,若某一人员同时存在于表a和表b,则表b人员信息优先。

24.
以下表格是一部分信用卡用户的特征,以及其是否购买账单分期的打标。现根据这些...
问题详情

以下表格是一部分信用卡用户的特征,以及其是否购买账单分期的打标。现根据这些样本构造ID3决策树,请问第一次分支选用哪一个特征(附上计算过程)。
790016yae.jpg
25.
潜在风险客户识别
问题详情

以边关系表示客户间的转账行为,若客户12转账,就认为存在1指向2的边。假设从某个客户1出发,沿着其任意转账关系边查找,若最终均可以到达终止客户(不存在帐务转出的客户),则认为客户1是安全客户;否则认为客户1是潜在风险客户。即,所有处于转账关系环中的客户以及指向环中客户的客户节点均是潜在风险客户。如下图,只有客户6是安全客户。

输入描述: 第一行为空格分隔的两个整数n和m。n为总客户数,m为总的转账关系边数。n不超过10000,m不超过100000。客户即表示为1到n的整数。
其后m行为所有的边关系,每一行为一条转账关系边,边描述为以逗号分隔的两个客户。输入样例: 6 6 1,3 2,4 2,6 3,4 4,5 5,3 输出描述: 在同一行输出所有安全客户列表,无顺序要求。客户间以空格分隔。若客户列表为空,则输出None。详见样例。输出样例 6