招商银行信用卡中心2019秋招IT笔试(大数据方向第三批)

时长:120分钟 总分:100分

103浏览 1人已完成答题

题型介绍
题型 单选题 多选题 简答题
数量 16 5 6
1.
关于数据完整性的说法正确的是
问题详情




2.
Python如何定义一个函数
问题详情




3.
有关数据仓库的开发特点,不正确的描述是
问题详情




4.
桶排序和快速排序在最好的情况下的时间复杂度分别为
问题详情




5.
数据库系统中采用封锁技术的目的是为了保证
问题详情




6.
python代码如下: a = [i ...
问题详情

python代码如下:
a = [i for i in range(0,10) if i%2 == 0] 
b = (i for i in range(0,10) if i%2 == 0)
则以下说法正确的是




7.
以下关于ETL的说法错误的是
问题详情




8.
关于Hive 中的压缩格式 RCFile、TextFi...
问题详情

关于Hive 中的压缩格式 RCFile、TextFile、SequenceFile说法错误的是




9.
关于python中的复数,下列说法错误的是?
问题详情

关于python2.7中的复数,下列说法错误的是?




10.
下面有关HIVE描述错误的是
问题详情




11.
Spark不支持使用哪种语言进行开发
问题详情




12.
下列哪个组件不能使用Hadoop YARN进行资源管理
问题详情

下列哪个组件不能使用Hadoop YARN进行资源管理




13.
启用Hadoop2版本的Namenode高可用之后,哪些组件不再使用
问题详情




14.
以下关于Flume,说法错误的是
问题详情




15.
在bash中,export命令的作用是
问题详情




16.
Python中定义函数时的参数为
问题详情




17.
下列哪些函数是开窗函数
问题详情




18.
给你两张表,表A和表B,其中表A有3行数据,表B有5行数据,表A ...
问题详情

给你两张表,表A和表B,其中表A有3行数据,表B有5行数据,表A left join 表B后,以下说法正确的是




19.
关于子查询以下哪两种说法是正确的?
问题详情




20.
关于python变量,下列说法正确的是
问题详情




21.
以下Python数据类型中,不可以通过索引访问的是
问题详情




22.
谈谈数据集市、数据仓库的区别和联系
问题详情
23.
现有学生分数统计表pub_f_class_score如下: std_...
问题详情

现有学生分数统计表pub_f_class_score如下:

std_nm(学生姓名)    class(班级)         score(分数)        insert_dt(更新时间)

nm1                          cls1                    98                      2018-08-22

nm2                          cls2                    97                      2018-08-22

nm3                          cls1                    97                      2018-08-22

nm4                          cls1                    95                      2018-08-22

nm5                          cls2                    92                      2018-08-22

nm6                          cls2                    84                      2018-08-22

nm7                          cls1                    91                      2018-08-22

nm8                          cls2                    89                      2018-08-22

nm9                          cls2                    91                      2018-08-22

现在需要统计出每个班级中排名前三的学生姓名以及其分数,请写出SQL实现
24.
谈谈你对ETL过程中数据清洗的认识
问题详情
25.
设计一套报表系统的权限体系,具体场景为A开发某些报表,供本部门或其他部门的...
问题详情

设计一套报表系统的权限体系,具体场景为A开发某些报表,供本部门或其他部门的人员访问,所有人员的组织结构按照部门区分,每个部门的报表有很多,每个报表供访问的对象也不相同,有一些人会访问固定的一类报表,如何设置报表权限体系能满足需求场景并且设计相对简单,维护成本低?可以阐述在你设计的权限体系下如报表或人员发生变更的时候是否只涉及简单的权限变更。
26.
小赵在测试spark的时候,写了如下的代码 do lines ...
问题详情

小赵在测试spark的时候,写了如下的代码
do

lines = sc.textFile("data.txt")

pairs = lines.map(lambda s: (s, 1))

counts = pairs.groupByKey(lambda a, b: a + b)

结果运行时等待了一段时间直接报错,data.txt文件较大,小赵对其进行抽样后结果如下:

data

apple

apple

apple

new

name

apple

apple

work

as

请分析报错的原因以及解决方案
27.
以WordCount为例,分别画出使用mapredeuce执行的详细过程和...
问题详情

以WordCount为例,分别画出使用mapredeuce执行的详细过程和以spark执行的详细过程。