招商银行信用卡中心2019秋招IT笔试(大数据方向第一批)
时长:120分钟 总分:100分
115浏览 0人已完成答题
题型介绍
题型 | 单选题 | 多选题 | 简答题 |
---|---|---|---|
数量 | 16 | 5 | 6 |
select * from tab ...
以下python脚本的运行结果正确的是   &nbs...
def addElement(_list):
print(6, id(_list))
_list.append(0)
print(7, id(_list))
return _list
if __name__ == "__main__":
list1 = [1, 2, 3]
print(1, id(list1))
list2 = addElement(list1)
print(2, list1)
print(3, id(list1))
print(4, list2)
print(5, id(list2))
Hive中concat函数的作用是是将传入的参数连接成为一个字符串,则co...
下面spark代码执行时,会读取几次file文件  &...
val raw = sc.textFile(file)
val pvLog = raw.filter(isPV(_))
val clLog = raw.filter(isCL(_))
val baseRDD = pvLog.union(clLog)
val baseRDD.count()
如果我们现有一个安装2.6.5版本的hadoop集群,在不修改默认配置的情...
查询每个部门中工资最高的员工 有两张表,一张表为员工表,包含员...
有两张表,一张表为员工表,包含员工ID,员工姓名,员工工资和员工所在的部门ID,
另一张表为部门表,包含部门ID和部门名称。
写出查询每个部门中工资最高的员工信息的SQL。对于上述两张表,输出应如下:
客户隐私管理是银行业的重中之重,现需要对数据仓库中多张表中存储的不同格式的...
小赵在测试pyspark的时候,写了一段代码如下 lines = s...
小赵在测试pyspark的时候,写了一段代码如下
lines = sc.textFile("data.txt")
lineLengths = lines.map(lambda s: len(s))
lineLengths.persist()
lineCount = lineLengths.count()
totalLength = lineLengths.reduce(lambda a, b: a + b)
1) 该代码运行过程中,请分析1,2,4行spark RDD的执行过程是怎么样的?
2) 请结合代码分析lineLengths.persist()这一步的作用