奇安信2020数据分析及应用(二)
时长:90分钟 总分:63分
169浏览 1人已完成答题
题型介绍
题型 | 单选题 | 多选题 | 简答题 |
---|---|---|---|
数量 | 45 | 15 | 3 |
HDFS(配置的block大小为128MB),上有一个目录/home/da...
设mysql数据库中一个表t_score的结构为:t_score(SN,C...
通过某分类器对样本数据进行判断,其中对于正样本预测准确的为90个,预测错误...
分析某一样本,其中正样本为60个,负样本为30个。针对样本的某个特征X,当...
判断该偏微分方程为什么类型3(∂^2u)/(∂x^2)+4(∂^2u)/∂...
3(∂^2 u)/(∂x^2 )+4(∂^2 u)/∂x∂y+1 (∂^2 u)/(∂y^2 )+2 ∂u/∂x-4 ∂u/∂y+5=0
关于以下代码,说法错误的是:line1:valrdd=sc.textFil...
line1: val rdd = sc.textFile("hdfs:///home/data")
line2: rdd.count()
line3: rdd.reduce(_+_)
line4: rdd.collect()
现有access.log文件,内容格式如下:503,66,c.html40...
503,66,c.html
404,17,a.html
503,56,c.html
200,14,d.html
503,11,c.html
503,48,c.html
要求:使用Spark-core完整的编码实现以下要求:
要求:1)计算404、200出现的数次;
2)计算503、200、404三类出现总次数,最终打印出来;