摩拜2018校招数据分析工程师笔试卷

时长:120分钟 总分:100分

214浏览 0人已完成答题

题型介绍
题型 单选题 简答题
数量 25 5
1.
在Shell编程中,下面哪个表示上一步所运行程序的返回值?
问题详情

在Shell编程中,下面哪个表示上一步所运行程序的返回值()




2.
在SQL语言中,子查询是(    ) 。
问题详情




3.
从一副牌(52张,不含打小怪)里抽出两张牌,其中一红一黑的概率是?
问题详情

从一副牌(52张,不含打小怪)里抽出两张牌,其中一红一黑的概率是




4.
SQL中,下列涉及空值的操作,不正确的是?( )
问题详情




5.
Mysql查询时,只有满足联接条件的记录才包含在查询结果,这种联接是()。
问题详情




6.
在shell中变量的赋值有四种方法,其中,采用name=12的方法称 。
问题详情




7.
A表字段a 类型int中有100条记录,值分别为1至100。如下语句 SELECT a FROM A WHERE a BETWEEN 1 AND 50 OR (a IN (25,70,95) AND a BETWEEN 25 AND 75) 则如下哪个值在这个sql语句返回的结果集中?
问题详情

A表字段a 类型int中有100条记录,值分别为1至100。如下语句 SELECT a FROM A WHERE a BETWEEN 1 AND 50 OR (a IN (25,70,95) AND a BETWEEN 25 AND 75)  则如下哪个值在这个sql语句返回的结果集中?




8.
已知表T1中有2行数据,T2中有3行数据,执行SQL语句,“select a.* from T1 a,T2 b”后,返回的行数为
问题详情




9.
从“产品”表里查询出价格高于产品名称为“一次性纸杯”的产品价格的记录,此SQL语句为?
问题详情




10.
shell不仅仅是用户命令解释器,同时一种强大的编程语言,linux缺省的shell是什么
问题详情




11.
想要了解上海市小学生的身高,需要抽取500个样本,这项调查中的样本是?
问题详情




12.
一组数据,均值>中位数>众数,问这组数据
问题详情




13.
SQL语言允许使用通配符进行字符串匹配的操作,其中&lsquo%&rsquo可以表示
问题详情




14.
关于正态分布,下列说法错误的是:
问题详情




15.
某人在被诊断为癌症后,他真正患癌症的概率为()
问题详情

人患癌症的概率为1/1000.假设有一台癌症诊断仪S1,通过对它以往的诊断记录的分析,如果患者确实患有癌症它的确诊率为90%,如果患者没有癌症,被诊断成癌症的概率是10%。某人在被诊断为癌症后,他真正患癌症的概率为()




16.
设随机变量X,Y不相关,且EX=2,EY=1,DX=3,则E(X(X+Y-2))=()
问题详情




17.
求一个被检查成合格品的产品确实为合格品的概率?
问题详情

某种产品,合格品率为0.96,一个合格品被检查成次品的概率是0.02,一个次品被检查成合格品的概率为0.05,问题:求一个被检查成合格品的产品确实为合格品的概率()




18.
以下关于PMF(概率质量函数),PDF(概率密度函数),CDF(累积分布函数)描述错误的是()
问题详情




19.
在Logistic Regression 中,如果同时加入L1和L2范数,会产生什么效果()
问题详情




20.
假设x1和x2是两个以0为均值,1为标准差的正态分布,那么x1+x2的概率密度分布是()?
问题详情




21.
Nave Bayes是一种特殊的Bayes分类器,特征变量是X,类别标签是C,它的一个假定是:()
问题详情




22.
在一个含有group by的查询sql中,同时存在having和where,sql在解析执行的时候,先执行的是哪一个?
问题详情


23.
SQL查询语句中where、group by、having 这些关键字区别和用法总结错误的是( )
问题详情




24.
执行以下 SQL ,下面哪个名字会被查询出来() SELECT Fir...
问题详情

执行以下 SQL ,下面哪个名字会被查询出来()

SELECT FirstName FROM StaffList WHERE FirstName LIKE’_A%’





25.
There are 3 doors, behind which are t...
问题详情

There are 3 doors, behind which are two goats and a car.

You pick a door (call it door A). You’re hoping for the car of course.

The game show host examines the other doors (B & C) and always opens one of them with a goat (Both doors might have goats he’ll randomly pick one to open)

So what is the chance of winning the game if you switch doors?





26.
有如下两张表格Orders, City_conf,表格结构如下 ...
问题详情

有如下两张表格Orders City_conf,表格结构如下

Orders
Id Coupon_fee Order_fee Citycode
1 2.0 1.0 010
2 1.0 0.5 NA
3 1.0 2.0 021
4 2.0 0.5 182
5 1.0 1.5 *&……%#
6 0 1.0 99999
...... ...... ...... ......


City_conf
Name Citycode Area
北京 010 North
苏州 0512 East
深圳 0755 South
成都 027 West
...... ...... ......

Orders表示订单表,包括优惠券金额,订单金额及产生订单的城市代码(注:城市代码包括已开城市Citycode及乱码/NA/不在已开城市代码中的数字)。City_conf表示摩拜所开城市列表,包括城市名称,城市代码及所属大区。请统计每个城市优惠券cover的订单费用。(注:1. 如果优惠券金额大于订单金额则cover的是订单费,否则为优惠券金额。2. 所有归不到城市列表中的订单统一为others)

27.
有如下两张表格Metro,Orders,表格结构如下 Metro ...
问题详情

有如下两张表格MetroOrders,表格结构如下

Metro

Name

Lng

Lat

中关村地铁站

121.442132

24.22421

望京地铁站

121.0284938

24.09839

。。。。

。。。。

。。。。

 

Orders

Id

Lng

Lat

Time

1

121.442132

24.22421

2017-07-01 22:11:14

2

121.0284938

24.09839

2017-07-01 22:11:15

。。。。

。。。。

。。。。

 

 

Metro表示地铁站列表,包括地铁站站名及经纬度坐标等字段。Oders表示订单表,包括开锁经纬度坐标及开锁时间等字段。 请统计每个地铁站周边1km范围内的订单,找出71日早上7:00-9:00期间 出行量最大的前10个地铁站。(先验知识:经度和纬度的小数点后两位相等即表示在一公里范围内)

28.
请写出在数据预处理过程中如何处理以下问题 1) 为了预测摩拜每天订单...
问题详情

请写出在数据预处理过程中如何处理以下问题

1) 为了预测摩拜每天订单数,我们建立了一个线性回归模型,其中有一个自变量为天气类型(分类变量),分为晴、阴、雾霾、沙尘暴、雨、雪等6种类型,请问如何处理这种变量

&lto:p> </o:p>

&lto:p> </o:p>

2) 仍然是1) 中的线性回归模型,其中有一个自变量为每天红包车的数量,但是这个变量有1/4的数据是缺失值,请写出至少两种处理缺失值的方法

&lto:p> </o:p>

&lto:p> </o:p>

3) 依然是1) 中的模型,其中自变量有4个,他们的相关系数矩阵如下:
795205nus.jpg

请问是否有问题?如有,请写出解决方法

29.
摩拜单车的车锁寿命(以小时计)为一随机变量,服从以标准差为300的正态分布...
问题详情

摩拜单车的车锁寿命(以小时计)为一随机变量,服从以标准差为300的正态分布。在一批样品中随机抽取 n = 25个车锁进行测试,得出平均寿命为10380小时。

1) 请计算总体平均车锁寿命miu95%置信区间(confidence interval

&lto:p> </o:p>

2) 在上面的研究中,假设我们有99%的信心认为误差界限(margin of error)不大于60小时,则需要随机抽取多少个车锁才能达到这一结果。

注:
795206oxj.jpg

30.
你在公交车站A等3路车,公交车到达车站符合泊松过程,且平均到达时间为10分...
问题详情

你在公交车站A3路车,公交车到达车站符合泊松过程,且平均到达时间为10分钟(lambda = 0.1/min)。假设公交车已经运营了一段时间,并且你在随机一个时间到达公交车站,请问

1) 等下一辆车来,你平均需要等多长时间?写出等车时间的概率密度函数

<o:p> </o:p>

2) 等第a辆车来,你平均需要等多长时间?写出等车时间的概率密度函数

<o:p> </o:p>

3) 2),你在公交车站A等到第a3路车来,坐车到公交车站B6路车,再等b6路车来,假设6路公交车到达车站也符合泊松过程,且平均到达时间也为10分钟。设第一阶段等待时间为T1,第二阶段等待时间为T2,则第一阶段等车时间占总共等车时间的比例为W = T1/T1+T2),请写出W的概率密度函数。