第四范式2019校园招聘建模笔试题

时长:120分钟 总分:100分

125浏览 1人已完成答题

题型介绍
题型 单选题 填空题
数量 30 2
1.
假定,我们在处理一个只有三个特征的二分类问题,使用bagging技术来优化...
问题详情

假定,我们在处理一个只有三个特征的二分类问题,使用bagging技术来优化它。max-feature = 2,n_estimators =3, 
 每个estimators的accuracy 是0.7, 可能获得的最大的精度是:(     )




2.
有下面一段python代码,  def count(): ...
问题详情

有下面一段python代码, 
def count():
    fs = [] 
    for i in range(1, 4): 
        def f(): 
            return i*i 
        fs.append(f) 
    return fs
 f1, f2, f3 = count()

如果执行f1(), f2()和f3(),下列说法正确的是:( )




3.
一段长度为L的线段,随机截成三段,请问这三段能够组成一个三角形的几率有多大...
问题详情

一段长度为L的线段,随机截成三段,请问这三段能够组成一个三角形的几率有多大:(    )




4.
下列map和reduce阶段的函数,能够被用来只选择重复记录的是:(&nb...
问题详情

下列map和reduce阶段的函数,能够被用来只选择重复记录的是:(    )






5.
假设二元分类的输出是概率值,一般设定输出概率大于或等于 0.5,则预测为正...
问题详情

假设二元分类的输出是概率值,一般设定输出概率大于或等于 0.5,则预测为正类;若输出概率小于 0.5,则预测为负类。那么,如果将阈值 0.5 提高,例如 0.6,大于或等于 0.6 的才预测为正类。则准确率(Precision)和召回率(Recall)会发生什么变化?(    )
i). 准确率(Precision)增加或者不变
ii). 准确率(Precision)减小
iii). 召回率(Recall)减小或者不变
iv). 召回率(Recall)增大




6.
下列哪个函数最容易发生梯度消失和梯度爆炸的情况 :(  &nbs...
问题详情

下列哪个函数最容易发生梯度消失和梯度爆炸的情况 :(    )




7.
若元素 a,b,c,d,e,f 依次进栈,允许进栈、退栈操作交替进行。但不...
问题详情

若元素 a,b,c,d,e,f 依次进栈,允许进栈、退栈操作交替进行。但不允许连续三次进行退栈操作,则不可能得到的出栈序列是:(    )





8.
spark 中的Stage 的 Task 的数量由什么决定 :( ...
问题详情

spark 中的Stage 的 Task 的数量由什么决定 :(     )




9.
优化分布式sql的时候,下列哪项说法是错误的 :(    )
问题详情




10.
在 bash 中, 在一条命令后加入"1>&2" 意味着:(...
问题详情

在 bash 中, 在一条命令后加入"1>&2" 意味着:(    )




11.
下列哪个是python中的不可变类型: (    )
问题详情




12.
单个神经元不能表示以下哪种逻辑关系?
问题详情




13.
关于 logistic regression和 SVM...
问题详情

关于 logistic regression和 SVM 不正确的是:(     )




14.
假设某个分类问题以AUC作为模型效果评价指标,评估时发现测试集AUC高于训...
问题详情

假设某个分类问题以AUC作为模型效果评价指标,评估时发现测试集AUC高于训练集AUC,最可能的原因是:(    )




15.
以下推荐方法中,推荐结果多样性最好的是:(    )
问题详情




16.
以下关于二分类模型的评价指标,描述错误的是:(    )
问题详情




17.
实际项目中,经常将多个机器学习模型的输出结合起来,以获得比单个模型更好、更...
问题详情

实际项目中,经常将多个机器学习模型的输出结合起来,以获得比单个模型更好、更鲁棒的输出。则下列说法正确的是:(    )




18.
下列哪项不是XGBoost的分裂点选择算法:(    ...
问题详情

下列哪项不是XGBoost的分裂点选择算法:(     )




19.
一个基金销售网站的基金产品,证券公司A占40%,证券公司B占60%,证券公...
问题详情

一个基金销售网站的基金产品,证券公司A占40%,证券公司B占60%,证券公司A的产品购买率是1%,证券公司B的产品购买率是2%,

现在抽出一支基金产品被购买,问是证券公司A的产品的概率:(    )





20.
 将一副完整的扑克牌(52张牌)随机地洗好。背面朝上累成一摞,然...
问题详情

 将一副完整的扑克牌(52张牌)随机地洗好。背面朝上累成一摞,然后从上往下依次翻开每一张牌,直到翻出第一张A。问:在这张A之后翻出的下一张牌,是黑桃A的概率和是黑桃2的概率比较,哪个大?




21.
下面哪种排序方法不属于比较排序:(    )
问题详情




22.
一个台阶总共有10级,如果一次可以跳1级,也可以跳2级。总共有多少总跳法:...
问题详情

一个台阶总共有10级,如果一次可以跳1级,也可以跳2级。总共有多少总跳法:(    )




23.
在一个卷积操作中,输入的feature map大小为32x32x3,通过一...
问题详情

在一个卷积操作中,输入的feature map大小为32x32x3,通过一个5x5大小的卷积核后,输出feature map的通道为6,卷积过程的stride为1,请问在这个过程中的参数数量是多少:(    )




24.
神经网络中的Dropout的效果跟以下哪种机器学习方法的效果类似:(&nb...
问题详情

神经网络中的Dropout的效果跟以下哪种机器学习方法的效果类似:(    )




25.
已知正负样本比1:10,precision/recall点是80%-80%...
问题详情

已知正负样本比1:10,precision/recall点是80%-80%,auc下限是:(     )




26.
已知正负样本比1:10,如果均匀采样,哪些指标受影响:(  &n...
问题详情

已知正负样本比1:10,如果均匀采样,哪些指标受影响:(     )






27.
L1和L2正则的先验分布服从怎样的分布:(    &n...
问题详情

L1和L2正则的先验分布服从怎样的分布:(     )




28.
一般,k-NN最近邻方法在(     )的情...
问题详情

一般,k-NN最近邻方法在(     )的情况下效果较好




29.
下列有关softmax函数的等式,哪个是正确的(其中x是输入向量,c是常数...
问题详情

下列有关softmax函数的等式,哪个是正确的(其中x是输入向量,c是常数,  e是自然对数)(    )。




30.
对数据集的某特征x进行线性变换,使用XGBoost进行学习,对模型的影响是...
问题详情

对数据集的某特征x进行线性变换,使用XGBoost进行学习,对模型的影响是:(    )




31.
流水表中插入切片表数据
问题详情

现在有两个数据表,
A表是某个商品的属性表,schema如下:
---------------------------
sku_id | a1 | a1_datetime |
---------------------------
其中sku_id是商品id;a1是商品的某个属性,例如评论数量;a1_datetime是采集商品属性的时间,每隔固定时间采集一次,如2018-07-01,2018-07-06,2018-07-11等

B表是客户浏览商品的记录表,schema如下:
---------------------------------
user_id | sku_id | buy_datetime |
---------------------------------
其中sku_id是商品id;user_id是客户id;datetime是购买时间,是随机的时间,如2018-07-05,2018-07-08,2018-07-12等

现在希望将A表和B表拼接成为C表,schema为
-------------------------------------------------------------
user_id | sku_id | buy_datetime | a1 | a1_datetime |
-------------------------------------------------------------
要求C表中每个商品sku_id的属性值a1,必须是在购买时刻之前最近的一次采集时间点采集的。



注意:
1.sqlite中时间函数julianday('time'):将返回从格林尼治时间的公元前 4714 年 11 月 24 日正午算起的天数。
2.sqlite中只支持left join,请将right join变成left join
3.sqlite中创建临时表语法是
CREATE TABLE new_table AS
  SELECT expressions
  FROM existing_tables
  [WHERE conditions]

输入描述: A、B两个数据表输入样例: A表: +--------+----+-------------+ | sku_id | a1 | a1_datetime | +--------+----+-------------+ | 1 | 3 | 2018-07-01 | | 1 | 5 | 2018-07-06 | | 1 | 7 | 2018-07-11 | | 2 | 2 | 2018-07-01 | | 2 | 4 | 2018-07-06 | | 2 | 6 | 2018-07-11 | +--------+----+-------------+ B表: +---------+--------+--------------+ | user_id | sku_id | buy_datetime | +---------+--------+--------------+ | 10001 | 1 | 2018-07-03 | | 10002 | 1 | 2018-07-04 | | 10003 | 1 | 2018-07-07 | | 10004 | 1 | 2018-07-09 | | 10005 | 2 | 2018-07-07 | | 10006 | 2 | 2018-07-19 | +---------+--------+--------------+ 输出描述: A、B两个数据表输出样例 结果( C表 ): +---------+--------+--------------+------+-------------+ | user_id | sku_id | buy_datetime | a1 | a1_datetime | +---------+--------+--------------+------+-------------+ | 10001 | 1 | 2018-07-03 | 3 | 2018-07-01 | | 10002 | 1 | 2018-07-04 | 3 | 2018-07-01 | | 10003 | 1 | 2018-07-07 | 5 | 2018-07-06 | | 10004 | 1 | 2018-07-09 | 5 | 2018-07-06 | | 10005 | 2 | 2018-07-07 | 4 | 2018-07-06 | | 10006 | 2 | 2018-07-19 | 6 | 2018-07-11 | +---------+--------+--------------+------+-------------+
32.
数组分解K个等和子数组
问题详情

给一个整数数组num,和一个正整数k,能否把数组num 切成k个子集,且各个子集的和相等。

请写出代码,返回bool 类型

输入描述: 一个整数数组num,和一个正整数k输入样例: [4, 3, 2, 3, 5, 2, 1]4 输出描述: 返回true 或者 false ,bool类型输出样例 True