网易2018实习生招聘笔试题-机器学习算法实习生

时长:120分钟 总分:110分

98浏览 0人已完成答题

题型介绍
题型 单选题 填空题 简答题
数量 20 3 2
1.
关于矩阵的广义逆,下列表述不正确的是________
问题详情




2.
关于梯度方向,下列说法正确的是______
问题详情




3.
假定树根的高度为0,则高度为6的二叉树最多有_______个叶节点。
问题详情




4.
下列哪种不是使用随机森林计算特征重要度的方法______
问题详情




5.
对于给定1000个训练样本的二分类问题,关于支持向量机的说法,正确的有_____
问题详情




6.
下列哪种不是支持向量机的分类类别_____
问题详情




7.
下列关于核函数的表述正确的是______
问题详情




8.
下列哪项不是SVM的优势_____
问题详情




9.
下列关于闵可夫斯基(Minkowski)距离的描述,正确的是____
问题详情




10.
牛牛找工作
问题详情

为了找到自己满意的工作,牛牛收集了每种工作的难度和报酬。牛牛选工作的标准是在难度不超过自身能力值的情况下,牛牛选择报酬最高的工作。在牛牛选定了自己的工作后,牛牛的小伙伴们来找牛牛帮忙选工作,牛牛依然使用自己的标准来帮助小伙伴们。牛牛的小伙伴太多了,于是他只好把这个任务交给了你。
11.
在Java中,包com中定义了类TestUtil,在com的子包util中...
问题详情

在Java中,包com中定义了类TestUtil,在com的子包util中定义了同名类TestUtil,给定如下Java代码,编译运行时,将发生( )。
package test
import com.util.TestUtil
import com.TestUtil
public class Test {
  public static void main(String[] args)  {
    TestUtil testutil = new TestUtil()
  }
}




12.
给定某Java程序的main方法如下,该程序编译运行后的结果是( ...
问题详情

给定某Java程序的main方法如下,该程序编译运行后的结果是( )。
public class Test {
    int count = 21
    public void count() {
        System.out.println(++count)
    }
    public static void main(String args[]) {
        new Test().count()
        new Test().count()
    }
}




13.
想实现用装饰器来计时,空白处应填的代码是? # -*- coding: u...
问题详情

想实现用装饰器来计时,空白处应填的代码是?
# -*- coding: utf-8 -*-
import time, functools
def metric(fn):
    # 空白处
    def wrapper(*args, **kw):
        startTime = time.time()
        tmp = fn(*args, **kw)
        endTime = time.time()
        print('%s executed in %s s' % (fn.__name__, endTime - startTime ))
        return tmp
    return wrapper




14.
python是用C语言写成的,根据名字空间特性,以下代码经过python编...
问题详情

python是用C语言写成的,根据名字空间特性,以下代码经过python编译器编译后,一共得到()个PyCodeObject对象。
class A:
    pass
def Fun():
    pass
a = A()
Fun()





15.
已知有4个矩阵分别大小为M1(5*3) M2(3*4) ...
问题详情

已知有4个矩阵分别大小为M1(5*3) M2(3*4) M3(4*2) M4(2*7) 下面组合计算所需要的乘法次数最优的为?





16.
有20个人去看电影,电影票50元。其中只有6个人有50元钱,另外6个人都只...
问题详情

有20个人去看电影,电影票50元。其中只有10个人有50元钱,另外10个人都只有一张面值100元的纸币,电影院没有其他钞票可以找零,问有多少种找零的方法?




17.
一个完全二叉树节点数为200,则其叶子结点个数为?
问题详情




18.
字符串zmnzizi用哈夫曼编码来编码,则共有多少位?
问题详情




19.
已知中序遍历的序列为abcdef,高度最小的不可能的二叉树的前序遍历是
问题详情




20.
以下算法中未用到贪心算法思想的是?
问题详情




21.
下列选项中,不可能是快速排序第2趟排序结果的是 ()
问题详情




22.
数对
问题详情

牛牛以前在老师那里得到了一个正整数数对(x, y), 牛牛忘记他们具体是多少了。

但是牛牛记得老师告诉过他x和y均不大于n, 并且x除以y的余数大于等于k。

牛牛希望你能帮他计算一共有多少个可能的数对。

23.
矩形重叠
问题详情

平面内有n个矩形, 第i个矩形的左下角坐标为(x1[i], y1[i]), 右上角坐标为(x2[i], y2[i])。

如果两个或者多个矩形有公共区域则认为它们是相互重叠的(不考虑边界和角落)。

请你计算出平面内重叠矩形数量最多的地方,有多少个矩形相互重叠。

24.
某电商网站现在需要预测用户未来一周内购买哪些商品,请问: 1)可以使...
问题详情

某电商网站现在需要预测用户未来一周内购买哪些商品,请问:

1)可以使用哪些评价指标(至少写出两个)?

2)你会使用或构造哪些特征 (至少写出五个)?

3) 现可供使用的模型有Logistic模型 和 GBDT(Gradient Boosting Decison Tree)模型,请简述这两个模型的原理,并比较这两个模型的特点。

4) 训练模型后在线下的离线评价效果很好,但上线使用后发现效果极差,请分析可能的原因及解决方案。

25.
现在需要为一个现存的产品增加文本分类的功能,你决定使用RadomFores...
问题详情

现在需要为一个现存的产品增加文本分类的功能,你决定使用RadomForest模型,产品方能提供的训练数据只有2W,你从外部抓取其它文本相关的分类数据有5W

1)请问如何划分你的 training setvalidation set, testing set ? 

2)假定人去做文本分类的Human ErrorE1, 模型的Training Error E2, Valid/Testing Error E3,请问依据这些信息如果确定模型的改进方向和优化措施?(请举例说明)