网易2018校招NLP算法工程师笔试卷

时长:120分钟 总分:100分

76浏览 0人已完成答题

题型介绍
题型 填空题 简答题
数量 3 2
1.
独立的小易
问题详情

小易为了向他的父母表现他已经长大独立了,他决定搬出去自己居住一段时间。一个人生活增加了许多花费: 小易每天必须吃一个水果并且需要每天支付x元的房屋租金。当前小易手中已经有f个水果和d元钱,小易也能去商店购买一些水果,商店每个水果售卖p元。小易为了表现他独立生活的能力,希望能独立生活的时间越长越好,小易希望你来帮他计算一下他最多能独立生活多少天。
2.
堆棋子
问题详情

小易将n个棋子摆放在一张无限大的棋盘上。第i个棋子放在第x[i]行y[i]列。同一个格子允许放置多个棋子。每一次操作小易可以把一个棋子拿起并将其移动到原格子的上、下、左、右的任意一个格子中。小易想知道要让棋盘上出现有一个格子中至少有i(1 ≤ i ≤ n)个棋子所需要的最少操作次数.
3.
小易喜欢的数列
问题详情

小易非常喜欢拥有以下性质的数列:
1、数列的长度为n
2、数列中的每个数都在1到k之间(包括1和k)
3、对于位置相邻的两个数A和B(A在B前),都满足(A <= B)或(A mod B != 0)(满足其一即可)
例如,当n = 4, k = 7
那么{1,7,7,2},它的长度是4,所有数字也在1到7范围内,并且满足第三条性质,所以小易是喜欢这个数列的
但是小易不喜欢{4,4,4,2}这个数列。小易给出n和k,希望你能帮他求出有多少个是他会喜欢的数列。
4.
假设某台服务器上有一个10亿行文本的文件,文件中每一行都是已经经过分词的句...
问题详情

假设某台服务器上有一个10亿行文本的文件,文件中每一行都是已经经过分词的句子。现在需要统计该文件中每个词出现的频次,现在有另有5台服务器供你使用,你能否设计流程,充分利用这些服务器,尽可能的快速统计出词语频次?
(请重点描述文件按何种方式分割到多台服务器,每台服务器计算出什么样的结果,这些结果又是按何种方式聚合到一起得到我们最终需要的词频统计信息的)
5.
1、请言简意赅地描述一个你所参与的NLP相关项目,包括项目的目标(需要解决...
问题详情

1、请言简意赅地描述一个你所参与的NLP相关项目,包括项目的目标(需要解决的问题)以及系统架构,然后详述一个你最熟悉的模块。
2、如果上述模块是采用传统的机器学习算法(LR,GBDT,SVM等),请你结合应用谈谈你是如何设计和选择特征的;如果采用的是深度学习方法,请你说明此项目中使用的深度学习算法具有什么样的优势?
3、在该项目中是否使用某些开源的工具或者框架,对比同类工具和框架他们具有什么特点?
4、描述你在参与项目中遇到的主要困难以及你的解决办法。