奇安信2019春招大数据

时长:120分钟 总分:100分

173浏览 0人已完成答题

题型介绍
题型 单选题 多选题
数量 62 15
1.
下面哪条命令可以把f1.txt复制为f2.txt?()
问题详情




2.
使用ln命令将生成了一个指向文件old的符号链接new,如果你将文件old...
问题详情

使用ln命令将生成了一个指向文件old的符号链接new,如果你将文件old删除,是否还能够访问文件中的数据?()




3.
ping使用的协议是()
问题详情




4.
怎样更改一个文件的权限设置()
问题详情




5.
在 bash 中, 在一条命令后加入"1&gt&amp2" 意味着()
问题详情

在 bash 中, 在一条命令后加入"1>&2" 意味着()




6.
vi中复制整行的命令是()
问题详情




7.
给进程1000发出暂停信号,可以用下面命令()
问题详情




8.
为了使文件所有者有读和写许可,其他用户只读,在设置文件许可值时,应该设为()
问题详情




9.
SQL语言中,修改表结构的语句是()
问题详情




10.
在关系数据库系统中,为了简化用户的查询操作,同时不增加数据的存储空间,常用...
问题详情

在关系数据库系统中,为了简化用户的查询操作,同时不增加数据的存储空间,常用的方法是创建()




11.
下面那个HTTP是网页返回正常的状态码()
问题详情




12.
下列哪些选项可以查看hdfs文件系统指定目录下文件的命令()
问题详情




13.
下列spark RDD方法中 哪些会产生数据shuffle()
问题详情




14.
spark下面哪些算子不是transformation算子()
问题详情




15.
spark streaming 中下面几种数据关系哪个正确()
问题详情




16.
如果有多个Kafka程序同时消费一个topic,如何保证取到不同的事件()
问题详情




17.
下面哪个功能是Kafka无法保证的()
问题详情




18.
Kafka的两条消息是否允许相同的key()
问题详情


19.
ElasticSearch的索引是()
问题详情




20.
ElasticSearch一个文本字段被标记为keyword类型,是否可以...
问题详情

ElasticSearch一个文本字段被标记为keyword类型,是否可以全文检索()


21.
下面哪个进程负责 HDFS 数据存储(&nbsp &nbsp &nbs...
问题详情

下面哪个进程负责 HDFS 数据存储(       )




22.
HDFS 中的 block 默认保存几份(&nbsp &nbsp &n...
问题详情

HDFS 中的 block 默认保存几份(       )




23.
HBase 依靠()存储底层数据
问题详情




24.
spark stage划分基于()
问题详情




25.
假设kafka集群有三个broker,则比较合理的partition数应设...
问题详情

假设kafka集群有三个broker,则比较合理的partition数应设置为()




26.
下面哪些可能是 spark 数据倾斜原因()
问题详情




27.
下列哪个是 Hadoop 运行的模式?(  )
问题详情




28.
spark调度模式有包括?(  )
问题详情




29.
elasticsearch集群监控状态包括(  )
问题详情




30.
elasticsearch节点角色类型包括(  )
问题详情




31.
Spark shuffle时 是否会在磁盘存储?()
问题详情


32.
如果NameNode意外终止SecondaryNameNode会接替它使集...
问题详情

如果NameNode意外终止SecondaryNameNode会接替它使集群继续工作?()


33.
Hadoop 支持数据的随机读写?()
问题详情


34.
Hadoop 自身具有严格的权限管理和安全措施保障集群正常运行?()
问题详情


35.
Hadoop 默认调度器策略为 FIFO?()
问题详情


36.
因为 HDFS 有多个副本,所以 NameNode 是不存在单点问题的?()
问题详情


37.
集群内每个节点都应该配 RAID,这样避免单磁盘损坏,影响整个节点运行?()
问题详情


38.
kafka的数据是存储在内存中的?()
问题详情


39.
关于dropout,下列说法正确的是(&nbsp &nbsp &nbs...
问题详情

关于dropout,下列说法正确的是(         )




40.
在卷积生成式对抗网络的生成器 G 里面,通常用(&nbsp )来取代池化层?
问题详情

在卷积生成式对抗网络的生成器 G 里面,通常用(  )来取代池化层?




41.
在卷积生成式对抗网络的判别器 D 里面,通常用(&nbsp )来取代池化层?
问题详情

在卷积生成式对抗网络的判别器 D 里面,通常用(  )来取代池化层?




42.
如果要存储一幅像素为800×600的16色图像,需要多少KB?()
问题详情

如果要存储一幅像素为800×600的16色图像,需要多少KB?()




43.
下列模型属于判别式模型的有哪些:() (1)马尔科夫随机场 (...
问题详情

下列模型属于判别式模型的有哪些:()
(1)马尔科夫随机场
(2)高斯过程 
(3)决策树 
(4)条件随机场 
(5)朴素贝叶斯 
(6)最大熵模型




44.
以下说法正确的是()
问题详情




45.
存在样本集合X=(8,10,12)和集合Y=(13,4,7),则Cov(X...
问题详情

存在样本集合X=(8,10,12)和集合Y=(13,4,7),则Cov(X,Y)的值为(      )




46.
以下哪些模型用到了EM算法求解(&nbsp &nbsp &nbsp ...
问题详情

以下哪些模型用到了EM算法求解(          )




47.
下列哪些选项描述的内容是正确的?()
问题详情




48.
训练CNN做图像分类时,下列哪些方法可以提升网络的泛化性能(&nbsp ...
问题详情

训练CNN做图像分类时,下列哪些方法可以提升网络的泛化性能(      )




49.
下面哪些是ReLU激活函数的特性?()
问题详情




50.
下列说法正确的有()
问题详情




51.
使用K-means算法进行聚类时,哪些参数需要用户预先指定(&nbsp ...
问题详情

使用K-means算法进行聚类时,哪些参数需要用户预先指定(      )




52.
ROC曲线上的点的横纵坐标轴分别表示分类器在测试数据上的()和()
问题详情




53.
ROC空间中的iso-accuracy直线的斜率等于()(N表示测试数据集...
问题详情

ROC空间中的iso-accuracy直线的斜率等于()(N表示测试数据集的大小,p表示其中正例个数,n表示其中负例个数)




54.
如下优化算法中,哪个需要计算损失函数的二阶导数()
问题详情




55.
假设某TV的一个列表中有10个频道,已知其中有2个频道为失效错误台,无法观...
问题详情

假设某TV的一个列表中有10个频道,已知其中有2个频道为失效错误台,无法观看,现在进行遍历检查,直到2个错误频道都被检查到为止,则检查所需打开的频道的平均次数(即数学期望E(X))为()




56.
下列哪种算法不属于ensemble方法()
问题详情




57.
关于PCA,以下哪些说法为真()
问题详情




58.
一个序列a=[1,4,2,5],现有卷积核k=[-1,1],则用k对a进行...
问题详情

一个序列a=[1,4,2,5],现有卷积核k=[-1,1],则用k对a进行卷积后的结果为:()




59.
输入图像大小为28x28,卷积核的大小为7x7,stride为1,则该图像...
问题详情

输入图像大小为28x28,卷积核的大小为7x7,stride为1,则该图像经卷积操作后大小为()




60.
一个简单的MLP有3个输入结点和一个输出结点,没有隐藏结点,从输入结点到输...
问题详情

一个简单的MLP有3个输入结点和一个输出结点,没有隐藏结点,从输入结点到输出结点的权值分别为4、5、6,激活函数为常数3,则输入为1、2、3的情况下输出值为()




61.
全联通网络中,输入层有10个结点,隐藏层有5个结点,则从输入层到隐藏层的最...
问题详情

全联通网络中,输入层有10个结点,隐藏层有5个结点,则从输入层到隐藏层的最大连接数量为()




62.
下面哪个是召回率的计算公式?()
问题详情




63.
下列关于随机梯度下降错误的是()
问题详情




64.
以下不是基于核算法的是()
问题详情




65.
下列哪个不属于CRF模型对于HMM和MEMM模型的优势()
问题详情




66.
已知正例点x=(3,3), y=(4,3),负例点z=(1,1),其间隔最...
问题详情

已知正例点x=(3,3), y=(4,3),负例点z=(1,1),其间隔最大分离超平面是? ()




67.
一个骰子,一个面是1,两个面是2,三个面是3,能使1、2、3都至少出现一次...
问题详情

一个骰子,一个面是1,两个面是2,三个面是3,能使1、2、3都至少出现一次的期望是多少()




68.
有如下6条记录的数据集: t1=[O,P,B], t2=[P,B,M],...
问题详情

有如下6条记录的数据集:
t1=[O,P,B], t2=[P,B,M], t3=[M,A], t4=[O,P,M], t5=[O,P,B,A], t6=[O,P,B,M,]
则支持度大于50%的频繁3项集为()




69.
下面哪种情况会影响K-means聚类的效果?()
问题详情




70.
下列可用于降低维度的算法有()
问题详情




71.
下列关于自然语言错误的是()
问题详情




72.
下列选项中描述错误的是()
问题详情




73.
以下不属于隐马尔科夫模型的三大问题的是()
问题详情




74.
句子&ldquoIf you do what you have always don...
问题详情

句子“If you do what you have always done you will get what you have always gotten”中的不同的2-gram的数量为()




75.
句子&ldquoIf you do what you have always don...
问题详情

句子“If you do what you have always done you will get what you have always gotten”中的不同的3-gram的数量为()




76.
以下哪个正则表达式能够匹配下面句子中的所有日期串() &ldquoThe next...
问题详情

以下哪个正则表达式能够匹配下面句子中的所有日期串()
“The next meetup on data science will be held on 2017-09-21, previously it happened on 31/03, 2016”





77.
一个语料库有N篇文档,从中随机抽取一篇文档,切词后该文档长度为T(个词),...
问题详情

一个语料库有N篇文档,从中随机抽取一篇文档,切词后该文档长度为T(个词),词“data”在该文中出现K次,同时词“data”在整个语料库的1/3的文档中出现过,则词“data”对抽出的这篇文档而言的tfidf为()