单选题

文本信息检索的一个核心问题是文本相似度计算，将查询条件和文本之间的相似程度...

发布于 2022-03-03 16:12:52

文本信息检索的一个核心问题是文本相似度计算，将查询条件和文本之间的相似程度数值化，从而方便比较。当文档和查询都表示成向量时，可以利用向量的内积的大小近似地表示两个向量之间的相关程度。

设有两个文档和查询抽取特征和去除停用词后分别是：
文档d1: a、b、c、a、f、b、a、f、h
文档d2: a、c
查询q: a、c、a
特征项集合为 {a、b、c、d、e、f、g、h}

如果采用二值向量表示，那么利用内积法计算出q和d1、d2的相似度分别是（）

A. 1、1

B. 2、2

C. 7、2

D. 0、0

登录后免费查看答案

关注者

被浏览

1 个回答

相关试卷

爱奇艺2019秋招算法方向笔试题（A） 2022-03-03

知识点

面圈网VIP题库全新上线，海量真题题库资源。 90大类考试，超10万份考试真题开放下载啦

去下载看看