KDD是什么?

阅读 1868 收藏 0 点赞 0 评论 0

KDD 代表数据库中的知识发现。它定义了在数据中发现知识的广泛过程,并强调了确定数据挖掘技术的高级应用。它是多个领域的研究人员感兴趣的领域,例如人工智能、机器学习、模式识别、数据库、统计、专业系统的知识获取和数据可视化。

KDD 过程的主要目标是从庞大数据库上下文中的信息中提取数据。它通过利用数据挖掘算法来识别被视为知识的内容来实现这一点。数据库中的知识发现被视为对巨大数据存储库进行的程序化、探索性分析和建模。KDD 是从大量困难的数据集中识别有效、有用和可理解的设计的有组织的过程。

KDD 是识别数据中有效、新颖、可能有用且基本符合逻辑的设计的重要过程。该过程表明 KDD 包括许多步骤,包括数据准备、模式搜索、知识评估和细化,所有步骤都在多次迭代中重复。非平凡是指包含某些搜索或推理;也就是说,它不像计算一组数字的平均值那样容易计算预定义的数量。

数据挖掘是 KDD 过程的根源,例如推断调查记录、开发模型和发现以前未知模式的算法。该模型用于从信息中提取知识、分析信息和预测信息。

数据挖掘是 KDD 过程中的一个步骤,包括应用数据分析和发现算法,在可接受的计算效率限制下,对数据进行特定的模式(或模型)枚举。

模式的领域通常是无限的,模式的枚举包含在这个空间中的某种形式的搜索。实际的计算约束严重限制了数据挖掘算法可以分析的子空间。

KDD 过程包含使用数据库以及一些必需的选择、预处理、子采样和转换;使用数据挖掘方法(算法)从中枚举模式;并计算数据挖掘的产品以识别被视为知识的枚举模式的子集。

KDD 过程的数据挖掘组件涉及从记录中提取和枚举模式的算法方法。完整的 KDD 过程包含对挖掘模式的评估和可能的解释,以确定可以用新知识处理哪些模式。

评论列表


问题


面经


文章

微信
公众号

扫码关注公众号