数据挖掘的含义是什么

数据挖掘的含义是什么?

数据挖掘就是从大量的、不完全的、有l噪声的、模糊的、随机的实际应用数据中,提取隐藏在其中但又有潜在价值的信息和知识的过程。该定义包含以下几层含义:

(1)数据源必须是真实的、大量的、有噪声的;

(2)发现的是用户感兴趣的知识;

(3)发现的知识是可接受、可理解、可运用的;

(4)并不要求发现放之四海而皆准的知识,仅支持特定的发现问题。

数据挖掘以解决实际问题为出发点,核心任务是对数据关系和特征进行探索。一般而言,数据挖掘可以分为两类:一类是有指导学习或监督学习,另一类是无指导学习或非监督学习。监督学习是对目标需求的概念进行学习和建模,通过探索数据和建立模型来实现从观察变量到目标需求的有效解释。无监督学习没有明确的标识变量来表达目标概念,主要任务是探索数据之间的内在联系和结构。

你可能感兴趣的