数据挖掘(DataMining),就是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程。
数据挖掘的广义观点:数据挖掘就是从存放在数据库,数据仓库或其他信息库中的大量的数据中“挖掘”有趣知识的过程。数据挖掘,又称为数据库中知识发现(KnowledgeDiscoveryinDatabase,KDD),也有人把数据挖掘视为数据库中知识发现过程的一个基本步骤。
知识发现过程以下步骤组成:
(1)数据清理,(2)数据集成,(3)数据选择,(4)数据变换,(5)数据挖掘,(6)模式评估,(7)知识表示。数据挖掘可以与用户或知识库交互。
空间数据挖掘是指从空间数据库中抽取没有清楚表现出来的隐含的知识和空间关系,并发现其中有用的特征和模式的理论、方法和技术。空间数据挖掘和知识发现的过程大致可分为以下多个步骤:数据准备、数据选择、数据预处理、数据缩减或者数据变换、确定数据挖掘目标、确定知识发现算法、数据挖掘、模式解释、知识评价等,而数据挖掘只是其中的一个关键步骤。但是为了简便,人们常常用空间数据挖掘来代替空间数据挖掘和知识发现。空间数据挖掘(SpatialDataMining,SDM)是数据挖掘的一个分支,是在空间数据库的基础上,综合利用各种技术方法,从大量的空间数据中自动挖掘事先未知的且潜在有用的知识,提取出非显式存在的空间关系或其它有意义的模式等,揭示出蕴含在数据背后的客观世界的本质规律、内在联系和发展趋势,实现知识的自动获取,从而提供技术决策与经营决策的依据。数据挖掘所能发现的知识最常见的有以下五种类型:广义知识、关联知识、分类知识、聚类知识和预测型知识。而要发现这些知识就需要运用相应空间数据挖掘方法。
综上所述,二者之间的共同点是:
1.都是基于已经获得的数据,无论是存储在数据库,数据仓库,或者是文件当中的数据进行分析;
2.都是从大量的信息当中,通过数据间的内在联系提取出操作者感兴趣的数据;
3.提取出的数据都是非显式存储的,或者说是隐藏在原有数据当中的;
4.空间数据挖掘是数据挖掘技术的一个重要分支和发展;
5.二者均以统计学为数学基础。
另外二者的不同之处在于:
1.传统数据挖掘处理的是数字和类别,而空间数据则是一些更为复杂的数据类型,例如:点、线、多边形等对象;
2.传统数据挖掘通常具有显式的输入,而空间数据挖掘的输入则常常是隐式的;
3.在传统数据挖掘中,有一个至关重要的前提假设,即数据样品是独立生成的,而这一假设在空间分析中是不成立的,事实上,空间数据之间是高度自关联的。
4.数据源十分丰富,数据量非常庞大,数据类型多,存取方法复杂;
5.应用领域十分广泛,只要与空间位置相关的数据,都可以对其进行挖掘;
6.挖掘方法和算法非常多,而且大多数算法比较复杂,难度大;
7.知识的表达方式多样,对知识的理解和评价依赖于人对客观世界的认知程度。
白癜风治疗哪里最好到哪家白癜风治疗好