数据挖掘 自习笔记 第三章 定性归纳实践(下)

别说谁变了你拦得住时间么 提交于 2019-12-04 22:13:44

属性相关分析方法:

首先,我的读后感是,对这一系列我感到比较困惑,不过,如果遇到实际问题的时候,只能按照例子,照搬步骤来分析。但是我初步理解到,按照下面的操作,是通过信息量,来分出个属性的主次,以便消除弱相关属性,并获得初始工作数据集。

这是一个基于信息(熵)进行属性相关分析的基本内容。

clip_image001

clip_image002

clip_image003

事例3.7:假设需要利用分析定性描述归纳方法,从一个大学数据库挖掘研究生的概念定性描述。

(1) 建立研究生目标数据集合。

(2) 利用AOI方法,根据属性泛化控制阙值对目标数据集所包含的属性进行初步分析。消除取值过多的属性并进行小规模属性泛化操作。从而获得3.5的结果。

clip_image004

(3) 用属性相关分析方法。首先是利用公式3.4计算当前数据进行分类所需要的信息量:

clip_image005

clip_image006

再用公式3.5 计算若利用major属性对数据进行分支所需要的信息为:

clip_image007

clip_image008

(4) 消除弱相关属性,并获得初始工作数据集。

(5) 最后利用算法3.1进行基于属性的归纳,并获得研究生目标数据集的概念描述。

 

基于属性归纳结果的表示

AOI方法的挖掘结果可以有多种输出表示形式。利用基于属性归纳所获得的挖掘结果通常都是采用如表-3.2所示的表格形式来加以描述。以下就是这样描述AOI方法挖掘结果的事例。

示例3.3:假设基于属性归纳操作是在一个商场数据库(2000年销售额)中进行的,从而获得如表-3.3所示的(泛化)归纳结果。

clip_image001[5]

clip_image003[5]

对上述归纳结果,我们可以转换成棒图表示描述

clip_image004[6]

分析定性描述事例

若所挖掘的概念秒速涉及许多属性,就需要对分析定性描述挖掘(analytical characterization)

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!