属性相关分析方法:
首先,我的读后感是,对这一系列我感到比较困惑,不过,如果遇到实际问题的时候,只能按照例子,照搬步骤来分析。但是我初步理解到,按照下面的操作,是通过信息量,来分出个属性的主次,以便消除弱相关属性,并获得初始工作数据集。
这是一个基于信息(熵)进行属性相关分析的基本内容。
事例3.7:假设需要利用分析定性描述归纳方法,从一个大学数据库挖掘研究生的概念定性描述。
(1) 建立研究生目标数据集合。
(2) 利用AOI方法,根据属性泛化控制阙值对目标数据集所包含的属性进行初步分析。消除取值过多的属性并进行小规模属性泛化操作。从而获得3.5的结果。
(3) 用属性相关分析方法。首先是利用公式3.4计算当前数据进行分类所需要的信息量:
再用公式3.5 计算若利用major属性对数据进行分支所需要的信息为:
(4) 消除弱相关属性,并获得初始工作数据集。
(5) 最后利用算法3.1进行基于属性的归纳,并获得研究生目标数据集的概念描述。
基于属性归纳结果的表示
AOI方法的挖掘结果可以有多种输出表示形式。利用基于属性归纳所获得的挖掘结果通常都是采用如表-3.2所示的表格形式来加以描述。以下就是这样描述AOI方法挖掘结果的事例。
示例3.3:假设基于属性归纳操作是在一个商场数据库(2000年销售额)中进行的,从而获得如表-3.3所示的(泛化)归纳结果。
对上述归纳结果,我们可以转换成棒图表示描述
分析定性描述事例
若所挖掘的概念秒速涉及许多属性,就需要对分析定性描述挖掘(analytical characterization)
来源:oschina
链接:https://my.oschina.net/u/1021819/blog/131159