数据挖掘概念
数据挖掘所挖掘的结果是面向全部的数据,而机器学习则是预测测试样本的检测结果。 1. 2. 3. 4. 5. 2.互信息值: 2 4V Volume ( ) Variety ( ) Velocity Value 4.数据挖掘的主要功能 5.多站点处理: 1. 单机多进程 2. 集群分布式计算效果 6.频繁项集: (min_sup) : : ―― Apriori Growth C 2 C C R R R R R R rd:() → yd yd 11.凝聚法分层聚类 有一堆方法可以用来算两点( pair)之间的距离:欧式,欧式平方,manhattan等,还有一堆方法可以算类(cluster)与类之间的距离,什么single-linkage、complete-linkage、还有这个ward linkage。(即最短最长平均,离差平方和) Extrapolation 关联规则的评价指标是支持度、置信度 13.分类规则的挖掘方法 通常有:决策树法、贝叶斯法、人工神经网络法、粗糙集法和遗传算法。 14.模型的具体化 就是预测公式,公式可以产生与观察值有相似结构的输出,这就是预测值。 15.频繁闭项集 “ - - 楗煎共 ” “ - 楗煎共 ” “ - - 楗煎共 ” g(f(X)) DM DB/DM DB DM DB/DW 原文:https://www.cnblogs.com/lgx