协方差,皮尔逊相关性,卡方检验
1、协方差 协方差 (Covariance)在 概率论 和 统计学 中用于衡量两个变量的总体 误差 。而 方差 是协方差的一种特殊情况,即当两个变量是相同的情况。 期望值 分别为 与 的两个具有有限二阶 矩 的 实数 随机变量 X 与 Y 之间的 协方差 定义为: 协方差表示的是两个变量的总体的 误差 ,这与只表示一个变量误差的 方差 不同。 如果两个 变量 的变化趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值。 如果两个变量的变化趋势相反,即其中一个大于自身的期望值,另外一个却小于自身的期望值,那么两个变量之间的协方差就是负值。 2、 两个变量之间的皮尔逊相关系数定义为两个变量之间的 协方差 和 标准差 的商: 上式定义了 总体 相关系数,常用希腊小写字母 ρ (rho) 作为代表符号。估算 样本 的协方差和标准差,可得到 样本相关系数 (样本皮尔逊系数),常用英文小写字母 r 代表: 数据标准化之后,(服从标准正太分布的话)夹角余弦,皮尔逊相关度是一样的 3、卡方检验 这个还不是太明白数学意义,这是怎么来的,为啥这么算???,而且没实际使用过。 具体介绍参考这篇博客 https://blog.csdn.net/bitcarmanlee/article/details/52279907 参考资料: https:/