Numpy数据分析

Posted by Joey on January 29, 2023

随机变量

  • 随机变量分为两类:离散型和非离散型。
  • 离散型:若随机变量X只能取到有限个或者可列个不同值,则称X为离散型随机变量。比如抽一张纸牌,一共54张,把这个事件转化成随机变量,这个随机变量的取值最多54个,是有限的。这就是离散型随机变量。
  • 非离散型:与离散型相对地,非离散型随机变量指随机变量有不可列个不同取值的随机变量。比如人的身高,可以从0厘米到300厘米任取,是无限个取值,因此是非离散型的。

协方差

  • 协方差(Covariance)在概率论和统计学中用于衡量两个变量的总体误差。 而方差是协方差的一种特殊情况,即当两个变量是相同的情况。 协方差表示的是两个变量的总体的误差,这与只表示一个变量误差的方差不同。

协方差矩阵

  • 针对一维样本集合,求出的协方差其实就是方差,即方差是协方差的一种特殊情况,都是反应集合中各元素离散度的。
  • 针对二维样本集合,求出的协方差反应的就是两纬度之间的相关性,正相关性或负相关性,或无关。
  • 针对三维样本集合,求出的是各个维度总体的相关性,针对各维度之间的关系,所以二维以上计算协方差,用的是协方差矩阵

含义:

本文首次发布于 Joey Blog, 作者 @乔宇(Joey) ,转载请保留原文链接..