IT博客汇
  • 首页
  • 精华
  • 技术
  • 设计
  • 资讯
  • 扯淡
  • 权利声明
  • 登录 注册

    [原]方差,协方差,标准差和均值标准差等各种差

    sheismylife发表于 2017-01-01 23:59:59
    love 0

    3 方差

    3.1 英文名称

    variance

    3.2 所属学科

    概率论和统计

    3.3 实际用途

    概率论中方差用来度量随机变量和其数学期望(即均值)之间的偏离程度。标准差、方差越大,离散程度越大。反之,离散程度越小。统计中的方差(样本方差)是各个数据分别与其平均数之差的平方的和的平均数。

    3.4 历史

    “方差”(variance)这一词语率先由罗纳德·费雪(Ronald Fisher)在其论文《The Correlation Between Relatives on the Supposition of Mendelian Inheritance》中提出。

    3.5 定义

    是在概率论和统计方差衡量随机变量或一组数据时离散程度的度量。

    3.6 公式

    设 X 是一个随机变量,若 E{[X−E(X)]2}

    存在,则称 E{[X−E(X)]2} 为 X 的方差,记为 D(X),Var(X)或 DX,其中 E(X)指的是对 X 的预期值,而 X 是实际值。即 D(x)=E{[X−E(X)]2}

    称为方差。这里E{}只能理解为一个记号,真正的公式在这里:

    s2=1n−1∑i=1n(xi−x¯)2(1)

    右边的求和公式可以转换成更容易计算的形式:

    ∑i=1n(xi−x¯)2=∑i=1n(x2i−2xiSumn+Sum2n2)=∑i=1nx2i−∑i=1n2xiSumn+∑i=1nSum2n2=∑i=1nx2i−2∑i=1nxiSumn+∑i=1nSum2n2=∑i=1nx2i−2SumSumn+Sum2n=∑i=1nx2i−Sum2n(2)
    • 说明
      • x¯=Sumn

  • ∑i=1n
      • 可以提取出来

    用newlisp计算,实现代码如下:

    ; variance of a data vector X
    (define (var X)
      (div (sum-d2 X) (sub (length X) 1)))
    ; sum of sqared differenses of X to mean of X
    (define (sum-d2 X)
      (sub (sum-sq X) (div (mul (sum X) (sum X)) (length X))))
    

    调用代码如下:

    > (module "stat.lsp")
    (lambda (stat:lst) (append (join (map string stat:lst) "\r\n") "\r\n"))
    > (setf a '(1 2 3 1 4 5 7))
    (1 2 3 1 4 5 7)
    > (stat:var a)
    4.904761904761905
    

    4 标准差

    (均方差)

    4.1 英文名称

    Standard Deviation

    4.2 实际用途

    由于方差是数据的平方,与检测值本身相差太大,人们难以直观的衡量,所以常用方差开根号换算回来这就是我们要说的标准差。

    4.3 公式

    σ=D(x)−−−−√(3)

    4.4 计算

    newlisp 调用如下:

    > (stat:sdev a)
    2.214669705568283
    

    5 协方差

    5.1 英文名称

    covariance

    5.2 简介

    从直观上来看,协方差表示的是两个变量总体误差的期望。方差是两个变量为同一个变量时的特殊的协方差。两个不同参数之间的方差就是协方差,若两个随机变量X和Y相互独立,则E[(X-E(X))(Y-E(Y))]=0,因而若上述数学期望不为零,则X和Y必不是相互独立的,亦即它们之间存在着一定的关系。

    5.3 公式

    Cov(X,Y)=E[(X−E(X))(Y−E(Y))](4)

    []内部的乘法式子变换一下

    =E[XY−XE(Y)−E(X)Y+E(X)E(Y))](5)

    将E[…]内部的都提取出来

    =E[XY]−E[XE(Y)]−E[E(X)Y]+E[E(X)E(Y))](6)

    E[..E(Y)] 这种计算方法是把E(Y)看成一个常数,可以提取到E外面,变成E[Y]E[…], 同理,E[E(X)E(Y))] => E(X)E(Y)

    =E[XY]−E[X]E[Y]−E[X]E[Y]+E[X]E[Y](7)

    所有E()都统一写成E[]

    =E[XY]−2E[X]E[Y]+E[X]E[Y](8)
    =E[XY]−E[X]E[Y](9)

    5.4 计算性质

    协方差的性质:

    1. Cov(X,Y)=Cov(Y,X)
    2. Cov(aX,bY)=abCov(X,Y), (a,b是常数)
    3. Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)

    6 均值的标准误差

    6.1 公式

    σmean=σn−−√(10)


沪ICP备19023445号-2号
友情链接