分散

出典: Wikipedio


プライバシー・ポリシー Wikipedioについて 免責事項 分散(ぶんさん、variance)は、確率論において、確率変数の2次の中心化モーメントのことで、確率変数の分布期待値からどれだけ散らばっているかを示す値。統計学においては、確率変数の分散だけでなく、標本標本平均からどれだけ散らばっているかを示す指標として標本分散が用いられる。

目次

確率変数の分散

2乗可積分確率変数<math>X</math>の分散は、<math>E</math>で期待値を表すことにして

<math>V(X)=E((X-E(X))^2)\,</math>

で定義される。同値な表現として、

<math>V(X)=E(X^2)-(E(X))^2\,</math>

とも書ける。

チェビシェフの不等式から、任意の正数<math>\epsilon</math>に対して

<math>P(|X-E(X)|>\varepsilon)\leq\frac{V(X)}{\varepsilon^2}</math>

が成り立つが、これは分散が小さくなるほど期待値の近くに変数が分布していることを示すおおざっぱな評価である。

確率変数<math>X</math>と<math>Y</math>が独立の場合、<math>V(X+Y)=V(X)+V(Y)</math>となる。

独立でない場合、<math>Cov</math>で共分散を表すことにして、<math>V(X+Y)=V(X)+V(Y)+2Cov(X,Y)</math>となる。

標本分散

n 個のデータ x1, x2, …, xn からなる標本があって、x をそのデータの相加平均とした時に、(x - xi)2 の平均

<math>s^2=\frac{1}{n}\sum_{i=1}^{n}(\bar{x}-x_i)^2</math>

標本分散 (sample variance) という。なお、後述の不偏分散を標本分散と呼ぶ文献もある。

定義より

<math>s^2=\frac{1}{n}\sum_{i=1}^{n}x_i^2-(\bar{x})^2=\bar{x^2}-(\bar{x})^2</math>

となるから、標本分散は、理論的には2乗の平均から平均の2乗を引いた値に等しい。したがって、手計算などではこの式による分散の計算が簡便でよい。しかし、有限桁しか扱えないコンピュータでこの式による標本分散を計算すると、桁落ちによる誤差が発生して正しく計算できないおそれがあるので、定義の式で計算することが望ましい。

不偏分散

標本分散は、その期待値が母分散(母集団の分散)よりも若干小さくなることが知られている。そこで、期待値が母分散に等しくなるように補正をかけた

<math>u^2=\frac{1}{n-1}\sum_{i=1}^{n}(\bar{x}-x_i)^2</math>

が用いられることも多く、これを母分散の不偏推定量であるとの意味で不偏分散 (unbiased variance) と呼ぶ。定義式より明らかなように、標本数が十分多ければ、不偏分散と標本分散の値はほぼ等しい。

不偏分散の期待値

不偏分散 u2 の期待値が母分散 σ2 に等しいことを示す。以下、母平均を μ とし、Σ は i = 1 から n までの和を表すものとする。また、関係式

<math>V[X]=E[X^2]-E[X]^2,\,</math>
<math>E[x_i]=\mu , \, V[x_i]=\sigma^2</math>

は繰り返し用いる。

<math>

\begin{align} E[u^2]&=E\left[ \frac{1}{n-1}\sum_{i} (x_i-\bar{x})^2 \right] \\ &=\frac{1}{n-1}\sum_{i}\left( E[x_i^2] -2 E[x_i\bar{x}] + E[\bar{x}^2] \right) \\ &=\frac{1}{n-1}\sum_{i}\left( \left(V \left[x_i \right]+E \left[x_i\right]^2 \right) -2 E[\bar{x}^2] + E[\bar{x}^2] \right) \\ &=\frac{n}{n-1}\left( (\sigma^2+\mu^2)- E[\bar{x}^2] \right) \\ &=\frac{n}{n-1}\left( (\sigma^2+\mu^2)-\left(V\left[\frac{1}{n}\sum_{i} x_i\right]+\mu^2 \right )\right) \\ &=\frac{n}{n-1}\left( (\sigma^2+\mu^2)-\left(\frac{1}{n^2}\sum_{i} V\left[x_i\right]+\mu^2 \right )\right) \\ &=\frac{n}{n-1}\left( \sigma^2-\frac{1}{n^2} \cdot n\sigma^2 \right) \\ &=\sigma^2 \end{align} </math>

関連項目

bg:Дисперсия (теория на вероятностите) bn:ভেদাঙ্ক ca:Variància cs:Rozptyl (statistika) da:Varians de:Varianz el:Διακύμανση en:Variance eo:Varianco es:Varianza et:Dispersioon eu:Bariantza fa:واریانس fi:Varianssi fr:Variance (statistiques et probabilités) gl:Varianza he:שונות id:Varians is:Dreifni it:Varianza ko:분산 lt:Dispersija mk:Варијанса ms:Varians nl:Variantie no:Varians pl:Wariancja pt:Variância ru:Дисперсия случайной величины scn:Varianza sh:Varijansa simple:Variance sk:Rozptyl (štatistika) sl:Varianca sr:Варијанса su:Varian sv:Varians tr:Varyans uk:Дисперсія випадкової величини ur:تفاوت vi:Phương sai zh:方差

個人用ツール