相関係数 - その1

今回用いるデータは2014-06-08付データと、以前作成した生年・デビュー年の表です。

相関係数

相関係数(そうかんけいすう、英: correlation coefficient)とは、2 つの確率変数の間の相関(類似性の度合い)を示す統計学的指標である。原則、単位は無く、−1 から 1 の間の実数値をとり、1 に近いときは2 つの確率変数には正の相関があるといい、−1 に近ければ負の相関があるという。0 に近いときはもとの確率変数の相関は弱い。因みに 1 もしくは −1 となる場合は 2 つの確率変数は線形従属の関係にある。

相関係数 - Wikipedia

 定義

変数xとyがあるとき、{ \displaystyle \overline{x},\overline{y}}をそれぞれx,yの相加平均とすると、

 { \displaystyle 相関係数=\frac{xとyの積和}{\sqrt{xの偏差平方和}×\sqrt{yの偏差平方和}} =\frac {\sum_{i=1}^{n} (x_{i}-\overline{x})(y_{i}-\overline{y})} {\sqrt {\sum_{i=1}^{n} (x_{i}-\overline{x})^2} \sqrt {\sum_{i=1}^{n} (y_{i}-\overline{y})^2} } }

生まれ年とWTRで

計算します。

  x=(生年) y=(WTR) 氏名  { x-\overline{x}}  { y-\overline{y}}  {(x-\overline{x})^2}  {(y-\overline{y})^2}  { (x-\overline{x})(y-\overline{y})}
  1989 1.28 三上枝織 3.65 -3.28 13.30 10.74 -11.95
  1993 0.86 三澤紗千香 7.65 -3.70 58.47 13.66 -28.27
 
 
 
  1980 4 高橋美佳子 -5.35 -0.56 28.66 0.31 2.98
合計 196550 451.1   0.00 0.00 2906.63 3512.04 -147.87
平均 1985.35 4.56            

小数点第3位四捨五入、中略。

 表より、 { \displaystyle 相関係数=\frac{-147.87}{\sqrt{2906.63}×\sqrt{3512.04}}}=-0.0462812908

ほぼ0・・・!

 

そんな感じしますね。

(つづく)