スピアマンの順位相関係数 - その1

相関係数 その1その2では、単相関係数(ピアソンの積率相関係数)について考えました。結果微妙だったので、(悔しいので、)2変数の順位に相関があるのかを考えることにしました。

順位に基づいて求められる相関係数は、スピアマンの順位相関係数と呼ばれます。

スピアマンの順位相関係数とは

スピアマンの順位相関係数(じゅんいそうかんけいすう)は統計学において順位データから求められる相関の指標である。チャールズ・スピアマン(Charles Spearman)によって提唱され、ふつうρ と書かれる。

ピアソンの積率相関係数(普通に相関係数と呼ばれるもの)と違い、ノンパラメトリックな指標である。すなわち2つの変数の分布について何も仮定せずに、変数の間の関係が任意の単調関数によってどの程度忠実に表現できるかを、評価するものである。「変数間の関係は線形である」と仮定する必要も、また変数を数値的にとる必要もなく、順位が明らかであればよい。

スピアマンの順位相関係数 - Wikipedia

定義

順位同士のデータで普通にピアソンの積率相関係数を計算してもイケるらしい。

ですが、公式があるようです。

 { \displaystyle スピアマンの順位相関係数:ρ=1-\frac {6\sum{{対応する2つ値の順位の差}^2}}{ {対応する値のペアの数}^3 -対応する値のペアの数 } }

分かりづらいので、とりあえず先に進みましょう。

用いるデータ

更新しましたので6月14日のデータを使います。

もう一つは例によって散布図の時に作った生年等一覧表なのですが、順位データを使う場合、年で比較すると同順位のものが多すぎて計算が面倒で正確性も落ちるのでデビュー年での計算はパスします。生年月日で順位付けしたデータを使います。

生年月日とWTR

表はこうなります。

生年月日 生年月日の順位 WTR WTRの順位 氏名
1989-01-06 27 1.18倍 72 三上枝織
1993-01-13 11 0.78倍 81 三澤紗千香
1986-02-28 54 1.57倍 64 三瓶由布子
1991-12-19 14 1.18倍 72 上坂すみれ
1982-04-22 71 9.38倍 8 下屋則子
1986-01-30 56 1.27倍 71 下田麻美
1981-02-23 79 3.66倍 35 中原麻衣
1980-05-15 82 4倍 31 中尾衣里
1986-12-13 46 4.78倍 27 五十嵐裕美
1985-01-20 62 0.95倍 76 井上麻里奈
1988-07-11 32 0.82倍 79 井口裕香
1986-11-26 48 0.63倍 87 伊藤かな恵
1994-01-29 6 10.83倍 7 佐倉綾音
1981-05-02 76 2.55倍 50 佐藤利奈
1986-05-08 53 2.18倍 55 佐藤聡美
1987-10-30 37 6.14倍 17 内山夕実
1986-07-23 52 1.02倍 74 内田彩
1989-12-27 20 3.15倍 40 内田真礼
1983-11-26 67 1.56倍 66 加藤英美里
1988-09-09 29 8.23倍 12 加隈亜衣
1984-07-12 64 2.34倍 53 南條愛乃
1987-11-18 36 2.05倍 58 原田ひとみ
1985-04-24 61 5.33倍 23 名塚佳織
1987-08-16 40 0.52倍 89 喜多村英梨
1980-03-31 83 0.24倍 97 坂本真綾
1976-09-20 92 0.37倍 93 堀江由衣
1989-09-27 23 1.45倍 69 大久保瑠美
1975-12-06 95 6.11倍 18 大原さやか
1993-06-11 9 1.75倍 61 大坪由佳
1994-09-13 4 3.05倍 42 大橋彩香
1984-04-28 66 2.56倍 49 大橋歩夕
1990-12-22 17 50.18倍 1 安済知佳
1991-09-17 15 0.51倍 90 寿美菜子
1995-08-15 3 0.33倍 95 小倉唯
1988-11-11 28 0.85倍 78 小松未可子
1982-02-05 72 0.73倍 84 小林ゆう
1986-02-15 55 5.95倍 19 小清水亜美
1988-08-09 30 5.38倍 22 山本希望
1987-09-17 38 5.71倍 20 巽悠衣子
1977-08-05 91 2.68倍 47 広橋涼
1975-08-28 96 5.51倍 21 後藤邑子
1989-12-26 21 1.48倍 67 徳井青空
1992-03-27 12 0.82倍 79 悠木碧
1990-02-04 19 0.78倍 81 戸松遥
1974-12-27 97 7.65倍 13 折笠富美子
1986-11-13 49 19.5倍 2 斉藤佑圭
1981-03-12 78 2.27倍 54 斎藤千和
1986-12-10 47 3.04倍 43 新田恵海
1981-03-31 77 0.74倍 83 新谷良子
1985-07-16 58 1倍 75 日笠陽子
1994-06-15 5 1.71倍 62 日高里菜
1991-05-29 16 1.47倍 68 早見沙織
1997-11-14 1 4.58倍 28 木戸衣吹
1986-10-03 51 9.11倍 10 本多真梨子
1972-08-14 99 17.94倍 3 本田貴子
1990-06-01 18 6.73倍 15 村川梨衣
1992-03-11 13 1.57倍 64 東山奈央
1977-09-14 90 3.83倍 32 松来未祐
1975-12-12 94 2.98倍 46 桑島法子
1978-08-08 89 9.38倍 8 桑谷夏子
1980-01-21 86 0.11倍 99 水樹奈々
1974-08-28 98 2.12倍 57 水橋かおり
1985-06-02 59 1.37倍 70 沢城みゆき
1988-04-15 34 1.76倍 60 沼倉愛美
1989-06-08 25 0.94倍 77 津田美波
1986-12-25 45 6.48倍 16 洲崎綾
1987-02-15 43 2.63倍 48 浅倉杏美
1993-04-02 10 3.75倍 33 瀬戸麻沙美
1976-02-27 93 0.19倍 98 田村ゆかり
1987-06-19 42 5.19倍 24 田村睦心
1997-05-23 2 8.89倍 11 田辺留依
1980-01-14 87 12.13倍 6 甲斐田裕子
1982-09-07 69 2.47倍 51 白石涼子
1981-08-21 74 4.02倍 30 相沢舞
1993-08-06 8 0.67倍 86 石原夏織
1982-01-10 73 3.52倍 36 福圓美里
1988-07-12 31 3倍 45 種田梨沙
1989-06-23 24 0.58倍 88 竹達彩奈
1980-02-06 85 3.06倍 41 能登麻美子
1989-02-25 26 0.43倍 92 花澤香菜
1980-11-18 80 0.28倍 96 茅原実里
1987-09-13 39 2.13倍 56 茅野愛衣
1985-05-08 60 3.22倍 39 藤井ゆきよ
1982-09-03 70 6.94倍 14 藤村歩
1984-10-19 63 4.04倍 29 藤田咲
1988-02-10 35 2.46倍 52 西明日香
1986-10-28 50 0.36倍 94 豊崎愛生
1987-08-10 41 3.5倍 37 赤崎千夏
1984-06-18 65 12.14倍 5 辻あゆみ
1988-06-28 33 5.1倍 25 近藤唯
1980-02-17 84 3.72倍 34 遠藤綾
1981-06-08 75 1.89倍 59 野中藍
1989-12-25 22 14倍 4 野村香菜子
1979-05-30 88 1.61倍 63 釘宮理恵
1983-08-12 68 0.73倍 84 阿澄佳奈
1993-08-28 7 4.79倍 26 雨宮天
1985-10-25 57 0.5倍 91 高垣彩陽
1987-02-14 44 3.01倍 44 高森奈津美
1980-05-29 81 3.39倍 38 高橋美佳子

 { \displaystyle スピアマンの順位相関係数:ρ=1-\frac {6\sum{{対応する2つ値の順位の差}^2}}{ {対応する値のペアの数}^3 -対応する値のペアの数 } }

値のペアの数、つまりデータの数は99です。

対応する2つ値の順位の差とは表の上から見ていくと27-72や11−81のこと。つまり、

氏名 順位の差 順位の差の2乗
三上枝織 -45 2025
三澤紗千香 -70 4900
三瓶由布子 -10 100
上坂すみれ -58 3364
下屋則子 63 3969
下田麻美 -15 225
中原麻衣 44 1936
中尾衣里 51 2601
五十嵐裕美 19 361
井上麻里奈 -14 196
井口裕香 -47 2209
伊藤かな恵 -39 1521
佐倉綾音 -1 1
佐藤利奈 26 676
佐藤聡美 -2 4
内山夕実 20 400
内田彩 -22 484
内田真礼 -20 400
加藤英美里 1 1
加隈亜衣 17 289
南條愛乃 11 121
原田ひとみ -22 484
名塚佳織 38 1444
喜多村英梨 -49 2401
坂本真綾 -14 196
堀江由衣 -1 1
大久保瑠美 -46 2116
大原さやか 77 5929
大坪由佳 -52 2704
大橋彩香 -38 1444
大橋歩夕 17 289
安済知佳 16 256
寿美菜子 -75 5625
小倉唯 -92 8464
小松未可子 -50 2500
小林ゆう -12 144
小清水亜美 36 1296
山本希望 8 64
巽悠衣子 18 324
広橋涼 44 1936
後藤邑子 75 5625
徳井青空 -46 2116
悠木碧 -67 4489
戸松遥 -62 3844
折笠富美子 84 7056
斉藤佑圭 47 2209
斎藤千和 24 576
新田恵海 4 16
新谷良子 -6 36
日笠陽子 -17 289
日高里菜 -57 3249
早見沙織 -52 2704
木戸衣吹 -27 729
本多真梨子 41 1681
本田貴子 96 9216
村川梨衣 3 9
東山奈央 -51 2601
松来未祐 58 3364
桑島法子 48 2304
桑谷夏子 81 6561
水樹奈々 -13 169
水橋かおり 41 1681
沢城みゆき -11 121
沼倉愛美 -26 676
津田美波 -52 2704
洲崎綾 29 841
浅倉杏美 -5 25
瀬戸麻沙美 -23 529
田村ゆかり -5 25
田村睦心 18 324
田辺留依 -9 81
甲斐田裕子 81 6561
白石涼子 18 324
相沢舞 44 1936
石原夏織 -78 6084
福圓美里 37 1369
種田梨沙 -14 196
竹達彩奈 -64 4096
能登麻美子 44 1936
花澤香菜 -66 4356
茅原実里 -16 256
茅野愛衣 -17 289
藤井ゆきよ 21 441
藤村歩 56 3136
藤田咲 34 1156
西明日香 -17 289
豊崎愛生 -44 1936
赤崎千夏 4 16
辻あゆみ 60 3600
近藤唯 8 64
遠藤綾 50 2500
野中藍 16 256
野村香菜子 18 324
釘宮理恵 25 625
阿澄佳奈 -16 256
雨宮天 -19 361
高垣彩陽 -34 1156
高森奈津美 0 0
高橋美佳子 43 1849
合計   174618

こうなるので、

 { \displaystyle スピアマンの順位相関係数:ρ=1-\frac {6\sum{{対応する2つ値の順位の差}^2}}{ {対応する値のペアの数}^3 -対応する値のペアの数 }=1-\frac {6×174618}{{99}^3-99}=-0.0798886827 }

またしても

そうなるんですか。

(つづく)