度数分布表・ヒストグラムを書いてみる - その3

その1

その2

のつづき。

 

WTRで

 繰り返しになりますが

スタージェスの公式より
 { \displaystyle 1+\frac{\log_{10} 98}{\log_{10} 2}} =1+6.6147…≒8


階級の幅は
 { \displaystyle \frac{(データの最大値)-(データの最小値)}{スタージェスの公式から求められた階級の個数}}=\frac{(75.91-0.11)}{8}=9.475

だからって10で作ると。

 

  階級      
以上   未満 度数 相対度数
60   1 0.01
50 60 0 0.00
40 50 1 0.01
30 40 0 0.00
20 30 0 0.00
10 20 8 0.08
0 10 88 0.90
  合計   98 1.00

役立たず。

2刻みにする。

 

  階級      
以上   未満 度数 相対度数
12   4 0.04
10 12 6 0.06
8 10 6 0.06
6 8 5 0.05
4 6 15 0.15
2 4 24 0.24
0 2 38 0.39
  合計   98 1.00

まあまあ見れる。

f:id:lisiograph:20140605225556p:plain

こんなもんですね。

 

WNRで

繰り返し

スタージェスの公式より
 { \displaystyle 1+\frac{\log_{10} 98}{\log_{10} 2}} =1+6.6147…≒8


階級の幅は
 { \displaystyle \frac{(データの最大値)-(データの最小値)}{スタージェスの公式から求められた階級の個数}}=\frac{(20.88-0.15 )}{8}=2.59125

3はおろか2で作っても意味が無いのは言わずもがな。

  階級      
以上   未満 度数 相対度数
12   2 0.02
10 12 0 0.00
8 10 0 0.00
6 8 3 0.03
4 6 1 0.01
2 4 9 0.09
0 2 83 0.85
  合計   98 1.00

0.5刻みにする。

  階級      
以上   未満 度数 相対度数
3   12 0.12
2.5 3 2 0.02
2 2.5 1 0.01
1.5 2 8 0.08
1 1.5 10 0.10
0.5 1 30 0.31
0 0.5 35 0.36
  合計   98 1.00

f:id:lisiograph:20140605233245p:plain

うん。

 

NT%で

繰り返し

スタージェスの公式より
 { \displaystyle 1+\frac{\log_{10} 98}{\log_{10} 2}} =1+6.6147…≒8


階級の幅は
 { \displaystyle \frac{(データの最大値)-(データの最小値)}{スタージェスの公式から求められた階級の個数}}=\frac{(282.01-1.69 )}{8}=35.04

35か・・・

  階級      
以上   未満 度数 相対度数
210%   2 0.02
175% 210% 1 0.01
140% 175% 0 0.00
105% 140% 4 0.04
70% 105% 17 0.17
35% 70% 22 0.22
0% 35% 52 0.53
  合計   98 1.00

 意外とダメじゃないけど、もう少し小さいほうがいいかも。

20で。

  階級      
以上   未満 度数 相対度数
120%   6 0.06
100% 120% 5 0.05
80% 100% 7 0.07
60% 80% 16 0.16
40% 60% 8 0.08
20% 40% 23 0.23
0% 20% 33 0.34
  合計   98 1.00

f:id:lisiograph:20140605234318p:plain

おk

 

まとめ?

WikipediaPV以外は一番下の階級が最頻となってるのでまあまあ満足です。

階級の幅を計算で出すと使えないものになるってことは標本の構成がいびつになってるということでしょうか。飛び抜けている値をとるものがあるからこそ面白いとも言えそうなので難しいです。

あと、記述の問題として、Rを使えるようになるべきだと思いました。時間かかりそうだなあ。課題多いなあ。