度数分布表・ヒストグラムを書いてみる - その1

使用するデータは2014年5月31日のデータです。

何のため?

適当に選んだデータがどんな形をしているのかを眺めるためです

WikipediaPVで

とりあえず階級の個数と幅は計算で出してみます。
スタージェスの公式より
 { \displaystyle 1+\frac{\log_{10} 98}{\log_{10} 2}} =1+6.6147…≒8


階級の幅は
 { \displaystyle \frac{(データの最大値)-(データの最小値)}{スタージェスの公式から求められた階級の個数}}=\frac{(3376-21)}{8}=419.375

うーん、500でいいか。

そうなると階級の個数は7になって、
度数分布表は

  階級      
以上   未満 度数 相対度数
3000   1 0.01
2500 3000 3 0.03
2000 2500 4 0.04
1500 2000 4 0.04
1000 1500 18 0.18
500 1000 40 0.41
0 500 28 0.29
  合計   98 1.00

はいできた。

ヒストグラムはこうですね。

f:id:lisiograph:20140602232625p:plain

 1000以下が7割ですか。

これが妥当かどうかというのはこれから考えることにします。

 

(つづく)