中学1年生で学ぶ「資料の整理」は、たくさんのバラバラな数字の集まり(資料)の中から、その集団の「特徴」や「傾向」を読み解くための強力なツールです。
クラスのテストの点数や身長の記録など、身近なデータを分析する方法を学んでいきましょう。
ここでは、その基本となる「度数分布表」「ヒストグラム」「相対度数」の3つのキーワードについて解説します。
たくさんのデータが並んでいるだけでは、全体の特徴はよく分かりません。
そこで、データをいくつかの区間に分けて整理した表が度数分布表(どすうぶんぷひょう)です。
21m, 15m, 28m, 17m, 23m, ... (←これだけだと分かりにくい!)
これを度数分布表にすると…
| 階級 (m) | 階級値 (m) | 度数 (人) |
|---|---|---|
| 10以上 ~ 14未満 | 12 | 3 |
| 14 ~ 18 | 16 | 8 |
| 18 ~ 22 | 20 | 11 |
| 22 ~ 26 | 24 | 6 |
| 26 ~ 30 | 28 | 2 |
| 合計 | 30 |
階級(かいきゅう): データを分ける区間のこと。
(例:「10m以上14m未満」)
階級の幅(かいきゅうのはば): 階級の区間の大きさ。
(例:14 - 10 = 4m)
度数(どすう): それぞれの階級に入っているデータの個数(この場合は人数)。
階級値(かいきゅうち): 各階級の真ん中の値。
(階級の端の数 + 端の数)÷ 2 で求める。
(例:(10+14)÷2=12m)。
資料の平均値を求めるときなどに使います。
この表を見るだけで、「18m以上22m未満の人が11人で一番多いんだな」というように、データの散らばり具合が一目で分かるようになります。
度数分布表を、さらに視覚的に分かりやすくしたものがヒストグラム(柱状グラフ)です。
横軸に階級、縦軸に度数をとって、柱(長方形)を並べたグラフです。
棒グラフと似ていますが、横軸が連続した量なので、柱どうしがくっついています。
データの分布の様子(どのあたりに集中しているか、など)が直感的に理解できます。
(グラフのイメージ)
横軸には「10, 14, 18, 22, 26, 30」といった目盛りが並ぶ。
縦軸には人数の目盛りが並ぶ。
「10~14」の区間には高さ「3」の柱が、「14~18」の区間には高さ「8」の柱が…というように、柱がすき間なく並びます。
一番高い山が「18~22」の区間にできるため、このあたりに記録が集中していることが一目で分かります。
全体の人数が違う2つのグループ(例えば、30人の1組と35人の2組)の記録を比べたいとき、単純な度数(人数)で比べると正しく比較できません。
そこで使うのが相対度数(そうたいどすう)です。
各階級の度数が、全体の度数(合計)に対してどれくらいの割合を占めているかを示す値です。
0以上1以下の小数で表されます。
(その階級の相対度数) = (その階級の度数) ÷ (度数の合計)
| 階級 (m) | 度数 (人) | 相対度数 |
|---|---|---|
| 10以上 ~ 14未満 | 3 | 0.10 |
| 14 ~ 18 | 8 | 0.27 (約) |
| 18 ~ 22 | 11 | 0.37 (約) |
| 22 ~ 26 | 6 | 0.20 |
| 26 ~ 30 | 2 | 0.07 (約) |
| 合計 | 30 | 1.00 |
相対度数をすべて合計すると、必ず1になります(または、四捨ご入の影響で0.99や1.01など、1に非常に近い値になります)。
これを使えば、人数の違うクラスどうしでも、「A組で一番人数の多い階級の割合は0.3で、B組は0.4だから、B組の方がその階級に生徒が集中しているな」というように、公平に比較できます。
「資料の整理」は、この3ステップの流れで進みます。
度数分布表で、バラバラなデータを分かりやすく整理する。
ヒストグラムで、データの分布を視覚的にとらえる。
相対度数で、全体に対する割合を計算し、他の集団と比較する。
これらは、ニュースや新聞などで使われる「統計」を正しく読み解くための第一歩となる、非常に大切な考え方です。