データの「代表値」とは

複数のデータがあるとき、そのデータ全体の傾向や特徴を1つの数値で表すことができます。この数値を「代表値」といいます。代表値で最もよく知られているのが「平均値」。

たとえば、下図のようなテスト結果のデータがあったとき、パッと見ただけではただのデータの羅列でしかありません。そこで、平均値を求めてみると、前回の平均値と比較するなどして、「テスト結果全体の水準」を把握することができますし、特定の点数が「テスト結果全体のどの位置にあたるか」といったことも確認できます。平均値を算出すれば、データ全体の傾向などが把握できるというわけです。
代表値を使用すれば、データ全体の傾向や特徴を把握できる

代表値を使用すれば、データ全体の傾向や特徴を把握できる



代表値には様々な値がありますが、ここでは、「平均値」「中央値」「最頻値」の3つについて、Excelを使用した算出方法やそれぞれの使い方などを解説していきます。

今回紹介する関数

平均値を算出するには「AVERAGE関数」

平均値は、ご存知の通り、「すべてのデータの合計値」を「データの個数」で割った値ですね。Excelでは、AVERAGE関数を使用して算出できます。
AVERAGE関数の入力

AVERAGE関数の入力




平均値を使用するときに注意すべきポイント

平均値を算出する際、データの中に「極端に大きい数値」や「極端に小さい数値」があるときは注意が必要です。こういった極端なデータを「外れ値」といい、平均値はこの外れ値の影響を受けやすい、という欠点があります。

たとえば、下図のテスト結果の場合、平均値は「627.5」となります。しかし、よく見てみると、主なデータは「530~655」の範囲にあり、「875」や「940」が極端に大きくて影響を及ぼしているようです。この外れ値を除いて平均値を算出してみると「571.5」となり、合点がいきますね。これらの平均値を比較してみると、先に算出した平均値「627.5」が「外れ値側」に寄ってしまっていたことがわかります。

このように、平均値を使用してデータ全体の傾向を把握するときは、ただ算出するだけでなく、外れ値の影響についても考慮する必要があるのです。
平均値は外れ値の影響を受ける※ExcelのTRIMMEAN関数を使用すると、外れ値の影響を除いた平均値を算出できます。

平均値は外れ値の影響を受ける
※ExcelのTRIMMEAN関数を使用すると、外れ値の影響を除いた平均値を算出できます。



続いて、中央値と最頻値について解説します!次ページへどうぞ!