データ分析や統計学において、中央値と平均値はどちらも重要な指標として用いられます。

しかし、一見同じように見えるこれらの指標には、実は異なる意味と役割があります。

今回の記事では、中央値と平均値の違いについてわかりやすく解説します。

  • それぞれの使い分け方
  • 知っておくと役立つポイント

についてもご紹介します。

中央値とは

中央値とは、データを小さい順に並べたときに真ん中に位置する値のことです。

データの個数が偶数の場合、真ん中の2つの値の平均値をとります。

例えば、{1, 3, 4, 5, 7, 9}というデータの列の場合、中央値は4となります。

平均値とは

平均値とは、データのすべての値を足して、データの個数で割った値のことです。

つまり、データの全体的な傾向を表す指標と言えます。

例えば、{1, 3, 4, 5, 7, 9}というデータの列の場合、平均値は5となります。

中央値と平均値の違い

中央値と平均値の違いは、以下の3点にあります。

データの分布に左右されない

中央値は、データの分布に左右されません。

つまり、極端な値(外れ値)があっても、中央値に大きな影響を与えることはありません。

一方、平均値は、極端な値の影響を受けやすいという特徴があります。

計算方法が簡単

中央値は、データを小さい順に並べるだけで計算できます。

一方、平均値は、すべての値を足して、データの個数で割るという計算が必要になります。

順序尺度データに適用できる

中央値は、間隔尺度データだけはありません。

順序尺度データにも適用できます。

一方、平均値は、間隔尺度データにしか適用できません。

中央値と平均値の使い分け

中央値と平均値は、それぞれ異なる特徴を持っています。

そのため、状況に応じて使い分けることが重要です。

極端な値がある場合

極端な値がある場合は、中央値の方が平均値よりもデータの傾向を正確に反映することができます。

データの分布が偏っている場合

データの分布が偏っている場合は、中央値の方が平均値よりもデータの中心的な値を把握することができます。

順序尺度データの場合

順序尺度データの場合は、中央値しか計算できません。

今回ご紹介した内容を参考に、中央値と平均値を正しく理解し、データ分析や統計学に役立ててください。