どちらの値を使ったほうがいいのか、特に平均値と中央値に関しては、決めるのが非常に難しい時があります。もちろん、両方を常に使うことは可能です… 一つの基準を平均値の計算に用い、別な基準を中央値に用いるといった具合です。こうすれば、どちらの測定法が特定のケースでは最も有用なのかが見えてきます。しかしながら、この統計用語を理解することで、正しい選択をずっと早くできるようになります。
平均値(あるいは平均)と中央値は、一定の数における中心的な傾向を理解する上で、似たような役割を果たします。平均値は伝統的に、中間点を測定する方法として人気がありますが、他の値より極端に高いか低い単一の値に左右されるという欠点があります。だからこそ、少数の異常値が平均を大きく歪めてしまうような場合には、中央値が中間点を測定するより良い方法となるのです。
平均値、中央値
定義 | 平均値は、一定の数の算術的な平均です。 | 中央値は、高いほうの値を低いほうの値から分離する数値です。 |
どんな時に適用されますか? | 平均値は、異常値の数が少ない通常の数値配分のときに用いられます。 | 中央値は一般的に、歪んだ数値配分を中心的な傾向に戻すときに用いられます。 |
計算方法は? | 平均値は、すべての数値の合計を、数値の数で割ることによって求められます。 | 中央値はすべての数値を昇順に並べてから、その配分の中央にくる数値を特定する方法で求められます。 |
例:普通の配分 | 2、3、3、5、8、10、11 (2+3+3+5+8+10+11)÷7= 6 平均値 = 6 | 2、3、3、5、8、10、11
中央値 = 5 |
例:歪んだ配分 | 2、2、3、3、5、7、8、130 (2+2+3+3+5+7+8+130)÷8= 20 平均値 = 20 | 2、2、3、3、5、7、8、130 (3+5)÷2=4 中央値 = 4 |
結論
比較しているデータがほとんど均一である場合には、安心して平均値(AVG) を用いることができます。しかしながら、データに幾つかの異常値がある場合には、中央値(MEDIAN)を用いるか、計算を歪めてしまう数値を取り除くことを検討する必要があります。
例
いくつかの実用的な例:
- 解決時間の全体を報告するために、デフォルトで全体の解決時間(時間)[Mdn]の基準を用います。しばらく調査中になっているチケットが何枚もあることが分かっており、これらのチケットに報告内容を歪められたくないので、私は中央値の基準を選びました。
- エージェントから寄せられる平均的な返答数をチェックしたいときは、返答数[Avg]の基準を使います。返答数がほぼ一定であることを知っているからです。
- 新しいリクエストに対するサポートチームの返答がどれぐらい早いかを知る必要がある場合には、デフォルトで最初の返答時間(時間)[Mdn]を基準に使いますが、最初の返答時間は通常では一定してますので、初回の返答時間を平均で図る測定基準を作成します。加えて、エージェントによって作成された主体的なチケットがある場合、そのほとんどは最初の返答時間が例外的に長い値となっていますので、報告からは除外します。
これは中央値の測定基準を平均値に変換する方法をインサイトで示すデモになります:
中央値の測定基準を平均値に変換するには
-
既存の レポートにアクセスするか、新しいレポートを作成します。
-
Gooddataの「内容」セクションに平均値の測定基準を見つけます。
-
測定基準をハイライトして、「詳細を表示」をクリックします。
-
元の測定基準が変更されないよう、開いたウィンドウの「複製」をクリックします。
-
新しい測定基準に、「[MDN]から[AVG]へ変更」のような、何か.適切な名前を付けます。
-
「編集」をクリックすると、測定基準エディタが表示されます。
-
MEDIANをハイライトして「AVG」と入力します。
-
「保存」をクリックします。
-
新しい測定基準をレポートに使用します。