統計学では「対象データの特徴や傾向」を示す数値は「代表値」と呼ばれます(*1)。代表値には「平均値」「中央値」「最頻値」があります(*1)。
平均値はよく知られているので、説明不要でしょう。中央値とは、対象データの値を大きい(もしくは小さい)順に並べた際、「真ん中」に位置する数値のことです(*2)。つまり「10、10、10、8、5、4、3、2、2」(大きい順)の場合、「5」が中央値となります。
もし真ん中に位置した数値が「2つ」ある、例えば「10、10、10、8、6、5、4、3、2、2」(大きい順)の場合、「6」「5」の平均値が中央値となります(*2)。つまり「10、10、10、8、6、5、4、3、2、2」の中央値は、5.5となります。
最頻値とは、対象データの中で最も現れた数値のことです(*3)。先述の「10、10、10、8、6、5、4、3、2、2」のデータでは、「10」(現れた回数3回)が最頻値となります。
同じデータ(「10、10、10、8、6、5、4、3、2、2」)でも代表値によって、選出される「数値」が異なってきます(平均値なら6、中央値なら5.5、最頻値なら10)。
<引用・参考文献>
*1 『ゼロからはじめる! 統計学見るだけノート』(永野裕之監修、2018年、宝島社), p46-47
*2 『ゼロからはじめる! 統計学見るだけノート』, p52-55
*3 『ゼロからはじめる! 統計学見るだけノート』, p56-57
コメント