外れ値

外れ値とは、得られたデータのうち、全体的な傾向から他と比べて極端に逸脱した値のこと。

外れ値のうち、測定ミスや記録ミス、条件の異なる値の混入など「極端な原因、理由」がわかっているものを「異常値」と呼ぶが、外れ値と異常値の違いは定義によって左右される。また、外れ値と「外れ値ではない値」との違いも明確ではないことがある。

データの中に外れ値があった場合、目的に応じて除外したり対数変換などの処理を行う。