アソシエーション分析

アソシエーション分析(association analysis)とは、膨大なデータの中から統計的なパターンや意味のある関連性を抽出するデータマイニング手法のこと。

支持度、期待信頼度、信頼度、リフト値といった評価指標を用いて、抽出したルール(アソシエーションルール)を評価する。

  • 支持度(support):すべてのデータの中で「A⇒B」といったルールが出現する割合
  • 期待信頼度(expected confidence):すべてのデータの中で結論(B)が出現する割合
  • 信頼度(confidence):条件(A)が出現するデータの中で、条件(A)と結論(B)が同時に出現する割合
  • リフト値(lift):信頼度(A⇒B)が、期待信頼度(B)のどれぐらいあるかという比率

アソシエーション分析の中でも、小売業のPOSデータやECのトランザクションデータを扱うものを特に「バスケット分析」と呼ぶ(同義として扱われることもある)。