名寄せ

名寄せとは、複数に分散したデータベースの中から、氏名やメールアドレス、住所や電話番号などの情報をもとにして、同一人物や同一企業を一つにまとめる作業のこと。もともとは金融機関が複数口座を保有する顧客を一元管理して、預金総額などを算出するために行われていたものだが、金融機関以外でもデータベースを統合して行われる顧客の一元管理のことも名寄せと呼ぶようになった。

名寄せは、以下のような手順で行われることが多い。

  • データの調査:データの各属性の入力状況の確認
  • データの抽出:データベースからデータを抽出し、項目のフォーマットを統一
  • データのクレンジング:値の表記やフォーマットを統一し、修正や削除
  • ID付与とマッチング:同一と識別されたデータに一意のIDを付与、特定可能な状態にする