データに関するキーワード(34件)

アソシエーション分析

アソシエーション分析(association analysis)とは、膨大なデータの中から統計的なパターンや意味のある関連性を抽出するデータマイニング手法のこと。 支持度、期待信頼度、信頼度、リフト値といった評価指標を用いて、抽出したルール(アソシエーションルール)を評価する。 [……]

バスケット分析

バスケット分析(basket analysis)とは、小売業のPOSデータやECのトランザクションデータを分析し、一度の購入で一緒に買われている商品の組み合わせを明らかにする手法のこと。買い物かご(バスケット)を一つの単位とすることに由来する。「マーケットバスケット分析」ともいう [……]

ゼロパーティデータ

ゼロパーティデータ(Zero-Party Data)とは、ユーザーが何らかの対価を得るために企業(広告主)に対して意図的に提供するデータのこと。企業からのオファーを受けるのと引き換えにそのユーザー固有のデータ利用をオプトインで承諾するというものである。趣味嗜好や購入意向といったユ [……]

サルベージ

サルベージ(salvage)とは、もともとは沈没した船舶の引き揚げや回収作業のことを表す英語だが、ビジネスやITの領域においては破損したハードディスクなどのデータストレージからデータを取り出す作業やサービスのことを指す。区別するために「データサルベージ」とも呼ばれる。 破損や不具 [……]

エンドツーエンド暗号化

エンドツーエンド暗号化(end-to-end encryption, E2EE)とは、通信ネットワークにおいて通信を行う送信者と受信者のみが暗号化されたデータを復号、閲覧できる仕組みの、秘匿性の高い暗号化技術のこと。「E2E暗号化」「端末間暗号化」。 転送途中のデータは常に暗号化 [……]

ウォーターフォールチャート(滝グラフ)

ウォーターフォールチャートとは、最初の値が数値の増減によってどのように変化したのかという増減の累積や内訳を可視化したグラフ表現のこと。「滝グラフ」「ウォーターフォール図」とも呼ばれる。 会社の決算などで、前期から今期へのキャッシュフローの変化を表す際などでよく用いられる。コンサル [……]

移動平均

移動平均とは、主に時系列データを一定区間ごとの平均値を連続的に求めて平滑化すること。株価をはじめとした時系列データは変化が激しく、傾向を滑らかにして把握しやすくするために用いられる。いくつかの種類があるが、明記がなければ単純移動平均のことを指す。 一定区間をどれぐらいにするかは場 [……]

テレメトリーデータ

テレメトリーデータとは、ソフトウェアやアプリケーションがパフォーマンス改善や品質向上を目的として収集するユーザーの利用状況データのこと。プロセスは自動化されて、メーカーやベンダーのコントロールセンターなど特定の地点にデータを送信、収集する。 このように遠隔地にいる利用者の測定デー [……]

トリム平均

トリム平均とは、上位と下位のデータを一定の割合で取り除いて計算した平均値のこと。データの中に外れ値や異常値がある場合、平均値がそれらに影響を受けないように除外できる。「刈込み平均」「調整平均」ともいう。 最小値側と最大値側からそれぞれ5%のデータを除去する場合、「5%トリム平均」 [……]

データレイク

データレイクとは、あらゆるデータを本来のフォーマットのまま蓄積、保管する一元化された貯蔵環境のこと。データ属性が構造的に管理された構造化データ、ログファイルや画像、動画といった非構造化データを、発生したままの生データで格納できる。直訳すると「データの湖」。 データウェアハウス(D [……]

データマート

データマートとは、企業のシステムに蓄積保管されたデータから特定の目的や用途のために抽出され、再構築されたデータベースのこと。直訳すると「データの小売店」。 特定の目的で抽出して小さなサイズで構築されるため、集計やデータ分析時に扱いやすいという利点がある。 データマートはデータウェ [……]

データウェアハウス (DWH)

データウェアハウスとは、企業の業務上で発生した情報を構造化データで時系列に整理して保管した統合データベース、もしくはその管理システムやソフトウェアのこと。直訳すると「データの倉庫」。複数の基幹システムから抽出されて再構成されることが多い。 データウェアハウスから抽出されてデータ分 [……]

異常値

異常値とは、得られたデータの中で他と比べて極端に逸脱した値を意味する「外れ値」のうち、測定ミスや記録ミス、条件の異なる値の混入など「極端な原因、理由」がわかっている値のこと。 外れ値と異常値の違いは定義によって左右されるため、どのような理由で外れた値になっているのかを確認する必要 [……]

外れ値

外れ値とは、得られたデータのうち、全体的な傾向から他と比べて極端に逸脱した値のこと。 外れ値のうち、測定ミスや記録ミス、条件の異なる値の混入など「極端な原因、理由」がわかっているものを「異常値」と呼ぶが、外れ値と異常値の違いは定義によって左右される。また、外れ値と「外れ値ではない [……]

正規化

正規化とは、データを一定の規則に従って整形、変換、再編して、利用しやすい状態にすること。データの重複をなくして管理を容易かつ効率的にし、より多様な目的で扱いやすくするためのデータベースの構築技法の一つである。 様々な分野で用いられる概念であり、整形や変換などの処理方法は異なる。

ビジネスインテリジェンス(BI)

ビジネスインテリジェンスとは、データを組織的にかつ系統的に蓄積、分類、検索、分析、加工して、ビジネスや経営の予測、最適化、意志決定に用いるプロセスや概念、取り組みのこと。 これらを取り扱うツールやソフトウェア、アプリケーションのことを「BIツール(BIシステム)」と呼ぶが、これら [……]

インテリジェンス

インテリジェンスとは、知性や知能、あるいは情報といった意味のこと。ビジネス領域においては、同く「情報」として捉えられる「データ」「インフォメーション」との区別や対比として「インテリジェンス」は用いられる。 データとインフォメーションとインテリジェンスの違い 日本語では「情報」とし [……]

空・雨・傘

「空・雨・傘」は、問題解決のためのフレームワークの一つで、「空を見て、雨が降りそうだから、傘を持っていこう」という意志決定に至るプロセスを分解してロジカルに考える手法のこと。 「空」は「空が曇っている」という事実の認識のステップである。データを客観的に正しく収集し、事実を適切に認 [……]

トランザクション

トランザクション(transaction)とは、商取引や売買といった「商品を渡して代金を受け取る」という一連の処理の単位のこと。ITの分野では、コンピュータ内のデータベースで処理される分割できない一連の処理単位のことを指す。またこの一連の処理をトランザクション処理という。略称は「 [……]

錯誤相関

錯誤相関とは、もともと相関がないデータに相関があると思い込んでしまうこと。実際には関連しない事象に対して、関連性があるように錯覚すること。認知バイアスの一つ。 特定の属性の集団が特徴ある行動をとった場合、その事象の起こる頻度を過大評価してしまう、というものなどが挙げられる。こうい [……]

平文

平文とは、インターネットなどの通信における暗号化されていないデータや文字列のこと。読みは「ひらぶん」。クリアテキスト。 暗号化されたデータ「暗号文」との対比で、情報漏洩防止のための対策が取られていないデータのことを指す。「本来暗号化されるべきパスワードやクレジットカード番号が、平 [……]

アノテーション

アノテーションとは、もともとは注釈、記注の意味である。IT分野においては、データやプログラム記述に対して注釈となる情報やメモを付与すること、もしくはその付加情報のことを指す。 Javaのプログラムの中にメタデータとして注釈を加えたり、文書を出力する際に「社外秘」「日付」などを付与 [……]

アセット

アセットとは、資産、金銭的に価値のある財産のこと。金融においては、現金の他に預金や貸し付け、不動産や有価証券などが該当し、一般的な意味としてはこちらの用途で使用されることが多い。 ビジネスにおいては、経営資源といった金融面の意味の他に、システム機器やソフトウェアといった「物理的に [……]

デジタルタトゥー

デジタルタトゥーとは、いったんWeb上で公開された書き込みや画像、情報は、一度拡散されるとコピーされて残り続け、後からの消去が困難であることを表す表現のこと。タトゥー(入れ墨)のように完全に消すのは難しいという比喩。 TwitterやInstagramといったSNS、ブログ、電子 [……]

GDPR

GDPR(EU一般データ保護規則:General Data Protection Regulation)とは、2018年5月からEUで施行された新しい個人情報保護の法律のこと。 個人に自身の個人データをコントロールする権利を保障する一方で、個人データを保有して「処理」「移転」する [……]

平均への回帰

平均への回帰とは、最初の試験結果が全体の平均値よりも大きく悪い結果だった対象について、同じ内容での2回目の試験を実施するとその結果は全体の平均値に近づく良い結果になるという、統計学的な現象のこと。平均回帰、回帰効果。 A/Bテストでも発生し、まったく同じテストを2度繰り返すと1度 [……]

ディープラーニング

ディープラーニング(deep learning)、深層学習とは、機械学習の手法の一つであり、コンピュータ側が学習データから自動的に特徴を認識、抽出を行うもの。 データの特徴をより深いレベルで学習し、非常に高い精度で特徴を認識できる。そのため、人の声の認識や、カメラで撮影した画像の [……]

機械学習

機械学習とは、人間が自然に行っている学習能力と同様の機能を、コンピュータで実現しようとする技術のこと。「人工知能のプログラム自身が学習する」仕組み。 現在では、数値や文字、画像や音声といった多様なデータの中から、規則性やパターンを発見し、現状把握や未来予測をするのにその知識を役立 [……]

PII(個人を特定できる情報)

PIIとは Personally Identifiable Information の略で、個人情報、個人を特定できる情報のこと。プライバシー性の高い情報のこと。電話番号、メールアドレス、名前といった情報をはじめ、他の情報と組み合わせて身元や居住地を特定できる情報も含まれる。特に [……]

ETL

ETLとは、Extract(抽出)、Transform(変換)、Load(ロード)の略で、データ統合の中でも重要なプロセス、あるいはそのソフトウェアのこと。外部からデータを抽出し、データウェアハウスなどで利用しやすい形に変換、加工し、対象となるデータベースに書き出す一連のプロセス [……]