データに関するキーワード(72件)

サンプル(標本)

サンプル(sample)とは、統計においては母集団から抽出したデータの集合のこと。「標本」ともいう。母集団を調査するために抽出した一部の対象のことである。 また、母集団からサンプル(標本)を抽出することを「標本抽出」または「サンプリング」という。

サンプル数(標本数)

サンプル数(the number of samples)とは、統計においては母集団から抽出したデータの集合である「サンプル(標本)」の数のこと。母集団からサンプルの抽出を何回行ったかという数である。「標本数」ともいう。 サンプル(標本)におけるデータの個数の意味で「サンプル数」が [……]

サンプルサイズ(標本の大きさ)

サンプルサイズ(sample size)とは、統計においてデータの個数を表す。1回のサンプル(母集団から抽出したデータの集合、標本)においていくつの個体を調査したかという個体数のことである。データの集合である1サンプルの大きさのこと。通常、小文字の「n」で表す。「標本の大きさ」「 [……]

名寄せ

名寄せとは、複数に分散したデータベースの中から、氏名やメールアドレス、住所や電話番号などの情報をもとにして、同一人物や同一企業を一つにまとめる作業のこと。もともとは金融機関が複数口座を保有する顧客を一元管理して、預金総額などを算出するために行われていたものだが、金融機関以外でもデ [……]

Cookie(クッキー)

Cookie(クッキー)とは、ユーザーがWebサイトにアクセスしたときに、Webサーバーからブラウザー経由でユーザーの端末内に保存される小さなテキストデータ、もしくはファイルのこと。ブラウザー単位で保存される。正式には「HTTP Cookie」。 ユーザーの表示環境やログイン情報 [……]

アソシエーション分析

アソシエーション分析(association analysis)とは、膨大なデータの中から統計的なパターンや意味のある関連性を抽出するデータマイニング手法のこと。 支持度、期待信頼度、信頼度、リフト値といった評価指標を用いて、抽出したルール(アソシエーションルール)を評価する。 [……]

バスケット分析

バスケット分析(basket analysis)とは、小売業のPOSデータやECのトランザクションデータを分析し、一度の購入で一緒に買われている商品の組み合わせを明らかにする手法のこと。買い物かご(バスケット)を一つの単位とすることに由来する。「マーケットバスケット分析」ともいう [……]

ゼロパーティデータ

ゼロパーティデータ(zero-party data, ZPD)とは、ユーザーが何らかの対価を得るために企業(広告主)に対して意図的に提供するデータのこと。企業からのオファーを受けるのと引き換えに、そのユーザー固有のデータ利用をオプトインで承諾するというものである。趣味嗜好や購入意 [……]

サルベージ

サルベージ(salvage)とは、もともとは沈没した船舶の引き揚げや回収作業のことを表す英語だが、ビジネスやITの領域においては破損したハードディスクなどのデータストレージからデータを取り出す作業やサービスのことを指す。区別するために「データサルベージ」とも呼ばれる。 破損や不具 [……]

エンドツーエンド暗号化

エンドツーエンド暗号化(end-to-end encryption, E2EE)とは、通信ネットワークにおいて通信を行う送信者と受信者のみが暗号化されたデータを復号、閲覧できる仕組みの、秘匿性の高い暗号化技術のこと。「E2E暗号化」「端末間暗号化」。 転送途中のデータは常に暗号化 [……]

ウォーターフォールチャート(滝グラフ)

ウォーターフォールチャート(waterfall chart)とは、最初の値が数値の増減によってどのように変化したのかという増減の累積や内訳を可視化したグラフ表現のこと。積み上げ棒グラフなどの重なる部分を分解し、最初の値から最終の値までの増減を表すことができる。「滝グラフ」「ウォー [……]

移動平均

移動平均とは、主に時系列データを一定区間ごとの平均値を連続的に求めて平滑化すること。株価をはじめとした時系列データは変化が激しく、傾向を滑らかにして把握しやすくするために用いられる。いくつかの種類があるが、明記がなければ単純移動平均のことを指す。 一定区間をどれぐらいにするかは場 [……]

テレメトリーデータ

テレメトリーデータ(telemetry data)とは、ソフトウェアやアプリケーションがパフォーマンス改善や品質向上を目的として収集するユーザーの利用状況データのこと。プロセスは自動化されて、データはメーカーやベンダーのコントロールセンターなど特定の地点へと送信、収集される。 こ [……]

トリム平均(調整平均, 刈込み平均)

トリム平均とは、上位と下位のデータを一定の割合で取り除いて計算した平均値のこと。データの中に外れ値や異常値がある場合、平均値がそれらに影響を受けないように除外できる。「刈込み平均」「調整平均」ともいう。 最小値側と最大値側からそれぞれ5%のデータを除去する場合、「5%トリム平均」 [……]

データレイク

データレイクとは、あらゆるデータを本来のフォーマットのまま蓄積、保管する一元化された貯蔵環境のこと。データ属性が構造的に管理された構造化データ、ログファイルや画像、動画といった非構造化データを、発生したままの生データで格納できる。直訳すると「データの湖」。 データウェアハウス(D [……]

データマート

データマートとは、企業のシステムに蓄積保管されたデータから特定の目的や用途のために抽出され、再構築されたデータベースのこと。直訳すると「データの小売店」。 特定の目的で抽出して小さなサイズで構築されるため、集計やデータ分析時に扱いやすいという利点がある。 データマートはデータウェ [……]

データウェアハウス (DWH)

データウェアハウスとは、企業の業務上で発生した情報を構造化データで時系列に整理して保管した統合データベース、もしくはその管理システムやソフトウェアのこと。直訳すると「データの倉庫」。複数の基幹システムから抽出されて再構成されることが多い。 データウェアハウスから抽出されてデータ分 [……]

異常値

異常値とは、得られたデータの中で他と比べて極端に逸脱した値を意味する「外れ値」のうち、測定ミスや記録ミス、条件の異なる値の混入など「極端な原因、理由」がわかっている値のこと。 外れ値と異常値の違いは定義によって左右されるため、どのような理由で外れた値になっているのかを確認する必要 [……]

外れ値

外れ値とは、得られたデータのうち、全体的な傾向から他と比べて極端に逸脱した値のこと。 外れ値のうち、測定ミスや記録ミス、条件の異なる値の混入など「極端な原因、理由」がわかっているものを「異常値」と呼ぶが、外れ値と異常値の違いは定義によって左右される。また、外れ値と「外れ値ではない [……]

正規化

正規化とは、データを一定の規則に従って整形、変換、再編して、利用しやすい状態にすること。データの重複をなくして管理を容易かつ効率的にし、より多様な目的で扱いやすくするためのデータベースの構築技法の一つである。 様々な分野で用いられる概念であり、整形や変換などの処理方法は異なる。

ビジネスインテリジェンス (BI)

ビジネスインテリジェンス(business intelligence)とは、データを組織的にかつ系統的に蓄積、分類、検索、分析、加工して、ビジネスや経営の予測、最適化、意志決定に用いるプロセスや概念、取り組みのこと。略称は「BI」。 これらを取り扱うツールやソフトウェア、アプリケ [……]

インテリジェンス

インテリジェンスとは、知性や知能、あるいは情報といった意味のこと。ビジネス領域においては、同く「情報」として捉えられる「データ」「インフォメーション」との区別や対比として「インテリジェンス」は用いられる。 データとインフォメーションとインテリジェンスの違い 日本語では「情報」とし [……]

空・雨・傘

「空・雨・傘」は、問題解決のためのフレームワークの一つで、「空を見て、雨が降りそうだから、傘を持っていこう」という意志決定に至るプロセスを分解してロジカルに考える手法のこと。 「空」は「空が曇っている」という事実の認識のステップである。データを客観的に正しく収集し、事実を適切に認 [……]

トランザクション (tx)

トランザクション(transaction)とは、商取引や売買といった「商品を渡して代金を受け取る」という一連の処理の単位のこと。ITの分野では、コンピュータ内のデータベースで処理される分割できない一連の処理単位のことを指す。またこの一連の処理をトランザクション処理という。略称は「 [……]

錯誤相関

錯誤相関(illusory correlation)とは、もともと相関がないデータに相関があると思い込んでしまうこと。実際には関連しない事象に対して、関連性があるように錯覚すること。認知バイアスの一つ。 特定の属性の集団が特徴ある行動をとった場合、その事象の起こる頻度を過大評価し [……]

平文

平文とは、インターネットなどの通信における暗号化されていないデータや文字列のこと。読みは「ひらぶん」。クリアテキスト。 暗号化されたデータ「暗号文」との対比で、情報漏洩防止のための対策が取られていないデータのことを指す。「本来暗号化されるべきパスワードやクレジットカード番号が、平 [……]

アノテーション

アノテーションとは、もともとは注釈、記注の意味である。IT分野においては、データやプログラム記述に対して注釈となる情報やメモを付与すること、もしくはその付加情報のことを指す。 Javaのプログラムの中にメタデータとして注釈を加えたり、文書を出力する際に「社外秘」「日付」などを付与 [……]

アセット

アセットとは、資産、金銭的に価値のある財産のこと。金融においては、現金の他に預金や貸し付け、不動産や有価証券などが該当し、一般的な意味としてはこちらの用途で使用されることが多い。 ビジネスにおいては、経営資源といった金融面の意味の他に、システム機器やソフトウェアといった「物理的に [……]

バッファ

バッファ(buffer)もしくはバッファーとは、もともとは「物の間に入って衝撃などを吸収、緩衝するもの」を意味する英語である。IT領域では、コンピューターがデータのやりとりの中で処理しきれないデータを一時的に溜めておくデータ領域「緩衝記憶領域」のことを表す。 加えて、日本のビジネ [……]

多変量テスト

多変量テストとは、施策の候補を複数のパターンで実施する際、変更する複数の変数のすべての組み合わせを一定期間に同時に行い、どの組み合わせが効果的かを検証する検定のこと、もしくはその取り組み全体のこと。Multivariate Testを略して「MVT」と呼ばれることもある。 基準と [……]