データに関するキーワード(61件)

アクチュアルデータ

アクチュアルデータ(actual data)とは、Webサイト閲覧やアプリ利用、動画視聴、商品購買といった消費者の行動や反応を計測して得られる数値化されたデータのこと。マーケティングリサーチの領域で用いられる用語である。 実際の購入履歴やアクセス解析ツールをはじめさまざまなツール [……]

データポータビリティ

データポータビリティ(data portability)とは、個人がサービス利用などで企業に提供した利用履歴などの個人データを、本人の意志によって他のサービスへ容易に移動できること、もしくはその仕組みのこと。個人データを構造化された形式で受け取り、それの第三者への移行が容易になる [……]

サイドローディング

サイドローディング(sideloading)とは、もともとは端末間のデータやファイルの転送を「ダウンロード」「アップロード」以外の手段で行うことを指す。ケーブルによる物理的な直接接続による移動、SDカードやUSBメモリなどを介した移動、BluetoothやWi-Fiを介した転送な [……]

データの民主化

データの民主化(data-democratization)とは、組織内の誰もが技能のレベルに関係なく容易にデータにアクセスでき、自由に利用できる状態、あるいはそのようなデータ活用の文化のこと。特別な技能や権限を有する担当者や専門家だけがデータを利用するのではなく、特別な知識や技術 [……]

FIFO (先入れ先出し)

FIFOとは、「first in, first out」の略で、先に入れたもの、つまり古いものを先に取り出す「先入れ先出し」の順序、処理方法のこと。「先入先出法」。読みは「ファイフォ」「フィーフォ」など。 複数の対象を管理、処理する際の順序の原理のことで、日時の古いものから順番に [……]

サフィックス(接尾辞)

サフィックス(suffix)とは、接尾辞、末尾に付け加えたものを意味する英語である。 ITの領域においては、文字列の末尾に付与した特定の数値や文字や記号のことで、何らかの意味を持ち、区別などの用途で用いられる。「.txt」「.pdf」などのファイル拡張子もサフィックスに該当する。 [……]

ウェイトバック集計

ウェイトバック集計とは、回収されたサンプル(標本)を母集団の構成に合わせて集計すること。サンプルに重み付けをして集計する方法である。「ウェイト付き集計」とも呼ぶ。 アンケート調査などで回答者(サンプル)の属性が偏り、実際の市場など母集団の構成比と異なる場合などに、回答数を調整して [……]

母数

母数(parameter, パラメータ)とは、統計学において母集団の特性を表す定数のこと。 例えば、母集団の「平均」「分散」「標準偏差」は母数であり、それぞれ「母平均」「母分散」「母標準偏差」とも呼ぶ。母集団から一部を抽出したデータの集合「サンプル(標本)」に関する値と区別するた [……]

ベキ分布

ベキ分布(power-law distribution)とは、発生する確率がその値のベキ乗(累乗)に比例する「ベキ乗則(power law, 冪乗則)」に従う統計分布のこと。 分布が左右対称となる正規分布とは異なり、ベキ分布は中央値や最頻値が分布の左端に位置し、極端な値が多いため [……]

NFT(非代替性トークン)

NFT(non-fungible token, ノンファンジブル・トークン)とは、ブロックチェーン上で発行され、唯一無二の存在であることを証明されたデジタルデータのこと。ブロックチェーン上(デジタル上)における資産鑑定書や所有証明書のような識別子を所有し、「世界に1つだけのデータ [……]

CDP (Customer Data Platform)

CDPとは、「カスタマー・データ・プラットフォーム (Customer Data Platform)」の略で、顧客IDやメールアドレスなどの顧客データを軸として、ファーストパーティデータやサードパーティデータを統合したプラットフォームのこと。個々の顧客のデータを集約し、マーケティ [……]

ファーストパーティデータ

ファーストパーティデータ(first party data)とは、企業が自社の顧客やWebサイト訪問者に関して収集、保有しているデータのこと。顧客のメールアドレスや名前、購入履歴や各種属性、あるいはWebサイトでのユーザー行動情報など、自社で収集蓄積した様々な情報が該当する。 2 [……]

デリミタ(区切り文字)

デリミタ(delimiter)とは、データをテキストファイルに記録する際に項目を区切る記号として用いる文字のこと。「区切り文字」。CSV形式であればカンマ「,」が用いられるなど、カンマやタブ、スペースなどが一般的である。 また、「(…)」「<…&gt [……]

ツリーマップ

ツリーマップ(treemap)とは、階層構造のデータを長方形の面積と色の組み合わせにより可視化したグラフ表現のこと。長方形の面積は各データのサイズ(数値)を、色はデータの属性を表し、属性の長方形の中に各データの長方形が組み合わされ、空間充填でコンパクトに表現される。大量のデータの [……]

信頼区間

信頼区間(confidence interval)とは、全数調査ができないなどにより調査結果の精度を知るために、母集団の平均(母平均)を統計的に推定する際などに設けられる幅、区間のこと。信頼係数(信頼度)のもとで母集団がその範囲に含まれると推定される区間である。英語の「confi [……]

信頼係数

信頼係数(confidence coefficient)とは、統計的に信頼区間を推定する区間推定の際に、母集団の平均(母平均)が信頼区間の範囲に含まれる確率のこと。 信頼係数は、値「1-α」、もしくは%で表す際は「100(1-α)%」と表記する。一般的には95%もしくは99%の信 [……]

しきい値(閾値, スレッショルド)

しきい値(threshold)とは、境目となる値のこと。ある現象を起こすためにその数値以上では効果が表れ、それ以下では効果が表れない境界の値のことであり、効果が表れるときの最小値である。「閾値(いきち)」、また英語の「スレッショルド」と表記されることもある。

母集団

母集団(population)とは、統計学の基礎概念の一つであり、本来の調査や分析の対象となる全体の集団のことを表す。その母集団に対して調査を行うために、一部を抽出したデータの集合のことを「サンプル(標本)」といい、サンプル(標本)から母集団を統計的に推測していくのが統計学の目的 [……]

サンプル(標本)

サンプル(sample)とは、統計においては母集団から抽出したデータの集合のこと。「標本」ともいう。母集団を調査するために抽出した一部の対象のことである。 また、母集団からサンプル(標本)を抽出することを「標本抽出」または「サンプリング」という。

サンプル数(標本数)

サンプル数(the number of samples)とは、統計においては母集団から抽出したデータの集合である「サンプル(標本)」の数のこと。母集団からサンプルの抽出を何回行ったかという数である。「標本数」ともいう。 サンプル(標本)におけるデータの個数の意味で「サンプル数」が [……]

サンプルサイズ(標本の大きさ)

サンプルサイズ(sample size)とは、統計においてデータの個数を表す。1回のサンプル(母集団から抽出したデータの集合、標本)においていくつの個体を調査したかという個体数のことである。データの集合である1サンプルの大きさのこと。通常、小文字の「n」で表す。「標本の大きさ」「 [……]

名寄せ

名寄せとは、複数に分散したデータベースの中から、氏名やメールアドレス、住所や電話番号などの情報をもとにして、同一人物や同一企業を一つにまとめる作業のこと。もともとは金融機関が複数口座を保有する顧客を一元管理して、預金総額などを算出するために行われていたものだが、金融機関以外でもデ [……]

Cookie(クッキー)

Cookie(クッキー)とは、ユーザーがWebサイトにアクセスしたときに、Webサーバーからブラウザー経由でユーザーの端末内に保存される小さなテキストデータ、もしくはファイルのこと。ブラウザー単位で保存される。正式には「HTTP Cookie」。 ユーザーの表示環境やログイン情報 [……]

アソシエーション分析

アソシエーション分析(association analysis)とは、膨大なデータの中から統計的なパターンや意味のある関連性を抽出するデータマイニング手法のこと。 支持度、期待信頼度、信頼度、リフト値といった評価指標を用いて、抽出したルール(アソシエーションルール)を評価する。 [……]

バスケット分析

バスケット分析(basket analysis)とは、小売業のPOSデータやECのトランザクションデータを分析し、一度の購入で一緒に買われている商品の組み合わせを明らかにする手法のこと。買い物かご(バスケット)を一つの単位とすることに由来する。「マーケットバスケット分析」ともいう [……]

ゼロパーティデータ

ゼロパーティデータ(zero-party data, ZPD)とは、ユーザーが何らかの対価を得るために企業(広告主)に対して意図的に提供するデータのこと。企業からのオファーを受けるのと引き換えに、そのユーザー固有のデータ利用をオプトインで承諾するというものである。趣味嗜好や購入意 [……]

サルベージ

サルベージ(salvage)とは、もともとは沈没した船舶の引き揚げや回収作業のことを表す英語だが、ビジネスやITの領域においては破損したハードディスクなどのデータストレージからデータを取り出す作業やサービスのことを指す。区別するために「データサルベージ」とも呼ばれる。 破損や不具 [……]

エンドツーエンド暗号化

エンドツーエンド暗号化(end-to-end encryption, E2EE)とは、通信ネットワークにおいて通信を行う送信者と受信者のみが暗号化されたデータを復号、閲覧できる仕組みの、秘匿性の高い暗号化技術のこと。「E2E暗号化」「端末間暗号化」。 転送途中のデータは常に暗号化 [……]

ウォーターフォールチャート(滝グラフ)

ウォーターフォールチャート(waterfall chart)とは、最初の値が数値の増減によってどのように変化したのかという増減の累積や内訳を可視化したグラフ表現のこと。積み上げ棒グラフなどの重なる部分を分解し、最初の値から最終の値までの増減を表すことができる。「滝グラフ」「ウォー [……]