データに関するキーワード(66件)

トークン

トークン(token)とは、もともと「象徴」「しるし」「記号」「証拠」などを意味する英語だが、ビジネスや金融関係などの文脈では「何らかの価値を示すもの、象徴」としてさまざまな意味で用いられる。 代用貨幣、代用通貨 ブロックチェーン技術を用いて発行された仮想通貨や暗号資産などの電子 [……]

個票

個票とは、調査や集計、投票、アンケート、会員管理、商品管理などで使用される個々の票、情報のこと。多くの場合、一意の人(ユーザー)や商品などが単位となる。読みは「こひょう」。 「個票データ」「個票形式」などのように用いる。「児童個票」「生徒個票」「参加者個票」のように他の用語と組み [……]

N/A (該当なし, 無効)

N/Aとは、「該当なし」「適用なし」を意味する英語「not applicable」、もしくは「無効」「利用不可」を意味する英語「not available」の略語である。質問に対する回答がない場合や該当するデータがない場合、あるいは該当の項目を提供できない場合、未定である場合など [……]

ロバストネス原則(ポステルの法則)

ロバストネス原則(robustness principle)とは、「あなたがすることは厳密に、あなたが他人から受けることには寛容に (be conservative in what you do, be liberal in what you accept from others [……]

モザイク図(マリメッコチャート, 量率グラフ)

モザイク図(mosaic plot)とは、データのサイズ(数値)と各属性の割合を可視化したグラフ表現のこと。データの階層構造とサイズを同時に把握できる。「マリメッコチャート (Marimekko chart)」「量率グラフ」ともいう。 長方形の面積は各データのサイズ(数値)を、色 [……]

アクチュアルデータ

アクチュアルデータ(actual data)とは、Webサイト閲覧やアプリ利用、動画視聴、商品購買といった消費者の行動や反応を計測して得られる数値化されたデータのこと。マーケティングリサーチの領域で用いられる用語である。 実際の購入履歴やアクセス解析ツールをはじめさまざまなツール [……]

データポータビリティ

データポータビリティ(data portability)とは、個人がサービス利用などで企業に提供した利用履歴などの個人データを、本人の意志によって他のサービスへ容易に移動できること、もしくはその仕組みのこと。個人データを構造化された形式で受け取り、それの第三者への移行が容易になる [……]

サイドローディング

サイドローディング(sideloading)とは、もともとは端末間のデータやファイルの転送を「ダウンロード」「アップロード」以外の手段で行うことを指す。ケーブルによる物理的な直接接続による移動、SDカードやUSBメモリなどを介した移動、BluetoothやWi-Fiを介した転送な [……]

データの民主化

データの民主化(data-democratization)とは、組織内の誰もが技能のレベルに関係なく容易にデータにアクセスでき、自由に利用できる状態、あるいはそのようなデータ活用の文化のこと。特別な技能や権限を有する担当者や専門家だけがデータを利用するのではなく、特別な知識や技術 [……]

FIFO (先入れ先出し)

FIFOとは、「first in, first out」の略で、先に入れたもの、つまり古いものを先に取り出す「先入れ先出し」の順序、処理方法のこと。「先入先出法」。読みは「ファイフォ」「フィーフォ」など。 複数の対象を管理、処理する際の順序の原理のことで、日時の古いものから順番に [……]

サフィックス(接尾辞)

サフィックス(suffix)とは、接尾辞、末尾に付け加えたものを意味する英語である。 ITの領域においては、文字列の末尾に付与した特定の数値や文字や記号のことで、何らかの意味を持ち、区別などの用途で用いられる。「.txt」「.pdf」などのファイル拡張子もサフィックスに該当する。 [……]

ウェイトバック集計

ウェイトバック集計とは、回収されたサンプル(標本)を母集団の構成に合わせて集計すること。サンプルに重み付けをして集計する方法である。「ウェイト付き集計」とも呼ぶ。 アンケート調査などで回答者(サンプル)の属性が偏り、実際の市場など母集団の構成比と異なる場合などに、回答数を調整して [……]

母数(パラメータ)

母数(parameter, パラメータ)とは、統計学において母集団の特性を表す定数のこと。 例えば、母集団の「平均」「分散」「標準偏差」は母数であり、それぞれ「母平均」「母分散」「母標準偏差」とも呼ぶ。母集団から一部を抽出したデータの集合「サンプル(標本)」に関する値と区別するた [……]

ベキ分布

ベキ分布(power-law distribution)とは、発生する確率がその値のベキ乗(累乗)に比例する「ベキ乗則(power law, 冪乗則)」に従う統計分布のこと。 分布が左右対称となる正規分布とは異なり、ベキ分布は中央値や最頻値が分布の左端に位置し、極端な値が多いため [……]

NFT(非代替性トークン)

NFT(non-fungible token, ノンファンジブル・トークン)とは、ブロックチェーン上で発行され、唯一無二の存在であることを証明されたデジタルデータのこと。ブロックチェーン上(デジタル上)における資産鑑定書や所有証明書のような識別子を所有し、「世界に1つだけのデータ [……]

CDP (Customer Data Platform)

CDPとは、「カスタマー・データ・プラットフォーム (Customer Data Platform)」の略で、顧客IDやメールアドレスなどの顧客データを軸として、ファーストパーティデータやサードパーティデータを統合したプラットフォームのこと。個々の顧客のデータを集約し、マーケティ [……]

ファーストパーティデータ

ファーストパーティデータ(first party data)とは、企業が自社の顧客やWebサイト訪問者に関して収集、保有しているデータのこと。顧客のメールアドレスや名前、購入履歴や各種属性、あるいはWebサイトでのユーザー行動情報など、自社で収集蓄積した様々な情報が該当する。 2 [……]

デリミタ(区切り文字)

デリミタ(delimiter)とは、データをテキストファイルに記録する際に項目を区切る記号として用いる文字のこと。「区切り文字」。CSV形式であればカンマ「,」が用いられるなど、カンマやタブ、スペースなどが一般的である。 また、「(…)」「<…&gt [……]

ツリーマップ

ツリーマップ(treemap)とは、階層構造のデータを長方形の面積と色の組み合わせにより可視化したグラフ表現のこと。長方形の面積は各データのサイズ(数値)を、色はデータの属性を表し、属性の長方形の中に各データの長方形が組み合わされ、空間充填でコンパクトに表現される。大量のデータの [……]

信頼区間

信頼区間(confidence interval)とは、全数調査ができないなどにより調査結果の精度を知るために、母集団の平均(母平均)を統計的に推定する際などに設けられる幅、区間のこと。信頼係数(信頼度)のもとで母集団がその範囲に含まれると推定される区間である。英語の「confi [……]

信頼係数

信頼係数(confidence coefficient)とは、統計的に信頼区間を推定する区間推定の際に、母集団の平均(母平均)が信頼区間の範囲に含まれる確率のこと。 信頼係数は、値「1-α」、もしくは%で表す際は「100(1-α)%」と表記する。一般的には95%もしくは99%の信 [……]

しきい値(閾値, スレッショルド)

しきい値(threshold)とは、境目となる値のこと。ある現象を起こすためにその数値以上では効果が表れ、それ以下では効果が表れない境界の値のことであり、効果が表れるときの最小値である。「閾値(いきち)」、また英語の「スレッショルド」と表記されることもある。

母集団

母集団(population)とは、統計学の基礎概念の一つであり、本来の調査や分析の対象となる全体の集団のことを表す。その母集団に対して調査を行うために、一部を抽出したデータの集合のことを「サンプル(標本)」といい、サンプル(標本)から母集団を統計的に推測していくのが統計学の目的 [……]

サンプル(標本)

サンプル(sample)とは、統計においては母集団から抽出したデータの集合のこと。「標本」ともいう。母集団を調査するために抽出した一部の対象のことである。 また、母集団からサンプル(標本)を抽出することを「標本抽出」または「サンプリング」という。

サンプル数(標本数)

サンプル数(the number of samples)とは、統計においては母集団から抽出したデータの集合である「サンプル(標本)」の数のこと。母集団からサンプルの抽出を何回行ったかという数である。「標本数」ともいう。 サンプル(標本)におけるデータの個数の意味で「サンプル数」が [……]

サンプルサイズ(標本の大きさ)

サンプルサイズ(sample size)とは、統計においてデータの個数を表す。1回のサンプル(母集団から抽出したデータの集合、標本)においていくつの個体を調査したかという個体数のことである。データの集合である1サンプルの大きさのこと。通常、小文字の「n」で表す。「標本の大きさ」「 [……]

名寄せ

名寄せとは、複数に分散したデータベースの中から、氏名やメールアドレス、住所や電話番号などの情報をもとにして、同一人物や同一企業を一つにまとめる作業のこと。もともとは金融機関が複数口座を保有する顧客を一元管理して、預金総額などを算出するために行われていたものだが、金融機関以外でもデ [……]

Cookie(クッキー)

Cookie(クッキー)とは、ユーザーがWebサイトにアクセスしたときに、Webサーバーからブラウザー経由でユーザーの端末内に保存される小さなテキストデータ、もしくはファイルのこと。ブラウザー単位で保存される。正式には「HTTP Cookie」。 ユーザーの表示環境やログイン情報 [……]

アソシエーション分析

アソシエーション分析(association analysis)とは、膨大なデータの中から統計的なパターンや意味のある関連性を抽出するデータマイニング手法のこと。 支持度、期待信頼度、信頼度、リフト値といった評価指標を用いて、抽出したルール(アソシエーションルール)を評価する。 [……]