データに関するキーワード(72件)

OSINT (Open-Source Intelligence, オシント)

「OSINT (Open-Source Intelligence, オープンソース・インテリジェンス)」とは、一般に公開されている情報を収集、分析、突合し、独自の有用な情報に変換して活用できる状態にする手法のことである。「OSINT」を「オシント」と読むことがある。もともとは国家 [……]

ブーリアン型(論理型, ブール型)

ブーリアン型(boolean datatype)とは、プログラミングなどにおける真理値(真偽値)を扱うデータ型のこと。「true (真)」もしくは「false (偽)」のいずれかの値を持つ。二者択一条件を表し、AND条件やOR条件などの条件分岐、論理演算などにおける重要な変数であ [……]

accum. (accumulative, 累計の)

「accum.」とは、「収集された」積み重ねた」「累積の」を意味する英語の「accumulative」の略である。 データや統計、指標などで使用される場合は「累計の」の意味であることが多い。「accum. views」であれば「累積視聴」となる。単に累計であれば「accumula [……]

フェルミ推定(オーダーエスティメーション)

フェルミ推定(Fermi estimate)とは、正確な数値がわからないものや実態の調査計測が困難な数量を、既にある情報を頼りに論理的に推測して短時間で見積もること。概算の見積もり。「オーダーエスティメーション (order estimation)」ともいう。 このような概算を得 [……]

ワンソースマルチユース (OSMU)

ワンソースマルチユース(one source multi use, OSMU)とは、一つのデータを元にして複数の目的や用途で利用すること。コンテンツや情報の領域にて、管理された一つの素材を元にさまざまな媒体やフォーマットでコンテンツや情報を作成、生成することを指す。「OSMU」と [……]

先祖返り

先祖返りとは、ビジネスやITの領域においてはソフトウェアやデータなどを更新する際に何らかの理由で過去の古いバージョンに書き換えられてしまうこと。もともとは生物の進化の過程で失ったと思われた遺伝子上の形質が突然その子孫に出現することである(帰先遺伝)。読みは「せんぞがえり」。 ビジ [……]

トークン

トークン(token)とは、もともと「象徴」「しるし」「記号」「証拠」などを意味する英語だが、ビジネスや金融関係などの文脈では「何らかの価値を示すもの、象徴」としてさまざまな意味で用いられる。 代用貨幣、代用通貨 ブロックチェーン技術を用いて発行された仮想通貨や暗号資産などの電子 [……]

個票

個票とは、調査や集計、投票、アンケート、会員管理、商品管理などで使用される個々の票、情報のこと。多くの場合、一意の人(ユーザー)や商品などが単位となる。読みは「こひょう」。 「個票データ」「個票形式」などのように用いる。「児童個票」「生徒個票」「参加者個票」のように他の用語と組み [……]

N/A (該当なし, 無効)

N/Aとは、「該当なし」「適用なし」を意味する英語「not applicable」、もしくは「無効」「利用不可」を意味する英語「not available」の略語である。質問に対する回答がない場合や該当するデータがない場合、あるいは該当の項目を提供できない場合、未定である場合など [……]

ロバストネス原則(ポステルの法則)

ロバストネス原則(robustness principle)とは、「あなたがすることは厳密に、あなたが他人から受けることには寛容に (be conservative in what you do, be liberal in what you accept from others [……]

モザイク図(マリメッコチャート, 量率グラフ)

モザイク図(mosaic plot)とは、データのサイズ(数値)と各属性の割合を可視化したグラフ表現のこと。データの階層構造とサイズを同時に把握できる。「マリメッコチャート (Marimekko chart)」「量率グラフ」ともいう。 長方形の面積は各データのサイズ(数値)を、色 [……]

アクチュアルデータ

アクチュアルデータ(actual data)とは、Webサイト閲覧やアプリ利用、動画視聴、商品購買といった消費者の行動や反応を計測して得られる数値化されたデータのこと。マーケティングリサーチの領域で用いられる用語である。 実際の購入履歴やアクセス解析ツールをはじめさまざまなツール [……]

データポータビリティ

データポータビリティ(data portability)とは、個人がサービス利用などで企業に提供した利用履歴などの個人データを、本人の意志によって他のサービスへ容易に移動できること、もしくはその仕組みのこと。個人データを構造化された形式で受け取り、それの第三者への移行が容易になる [……]

サイドローディング

サイドローディング(sideloading)とは、もともとは端末間のデータやファイルの転送を「ダウンロード」「アップロード」以外の手段で行うことを指す。ケーブルによる物理的な直接接続による移動、SDカードやUSBメモリなどを介した移動、BluetoothやWi-Fiを介した転送な [……]

データの民主化

データの民主化(data-democratization)とは、組織内の誰もが技能のレベルに関係なく容易にデータにアクセスでき、自由に利用できる状態、あるいはそのようなデータ活用の文化のこと。特別な技能や権限を有する担当者や専門家だけがデータを利用するのではなく、特別な知識や技術 [……]

FIFO (先入れ先出し)

FIFOとは、「first in, first out」の略で、先に入れたもの、つまり古いものを先に取り出す「先入れ先出し」の順序、処理方法のこと。「先入先出法」。読みは「ファイフォ」「フィーフォ」など。 複数の対象を管理、処理する際の順序の原理のことで、日時の古いものから順番に [……]

サフィックス(接尾辞)

サフィックス(suffix)とは、接尾辞、末尾に付け加えたものを意味する英語である。 ITの領域においては、文字列の末尾に付与した特定の数値や文字や記号のことで、何らかの意味を持ち、区別などの用途で用いられる。「.txt」「.pdf」などのファイル拡張子もサフィックスに該当する。 [……]

ウェイトバック集計

ウェイトバック集計とは、回収されたサンプル(標本)を母集団の構成に合わせて集計すること。サンプルに重み付けをして集計する方法である。「ウェイト付き集計」とも呼ぶ。 アンケート調査などで回答者(サンプル)の属性が偏り、実際の市場など母集団の構成比と異なる場合などに、回答数を調整して [……]

母数(パラメータ)

母数(parameter, パラメータ)とは、統計学において母集団の特性を表す定数のこと。 例えば、母集団の「平均」「分散」「標準偏差」は母数であり、それぞれ「母平均」「母分散」「母標準偏差」とも呼ぶ。母集団から一部を抽出したデータの集合「サンプル(標本)」に関する値と区別するた [……]

ベキ分布

ベキ分布(power-law distribution)とは、発生する確率がその値のベキ乗(累乗)に比例する「ベキ乗則(power law, 冪乗則)」に従う統計分布のこと。 分布が左右対称となる正規分布とは異なり、ベキ分布は中央値や最頻値が分布の左端に位置し、極端な値が多いため [……]

NFT(非代替性トークン)

NFT(non-fungible token, ノンファンジブル・トークン)とは、ブロックチェーン上で発行され、唯一無二の存在であることを証明されたデジタルデータのこと。ブロックチェーン上(デジタル上)における資産鑑定書や所有証明書のような識別子を所有し、「世界に1つだけのデータ [……]

CDP (Customer Data Platform)

CDPとは、「カスタマー・データ・プラットフォーム (Customer Data Platform)」の略で、顧客IDやメールアドレスなどの顧客データを軸として、ファーストパーティデータやサードパーティデータを統合したプラットフォームのこと。個々の顧客のデータを集約し、マーケティ [……]

ファーストパーティデータ

ファーストパーティデータ(first party data)とは、企業自身が収集、保有する顧客に関するデータのこと。顧客のメールアドレスや名前、購入履歴や各種属性、あるいはWebサイトやアプリでのユーザー行動情報など、自社で収集蓄積した様々な情報が該当する。 会員登録した情報 M [……]

デリミタ(区切り文字)

デリミタ(delimiter)とは、データをテキストファイルに記録する際に項目を区切る記号として用いる文字のこと。「区切り文字」。CSV形式であればカンマ「,」が用いられるなど、カンマやタブ、スペースなどが一般的である。 また、「(…)」「<…&gt [……]

ツリーマップ

ツリーマップ(treemap)とは、階層構造のデータを長方形の面積と色の組み合わせにより可視化したグラフ表現のこと。長方形の面積は各データのサイズ(数値)を、色はデータの属性を表し、属性の長方形の中に各データの長方形が組み合わされ、空間充填でコンパクトに表現される。大量のデータの [……]

信頼区間

信頼区間(confidence interval)とは、全数調査ができないなどにより調査結果の精度を知るために、母集団の平均(母平均)を統計的に推定する際などに設けられる幅、区間のこと。信頼係数(信頼度)のもとで母集団がその範囲に含まれると推定される区間である。英語の「confi [……]

信頼係数

信頼係数(confidence coefficient)とは、統計的に信頼区間を推定する区間推定の際に、母集団の平均(母平均)が信頼区間の範囲に含まれる確率のこと。 信頼係数は、値「1-α」、もしくは%で表す際は「100(1-α)%」と表記する。一般的には95%もしくは99%の信 [……]

しきい値(閾値, スレッショルド)

しきい値(threshold)とは、境目となる値のこと。ある現象を起こすためにその数値以上では効果が表れ、それ以下では効果が表れない境界の値のことであり、効果が表れるときの最小値である。「閾値(いきち)」、また英語の「スレッショルド」と表記されることもある。

母集団

母集団(population)とは、統計学の基礎概念の一つであり、本来の調査や分析の対象となる全体の集団のことを表す。その母集団に対して調査を行うために、一部を抽出したデータの集合のことを「サンプル(標本)」といい、サンプル(標本)から母集団を統計的に推測していくのが統計学の目的 [……]