UpSet plot (アップセット・プロット)
UpSet plot(アップセット・プロット)とは、複数の集合間の交差関係を効率的に可視化するためのデータビジュアライゼーション手法、もしくはそれによって作成されたグラフのこと。ベン図やオイラー図が3~4個を超える集合を表現するのに限界があったのに対し、UpSet plotは数多 [……]
UpSet plot(アップセット・プロット)とは、複数の集合間の交差関係を効率的に可視化するためのデータビジュアライゼーション手法、もしくはそれによって作成されたグラフのこと。ベン図やオイラー図が3~4個を超える集合を表現するのに限界があったのに対し、UpSet plotは数多 [……]
データ・インク比(data-ink ratio)とは、グラフや図表全体のインク量に対するデータ表現に使われるインク量の割合のこと。データそのものを際立たせるための基準であり、データ・インク比が高いほどグラフはデータの情報伝達に焦点を合わせてシンプルになり、データが明確に伝わること [……]
キャンベルの法則(Campbell’s law)とは、社会的なプロセスにおける定量的な指標が改善や評価の基準として重視されると、その指標そのものが操作され結果的に本来の目的を果たさなくなる事象のこと。 ある問題を解決するために特定の指標を測定してその指標の改善を目標に [……]
グッドハートの法則(Goodhart’s law)とは、特定の指標が人々の行動を評価するための目標として設定されたとき、人々は目標に対してなんとか達成しようとその指標を操作するようになり、その結果その指標は測定しようとした本来の目的からかけ離れて適切な指標ではなくなる [……]
「OSINT (Open-Source Intelligence, オープンソース・インテリジェンス)」とは、一般に公開されている情報を収集、分析、突合し、独自の有用な情報に変換して活用できる状態にする手法のことである。「OSINT」を「オシント」と読むことがある。もともとは国家 [……]
ブーリアン型(boolean datatype)とは、プログラミングなどにおける真理値(真偽値)を扱うデータ型のこと。「true (真)」もしくは「false (偽)」のいずれかの値を持つ。二者択一条件を表し、AND条件やOR条件などの条件分岐、論理演算などにおける重要な変数であ [……]
「accum.」とは、「収集された」積み重ねた」「累積の」を意味する英語の「accumulative」の略である。 データや統計、指標などで使用される場合は「累計の」の意味であることが多い。「accum. views」であれば「累積視聴」となる。単に累計であれば「accumula [……]
フェルミ推定(Fermi estimate)とは、正確な数値がわからないものや実態の調査計測が困難な数量を、既にある情報を頼りに論理的に推測して短時間で見積もること。概算の見積もり。「オーダーエスティメーション (order estimation)」ともいう。 このような概算を得 [……]
ワンソースマルチユース(one source multi use, OSMU)とは、一つのデータを元にして複数の目的や用途で利用すること。コンテンツや情報の領域にて、管理された一つの素材を元にさまざまな媒体やフォーマットでコンテンツや情報を作成、生成することを指す。「OSMU」と [……]
先祖返りとは、ビジネスやITの領域においてはソフトウェアやデータなどを更新する際に何らかの理由で過去の古いバージョンに書き換えられてしまうこと。もともとは生物の進化の過程で失ったと思われた遺伝子上の形質が突然その子孫に出現することである(帰先遺伝)。読みは「せんぞがえり」。 ビジ [……]
トークン(token)とは、もともと「象徴」「しるし」「記号」「証拠」などを意味する英語だが、ビジネスや金融関係などの文脈では「何らかの価値を示すもの、象徴」としてさまざまな意味で用いられる。 代用貨幣、代用通貨 ブロックチェーン技術を用いて発行された仮想通貨や暗号資産などの電子 [……]
個票とは、調査や集計、投票、アンケート、会員管理、商品管理などで使用される個々の票、情報のこと。多くの場合、一意の人(ユーザー)や商品などが単位となる。読みは「こひょう」。 「個票データ」「個票形式」などのように用いる。「児童個票」「生徒個票」「参加者個票」のように他の用語と組み [……]
N/Aとは、「該当なし」「適用なし」を意味する英語「not applicable」、もしくは「無効」「利用不可」を意味する英語「not available」の略語である。質問に対する回答がない場合や該当するデータがない場合、あるいは該当の項目を提供できない場合、未定である場合など [……]
ロバストネス原則(robustness principle)とは、「あなたがすることは厳密に、あなたが他人から受けることには寛容に (be conservative in what you do, be liberal in what you accept from others [……]
モザイク図(mosaic plot)とは、データのサイズ(数値)と各属性の割合を可視化したグラフ表現のこと。データの階層構造とサイズを同時に把握できる。「マリメッコチャート (Marimekko chart)」「量率グラフ」ともいう。 長方形の面積は各データのサイズ(数値)を、色 [……]
アクチュアルデータ(actual data)とは、Webサイト閲覧やアプリ利用、動画視聴、商品購買といった消費者の行動や反応を計測して得られる数値化されたデータのこと。マーケティングリサーチの領域で用いられる用語である。 実際の購入履歴やアクセス解析ツールをはじめさまざまなツール [……]
データポータビリティ(data portability)とは、個人がサービス利用などで企業に提供した利用履歴などの個人データを、本人の意志によって他のサービスへ容易に移動できること、もしくはその仕組みのこと。個人データを構造化された形式で受け取り、それの第三者への移行が容易になる [……]
サイドローディング(sideloading)とは、もともとは端末間のデータやファイルの転送を「ダウンロード」「アップロード」以外の手段で行うことを指す。ケーブルによる物理的な直接接続による移動、SDカードやUSBメモリなどを介した移動、BluetoothやWi-Fiを介した転送な [……]
データの民主化(data-democratization)とは、組織内の誰もが技能のレベルに関係なく容易にデータにアクセスでき、自由に利用できる状態、あるいはそのようなデータ活用の文化のこと。特別な技能や権限を有する担当者や専門家だけがデータを利用するのではなく、特別な知識や技術 [……]
同意管理プラットフォーム(コンセントマネジメントプラットフォーム, consent management platform, CMP)とは、Webサイトやアプリの利用ユーザーに対してCookieをはじめとしたユーザーデータの取得と利用目的を明示し、その同意(オプトイン)を獲得、管 [……]
FIFOとは、「first in, first out」の略で、先に入れたもの、つまり古いものを先に取り出す「先入れ先出し」の順序、処理方法のこと。「先入先出法」。読みは「ファイフォ」「フィーフォ」など。 複数の対象を管理、処理する際の順序の原理のことで、日時の古いものから順番に [……]
サフィックス(suffix)とは、接尾辞、末尾に付け加えたものを意味する英語である。 ITの領域においては、文字列の末尾に付与した特定の数値や文字や記号のことで、何らかの意味を持ち、区別などの用途で用いられる。「.txt」「.pdf」などのファイル拡張子もサフィックスに該当する。 [……]
ウェイトバック集計とは、回収されたサンプル(標本)を母集団の構成に合わせて集計すること。サンプルに重み付けをして集計する方法である。「ウェイト付き集計」とも呼ぶ。 アンケート調査などで回答者(サンプル)の属性が偏り、実際の市場など母集団の構成比と異なる場合などに、回答数を調整して [……]
母数(parameter, パラメータ)とは、統計学において母集団の特性を表す定数のこと。 例えば、母集団の「平均」「分散」「標準偏差」は母数であり、それぞれ「母平均」「母分散」「母標準偏差」とも呼ぶ。母集団から一部を抽出したデータの集合「サンプル(標本)」に関する値と区別するた [……]
ベキ分布(power-law distribution)とは、発生する確率がその値のベキ乗(累乗)に比例する「ベキ乗則(power law, 冪乗則)」に従う統計分布のこと。 分布が左右対称となる正規分布とは異なり、ベキ分布は中央値や最頻値が分布の左端に位置し、極端な値が多いため [……]
NFT(non-fungible token, ノンファンジブル・トークン)とは、ブロックチェーン上で発行され、唯一無二の存在であることを証明されたデジタルデータのこと。ブロックチェーン上(デジタル上)における資産鑑定書や所有証明書のような識別子を所有し、「世界に1つだけのデータ [……]
CDPとは、「カスタマー・データ・プラットフォーム (Customer Data Platform)」の略で、顧客IDやメールアドレスなどの顧客データを軸として、ファーストパーティデータやサードパーティデータを統合したプラットフォームのこと。個々の顧客のデータを集約し、マーケティ [……]
ファーストパーティデータ(first party data)とは、企業自身が収集、保有する顧客に関するデータのこと。顧客のメールアドレスや名前、購入履歴や各種属性、あるいはWebサイトやアプリでのユーザー行動情報など、自社で収集蓄積した様々な情報が該当する。 会員登録した情報 M [……]
デリミタ(delimiter)とは、データをテキストファイルに記録する際に項目を区切る記号として用いる文字のこと。「区切り文字」。CSV形式であればカンマ「,」が用いられるなど、カンマやタブ、スペースなどが一般的である。 また、「(…)」「<…> [……]
ツリーマップ(treemap)とは、階層構造のデータを長方形の面積と色の組み合わせにより可視化したグラフ表現のこと。長方形の面積は各データのサイズ(数値)を、色はデータの属性を表し、属性の長方形の中に各データの長方形が組み合わされ、空間充填でコンパクトに表現される。大量のデータの [……]