データの種類 |
テキスト
|
データの変数(パラメーター)の変数名 |
・インターネット検閲に「賛成」と「反対」|・セッション内の「ある論文」と「その他全ての論文」|異なる2つの立場に対応するテキストデータ。|・原子力の「専門的な報告書」と「一般向けのニュース記事」 |
データの概要説明 |
あるテーマに関する異なる2つ(将来的には複数)の立場の位置づけを一目で示す可視化ツール。2つの立場について、それぞれ対応する文書データを用意すると、各立場に特徴的な語と、その間でハブの役割を果たす語を抽出し、立場間の共通点・相違点を俯瞰できる。 |
想定しているデータの分析・シミュレーションプロセス |
それぞれのテキストデータに特徴的な単語と、その間をつなぐハブの単語を、確率的指標に基づく手法で抽出し、可視化する。 |
想定しているデータの分析・シミュレーションプロセスの結果 (データ分析結果/ツールの出力/典型例など) |
・それぞれのテキストデータに特徴的な単語と、その間をつなぐハブの単語
・上記単語同士の文共起関係 |
上記の分析・シミュレーションプロセス以外に期待する分析 |
・ハブ単語に着目し、共通のテーマに誰がどの程度興味を持っているか把握できる。
・将来的にはカテゴリデータ等への応用も視野に入れる。 |
コメントフォーム