ニコニコ大百科データ

  • 作成日:2016年07月11日 最終更新日:2016年07月11日
  • コメントする
  • いいね
  • お気に入り

全体に公開

提出者情報

データジャケットの題名 ニコニコ大百科データ
データの所在・所有者 国立情報学研究所、株式会社ドワンゴ、有限会社未来検索ブラジル
データ収集方法やコスト ニコニコ大百科に投稿された記事のデータから抽出。
データの共有について その他
データの共有について (その他を選ばれた方)

データの分析・シミュレーションについて

データの種類 テキスト 数値 時系列
データの変数(パラメーター)の変数名 レス本文|記事タイトル|記事種類(A:単語,V:動画,I:商品,L:生放送)|レス投稿日時|記事作成日時|記事ヨミ|記事本文|レス番号|記事更新日時|記事ID
データの概要説明 国立情報学研究所が(株)ドワンゴおよび(有)未来検索ブラジルから提供を受けて研究者に提供しているデータセット。 ニコニコ大百科に2014年2月上旬までに投稿された記事全ての記事ヘッダ、記事本文データ、それに付随する掲示板全データを含む。ただし、ユーザーページ及びユーザーIDは削除されている。 記事ヘッダデータは、記事ID、記事タイトル、記事ヨミ、記事種類(a:単語,v:動画,i:商品,l:生放送)、記事作成日時などのデータとなる。CSV形式のファイルで、1年当たり1ファイル、圧縮ファイルで約4.9MB、展開後は約14.9MBとなる。 記事本文データは、記事ID、記事本文、記事更新日時などのデータとなる。CSV形式のファイルで、1月あたり1ファイル(例外あり)、圧縮ファイルで約4.52GB、展開後は約22.7GBとなる。 掲示板データは記事ID、レス番号、レス投稿日時、レス本文などのデータとなる。CSV形式のファイルで、1年あたり1ファイル、圧縮ファイルで約576MB、展開後は約1.68GBとなる。
想定しているデータの分析・シミュレーションプロセス
想定しているデータの分析・シミュレーションプロセスの結果 (データ分析結果/ツールの出力/典型例など)
上記の分析・シミュレーションプロセス以外に期待する分析

その他

自由記述
入手したいデータ/ツール
可視化情報
サンプルデータ

コメントフォーム

captcha

利用規約はこちらからご確認下さい。