ニコニコ大百科データ

  • Last Update:July,11,2016 Created:July,11,2016
  • Comment
  • Like
  • Favorite

Public

Profile

Title of the dataset ニコニコ大百科データ
Provenance of the dataset 国立情報学研究所、株式会社ドワンゴ、有限会社未来検索ブラジル
How were the data collected/created? What was the cost? ニコニコ大百科に投稿された記事のデータから抽出。
Data sharing policy Other
Data sharing policy

About data analysis and simulation

Type of data: Check all that apply. Use "Other" to specify other types so that we can include them in further updates. text number series table
Variable labels of dataset (the names of the variables) レス本文|記事タイトル|記事種類(A:単語,V:動画,I:商品,L:生放送)|レス投稿日時|記事作成日時|記事ヨミ|記事本文|レス番号|記事更新日時|記事ID
Outline of data 国立情報学研究所が(株)ドワンゴおよび(有)未来検索ブラジルから提供を受けて研究者に提供しているデータセット。 ニコニコ大百科に2014年2月上旬までに投稿された記事全ての記事ヘッダ、記事本文データ、それに付随する掲示板全データを含む。ただし、ユーザーページ及びユーザーIDは削除されている。 記事ヘッダデータは、記事ID、記事タイトル、記事ヨミ、記事種類(a:単語,v:動画,i:商品,l:生放送)、記事作成日時などのデータとなる。CSV形式のファイルで、1年当たり1ファイル、圧縮ファイルで約4.9MB、展開後は約14.9MBとなる。 記事本文データは、記事ID、記事本文、記事更新日時などのデータとなる。CSV形式のファイルで、1月あたり1ファイル(例外あり)、圧縮ファイルで約4.52GB、展開後は約22.7GBとなる。 掲示板データは記事ID、レス番号、レス投稿日時、レス本文などのデータとなる。CSV形式のファイルで、1年あたり1ファイル、圧縮ファイルで約576MB、展開後は約1.68GBとなる。
Simulation process
Expected outcome of the process (obtained knowledge, analysis results, output of tools)
Anticipation for analyses/simulations other than the typical ones provided above

Other

Comments
What kind of data/tools do you wish to have?
Visualized information
Sample data

Comment form

captcha

Please check the terms of use here.

関連するトピック

関連するトピックはありません。