ニコニコ大百科データ
- Last Update:July,11,2016 Created:July,11,2016
- Comment
- Like
- Favorite
Public
Profile
Title of the dataset | ニコニコ大百科データ |
---|---|
Provenance of the dataset | 国立情報学研究所、株式会社ドワンゴ、有限会社未来検索ブラジル |
How were the data collected/created? What was the cost? | ニコニコ大百科に投稿された記事のデータから抽出。 |
Data sharing policy | Other |
Data sharing policy |
About data analysis and simulation
Type of data: Check all that apply. Use "Other" to specify other types so that we can include them in further updates. | text number series table |
---|---|
Variable labels of dataset (the names of the variables) | レス本文|記事タイトル|記事種類(A:単語,V:動画,I:商品,L:生放送)|レス投稿日時|記事作成日時|記事ヨミ|記事本文|レス番号|記事更新日時|記事ID |
Outline of data | 国立情報学研究所が(株)ドワンゴおよび(有)未来検索ブラジルから提供を受けて研究者に提供しているデータセット。 ニコニコ大百科に2014年2月上旬までに投稿された記事全ての記事ヘッダ、記事本文データ、それに付随する掲示板全データを含む。ただし、ユーザーページ及びユーザーIDは削除されている。 記事ヘッダデータは、記事ID、記事タイトル、記事ヨミ、記事種類(a:単語,v:動画,i:商品,l:生放送)、記事作成日時などのデータとなる。CSV形式のファイルで、1年当たり1ファイル、圧縮ファイルで約4.9MB、展開後は約14.9MBとなる。 記事本文データは、記事ID、記事本文、記事更新日時などのデータとなる。CSV形式のファイルで、1月あたり1ファイル(例外あり)、圧縮ファイルで約4.52GB、展開後は約22.7GBとなる。 掲示板データは記事ID、レス番号、レス投稿日時、レス本文などのデータとなる。CSV形式のファイルで、1年あたり1ファイル、圧縮ファイルで約576MB、展開後は約1.68GBとなる。 |
Simulation process | |
Expected outcome of the process (obtained knowledge, analysis results, output of tools) | |
Anticipation for analyses/simulations other than the typical ones provided above |
Other
Comments | |
---|---|
What kind of data/tools do you wish to have? | |
Visualized information | |
Sample data |
Comment form