Yahoo! 知恵袋データ(第2版)
作成日:2016年07月11日 最終更新日:2016年07月11日
コメントする
いいね
お気に入り
全体に公開
提出者情報
データジャケットの題名 | Yahoo! 知恵袋データ(第2版) |
---|---|
データの所在・所有者 | 国立情報学研究所、ヤフー株式会社 |
データ収集方法やコスト | Yahoo!知恵袋のサービスを通してデータベースに収集された情報から抽出。 |
データの共有について | その他 |
データの共有について (その他を選ばれた方) |
データの分析・シミュレーションについて
データの種類 | その他 |
---|---|
データの変数(パラメーター)の変数名 | |
データの概要説明 | 国立情報学研究所がヤフー株式会社から提供を受けて、研究者に提供しているYahoo!知恵袋のデータセット。「Yahoo!知恵袋」とは、質問したい人と回答したい人をむすび、知恵と知識を参加者同士で共有することを目的とした日本最大の知識検索サービスで、2004年4月からヤフー株式会社が提供している。 本データは「Yahoo!知恵袋」において下記の期間に解決済みとなった質問と回答を、ヤフー株式会社が「ヤフー知恵袋」のデータベースから抽出したものとなる。 2004年4月?2009年4月の5年間で集められた約1600万件の質問と約5000万の回答を含む。 |
想定しているデータの分析・シミュレーションプロセス | |
想定しているデータの分析・シミュレーションプロセスの結果 (データ分析結果/ツールの出力/典型例など) | Q&Aコミュニティにおける回答の信頼性指標の構築(http://se.naist.jp/html/HCI/QA_community/)、Q&Aサイトへの質問の作成を支援するための情報の抽出(情報社会学会論文誌Vol.3 No.2 pp.5-14 (2009))、QAサイトコンテンツの信憑性分析およびWebクエリの意図発見、コミュニティの活性度評価、Web質問応答システム開発 |
上記の分析・シミュレーションプロセス以外に期待する分析 |
その他
自由記述 | <第1版との比較> 2007年3月に提供を開始した第1版は2005年10月までのベータ版期間の投稿データであったが、第2版では2004年4月から2009年4月までのデータとなる。 投稿データの対象期間が拡大しただけでなく、2006年5月より対応している携帯電話からの投稿データも追加されている。 さらに、第1版の対象期間の後に「Yahoo!知恵袋」に機能追加された、投稿に付随するデータ(評価数、コイン数、知恵コレクション数、モバイルフラグなど)も新たに提供されている。 |
---|---|
入手したいデータ/ツール | |
可視化情報 | |
サンプルデータ |
コメントフォーム