Yahoo! 知恵袋データ(第2版)
Last Update:July,11,2016 Created:July,11,2016
Comment
Like
Favorite
Public
Profile
Title of the dataset | Yahoo! 知恵袋データ(第2版) |
---|---|
Provenance of the dataset | 国立情報学研究所、ヤフー株式会社 |
How were the data collected/created? What was the cost? | Yahoo!知恵袋のサービスを通してデータベースに収集された情報から抽出。 |
Data sharing policy | Other |
Data sharing policy |
About data analysis and simulation
Type of data: Check all that apply. Use "Other" to specify other types so that we can include them in further updates. | other |
---|---|
Variable labels of dataset (the names of the variables) | |
Outline of data | 国立情報学研究所がヤフー株式会社から提供を受けて、研究者に提供しているYahoo!知恵袋のデータセット。「Yahoo!知恵袋」とは、質問したい人と回答したい人をむすび、知恵と知識を参加者同士で共有することを目的とした日本最大の知識検索サービスで、2004年4月からヤフー株式会社が提供している。 本データは「Yahoo!知恵袋」において下記の期間に解決済みとなった質問と回答を、ヤフー株式会社が「ヤフー知恵袋」のデータベースから抽出したものとなる。 2004年4月?2009年4月の5年間で集められた約1600万件の質問と約5000万の回答を含む。 |
Simulation process | |
Expected outcome of the process (obtained knowledge, analysis results, output of tools) | Q&Aコミュニティにおける回答の信頼性指標の構築(http://se.naist.jp/html/HCI/QA_community/)、Q&Aサイトへの質問の作成を支援するための情報の抽出(情報社会学会論文誌Vol.3 No.2 pp.5-14 (2009))、QAサイトコンテンツの信憑性分析およびWebクエリの意図発見、コミュニティの活性度評価、Web質問応答システム開発 |
Anticipation for analyses/simulations other than the typical ones provided above |
Other
Comments | <第1版との比較> 2007年3月に提供を開始した第1版は2005年10月までのベータ版期間の投稿データであったが、第2版では2004年4月から2009年4月までのデータとなる。 投稿データの対象期間が拡大しただけでなく、2006年5月より対応している携帯電話からの投稿データも追加されている。 さらに、第1版の対象期間の後に「Yahoo!知恵袋」に機能追加された、投稿に付随するデータ(評価数、コイン数、知恵コレクション数、モバイルフラグなど)も新たに提供されている。 |
---|---|
What kind of data/tools do you wish to have? | |
Visualized information | |
Sample data |
Comment form