ClueWeb12

  • 作成日:2015年11月09日 最終更新日:2015年11月09日
  • コメントする
  • いいね
  • お気に入り

全体に公開

提出者情報

データジャケットの題名 ClueWeb12
データの所在・所有者 http://www.lemurproject.org/clueweb12.php/
データ収集方法やコスト The ClueWeb12 datasets are distributed by Carnegie Mellon University for research purposes only. A dataset may be obtained from Carnegie Mellon by signing a data license agreement with Carnegie Mellon University, and paying a fee that covers the cost of distributing the dataset.
データの共有について その他
データの共有について (その他を選ばれた方)

データの分析・シミュレーションについて

データの種類 テキスト
データの変数(パラメーター)の変数名
データの概要説明 The ClueWeb12 dataset was created to support research on information retrieval and related human language technologies. The dataset consists of 733,019,372 English web pages, collected between February 10, 2012 and May 10, 2012. ClueWeb12 is a companion or successor to the ClueWeb09 web dataset. Distribution of ClueWeb12 began in January 2013.
想定しているデータの分析・シミュレーションプロセス
想定しているデータの分析・シミュレーションプロセスの結果 (データ分析結果/ツールの出力/典型例など)
上記の分析・シミュレーションプロセス以外に期待する分析

その他

自由記述
入手したいデータ/ツール
可視化情報
サンプルデータ

コメントフォーム

captcha

利用規約はこちらからご確認下さい。