Sentiment scale datasets of Movie Review Data

  • 作成日:2015年11月24日 最終更新日:2015年11月24日
  • コメントする
  • いいね
  • お気に入り

全体に公開

提出者情報

データジャケットの題名 Sentiment scale datasets of Movie Review Data
データの所在・所有者 http://www.cs.cornell.edu/people/pabo/movie-review-data/
データ収集方法やコスト Authors automatically tokenized and applied pattern matching technique to remove explicit rating indications from the reviews. Subjective sentences were automatically identified using the system described in their 2004 ACL paper (http://www.cs.cornell.edu/home/llee/papers/cutsent.home.html).
データの共有について その他
データの共有について (その他を選ばれた方)

データの分析・シミュレーションについて

データの種類 テキスト 数値
データの変数(パラメーター)の変数名 AUTHOR NAME|THREE CLASS|NORMALIZED NUMERICAL RATING|FOUR CLASS|REVIEW TEXT(DOCUMENT)|CLASS LABELS|ID OF THE SOURCE HTML FILE|NUMERICAL RATING
データの概要説明 This data is distributed as movie-review data for use in sentiment-analysis experiments, which includes a collection of documents whose labels come from a rating scale. Introduced in Pang/Lee ACL 2005 (Released July 2005). There are two files, roughly corresponding to (1) the reviews after pre-processing, including subjectivity extraction (i.e., the data we used in our experiments) and (2) the reviews after very light pre-processing. Available are collections of movie-review documents labeled with respect to their overall sentiment polarity (positive or negative) or subjective rating (e.g., two and a half stars) and sentences labeled with respect to their subjectivity status (subjective or objective) or polarity.
想定しているデータの分析・シミュレーションプロセス sentiment classification/summarization/sentiment categorization/sentiment polarity/rating evaluation
想定しているデータの分析・シミュレーションプロセスの結果 (データ分析結果/ツールの出力/典型例など) polarity of reviews/summarized reviews/clusters/categories
上記の分析・シミュレーションプロセス以外に期待する分析

その他

自由記述 Bo Pang, Lillian Lee, and Shivakumar Vaithyanathan, Thumbs up? Sentiment Classification using Machine Learning Techniques, Proceedings of EMNLP 2002. Bo Pang and Lillian Lee, A Sentimental Education: Sentiment Analysis Using Subjectivity Summarization Based on Minimum Cuts, Proceedings of ACL 2004. Bo Pang and Lillian Lee, Seeing stars: Exploiting class relationships for sentiment categorization with respect to rating scales, Proceedings of ACL 2005.
入手したいデータ/ツール
可視化情報
サンプルデータ

コメントフォーム

captcha

利用規約はこちらからご確認下さい。