Vector representations of sentences

  • 作成日:2017年10月31日 最終更新日:2017年10月31日
  • コメントする
  • いいね
  • お気に入り

全体に公開

提出者情報

データジャケットの題名 Vector representations of sentences
データの所在・所有者 Refining Raw Sentence Representations for Textual Entailment Recognition via Attention
データ収集方法やコスト The data was created by training and end-to-end Neural Network Classifier capable of taking a pair of sentences from the MultiNLI dataset as input and predicting whether the pair belonged to one of three categories. It is difficult to estimate the cost, but learning about the theory behind the implementation and implementing the code took around 700 man-hours.
データの共有について その他
データの共有について (その他を選ばれた方)

データの分析・シミュレーションについて

データの種類 テキスト 数値
データの変数(パラメーター)の変数名 SENTENCE_TYPE|REPRESENTATION_VECTOR|SENTENCE_PAIR_ID
データの概要説明 This data includes 300-dimensional sentence representations of the validation set pertaining to the MultiNLI dataset, first published in the RepEval 2017 shared task of the EMNLP 2017 conference.
想定しているデータの分析・シミュレーションプロセス Similarity analysis using cosine distance
想定しているデータの分析・シミュレーションプロセスの結果 (データ分析結果/ツールの出力/典型例など) Understand how well the semantics and syntactics of each sentence are encoded in the 300-dimensional space. See the shared task recap paper: https://arxiv.org/pdf/1707.08172.pdf
上記の分析・シミュレーションプロセス以外に期待する分析

その他

自由記述
入手したいデータ/ツール
可視化情報
サンプルデータ

コメントフォーム

captcha

利用規約はこちらからご確認下さい。

関連するトピック

関連するトピックはありません。