決定木学習器
- 作成日:2013年11月05日 最終更新日:2013年11月05日
- コメントする
- いいね
- お気に入り
全体に公開
提出者情報
データジャケットの題名 | 決定木学習器 |
---|---|
データの所在・所有者 | |
データ収集方法やコスト | |
データの共有について | その他 |
データの共有について (その他を選ばれた方) |
データの分析・シミュレーションについて
データの種類 | その他 |
---|---|
データの変数(パラメーター)の変数名 | 事例集合(各事例は独立変数の値のセットと、その事例に該当するクラスの対)|独立変数集合|取りうるクラス(出力)の集合 |
データの概要説明 | |
想定しているデータの分析・シミュレーションプロセス | エントロピーが最大となるクラス分けを、ツリーの各レベルで行ってゆく。 |
想定しているデータの分析・シミュレーションプロセスの結果 (データ分析結果/ツールの出力/典型例など) | 各事例に対する取りうる出力(クラス)の集合 入力変数と出力変数の関係(決定木そのもの) |
上記の分析・シミュレーションプロセス以外に期待する分析 | もともとは画像理解に使われていたがその後、様々な種類のデータに適用。 |
その他
自由記述 | 「出力」には、 a・データが持っている実世界モデルにおける結果変数 b・ツールが吐く出力結果 という二通りがあるという土曜日の議論からすると、他データとの結合という観点ではaを記入したくなるが、普通にツールの出力と言えばbということになる。 したがって、aについてはツールでもデータでも分けずに記入するようにしてはどうか。bはツールでは必要であるが、データの場合は期待する分析に記入するべきことではないかと思うので、そこで統合的に扱ってはどうか。 |
---|---|
入手したいデータ/ツール | ジャーナル論文を書く学生と、そうでない学生の履歴(履修内容等の)データ |
可視化情報 | |
サンプルデータ |
コメントフォーム