Type of data: Check all that apply. Use "Other" to specify other types so that we can include them in further updates. |
text
number
|
Variable labels of dataset (the names of the variables) |
脱離ルール|数値データ|職務履歴書|分かち書きされたデータ|離脱する会員と応募する会員の違いルール|コーパス|文書行列|文書ベクトル|単語データ|重要度|登録情報|決定木 |
Outline of data |
転職サイトの登録者の登録情報と職務報告書からテキストマイニングを用いて、転職サイトを離脱する登録者の傾向が出ている特徴量を抽出したデータ。 |
Simulation process |
職務履歴書からコーパスを作成。コーパスから分かち書きされたデータを作成。分かち書きされたデータから単語を抽出。抽出された単語から文書ベクトルを作成。文書ベクトルを組み合わせて文書行列を作成。文書行列から頻出頻度の高いまたは低い単語の成分を削除。出来上がった行列をランダムフォレストを用いて重要度を算出。算出された重要度を決定木分析にかけて決定木を作成。決定木からサイトの離脱ルールを推定。またサイトの登録者情報を数値データ化し、先ほどの文書ベクトルと数値データから重要度を算出。重要度を決定木分析にかけて決定木を作成。決定木から、離脱する会員と応募する会員の違いルールを推定。 |
Expected outcome of the process (obtained knowledge, analysis results, output of tools) |
離脱する会員のルール、離脱する会員と応募する会員の違いのルール |
Anticipation for analyses/simulations other than the typical ones provided above |
|
Comment form