テキストマイニングによる転職サイトの会員離脱予想のデータ

  • Last Update:June,11,2017 Created:June,11,2017
  • Comment
  • Like
  • Favorite

Public

Profile

Title of the dataset テキストマイニングによる転職サイトの会員離脱予想のデータ
Provenance of the dataset 東京理科大学理工学部経営工学科
How were the data collected/created? What was the cost? 転職サイトの登録者の登録情報と職務報告書から収集
Data sharing policy Other
Data sharing policy

About data analysis and simulation

Type of data: Check all that apply. Use "Other" to specify other types so that we can include them in further updates. text number
Variable labels of dataset (the names of the variables) 脱離ルール|数値データ|職務履歴書|分かち書きされたデータ|離脱する会員と応募する会員の違いルール|コーパス|文書行列|文書ベクトル|単語データ|重要度|登録情報|決定木
Outline of data 転職サイトの登録者の登録情報と職務報告書からテキストマイニングを用いて、転職サイトを離脱する登録者の傾向が出ている特徴量を抽出したデータ。
Simulation process 職務履歴書からコーパスを作成。コーパスから分かち書きされたデータを作成。分かち書きされたデータから単語を抽出。抽出された単語から文書ベクトルを作成。文書ベクトルを組み合わせて文書行列を作成。文書行列から頻出頻度の高いまたは低い単語の成分を削除。出来上がった行列をランダムフォレストを用いて重要度を算出。算出された重要度を決定木分析にかけて決定木を作成。決定木からサイトの離脱ルールを推定。またサイトの登録者情報を数値データ化し、先ほどの文書ベクトルと数値データから重要度を算出。重要度を決定木分析にかけて決定木を作成。決定木から、離脱する会員と応募する会員の違いルールを推定。
Expected outcome of the process (obtained knowledge, analysis results, output of tools) 離脱する会員のルール、離脱する会員と応募する会員の違いのルール
Anticipation for analyses/simulations other than the typical ones provided above

Other

Comments こちらが専門的な知識を持っているという前提で書かれた論文だったので、まず研究の仕組みを理解することが難しく、それに伴い変数同士の関係性を明白にすることが難しかった。
What kind of data/tools do you wish to have?
Visualized information
Sample data

Comment form

captcha

Please check the terms of use here.

関連するトピック

関連するトピックはありません。