Login/
Member

Login
Member

テキストマイニングによる転職サイトの会員離脱予想のデータ

Last Update：June,11,2017　Created：June,11,2017
Comment
Like
Favorite

Public

Profile

Title of the dataset	テキストマイニングによる転職サイトの会員離脱予想のデータ
Provenance of the dataset	東京理科大学理工学部経営工学科
How were the data collected/created? What was the cost?	転職サイトの登録者の登録情報と職務報告書から収集
Data sharing policy	Other
Data sharing policy

About data analysis and simulation

Type of data: Check all that apply. Use "Other" to specify other types so that we can include them in further updates.	text number
Variable labels of dataset (the names of the variables)	脱離ルール\|数値データ\|職務履歴書\|分かち書きされたデータ\|離脱する会員と応募する会員の違いルール\|コーパス\|文書行列\|文書ベクトル\|単語データ\|重要度\|登録情報\|決定木
Outline of data	転職サイトの登録者の登録情報と職務報告書からテキストマイニングを用いて、転職サイトを離脱する登録者の傾向が出ている特徴量を抽出したデータ。
Simulation process	職務履歴書からコーパスを作成。コーパスから分かち書きされたデータを作成。分かち書きされたデータから単語を抽出。抽出された単語から文書ベクトルを作成。文書ベクトルを組み合わせて文書行列を作成。文書行列から頻出頻度の高いまたは低い単語の成分を削除。出来上がった行列をランダムフォレストを用いて重要度を算出。算出された重要度を決定木分析にかけて決定木を作成。決定木からサイトの離脱ルールを推定。またサイトの登録者情報を数値データ化し、先ほどの文書ベクトルと数値データから重要度を算出。重要度を決定木分析にかけて決定木を作成。決定木から、離脱する会員と応募する会員の違いルールを推定。
Expected outcome of the process (obtained knowledge, analysis results, output of tools)	離脱する会員のルール、離脱する会員と応募する会員の違いのルール
Anticipation for analyses/simulations other than the typical ones provided above

Other

Comments	こちらが専門的な知識を持っているという前提で書かれた論文だったので、まず研究の仕組みを理解することが難しく、それに伴い変数同士の関係性を明白にすることが難しかった。
What kind of data/tools do you wish to have?
Visualized information
Sample data

Latest DJs

日照量と株価の相関性の検証

February,13,2022

気候変動から影響を受ける可能性の高い銘柄の検知

February,13,2022

nbaにおける各地点でのシュート軌道と成功率の関係

January,14,2022

SNSでのデマの拡散に関するデータ

January,12,2022

国民幸福度データ

January,12,2022

Comment form コメントをキャンセル

関連するトピック

関連するトピックはありません。

このDJのトピックを投稿