データの種類 |
テキスト
数値
時系列
表
|
データの変数(パラメーター)の変数名 |
各サービスの利用履歴|ポイントの活用状況|購買履歴|ユーザの会員情報 |
データの概要説明 |
8000万を超える楽天会員の属性、購入履歴、カード、ポイント、クーポンなどのプロファイルデータを一元的に集約し、分析するためのDWH(データウェアハウス)。ビッグデータであるWebログと会員情報を組み合わせたデータ分析が可能になる。Webログ系をHadoopとCassandraで構築した基盤に蓄積する。グローバルなEC市場で楽天経済圏を拡大することを目指す。 |
想定しているデータの分析・シミュレーションプロセス |
相関ルール、機械学習、分散処理、etc.(おそらく) |
想定しているデータの分析・シミュレーションプロセスの結果 (データ分析結果/ツールの出力/典型例など) |
ユーザーの行動を一定のロジックで分析すると、「ポイントをためるユーザー」「獲得したポイントをすぐに使うユーザー」「値引きに反応しないユーザー」などのさまざまなクラスタに分けられる。そして、このクラスタにはこのサービスが好まれるなどの傾向も見えてくる。 |
上記の分析・シミュレーションプロセス以外に期待する分析 |
web上での快適な(お買い物)体験をユーザに提供する。
web上の分析をきっかけに、webにとどまらず実世界で幸福な気持ちを維持できるための知見が得られる。 |
コメントフォーム