データの種類 |
テキスト
数値
時系列
|
データの変数(パラメーター)の変数名 |
No|全国地方公共団体コード|都道府県名|市区町村名|公表_年月日|曜日|発症_年月日|患者_居住地|患者_年代|患者_性別|患者_属性|患者_状態|患者_症状|患者_渡航歴の有無フラグ|備考|退院済フラグ |
データの概要説明 |
東京都がオープンデータとして公開している,新型コロナウイルス陽性患者に関する属性データ. |
想定しているデータの分析・シミュレーションプロセス |
本データセットから日別の感染者数を集計し,その日別感染者数を目的変数とする.
感染者数に影響のある説明変数を探索し,説明変数のデータセットと日付をキーにして複数データセットをマージする.
今回は,時系列分析で柔軟かつ自由にモデリングできるとされる「状態空間モデル」を用いて,感染者数の予測を試みる.
将来の第2波,第3波,感染爆発への抑止策に寄与できるベイズ統計モデリングを試みる.
ただ,説明変数をいかに探索するかが課題として挙げられる.
まずは,濃厚接触,クラスター,感染経路不明者数など,感染と因果関係のありそうな要因に着目して説明変数を選択しようと思う. |
想定しているデータの分析・シミュレーションプロセスの結果 (データ分析結果/ツールの出力/典型例など) |
現時点では東京都におけるCOVID-19に関するデータが不足していたり,未知の要因もあると思われるため,感染者数予測モデルの精度を上げるのは困難に思われる.
マルコフ連鎖モンテカルロ法(MCMC)を用いた乱数発生によって,複数パターンの感染者数の時系列グラフを出力し,それぞれの感染シナリオに沿った対策を提案できれば良いと思う. |
上記の分析・シミュレーションプロセス以外に期待する分析 |
複雑ネットワークモデルでパラメータ操作による複数の感染シナリオ,未知の感染要因探索の導出に期待している. |
コメントフォーム