東京都_新型コロナウイルス陽性患者発表詳細

  • 作成日:2020年06月15日 最終更新日:2020年06月15日
  • コメントする
  • いいね
  • お気に入り

全体に公開

提出者情報

データジャケットの題名 東京都_新型コロナウイルス陽性患者発表詳細
データの所在・所有者 https://stopcovid19.metro.tokyo.lg.jp/data/130001_tokyo_covid19_patients.csv
データ収集方法やコスト Googleで「コロナ 感染者数 東京都」で検索して「東京都 新型コロナウイルス感染症対策サイト」の「新規患者に関する報告件数の推移」にアクセスし,そこにあった「オープンデータを入手」リンク先へアクセス.
データの共有について 一般的に共有してよい
データの共有について (その他を選ばれた方)

データの分析・シミュレーションについて

データの種類 テキスト 数値 時系列
データの変数(パラメーター)の変数名 No|全国地方公共団体コード|都道府県名|市区町村名|公表_年月日|曜日|発症_年月日|患者_居住地|患者_年代|患者_性別|患者_属性|患者_状態|患者_症状|患者_渡航歴の有無フラグ|備考|退院済フラグ
データの概要説明 東京都がオープンデータとして公開している,新型コロナウイルス陽性患者に関する属性データ.
想定しているデータの分析・シミュレーションプロセス 本データセットから日別の感染者数を集計し,その日別感染者数を目的変数とする. 感染者数に影響のある説明変数を探索し,説明変数のデータセットと日付をキーにして複数データセットをマージする. 今回は,時系列分析で柔軟かつ自由にモデリングできるとされる「状態空間モデル」を用いて,感染者数の予測を試みる. 将来の第2波,第3波,感染爆発への抑止策に寄与できるベイズ統計モデリングを試みる. ただ,説明変数をいかに探索するかが課題として挙げられる. まずは,濃厚接触,クラスター,感染経路不明者数など,感染と因果関係のありそうな要因に着目して説明変数を選択しようと思う.
想定しているデータの分析・シミュレーションプロセスの結果 (データ分析結果/ツールの出力/典型例など) 現時点では東京都におけるCOVID-19に関するデータが不足していたり,未知の要因もあると思われるため,感染者数予測モデルの精度を上げるのは困難に思われる. マルコフ連鎖モンテカルロ法(MCMC)を用いた乱数発生によって,複数パターンの感染者数の時系列グラフを出力し,それぞれの感染シナリオに沿った対策を提案できれば良いと思う.
上記の分析・シミュレーションプロセス以外に期待する分析 複雑ネットワークモデルでパラメータ操作による複数の感染シナリオ,未知の感染要因探索の導出に期待している.

その他

自由記述 本ページでデータジャケットの欄を入力していたら,状態空間モデルではパラメータ操作できずにシミュレーションができないのではという不安があったが,MCMCによる乱数発生と確率分布のパラメータ設定によって,ある程度シミュレーションができることに気付いた. メタ認知の体験につながり嬉しかった.
入手したいデータ/ツール 新型コロナウイルス関連データ.
可視化情報
サンプルデータ

コメントフォーム

captcha

利用規約はこちらからご確認下さい。