Showing posts with label Data Analysis. Show all posts
Showing posts with label Data Analysis. Show all posts

Monday, April 13, 2020

SEIR モデルで潜伏期間を考慮して計算すると接触率を80%減らすのが必須という結果になる

数日前の計算では、疫学の計算モデルでも最もシンプルな SIR モデル (Susceptible-Infectious-Recovered) を使って計算しました。そのときの主な結果としては、

  1. 今すぐ (4/7の時点) で接触率を 80% 減らすと、陽性患者数を東京都の場合 10,000 人台くらいに抑えられる。
  2. 接触率を 20% 程度減らすだけでは、陽性患者数のピークが先延ばしになるだけで、ピークは 200 万人近くになり解決にならない。
  3. 何も対策をとらないと、300 万人近くが感染する。→ 1 と 3 で 2桁の違う。


COVID-19 は、潜伏期間が長いという特徴があります。WHO によると、潜伏期間 (incubation period) は 1-14 日にわたり、典型的には 5 日としています。
https://www.who.int/news-room/q-a-detail/q-a-coronaviruses

発病しても無症状な人も結構な割合でいるらしく、知らず知らずのうちに感染を広めてしまうパターンもあります。それゆえ、陰性/陽性の検査が早く正しくできるようになるのが、この状況改善の重要なハードルの一つだと思います。少なくとも陽性とわかれば、即座に自己隔離ができる。


SEIR モデル

潜伏期間を含めた計算モデルがあり、SEIR (Susceptible-Exposed-Infectious-Recovered) モデルというのがあります。

計算とグラフに関する備考:

  • 潜伏期間 5 日という要素を加えて計算
  • β (疫病の拡散割合) を調整し直し。
  • γ (回復率、回復期間14日の逆数とした) は同じままにしています。
  • グラフは縦軸を対数表示。
  • 4月初旬の接触率のレベルから OO% 減らしたかにより色分け。
  • 黒い点は、東京都保健局の実測値である。
  • 線は陽性患者数を示していて、回復した人は含まない。東京都のデータは「退院済み」を回復者としてカウント。
縦軸を対数表示にしたので、いろいろなシナリオを一つのグラフで見える様になりました。グラフの上の限界が、10,000,000 人 (10の7乗)、下の限界が 1 人 (10の1乗) という単位です。

グラフからわかる特徴としては:

  1. 接触率を 80% に減らして、やっと陽性患者数が減少する (理由は後述)。
  2. 接触率を 80% 以上にすると、患者数のピークが 8,000 弱で 5 月ごろにやってくる。ただ、アメリカの傾向では SIP 実施後からピークに達するまでに 4週間は経っているので、実際のピークは早くて 5 月の GW 明けくらいではないだろうか? 
  3. 接触率をちょっと減らすだけ (20 - 60%) では、ピークが先延ばしになるだけで、100 万人単位の陽性感染者数を出すことになる。
  4. 接触率を 80% 以上に減らすと、陽性患者数の数が 2 桁は減る。つまり、何もしないときに 100 万人単位なのが、1 万人単位に減る。
  5. 黒い点(東京都の実測値)の傾きが、2 月は急で、3月に変わる頃に一時緩やかになり、3月末からまた急に、加速しているような傾向が見える。


前回の SIR モデルにくらべて、潜伏期間という要素が加わったため、接触率の軽減が 80% でもかなり減少に時間がかかるようになりました。

言い換えると、感染拡大を収束させるには、全人口に占める免疫保持者の割合を高くする必要があります。いま、ワクチンで免疫をつけるのは無理なので、自宅待機などで人と人との接触を減らすしか有効な策がありません。

いま、EU や US などを中心に、「陽性患者数の数はピークに達した/達しつつあり、減少に転じるのが見えてきたが、どうやってロックダウンを解除、緩和するか」が議題になっています。完全に解除すると、3 月中旬の時点に逆戻りするだけで、この数週間の苦労が水の泡になります。どういうプランになるのかとても気になるところです。


ちなみに、こちらは↑の対数表示したものを、通常の線形スケールで表示したものです。あくまでも計算ですが、80%減でもかなり時間がかかる。武漢 (Wuhan) の場合は、紫の100%減に近い方策を取ったのだと理解しています。

このウィルス、感染はしやすく、逆に減少しにくいという特徴があるっぽいのも厄介すぎる。

日本全体の場合

WHO から各国の COVID-19 の統計をダウンロードできます。陽性の確認者数、回復者数、死者数で別けられています。

こちらも同じく対数表示しました。
対数表示にすると、2 月、 3 月ごろの増加の傾向がわかりやすくなり、増加のスピードが遅くなっている期間があります。外出自粛ムードに効果があったのかなぁと思います。


接触率 80% 必須という計算結果になる理由

疫学における感染症の基本再生産数 R0 (basic reproduction number) という数字があります。1 人の感染者が、他の何人に感染させるかを表す数字です。インフルエンザは 2-3 とされ、1 人の感染者から 2-3 人へ感染させてしまうことを意味します。

R0 がわかると、人口の何%が免疫を持っていると、集団免疫 (herd immunity) の状態になり、感染症流行が収束に向かうかを計算できます。この「人口の何%が免疫を持っていると」は、臨界免疫保持率 (?), Pc (the critical proportion of the immune population) というのは、次の式で計算できます。

Pc = 1 - 1 /R0

また、R0 は、R0 = β × γ で計算されます。βは疫病の感染率、γは疫病の回復率です。

COVID-19 の場合、平均 14 日間が回復期間とあるので、γ = 1 / 14 = 0.071 と固定して計算しています。

これまでの数値計算の結果は次の表になります。

 R0βγ  p_c
 東京  (SEIR モデルの場合) 3.68 0.263 1 / 14   (0.071) 73%
 東京 (SIR モデルの場合)       2.35  0.168 1 / 14   (0.071) 57%
 日本 (SEIR モデル) 3.78 0.270  1 / 14   (0.071) 74 %


今回再計算した東京都の SEIR モデルの場合は、β が大きくなるために R0 が前回の計算よりも上昇し、結果として Pc が 57% から 73% へ上昇しました。

つまり、p_c が意味するのは、全人口の 73% に免疫がつくと、感染者が増えもせず、減りもせずという平衡状態になります。R0 の値が大きいほど、流行を抑制するのが難しくなるとも言えます。上のグラフで、「80%減にした場合」の減少が遅くなったのは、Pc = 73% という結果になったため、効果が薄れたのが理由です。(Pc = 73% でグラフを描くと、線が真横に伸びます。)

Pc を減らすには、R0 を小さくする必要があります。R0 は、R0 = β × γ で計算できます。

つまり、感染を抑えるには、βとγを小さくすればよいのですが、方法としては次の様になります。
  • βを減らす方法: 新たな感染を伝搬を減らす:
    • (1) 自宅待機して人との接触を減らす。
    • (2) ワクチンを摂取する。
    • (3) 防護服を着る。
  • γを減らす方法: γは回復日数に関係するので、
    • (1) 感染者の特定を早く行う。
    • (2) 効果的な治療方法を (発見し) 施して早く治す。

繰り返しになりますが、COVID-19 に対するワクチンはないため、自宅待機をするしか数を減らす方法がありません。

ただ、それでは経済がストップして長期的には基本的生活の維持も難しくなるのは明らかなので、陽性検査を素早く正確に行えるようになること、有効な治療方法を見つけることも同時に必要です。

接触率を80%減らすのが必須というのは、Pc (the critical proportion of the immune population) = 73% となるため、それよりも大きい数にする必要があるためです。それが 80% は必要だというのが専門家らの見解と思います。

ただ、今は免疫をつけられるのは回復者 (回復しても再度陽性になるケースも多数報告があり未確定) だけなので数が全く足らず、自宅待機という方法で免疫保持状態を擬似的に作ろうとしているのだと理解しています。そのためには外出を減らして、人と人の接触率を80%減らすことが日本全国規模で急務になってきているのかもと、WHO のデータからも感じました。



参考



Wednesday, April 8, 2020

日本の非常事態宣言後の徹底的な接触減少が必要であると思う計算結果について



「欧米に近い外出制限を」 北大教授、感染者試算で提言


4月3日にこの日経新聞の記事をみて、やっぱり social distancing 大事だなぁ、と思いました。が、この図をよく見返すと、日経新聞が専門家のデータをちゃんと可視化できなかった為か、図的におかしい。接触を減らす対策を開始しても、突然数が真下に下降することは物理的にありえん。車が急に止まれないのと同じく、しかも長い潜伏期間をもつウィルス感染の場合、惰性でしばらくは増加してしまう。もっとなだらかに微分可能な連続的な曲線を描くはず。東京都は 1月24日ごろから計測が始まっていますが、4月6日の時点で 73 日が経過しており、そこまで急激に増加してないかと。

けど図が定性的に主張することは全く正しいので、記事で言われているように、現状から 80% くらいの思い切った接触減は必須。


SIR モデル

計算疫学(?)(Compartmental models in epidemiology) にある SIR モデルで、東京都の陽性患者数の推移を数値計算をしてみました (潜伏期間含まない) 。

今すぐに接触を減らす対策を実行始めても、しばらくは感染者数は増え、次第に減ってくる様子がうかがえます。

モデルからわかるのは、感染者を減らすには: 

(i) 感染拡大を減らす(他人にうつさない、キャリーしない)、

または/および、

(ii) 有効な治療手段を発見することです。

また、数値からだけで言うことですが、自宅待機などの対策も何もせず、感染者を数百万の規模まで放置、免疫が自然とつ集団免疫態となり、いずれ自然に収束します。が、あまりにも犠牲者の数が多く、地獄絵図になるので絶対に避けなければならない。

今現在でワクチンで予防とか、有効な治療方法がまだ発見されてない中、確実に有効なのは (i)しか対策がありません。

(i) については、今後 PCR 検査の利用が拡大すれば、症状が現れる前に自主的に隔離ができるなど、拡大を抑えることに繋がるはずです。


実際の陽性患者数については、東京都のデータが入手しやすいので、引き続き東京都の場合で計算しています。

[データソース]


この数値計算は、

(i) 感染率が今時点の水準の 80% 減になったら、
(ii)感染率が今時点の水準のわずかに 20% 減になったら、
(iii)感染率が今時点の水準から変わらなければ、


という条件で行いました。いまからでも遅くないので徹底的にトップダウンで断行すれば、確かに GW 明けくらいに減少に転じて、桁違いに救える生命が増えるはずです。


[参考] Compartmental models in epidemiology
https://en.wikipedia.org/wiki/Compartmental_models_in_epidemiology

[注意] SIRモデルでの感染率 β は定数となっていますが、ここでは β は S, I, R に依存しない関数 (independent) で、単に time-dependent として、4月中頃から徐々に感染率が、4月7日の水準の OO% に変わるように sigmoid 関数でモデル化しました。もっと厳密に計算するのであれば、モデルの導出し直しと、潜伏期間も考慮する必要があります。


計算結果

(i) 感染率が今時点の水準の80%減になったら、数のピークが今年5月7日に 10,448 人。ちなみに 60 - 70% 減くらいでも、(ii) や (iii) よりも 2 桁少なく、5月中旬のピーク時に 1 万人台でおさまっていました。




(ii) 感染率が今時点の水準の20%減になったら、数のピークが今年8月13日に約 185 万人。
つまり、20%減などのちょっとだけの減少だと、ピークが先延ばしになるだけで、(病院などの容量を簡単にオーバーし) 意味がない



(iii) 今時点の水準と変わらなければ、数のピークが今年7月15日に約 295 万人。これは幸いにももう起こらないと思われるシナリオですが、首相が非常事態宣言も出さず何も変えなければ、相当な数になっていたこともありえます。



ただ、4月9日の記事だとまだまだ実は不安ではあります。数日が対応が遅れたり、他人事と思っていると New York やイタリア北部のような惨事になりかねない。




3月中頃のアメリカのホワイトハウスの発表では、「100 万 - 200 万人の命を救った」と耳にしました。

当時は「(この人、またいつものように) 何を大袈裟なことを言ってんだか、0 の桁を間違えてんじゃないか。」と馬鹿にしていましたが、マジでそれは的を得ていて真実だった。


アメリカもあのまま Shelter-In-Place (SIP, 自宅待機令) を早期に実行していなければ、今よりももっと酷い状況だったのは間違いなく、感染者も2 桁は増えていたかもしれません。




Sunday, April 5, 2020

東京都発表の新型コロナウイルス陽性患者数について (2020年4月5日時点)

ニュースで見れる情報でしか日本の様子はわからないのですが、直ちに国家が具体的かつ徹底的に措置を断行しないと、とんでもない状況になりかねないと思った。

「東京都 新型コロナウイルス陽性患者発表詳細」
https://catalog.data.metro.tokyo.lg.jp/d…/t000010d0000000068
に東京都福祉保健局が公開しているデータがあり、こちら↓にもダッシュボードがありますが、東京都での陽性患者数 "Number of Confirmed" (Total を選ぶ) が明らかな指数関数を描いている。
https://stopcovid19.metro.tokyo.lg.jp/en


一般市民としては、Shelter-In-Place を徹底し、外出しないというのが最大の社会に対する貢献。他人から移るかもしれないというよりも、既に自身が罹患しているかもと仮定して他人に移したら迷惑千万であるという視点に立つべき。

COVID-19 のタチが悪いのは、潜伏期間が長く、自覚症状がない時点でも、次々に罹患させてしまう可能性が高いこと。さらに感染率も高く、インフルエンザよりも破壊力も高いことだ。金属の表面だと 72 時間程度ウィルスが生きるとも言われ、頻繁に複数の人が触るドアノブを触るとか、でも移ることが充分ありえる。

伝染病や疫病学は専門ではないので、発表されている数字を単純な数値モデル化しただけの予測になります(疫病学などの要素については全く加味していません)。東京都で 1 月 24 日の陽性患者の発生から 4 月 5 日までの実測値でいうと、毎日平均で 13.9% の増加をしており、ここから 1 日に増える陽性患者数が増えるのが明らか。

ニューヨークの例をみていると、増加割合はもっと速くなることもありえる。

まずはこちらが、東京都福祉保健局のデータ (赤点) と、それを指数関数でフィッティングしたもの (緑)。3 月 20 日くらいから増え方が加速しています。


指数関数が怖いのは、初期の部分は穏やかな直線的に増えてるように見えてしまい、「今日はOO人増えました」と聞いても、昨日や先週とたいして変わらへんやん、という感じてしまえるところです。

一旦ホッケースティックのように「J」型に姿を変え始めた時が心配です。すでに J 型になっているし。

この指数関数のモデルを更に延長して、5 月 10 日まで伸ばしたものがこちら。青い点線が予測値となります。


4 月 4 日までのデータでは、1日辺りの増加率が 13.6 % でしたが、4 月 5 日のデータを含めてモデル化すると、13.9% に増えました。わずか 0.3% の違いですが、それでもゴールデンウィーク明けの 5 月 6 日には、陽性患者数が 4.5 万人が 5.7万人に増える程の違いとして現れます。


直ちに、(i) ソーシャルディスタンシングの徹底 (国際単位系では 2m が妥当、ゴルファーなら 2 ヤード)、(ii) 買い物や個人での運動以外での外出の禁止、(iii) 記者会見は全てオンライン、などなどを国家や自治体が「お願いしたい」ではなく、生命を守るという観点から罰則も含め徹底的に実行する必要があるのではないか。

14 日間の潜伏期間という長ーーい時間遅れ要素があり、フィードバックが全く効果がない超スーパー不安定システムなのも明らかである。

事が発生するまでに未然に対策をとるフィードフォワード的な具体的な施策と実行が、国家レベルに早急に求められている気がした。


モデルについて

t = 日付, n = 類型の陽性患者数として、n = a * b^t としたすごく単純な指数関数モデルを 1/24/20 - 4/4/20 の区間でフィットした。

4 月 5 日までのデータで得られた最適解は:

a = 0.086
b = 1.139

つまり、1 日で前日の 13.9% 増加し、約 5.2 日で倍になる。今の時点で 1,000 人を超えたところなので、4月10日には倍の 2,000 人に到達するくらいの増加速度である。