Новый коронавирус: безобидный патоген или страшный убийца?

Новости об эпидемии новости коронавируса захлестнули СМИ, но, в принципе, по заверениям экспертов бояться особо нечего — летальность в районе 3%. Что довольно странно, на мой взгляд. Давайте попробуем разобраться.

На текущий момент (2020–01–28) статистика такая: 4599 инфицированных, 106 смертей и 69 выздоровевших [источник]. Большинство экспертов ничтоже сумняшеся делят 106 на 4599 и получают примерно 2.3%-ную летальность, что, конечно же, очень успокаивает.

Но, на самом деле, такой метод нельзя применять, по крайней мере, в начале эпидемии! И вот почему: количество диагностированных увеличивается по экспоненте. Рассмотрим пример, который поможет лучше понять проблему:

пусть некая болезнь убивает ровно за 1 месяц с вероятностью 1. Пусть также количество заболевших удваивается каждые 10 дней. Допустим, в первый месяц умерло х человек. Но заболевших, которые еще не умерли, в 7 раз больше! Просто потому, что за месяц произойдет три удвоения исходной популяции больных (а это увеличение в 8 раз). Поэтому метод, когда делят количество умерших на количество диагностированных оценит летальность всего лишь в x / (x + 7x) = 1/8 = 12.5%!

А на самом деле, по условию задачи летальность стопроцентная!

Пусть пример и искусственный, но он абсолютно справедлив для реальной жизни (подумайте почему). А каков же тогда правильный метод? Более корректный (но не идеальный) метод состоит в том, чтобы посчитать летальность на основе уже известных исходов. Для коронавируса мы знаем, что умерло 106, а выздоровело 69. Значит всего, было 106 + 69, а смертность равна 106 / (106 + 69) = 0.606. Почти шестьдесят один процент, Карл!

Конечно, данный метод склонен к завышению, потому что в начале умирают как правило старики, больные со слабым иммунитетом или те, у кого по несчастливой случайности оказалась тяжелая форма заболевания. Плюс, время от начала заболевания до смерти может быть короче чем до выздоровления. Со временем, когда будет больше данных (в том числе по молодым людям), оценка летальности должна уменьшиться и стабилизироваться, вот только я сомневаюсь, что стабилизируется она на 2–3%…

Скептики, конечно, скажут, что это все умозрительные заключения, автор не эпидемиолог и вообще. Но давайте обратимся к истории и вспомним эпидемию SARS:

In the early stages of the SARS epidemic, health officials estimated the mortality rate at less than 4%. More recently, officials have cited rates in the 6% to 7% range. Today’s SARS figures from the WHO — 6,903 cumulative cases and 495 deaths — point to a case-fatality ratio of 7.2%. But WHO officials note that this calculation underestimates the rate, since some currently ill patients will die of the disease.

Цитата выше говорит нам о том, что вначале летальность от SARS оценивалась довольно оптимистично (менее 4%), однако затем она начинает расти. Такая оптимистичная оценка в начале эпидемии связана именно с некорректным методом, который мы обсуждали!

Более того, специалисты ВОЗ применили и корректный метод:

One method the WHO used was to calculate the case-fatality ratio using only the cases whose final outcome was known. With this method, ratios ranged from 11% to 17% for Hong Kong, 13% to 15% for Singapore, 15% to 19% for Canada, and 5% to 13% for China. But since the outbreak is continuing, this method “gives an overestimate because the average time from illness onset to death for SARS is shorter than the average time from illness onset to recovery,” officials said.

Этот метод давал, в среднем, 15%-ную летальность. Но специалисты ВОЗ считают, что этот метод сильно завышает летальность. А каковы же реальные цифры?

“On the basis of more detailed and complete data, and more reliable methods, WHO now estimates that the case fatality ratio of SARS ranges from 0% to 50%, depending on the age group affected, with an overall estimate of case fatality of 14% to 15%,” the agency’s announcement said.

Википедия говорит про 9.6%-ную смертность. В любом случае, пессимистичная оценка оказалась ближе к реальности (точнее, ближе всего оказалось среднее из двух :) ). Но, понятное дело, пессимистичную оценку никто не любит ибо она порождает панику. Кстати, брать среднее из двух смещенных оценок имеет смысл: поскольку смещения разных знаков, то они друг-друга или уничтожат, или хотя бы уменьшат, если мы их сложим и поделим пополам.

Подытоживая, летальность по разным оценкам составляет от 2.3% до 61%, в среднем — 31.65%. Такие дела. Не болейте.

UPDATE: нашел статью, которая полностью подтверждает легитимность моих выкладок:

На графике снизу прекрасно видно как наивный метод (число умерших делить на число диагностированных), обозначенный на графике ромбиками, систематически занижает летальность в самом начале:

А вот еще одна работа, которая показывает то же самое: наивный метод (кол-во умерших делить на кол-во диагностированных) приводит к драматическому занижению летальности! См. график ниже:

А здесь получили, что недооценка наивного эстиматора составляет 24%, в то время как переоценка консервативного эстиматора составляет всего 5%.

А в статье “Potential Biases in Estimating Absolute and Relative Case-Fatality Risks during Outbreaks” авторы озвучивают мои мысли практически теми же словами:

Simple division of the number of deaths reported by week w (green), by the number of cases reported by week w (blue) will underestimate the CFR because the numerator does not include all those cases in the denominator who will eventually die. With a reporting delay of 3 weeks for deaths compared to cases, the reported deaths curve will be shifted 3 weeks to the right, relative to the curve of the total number of cases reported by week w who will die (red). If the epidemic doubling time is 2 weeks, as shown here, the underestimate of CFR will be by a factor of about 2^3/2 ≈ 2.8, with the exponent being the number of epidemic doubling times that pass between case reporting and death reporting. In reality, there will be a distribution of reporting delays rather than a fixed delay, making this a heuristic rather than exact approach. The problem is ameliorated in an epidemic that grows more slowly or less than exponentially.

Работал в НИИ Антимикробной химиотерапии. Сейчас инженер систем машинного обучения. Ученый-биогеронтолог, специализирующийся на биостатистике и анализе данных

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store