В медицинских сценариях все наоборот. Шансы обычно выражаются в виде коэффициента «за» – вероятности того, что событие произойдет, относительно вероятности того, что оно не произойдет, а поскольку мы обычно говорим о заболеваниях с уровнем распространения среди популяции ниже 50 %, первым обычно называется меньшее число.
Чтобы посмотреть, как вычислить медицинские шансы и желаемое соотношение шансов, рассмотрим гипотетическое исследование конкретного контролируемого случая о влиянии единственного варианта Е4 (как в моем профиле ДНК) на вероятность развития болезни Альцгеймера к 85 годам. Результаты представим в табл. 1. Шансы развития болезни Альцгеймера к 85 годам в случае с одной копией варианта Е4 в генотипе (как и у меня) представляют собой количество людей с болезнью (100), деленное на количество людей без болезни (335), то есть 100 к 335 или, в виде дроби, 100/335. По той же логике, с учетом данных из второй строки таблицы, шансы развития болезни к 85 годам у обладающих распространенным генотипом с двумя копиями варианта Е3 составляют 79 к 956, или 79/956. Таким образом, соотношение шансов – это сравнение шансов на развитие болезни у человека с заданным генотипом (например, одна копия варианта Е4 и одна копия варианта Е3) с шансами развития болезни у человека с наиболее распространенным генотипом (две копии варианта Е3). Для гипотетических показателей, приведенных в табл. 1, соотношение шансов составляет 100/335, деленное на 79/956, что дает 3,61. Крайне важно, что соотношение шансов не требует от нас знать уровень распространения болезни в популяции в целом, поэтому его можно легко вычислить на основе анализа конкретных случаев.
Табл. 1. Результаты гипотетического тематического исследования о влиянии варианта одной копии Е4 на развитие болезни Альцгеймера к 85 годам
Показатель соотношения шансов сам по себе не дает информации о значении относительного риска (вероятности получения заболевания для генотипа Е3/Е4 относительно вероятности получения заболевания для генотипа Е3/Е3), но, объединив его с общим популяционным риском заболевания и известными частотами генотипов [56], можно определить вероятность заболевания для данного генотипа. Этот расчет очень непрост. Более того, не существует даже однозначно определенного способа его сделать. Я попытался воспроизвести тот же показатель риска развития поздней болезни Альцгеймера, что обнаружил в присланном отчете, используя тот же метод, что и в 23andMe, и данные, взятые непосредственно из отчета или из документов, которые они цитировали [57]. (Если вам интересно, при расчете мне предстояло найти вероятность развития заболевания, решив систему из трех взаимосвязанных уравнений для трех неизвестных условных вероятностей при помощи нелинейной программы поиска решений – как раз в таких задачках я люблю покопаться в процессе своей повседневной работы). Я обнаружил небольшие, но потенциально очень значимые расхождения между моими результатами и результатами 23andMe. Мои расчеты подсказывали, что к выкладкам 23andMe стоит отнестись с некоторым скептицизмом.
Наткнувшись на исследование 2014 года, в котором сравнивались методы расчета рисков, применявшиеся в трех ведущих персональных геномных компаниях, включая 23andMe [58], я укрепился в своих сомнениях относительно точности их результатов. Авторы обнаружили, что разные подходы к оценке общепопуляционного риска, частот генотипов и разные формулы, используемые при расчетах, вкупе способствовали значительному расхождению итоговых значений прогнозируемых рисков у различных компаний. Когда прогнозируемые риски использовались для распределения людей в группы повышенного, пониженного или стандартного риска, расхождения становились еще более очевидными. Исследование показало, что по крайней мере две из трех компаний относили 65 % всех лиц, протестированных на рак простаты, к противоположным категориям риска (повышенной или пониженной). Почти в двух третях случаев одна компания могла сообщить человеку, что он здоров, в то время как другая компания информировала бы его, что у него повышенный риск развития рака простаты.
Оставляя в стороне возможность ошибки самих генетических тестов, я получил ответ на свой третий вопрос: несовершенство математического подхода к оценке риска, представляемой в индивидуальных отчетах о личном геноме, заставляет воспринимать эти отчеты с некоторым скепсисом.
Момент истины
Наборы для индивидуального анализа ДНК – далеко не единственные инструменты здравоохранения, оказавшиеся в нашем распоряжении. Сегодняшние телефонные приложения могут отслеживать частоту сердечных сокращений или оценивать аэробное состояние; домашние тесты обещают определить все что угодно, начиная от аллергии и артериального давления и заканчивая проблемами со щитовидной железой или даже ВИЧ-инфекции. Но задолго до появления дорогих индивидуальных ДНК-тестов и телефонных приложений, которые измеряют вашу концентрацию или следят за вашим прессом, появился самый дешевый, простой в подсчете и, безусловно, низкотехнологичный персональный диагностический инструмент: индекс массы тела (ИМТ). ИМТ рассчитывается путем деления своей массы в килограммах на квадрат роста в метрах.
Для учета и диагностики любой с ИМТ ниже 18,5 классифицируется как имеющий «недостаточный вес». В диапазон «нормального веса» входит ИМТ от 18,5 до 24,5, а «избыточного веса» – от 24,5 до 30. «Ожирение» определяется при ИМТ выше 30. Ожирение может быть причиной примерно 23 % смертей в США, хотя точно оценить его влияние сложно. Однако эта тенденция в несколько меньшей степени прослеживается по всему миру. В Европе ожирение как причина преждевременной смертности уступает только курению. Ожирение среди взрослых и детей растет почти в каждой стране, и за последние 30 лет его распространенность удвоилась. Людей, страдающих ожирением, предупреждают о риске таких угрожающих жизни заболеваний, как диабет II типа, инсульт, ишемическая болезнь сердца и некоторые виды рака, а также о повышенном шансе возникновения психологических проблем, таких как депрессия. Сегодня в мире больше людей умирает от избыточного веса, чем от недостатка в весе.
Учитывая последствия для здоровья, связанные с ожирением или даже избыточным весом, можно было бы предположить, что система измерения, используемая для диагностики этих состояний – ИМТ, – будет иметь мощную теоретическую и экспериментальную основу. К сожалению, это далеко от истины. ИМТ «изобрел» в 1835 году бельгиец Адольф Кетле, известный астроном, статистик, социолог и математик, но никак не врач [59]. На основе довольно шатких математических построений Кетле сделал вывод, что «вес взрослых людей разного роста приблизительно равен квадрату длины тела». Примечательно, однако, что Кетле вывел эту статистику из усредненных данных о населении в целом и не подразумевал, что соотношение будет верным для любого отдельно взятого человека. Он также не предполагал, что выведенное им соотношение, которое станет известным как «индекс Кетле», станет использоваться для определения избыточности или недостаточности