Теория теорий: Пособие для молодого ученого
Б.Н. Волгин
Новые времена
Новая история научных наименований началась методом перекрестного опыления.
Перекрёстное опыление ения у растений, при котором пыльца от андроцея одного цветка переносится на рыльце пестика другого цветка другого растения этого же вида.
Дифференциация
Дифференциация — процесс объединения частей в целое.
и интеграция
Интеграция — разделение, разведение процессов или явлений на составляющие части.
наук дала для этого широкие возможности. Если вначале создавали новые ветви на стыке родственных наук, типа физическая химия
Физхимия — раздел химии, наука об общих законах строения, структуры и превращения химических веществ.
или химическая физика,
Химическая физика Химическая физика — наука о физических законах, управляющих строением и превращением химических веществ.
то затем уже стали сочетаться любые две науки, первыми пришедшими на ум ученому после завтрака.
Завтрак — первый дневной приём пищи, как правило — в период от рассвета до полудня.
Этот метод встречается до сих пор, обладая особой пробивной силой в экстравагантных сочетаниях типа социальная кибернетика
Социальная кибернетика — независимый раздел в социологии, основанный на общей теории систем и кибернетике.
или философия надежности.
После того как двойные стыки научных дисциплин оказались исчерпанными и общественность замерла, ожидая бурного развития на тройных и более стыках, соображения практического удобства потребовали сокращенного составного наименования научных теорий.
Модификация метода перекрестного опыления: берутся два любых существительных из словаря Ожегова
Словарь русского языка — нормативный толковый словарь общеупотребительной лексики. 
и осуществляется их научная стыковка после превращения одного из них в прилагательное.
К примеру, из названия журнала Семья и школа можно создать как минимум две теории: семейная школа и школьная семья. Аналогично стыкуются, с добавлением слова теория в сомнительных случаях: теория труктурной лингвистики
Структурная лингвистика — совокупность представлений о языке и методов его исследования, языковедческая дисциплина.
или теория лингвистических структур, теория кинематических цепей
Кинематическая цепь — это связанная система объектов, образующих между собой кинематические пары.
<[/expand] или теория цепной кинематики, теория пространственных графов или теория графических пространств.
Загадочность содержания — через упрощение названия
Название научной теории должно быть слегка загадочным, намекая непосвященным на особую сложность и невыразимость ее содержания. Особенно эффективно это достигается путем упрощения названия, когда автор попутно предстает как человек с высокой гражданской сознательности, всячески стремящийся разъяснить вновь рожденную науку. Упрощайте название — таков основной путь, который мы смело рекомендуем молодому исследователю.
Делается это так. Любое явление природы, любое событие, процесс, поступок человека можно объявить теорией: теория предсказаний, теория принятия решений,
Теория принятия решений — область исследования, вовлекающая понятия и методы математики, статистики, экономики, менеджмента и психологии с целью изучения закономерностей выбора людьми путей решения проблем и задач, а также способов достижения желаемого результата.
теория игр,
Теория игр — математический метод изучения оптимальных стратегий в играх.
теория очередей,
Теория очередей — раздел теории вероятностей, целью исследований которого является рациональный выбор структуры системы обслуживания и процесса обслуживания на основе изучения потоков требований на обслуживание, поступающих в систему и выходящих из неё, длительности ожидания и длины очередей.
теория запасов, теория чувствительности, теория регрессивных критериев. Еще не создана, но несомненно появится теория пробелов в теориях. Но теория компиляции уже существует. От нее через теорию асимптотических методов можно подойти к основам теории предельной корректности, или — на выбор — создать теоретические основы проектирования компиляторов…
Но зачем в названии фигурирует слово теория? Зачем оставлять у читателей хоть тень сомнения в том, что ваши интересы фундаментальны?
Наиболее смелые исследователи уже опускают слово
Годится и профессиональный термин типа электрофорез.
Электрофорез — это электрокинетическое явление перемещения частиц дисперсной фазы в жидкой или газообразной среде под действием внешнего электрического поля.
ставролит, если он хорошо воспринимается на слух и вы догадываетесь, что он примерно означает.
Если же вы успели застолбить целый сектор — скажем, Бури, и кто-то выхватил у вас из-под носа эту многообещающую территорию, то смело углубляйтесь. И за вами останутся, скажем, Суббури и возмущения в магнитосфере.
Особый эффект от недосказанности достигается при возможных вариациях трактовок:
Не спешите раскрываться, создавайте вокруг себя атмосферу всеобщей заинтригованности. Прямой метод доступа — о чем это, черт побери, — об ЭВМ или о красотке?..
Мария Брановская1 о математике
Максим Музыка. Люблю математику
Масса танка Т-72 — 41 тонна.
Цена металлолома ~3000 грн/тонна
Цена танка при сдаче в металлолом — 123000 грн.
Кое-кто знает толк в коммерции.
Николай Зинов. Байес versus вирус
but everyone wants to have had it.
- Предположим, что у тестов на некий вирус К специфичность 98%. Вася решил сделать себе этот тест и получил положительный результат. Поскольку сейчас он чувствует себя отлично, Вася решил, что результаты теста означают, что он уже переболел вирусом К и риска заразиться заново нет. Чему равна вероятность того, что Вася на самом деле не болел, если известно, что в его городе переболело 2% населения?
- Чтобы подстраховаться Вася прошел это тестирование еще один раз и снова получил положительный результат (исходы тестов мы считаем независимыми). Как изменится вероятность того, что Вася не болел вирусом К?
- У Оли болит горло — это симптом многих респираторных вирусных инфекций. Известно, что горло болит у 10% заболевших вирусом К. Попробуйте прикинуть, с какой вероятностью у обычного человека (не болеющего вирусом К) может заболеть горло. Как, исходя из этой оценки, посчитать вероятность того, что у Оли именно вирус К?
Противоположная характеристика — чувствительность — более интуитивно понятна. Это отношение числа больных с положительным результатом теста к общему числу протестированных больных, которое показывает, какую долю больных «поймает» тест. Можно заметить, что определение специфичности в некотором смысле обратно чувствительности: оно получается заменой больных на здоровых, а положительного результата на отрицательный. То есть если представить, что тест выявляет не больных среди здоровых, а здоровых среди больных, то чувствительность и специфичность поменяются местами. Hint 2 Как можно догадаться из названия, решить задачу можно с помощью теоремы Байеса. Но можно и на пальцах посчитать частоты вариантов, о которых идет речь в задаче: присутствие/отсутствие антител в сочетании с положительным/отрицательным результатом теста. Hint 3 Вопрос про Олю можно свести к вопросу про Васю, если представить, что наличие боли в горле — это результат теста. Solution Для начала приведем решение первого пункта на пальцах — просто аккуратно подсчитаем указанные во второй подсказке величины.
Предположим, что было протестировано 10000 человек. Из них, поскольку по условию в городе переболевших 2%, а мы считаем, что отбор людей для тестирования проведен совершенно случайно, 200 в действительности переболели вирусом К (стоит отметить, что не все из них получат положительный результат теста, так как чувствительность теста, как и специфичность, не идеальная). Из оставшихся 9800 здоровых людей 9604 (ведь специфичность теста 98%) правильно получат отрицательный результат. Но вот оставшиеся 196 человек получат ложноположительный результат. На самом деле рядом с каждым из этих чисел нужно писать примерно, но 10000 — довольно большая выборка, так что отличия очень слабо влияют на дальнейшие подсчеты.
Получивший положительный результат Вася относится к одной з двух групп: получивших истинно положительный результат переболевших или получивших ложноположительный результат здоровых. Получаем, что вероятность того, что Вася переболел, равна
Запишем теперь те же рассуждения более формально с использованием языка теории вероятностей и теоремы Байеса. Рассмотрим два случайных события: событие A состоит в том, что Вася получил положительный тест на антитела к вирусу, а событие B состоит в том, что Вася действительно имеет иммунитет к вирусу.
В теории вероятностей вводится понятие условной вероятности события A при условии события B, P(A|B): это вероятность события A в предположении, что событие B произошло. В нашем примере P(A|B) — это вероятность того, что Вася получит положительный результат теста, если достоверно известно, что он имеет антитела к вирусу.
Посчитать такую вероятность можно следующим образом: оставим только тех людей, которые переболели и имеют иммунитет к вирусу (остальные нас не интересуют), и посчитаем среди них долю тех, кто получил положительный результат теста — это и будет искомая условная вероятность. На языке теории вероятностей эта идея выражается так:
где P(B) — вероятность того, что у человека есть иммунитет (доля тех, кого мы оставили в выборке), а P(AB) — вероятность события AB, состоящего в том, что произошли одновременно события A и B, то есть вероятность того, что у человека есть иммунитет и тест дал положительный результат (доля тех, кого мы оставили выборке, и при этом имеющих положительный результат теста). Можно заметить, что P(A|B) — это просто чувствительность теста.
Сформулируем теперь теорему Байеса. Она утверждает, что для произвольных случайных событий A и B верно следующее равенство:

Оказывается, если воспользоваться определением условной вероятности, данным выше, то доказать ее очень просто:

Сходу может быть непонятно, в чем суть этой теоремы, поэтому попробуем сначала применить ее к нашей задаче. По условию мы достоверно знаем, что Вася получил положительный результат теста, но не знаем, имеет ли он иммунитет к вирусу. Это значит, что нас интересует условная вероятность P(B|A). Чтобы получить ее с помощью теоремы Байеса, нужны три вероятности: P(A), P(B), P(A|B). Вероятность P(B) — это вероятность того, что случайно взятый человек имеет иммунитет к вирусу. По условию она равна 2%. Вероятность P(A|B) — это вероятность того, что человек получит положительный тест, при условии, что у него есть антитела к вирусу. Как уже было отмечено выше, это чувствительность теста (которая в условии не дана, но ее можно оценить сверху единицей).
Сложнее всего посчитать P(A) — вероятность того, что человек получит положительный результат теста. Как мы уже поняли в элементарном решении выше, она складывается из вероятности того, что человек больной и получил истинно положительный результат, и вероятности того, что человек здоровый и получил ложноположительный результат. Формально это записывает так:
где
Подставив определение условной вероятности, можно получить так называемую формулу полной вероятности:

Для этой формулы все данные у нас уже имеются. Часть вероятностей мы уже посчитали. Новых величин две:
Подставляя все числа в теорему Байеса, получаем:

Внимательный читатель заметит, что в результате мы проделали в точности те же вычисления, что и в элементарном решении, и лишь облекли их в более серьезную форму.
Второй вопрос задачи — как оценить вероятность того, что Вася имеет иммунитет, если повторный тест тоже дал положительный результат, — мы обсудим в послесловии.
Перейдем теперь к решению пункта про Олю. Если считать, что наличие или отсутствие боли в горле — это результат теста, то 10% из условия — это чувствительность этого «теста». Доля людей с больным горлом среди тех, кто не заразился новым вирусом, это (1 − специфичность) нашего «теста», то есть условная вероятность того, что человек без заболевания получил положительный результат «теста». Осталось оценить долю людей, которые в мирное время страдают от боли в горле. Прикинуть ее можно, приблизительно подсчитав, сколько в среднем дней вы и ваши знакомые всех возрастов жалуетесь на боль в горле в течение года (здесь мы не учитываем жизненные факторы вроде того, что зимой горло болит чаще, чем летом, — ведь в условии ничего не сказано про то, в какое время года заболела Оля). Разумной выглядит оценка в одну–две недели в год, что дает вероятность около 2%. Подставим эти значения в теорему Байеса:

Выходит, вероятность того, что Оля заразилась вирусом «К», достаточно мала.
Afterword
Чтобы ответить на этот вопрос, нужно разобраться, что же мы подразумеваем под вероятностью. Исторически, при становлении формализма теории вероятности в XX веке, под вероятностью понимали вероятность статистическую. Если подбросить честную монетку 100 раз, то она упадет вверх решкой примерно 50 раз. Если подбросить монетку N раз, то она упадет вверх решкой K ≈ N⋅0,5 раз, и чем больше число испытаний N, тем ближе KN к истинной вероятности (в случае монетки это 1/2) — математически это выражается в законе больших чисел. В этом смысле обычно вводят вероятность в школе или университете. Однако такой взгляд на вероятность не единственный возможный.
Вернемся к нашей задаче. Когда речь идет о большом количестве протестированных людей, то статистический подход оправдан. Но в условии спрашивалось про одного лишь Васю: переболел он или нет? На самом деле он либо имеет антитела, либо нет (как и всё на свете на макроскопическом уровне, а вот в микромире правит квантовая механика, где вероятности имеют физический смысл, но это выходит за рамки нашей задачи). Однако мы не знаем точно, болен он или здоров, а лишь оцениваем вероятность этих исходов на основе доступной информации. При таком подходе вероятность описывает не реальную невозможность предсказать исход события, а описывает нашу неуверенность, незнание того, что произошло или произойдет. Получение новой информации может изменить наше представление о вероятности того или иного события. Такой подход был впервые предложен Байесом и называется в его честь.
Еще один пример: предположим, вы играете в игру Кто хочет стать миллионером? и не знаете ответ на вопрос. Тогда, выбирая наугад первый вариант ответа, вы оцениваете свои шансы на победу в 25%, хотя на самом деле исход предопределен — ответ будет либо правильным, либо неправильным. Предположим теперь, что вы взяли подсказку 50/50 и остались только два варианта ответа. Если ваш выбор не поменялся, то и исход тоже не поменяется. Но теперь вы оцениваете вероятность на успех выше, так как получили новую информацию, и теперь более уверены в том, что угадаете.
Как же связана теорема Байеса с байесовским подходом? Разберемся, опять же, на примере нашей задачи. Изначально, перед тем, как Вася сдал тест, оценить вероятность того, что он переболел, можно лишь долей заболевших. В обозначениях из решения это P(B). В байесовском подходе это априорная вероятность события — оценка вероятности до получения новой информации. После того, как мы получили информацию о том, что тест дал положительный результат (событие A), можно посчитать новую оценку вероятности (апостериорную вероятность ) с учетом этих данных. Это условная вероятность P(B|A), которая вычисляется по теореме Байеса. Таким образом, эта теорема как раз и дает правило пересчета оценки вероятности события при поступлении новых данных.
Теперь можно вернуться к вопросу о том, как же оценить вероятность того, что у Васи есть антитела к вирусу, если повторный тест также дал положительный результат. Однократное применение теоремы Байеса позволило нам уточнить оценку вероятности: перейти от априорной к апостериорной вероятности. Для дальнейшего можно взять эту новую вероятность, как априорное значение P(B) и повторно применить теорему Байеса, чтобы учесть информацию о еще одном результате теста. Тогда новая апостериорная вероятность будет равна:

Здесь проявилось одно из преимуществ байесовского подхода — возможность многократно обновлять предсказания с приходом новых данных.
На практике основное препятствие, с которым сталкиваются при необходимости применить теорему Байеса, — это сложность оценивания вероятности в знаменателе. В решении это проявилось в полной мере: эта вероятность была неизвестна и пришлось разложить ее по формуле полной вероятности. На практике, когда имеют дело не с дискретными случайными величинами (принимающими конечный набор значений, как, например, в нашей задаче, где Вася мог быть либо болен, либо не болен), а с непрерывно распределенными на всех действительных числах, задача точного подсчета знаменателя обычно становится невыполнимой, так что приходится довольствоваться различными методами приблизительной оценки вероятности.
В заключение обсудим вопрос определения характеристик теста: чувствительности и специфичности. Оказывается, это далеко не единственный способ задать точность теста. Например, в машинном обучении широко используется другая пара характеристик: точность (precision) и покрытие (recall). Можно задаться вопросом: откуда вообще в машинном обучении тесты? Речь идет о моделях классификации. Примером может служить модель, которая по изображению определяет, есть на нем котик или нет. Вывод модели — это результат теста, и он подвержен тем же самым проблемам, что и медицинский тест: модель может не заметить котика на картинке или сказать, что котик есть, хотя на картинке его нет. Стандартные метрики определяются следующим образом: точность — это доля картинок, на которых реально есть котики, среди тех, которые модель-классификатор разметила как содержащие котиков, а покрытие — это доля примеров, на которых она распознала котика среди всех картинок с котиками. Хорошее упражнение: посчитать эти величины по данным из условия задачи и сравнить с чувствительностью и специфичностью. Об аналогичных метриках можно прочитать в статье Confusion matrix.
Акад. А.Н. Колмогоров об аксиоматике
1 Действительный член ЧК. — Ред. ТЧК.