Теория теорий: Пособие для молодого ученого

Б.Н. Волгин

Вместо введения
К истории вопроса
Новые времена
Загадочность содержания — через упрощение названия
Вариации наименований
Заезженный путь (предостережение)

Страницы 1 2 3 4

Новые времена

Новая история научных наименований началась методом перекрестного опыления.
Перекрёстное опыление ения у растений, при котором пыльца от андроцея одного цветка переносится на рыльце пестика другого цветка другого растения этого же вида.

Дифференциация
Дифференциация — процесс объединения частей в целое.

и интеграция
Интеграция — разделение, разведение процессов или явлений на составляющие части.

наук дала для этого широкие возможности. Если вначале создавали новые ветви на стыке родственных наук, типа физическая химия
Физхимия — раздел химии, наука об общих законах строения, структуры и превращения химических веществ.

или химическая физика,
Химическая физика Химическая физика — наука о физических законах, управляющих строением и превращением химических веществ.

то затем уже стали сочетаться любые две науки, первыми пришедшими на ум ученому после завтрака.
Завтрак — первый дневной приём пищи, как правило — в период от рассвета до полудня.

Этот метод встречается до сих пор, обладая особой пробивной силой в экстравагантных сочетаниях типа социальная кибернетика
Социальная кибернетика — независимый раздел в социологии, основанный на общей теории систем и кибернетике.

или философия надежности.
После того как двойные стыки научных дисциплин оказались исчерпанными и общественность замерла, ожидая бурного развития на тройных и более стыках, соображения практического удобства потребовали сокращенного составного наименования научных теорий.
Модификация метода перекрестного опыления: берутся два любых существительных из словаря Ожегова
Словарь русского языка — нормативный толковый словарь общеупотребительной лексики.

и осуществляется их научная стыковка после превращения одного из них в прилагательное.
К примеру, из названия журнала Семья и школа можно создать как минимум две теории: семейная школа и школьная семья. Аналогично стыкуются, с добавлением слова теория в сомнительных случаях: теория труктурной лингвистики
Структурная лингвистика — совокупность представлений о языке и методов его исследования, языковедческая дисциплина.

или теория лингвистических структур, теория кинематических цепей
Кинематическая цепь — это связанная система объектов, образующих между собой кинематические пары.

<[/expand] или теория цепной кинематики, теория пространственных графов или теория графических пространств.

Загадочность содержания — через упрощение названия

Название научной теории должно быть слегка загадочным, намекая непосвященным на особую сложность и невыразимость ее содержания. Особенно эффективно это достигается путем упрощения названия, когда автор попутно предстает как человек с высокой гражданской сознательности, всячески стремящийся разъяснить вновь рожденную науку. Упрощайте название — таков основной путь, который мы смело рекомендуем молодому исследователю.
Делается это так. Любое явление природы, любое событие, процесс, поступок человека можно объявить теорией: теория предсказаний, теория принятия решений,
Теория принятия решений — область исследования, вовлекающая понятия и методы математики, статистики, экономики, менеджмента и психологии с целью изучения закономерностей выбора людьми путей решения проблем и задач, а также способов достижения желаемого результата.

теория игр,
Теория игр — математический метод изучения оптимальных стратегий в играх.

теория очередей,
Теория очередей — раздел теории вероятностей, целью исследований которого является рациональный выбор структуры системы обслуживания и процесса обслуживания на основе изучения потоков требований на обслуживание, поступающих в систему и выходящих из неё, длительности ожидания и длины очередей.

теория запасов, теория чувствительности, теория регрессивных критериев. Еще не создана, но несомненно появится теория пробелов в теориях. Но теория компиляции уже существует. От нее через теорию асимптотических методов можно подойти к основам теории предельной корректности, или — на выбор — создать теоретические основы проектирования компиляторов…
Но зачем в названии фигурирует слово теория? Зачем оставлять у читателей хоть тень сомнения в том, что ваши интересы фундаментальны?
Наиболее смелые исследователи уже опускают слово

сумерки,
эмоции,
сера в белках,
пены.

Годится и профессиональный термин типа электрофорез.
Электрофорез — это электрокинетическое явление перемещения частиц дисперсной фазы в жидкой или газообразной среде под действием внешнего электрического поля.

ставролит, если он хорошо воспринимается на слух и вы догадываетесь, что он примерно означает.
Если же вы успели застолбить целый сектор — скажем, Бури, и кто-то выхватил у вас из-под носа эту многообещающую территорию, то смело углубляйтесь. И за вами останутся, скажем, Суббури и возмущения в магнитосфере.
Особый эффект от недосказанности достигается при возможных вариациях трактовок:

языки;
механизм управления;
ожидаемая продолжительность брака.

Не спешите раскрываться, создавайте вокруг себя атмосферу всеобщей заинтригованности. Прямой метод доступа — о чем это, черт побери, — об ЭВМ или о красотке?..

Страницы 1 2 3 4

Мария Брановская¹ о математике

Сложить и вычесть — это математика. Что сложить и что вычесть — это уже не математика

Максим Музыка. Люблю математику

Премия за подбитый танк — 48720 грн.
Масса танка Т-72 — 41 тонна.
Цена металлолома ~3000 грн/тонна
Цена танка при сдаче в металлолом — 123000 грн.
Кое-кто знает толк в коммерции.

Текст публикуется по Факты

Николай Зинов. Байес versus вирус

No one wants to have covid-19,
but everyone wants to have had it.

Как известно, вирусные заболевания иногда могут протекать бессимптомно. Один из способов выяснить, переболел ли человек, — пройти тест на антитела. Если в ходе теста окажется, что в крови (как правило, для тестирования нужно небольшое количество крови из пальца) есть антитела к вирусным белкам, то это будет означать, что иммунная система уже познакомилась с вирусом и опознала его (и либо еще борется с ним, либо уже победила). К сожалению, тесты не идеальны и могут давать ложные результаты.

Предположим, что у тестов на некий вирус К специфичность 98%. Вася решил сделать себе этот тест и получил положительный результат. Поскольку сейчас он чувствует себя отлично, Вася решил, что результаты теста означают, что он уже переболел вирусом К и риска заразиться заново нет. Чему равна вероятность того, что Вася на самом деле не болел, если известно, что в его городе переболело 2% населения?
Чтобы подстраховаться Вася прошел это тестирование еще один раз и снова получил положительный результат (исходы тестов мы считаем независимыми). Как изменится вероятность того, что Вася не болел вирусом К?
У Оли болит горло — это симптом многих респираторных вирусных инфекций. Известно, что горло болит у 10% заболевших вирусом К. Попробуйте прикинуть, с какой вероятностью у обычного человека (не болеющего вирусом К) может заболеть горло. Как, исходя из этой оценки, посчитать вероятность того, что у Оли именно вирус К?

Hint 1 Специфичность теста — это отношение числа здоровых людей, у которых тест дал отрицательный результат, к общему числу здоровых людей среди протестированных. Физический смысл этой величины такой: если тест обладает идеальной специфичностью (100%), то все здоровые люди получат отрицательный результат теста и не будет ложноположительных результатов. Если же специфичность ниже 100%, то это означает, что часть здоровых людей получит положительный результат. Специфичность того или иного теста определяется в контролируемых исследованиях, в которых достоверно известно, кто из тестируемых болен, а кто здоров.
Противоположная характеристика — чувствительность — более интуитивно понятна. Это отношение числа больных с положительным результатом теста к общему числу протестированных больных, которое показывает, какую долю больных «поймает» тест. Можно заметить, что определение специфичности в некотором смысле обратно чувствительности: оно получается заменой больных на здоровых, а положительного результата на отрицательный. То есть если представить, что тест выявляет не больных среди здоровых, а здоровых среди больных, то чувствительность и специфичность поменяются местами. Hint 2 Как можно догадаться из названия, решить задачу можно с помощью теоремы Байеса. Но можно и на пальцах посчитать частоты вариантов, о которых идет речь в задаче: присутствие/отсутствие антител в сочетании с положительным/отрицательным результатом теста. Hint 3 Вопрос про Олю можно свести к вопросу про Васю, если представить, что наличие боли в горле — это результат теста. Solution Для начала приведем решение первого пункта на пальцах — просто аккуратно подсчитаем указанные во второй подсказке величины.
Предположим, что было протестировано 10000 человек. Из них, поскольку по условию в городе переболевших 2%, а мы считаем, что отбор людей для тестирования проведен совершенно случайно, 200 в действительности переболели вирусом К (стоит отметить, что не все из них получат положительный результат теста, так как чувствительность теста, как и специфичность, не идеальная). Из оставшихся 9800 здоровых людей 9604 (ведь специфичность теста 98%) правильно получат отрицательный результат. Но вот оставшиеся 196 человек получат ложноположительный результат. На самом деле рядом с каждым из этих чисел нужно писать примерно, но 10000 — довольно большая выборка, так что отличия очень слабо влияют на дальнейшие подсчеты.
Получивший положительный результат Вася относится к одной з двух групп: получивших истинно положительный результат переболевших или получивших ложноположительный результат здоровых. Получаем, что вероятность того, что Вася переболел, равна

Если учесть неидеальную чувствительность теста, то вероятность будет еще меньше (ниже мы выведем формулу, в которой будет учтена и зависимость от чувствительности). Выходит, Васе рано делать вывод о том, что он переболел и имеет иммунитет к вирусу К: ведь вероятность, что он болел, всего лишь около половины. Стоит, однако, заметить, что если бы Вася не делал тест, то оценить вероятность того, что он болен, можно было бы лишь в 2% (именно столько процентов населения переболело по статистике), так что положительный тест, как и следовало, увеличил уверенность в том, что Вася переболел и имеет иммунитет.
Запишем теперь те же рассуждения более формально с использованием языка теории вероятностей и теоремы Байеса. Рассмотрим два случайных события: событие A состоит в том, что Вася получил положительный тест на антитела к вирусу, а событие B состоит в том, что Вася действительно имеет иммунитет к вирусу.
В теории вероятностей вводится понятие условной вероятности события A при условии события B, P(A|B): это вероятность события A в предположении, что событие B произошло. В нашем примере P(A|B) — это вероятность того, что Вася получит положительный результат теста, если достоверно известно, что он имеет антитела к вирусу.
Посчитать такую вероятность можно следующим образом: оставим только тех людей, которые переболели и имеют иммунитет к вирусу (остальные нас не интересуют), и посчитаем среди них долю тех, кто получил положительный результат теста — это и будет искомая условная вероятность. На языке теории вероятностей эта идея выражается так:

где P(B) — вероятность того, что у человека есть иммунитет (доля тех, кого мы оставили в выборке), а P(AB) — вероятность события AB, состоящего в том, что произошли одновременно события A и B, то есть вероятность того, что у человека есть иммунитет и тест дал положительный результат (доля тех, кого мы оставили выборке, и при этом имеющих положительный результат теста). Можно заметить, что P(A|B) — это просто чувствительность теста.
Сформулируем теперь теорему Байеса. Она утверждает, что для произвольных случайных событий A и B верно следующее равенство:

Оказывается, если воспользоваться определением условной вероятности, данным выше, то доказать ее очень просто:

Сходу может быть непонятно, в чем суть этой теоремы, поэтому попробуем сначала применить ее к нашей задаче. По условию мы достоверно знаем, что Вася получил положительный результат теста, но не знаем, имеет ли он иммунитет к вирусу. Это значит, что нас интересует условная вероятность P(B|A). Чтобы получить ее с помощью теоремы Байеса, нужны три вероятности: P(A), P(B), P(A|B). Вероятность P(B) — это вероятность того, что случайно взятый человек имеет иммунитет к вирусу. По условию она равна 2%. Вероятность P(A|B) — это вероятность того, что человек получит положительный тест, при условии, что у него есть антитела к вирусу. Как уже было отмечено выше, это чувствительность теста (которая в условии не дана, но ее можно оценить сверху единицей).
Сложнее всего посчитать P(A) — вероятность того, что человек получит положительный результат теста. Как мы уже поняли в элементарном решении выше, она складывается из вероятности того, что человек больной и получил истинно положительный результат, и вероятности того, что человек здоровый и получил ложноположительный результат. Формально это записывает так:

где

обозначает отрицание B, то есть событие, состоящее в том, что событие B не наступило. Очевидно, что

Подставив определение условной вероятности, можно получить так называемую формулу полной вероятности:

Для этой формулы все данные у нас уже имеются. Часть вероятностей мы уже посчитали. Новых величин две:

— вероятность того, что случайно взятый человек здоров, и

— вероятность того, что здоровый человек получит положительный тест (можно заметить, что в сумме со специфичностью теста она дает 1).
Подставляя все числа в теорему Байеса, получаем:

Внимательный читатель заметит, что в результате мы проделали в точности те же вычисления, что и в элементарном решении, и лишь облекли их в более серьезную форму.
Второй вопрос задачи — как оценить вероятность того, что Вася имеет иммунитет, если повторный тест тоже дал положительный результат, — мы обсудим в послесловии.
Перейдем теперь к решению пункта про Олю. Если считать, что наличие или отсутствие боли в горле — это результат теста, то 10% из условия — это чувствительность этого «теста». Доля людей с больным горлом среди тех, кто не заразился новым вирусом, это (1 − специфичность) нашего «теста», то есть условная вероятность того, что человек без заболевания получил положительный результат «теста». Осталось оценить долю людей, которые в мирное время страдают от боли в горле. Прикинуть ее можно, приблизительно подсчитав, сколько в среднем дней вы и ваши знакомые всех возрастов жалуетесь на боль в горле в течение года (здесь мы не учитываем жизненные факторы вроде того, что зимой горло болит чаще, чем летом, — ведь в условии ничего не сказано про то, в какое время года заболела Оля). Разумной выглядит оценка в одну–две недели в год, что дает вероятность около 2%. Подставим эти значения в теорему Байеса:

Выходит, вероятность того, что Оля заразилась вирусом «К», достаточно мала.
Afterword

Итак, в этой задаче мы, воспользовавшись теоремой Байеса (названной в честь Томаса Байеса — английского математика и священника, жившего в XVIII веке), обнаружили, что даже тест с высокими показателями чувствительности и специфичности дает неожиданно много ошибок. Это важный практический результат. Но изначально мы получили его без всякой теоремы Байеса, да и сама она выводится в одну строчку. Чем же объясняется ее важность в теории вероятностей?
Чтобы ответить на этот вопрос, нужно разобраться, что же мы подразумеваем под вероятностью. Исторически, при становлении формализма теории вероятности в XX веке, под вероятностью понимали вероятность статистическую. Если подбросить честную монетку 100 раз, то она упадет вверх решкой примерно 50 раз. Если подбросить монетку N раз, то она упадет вверх решкой K ≈ N⋅0,5 раз, и чем больше число испытаний N, тем ближе KN к истинной вероятности (в случае монетки это ¹/₂) — математически это выражается в законе больших чисел. В этом смысле обычно вводят вероятность в школе или университете. Однако такой взгляд на вероятность не единственный возможный.
Вернемся к нашей задаче. Когда речь идет о большом количестве протестированных людей, то статистический подход оправдан. Но в условии спрашивалось про одного лишь Васю: переболел он или нет? На самом деле он либо имеет антитела, либо нет (как и всё на свете на макроскопическом уровне, а вот в микромире правит квантовая механика, где вероятности имеют физический смысл, но это выходит за рамки нашей задачи). Однако мы не знаем точно, болен он или здоров, а лишь оцениваем вероятность этих исходов на основе доступной информации. При таком подходе вероятность описывает не реальную невозможность предсказать исход события, а описывает нашу неуверенность, незнание того, что произошло или произойдет. Получение новой информации может изменить наше представление о вероятности того или иного события. Такой подход был впервые предложен Байесом и называется в его честь.
Еще один пример: предположим, вы играете в игру Кто хочет стать миллионером? и не знаете ответ на вопрос. Тогда, выбирая наугад первый вариант ответа, вы оцениваете свои шансы на победу в 25%, хотя на самом деле исход предопределен — ответ будет либо правильным, либо неправильным. Предположим теперь, что вы взяли подсказку 50/50 и остались только два варианта ответа. Если ваш выбор не поменялся, то и исход тоже не поменяется. Но теперь вы оцениваете вероятность на успех выше, так как получили новую информацию, и теперь более уверены в том, что угадаете.
Как же связана теорема Байеса с байесовским подходом? Разберемся, опять же, на примере нашей задачи. Изначально, перед тем, как Вася сдал тест, оценить вероятность того, что он переболел, можно лишь долей заболевших. В обозначениях из решения это P(B). В байесовском подходе это априорная вероятность события — оценка вероятности до получения новой информации. После того, как мы получили информацию о том, что тест дал положительный результат (событие A), можно посчитать новую оценку вероятности (апостериорную вероятность ) с учетом этих данных. Это условная вероятность P(B|A), которая вычисляется по теореме Байеса. Таким образом, эта теорема как раз и дает правило пересчета оценки вероятности события при поступлении новых данных.
Теперь можно вернуться к вопросу о том, как же оценить вероятность того, что у Васи есть антитела к вирусу, если повторный тест также дал положительный результат. Однократное применение теоремы Байеса позволило нам уточнить оценку вероятности: перейти от априорной к апостериорной вероятности. Для дальнейшего можно взять эту новую вероятность, как априорное значение P(B) и повторно применить теорему Байеса, чтобы учесть информацию о еще одном результате теста. Тогда новая апостериорная вероятность будет равна:

Здесь проявилось одно из преимуществ байесовского подхода — возможность многократно обновлять предсказания с приходом новых данных.
На практике основное препятствие, с которым сталкиваются при необходимости применить теорему Байеса, — это сложность оценивания вероятности в знаменателе. В решении это проявилось в полной мере: эта вероятность была неизвестна и пришлось разложить ее по формуле полной вероятности. На практике, когда имеют дело не с дискретными случайными величинами (принимающими конечный набор значений, как, например, в нашей задаче, где Вася мог быть либо болен, либо не болен), а с непрерывно распределенными на всех действительных числах, задача точного подсчета знаменателя обычно становится невыполнимой, так что приходится довольствоваться различными методами приблизительной оценки вероятности.
В заключение обсудим вопрос определения характеристик теста: чувствительности и специфичности. Оказывается, это далеко не единственный способ задать точность теста. Например, в машинном обучении широко используется другая пара характеристик: точность (precision) и покрытие (recall). Можно задаться вопросом: откуда вообще в машинном обучении тесты? Речь идет о моделях классификации. Примером может служить модель, которая по изображению определяет, есть на нем котик или нет. Вывод модели — это результат теста, и он подвержен тем же самым проблемам, что и медицинский тест: модель может не заметить котика на картинке или сказать, что котик есть, хотя на картинке его нет. Стандартные метрики определяются следующим образом: точность — это доля картинок, на которых реально есть котики, среди тех, которые модель-классификатор разметила как содержащие котиков, а покрытие — это доля примеров, на которых она распознала котика среди всех картинок с котиками. Хорошее упражнение: посчитать эти величины по данным из условия задачи и сравнить с чувствительностью и специфичностью. Об аналогичных метриках можно прочитать в статье Confusion matrix.

Текст публикуется по Элементы

Акад. А.Н. Колмогоров об аксиоматике

Мне представляется единственно удачным выходом сопоставить те общие свойства длин, площадей и объемов, которые позволяют выразить их при выбранной единице меры числами, и называть системой величин всякую совокупность объектов, обладающую этими свойствами. Но это уже не что иное, как аксиоматический метод, который не должен казаться скомпрометированным своей связью с конвенционализмом (учением об условности математических определений). Действительно, когда Гильберт в Основаниях геометрии предлагает называть пространством любую совокупность объектов и отношений, удовлетворяющую его аксиомам, то вместе с Лебегом следует протестовать, если из определения Гильберта делают заключение о произвольности выбора объекта изучения в математике. Однако то же самое определение Гильберта можно воспринимать совсем противоположным образом. Можно утверждать, что система аксиом, лежащих в основе геометрии, является замечательным, концентрированным выражением результата наших усилий, направленных к познанию действительности. Успех, заключающийся в ее создании, тем более замечателен, что она не только отражает с очень большой точностью свойства окружающего нас пространства при обычной интерпретации ее основных понятий (точек, прямых, плоскостей и т.д.), но также хорошо приспособлена и для выражения совсем других закономерностей внешнего мира при других ее интерпретациях. Таким образом, абстрактная (аксиоматизированная) геометрия больше связана с действительностью, чем геометрия в ее традиционной форме.

Текст публикуется по Лебег А. Об измерении величин

¹ Действительный член ЧК. — Ред. ТЧК.