Философия науки и техники Philosophy of Science and Technology
2022. Т. 27. № 1. С. 70-83 2022, vol. 27, no. 1, pp. 70-83
УДК 168 DOI: 10.21146/2413-9084-2022-27-1-70-83
ТЕОРИЯ И МЕТОДОЛОГИЯ НАУКИ И ТЕХНИКИ
В.А. Бажанов
Затрагивает ли кризис воспроизводимости математику?*
Бажанов Валентин Александрович - доктор философских наук, профессор, заслуженный деятель науки РФ. Межрегиональная общественная организация «Русское общество истории и философии науки», исследователь. Российская Федерация, 105062, г. Москва, Лялин пер., 1/36, стр. 2; e-mail: [email protected]
В статье обращается внимание на важное значение кризиса воспроизводимости для науки (включая вопросы ее финансирования). Предпринимается попытка обсудить, каким образом феномен и кризис воспроизводимости проявляется в математике и как его воспринимают представители математического сообщества. Показывается, что традиционные подходы к анализу феномена доказательства в математике предполагают его обозримость, возможность принципиальной проверки всех шагов доказательства компетентными членами научного сообщества, а смысл математического доказательства усматривается в том, что его целью является убеждение членов сообщества в правильности, корректности всех его компонентов. Посредством предъявления доказательства его автор берет на себя (моральную) ответственность за то, что сформулированное им утверждение (теорема) является правильным и каждый может повторить путь, который ведет к его обоснованию. Увеличение сложности математических доказательств в ходе ее исторического развития и прежде всего расширение использования компьютеров в качестве важных элементов доказательства приводит в некоторых случаях к потере его обозримости и к переносу центра тяжести в рецепции доказательства на косвенные признаки (уверенность в правильности алгоритмических процедур и пруве-ров). Все это ведет к необходимости пересмотреть взгляды на степень надежности математических доказательств и оценку их не как достоверных, а лишь как правдоподобных. Это является основанием для характеристики новой эпохи развития математики как «пост-строгой», что поднимает серьезные проблемы, связанные с осмыслением и анализом процедур воспроизводимости в математике и статуса доказательства в эту
Исследование выполнено при финансовой поддержке РНФ, проект № 21-18-00428 «Политическая субъектность современной науки: междисциплинарный анализ на перекрестке философии науки и философии политики» в Русском обществе истории и философии науки.
© Бажанов В.А.
эпоху. Особую актуальность эти проблемы приобретают в условиях экспансии в сферу математического творчества разного рода компьютерных методов и компьютерного моделирования.
Ключевые слова: воспроизводимость, математика, прикладная математика, доказательство, компьютерные методы доказательства, пост-строгость
Введение
В последние годы академическое сообщество весьма обеспокоено проблемой воспроизводимости результатов исследований [Randall, Welser, 2018]. Ситуация оценивается как полноценный, глубокий кризис, который касается ключевых компонентов и смысла научного поиска [Allison, Shiffrin, Stodden, 2018, p. 2561; Re-dish, Kummerfeld et al., 2018, р. 5042]. О кризисе говорят не только психологи1 и/или социологи2, но даже многие представители естественных наук [Reproducibility and Replicability, 2019]. Какая-то часть населения усматривает в кризисе свидетельство в пользу того, что науке доверять нельзя3. Особенную озабоченность высказывают представители медико-биологических наук, поскольку недостоверные данные здесь могут негативно отразиться на здоровье миллионов людей [Hicks, 2021]. О глубине кризиса также говорит едва ли не лавинообразный начиная примерно с 2010 г. рост публикаций, посвященных анализу его природы, причин и способов исправления ситуации [Fanelli, 2018, p. 2629]. Оценки глубины и причин кризиса воспроизводимости в науке имеют и политический аспект: если наука не способна дать объективное и, значит, достоверное знание, которое может быть в принципе полезным ipso facto, то властные структуры могут задуматься о том, не стоит ли существенно урезать ее государственное финансирование и сократить институты, в которых сотрудники заняты получением мало- или вообще недостоверного знания?
Затрагивает ли этот кризис математику и если да, то в какой степени? Ответ на этот вопрос для математики не менее актуален, чем для дисциплин, которые связаны с обработкой эмпирических данных, поскольку развивается «экспериментальная математика»4, да и прикладная математика так или иначе не может не заниматься их обработкой. Если допустить, что затрагивает, то в чем это проявляется и каковы причины, побуждающие говорить о кризисе воспроизводимости в современной математике? Если нет, то почему математика
Например, исследователи-психологи, изучающие феномен числового познания [Cipora, Sol-tanlou, 2021].
Например, социологи, разрабатывающие и качественные, и количественные методы в социальных науках [Freese, 2017].
Такой позиции в Германии в основном придерживаются сторонники «правых» партий [Mede, Schafer et al., 2020, p. 99].
Уже двадцать лет издается журнал "Experimental Mathematics". Хотя многие представители элиты, которые занимаются фундаментальной, «чистой» математикой, относятся к экспериментальной математике свысока и понятие экспериментальной математики считают противоречивым и искажающим смысл математического творчества [Avigad, 2022, p. 109]. Однако этот раздел математики находится на подъеме в смысле привлекательности и расширения поля исследований.
2
3
остается в стороне от ситуации, характерной для иных, особенно естественных наук, прежде всего физики, в которых давно и активно применяются математические методы и которые, по известному выражению Е. Вигнера, придают этим наукам «непостижимую эффективность»?
Статья начинается с некоторых уточнений терминологии, используемой при анализе феномена воспроизводимости (раздел 1), затем обсуждаются вопросы, относящиеся к природе и статусу доказательства в математике, динамика увеличения сложности математических доказательств в ее новейшей истории, а также требование к их обозримости (раздел 2), история и особенности применения компьютеров при доказательстве математических теорем, последствия для оценки надежности доказательств вследствие потери обозримости при использовании компьютеров и пруверов (раздел 3), в заключении предлагаются открытые вопросы, которые, по мнению автора, являются важными для осмысления развития математики в эпоху пост-строгости.
1. Терминологические уточнения
Начнем с уточнения содержания терминов, которые принято использовать в математических науках для описания феномена воспроизводимости результатов исследований и сопряженными с ними явлениями.
Повторение (repeatability) - получение ранее достигнутых результатов той же самой группой людей (например, сотрудниками лаборатории) теми же самыми методами в условиях прежних методологических установок.
Репликация (replicability) - получение ранее достигнутых результатов другой группой людей, но теми же самыми методами в условиях прежних методологических установок.
Воспроизводимость (reproducibility) - получение ранее достигнутых результатов другой группой людей, другими методами и при использовании новой методологии [Schnell, 2018, p. 3099-3100].
Кроме того, следует учитывать методы достижения воспроизводимости, идентичность полученных результатов и заключений, сопровождающих их обработку и осмысление [Plesser, 2018, p. 3].
Если иметь в виду репликацию, то выделяют следующие ее подвиды: «прямую» (direct), «близкую» (close), «концептуальную» (conceptual), «внутреннюю» (internal) и «внешнюю» (external). Прямая репликация имеет место в случае точного воссоздания экспериментальной ситуации; она фактически исключена в социальных науках. Близкая репликация предполагает максимально возможное, но не вполне полное воссоздание всех условий эксперимента. Концептуальная репликация - организация и проведение эксперимента другими методами, нежели те, которые использовались ранее. Внутренняя репликация - повторение эксперимента теми же самыми сотрудниками, которые проводили предшествующий опыт, а внешняя - новым коллективом исследователей [Aguilar, 2021, p. 41]. Учет различий в содержании терминов, относящихся к описанию феномена воспроизводимости, может быть важным в анализе различных тонких, лиминальных и пограничных ситуаций. Для целей настоящей статьи терминологические нюансы не имеют существенного
значения. Поэтому преимущественно мы будем использовать понятие воспроизводимости, хотя в ряде случаев следует иметь в виду все семейство близкородственных понятий.
2. Генезис и статус представлений о кризисе воспроизводимости в математике
Наличие кризиса или по меньшей мере некоторых симптомов кризисных явлений в математике признается большинством математиков, которые интересуются основаниями и методологическими вопросами, сопряженными с развитием этой науки. Между тем оценки глубины кризиса в математике простираются от разной градации сомнений в наличии самого кризиса и контрпродуктивности рассуждений о нем ввиду их неблагоприятного воздействия на молодое поколение, которое может составить неверное впечатление о научной деятельности [Fanelli, 2018, p. 2630], до признания серьезности нового вызова математическому мышлению.
Одна группа математиков в качестве ответа на вызовы со стороны кризиса призывает существенно изменить систему экспертизы поступающих в журналы статей [Schnell, 2018; Bordg, 2021, p. 51]. Так, в 2021 году предпринято издание нового журнала, специально посвященного проблеме воспроизводимости в области математического образования "Implementation and Replication Studies in Mathematics Education" [Jankvist, Aquilar et al., 2021]5. Стоит обратить внимание на тот факт, что впервые о важности проблемы и необходимости такого журнала заговорили еще в 1975 г. [Ibid., p. 11], хотя феномен воспроизводимости ни в области естественных наук, ни тем более в математике не находился в фокусе внимания ученых.
Другая группа математиков на передний план выдвигает проблему обстоятельного анализа природы математического доказательства, и в первую очередь относительно нового для математического творчества феномена компьютерного доказательства - феномена, во многом благодаря которому, как считается, кризис воспроизводимости и затронул эту науку.
Дело в том, что многие сотни лет математическое доказательство должно было убеждать научное сообщество6 в том, что автор некоторого утверждения (теоремы) при его формулировке не ошибся, что он берет ответственность за его правильность, и каждый достаточно компетентный член сообщества может в этом самостоятельно удостовериться, повторив нетривиальный путь к конкретному утверждению (теореме) посредством повторения и проверки всех шагов доказательства. Тем самым доказательство могло оцениваться как этическая по своей сути процедура, путем которой автор поручался за верность
Актуальность издания такого рода журнала авторы обосновывают тем, что за пятилетний период сто ведущих мировых журналов, посвященных проблемам образования, опубликовали всего 0,13% статей от общего объема, которые были непосредственно посвящены проверке ранее полученных результатов [Aguilar, 2020, р. 42].
Именно на фактор убедительности доказательства для профессиональных математиков, например, обращает внимание Р. Херш [Неге^ 1993, р. 391-393].
5
озарения, которое, возможно, лежало в основании формулировки тезиса доказательства [Bazhanov, 2008]. Поэтому доказательство строилось таким образом, чтобы отвечать принципу его «обозримости»: каждый элемент доказательства присутствует в явном виде и доступен непосредственной проверке с точки зрения его правомерности введения и корректности определения. Доказательство можно рассматривать как форму апелляции к научному сообществу, в котором содержится (неявный) призыв к последнему проконтролировать корректность доказательства. Надежность доказательства оценивается в социальном контексте [Bazhanov, 2012]. Иными словами, автор предлагает объяснение заинтересованным коллегам, почему им используются те или иные элементы доказательства, и обосновывает применявшиеся им методы. Научное сообщество может признать все компоненты доказательства приемлемыми, а может усомниться в каких-то его моментах, обнаружить пробелы и/или неприемлемые допущения и приемы, которые делают доказательство сомнительным или вообще недостоверным. При этом пробелы в доказательствах могут быть преднамеренными [Fallis, 2003]7, восполнимыми впоследствии при более обстоятельном изложении доказательных процедур и расширении аргументативной базы [Andersen, 2020].
(Пере)доказательства теорем в математике - совсем не редкость [ Dawson, 2006, p. 270]. Это принято делать не только для проверки правильности доказательства, но и для того, чтобы, например, испытать новые методы демонстрации, представить доказательство в новом - более компактном виде, чтобы поместить теорему в более широкий концептуальный контекст, предложить ее обобщение и/или связать с другой, неожиданной для научного сообщества областью математического знания. Рассмотрение старой проблемы в новом -обобщенном контексте - влечет, как правило, более глубокое понимание ее природы и статуса в системе математического знания. Речь идет о своего рода перекрестном опылении различных разделов математического знания.
Иногда значительные трудности в проверках доказательства возникают тогда, когда оно сложное и объемное (точнее, длинное - если иметь в виду количество шагов, требуемых для получения полного цикла демонстрации), достигающее пределов обозримости, которые, вообще-то говоря, зависят от конкретного исторического периода развития математики. Если на рубеже XIX и XX столетий верхний предел длины доказательства можно оценить в примерно сто страниц печатного текста, в середине ХХ века - в двести страниц, то на границе XX и XXI столетий - уже где-то в пятьсот страниц.
Так, в конце XIX века В.К. Киллинг предложил классификацию простых групп Ли в статьях, занимающих примерно 180 страниц. В 1905 г. Э. Ласкер в статье объемом почти 100 страниц доказал важную теорему в алгебре (обобщенную через 15 лет Э. Нетер). В 1968 г. П.С. Новиков и его ученик С.И. Адян решили проблему Бёрнсайда (о существовании неразрешимых конечных групп нечетного порядка). Решение было представлено в трех статьях общим
Если, например, автор хочет скрыть те или иные шаги в доказательстве, кажущиеся ему не вполне обоснованными или которыми, по его мнению, рано делиться с коллегами; пробелы допускаются и в случае применения общепринятых методов.
объемом в триста с лишним страниц текста. В начале XXI в. почти сотня математиков в течение продолжительного периода времени (пятьдесят лет!) занимались классификацией простых конечных групп. Результат этой гигантской работы был изложен в двадцати (!) томах, содержащих примерно пятнадцать тысяч машинописных страниц.
Весьма показательна ситуация с претензией на доказательство в 2012 г. Ш. Мочидзуки из университета Киото центральной в теории чисел abc-гипо-тезы, из которой следует много важных следствий. Мочидзуки изложил свое доказательство в серии четырех статей общим объемом примерно 500 страниц в виде препринта, а число сопроводительных материалов достигало полутора тысяч страниц. Представленный им текст, включая такого рода материалы, содержал множество размытых понятий, которым не давалось определений, применялись необщезначимые методы, которые (во всяком случае на момент получения результата) не были приняты в математическом сообществе. Мочидзуки приглашали на десятки конференций, посвященных анализу его доказательства, но он ни разу на них не являлся, хотя охотно отвечал на вопросы по электронной почте или скайпу. Несмотря на открытость для контактов Мочидзуки, его доказательство оставалось по-прежнему непонятым. Рецензентов для публикации статей Мочидзуки в неяпонских математических журналах не находилось.
Два немецких математика П. Шольце (награжденный медалью Филдса в 2018 г., т.е. выдающийся математик) и Я. Стикс8 нашли в доказательстве, как они были убеждены, ошибку. Они отправились в Киото, где неделю обсуждали с Мочидзуки его доказательство. Последний не смог убедить Шольце и Стикса в том, что его доказательство корректное, а Шольце и Стикс убедить Мочидзуки и его японских коллег в том, что он допустил ошибку [Bordg, 2021, р. 50; Rittberg, 2021, p. 5588]. Таким образом создалась парадоксальная ситуация: одна группа именитых математиков (главным образом, соотечественников Мочидзуки) убеждена в правильности доказательства abc-гипотезы, а другая - нет. Однако доказательство не может иметь географическую привязку в смысле его корректности, хотя признание корректности доказательства может зависеть от принадлежности ученого к тому или иному направлению. Так, например, теорема о сходимости ограниченной монотонной последовательности рациональных чисел принимается в классическом, но не в интуиционистском математическом анализе.
Все эти примеры относятся к доказательствам, проведенным, так сказать, традиционными - аналитическими - способами, силой человеческого разума (имеется в виду без обращения к мощи вычислительных машин). Между тем попытки использовать машины для доказательства теорем имели место с середины 1950-х годов, когда было доказано, что сумма двух четных чисел дает четное число, а затем и 38 из 52 теорем из эпохального труда Б. Рассела и А. Уайтхеда "Principia Mathematica" [Bibel, 2007].
Шольце и Стикс являются крупными специалистами в области, близкой к основным интересам Мочидзуки.
3. Заря эпохи «пост-строгости»: функции компьютеров в математических доказательствах
Серьезный прорыв (в смысле получения важных результатов) в применении вычислительных машин относится к середине 1970-х гг., когда К. Аппе-лем и В. Хакеном была доказана теорема о четырех красках9. Доказательство занимало сто сорок страниц, а компьютер много часов обсчитывал допустимые варианты расклада красок (цветов) на почти двух тысячах карт. Этот результат положил начало все более и более широкому использованию компьютеров в математических доказательствах нетривиальных теорем.
Особенно впечатляет следующий результат. Еще в 1611 г. И. Кеплер высказал гипотезу о том, что наиболее оптимальная плотность расположения в трехмерном пространстве одинаковых по размеру сфер (шаров) достигается путем кубической гранецентрированной укладки (попросту выражаясь, «пирамидкой»). В 1998 г. Т. Хейлс известил о доказательстве этой гипотезы, которое занимало 250 страниц и было получено с помощью больших вычислений на компьютере. Более десяти математиков проверяли доказательство и сочли, что оно с вероятностью 99% верное. Позже (в 2014 г.) Т. Хейлс создал компьютерную систему проверки доказательств Flyspeck, действительно подтвердившую правильность доказательства. С ее помощью и посредством других программ проверки доказательства Хейлс обнаружил сотни (сотни!) ошибок в первоначальной версии доказательства [Bordg, 2021, p. 49], которые, правда, не касались основного заключения и не заставляли серьезно усомниться в полученном результате и основных методах его достижения, но все равно были исправлены с тем, чтобы к доказательству нельзя было предъявить какие-либо претензии.
Особенно вызывающим и поражающим воображение является решение проблемы булевых пифагоровых троек в 2016 г., когда вспомогательная компьютерная программа, составленная М. Хейлем из университета в Остине с группой коллег, перебиравшая все возможные варианты троек чисел, заняла 200 терабайт [Lamb, 2016]. По существу, эта величина (200 терабайт) соразмерна объему электронных версий всех печатных материалов, которые хранятся в библиотеке конгресса в США10. М. Хейл также нашел решение так называемой проблемы Шура номер пять11 с помощью компьютерного перебора
Смысл теоремы в том, что любую политическую карту (на плоскости или шаре), на которую нанесены различные страны, можно окрасить не более чем четырьмя цветами так, чтобы различные страны были раскрашены разными цветами и соседние области, имеющие общую границу, отличались по цвету.
Библиотека конгресса США насчитывает 170 миллионов единиц хранения, из них - 40 миллионов книг; в Британской библиотеке 150 миллионов единиц хранения, из них книг -15 миллионов.
Формулировка теоремы Шура зависит от конкретной области математики. Скажем, в случае комбинаторики она гласит, что для всякого целого положительного числа г существует целое положительное число 5 такое, что в любом разбиении целых чисел {1,..., 5} на г частей какая-то одна часть содержит целые числа х, у и z, где х + у = z.
9
вариантов, причем размер соответствующей программы был равен примерно двум петабайтам12 [Heule, 2017].
Однако применение компьютера и, вообще говоря, методов нейрокомпью-тинга [Савельев, 2020; Нечаев, 2021] по существу придает качество «необозримости» доказательству и, следовательно, означает принципиальную невозможность математикам проверить его «пошагово». Кроме того, любая сложная компьютерная программа, особенно указанных выше внушительных объемов, может содержать «баги», т.е. ошибки, совершенные программистом непреднамеренно, своего рода дефекты в программе или же сбои в работе «железа» (самого компьютера). Разумеется, мыслима и «дебагизация» (исправление ошибок) программного обеспечения, но нельзя дать гарантию, что в программе не вскроются ранее не замеченные дефекты. Все это поднимает серьезные проблемы анализа феномена воспроизводимости в компьютерных науках, включая вопросы верификации результатов их операций [Coveney, Groen, Hoekstra, 2021, p. 2]. Таким образом, часть математиков может выражать сомнение в надежности доказательства, существенную функцию в котором выполняло и выполняет вычисление посредством компьютера. В таком контексте должно не удивлять утверждение, сделанное раньше, чем появились тера- и пентабайтные компьютерные программы, о том, что теорема доказана с 60% вероятностью. В условиях, когда непротиворечивость формальной системы считается частным случаем противоречивости [Priest, 2007, р. 98], стандарты математического дискурса могут быть пересмотрены и «смягчены». Однако под углом зрения эпистемологических стандартов дискурса такая ситуация заставляет самым серьезным образом задуматься о смысле применения компьютеров в исследовательской практике вообще и статуса компьютерных вычислений в плане анализа феномена воспроизводимости [Cockburn, Dragicevic et al., 2020]. В определенной степени это отвечает классификации И. Лакатоса этапов математического творчества в его статье с нагруженным смыслом названием "What does a mathematical proof prove?13" на пре-формальную, формальную и пост-формальную стадии [Lakatos, 1978, p. 61-69]. Лакатос обращает внимание на тот факт, что после формализации какой-то теории неизбежно возникают вопросы об идеях, предшествующих появлению идей, которые привели к ее формулировке, и полноте выражения их статуса в ее формализованной версии.
Использование компьютерного моделирования (или методов искусственного интеллекта) - это по существу не что иное, как цифровой образ реальности, который даже при успешном применении - не более чем гомоморфная ее копия14.
Число специальных машинных алгоритмов, которые нацелены на автоматическое доказательство теорем (пруверов), множится: iProver, Coq, Mizar, HOL,
12 1 петабайт равен 1000 терабайтам.
13 В английском названии обыгрывается «созвучие» смыслов понятий proof (доказательство) и prove (доказать): «Что математическое доказательство доказывает?».
14 Это суждение справедливо и в случае использования компьютеров, основанных на фотонных технологиях, которые значительно превосходят и по скорости работы, и по экономии потребляемой энергии мощные компьютеры традиционной архитектуры [Coveney, High-field, 2020, p. 10].
HoTT и т.д. Программа В.А. Воеводского разработки унивалентных оснований математики, развиваемая ныне его последователями, как раз и ставила цель поиска эффективных пруверов, некоторого универсального языка и систем автоматической компьютерной проверки правильности доказательств.
Апелляция к такого рода средствам знаменует собой вступление в эру «постстрогой (курсив мой. - Б.В.)» математики [Buzzard, 2020, p. 1792]. Такая характеристика нового этапа развития математики означает, что прежняя эпоха - «строгой» математики - строилась на жестком условии обозримости, принявшей «облик» фини-тизма в случае попытки избавиться от парадоксов канторовский теории множеств и обосновать математику Д. Гильбертом, в ней фигурировали абстракции высокого уровня, типа абстракции актуальной бесконечности в теории множеств или абстракции также достаточно высокого уровня потенциальной бесконечности в конструктивной математике. «Строгая» математика всегда привлекала таких мыслителей, которые не были озабочены достижением славы; их основными мотивами в течение столетий являлась свобода творчества, преклонение перед силой человеческого интеллекта, красота изучаемого предмета, интеллектуальный восторг при неожиданных открытиях или конструкции новых объектов, порой поражающих своей изящностью, удивительными свойствами и универсальностью перспектив приложений ко многим разделам математики. Эти мотивы математического творчества животворили математику. Полагаю, что эти мотивы сохранятся, но их состав расширится, в частности, за счет проблем, встающих перед образованием в эпоху экспансии компьютеров и компьютерного моделирования и обработки больших массивов данных [Вавилов, 2020]15. Будущее покажет, возникновение каких новых мотивов творчества стимулирует экспансия компьютеров и программных продуктов в сферу математической деятельности.
Вместо заключения: вопросы для размышления
Осмысление феномена воспроизводимости в математике весьма актуально и для этой науки, поскольку касается даже перспектив ее финансирования. Исследование этого феномена требует пристального внимания и в случае математики, поскольку может дать не только новый импульс для ее развития, но и повлиять на природу и добавить новые стимулы для роста математического знания. Использование компьютеров при доказательстве и его проверке приводит в некоторых случаях к потере его обозримости и к переносу центра тяжести в рецепции доказательства на косвенные признаки (уверенность в правильности алгоритмических процедур и пруверов). Все это ведет к необходимости пересмотреть взгляды на степень надежности математических доказательств и оценку их не как достоверных, а лишь как правдоподобных.
Эти проблемы уже активно обсуждаются. В частности, достоверность и объективность в «экспериментальной» математике, которая касается и обработки больших массивов данных, существенно повышается, когда предпринимается предварительная регистрация целей, гипотез и методов предполагаемого исследования [Cockburn, Dragicevic et al., 2020, р. 76]. Кроме того, в целях воспроизведения результатов компьютерного моделирования весьма желательно (а часто и необходимо) описание программного обеспечения с открытым исходным кодом, которое обеспечивает исправление ошибок и дефектов программы, а также получение ее усовершенствованных версий [Fehr, Heiland et al., 2016, p. 265].
Нормативы работы, как и мотивы математического творчества в эпоху «пост-строгой» математики, по всей видимости, могут претерпеть существенные изменения, а сама эпоха поднимает массу еще не вполне осмысленных проблем, да и не сформулированных пока сколько-нибудь четко [см.: Krantz, 2011, p. 117-133; Avigad, 2018, p. 682-683]. Назову только лишь несколько, касающихся процедур доказательства: какой статус в этой ситуации будет придан феномену воспроизводимости (репликации) доказательства? Сохранится ли, и если да, то в каком качестве, требование к обозримости доказательства? Способны ли машинные доказательства помочь концептуальному пониманию новых достижений в математике? Могут ли быть экстраполированы методы активации и поддержки интуиции математиков, всегда игравшие важную роль в научном поиске контрпримеров для полученных результатов с помощью искусственного интеллекта или нейронных сетей [Davies, Velickovic et al., 2021, p. 71]? В какой мере могут быть ослаблены или модифицированы требования к доказательству в прикладной математике? Если это произойдет, то не разойдутся ли пути философии математики как таковой и философии математической практики [Livingston, 2021]? Заставит ли расширение применения компьютеров для доказательств теорем изменить стиль математического мышления? Как этот процесс может повлиять на феномен «интеллектуальной щедрости», который чрезвычайно важен для активного обмена идеями в математическом сообществе [Lea Morris, 2021, р. 364] и, значит, прогресса математического знания? Список открытых проблем можно легко продолжить.
Для философии науки и философии математики открываются широкие горизонты для размышлений и анализа.
Список литературы
Вавилов, 2020 - Вавилов Н.А. Компьютеры как новая реальность в математике: I. Personal account // Компьютерные инструменты в образовании. 2020. № 2. С. 5-26.
Нечаев, 2021 - Нечаев Ю.И. Концептуальный базис нейрокомпьютерных систем в среде современной компьютерной математики // Нейрокомпьютеры: разработка, применение, 2021. № 2. С. 5-15.
Савельев, 2020 - Савельев А.В. История и современность нейрокомпьютинга // Нейрокомпьютеры: разработка, применение. 2020. № 4. С. 61-66.
Allison, Shiffrin, Stodden, 2018 - Allison D.B., Shiffrin R.M., Stodden V. Reproducibility of research: Issues and proposed remedies // PNAS. 2018. Vol. 115. No. 11. P. 2561-2562.
Aguilar, 2020 - Aguilar M.S. Replication Studies in Mathematics Education: what kind of questions would be productive to explore? // International Journal of Science and Mathematics Education. 2020. Vol. 18. P. 37-50.
Andersen, 2020 - Andersen L.E. Acceptable Gaps in Mathematical Proofs // Synthese. 2020. Vol. 197. P. 233-247.
Avigad, 2018 - Avigad J. The mechanization of mathematics // Notices of AMS. 2018. Vol. 65. No. 6. P. 681-690.
Avigad, 2022 - Avigad J. Varieties of mathematical understanding // Bulletin of the American Mathematical Society. 2022. Vol. 59. No. 1. P. 99-117.
Bazhanov, 2008 - Bazhanov V.A. Proof as an Ethical Procedure // Science and Ethics. The Axiological Contexts of Science / E. Agazzi, F. Minazzi (eds.). Bruxelles, Bern, Berlin, Frankfurt am Main, New York, Oxford, Wien: Peter Lang, 2008. P. 185-193.
Bazhanov, 2012 - Bazhanov V.A. Mathematical Proof As a Form of Appeal to a Scientific Community // Russian Studies in Philosophy. Vol. 50. No. 4. P. 52-72.
Bibel, 2007 - Bibel W. Early History and Perspectives of Automated Deduction // KI 2007: Advances in Artificial Intelligence. Lecture Notes in Computer Science / J. Hertzberg, M. Beetz, R. Englert (eds.). Vol 4667. Berlin, Heidelberg: Springer, 2007. P. 2-18.
Bordg, 2021 - Bordg A. A Replication crisis in mathematics? // The Mathematical Intelligencer. 2021. Vol. 43. No. 4. P. 48-52.
Buzzard, 2020 - Buzzard K. Proving theorems with computers // Notices of AMS. 2020. Vol. 67. No. 11. P. 1791-1799.
Cipora, Soltanlou, 2021 - Cipora K., Soltanlou M. Direct and Conceptual Replication in Numerical Cognition // Journal of Numerical Cognition. 2021. Vol. 7 (3). P. 240-247.
Cockburn, Dragicevic et al., 2020 - Cockburn A., Dragicevic P. et al. Threads of a Replication Crisis in Empirical Computer Science // Communications of the ACM. 2020. Vol. 63. No. 8. P. 70-79.
Coveney, Highfield, 2021 - Coveney P.V., Highfield R.R. When We can Trust Computes (and When We Can't) // Philosophical transactions. Series A, Mathematical, physical, and engineering sciences. 2021. Vol. A379. Article 20200067. DOI: 10.1098/rsta.2020.0067.
Coveney, Groen, Hoekstra, 2021 - Coveney P.V., Groen D., Hoekstra A.G. Reliability and reproducibility in computational science: implementing validation and uncertainty quantification in silico // Philosophical transactions. Series A, Mathematical, physical, and engineering sciences. 2021. Vol. A379. Article 20200409. DOI: 10.1098/rsta.2020.0409.
Dawson, 2006 - Dawson J.Jr. Why do mathematicians Re-prove theorems // Philosophia Mathematica. 2006. Vol. 14. P. 269-286.
Davies, Velickovic et al., 2021 - Davies A., Velickovic P. et al. Advancing mathematics by guiding human intuition with AI // Nature. 2021. Vol. 600. P. 70-74.
Fallis, 2003 - Fallis D. Intentional Gaps in Mathematical Proofs // Synthese. 2003. Vol. 134. P. 45-69.
Fanelli, 2018 - Fanelli D. Is science really facing a reproducibility crisis, and do we need it to? // PNAS. 2018. Vol. 115. No. 11. P. 2628-2631.
Fehr, Heiland et al., 2016 - Fehr J., Heiland J. et al. Best practices for replicability, reproducibility and reusability of computer-based experiments exemplified by model reduction software // AIMS Mathematics. 2016. Vol. 1 (3). P. 261-281.
Freese, 2017 - Freese J. Replication in Social Science // Annual Review of Sociology. 2017. Vol. 43. P. 147-165.
Hersh, 1993 - Hersh R. Proving is convincing and explaining // Educational Studies in Mathematics. 1993. Vol. 24. No. 4. P. 389-399.
Heule, 2017 - Heule M.J.H. Schur number five // arXivLabs. November 21, 2017. URL: https://doi.org/10.48550/arXiv.1711.08076 (дата обращения: 01.02.2022).
Hicks, 2021 - Hicks D.J. Open science, the replication crisis, and environmental public health // Accountability in Research. 2021 (online version). DOI: 10.1080/08989621.2021. 1962713.
Jankvist, Aquilar et al., 2021 - Jankvist U.Th., Aquilar M.S. et al. Launching Implementation and Replication Studies in Mathematics Education // Implementation and Replication Studies in Mathematics Education. 2021. Vol. 1. Issue 1. P. 1-19.
Krantz, 2011- Krantz S.G. The Proof is in Pudding. The Changing Nature of Mathematical Proof. New York: Springer, 2011. XVII, 227 p.
Lakatos, 1978 - Lakatos I. Mathematics, science and epistemology / J. Worral, G. Currie (eds.). Cambridge: Cambridge University Press, 1978.
Lamb, 2016 - Lamb E. Two-hundred-terabyte maths proof is largest ever // Nature. 2016. Vol. 534. P. 17-18.
Lea Morris, 2021 - Lea Morris R. Intellectual generosity and the reward structure of mathematics // Synthese. 2021. Vol. 199. P. 345-367.
Livingston, 2021 - Livingston E. Practical reasoning and witnessably rigorous proof // Synthese. 2021. Vol. 199. P. 2277-2991.
Mede, Schafer et al., 2021 - Mede N.G., Schafer M.S. et al. The "replication crisis" in the public eye: German awareness and perceptions of the (ir)reproducibility of scientific research // Public Understanding of Science. 2021. No. 1. P. 91-102.
Plesser, 2018 - Plesser H.E. Reproducibility vs. Replicability: A Brief History of a Confused Terminology // Frontiers in Neuroinformatics. 2018. Vol. 11. Article 76. DOI: 10.3389/fninf. 2017.00076.
Randall, Welser, 2018 - Randall D., Welser Ch. The reproducibility crisis of modern science: causes, consequences, and the road to reform. N.Y.: National Association of scholars, 2018. IV. 70 p.
Redish, Kummerfeld et al., 2018 - Redish A.D., Kummerfeld E. et al. Reproducibility failures are essential to scientific inquiry // PNAS. 2018. Vol. 115. No. 20. P. 5042-5046.
Reproducibility and Replicability in Science, 2019 - Reproducibility and Replicability in Science. Washington, D.C.: The National Academics press, 2019. DOI: 10.17226/25303
Rittberg, 2021 - Rittberg C.J. Intellectual Humility in Mathematics // Synthese. 2021. Vol. 199. P. 5571-5601.
Schnell, 2018 - Schnell S. "Repoducible" research in mathematical sciences requires changes in our peer review culture and modernization of our current publication approach // Bulletin of Mathematical Biology. 2018. Vol. 80 (2). P. 3095-3105.
Does the reproducibility crisis affect mathematics?
Valentin A. Bazhanov
Ulyanovsk State University, Department of Philosophy. 42 L. Tolstoy Str., Ulyanovsk, 432000, Russian Federation; e-mail: [email protected]
Reproducibility crisis in science accepted by academia as acute issue (including the problem of funding). The goal of this article is to discuss how the phenomenon and the crisis of reproducibility is manifested in mathematics, and how it perceived by the mathematical community. We argue that traditional approaches to the analysis of the proof in mathematics presuppose its visibility, the possibility of fundamental verification of all steps of the proof by competent members of the scientific community. The meaning of the mathematical proof seen in its aim to convince community members of the correctness as a whole, and validity of all its components. By presenting a proof, its author takes on the (moral) responsibility that the statement (theorem) she formulates is correct, and everyone can repeat the path that leads to its justification. The increasing complexity of mathematical proofs in the course of its historical development and, above all, the expansion of computers as important elements of the proof, leads in some cases to the loss of its visibility. Thus, the shift of the reception of the proof to indirect signs is rather evident (confidence in the correctness of algorithmic procedures and provers). All this leads to the need to reconsider views on the degree of reliability of mathematical proofs and their assessment not as reliable, but only as plausible. This is the basis for characterizing the new era in the development of mathematics as "post-rigorous", which raises serious problems related to comprehension and analysis of reproducibility in mathematics, and the status of proof in this era. These problems especially relevant in the context of expansion into the sphere of mathematical creativity of computer-based simulation and computers as a tool of discourse.
Keywords: reproducibility, mathematics, applied mathematics, proof, computer proof methods, post-rigor
Acknowledgements: The reported study was funded by the Russian Science Foundation, project No. 21-18-00428 "Political subjectivity of Modern Science: interdisciplinary analysis at the intersection of Philosophy of science and Philosophy of Politics" in the Russian Society of History and Philosophy of Science.
References
Allison, D.B., Shiffrin, R.M., Stodden, V. "Reproducibility of research: Issues and proposed remedies", PNAS, 2018, vol. 115, no. 11, pp. 2561-2562.
Aguilar, M.S. "Replication Studies in Mathematics Education: what kind of questions would be productive to explore?", International Journal of Science and Mathematics Education, 2020, vol. 18, pp. 37-50.
Andersen, L.E. "Acceptable Gaps in Mathematical Proofs", Synthese, 2020, vol. 197, pp. 233-247.
Avigad, J. "The mechanization of mathematics", Notices of AMS, 2018, vol. 65, no. 6, pp. 681-690.
Avigad, J. "Varieties of mathematical understanding", Bulletin of the American Mathematical Society, 2022, vol. 59, no. 1, pp. 99-117.
Bazhanov, V.A. "Proof as an Ethical Procedure", Science and Ethics. The Axiological Contexts of Science, E. Agazzi, F. Minazzi (eds.). Bruxelles, Bern, Berlin, Frankfurt am Main, New York, Oxford, Wien: Peter Lang, 2008, pp. 185-193.
Bazhanov, V.A. "Mathematical Proof as a Form of Appeal to a Scientific Community", Russian Studies in Philosophy, 2012, vol. 50, no. 4, pp. 52-72.
Bibel, W. "Early History and Perspectives of Automated Deduction", KI2007: Advances in Artificial Intelligence. Lecture Notes in Computer Science, J. Hertzberg , M. Beetz, R. Englert (eds.), vol. 4667. Berlin, Heidelberg: Springer, 2007, pp. 2-18.
Bordg, A. "A Replication crisis in mathematics?", The Mathematical Intelligencer, 2021, vol. 43, no. 4, pp. 48-52.
Buzzard, K. "Proving theorems with computers", Notices of AMS, 2020, vol. 67, no. 11, pp. 1791-1799.
Cipora, K., Soltanlou, M. "Direct and Conceptual Replication in Numerical Cognition", Journal of Numerical Cognition, 2021, vol. 7 (3), pp. 240-247.
Cockburn, A., Dragicevic, P. et al. "Threads of a Replication Crisis in Empirical Computer Science", Communications of the ACM, 2020, vol. 63, no. 8, pp. 70-79.
Coveney, P.V., Highfield, R.R. "When We can Trust Computes (and When We Can't)", Phil. Trans. R. Soc., 2021, vol. A379, article 20200067. DOI: 10.1098/rsta.2020.0067.
Coveney, P.V., Groen, D., Hoekstra, A.G. "Reliability and reproducibility in computational science: implementing validation and uncertainty quantification in silico", Philosophical transactions. Series A, Mathematical, physical, and engineering sciences, 2021, vol. A379, article 20200409. DOI: 10.1098/rsta.2020.0409.
Dawson, J.Jr. "Why do mathematicians Re-prove theorems", Philosophia Mathematica, 2006, vol. 14, pp. 269-286.
Davies, A., Velickovic P. et al. "Advancing mathematics by guiding human intuition with AI", Nature, 2021, vol. 600, pp. 70-74.
Fallis, D. "Intentional Gaps in Mathematical Proofs", Synthese, 2003, vol. 134, pp. 45-69.
Fanelli, D. "Is science really facing a reproducibility crisis, and do we need it to?", PNAS, 2018, vol. 115, no. 11, pp. 2628-2631.
Fehr, J., Heiland, J. et al. "Best practices for replicability, reproducibility and reusability of computer-based experiments exemplified by model reduction software", AIMS Mathematics, 2016, vol. 1 (3), pp. 261-281.
Freese, J. "Replication in Social Science", Annual Review of Sociology, 2017, vol. 43, pp. 147-165.
Hersh, R. "Proving is convincing and explaining", Educational Studies in Mathematics, 1993, vol. 24, no. 4, pp. 389-399.
Heule, M.J.H. "Schur number five", arXivLabs, November 21, 2017 [https://doi.org/ 10.48550/arXiv.1711.08076, accessed on 01.02.2022].
Hicks, D.J. "Open science, the replication crisis, and environmental public health", Accountability in Research, 2021 (online version). DOI: 10.1080/08989621.2021.1962713.
Jankvist, U.Th., Aquilar, M.S. et al. "Launching Implementation and Replication Studies in Mathematics Education", Implementation and Replication Studies in Mathematics Education, 2021, vol. 1, issue 1, pp. 1-19.
Krantz, S.G. The Proof is in Pudding. The Changing Nature of Mathematical Proof. New York: Springer, 2011. XVII, 227 pp.
Lakatos, I. Mathematics, science and epistemology, J. Worral, G. Currie (eds.). Cambridge: Cambridge University Press, 1978.
Lamb, E. "Two-hundred-terabyte maths proof is largest ever", Nature, 2016, vol. 534, pp. 17-18.
Lea Morris, R. "Intellectual generosity and the reward structure of mathematics", Synthese, 2021, vol. 199, pp. 345-367.
Livingston, E. "Practical reasoning and witnessably rigorous proof", Synthese, 2021, vol. 199, pp. 2277-2991.
Mede, N.G., Schafer, M.S. et al. "The "replication crisis" in the public eye: German awareness and perceptions of the (ir)reproducibility of scientific research", Public Understanding of Science, 2021, no. 1, pp. 91-102.
Nechayev, Yu.I. "Kontseptual'nyy bazis neyrokomp'yuternykh sistem v srede sovremennoy komp'yuternoy matematiki" [Conceptual basis of neurocomputer systems in the environment of modern computer mathematics], Neyrokomp'yutery: razrabotka, primeneniye [Neurocomputers: development, application], 2021, no. 2, pp. 5-15. (In Russian)
Plesser, H.E. "Reproducibility vs. Replicability: A Brief History of a Confused Terminology", Frontiers in Neuroinformatics, 2018, Vol. 11, article 76. DOI: 10.3389/fninf.2017.00076.
Randall, D., Welser, Ch. The reproducibility crisis of modern science: causes, consequences, and the road to reform. N.Y.: National Association of scholars, 2018. IV. 70 pp.
Redish, A.D., Kummerfeld, E. et al. "Reproducibility failures are essential to scientific inquiry", PNAS, 2018, vol. 115, no. 20, pp. 5042-5046. DOI: 10.1073/pnas.1806370115.
Reproducibility and Replicability in Science. Washington, D.C.: The National Academics press, 2019. DOI: 10.17226/25303.
Rittberg, C.J. "Intellectual Humility in Mathematics", Synthese, 2021, vol. 199, pp. 5571-5601.
Saveliev, A.V. "Istoriya i sovremennost' neyrokomp'yutinga" [History and modernity of neurocomputering], Neyrokomp'yutery: razrabotka, primeneniye [Neurocomputers: development, application], 2020, no. 4, pp. 61-66. (In Russian)
Schnell, S. "'Repoducible' research in mathematical sciences requires changes in our peer review culture and modernization of our current publication approach", Bulletin of Mathematical Biology, 2018, vol. 80 (2), pp. 3095-3105.
Vavilov, N.A. "Komp'yutery kak novaya real'nost' v matematike: I. Personal account" [Computers as a new reality in mathematics: I. Personal account], Kompyuternyye instrumenty v obrazovanii [Computer tools in education], 2020, no. 2, pp. 5-26. (In Russian)