DIGITAL DOPING FOR HISTORIANS: CAN HISTORY, MEMORY, AND HISTORICAL THEORY BE RENDERED ARTIFICIALLY INTELLIGENT?
Kansteiner Wulf, Professor with Special Responsibilities, Aarhus University, Aarhus, Danmark
Artificial intelligence is making history, literally. Machine learning tools are playing 3 key role in crafting images and stories about the past in popular culture, AI has probably also already invaded the history classroom. Large language models such as GPT 3 are able to generate compelling, non-plagiarized texts in response to simple natural language inputs, thus providing students with an opportunity to produce high-quality written assignments with minimum effort. In a simitar vein, tools like GPT-j are likely to revolutionize historical studies, enabling historians and other professionals who deal in texts to rely on AI-genera ted intermediate work products, such as accurate translations, summaries, and chronologies. Biit present-day large language models fail at key tasks that historians hold in high regard. They are structurally incapable oj telling the truth and. tracking pieces of information through layers of texts. What's more, they lack ethical self-reflexhity. There-fore, for the time being, the writing of academic history will require human agency. But for historical theorists, large language models might offer an opportunity to test basic hypotheses about the nature of historical writing. Historical theorists can, for instance, have customized large language models write a series of descriptive, narrative, and assertive histories about the same events, thereby enabling them to explore the precise relation between description, narration, and argumentation in historical writing. In short, with specifically designed large language models, historical theorists can run the kinds of large-scale writing experiments that they could never put into practice with real historians-Keywords: artificial intelligence (AI): GPT-3; historical theory; collective memory; historical writing; large language models; description; narration; argumentation; Open AI; machine learning.
EON: HYCWRL; DOI; 10.24923/33058757.3033-13.5
УДК 130.2 ВАК 5.10.2
© Канштайнер В., 2023 © Григорьева М.А., перевод с англ., 2023
Kansteiner W. Digital doping for historians: can history, memory, and historical theory be rendered artificially intelligent?// History and ITieory. Vol. 61. no. 4 (December 2022), 119-133. Published by Wiley Periodicals LLC on behalf of Wesieyan University. DO): 10.1m/ hiih.12282. First published: 16 December 2022 https://doi.org/ 10.im/hith.1.2282
ЦИФРОВОЙ ДОПИНГ ДЛЯ ИСТОРИКОВ: МОЖНО ЛИ СДЕЛАТЬ ИСТОРИЮ, ПАМЯТЬ И ИСТОРИЧЕСКУЮ ТЕОРИЮ ИСКУССТВЕННЫМ ИНТЕЛЛЕКТОМ?
Искусственный интеллект буквально творит историю. Инструменты машинного обучения играют ключевую роль в создании изображений и историй о прошлом в популярной культуре. ИИ, вероятно, также уже вторгся в классы истории. Большие языковые модели, такие как СРТ~з, способны генерировать привлекательные тексты без плагиата в ответ на простые входные данные на естественном языке, что дает учащимся возможность выполнять высококачественные письменные задания с ми-нима/1ьными усилиями. В том же ключе такие инструменты, как СРТ-з, вероятно, произведут революцию в исторических исследованиях, позволив историкам 1; другим специалистам, рабогтиощим с текстами, пола-ггипься на промежуточные рабочие продукты, созданные ИИ, такие как точные переводы, резюме и хронологии. Но современные большие языковые модели не справляются с мючевыми задачами, которые историки высоко ценят. Они структурно не способны говорить правду и отслеживать фрагменты информации через слои текстов. Более того, им не хватает этической саморефлексии. Поэтому на данный момент для написания академической истории потребуется участие человека. Но для историков-теоретиков большие языковые модели могут дать возможность проверить основные гипотезы о природе исторического письма. Исторические теоретики могут, напримф, настроить большие языковые модели, чтобы написать серию описательных:, повествовательных и утвердительных историй об одних и тех же событиях, что помедлит им исследовать точную связь между описанием, повествованием и аргументацией в историческом письме. Короче говоря, со специа/1ыю разработанными большими языковыми моделями историки-теоретики могу т провой чпь крупномасштабные письмённые эксперимег¡ты, которые они никогда не смогли бы осуществить на практике с настоящими историками.
Ключевые слова: искусственный интеллект (ИИ); ГШ'-Щ историческая теория; коллективная память; историческое письмо; большие языковые модели; описание; повествование; аргументация; Открытый ИИ; машинное обучение.
о
Историки пишут тексты, и сами будучи частью времени, в котором работают, они помогают формировать культуру памяти двадцать первого века не только в музеях, мемориалах, но и через телешоу и видеоигры. [i] Монографии, которые докторанты подшивают в конце своей творческой работы с источниками, включая оцифрованные и визуальные; источники, принимают формат, который не сильно изменился со времен Леопольда фон Ранке. Цифровая копия "Истории Реформации в Германии" показывает, что Ранке, как и его ученики двадцать первого века, сначала использует сноски для обсуждения терминологии, прежде чем установить ритм включения одной или двух сносок, содержащих ссылки на первоисточники на каждой странице, [г] Текстовое приложение сноски уже было знакомо современникам Ранке, хотя никому из ученых и литературных предшественников Ранке не удавалось сделать приложение столь доступным для читателя, так, что в итоге этот вариант был принят за эталон в оформлении сносок. [3] Сноска, ставшая благодаря Ранке привлекательной, удостоверила эпистемологическую целостность письменного текста как в символическом, так и в практическом плане. Сегодня сноска и то, что она представляет, может оказаться долгожданным камнем преткновения, когда историки входят в мир искусственного интеллекта (ИИ).
Поскольку историки так же сосредоточены на текстах, как и они, последний прорыв в области искусственного интеллекта, генерирующего текст, откроет новые возможности для исторических исследований и преподавания и сгори и и, вероятно, определит будущее дисциплины. [4] Однако остаются нерешенные вопросы. Существующие в настоящее время технологии машинного обучения, основанные на искусственном интеллекте, способны создавать грамматически безупречные и семантически убедительные тексты, которые даже опытные читатели не могут отличить от написанного человеком. [5] Кроме того, инструменты машинного обучения можно привести в действие простыми короткими командами на естественных языках. Но эти большие языковые модели (LLM), как их называют, разрабатываются с коммерческими целями и, насколько нам известно, не способны отличить правду от лжи. [6] Они могут писать в стиле Ранке и, как часть этого стилистического упражнения, даже создавать правдоподобные сноски внизу страницы. Но они, в отличие от Ранке, не могут давать правдивых сносок. Наиболее совершенным общедоступным LLM является GPT-3; он был
=
¿6 СО
со
Н К
Г
57
КАНШТАИНЕР Вулъф, профессор, Орхусский университет, Орхус, Дания
разработан базирующейся в Сан-Франциско (сначала благотворите.!ьной, а затем коммерческой) инициативой Open AI. [7] GPT-3 структурно не может приписать утверждения, которые он генерирует, определенному текстовому происхождению, не говоря уже об оценке фактической достоверности л юбого из его текстовых входи ых ил и выходных данных. LLM еще не могуг оперировать категориями референциальной истины, которые составляют основную предпосылку для изучения исторической дисциплины. Им не хватает вертикальной памяти, необходимой для создания точных ссылок. Вместо этого они следуют простой, но мощной горизонтальной логике, снова и снова спрашивая себя, какое слово или знак может следовать за данной последовательностью слов или знаков, и берут огромное количество текстов, которые они усвоили во время обучения, в качестве статистического эталона для построения, это решение по одному слову или знаку за раз и с большой скоростью. |8J Это, возможно, не ракетостроение, но LLM - взрывоопасная технология для всех профессиональных писателей, включая, хотя и не в первую очередь, историков.
Постоянная привязанность к текстам как к предпочтительному для историков профессиональному результату поддерживает прекрасное радение неуклонного накопления исторических знаний. Историки Реформации двадцать первого века сместили аналитический фокус, перейдя от политической истории к социальной и культурной истории и к передовым областям, таким как история эмоций. [9] Занимаясь новыми вопросами и владея новыми концепциями, многие историки признают Ранке лишь мимоходом, хотя они по-прежнему прославляют его за то, что он формировал науку на протяжении более века в результате "огромного диапазона его аналитического видения". [ю] За прошедшие годы произошло многое, в том числе две мировые войны, несколько геноцидов, деколонизация и разочарование во всех видах национализма, но
выводы Ранке, по-видимому, все еще актуарны. Его тексты оааются доступными для цитирования с неизменной истинностной ценностью. Но большой однородный массив исследований представляет собой значительный этический фактор риска для всех текстов, созданных ИИ, включая истории, созданные ИИ. Рано или поздно любые структурные предубеждения, встроенные в текстовый корпус, который использовался для обучения данного LLM, найдут свое отражение в текстовом выводе этого LLM. Проще говоря, если LLM был обучен расистским и сексистским материалам, он, вероятно, будет создавать расистские и сексистские тексты. И трудно избежать использования предвзятого материала для обучения LLM, потому что LLM достигают своих потрясающих человеческих навыков письма только в результате механического поглощения огромного количества текстов, созданных людьми, которые, как правило, содержат много проблемных мнений и предубеждений. Историки прекрасно осознают, но также часто становятся жертвами того же риска воспроизведения искаженных моральных миров своих источников. Inj Однако, в отличие от историков, LLM структурно не могут писать проти в сути своей собственной обучающей ленты. В этом отношении гладкие текстовые поверхности, созданные LLM, скрывают больше моральных недостатков, чем профессионально вылепленные поверхности исторической науки.
Социальная память
Существуют важные разл ичия в социальном конструировании исторической правды внутри исторической профессии, с одной стороны, и социальном конструировании исторической достоверности в широком диапазоне визуальных и иммерсивных медиа, которые поддерживают культуру памяти двадцать первого века, с другой. В принципе, нет никаких причин, по которым историки не должны создавать цифровые фильмы, игры или виртуальную среду с
инфраструктурой "сносок", которые снабжают ссылками и объясняют концептуальный и эстетический выбор. Однако историки убеждены, что при всей их ориентированности на текст они разработали протоколы создания прозаических текстов па основе эмпирических источников, которые, насколько им известно, отражают историческую действительность. Не имея опыта манипулирования другими СМИ, ¡12] историкам будет нелегко решить, какие визуальные изображения прошлых событий -особенно изображения, созданные не на основе документальных материалов, -заслуживают называться исторически точн ы ми. Уч и-тывая множество эстетических параметров фильмов и игр, эта сдержанность имеет смысл, хотя многие исто-рики-теоретики утверждают, что даже прозаические тексты, древние информационные технологии, кото-ры ми. он и являются, передают смысл посредством эстетических и других структурных параметров, которые отделены от текстов, выполняют "референтную функцию". [13]
В культуре визуальной памяти, в отличие от профессионального исторического письма, ИИ уже играет решающую и быст-рорасшпряющукнгя роль, формируя представление людей о том, как Должно было выглядеть и ощущаться прошлое и каким его следует помнить. ИИ, например, хорошо разбирается в чтении и составлении фиксированных изображений. [14] Вспомнить о занимательных результатах инструментов машинного обучения, таких как ОАЬЬ-Е 2, - например, "картины" борцов сумо, которые: были визуализированы в стиле Джорджио де Кирико. [15] Кроме того искусственный интеллект отлично справ-
ляется с создан нем визуальных фонов, спецэффектов и переходных сцен в видеоиграх и фильмах, [16] В результате постоянно расширяющийся диапазон социальных воспоминаний возникает благодаря взаимодействию человека с изображениями, созданными технологией машинного обучения, сеще недостаточно изученными и недооцененными последствиями для эволюции этих социальных воспоминаний. [17] Машины проглотил и ошеломляющее количество изображений, созданных человеком (вместе со всеми предубеждениями и пробелами, которые эти образы влекут за собой), еще не прибегнув к какому-либо набору этических принципов, которые позволили бы им преодолеть эти предубеждения и пробелы.
Есть дополнительные недостатки в триумфальном продвижении ИИ в производстве и хранении визуальной культуры. Инструментам машинного обучения, по-видимому, сложно работать с тем типом визуальной записи, который особенно актуален для историков и режиссеров-документалистов. Визуальной компьютерной аналитике все еще часто мешают движущиеся изображения, особенно документальные кадры с более низким разрешением, У приложений есть проблемы с отслеживанием многих переменных, связанных с распознаванием данного движущегося объекта или человека под разными углами и в разных условиях. [18] Поэтому на данный момент, если оставить в стороне вопросы авторского права и коммерческую жизнеспособность, по-прежнему невозможно собрать полный цифровой перечень движущихся изображений, который мог бы революционизировать наше отношение к
СУЩЕСТВУЮТ ВАЖНЫЕ РАЗЛИЧИЯ В СОЦИАЛЬНОМ КОНСТРУИРОВАНИИ ИСТОРИЧЕСКОЙ ПРАВДЫ ВНУТРИ ИСТОРИЧЕСКОЙ ПРОФЕССИИ И СОЦИАЛЬНОМ КОНСТРУИРОВАНИИ ИСТОРИЧЕСКОЙ ДОСТОВЕРНОСТИ В ШИРОКОМ ДИАПАЗОНЕ ВИЗУАЛЬНЫХ И ИММЕРСИВНЫХ МЕДИА, КОТОРЫЕ ПОДДЕРЖИВАЮТ КУЛЬТУРУ ПАМЯТИ XXI ВЕКА,
визуальной истории двадцатого и двадцать первого веков. Представьте себе полностью доступный для поиска цифровой архив всех материалов фильмов на популярную тему, который ИИ мог бы использовать для выполнения простой подсказки, основанной на исчерпывающем обзоре и выборочной сборке всех существующих материалов по этой теме. Затем искусственный интеллект мог под влиянием момента выпускать заказные 11ау ч по- по пул яр и ые те лев и ркя ш ые передачи - например, документальный фильм об Адольфе Гитлере в стиле Кена Бернса с использованием самых зрелищных кадров из существующих. Пока более мощные вычислительные технологии, например, свободно программируемые квантовые компьютеры, не станут общедоступными.
Давайте все же на мгновение помечтаем и попробуем мечтать ответственно. Как только компьютеры узнают Гитлера и ему подобных со всех сторон, кинокомпании могут быть свободны. Используя большое количество оригинальных кадров и послевоенных постановок, технология ИИ может дать очень компетентные результаты. По сути, зрител и мог;! и бы заставить ИИ создавать свои собственные частные видеоролики, собирая существующие киноматериалы, по одному кадру за раз, чтобы отразить их особые эстетические и повествовательные пристрастия. Однако следует сразу добавить, что это аналоговая мечта, соответствующая интеллектуальным потребностям исторической профессии, а не мечта о машинном обучении, отражающая приоритеты коммерческих поставщиков ИИ. Машина искусственного интеллекта, состоящая из архива искусственного интеллекта, который может анализировать и классифицировать каждый снимок в зависимости от его предмета, точки зрения, освещения, настроек, технического качества и так далее, с одной стороны, и технология искусственного интеллекта, которая может соединять эти кадры в единое целое в ответ на действия зрителя, с другой стороны, сохра-
нят полностью функциональную вертикальную память всего проанализированного материала. По желанию пользователей эта замечательная энергоемкая машина оставит каждый кадр нетронутым, свободным от цифровых манипуляций, а также сможет раскрыть точное происхождение каждого кадра, который он включил, скажем, в документальный фильм по запросу "жизнь Гитлера". По сути, машина, опираясь на обширную систему указателей, могла давать справочные сноски. [19] В этом отношении машина была бы пол ной противоположностью технологии искусственного интеллекта, которая в настоящее время находится на пике. ПАЫ.-Е 2 не собирает аутентичный визуальный материал; он изобретает новый (иногда выглядящий аутентичным) материал, и его акты кажущегося творчества возникают из структуры корпуса, который использовался для его обучения, а не из каких-либо конкретных образов в этом корпусе.
На первый взгляд, наша воображаемая машина зрительной памяти должна осчастливить историков и архивистов, хотя полный перечень документальных фильмов и телевизионных материалов двадцатого и двадцать первого веков сможет дать правдивый результат только в том случае, если материал, каким бы обширным он ни был, был подвергнут человеческому контролю качества и последовательно проверен фильтрами ИИ, которые были обучены обнаруживать цифровые манипуляции с материалом. В противном случае наша визуальная база данных была бы быстро заражена другими достижениями ИИ, такими как дип-фейки, которые регулярно появляются в медиапотоке и которые трудно удалить из быстроменяющихся цифровых платформ, которые стимулируют нашу культуру памяти. [20] А дипфейки - это только верхушка айсберга. Наш воображаемый корпус кино и телематериалов двадцатого и двадцать первого веков будет содержать множество технически безупречных, не подвергавших-
ся манипуляциям исторических материалов, а технологи и глубокого обучения дадут представление о любых предубеждениях, содержащихся в материале. Нацистские пропагандистские фильмы, например, структур!-1 о больше сов мести м ы с неонацистски ми сюжетами жизни Гитлера, чем с антифашистскими, Тем больше причин для человеческого контроля качества входных и выходных данных, что в отношении кино и телевидения является амбициозным - но, возможно, не совсем нереалистичным -предложением. Если мы думаем, что истории и образы, которые мы потребляем, влияют на наши воспоминания, личность и поведение в будущем, мы должны быть очень осторожны, позволяя ИИ создавать наши будущие развлечения на основе нашего морально и политически глубоко ущербного культурного наследия. Правильная политика памяти в эпоху цифровых технологий, по-видимому, требует разумных и всепроникающих усилий по цензуре. [21] Наш утопический/антиутопический мысленный эксперимент, который в настоящее время вряд ли станет реальностью, подчеркивает серьезную дилемму, лежащую в основе всех технологий ИИ. С одной стороны, технология становится невероятно эффективной в задаче самогенерирования медиапродуктов, привлекательных для своих потребителей-людей, только благодаря огромному, не избирательному потреблению подобных медиапродуктов. Машина может решить, какая сцена должна правдоподобно следовать задругой сценой, потому что она может рассчитать, какие сцены, вероятно, будут следовать одна задругой, основываясь на структуре обширного корпуса, который она впитала. Это на-
дежно создает вывод, который по уважительным причинам напоминает потребителям СМИ о других продуктах на ту же тему. С другой стороны, и это важно, машина действует по принципу последовательного правдоподобия, а не правдивости. [22]
История
На этом этапе нашего контрфактического сценария мы, вероятно, будем благодарны историкам, которые, несмотря на методологическую и эстетическую консервативность, придерживаются своего проверенного временем текстового формата для передачи исторических знаний. Они вряд ли будут глубоко вовлечены в визуально и тактильно иммерсивную культуру памяти, создан ную искусственным интеллектом будущего. Но нет причин расслабляться. Все описанные выше дилеммы относительно будущего цифрового визуального архива уже применимы к мире текстов. Большие языковые модели, в отличие от больших киномоделей, уже существуют. Они пишут по-человечески, не могут отличить правдивые утверждения от ложных и быстро распространяют структурные предубеждения, содержащиеся в материале, который использовался для их обучения. Именно благодаря своему текстовом}' фетишизму историки, идя по стопам других профессиональных писателей, - нравится им это или нет - вот-вот вылетят из дальних рядов на передовые позиции цифровой революции. Допустим, 1ХМ могут оказать ценную, экономящую время помощь в написании академических текстов, факт, который, вероятно, не упускают из виду более предприимчивые представители исторической профессии, их
ЕСЛИ МЫ ДУМАЕМ, ЧТО ИСТОРИИ И ОБРАЗЫ, КОТОРЫЕ МЫ ПОТРЕБЛЯЕМ, ВЛИЯЮТ НА НАШИ ВОСПОМИНАНИЯ, ЛИЧНОСТЬ И ПОВЕДЕНИЕ В БУДУЩЕМ, МЫ ДОЛЖНЫ БЫТЬ ОЧЕНЬ ОСТОРОЖНЫ, ПОЗВОЛЯЯ ИИ СОЗДАВАТЬ НАШИ БУДУЩИЕ РАЗВЛЕЧЕНИЯ НА ОСНОВЕ НАШЕГО МОРАЛЬНО И ПОЛИТИЧЕСКИ ГЛУБОКО УЩЕРБНОГО КУЛЬТУРНОГО НАСЛЕДИЯ.
руководители и их аспиранты. После многих лет ажиотажа и разочарований ИИ, наконец, оправдал большие надежды и взял на себя рутинное производство текстов для потребления человеком: "Люди, чья работа все еще заключается в написании, будут все чаще поддерживаться такими инструментами, как СРТ-з". [23] Будучи самой передовой общедоступной моделью большого языка, СРТ-з производит более 4,5 миллиардов слов каждый день, и с учетом этого результата она, вероятно, создает значительную долю всех текстов, предназначенных для человеческого восприятия. Как лаконично выразился Тобиас Риз: "Мы подвержены потоку нечеловеческих слов". ¡ 24]
Большое количество текстов, написанных исторической профессией, может стать мечтой для нейронных сетей ИИ и, возможно, также для историков, хотя "большой" и "мечта" здесь - относительные термины. Совокупный результат всех историков, созданных со времен Ранке, представляет собой лишь небольшую закуску для универсальных языковых моделей, таких как СРТ-з. [25] Более того, модели, вероятно, не могут мечтать. По мнению большинства - но далеко не всех - экспертов, модели лишены сознания и, следовательно, способности планировать заранее, быть по-насгояще-му творческими и мечтать. [26]
Опять же, насколько изобретательны историки на самом деле? Разве видение истории как научного направления не всегда включало в себя идею о том, что два профессиональных историка, имеющих сопоставимый уровень последипломного образования, разделяющие схожие этические ценности и снабженные одними и теми же данными, одними и теми же исследовательскими вопросами и одними и теми же концептуальными схемы - придут к в значительной степени: совместимым, интерсубъективно достоверным результатам? Идеальный тип научного историка напоминает алгоритм в том смысле, что дисциплинированный ум историка надежно производит аналогичные
результаты из аналогичных входных данных. Кажется, сущесгвует естественная близость между самыми передовыми формами ИИ и исторической дисциплиной. Оба проявляют особое пристрастие к правилам, предсказуемости и письменному слову. Следовательно, историческое знание может быть именно тем воображением, связанным с методом, которое ИИ может надежно имитировать. Как и в СРТ-з, историки пишут о том, что они где-то прочитали, но решающее различие между ними состоит в том, что историки пытаются улови ть в этом "что-то еще".
Брак ИИ и исторической профессии станет свадьбой мечты только в том случае, если ИИ разовьет сознание и начнет заботиться о правдивости своих утверждений или, что более вероятно, если инструменты ИИ смогут быть собраны в возможной будущей GPT-History, которая строится на других принципах построения, чем доступные в настоящее время LLM. Во-первых, GPT-History потребуется архивный компонент, который намного больше раскрывает происхождение, по крайней мере, некоторых из его текстовых выходных данных. Подобно GPT-Film, представленному выше, GPT-History потребуется вертикальная память, которая позволит ему предоставлять сноски для цитат и резюме текстов, которые он считает относящимися к данному запросу историка. Кроме того, текстотворческая составляющая CPT-History должна обучаться исключительно с помощью правдивых текстов и новейших научных разработок.
Скорее всего, машинное обучение уже играет роль в истории, как и во многих тек-стоориентированн ых, регламентированных искусствах и профессиях, таких как литература, журналистика и юриспруденция. [27] Во всех этих условиях ИИ в первую очередь (и иногда разумно) используется для рутинных, небольших письменных задач, и масштаб успешного написания ИИ, вероятно, будет быстро увеличиваться. Одно значение для истории очевидно. Дисциплина
должна приобрести более мягкие и гибкие определения пл агиата, не в последнюю очередь потому, что мы, вероятно, столкнемся с волной умных студентов, сдающих задания. которые будут написаны с помощью инструментов машинногообучеиия и которые может быть трудно разоблачить как подделки, особенно если учащиеся используют инструменты последовательно на протяжении всей своей карьеры в колледже. [28] По словам Майка Шарплса, "студент теперь может создать целое эссе или задание за считанные секунды по цене около i Цента США". [29] Фактически, я думаю, что ответственное использование инструментов машинного письма, особенно умение создавать эффективные подсказки на естественном языке для LLM, должно стать ключевым компонентом всех программ бакалавриата. В конце концов, мы также отказались от идеи, что правильное написание является признаком истинного ученого. Кроме того, GPT-3-отличная платформа для некоторых задач, таких как предоставление грамотных конспектов статей и целых книг. [30]
То, что работает для студентов, в принципе должно работать и для ученых. Давайте рассмотрим некоторые инновационные ориентиры в области истории Холок оста и геноцида в качестве контрфактических примеров. В 2007 году, после десятилетий памяти о Холокосте, в которой особое внимание уделялось точке зрения жертв, Саул Фридлендер включил эту точку зрения в мультиперспективный отчет об установленной истории "Окончательного решения". [31] В 20Ю году специалист по истории Восточной Европы Тимоти Снайдер пересказал историю массовых преступлений до и во время Второй мировой войны с точки зрения восточноевропейской коллективной памяти, которая развивалась после окончания Холодной войны. [32] Оба проекта свидетельствуют об актуальности социальных воспоминаний, и оба, возможно, извлекли выгоду из программного обеспечения для анализа текстов. Например, анализ текста
мог помочь обоим авторам найти полезные описания конкретных исторических сцен или мест из мемуаров выживших и других источников. [33] Аналогичным образом, оба проекта могли бы извлечь выгоду из технологии искусственного интеллекта, генерирующей текст, если бы такие машины, как СРТ-з, уже существовали. А1 мог бы, например, предоставить краткие хронологические сводки действий и заявлений Гитлера или Сталина, которые авторы могли бы дополнительно обработать и включить в свои рукописи.
В настоящее время "краткий" является здесь рабочим термином. В зависимости от используемых подсказок СРТ-з, например, имеет тенденцию повторяться через несколько страниц и имеет особую склонность к расистским и сексистским разглагольствованиям, которые отражают доминирующие темы, считанные СРТ-з €ерез Интернет-тексты, социальные сети, цифровые книги и Википедию. [34] Поэтому некоторые эксперты пришли к выводу, что "СРТ-з ~ это выдающаяся технология, но такая же умная, осознанная, проницательная, чувствительная и разумная (и т. д.), как старая пишущая машинка". [35] Более тщательно подобранные обучающие тексты, вероятно, приведут к другим резул ьтатам, хотя повторяющийся характер продукции не может быть лепЦ преодолен с помощью доступных в настоящее время технологий. В СРТ-з встроен фактор случайности для повышения его "творческого потенциала", но проблема остается в том, что СРТ-з не забывает ответ на один вопрос, отвечать на который она была обучена снова и снова: "какое слово является наиболее вероятным?", "следовать данному предложению или фразе?". Алгоритмам можно приказать опускать или не одобрять явно расистские и секшстские термины, но они все равно будут повторять их. Трудно просить их забыть и целенаправленно импровизировать, потому что в выводе обновленной версии СРТ, которая была обучена большей степени забывчивости,
может не хватать концептуальной и стилистической связности. В данный момент, технология машинного обучения просто не встроена в сложные нейронные сети, способные совершать новаторские, мотивированные скачки творческого воображения, которые обычно совершают творческие писатели и историки. Тем не менее, на первый взгляд, технология отлично справляется с созданием интеллектуал ьных текстовых блоков, которые, по-видимому, готовы к вставке в следующую научную статью или могюграфи ю - то есгь до тех пор, пока вь! снова не споткнетесь о мелочь сноски и справочной, вертикальной память, которую представляют сноски,
В ходе нескольких недавних экспериментов СРТ-з удалось написать более или менее убедительно звучащие академические статьи, в том числе довольно разочаровывающую статью о себе, которая была отправлена на рецензирование. |з6] Но в этих экспериментах СРТ-з просто изобретал привлекательные заметки, которые не ссылались на реально существующие источники. Например, он создал: фиктивные ссылки на убедительно звучащие веб-сайты и, что еще более пугающе, ссылки на фиктивные журнальные статьи. Ссылки содержат имена реальных выдающихся ученых, публикующихся в этой области, и названия реальных журналов, имеющих отношение к этой области, но СРТ-з выдумал выпуски журналов, которых не существует. [37] Именно потому, что СРТ-з не занимается плагиатом -его предложения не помечаются антиплагиат ным программным обеспечением и не нарушаются авторские права, как это практикуется сегодня, - он также не может правильно цитировать. СРТ-з не имеет явной вертикальной памяти. Он никогда не сможет сказать нам, откуда взялось содер-
жание данного предложения, потому что каждое новое слово есть результат тысяч и тысяч расчетов вероятности. GPT-3 может предоставить множество полезных семантических услуг, но "правда не входит в их число", не говоря уже о том, чтобы говорить правду прозрачным и поддающимся проверке способом. [38] Таким образом, существует вполне реальная опасность того, что большие языковые модели вызовут "постоянное загрязнение нашей информационной экосистемы огромным количеством очень правдоподобных, но часто ложных текстов". [39] Трудно предсказать, как долго будет сохраняться эта проблема. Wu Dao 2.0, китайский ответ на СРТ-з, разработанный Пекинской академией искусственного интеллекта, и представленный публике в 2021 году, по-видимому, намного лучше, чем СРТ-з, запоминает ранее освоенные задачи, тем самым приближая ИИ к человеческой памяти и механизмам обучения", включая, возможно, в какой-то момент в будущем, оценку правдивых текстов. [40]
Чтобы преуспеть в создании правдивых заметок* и негру мен ты маш и i moro обуче н ия должны будут сотрудничать с инструментами исследования академической литературы (такими как íris.ai), которые могут найти подходящие ссылки для автоматически сгенерированного контента. [41] Кроме того, чтобы генерировать правдивый контент, History-GPT следует обучать текстам, прошедшим контроль качества, например, рецензируемым академическим письмам и качественной журналистике. Наконец, самой большой проблемой окажется предотвращен не неприятных структурных предубеждений. В своем нынешнем виде GPT-3 не знает этики и не является нейтральной машиной. Он предпочитает текстовый статус-кво, как он появляется в его обучающей
БРАК ИИ
И ИСТОРИЧЕСКОЙ ПРОФЕССИИ СТАНЕТ СВАДЬБОЙ МЕЧТЫ ТОЛЬКО В ТОМ СЛУЧАЕ, ЕСЛИ ИИ РАЗОВЬЕТ СОЗНАНИЕ И НАЧНЕТ ЗАБОТИТЬСЯ О ПРАВДИВОСТИ СВОИХ УТВЕРЖДЕНИЙ.
ленте, что, таким образом, затрудняет критическое письмо, направленное против сути корпуса. Существуют многообещающие инициативы по улучшению этики СРТ-з, и тщательное курирование контента. [42]
История СРТ, заслуживающая этого звания, то есгь заслужи вающая того, чтобы называться академической, научной машиной, по-видимому, требует розум1 юй, целенаправленной интеграции двух типов ИИ: цифровой, очень разнообразной, аналогово-струк-турированной коллекции эффективно проиндексированных данных, и, по запросу, грамотно обобщенные источники, с одной стороны, и компонент творческого письма ИМ, который был обучен с использованием самых современных научных знаний, с другой стороны. Объединение этих двух компонентов в один текст и принятие решения о том, в какой степени вывод одной стороны требует корректировки вывода другой стороны, вероятно, еще долгое время потребует участия человека.
Точно так же, как сегодняшняя наука идентифицирует программное обеспечение, которое использовалось для создания и обработки больших наборов количественных данных, где это применимо, будущая наука будет признавать технологию машинного обучения, которая испсшьзовал$Щ для составления промежуточных рабочих продуктов, таких как хронологии и описательные сводки источников, и даже станки, которые использовались для создания ил и внесения последних стилистических штрихов в целые рукописи. Если технология машинного обучения заставит рукопись отражать стиль академического героя, это может стать последней фазой процесса написания диссертации.
Историческая теория
Характеристики, снижающие Ценность СРТ-з как автора исторических исследований, могут превратить его в интересную площадку для исторической теории. Хорошей цифровой отправной точкой в этом
контексте является хорошо зарекомендовавшая себя область стилометрии, которая измеряет преобладание стилистических особенностей текстов на уровне отдельных символов, слов и предложений и на уровне более сложных языковых структур, например, риторические фигуры и более крупные всеобъемлющие текстовые шаблоны, [43! Метод помогает установить литературное и юридическое авторство и описать эволюцию стилей письма на протяжении десятилетий и столетий. Как и многие другие статистические анализы, стилометрия поддается при-влекаггельнойвизуализации, например, в виде тепловых карт и дендрограмм; [44] Насколько мне известно, этот метод не применялся для описания стиля отдельных историков или отслеживания ключевых особенностей профессионал ьного исторического письма на протяжении последних нескольких сотен лет,
Стилометрия и технологии машинного обучения открывают возможности для разработки и проверки гипотез о микро- и макрограмматике профессионального исторического письма. Обычно историки-теоретики анализируют образцы исторических исследований, написанных настоящими историками, чтобы определить закономерности и правила, которые управляют дисциплиной в целом. 1ХМ позволяют нам перевернуть этот процесс с ног на голову, превратив наши предположения о том, как работает история, в набор инструкций, а ИМ воплотит эти инструкции в текстовую практику. С помощью своего рода реверсивной исторической теории мы можем заставить машины писать исторические трактаты в соответствии с лингвистическими спецификациями, отражающими наши гипотезы о том, как работает история; затем мы можем увидеть, в какой степени результаты совпадают с историографией, созданной "в дикой природе".
Историческая теория есть неустоявшееся знание. Существует три разных (и, намой взгляд, одинаково правдоподобных) утвер-
ждепия о природе истории. Для некоторых теоретиков и большинства историков история - это эмпирическая академическая дисциплина, предоставляющая читателям описания тщательно очерченных сегментов прошлой реальности. [45] Лингвистический поворот предложил другой смысл существования истории, определяя повествовательное исполнение как первичную неотъемлемую ценность профессионального исторического письма. [46] Наконец, некоторые постн аррати висты, такие как Йоу-ни-Матти Куукканен, утверждали, что исторические тексты следует ценить и оценивать как аргументированные вмешательства, призванные убедить читателей в обоснованности набора утверждений. [47] Я думаю, что все три утверждения верны. Нет причин предполагать, что история - это игра с нулевой суммой, связанная исключительно с описанием, повествованием или аргументацией. На самом деле я бы предположил, что история - это гибридная интеллектуальная писательская деятельность, в которой постоянно смешиваются описание, повествование и аргументация на разных уровнях текста. В то же время можно определить, что многие исторические работы служат одной основной цели. В результате реально может существовать как минимум три разных типа истории, которые следует^ оценивать по разным критериям. Существуют нарративные истории, в которых описания и аргументация используются для создания хорошей истории, и напористые истории, в которых используются повествовательные и описательные отрывки, чтобы убедить читателей в обоснованности конкретного аргумента. [48]
Чтобы проверить приведенные выше гипотезы, можно было бы преобразовать текстовые лингвистические определения описания, аргументации и повествования в алгоритмическую форму, чтобы определить преобладание и распределение описательных, утвердительных и повествовательных предложений и отрывков в данном фраг-
менте исторического письма. [49] Затем можно было бы внимательно проанализировать отрывки с интенсивным описанием, повествованием и аргументацией и попытаться определить их семантические и возможные иерархические отношения друг с другом. В этом контексте было бы особенно интересно, если бы машины извлекали паттерны продвижен ия текста в определенн ых сегментах текста (таких как введение, заключение и отрывки, в которых обсуждаются сходные понятия), а также позволяли бы им отслеживать различные семантические нити текста, (например, путем разграничения уровня исторического изложения и уровня историографической контекстуали-зации). [50] Короче говоря, можно определить, как данный текст функционирует лингвистически, сравнить его лингвистический профиль текста с другими публикациями и даже проследить эволюцию доминирующих принципов текстового построения с течением времени в различных субдисциплинах и области в целом. Некоторые возможные результаты включают наблюдение, что историки в основном испол ьзовали повествование, как утверждают нарративис-ты после лип гвистичсского поворота 1970-х годов, но что теперь они с большей вероятностью будут спорить, как утверждают по-стнаррати висты. Кроме того, можно было бы эмпирически проиллюстрировать, что историки предпочитают описательные стили продвижения текста, когда они начинают работать в новой обласги исследований, такой как цифровая история. [51]
Следующим шагом реверс-инжинириlira будет разработка хороших подсказок, чтобы иметь преемника ТГП-3, предпочтительно правдивую историю ТПТ, писать описательные, повествовательные и убедительные истории конкретных событий или эпох, сравнивать результаты с существующими научными данными и, таким образом, проверить представление о том, что прин цип иал ьно разн ые ти п ы исторической науки действительно существуют, [52] Из-
меняя параметры теста от одного прогона к другому, мь! могли бы, например, определить, насколько далеко утверждения фактов проникают в нарративную и аргумен-тативную надстройку исторических текстов. Возможно, действительно существуют разные типы исторического повествования и аргументации, которые более или менее прочно интегрированы в соответствующую им эмпирическую инфраструктуру и зависят от нее. Мы можем играть с лингвистической и семантической грамматикой истории, включая уровни абстракции, степени эмпирической насыщенности, интенейв-ность повествовательного погружения ивни-мание к логическим деталям. Возможно, мы сможем определить переломные моменты, знаменующие переход эмпирического трактата в повествовательное представление или хорошо продуманное аргумента™ вное вмешательство. Хорошо разработанные ШУЕ предлагают экспериментальные возможности для исторической теории, которые никогда не существовали ранее, и шанс разработать точные, но гибкие критерии суждения, которые соответствуют эмпирическим, описательным и напористым исследованиям и разнообразию области. ИМ могли бы научить нас в конкретных лингвистических терминах тому, что есть больше способов добиться успеха или потерпеть неудачу в сложной задаче написания истории, чем мы предполагали ранее.
Закл ючение
Что из всего этого можно получить? Прежде всего, скорость и масштаб и все преимущества, которые они влекут за собой. Эти преимущества включают в себя привлекательные, привлекательные места коллективной памяти, отражающие политические и этические предпочтения их создателей, всестороннее владение источниками и литературой, которое больше не может быть достигнуто отдельными учеными и исследовательскими группами, новые формы мультиперспективного и мультиекалярно-
го письма на разных языках, проверка гипотез и контрфактических сценариев под влиянием момента, доступ к истории обществ и эпох, которыми до сих пор пренебрегали профессиональные историки (включая легкий доступ к мультимедийным архивам [53]), быстрый и глубокий анализ лингвистических и семантических паттернов исторического письма в разных масштабах и возможности проверки основных аксиом исторической теории с выгодной точки, расположенной внутри исторического текста, то есть с точки зрения субъекта письма. Все это дается по крутой, возможно, непомерно высокой цене. Технологии машинного обучения дороги, имеют огромный углеродный след и предназначены для обслуживания интересов их коммерческих владельцев. [54] Кому-то придется платить за технологию машинного обучения, совместимую с академическими кругами. Эта GPT-история должна находиться под общественным контролем, не в последнюю очередь для того, чтобы гарантировать, что она придерживается узаконенных правил цензуры. Наконец, его продукция должна быстро и решительно продвигать дело защиты окружающей среды; в противном случае было бы трудно оправдать необходимые вложения скудных ресурсов. Как метко напоминает нам GPT-3: "Для обучения больших языковых моделей требуется много электроэнергии. Это потребление электроэнергии приводит к выбросам парниковых газов, что способствует изменению климата. Кроме того, эти модели часто размещаются на серверах, использующих ископаемое топливо, что еще больше усугубляет их воздействие на окружающую среду", [55]
Примечания;
1. См.: The Oxford Handbook of Public History, ed. James B. Gardner and Paula Hamilton (Oxford: Oxford University Press, 203 7).
2. Leopold von Ranke, Histoiy of the Reformation in Germany, ed. Robert A. Johnson, transi. Sarah Austin {London: Routiedgeand Sons, 1905), Vil, 3, https:// books.google .com /books ?i d - BXs fAAAAMAAJ.
3- Anthony Grafton, The Footnote: A Curious History' (Cambridge. MA: Harvard University Press,1997), 223.
4. Краткую историю ИИ см.: Yuchen Jiang et a!., "Quo Vadis Artificial intelligence?" Discover Artificial Intelligence 2 {2022), https://linicspringer.com/ article/10.10 07/ 04 4163 ■ 02 2 -о о 02 2 - 8.
5. Robert Dale, "GPT-3: What's ft Good For?" Natural Language Engineering 27, no. 1 (2021),113-18.
6. Adam Sobieszek and Tadeusz Price, "Playing Games with AIs: The Limits of GPT-3 anc' Similar Large Language Models," Minds and Machines 32, no. 2 {2022), 341-64.
7. Den Dickson, "The Untold Story of GPT-3 is the Transformation of Open AI," Tech Talks(blog),i7 August 2020, https://bdtechtalks.com/2020/08/17/ o| jena i- gp t -3 -com me rcial - ai /.
8. SteveTingiris, Exploring GPT-3; An Unofficial First Look at the General-Purpose Language Processing API from Open AI (Birmingham: Packt, 2021), 5.
9. SusanC. Karant-Nuna The Reformation of Feeling: Shaping the Religious Emotions in Early Modern Germany (Oxford: Oxford University Press, 2010). Для Карант-Нанна Ранке остается коллегой, с которым приходится считаться (9).
10. С. Scott Dixon, Contesting the Reformation (Chichester: Wiley-Black well, 2012), 20. См. также: Thomas A. Brady jr., German Histories in the Age of Reformations, 1400-1650(CamlSrid^: Cam-bridge University Press, 2009), 3.
п. Возьмем, к примеру, дискуссию по поводу редакционной статьи, написанной президентом Американской исторической ассоциации, который oiшакивал презентизм во многих выступлениях в области публичной истории, но не смог признать приверженность политической программе прошлых элит, которая структурно заложена во многих источниках, используется историками и поэтому часто непреднамеренно воспроизводится указанными историками. См.: James IT. Sweet, "Is History History? Identity Politics and Teleologies of the Present, "Perspectives on History, 17 August 2022, ht tjjs://www his torians.org/'publications-and-directories/ perspectives-on-history/ sqptember-2iJ22/ is -history- his tory- identi tv-pol itics-and-teleol ogies -of-the-present.
12. Robert A. Rosens tone made this point in the 1990s in Visions of the Past; The Challenge of Film to Our Ida of History (Cambridge, MA: Harvard University Press, 1995); Adam Chapman confirmed it in Digital Games as History: How Videogames Represent the Past and Offer Access to Historical Practice (New York Routledge, 2016).
13, См., например: Kalle Pihlainen, The Work of History: Constructivism and aPoliticsof the Past (New York: Routledge, 2017) andj?rn R?sen, Evidence and Meaning: A Theory of Historical Studies (New York: Berghahn Books, 2017).
14. Это относится, например, к способности ИИ чита 1Ъ лица людей и даже эмбрионов как в позитивных, так и в клинических случаях. Подробнее Ш этом сравните: LotteHouwing, "Reclaim Your Расе and the Streets: Why Facial Recognition, and Other Biometric Surveillance Technology in Public Spaces, Should Be Banned," in (Dis)Obedience in Digital Societies: Perspectives on the Power of Algorithms and Data, ed. Sven Quadflieg, Klaus Neuburg, and Simon Nestler (Bielefeld: Transcript,2о22), 318-41, and Yasunari Miyagi et al., "Recognition of Facial Expression of Fetuses by Artificial Intelligence (AI),"journal of Perinatal Medicine^j9, no. 5 ( 2021), 596-603.
15. Clemens J, Setz, "Digitale Kunst: Noch sind sie unschuldig, "S?ddeutsche Zeitung,i4 June 2022, htt|is:./ / www .sueddeutsche.de/kultur/demenB-setz-dall -e-mini-kuensthche-intelligenz-jorge-luis-borges-1,5602238. Оценку DALL-E 2 см.: Gary Marcus, Ernest Davis, and Scott Aaronson, "A Very Preliminary Analysis of DALL-E 2," ArXiv, last modified 2 May 2022, https://arxiv.0rg/abs/2204.13807v2.
16. Pei-SzeChow, "Ghost in the (Hollywood) Machine: Emergent Applications of Artificial Intelligence in the Film Industry," NECSUS9, no. 1 (2020), 193-214; Xiaoyu Li et al., "Deep Sketch-Guided Cartoon Video Enbetweening, "IEEE Transactions on Visualization and Computer Graphics28, no. 8(2022), 2938-52.
17. Рост культуры памяти, поддерживаемой ИИ, подчеркивает необходимость критических исследований цифровой памяти. Подробнее об этом см.: Digital Memory Studies: Media Pasts in Transition, ed. Andrew I loskins (New York: Routledge, 2018) and Anna Reading, Gender and Memory in the Globital Age (London: Paigrave, 2016).
18. Tobias Ebbrecht-Hartmann, L.ital Henig, and Noga Stiassny, "Report on Digital Curat ion of Popular Culture Content," Visual History of the Holocaust, last modified 31 December 2020, https://www.vhh-project.eu/deli ve rabies/d 2-5-report-on-digita I-cura ti on -of-popul ar-cul ture-con tent/.
19. Предшественник этой машины существует в виде алгоритма, который позволяет пользователям получать доступ к обширной коллекции визуальных материалов, собранных в архиве визуальной истории USCShoah Foundation. Подробнее об этом см.: Todd Presner, "The Ethics of the Algorithm: Close and Distant listening to the Shoah Foundation Visual History Archive," in Probing the Ethics of Holocaust Culture, ed. Claudio Fogu, Wulf Kansteiner, and Todd Presner (Cambridge, MA; Harvard University Press, 2016), 175-202.
20. Nmh Gianstracusa, How Algorithms Create and Prevent Fake News: Exploring the Impacts of Social Media. Deep fakes, GPT-3, and More (Acton: Apress, 2021).
21. Wulf Kansteiner, "Censorship and Memory: Thinking Outside the Box with Eacebook, Goebbets,
and Xi jinping," Journal of Perpetrator Research 4, no. 1 (2021), 35-58.
22.1 la]гример, DAIiL-H 2, по-видимому, в значите,'! ьной степени следует принципам этического использования Open AI. Подробнее об этом см.: Matthias Bastian, "Open AJ's DALL-1 2 Is Pretty Compliant - But Who is Responsible Anyway?" The Decoder, 20 May 2022, https://the-decoder.com/ о penais -dall - e-2 - i s - pre tty-com p 1 i a n t-bu t - who - is -res pons ibl e -a ny way/.
23. Luciano I'loridi and Massimo Chiriatti, "GPT-3: Its Nature, Scope, Limits, and Consequences," Minds and Machines 30, no. 4 (2020), 691.
24. Tobias Roes, "Non -Human Words: On GPT-3 as a Philosophical Laboratory." Daedal us 151. no. 2 (2022), 180,
25.7'om B. Brown el at., "language Models Are Few-Shot Learners," Ar Xiv, last modified 22 July 2020,8, https://arxiv.org/abs/2005.14165.
26. Cade Metz, "AI. Is Not Sentient. Why Do People Say It Is?" The New York Times, 5 August 2022, https:/ /www.nytimes.com/2022/08/05/technology/ai-sentient-google.html. См. iaia&e обсуждение интеллекта GPT-з в: Carlos Montemayor, language and Intelligence," Minds and Machines 31. no. 4 (2021), 471-86.
27. Mike Sharpies and Rafael P?rez у P?rez, Story Machines: How Computers Have Become Cre-ative Writers (New York: Roudedge, 2022); Amy Cypher!, "A Human Being Wrote This Law Review Article: GPT-3 and the Practice of Law," LIC Davis Law Review 55, no. 1 (2022), 401-43.
28. Nassim Debouche, "Plagiarism in the Age of Massive Generative Pro-trained Transformers! CRT-3)," Ethics in Science and Environmental Politics2i (March 2021), 17-23.
29. Mike Sharpies, "New AI Loots That Can Write Student Essays Esquire Educators to Rethink Teaching and Assessment," L.SE Impact Blog(blog), 17 May 2022, https://bl0gslse.ac.uk/impactDfkx3alsciences/ 2*122/05/ 17/ new-sfl- toejs-ihat-can-write-studen t-essays-requrns-educators-to-rdhi nk-teathing-and- assessment/.
30. Bharafh Chintagunta et al„ "Medically Aware GPT-3 as a Data Generator for Medical Dialogue Summarization," in Proceedings of the Second Workshop on Natural Language Processing for Medical Conversations, ed. Chaitanya Shivade et al. (Stroudsburg: Association for Computational Linguistics, 2021), 66-76. Обсуждение одного из многих коммерческих поставщиков услуг см.: Matt Payne, "State of the Art GPT-3 Summarizer for Any Size Document or Format," Width.ai(blog), 7 September 2021, https://www.width.ai/p0st/gpt3-summarizer.
31. Saitl Friedlander, The Years of Extermination: Nazi Germany and the Jews, 1939-1945 (New York; HarperCollins, 2007).
32. Timothy Snyder, Bioodlands: Europe between Hitler and Stalin (New York: Basic Books,2010).
33. Это могло быть сделано так, как Кристофер Р. Браунинг использовал инструменты цифрового поиска Архива визуальной истории USC Shoah Foundation во время работы над "Вспоминая выживание", Remembering Survival: Inside a Nazi Slave-Labor Camp (New York: Norton, 2010).
34. Brown et al., "Language Models Are Few-Shot Learners," 9.
35. Floridi and Chiriatti, "GPT-3: Its Nature, Scope, Limits, and Consequences," 690.
36. Almira Osmanovic Thunstr?m, "We Asked GPT-3 to Write an Academic Paper about Itself-Then We T ried to Get Et Published," Scientific American, 30 June 2022, https://www.scientificamerican.com/article/ we-as ked -gpt -3 - to-wri te-a n- academic- paper -about-itself-then-we-tried-to-get- it- published|i
37. Sharpies, "New Al Tools That Can Write Student Essays."
38. Sobieszek and Price, "Playing Games with AIs," 34 J■
39. [bid.
40. Alberto Romero, "GPT-3 Scared You? Meet Wu Dao 2.0: A Monster of 1. 75 Trillion Parameters," Towards Data Science, 5 June 2021, https:// towardsda tascience.com/gpt-3-scared-you-meet-wu-dao-2-0-a-monster-of-1-75-trillion-parameters-832cd83db484.
41. Andy Extance, "How Ai Technology Can Tame the Scientific literature," Nature, 10 September 2018, https://www.nature.com/articles/ Щ1586-018-06617-5.
42. Anastasia Chan, "GPT-3 a"d Instruct GPT: Technological Dystopianism, Utopianism, and 'Contextual' Perspectives in Al Ethics and Industry," Ai and Ethics (April 2022), https://d0i.0rg/10.1007/ S43681-022-00148-6.
43. Jacques Savoy, Machine I/earning Methods for Stylometry: Authorship Attribution and Author Profiling (Cham: Springer, 2020).
44. K.V, Lagutina and A. M. Manakhova, "Automated Search and Analysis of the Stylometric Features That Describe the Styleof the Prose of igth-2ist Centuries," Automatic Control and Computer Sciences 55, no. 7 {2021),866-76.
45. C. Behan McCullagh, The Truth of History (London: Routledge, 2003).
46. Alun Munslow, Narrative and History, 2nd ed. (London: Red Globe Press, 2019).
47. Jouni-Matti Kuukkanen, Postnarrativist Philosophy of Historiography (New York: Paigrave, 2015).
48. Wulf Kansteiner, "History beyond Narration: The Shifting Terrain of Bioodlands," in Analysing Historical Narratives: On Academic, Popular and Educational Framings of the Past, ed. Stefan Berger,
Nicola Branch, and Chris Ijorenz (New York: Berghahn Books, 2021), 51-82.
49. Рассмотрим в этом контексте конкретные текстовке лингвистические определения описания, повествования и аргументации, которые были предложены здесь: Cirlota S. Smith in Modes of Discourse: The Local Structure of Texts (Cambridge: Cambridge University Press, 2003) и у которых есгь потенциал для цифровой операционализации. Звучит перспектив!ю совместить эти категории с методом "среднего чтения" с помощью ИИ; см.; Jon Chun and Katherine Skins, "What the Rise of Ai Means for Narrative Studies: A Response to 'Why Computers Will Never Read (or Write) Literature' by Angus Fletcher," Narrative 30, no, 1 (2022), 104-13.
50. Многообещающим в этом отношении является успешный компьютерный анализ нарративных структур в: Ryan L. Boyd, Kate G. Blackburn, and James W. Pennebaker, "The Narrative Arc: Revealing-Core Narrative Structures through Text Analysis," Science AdvancesS, no. 32 {2020), https://doi.org/ io.ii26/sciadv.aba2i96. См. также: Joshua Daniel Eisenberg,"AutomatkExtracdonofNarrativeStmcture from long Form Text" (PhD diss.,Florida International University, 2018), https://digi talcommons.fiu.edu/etd/
39^.
51. Stephen Robertson and Lincoln Mullen, "Arguing with Digital History: Patterns of Historical Interpretation," journal of Social History 54, no. 4 (2021), 1005-22. Кроме того, некоторые исследования показывают, что описательные текс ты действительно больше связаны с пространственным, чем с хронологическим продвижением; см.: Christine Peters, "Text Mining, Travel Writing, and the Semantics of the Global: An Ant Cone Analysis of Alexander von Humboldt's Reise indieAequinoktial-Gegenden des Neuen Kontinents," in Digital Methods in die Humanities: Challenges, Ideas, Perspectives, ed. Silke Schwandt (Bielefeld: Bielefeld University Press, 2021), 192.
52. Для оценки аргументативных навыков моделей языкового представления см.: Mayank Kejriwa! et al., "Designing a Strong l est for Measuring True Common-Sense Reasoning," Nature Machine Intelligence4, no. 4 (2022), 318-22. Even CPT-2 is apparently already quite good at arguing; see Khalid Al-Khatib et al., "Employing Argumentation Knowledge: Graphs for Neural Argument Generat ion," in Proceedings of the 59th Annual Meeting of the Association for Computational Linguistics and the nth International Joint Conference on Natural Language Processing, vol. 1, ed,Chengqing Zonget al. (Stroudsburg: Association for Computational Linguistics, 2021), 4744-54.
53. Архивы устной истории, которые были предоставлены удаленно и проиндексированы с помощью технологии искусственного интеллекта, фиксирующей естественный язъйе и друг ие социальные сигналы (например, технология, которая может идентифицировать выражение лица и язык тела, а также анализировать дыхание), могут, например, служить историкам и их машинному обучению. Подробнее об этом см.: I rancisca Pessanhaand AlmilaAkdag Salali "A Computational look at Oral History Archives," journal on Computing and Cultural Heritage^, no. 1 (2021), https://doLorg/ 10.1145/3477605.
54. Dieuwertje Luitse and Wiebke Denkena, "The Great Transformer: Examining the Role of Large Language Models in the Political Economy of AI," Big Data and SocietyS, no. 2 (2021), https://doi.0rg/10.1177/ 20539517211047734.
55. Этот вывод был создан на игровой площадке Open Al (https://beta.openai.com/playground) 26 сентября 2022 г. в ответ на мою подсказку "Напишите один абзац о негативном влиянии больших языковых моделей, таких как GPT-3, на мировой климат" с настройкой температуры i и максимальной длиной 485 знаков.