Научная статья на тему 'Философские основания компьютерной лингвистики'

Философские основания компьютерной лингвистики Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
134
34
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
компьютерная лингвистика / искусственный интеллект / субъект / объект / познание / социальная технология / языковое значение / computer linguistics / artifi cial intelligence / subject / object / cognition / social technology / linguistic meaning

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Даниелян Наира Владимировна

Компьютерная лингвистика рассмотрена как ключевой компонент при создании искусственных интеллектуальных систем. Выдвинута гипотеза, что искусственные интеллектуальные системы способны полностью изменить классические представления о субъект-объектном взаимодействии. Показано, как посредством компьютерной лингвистики совершается переход от субъект-объектного взаимодействия к субъект-субъектному, поскольку стирается грань между естественным и искусственным интеллектом. Обоснована идея, что компьютерная лингвистика приобретает характер социальной технологии, так как в своей основе содержит совмещение познающего субъекта, средств познания и познаваемого объекта в едином цикле.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Philosophical foundations of computer linguistics

Computational linguistics is considered as a key component in the creation of artifi cial intelligent systems. The hypothesis is put forward that artifi cial intelligent systems are able to completely change the classical ideas about subject-object interaction. It is shown how the transition from subject-object interaction to subject-subject interaction takes place through computational linguistics, since the line between natural and artifi cial intelligence is blurred. The idea is substantiated that computational linguistics acquires the character of a social technology, since it basically contains a combination of a cognizing subject, means of cognition and a cognizable object in a single cycle.

Текст научной работы на тему «Философские основания компьютерной лингвистики»

Экономические и социально-гуманитарные исследования. 2022. № 4 (36). С. 83—89. Economic and Social Research. 2022. No. 4 (36). P. 83—89. Научная статья

УДК 165.12

doi: 10.24151/2409-1073-2022-4-83-89

Философские основания компьютерной лингвистики

Н. В. Даниелян

Национальный исследовательский университет «МИЭТ», Москва, Россия vend22@yandex.ru

Аннотация. Компьютерная лингвистика рассмотрена как ключевой компонент при создании искусственных интеллектуальных систем. Выдвинута гипотеза, что искусственные интеллектуальные системы способны полностью изменить классические представления о субъект-объектном взаимодействии. Показано, как посредством компьютерной лингвистики совершается переход от субъект-объектного взаимодействия к субъект-субъектному, поскольку стирается грань между естественным и искусственным интеллектом. Обоснована идея, что компьютерная лингвистика приобретает характер социальной технологии, так как в своей основе содержит совмещение познающего субъекта, средств познания и познаваемого объекта в едином цикле.

Ключевые слова: компьютерная лингвистика, искусственный интеллект, субъект, объект, познание, социальная технология, языковое значение

Для цитирования: Даниелян Н. В. Философские основания компьютерной лингвистики // Экономические и социально-гуманитарные исследования. 2022. № 4 (36). С. 83— 89. https://doi.org/10.24151/2409-1073-2022-4-83-89

Original article

Philosophical foundations of computer linguistics

N. V. Danielyan

National Research University of Electronic Technology, Moscow, Russia vend22@yandex.ru

Abstract. Computational linguistics is considered as a key component in the creation of artificial intelligent systems. The hypothesis is put forward that artificial intelligent systems are able to completely change the classical ideas about subject-object interaction. It is shown how the transition from subject-object interaction to subject-subject interaction takes place through computational linguistics, since the line between natural and artificial intelligence is blurred. The idea is substantiated that computational linguistics acquires the character of a social technology, since it basically contains a combination of a cognizing subject, means of cognition and a cognizable object in a single cycle.

© Даниелян Н. В.

Keywords: computer linguistics, artificial intelligence, subject, object, cognition, social technology, linguistic meaning

For citation: Danielyan N. V. "Philosophical Foundations of Computer Linguistics". Economic and Social Research 4 (36) (2022): 83—89. (In Russian). https://doi.org/10.24151/2409-1073-2022-4-83-89

Компьютерная лингвистика — довольно новая и активно развивающаяся область, особенно на фоне быстрого прогресса «приложений искусственного интеллекта» и дополненной реальности, совершенствования андроидов, развития систем машинного перевода и человеко-машинных интерфейсов и т. д. Определяя предмет компьютерной лингвистики, можно предположить, что в своей основе он содержит компьютерную адаптацию естественного языка, т. е. в области ее применения «компьютер выступает в роли субъекта восприятия лингвистики» [3, с. 4]. Соответственно, специалисты и исследователи в области компьютерной лингвистики уделяют значительное внимание воспроизведению искусственной системы субъективной репрезентации знаний и обработки информации, поступающей из разных источников.

Во многих технических университетах мира сегодня реализуются программы подготовки специалистов в области создания искусственного интеллекта (ИИ). Все они посвящены ответу на впервые поднятый А. Тьюрингом вопрос о возможности реализации «машинного мышления». Сегодня эта проблема актуализируется на фоне развития технологий моделирования человеческого разума. Вдумаемся в сам термин — «искусственный интеллект». Поскольку человек-ученый: инженер, разработчик, технолог, психолог, лингвист и т. д., — собирается создать аналог интеллекта человека, предполагается, что этот аналог будет обладать неким «сознанием» и «мышлением», т. е. способностью дублировать когнитивные процессы, происходящие в человеческом мозге.

Сегодня существуют две версии теории искусственного интеллекта. «Сторонники слабой версии теории ИИ считают, что соответствующим образом запрограммированный

компьютер может только моделировать мыслительные акты человека, в то время как сторонники сильной версии допускают, что запрограммированные компьютерные устройства действительно мыслят и в силу этого могут находиться в соответствующих когнитивных состояниях» [11, с. 669]. Последнее утверждение крайне спорно, так как предполагает наделение компьютеризированного устройства способностью мыслить: с философской точки зрения, это будет означать расширение субъектной области до сферы ИИ, т. е. неживого.

Вместе с тем при современных темпах развития био- и нанотехнологий слабая версия ИИ вполне реализуема. Эксперименты с нанороботами служат подтверждением наличия оснований для такого оптимизма. Нанороботы могут вводиться в нейроны, благодаря чему ученые исследуют, каким образом понятия и суждения формируются в человеческом мозге. Далее полученная информация поступает в компьютер, и ее обработка позволяет «моделировать» мыслительный акт субъекта, т. е. человека, а также «продолжать» этот акт. При таком подходе мозг человека может напрямую обмениваться информацией с компьютером, обладающим нейроинтерфейсом [9]. Таким образом, внешним вычислительным устройством постепенно оказывается не только компьютер, но и мозг, т. е. речь начинает идти не о субъект-объектном, а субъект-субъектном взаимодействии, что в то же время продвигает нас по пути принятия и реализации сильной версии ИИ.

На следующем этапе ИИ (изначально разработанный и запрограммированный инженерами) перестает быть полностью подконтрольным своим создателям, так как этот интеллект воспроизводит модели мышления человеческого существа. Возникает

закономерный вопрос: следует ли его создавать, так как после его появления мир полностью изменится и под угрозой окажутся сущность и существование самого человека? Вероятно, намного разумнее остановиться на использовании приложений к андроидам, которые уже сегодня помогают человеку в разных сферах деятельности (они представляют собой материализацию слабой версии ИИ и продвигаются на рынок в качестве «приложений искусственного интеллекта»).

Сегодня компьютерная лингвистика позволяет вступить на путь создания искусственных интеллектуальных систем и довольно быстро продвигаться по нему. Среди ее текущих задач выделяют следующие: «...создание человеко-машинных интерфейсов с устным вводом / выводом информации; речевое управление компьютером и другими техническими устройствами <...>; организация информационно-справочной службы, позволяющей получать и выдавать различную информацию из базы данных в условиях, когда вопрос задается голосом <. >; создание устройств для приема и озвучивания различных сообщений <...>; многоязычный устный ввод / вывод речевой информации с автоматическим переводом» [8, с. 515—516] и другие.

Посредством компьютерной лингвистики решаются такие сложные задачи, как машинный перевод, а также более простые: создание информационно-поисковых систем, обработка массивов текстов по ключевым словам. Так, В. М. Алпатов отмечает, что «наряду с прикладными направлениями, сложившимися в рамках формальной лингвистики, большое место в последние десятилетия занимают и направления работ, связанные с функционализмом. Среди них надо особо выделить корпусную лингвистику» [2, с. 84]. С начала 2000-х гг. создается Национальный корпус русского языка, который постоянно пополняется. К началу второго десятилетия XXI в. созданы корпуса и большинства других языков мира. Они служат разным целям, например, статистическим. При группировании по времени создания текстов они могут предоставить пользователю информацию

об исторических изменениях, произошедших в языке за определенный исторический отрезок, что является важным компонентом при построении компьютерных моделей, воспроизводящих акты мышления.

В свете рассмотренных достижений и перспектив в области создания интеллектуальных искусственных систем хотелось бы отметить, что здесь возникает проблема взаимоотношений человека и машины в части правильности распределения функций между ними. Н. Винер как основатель кибернетики полагал: «Отдайте человеку — человеческое, а вычислительной машине — машинное. В этом и должна, по-видимому, заключаться разумная линия поведения при организации совместных действий людей и машин» [4, с. 212].

Трудно предположить, в какой степени человечество будет прислушиваться к этому призыву в будущем, так как сегодня компьютерные технологии все более глубоко проникают во все сферы человеческой деятельности, т. е. носят все более социальный характер. С этой целью рассмотрим, как дополненная реальность (ЛЯ) уже используется в образовании. В основании технологии ЛЯ находится голография, основанная на создании трехмерного изображения. При наведении устройства на объект, имеющий соответствующую метку, например рЯ-код, на его экране появляется трехмерное изображение объекта, с которым пользователь может проводить манипуляции, вращая и рассматривая с разных сторон. Данная технология имеет огромный потенциал для сферы образования, так как позволяет наглядно представлять и иллюстрировать материал для обучающихся. Так, студенту нет необходимости читать объемную сопроводительную литературу к какому-либо устройству или процессу, поскольку он может получить его изображение с текстовыми пояснениями. Очевидно, что данная технология в качестве необходимого элемента содержит обработку текстовых данных, т. е. лингвистическую составляющую. К прорывным технологиям в области применения ИКТ-технологий в сфере перевода относятся приложения, которые позволяют при

наведении телефона на текст получить его перевод на множество выбранных языков1.

Все эти примеры — яркое свидетельство того, что компьютерная лингвистика все больше приобретает характер социальной технологии, так как в своей основе содержит совмещение познающего субъекта, средств познания и познаваемого объекта в едином цикле вследствие отсутствия необходимости в посреднике между пользователем и компьютером. Взаимодействие человека с компьютером протекает таким образом, что само человеческое действие не является чем-то внешним по отношению к субъектам, а как бы включается в систему, видоизменяя каждый раз поле ее возможных состояний. Язык выступает средством такого взаимодействия, являясь циклической системой, так как способен воссоздавать себя. Согласно У. Найссеру, язык «ложится» на некую «предуготовленную схему», которую ученый называет «форматом»: «Информация, заполняющая формат в какой-то момент циклического процесса, становится частью формата в следующий момент, определяя то, как будет приниматься дальнейшая информация» [12, с. 75]. Наличие такого рода «формата» может пониматься как свидетельство самоорганизации познавательного процесса и его гибкой приспо-сабливаемости к новой языковой ситуации, благодаря способности опираться на предшествующий опыт.

Из данных рассуждений следует, что компьютерная лингвистика тесно связана с когнитивной лингвистикой, нацеленной на изучение языковых значений [13, с. 36]. Однако под воздействием ИИ область когнитивного смещается, поскольку субъектом познания может быть ИИ (неживое). Как результат, в современной эпистемологии наблюдается расшатывание устойчивых когнитивных структур и логических оснований познавательного процесса субъекта, сложившихся в ходе его

1 Пример работы приложения WordLens Translator (в режиме реального времени показывающего перевод надписи на экране) приводят Н. Н. Зильберман и В. А. Сербин в статье «Возможности использования приложений дополненной реальности в образовании» [7, с. 29].

эволюционного развития в предыдущие исторические эпохи. Это требует нового подхода к рассмотрению познавательного процесса. Так, чилийские нейробиологи У. Матурана и Ф. Варела в концепции ауто-поэтических систем предлагают исходить из следующей позиции: поскольку мозг человека является операционально-замкнутой, самовоспроизводящейся системой, то «каждый акт познания рождает некий мир» [10, с. 26]. Таким образом, как отмечалось нами ранее, «рационально возможен только сконструированный наблюдателем мир» [5, с. 59], поскольку проблема познания начинает определяться когнитивными операциями систем наблюдения.

Таким образом, происходит трансформация и наших научных представлений о субъекте познания: мы обнаруживаем и отслеживаем преобразование индивидуального эпистемологического Я в коллективного субъекта, т. е. его превращение в некий социальный конструкт, порождаемый процессом коммуникации. Мы начинаем рассматривать субъекта в качестве неотъемлемой части комплексов, сформированных под воздействием современных социотехнических систем (что характерно для систем с ИИ). Соответственно, актуальность приобретает понимание субъекта как «детектора, или фиксатора, различных аспектов реальности» [1, с. 115].

Акторно-сетевой подход служит ярким примером данного направления мысли в теории познания. Он утверждает, что с развитием технологий происходит «растворение» субъективности в потоке объективного. Это нивелирует познавательные возможности субъекта, который начинает приобретать коллективный характер, до границ его «распределенности» в социуме. Можно предположить также, что при переходе в сферу ИИ область субъективного сужается до виртуального. Эти процессы в современном мире стимулируются, помимо прочего, машинным обучением роботов, созданных с применением искусственных нейронных сетей, которые одновременно реализуют такую функцию мышления человека, как переработка значительного объема

одновременно поступающей на вход когнитивной информации с сохранением результата в виде паттерна (безличного знания), распределяемого сетью и используемого системой при дальнейшем функционировании. С. А. Диане не без оснований полагает: «Переход на новый качественный уровень позволит сместить акцент исследований в интеллектуальной робототехнике от решения частных прикладных задач к построению универсальных информационно-управляющих систем. База знаний подобных систем должна основываться на семантической модели внешней среды, включающей информацию о типах, характеристиках и взаимосвязях между объектами, обнаруженными как в рамках текущей технологической операции, так и в масштабе всего опыта, накопленного системой» [6, с. 319]. Таким образом, в этом новом виде социального взаимодействия (взаимодействия, которое мы начинаем рассматривать как социальное) действует «распределенный субъект», так как границы его размыты и все роботы, подключенные к сети, могут воспользоваться знаниями из базы данных.

К. К. Боярский отмечает, что бывает два типа знаний:

1) «Знание, что» — совокупность утверждений о чем-либо (например: кувшин — сосуд для хранения жидкости, обычно из стекла);

2) «Знание, как» — знание о последовательности операций, которые следует выполнить (например, знание алгоритма действий по использованию устройства) [3, с. 5].

Система оперирует с репрезентациями знаний, используя различные коды, соответствующие системе знаков и значений, которые человек выражает в виде речевого акта. Предпосылкой к подобному пониманию возможности выражения результата когниции в виде системы знаков можно считать идеи логицизма, основанные на чистых формах мышления без привлечения их содержания [14].

Все эти рассуждения приводят нас к пониманию того, какие элементы методологической базы лингвистических наук были

взяты за основу развития компьютерной лингвистики. Их можно проследить по дисциплинам, включенным в учебные планы лингвистических специальностей отечественных и зарубежных вузов. В качестве базовых в них включены такие предметы, как «Методы лингвистического анализа», «Корпусная лингвистика», «Когнитивно-дискурсивные исследования», «Функциональные модели в естественном языке» и другие, — все они формируют лингвистические компетенции обучающихся, основываясь на таких структурах знаний, как «фрейм», «сценарий», «план», «дискурс». Для создания систем ИИ также важно построение и изучение текста как продукта дискурсивного мышления с целью когнитивного моделирования дискурса. Таким образом, система начинает «мыслить» языковыми структурами, приближенными к эпистемологическому субъекту, т. е. все более приобретает черты социальной технологии.

Студенты изучают методологию построения корпусов текстов, семантические технологии, машинный перевод, овладевают технологиями для реализации компьютерного зрения и многими другими инструментами, что позволяет им после окончания вуза претендовать на широкий спектр вакансий в различных компаниях, связанных с эффективной разработкой программных средств и информационных проектов в области создания приложений, основанных на технологии ИИ. Очевидно, что существует и технический аспект системы подготовки таких специалистов. Понимание этого вызывает необходимость введения в учебные планы дисциплин инженерной области знаний: предметов, освоив которые студенты овладеют математическими основаниями компьютерной лингвистики, информационными технологиями и языками программирования, машинным обучением, основанным на представлении знаний посредством знаковых систем, анализом и визуализацией текстовых данных и др.

Подводя итоги данной статьи, хотелось бы отметить, что компьютерная лингвистика — быстро меняющаяся область. Она

сопряжена со всем предыдущим теоретическим и практическим опытом, накопленным лингвистикой, и с современными технологическими достижениями. Она развивается на стыке естественных и гуманитарных наук, во многом задавая траекторию и определяя перспективы дальнейших трансформаций дискурса человека и компьютера и их совмещения в познавательном цикле. Как установлено в данной статье, в основе компьютерной лингвистики — слияние познающего субъекта, средств познания и познаваемого объекта в едином целом, и научная рефлексия этого совмещения открывает новую главу в понимании познавательных процессов как естественной, так, очевидно, и искусственной природы. В отечественном философском дискурсе данное научное направление пока развивается недостаточно интенсивно, однако можно полагать, что оно будет привлекать внимание все большего числа ученых по мере роста влияния ИИ на социальное «мироустройство».

Список литературы и источников

1. Агацци Э. Научная объективность и ее контексты / пер. с англ. Д. Г. Лахути. М.: Прогресс-Традиция, 2017. 688 с.

2. Алпатов В. М. Языкознание: от Аристотеля до компьютерной лингвистики. М.: Альпи-на нон-фикшн, 2018. 253 с. (Б-ка ПостНауки).

3. Боярский К. К. Введение в компьютерную лингвистику. СПб.: НИУ ИТМО, 2013. 72 с.

4. Винер Н. Кибернетика и общество; Творец и робот. М.: Тайдекс Ко, 2003. 248 с.

5. Даниелян Н. В. Научная рациональность и конструктивизм. М.: МИЭТ, 2014. 100 с.

6. Диане С. А. К. Обучение и социальная интеграция автономных роботов на основе применения современных когнитивных технологий // Философия и социология техники в XXI веке: к 70-летию В. Г. Горохова / под общ. ред. И. Ю. Алексеевой, А. А. Костиковой, А. Ф. Яковлевой. М.: Аквилон, 2018. С. 316—321.

7. Зильберман Н. Н., Сербии В. А. Возможности использования приложений дополненной реальности в образовании // Открытое и дистанционное образование. 2014. № 4 (56). С. 28—33.

8. Кодзасов С. В., Кривнова О. Ф. Общая фонетика. М.: РГГУ, 2001. 592 с.

9. Ллойд С., Энджи Дж. Сингулярный компьютер // В мире науки. 2005. № 2. С. 33-42.

10. Матурана У., Варела Ф. Древо познания: биологические корни человеческого понимания / пер.: Ю. А. Данилов. 2-е изд., доп. М.: УРСС: ЛЕНАНД, 2019. 320 с.

11. Меркулов И. П. Мышление с точки зрения компьютерной эпистемологии // Субъект, познание, деятельность. М.: Канон+: Реабилитация, 2002. С. 664-683.

12. Найссер У. Познание и реальность: Смысл и принципы когнитивной психологии / пер. с англ.: В. В. Лучков. М.: Прогресс, 1981. 230 с. (Обществ. науки за рубежом).

13. Скребцова Т. Г. Когнитивная лингвистика: классические теории, новые подходы. М.: Изд. дом ЯСК, 2018. 392 с.

14. Фреге Г. Логика и логическая семантика: сб. трудов / пер. с нем.: Б. В. Бирюков. М.: Аспект Пресс, 2000. 512 с.

References

1. Agazzi E. Scientific Objectivity and Its Contexts. Cham: Springer, 2014. xvii, 482 p. https://doi. org/10.1007/978-3-319-04660-0

2. Alpatov V. M. Language Studies: from Aristotle to Computer Linguistics. Moscow: Al'pina non-fikshn, 2018. 253 p. (In Russian). Series B-ka PostNauki.

3. Boyarskiy K. K. Introduction to Computer Linguistics. St. Petersburg: ITMO Univ., 2013. 72 p. (In Russian).

4. Wiener Norbert. The Human Use of Human Being. Cybernetics and Society. N. p.: Da Capo Press, 1988. 199 p.

5. Danielyan N. V. Scientific Rationality and Constructivism. Moscow: MIET, 2014. 100 p. (In Russian).

6. Diane S. A. K. "Autonomous Robots Learning and Social Integration on the Basis of Modern Cognitive Technologies". Filosofiya i sociologiya tekhniki v XXI veke: k 70-letiyu V. G. Gorokhova. Gen. eds: I. Yu. Alekseeva, A. A. Kostikova, A. F. Yakovleva. Moscow: Akvilon, 2018. 316-321. (In Russian).

7. Zilberman N. N., Serbin V. A. "Augmented Reality Applications Possibilities in Education". Otkrytoye i distantsionnoye obrazovaniye = Open and Distance Education 4 (56) (2014): 28—33. (In Russian).

8. Kodzasov S. V., Krivnova O. F. General Phonetics. Moscow: Russian State Univ. for the Humanities, 2001. 592 p. (In Russian).

9. Lloyd S., NG Y. J. "Black Hole Computers". Scientific American 291.5 (2004): n. pag. Web. 15 Nov. 2022. (In Russian). <https://www. scientificamerican.com/article/black-hole-computers/>

10. Maturana H. R., Varela F. Tree of Knowledge: The Biological Roots of Human Understanding. Boulder, CO: Shambhala Publ., 1992. 269 p.

11. Merkulov I. P. "Thinking in Regard to Computer Epistemology". Sub"ekt, poznaniye, deyatel'nost'. Moscow: Kanon+, Reabilitatsiya, 2002. 664-683. (In Russian).

12. Neisser U. Cognition and Reality. Principles and Implications of Cognitive Psychology. San Francisco: W. H. Freeman and Co., 1976. xvi, 230 p.

13. Skrebtsova T. G. Cognitive Linguistics: Classical Theories, New Approaches. Moscow: Izd. dom YaSK, 2018. 392 p. (In Russian).

14. Frege G., Biryukov B. V., transl. Logic and Logical Semantic, a collection. Moscow: Aspekt Press, 2000. 512 p. (In Russian).

Информация об авторе Даниелян Наира Владимировна — доктор философских наук, доцент, профессор Института высокотехнологичного права, социальных и гуманитарных наук, Национальный исследовательский университет «МИЭТ» (Россия, 124498, г. Москва, пл. Шокина, д. 1).

Information about the author

Naira V. Danielyan — Dr. Sci. (Philosophy), Assoc. Prof., Professor of the Institute of High-Tech Law, Social and Humanitarian Sciences, National Research University of Electronic Technology (Russia, 124498, Moscow, Shokin sq., 1).

Статья поступила в редакцию 10.09.2022. The article was submitted 10.09.2022.

i Надоели баннеры? Вы всегда можете отключить рекламу.