Научная статья на тему 'Методы квантового формализма в информационном поиске и обработке текстов на естественных языках'

Методы квантового формализма в информационном поиске и обработке текстов на естественных языках Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
232
59
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ / КВАНТОВЫЙ ФОРМАЛИЗМ / ОБРАБОТКА ЕСТЕСТВЕННО-ЯЗЫКОВЫХ ТЕКСТОВ / МОДЕЛИРОВАНИЕ СЕМАНТИКИ / ОПЕРАТОР ПЛОТНОСТИ / INTELLIGENT SYSTEMS / QUANTUM FORMALISM / PROCESSING OF NATURAL LANGUAGE TEXTS / MODELING OF SEMANTICS / DENSITY OPERATOR

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Бессмертный И. А., Васильев А. В., Королёва Ю. А., Платонов А. В., Полещук Е. А.

Создание интеллектуальных систем в парадигме логического поиска решений требует формализации знаний в виде онтологий, продукционных моделей и т.п. Однако обеспечить строгую формализацию знаний удается далеко не всегда вследствие неполноты, неточности и противоречивости данных. В последнее время внимание исследователей переключилось на извлечение знаний из естественно-языковых текстов. Особого внимания заслуживает подход, основанный на использовании квантового формализма к объектам макромира, позволяющим учитывать присущую естественному языку неопределенность и неточность. Многочисленные эксперименты, проведенные в течение последних 30 лет, демонстрируют, что математический аппарат, разработанный для моделирования элементарных частиц, также удовлетворительно описывает поведение людей, которое не может быть описано математическим аппаратом классической логики и теории вероятностей. Проанализированы методы обработки естественно-языковых текстов средствами квантовой математики.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Quantum-formalism methods in information retrieval and processing of texts in natural languages

Creation of intelligent systems in the paradigm of logical decision-making requires formalization of knowledge in the form of ontologies, production models, etc. However, a rigorous formalization of knowledge is far from always possible due to the incompleteness, inaccuracy, and inconsistency of the data. In this regard, recently, the attention of researchers has shifted to extracting knowledge from natural language texts. Particularly noteworthy is the recently developing approach based on the use of quantum formalism to the objects of the macrocosm, which allows one to consider the uncertainty and inaccuracy inherent in the natural language. Numerous experiments conducted over the past 30 years demonstrate that the mathematical apparatus developed for modeling elementary particles also satisfactorily describes the behavior of people, which cannot be described by the mathematical apparatus of classical logic and probability theory. A review of the methods of processing natural language texts by means of quantum mathematics is presented. The methods are designed to eliminate the shortcomings of existing methods and means of information retrieval.

Текст научной работы на тему «Методы квантового формализма в информационном поиске и обработке текстов на естественных языках»

ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА

УДК 004.415.2

DOI: 10.17586/0021-3454-2019-62-8-702-709

МЕТОДЫ КВАНТОВОГО ФОРМАЛИЗМА В ИНФОРМАЦИОННОМ ПОИСКЕ И ОБРАБОТКЕ ТЕКСТОВ НА ЕСТЕСТВЕННЫХ ЯЗЫКАХ

И. А. Бессмертный, А. В. Васильев, Ю. А. Королёва, А. В. Платонов, Е. А. Полещук

Университет ИТМО, 197101, Санкт-Петербург, Россия E-mail: igor_bessmertny@hotmail. com

Создание интеллектуальных систем в парадигме логического поиска решений требует формализации знаний в виде онтологий, продукционных моделей и т.п. Однако обеспечить строгую формализацию знаний удается далеко не всегда вследствие неполноты, неточности и противоречивости данных. В последнее время внимание исследователей переключилось на извлечение знаний из естественно-языковых текстов. Особого внимания заслуживает подход, основанный на использовании квантового формализма к объектам макромира, позволяющим учитывать присущую естественному языку неопределенность и неточность. Многочисленные эксперименты, проведенные в течение последних 30 лет, демонстрируют, что математический аппарат, разработанный для моделирования элементарных частиц, также удовлетворительно описывает поведение людей, которое не может быть описано математическим аппаратом классической логики и теории вероятностей. Проанализированы методы обработки естественно-языковых текстов средствами квантовой математики.

Ключевые слова: интеллектуальные системы, квантовый формализм, обработка естественно-языковых текстов, моделирование семантики, оператор плотности

Продолжающийся в течение последних десятилетий экспоненциальный рост количества документальных источников информации сопровождается снижением ее качества. Несмотря на появление многочисленных баз данных и знаний наиболее популярным форматом представления знаний по-прежнему остается текст [1, 2].

Естественно-языковой текст является очень сложным форматом для автоматической обработки данных и представления знаний и, в первую очередь, в связи с тем, что такой массив символов не содержит метаинформации о содержащемся знании, а значит, с этими символами невозможна манипуляция как с единицами некоторого знания. Несмотря на то что в основе концепции Web 3.0 [3] лежит так называемая семантическая разметка [4], позволяющая объединить текст и методы представления знаний, большинство ресурсов в сети Интернет не используют ее, поскольку для выполнения разметки требуются значительные трудовые и временные ресурсы.

Извлечение знаний из естественно-языковых текстов может осуществляться с использованием двух подходов. Первый подход содержит те же этапы, что и усвоение текста челове-

ком, в частности, синтаксический и семантический анализ; второй предполагает непосредственное извлечение смысла из текста.

Интеллектуальные системы, базирующиеся на формализации знаний и логическом поиске, в последние десятилетия практически не развиваются, поскольку формализации знаний в широком контексте препятствуют невозможность классификации, вызванная неочевидностью разделения объектов окружающего мира на концепты, а также субъективность наблюдателей, не выходящих за рамки собственного опыта. Указанные факторы приводят к тому, что базы знаний, построенные на классической логике, неизбежно становятся неточными, неполными и противоречивыми. В этой связи внимание исследователей все чаще привлекает математический аппарат квантовой логики, с помощью которого делаются попытки моделировать не только объекты микромира, но также человеческого мышления, а также исследовать результаты когнитивной деятельности человека, в первую очередь, накопленные текстовые источники информации.

В течение последних 30 лет проводились исследования в области квантовой логики, и было обнаружено, что понятийный аппарат человека достаточно правдоподобно описывается эмпирическими законами квантовой механики, установленными для элементарных частиц. Аналогами измерения состояний элементарных частиц здесь обычно считаются ответы на вопросы. Квантовоподобным состоянием обладает сознание человека, которое можно измерить, лишь задавая вопросы и получая в ответ некоторое измеренное состояние. Можно предположить, что естественно-языковые тексты обладают теми же свойствами, что и понятийные модели в человеческом сознании. В этой связи перспективным направлением развития методов информационного поиска следует считать применение математического аппарата квантовой логики к естественно-языковым текстам.

Целью настоящей работы является выявление целесообразности использования методов квантовой механики при обработке естественно-языковых текстов. Для достижения поставленной цели выполнен обзор опубликованных результатов исследований в данной области.

Моделирование семантики через информационные потоки в квантовоподобной системе. По большей части эта группа работ носит теоретический характер ввиду того, что для реализации данных методов требуются большие вычислительные затраты. Тем не менее они представляют интерес с точки зрения предлагаемых моделей. В работах [5, 6] излагается идея объединения дистрибутивной и синтаксической семантики текстов. На основе дистрибутивной семантики, для которой характерно определение вектора смысла слова исходя из статистики по его контексту, авторы предлагают получать векторы, обозначающие смыслы слов. Далее авторы рассматривают алгебру Ламбека [7, 8], с помощью которой описываются грамматика конкретного языка и структура связей в квантовоподобной системе. Объектами этой алгебры являются определенные типы слов (существительные, глаголы, прилагательные и т.д.), а также связи между ними (следует учитывать, что предложение должно быть правильно построенным). Например, для „Алиса ненавидит Боба", выражением в алгебре Ламбека будет:

пп-15п-1п (1)

где п — существительное, и-1 — взаимообратное значение для п, s — глагол, а гТ^ъгТ^ описывает простое повествовательное предложение с транзитивным глаголом, слева и справа от

которого стоят субъект и предикат. Следует обратить внимание, что связки типа „ пп-1" сокращаются до единицы, и в итоге правильно построенное предложение сократится до ^ . При этом в процессе редукции определяются связки между словами, которые и образуют дуги в графе, описывающем квантовую систему. Схема предложения „Алиса ненавидит Боба" приведена на рисунке (стрелки — поток информации, аналогичный потоку в квантовой телепор-тации). Подразумевается, что смысл слова можно получить на основе статистики, собранной по его контекстам, и таким образом представить векторы смыслов отдельных предложений.

В работе [5] рассматривается процесс передачи информации между квантовыми подсистемами при помощи теории категорий. Исходя из аналогии между словами в предложении как отдельными квантовыми подсистемами [9], а отношениями между словами в предложении — как связями в квантовой системе, в работе предлагается рассматривать смысл целой фразы как результат преобразования потока информации в квантовой системе. Авторы строят векторы смыслов целых фраз таким образом [10]: все предложение представляется тензорным произведением векторов-смыслов отдельных слов; затем данное произведение редуцируется оператором специального вида в вектор меньшей размерности [6].

Представление семантики посредством операторов плотности. В работах [7, 8, 11—13] семантика слов и предложений моделируется посредством представления каждого слова как суперпозиции его смыслов, в то время как смысл предложения есть неопределенность более высокого уровня, моделируемая с помощью операторов плотности. В работе [9] описан способ моделирования языка. Каждое слово представляется базовым вектором в пространстве всех слов используемого словаря. Положим, словарь состоит из трех слов: компьютер, система, процессор. Тогда слово процессор можно представить вектором (0,0,1), а слово система — (0,1,0). Подобное представление слов часто используется при автоматизированном анализе естественного языка. Исходя из определения матрицы плотности каждый такой базисный вектор может быть представлен в терминах операторов плотности. Далее авторы предлагают моделировать смысл целой фразы путем взвешенного суммирования операторов плотности всех терминов фразы.

В итоге, в отличие от работы [5], где связывание терминов производится через квантовую запутанность, в [11] связывание терминов производится через суперпозицию. Каждое слово со своим смыслом не представляется квантовой подсистемой, а дает базис, на котором строится представление более крупной структуры, например, словосочетания. Непосредственно задача моделирования языка решается через теорему Глизона [14], которая связывает матрицу плотности р, отражающую состояние квантовой системы, с вероятностью (рр) наблюдения чистого состояния системы через след матрицы, полученной путем перемножения матрицы плотности системы и проектора на вектор на уг-:

Рр(у ) = *(р|уг-уг|). (2)

Здесь и далее используется принятое в квантовой механике обозначение векторов, называемое нотацией Дирака [8—10, 15, 16]: I у — кет-вектор, а у | — бра-вектор. Бра- и кет-векторы комплексно сопряжены и транспонированы относительно друг друга. В аналогичных по применяемому подходу работах [11—13, 17] авторы следуют схожим образом, однако применяют данный формализм для идентификации степени схожести семантики двух слов. Для достижения поставленной задачи необходимо построить контексты слов через операторы плотности, предварительно разбив допустимые формы и роли слова в предложении на независимые группы по степени их схожести. Таким образом, все предложения, в которых присутствует анализируемое слово, подвергаются синтаксическому анализу. Далее, каждой роли анализируемого слова (например, ролью может являться „объект" в субъект-объектном отношении) присваивается вектор контекста, содержащий все слова, имеющие непосредственную синтаксическую связь. Рассмотрим пример. В предложении „мама мыла раму", слово

мама будет определено как субъект, а контекст будет представлен двумя словами: мыть и рама. Итоговый вектор преобразуется в проектор, в то время как смысл слова моделируется через взвешенную сумму таких проекторов через все анализируемые документы. Следует учитывать, что если в одном документе слово имеет несколько значений, то проектор будет построен с предварительным суммированием этих контекстов, отражая неопределенность значения слова в документе.

Непосредственно для оценки идентичности смыслов слов используют полученные матрицы плотности, представляя одну из матриц плотности как проектор на некоторый вектор смысла с использованием теоремы Глизона [5].

В [18—20] исследуется метод моделирования языка посредством составления матриц плотности. Неравенства Белла [21] рассматриваются как инструмент для обнаружения квантовой запутанности нескольких квантовых объектов. Опыт Аэртса [22, 23] распространяется на языковые модели. В качестве основы для построения чистых состояний используется ИЛЬ-метод. Так, при помощи неравенств Белла обнаружены размеры окон, на которых, если верить этим неравенствам, проявляется эффект запутанности. Этот эффект можно наблюдать при тестировании пар слов. Таким образом, материалы работ [18—20] можно рассматривать как основу для тестирования языковых моделей, использующих квантовый формализм.

Также следует обратить внимание на работы [24—28], в которых рассматриваются методы идентификации семантических отношений между парами категорий (антонимия, гипо-нимия, отсутствие отношений). Для этого на базе ИЛЬ-модели вводятся операторы над векторным пространством Ж Ф Ж, где Ж — векторное пространство для ИЛЬ-модели. В работах рассматриваются такие семантические категории, как нефть, порядок и экология. На примере этих категорий вводятся операторы а и 0, где первый оператор вернет (если отрывок текста подразумевает в себе категорию экология) | +1 и | -1 — в ином случае; оператор 0 строится аналогичным образом, но для категории порядок. На основании этих операторов для текстов, подразумевающих категорию „нефть" строятся семантические связи с двумя другими категориями. Предлагается следующий подход:

— если операторы вернули векторы | +1 и | -1 или | -1 и | -1 то в исследуемом тексте наблюдается отношение гипонимии между категориями нефть и экология или экология и уголь;

— если операторы вернули разнонаправленные векторы, то предполагается наличие антонимии;

— если операторы вернули векторы, соответствующие суперпозиции | +1 и | -1, в которой нет четкого выделения базисного вектора, то считается, что между категориями в тексте нет семантической связи.

В качестве реализации таких операторов предлагается использовать операторы Паули. Таким образом, вводится корреляционный анализ в квантово-логическую модель, который позволяет оценивать семантические связи между категориями в тексте.

Заключение. Методы информационного поиска и обработки текстов на естественных языках разделяются на логические и статистические. В последнее время, с появлением работоспособных методов машинного обучения, интерес исследователей сосредоточился на статистических методах, которые не требуют больших трудозатрат на создание баз знаний и демонстрируют лучшие результаты, в частности в устранении неоднозначностей и обработке исключений из правил. Однако статистические методы имеют недостатки, поскольку не учитывают порядок слов в предложениях.

На основе анализа исследований, выполненных на стыке классических методов обработки естественно-языковых текстов и математического аппарата квантовой механики, можно выделить две категории работ:

В работах первой группы моделирование семантики осуществляется через информационные потоки в квантовой системе с точки зрения теории категорий, предлагается аппарат анализа текстов на естественном языке, выраженный в форме алгебры. На текущий момент эти работы представляют скорее теоретический интерес, нежели практический.

Вторая группа работ связана с использованием методов квантового формализма, который позволяет в более удобной форме отображать вероятности в форме волновых функций и, в частности, учитывать некоммутативность операций, наблюдаемую в реальных экспериментах на макроуровне.

Остальные, по большей части теоретические, работы нельзя сгруппировать по какому-то общему критерию, однако они могут привнести интересные идеи в практико-ориентированные проекты.

список литературы

1. Бородай С. Ю. Современное понимание проблемы лингвистической относительности: работы по пространственной концептуализации // Вопросы языкознания. 2013. № 4. C. 17—54.

2. Caputo A., Piwowarski B., Lalmas M. A Query Algebra for Quantum Information Retrieval // Proc. of the 2nd Italian Information Retrieval Workshop. 2011. January.

3. Hitzler P., Krtzsch M., Rudolph S. Foundations of Semantic Web Technologies. Chapman & Hall/CRC, 2009.

4. Amerland D. Google Semantic Search: Search Engine Optimization Techniques That Get Your Company More Traffic, Increase Brand Impact, and Amplify Your Online Presence. Que Publishing Company, 2013. P. 40—53.

5. Clark S., Coecke B., Sadrzadeh M. A Compositional Distributional Model of Meaning. Quantum Interaction. California, USA, 2007.

6. Blacoe W., Kashefi E., Lapata M. A Quantum-Theoretic Approach to Distributional Semantics // Human Language Technologies: Conf. of the North American Chapter of the Association of Computational Linguistics. Proc. June 9—14, 2013, Atlanta, Georgia, USA, Association for Computational Linguistics, 2013. P. 847—857.

7. Li J., Zhang P., Song D., Hou Y. An adaptive contextual quantum language model // Physica A: Statistical Mechanics and its Applications. 2016, March. DOI: 10.1016/j.physa.2016.03.003.

8. Хренников А. Ю. Введение в квантовую теорию информации. М.: Физматлит, 2008. 284 с. ISBN: 978-5-92210951-2.

9. Lambek J. Type Grammar Revisited // Logical Aspects of Computational Linguistics. Berlin, Heidelberg: Springer, 1999. Vol. 27. P. 1—27.

10. Abramsky S., Duncan R. A categorical quantum logic // Mathematical Structures in Computer Science. 2006. Vol. 16, N 3. P. 469—489.

11. Sordoni A., Nie J., Bengio Y. Modeling Term Dependencies with Quantum Language Models for IR // Proc. of the 36th Intern. ACM SIGIR Conf. on Research and Development in Information Retrieval. SIGIR'13. NY, USA: ACM, 2013. P. 653—662.

12. Sordoni A., Bengio Y., and Nie J.-Y. Learning concept embeddings for query expansion by quantum entropy minimization // Proc. of the Twenty-Eighth AAAI Conf. on Artificial Intelligence. 2014. Р. 1586—1582.

13. D'Hooghe B., Aerts D., Haven E. Quantum formalisms in non-quantum physics situations: historical developments and directions for future research [Электронный ресурс]: <https://www.researchgate.net/ publication/228568348_Quantum_formalisms_in_non-quantum_physics_situations_historical_developments_and_ directions_for_future_research>.

14. Blacoe W., Kashefi E., Lapata M. A Quantum-Theoretic Approach to Distributional Semantics // Human Language Technologies: Conf. of the North American Chapter of the Association of Computational Linguistics, Proce. USA, Association for Computational Linguistics, 2013. P. 847—857 [Электронный ресурс]: <http://www.vub.ac.be/ CLEA/workshop/qs08/abstracts08/Haven.pdf>.

15. Clark S., Coecke B., Grefenstette E. et al. A quantum teleportation inspired algorithm produces sentence meaning from word meaning and grammatical structure // Malaysian J. of Mathematical Sciences. 2013. Vol. 8.:

16. Rijsbergen C. J. van. The Geometry of Information Retrieval. NY: Cambridge University Press, 2004. ISBN: 0521838053.

17. Gabora L., Aerts D. Contextualizing concepts using a mathematical generalization of the quantum formalism // J. Exp. Theor. Art. Int. 2002. Vol. 31. P. 327—358.

18. Barros J., Toffano Z., Meguebli Y., Doan B. Contextual Query Using Bell Tests // Quantum Interaction: 7th Intern. Conf. UK. 2013. Vol. 8369. P. 110—121.

19. Robins J. M., Vanderweele T. J., and Gill R. D. A proof of Bell's inequality in quantum mechanics using causal interactions // Scand. 2015. J. Stat. To appear [Электронный ресурс]: <biostats.bepress:cobra/83>.

20. Sordoni A., Nie J.-Y. Looking at vector space and language models for IR using density matrices // Quantum Interaction. QI 2013. Lecture Notes in Computer Science. 2014. Vol. 8369. P. 147—159. https://doi.org/10.1007/978-3-642-54943-4_13

21. Bell J. S. On the Einstein Podolsky Rosen paradox // Physics. 1964. Vol. 1, N 3. P. 195—200 [Электронный ресурс]: <https://cds.cern.ch/record/111654>.

22. Fano G., Blinder S. M. Quantum Entanglement and Bell's Theorem. Mathematical Methods and Conceptual Foundations // Springer International Publishing. 2017. Vol. 262.

23. Aerts D., Czachor M., Sozzo S. Quantum Interaction Approach in Cognition, Artificial Intelligence and Robotics // CoRR. 2011. Vol. 10. P. 35—40.

24. Galofaro F., Toffano Z., Doan B. A quantum-based semiotic model for textual semantics // Kybernetes. 2018. Vol. 47, N 2. P. 307—320. https://doi.org/10.1108/K-05-2017-0187.

25. Lund K., Burgess C. Producing high-dimensional semantic spaces from lexical co-occurrence // Behavior Research Methods Instruments and Computers. 1996. Vol. 28. P. 203—208.

26. Yan Xin, Li Xue, Song Dawei. A correlation analysis on LSA and HAL semantic space models // Computational and Information Science. Lecture Notes in Computer Science. Berlin: Springer, 2004. P. 711—717.

27. Hou Y., Song D. Characterizing pure high-order entanglements in lexical semantic spaces via information geometry // Intern. Symp. on Quantum Interaction. Springer, 2009. P. 237—250.

28. Hou Y., Zhao X., Song D., Li W. Mining pure high-order word associations via information geometry for information retrieval // ACM Transactions on Information Systems (TOIS). 31. 12.2013.

Сведения об авторах

Игорь Александрович Бессмертный — д-р техн. наук, доцент; Университет ИТМО; факультет программной инженерии и компьютерной техники; E-mail: igor_bessmertny@hotmail.com

Алексей Викторович Васильев — аспирант; Университет ИТМО; факультет программной инжене-

рии и компьютерной техники; E-mail: avvasiljev@corp.ifmo.ru

Юлия Александровна Королёва — канд. техн. наук; Университет ИТМО; факультет программной

инженерии и компьютерной техники; E-mail: jakoroleva@corp.ifmo.ru

Алексей Владимирович Платонов — аспирант; Университет ИТМО; факультет программной инженерии и компьютерной техники; E-mail: avplatonov@corp.ifmo.ru

Поступила в редакцию 28.01.19 г.

Ссылка для цитирования: Бессмертный И. А., Васильев А. В., Королёва Ю. А., Платонов А. В., Полещук Е. А. Методы квантового формализма в информационном поиске и обработке текстов на естественных языках // Изв. вузов. Приборостроение. 2019. Т. 62, № 8. С. 702—709.

QUANTUM FORMALISM METHODS IN INFORMATION RETRIEVAL AND PROCESSING OF TEXTS IN NATURAL LANGUAGES

I. A. Bessmertny, A. V. Vasiljev, Yu. A. Koroleva, A. V. Platonov, E. A. Poleschuk

ITMO University, 197101, St. Petersburg, Russia E-mail: igor_bessmertny@hotmail.com

Creation of intelligent systems in the paradigm of logical decision-making requires formalization of knowledge in the form of ontologies, production models, etc. However, a rigorous formalization of knowledge is far from always possible due to the incompleteness, inaccuracy, and inconsistency of the data. In this regard, recently, the attention of researchers has shifted to extracting knowledge from natural language texts. Particularly noteworthy is the recently developing approach based on the use of quantum formalism to the objects of the macrocosm, which allows one to consider the uncertainty and inaccuracy inherent in the natural language. Numerous experiments conducted over the past 30 years demonstrate that the mathematical apparatus developed for modeling elementary particles also satisfactorily describes the behavior of people, which cannot be described by the mathematical apparatus of classical logic and probability theory. A review of the methods of processing natural language texts by means of quantum mathematics is presented. The methods are designed to eliminate the shortcomings of existing methods and means of information retrieval.

Keywords: intelligent systems, quantum formalism, processing of natural language texts, modeling of semantics, density operator

REFERENCES

1. Boroday S.Yu. Voprosy Jazykoznanija, 2013, no. 4, pp. 17-54. (in Russ.)

2. Caputo A., Piwowarski B., Lalmas M. Proceedings of the 2nd Italian Information Retrieval Workshop, 2011, January.

3. Hitzler P., Krtzsch M., Rudolph S. Foundations of Semantic Web Technologies, Chapman & Hall/CRC, 2009.

4. Amerland D. Google Semantic Search: Search Engine Optimization Techniques That Get Your Company More Traffic, Increase Brand Impact, and Amplify Your Online Presence, Que Publishing Company, 2013, рр. 40-53.

5. Clark S., Coecke B., Sadrzadeh M. Quantum Interaction, California, USA, 2007.

6. Blacoe W., Kashefi E., Lapata M. Human Language Technologies: Conference of the North American Chapter of the Association of Computational Linguistics, Proceedings, June 9-14, 2013, Atlanta, Georgia, USA, Association for Computational Linguistics, 2013, March, рр. 847-857. DOI: 10.1016/j.physa.2016.03.003

7. Li J., Zhang P., Song D., Hou Y. Physica A: Statistical Mechanics and its Applications, 2016, March. DOI: 10.1016/j.physa.2016.03.003.

8. Hrennikov A.J. Vvedenie v kvantovuju teoriju informacii (Introduction to The Quantum Information Theory), Moscow, 2008, рр. 97-107.

9. Lambek J. Logical Aspects of Computational Linguistics, Berlin, Heidelberg, Springer, 1999, vol. 27, рр. 1-27.

10. Abramsky S., Duncan R. Mathematical Structures in Computer Science, 2006, no. 3(16), pp. 469-489.

11. Sordoni A., Nie J., Bengio Y. Proceedings of the 36th International ACM SIGIR Conference on Research and Development in Information Retrieval. SIGIR'13, NY, USA, ACM, 2013, рр. 653-662.

12. Sordoni A., Bengio Y., and Nie J.-Y. Proceedings of the Twenty-Eighth AAAI Conference on Artificial Intelligence, 2014, рр. 1586-1582.

13. D'Hooghe B., Aerts D., Haven E. VUB, CLEA, 2008, https://www.researchgate.net/publication/ 228568348_Quantum_formalisms_in_non-

quantum_physics_situations_historical_developments_and_directions_for_future_research.

14. Blacoe W., Kashefi E., Lapata M. Human Language Technologies: Conference of the North American Chapter of the Association of Computational Linguistics, Proceedings, USA, Association for Computational Linguistics, 2013, рр. 847-857, http://www.vub.ac.be/CLEA/workshop/ qs08/abstracts08/ Haven.pdf.

15. Clark S., Coecke B., Grefenstette E. et al. Malaysian Journal of Mathematical Sciences, 2013, vol. 8.

16. Rijsbergen C. J. van. The Geometry of Information Retrieval, NY, USA, Cambridge University Press, 2004. ISBN: 0521838053.

17. Gabora L., Aerts D. J. Exp. Theor. Art. Int., 2002, vol. 31, рр. 327-358.

18. Barros J., Toffano Z., Meguebli Y., Doan B. Quantum Interaction, 7th International Conference, UK, 2013, vol. 8369, рр. 110-121.

19. Robins J.M., Vanderweele T.J. and Gill R.D. Scand, 2015, J. Stat. biostats.bepress:cobra/83.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

20. Sordoni A., Nie J.-Y. Quantum Interaction. QI 2013. Lecture Notes in Computer Science, 2014, vol. 8369, рр. 147-159, https://doi.org/10.1007/978-3-642-54943-4_13

21. Bell J.S. Physics, 1964, no. 3(1), pp. 195-200, https://cds.cern.ch/record/111654.

22. Guido Fano, Blinder S.M. Springer international publishing, 2017, vol. 262.

23. Aerts D., Czachor M., Sozzo S. CoRR, 2011, vol. 10, рр. 35-40.

24. Galofaro F., Toffano Z., Doan B. Kybernetes, 2018, no. 2(47), pp. 307-320, https://doi.org/10.1108/K-

05-2017-0187.

25. Lund K., Burgess C. Behavior Research Methods Instruments and Computers, 1996, vol. 28, pp. 203-208.

26. Yan Xin, Li Xue, Song Dawei, Computational and Information Science. Lecture Notes in Computer Science, Berlin, Springer, 2004, pp. 711-717.

27. Hou Y., Song D. International Symposium on Quantum Interaction, Springer, 2009, pp. 237-250.

28. Hou Y., Zhao X., Song D., Li W. ACM Transactions on Information Systems (TOIS), 31. 12.2013.

Igor A. Bessmertny

Alexey V. Vasiljev Yulia A. Koroleva Alexey V. Platonov

For citation: Bessmertny I. A., Vasiljev A. V., Koroleva Yu. A., Platonov A. V., Poleschuk E. A. Quantum formalism methods in information retrieval and processing of texts in natural languages. Journal of Instrument Engineering. 2019. Vol. 62, N 8. P. 702—709 (in Russian).

DOI: 10.17586/0021-3454-2019-62-8-702-709

Data on authors

Dr. Sci., Associate Professor; ITMO University, Faculty of Software Engineering and Computer Technique; E-mail: igor_bessmertny@hotmail.com

Post-Graduate Student; ITMO University, Faculty of Software Engineering and Computer Technique; E-mail: avvasiljev@corp.ifmo.ru PhD; ITMO University, Faculty of Software Engineering and Computer Technique; Assistant; E-mail: jakoroleva@corp.ifmo.ru Post-Graduate Student; ITMO University, Faculty of Software Engineering and Computer Technique; E-mail: avplatonov@corp.ifmo.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.