Научная статья на тему 'МОДЕЛИРОВАНИЕ ПРОЦЕССА ПОИСКА ОПЕРАТИВНО ЗНАЧИМОЙ ИНФОРМАЦИИ ИЗ ОТКРЫТЫХ ГОСУДАРСТВЕННЫХ ИНФОРМАЦИОННЫХ РЕСУРСОВ'

МОДЕЛИРОВАНИЕ ПРОЦЕССА ПОИСКА ОПЕРАТИВНО ЗНАЧИМОЙ ИНФОРМАЦИИ ИЗ ОТКРЫТЫХ ГОСУДАРСТВЕННЫХ ИНФОРМАЦИОННЫХ РЕСУРСОВ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
95
23
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОТКРЫТЫЕ ГОСУДАРСТВЕННЫЕ ИНФОРМАЦИОННЫЕ РЕСУРСЫ / ВЗАИМОСВЯЗИ МЕЖДУ КАТЕГОРИЯМИ ДАННЫХ / ОПЕРАТИВНО ЗНАЧИМАЯ ИНФОРМАЦИЯ / ГРАФОАНАЛИТИЧЕСКИЙ МЕТОД

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Никулина Е. Ю., Обухова Л. А., Рогозин Е. А.

Цель. Целью исследования является повышение эффективности мероприятий по выявлению, расследованию и раскрытию правонарушений и преступлений на основе анализа ресурсов сети Интернет на предмет выявления и структуризации пригодной для интеллектуального анализа информации; выявить взаимосвязи между категориями данных, разработать модель получения оперативно значимой информации из открытых государственных информационных ресурсов. Метод. Исследование основано на применении статистического анализа для описания общей структуры информации о физическом лице, размещенной в официальных государственных информационных ресурсах. Категорированный список актуальных веб-ресурсов, содержащих оперативно значимую информацию о лице или предмете преступления, составлен на основании экспертных оценок сотрудников органов внутренних дел. Для определения взаимосвязей между категориями данных использован графоаналитический метод исследования потоков информации, построена графовая модель получения оперативно значимой информации из открытых государственных информационных ресурсов. Результат. Представлены результаты анализа ресурсов сети Интернет на предмет выявления пригодной для интеллектуального анализа информации, проведена их структуризация, выявлены взаимосвязи между категориями данных, разработана модель получения оперативно значимой информации из открытых государственных информационных ресурсов. Вывод. Проведенный системный анализ государственных информационных ресурсов сети Интернет позволил выявить взаимосвязи между категориями данных и использовать их для получения оперативно значимой информации из открытых государственных информационных ресурсов. На практике построенная модель может быть использована для оптимизации нечеткого поиска. Для решения поставленной задачи представляется возможным применение нейронных сетей Кохонена или алгоритмов Хемминга. Аппарат нейронных сетей позволит определить закономерностей и оптимизировать поиск оперативно значимой информации.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Никулина Е. Ю., Обухова Л. А., Рогозин Е. А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

MODELING THE PROCESS OF SEARCHING FOR OPERATIONALLY SIGNIFICANT INFORMATION FROM OPEN STATE INFORMATION RESOURCES

Objective. The purpose of the study is to increase the effectiveness of measures to identify, investigate and disclose offenses and crimes based on the analysis of Internet resources in order to identify and structure information suitable for intellectual analysis; identify relationships between data categories, develop a model for obtaining operationally significant information from open government information resources. Method. The study is based on the use of statistical analysis to describe the general structure of information about an individual posted in official state information resources. A categorized list of relevant web resources containing operationally significant information about a person or subject of a crime is compiled on the basis of expert assessments of law enforcement officers. To determine the relationships between data categories, a graphical-analytical method for studying information flows was used, and a graph model for obtaining operationally significant information from open state information resources was built. Result. The results of the analysis of Internet resources in order to identify information suitable for intellectual analysis are presented, their structuring is carried out, relationships between data categories are identified, and a model for obtaining operationally significant information from open state information resources is developed. Conclusion. The conducted system analysis of the state information resources of the Internet made it possible to identify the relationship between the categories of data and use them to obtain operationally significant information from open state information resources. In practice, the constructed model can be used to optimize fuzzy search. To solve this problem, it seems possible to use Kohonen neural networks or Hamming algorithms. The apparatus of neural networks will allow you to determine patterns and optimize the search for operationally significant information.

Текст научной работы на тему «МОДЕЛИРОВАНИЕ ПРОЦЕССА ПОИСКА ОПЕРАТИВНО ЗНАЧИМОЙ ИНФОРМАЦИИ ИЗ ОТКРЫТЫХ ГОСУДАРСТВЕННЫХ ИНФОРМАЦИОННЫХ РЕСУРСОВ»

ИНФОРМАТИКА, ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА И УПРАВЛЕНИЕ COMPUTER SCIENCE, COMPUTER ENGINEERING AND MANAGEMENT УДК 004.05

DOI: 10.21822/2073-6185-2021-48-4-123-132

Оригинальная статья /Original Paper

Моделирование процесса поиска оперативно значимой информации из открытых государственных информационных ресурсов Е.Ю. Никулина, Л.А. Обухова, Е.А. Рогозин

Воронежский институт МВД России, 394065, г. Воронеж, пр. Патриотов, 53, Россия

Резюме. Цель. Целью исследования является повышение эффективности мероприятий по выявлению, расследованию и раскрытию правонарушений и преступлений на основе анализа ресурсов сети Интернет на предмет выявления и структуризации пригодной для интеллектуального анализа информации; выявить взаимосвязи между категориями данных, разработать модель получения оперативно значимой информации из открытых государственных информационных ресурсов. Метод. Исследование основано на применении статистического анализа для описания общей структуры информации о физическом лице, размещенной в официальных государственных информационных ресурсах. Категорированный список актуальных веб-ресурсов, содержащих оперативно значимую информацию о лице или предмете преступления, составлен на основании экспертных оценок сотрудников органов внутренних дел. Для определения взаимосвязей между категориями данных использован графоаналитический метод исследования потоков информации, построена графовая модель получения оперативно значимой информации из открытых государственных информационных ресурсов. Результат. Представлены результаты анализа ресурсов сети Интернет на предмет выявления пригодной для интеллектуального анализа информации, проведена их структуризация, выявлены взаимосвязи между категориями данных, разработана модель получения оперативно значимой информации из открытых государственных информационных ресурсов. Вывод. Проведенный системный анализ государственных информационных ресурсов сети Интернет позволил выявить взаимосвязи между категориями данных и использовать их для получения оперативно значимой информации из открытых государственных информационных ресурсов. На практике построенная модель может быть использована для оптимизации нечеткого поиска. Для решения поставленной задачи представляется возможным применение нейронных сетей Кохонена или алгоритмов Хемминга. Аппарат нейронных сетей позволит определить закономерностей и оптимизировать поиск оперативно значимой информации.

Ключевые слова: открытые государственные информационные ресурсы, взаимосвязи между категориями данных, оперативно значимая информация, графоаналитический метод

Для цитирования: Е.Ю. Никулина, Л.А. Обухова, Е.А. Рогозин. Моделирование процесса поиска оперативно значимой информации из открытых государственных информационных ресурсов. Вестник Дагестанского государственного технического университета. Технические науки. 2021; 48 (4): 123-132. DOI:10.21822/2073-6185-2021-48-4-123-132

Modeling the process of searching for operationally significant information from open state information resources E.Yu. Nikulina, L.A. Obukhova, E.A. Rogozin

Voronezh Institute of the Ministry of Internal Affairs of Russia, 53 Patriotov Ave., Voronezh 394065, Russia Abstract. Objective. The purpose of the study is to increase the effectiveness of measures to identify, investigate and disclose offenses and crimes based on the analysis of Internet resources in order to identify and structure information suitable for intellectual analysis; identify relationships be-

tween data categories, develop a model for obtaining operationally significant information from open government information resources. Method. The study is based on the use of statistical analysis to describe the general structure of information about an individual posted in official state information resources. A categorized list of relevant web resources containing operationally significant information about a person or subject of a crime is compiled on the basis of expert assessments of law enforcement officers. To determine the relationships between data categories, a graphical-analytical method for studying information flows was used, and a graph model for obtaining operationally significant information from open state information resources was built. Result. The results of the analysis of Internet resources in order to identify information suitable for intellectual analysis are presented, their structuring is carried out, relationships between data categories are identified, and a model for obtaining operationally significant information from open state information resources is developed. Conclusion. The conducted system analysis of the state information resources of the Internet made it possible to identify the relationship between the categories of data and use them to obtain operationally significant information from open state information resources. In practice, the constructed model can be used to optimize fuzzy search. To solve this problem, it seems possible to use Kohonen neural networks or Hamming algorithms. The apparatus of neural networks will allow you to determine patterns and optimize the search for operationally significant information.

Keywords: open government information resources, relationships between data categories, operationally significant information, graphic-analytical method

For citation: E.Yu. Nikulina, L.A. Obukhova, E.A. Rogozin. Modeling the process of searching for operationally significant information from open state information resources. Herald of Daghestan State Technical University. Technical Sciences. 2021; 48 (4): 123-132. (In Russ.) DOI:10.21822/2073 -6185-2021-48-4-123-132

Введение. В настоящее время объемы данных, представленных в государственных и негосударственных информационных ресурсах сети Интернет, растут в геометрической прогрессии. Для обработки стремительно растущих массивов различных по форме и представлению видов данных требуются большие объемы ресурсов и более сложные программные решения. Размещенная открытая информация касается разнообразных областей деятельности юридических и физических лиц. Поэтому мониторинг государственных и негосударственных информационных ресурсов, размещающих открытую информацию, особенно важен при выявлении оперативно значимой информации. Однако в настоящее время перечень таких информационных ресурсов отсутствует. Поэтому проведение исследований в данной области приобретают особую актуальность. Как следствие, разработка и реализация алгоритмов обработки и анализ разнообразных по форме представления больших объемов информации, позволит повысить эффективность мероприятий по выявлению, расследованию и раскрытию правонарушений и преступлений.

В статье представлены результаты анализа ресурсов сети Интернет на предмет выявления пригодной для интеллектуального анализа информации, проведена их структуризация, выявлены взаимосвязи между категориями данных, разработана модель получения оперативно значимой информации из открытых государственных информационных ресурсов.

Постановка задачи. На текущий момент сотрудниками правоохранительных органов для получения оперативно значимой информации все чаще используются различные информационные источники данных: средства массовой информации, автоматизированные информационные системы специального назначения, веб-ресурсы глобальной сети Интернет и др. В частности, в сети Интернет размещены сведения, опираясь на которые сотрудники предварительного следствия органов внутренних дел могут получить информацию о правонарушениях отдельных лиц и организаций, а также о противозаконных действиях отдельных лиц. Поэтому интенсификация информационного потока на сегодняшний день позволяет воспринимать Интернет как особый инструмент поиска информации, а не только, как технологический инструмент информационной системы.

Однако существует ряд проблем, связанных с использованием информации, размещенной на веб-ресурсах с открытым доступом. С одной стороны, не все открытые источники информации содержат актуальную и достоверную информацию, что не позволяет использовать ее в качестве доказательной базы при раскрытии и расследовании преступлений. Решением данной проблемы может стать использование информации, размещаемой на официальных веб-ресурсах ведомственных служб и организаций, с помощью которых могут быть установлены неизвестные следствию факты и сведения.

С другой стороны, проблема использования таких информационных источников заключается в значительном объеме разрозненных, логически не связанных между собой данных, что усложняет процесс поиска той информации, которая может быть актуальна на момент расследования правонарушения или преступления.

Сотрудники предварительного следствия органов внутренних дел, используя ресурсы сети Интернет, в ходе проведения поисково-разыскной работы выделяют исходную и разыскную информацию [1]. Исходные данные включают в себя информацию, полученную следователем письменно или устно:

- в результате проведенного первоначального следственного осмотра или опроса;

- в результате оформления предварительных показаний потерпевших и свидетелей;

- в результате оперативно-разыскных мероприятий органов следствия и дознания;

- в результате аналитической обработки информации, полученной из интернет-ресурсов,

- из медицинских учреждений и иных организаций, владеющих информацией о лицах и событиях в силу профессиональной деятельности.

Исходные данные становятся базой для проведения поисково-разыскной работы сотрудниками предварительного следствия. Информацию, содержащуюся в исходных данных, можно характеризовать как доказательственную или ориентирующую.

Разыскная информация содержит результаты, полученные органами расследования в ходе следствия. К такому виду информации относится и информация, полученная из Интернета, но в отличие от исходных сведений, розыскные должны быть правдоподобными и актуальными, что могут гарантировать лишь официальные государственные источники данных. Решением вопроса актуальности и достоверности информации является использование государственных информационных систем.

Анализ существующих информационных веб-ресурсов показал, многие из них содержат информацию о физических лицах, которая может быть использована при раскрытии и расследовании различных правонарушений и преступлений. Однако в настоящее время отсутствует перечень таких информационных систем.

Поэтому в ходе работы рассматривались только те системы, в которых содержится достоверная информация, т.е. государственные информационные системы, содержащие официальную информацию, размещаемую на официальных государственных информационных ресурсах.

Методы исследования. Согласно Федеральному закону от 27 июля 2006 г. № 149 «Об информации, информационных технологиях и о защите информации» под государственными информационными системами подразумеваются федеральные и региональные информационные системы, созданные на основании соответственно федеральных законов, законов субъектов РФ, правовых актов государственных органов [2, 3].

Выберем в качестве объекта исследования физическое лицо, а также предметы или происшествия, связанные с ним. В ходе проведения структурного анализа открытой информации о

физическом лице определим общие сущности и атрибуты, характеризующие лицо по всем сферам жизнедеятельности [3-10].

В поисковых системах, связанных с индивидуальным налоговым номером физического лица, выделим сущность «Индивидуальный номер налогоплательщика», которая характеризуется следующим набором атрибутов: «Серия ИНН», «Номер ИНН», «Фамилия», «Имя», «Отчество», «Дата рождения», «Место рождения», «Вид документа, удостоверяющего личность», «Серия и номер документа», «Дата выдачи документа».

В поисковой системе, связанной с вопросами миграции, выделим:

- сущность «Запрет на въезд в Российскую Федерацию», которая характеризуется следующим набором атрибутов: «Фамилия», «Имя», «Отчество», «Пол», «Дата рождения», «Гражданство», «Тип документа», «Номер документа», «Дата действительности документа», «Выдавшая страна или организация»;

- сущность «Разрешение на работу», которая характеризуется следующим набором атрибутов: «Вид разрешения», «Серия», «Номер», «Серия бланка документа», «Вид деятельности лица», «Номер паспорта лица»;

- сущность «Разрешение на въезд в РФ», которая характеризуется следующим набором атрибутов: «Номер приглашения», «Серия бланка», «Номер бланка».

В поисковой системе, связанной с вопросами недвижимости, выделим:

- сущность «Объект недвижимости», которая характеризуется следующим набором атрибутов: «Субъект РФ», «Район», «Город», «Населённый пункт», «Элемент планировочной структуры», «Улица», «Номер здания», «Код ОКТМО», «Тип дома», «Способ управления», «Состояние», «Кадастровый номер»;

- сущность «Объект ЕГРН», которая характеризуется следующим набором атрибутов: «Тип объекта», «Кадастровый номер», «Условный номер», «Регион», «Район», «Город», «Населённый пункт», «Улица», «Дом», «Строение», «Корпус», «Квартира».

В поисковой системе, связанной с автотранспортными средствами, выделим:

- сущность «Водитель», которая характеризуется следующим набором атрибутов: «Серия», «Номер» и «Дата выдачи» свидетельства на транспортное средство;

- сущность «Регистрация транспортного средства», которая характеризуется следующим набором атрибутов: «VIN», «Номер кузова» и «Номер шасси» транспортного средства;

- сущность «Транспортное средство», которая характеризуется следующим набором атрибутов: «Государственный знак» и «Свидетельство».

В поисковой системе, позволяющей получить информацию о физических лицах, находящихся в розыске, выделим:

- сущность «Розыск МВД», которая характеризуется следующим набором атрибутов: «Фамилия», «Имя», «Отчество»; «Год», «Месяц», «День» рождения;

- сущность «Розыск ФСИН», которая характеризуется следующим набором атрибутов: «Регион», «ФИО».

Указанные взаимосвязи сущностей информационных объектов физических лиц выявлены путем выделения идентичных параметров (атрибутов) различных сущностей. При этом атрибуты сущностей определялись из веб-интерфейса соответствующего информационного ресурса.

На основании экспертных оценок составим следующий категорированный список актуальных на сегодняшний день информационных систем (веб-ресурсов), содержащих оперативно значимую информацию о лице или предмете правонарушения (преступления), сгруппированных по различным аспектам (категориям) жизнедеятельности физических лиц (табл.1).

Таблица 1. Перечень актуальных информационных систем (веб-ресурсов) _Table 1. List of current information ^ systems (web resources)_

№ п.п. Категория/Category Веб-ресурс/ Web resource

1 Социальные сети. Social networks. https://duckduckgo.com/ https://findclone.ru/ http://220vk.com

2 Новостные источники, представленные в сети Интернет, архивные СМИ открытого доступа. News sources presented on the Internet, archival open access media http://www.findsmi.ru/ http://www.compromat.ru/ http://rucompromat.com/

3 Поисковые системы, позволяющие получить информацию о юридических лицах, индивидуальных предпринимателях, физических лицах, налогах, бухгалтерской отчетности, задолженности по налогам, лицензиях на виды деятельности. Search engines that allow you to get information about legal entities, individual entrepreneurs, individuals, taxes, financial statements, tax debts, licenses for activities. https://service.nalog.ru/ https ://www. rusprofile. ru/ https://zachestnyibiznes.ru/ https://fedresurs.ru/company/ https://znaemvseh. ru/ https://www.vestnik-gosreg.ru/publ/vgr/ http://www.centerdolgov.ru/ https://www.gks.ru/accounting report https://pb.nalog.ru/ https://egrul.nalog.ru/ https ://www. rusprofile. ru

4 Поисковые системы кадастровой регистрации объектов недвижимости. Search systems for cadastral registration of real estate objects. http://rosreestr. gov.ru https://dom.gosuslugi.ru/#!/houses/ https://egrn365.ru

5 Поисковые системы индивидуального налогового номера физического или юридического лица. Search engines for the individual tax number of a natural or legal person. https://nalog-ru.com/inn https://www. nalo g.ru/rn77/service/invalid cert/ www.tinkoff.ru/inn

6 Поисковые системы задолженностей физических и юридических лиц по ИНН. Search systems for debts of individuals and legal entities by TIN. https://npd.nalog.ru/check-status/ https://peney.net/ https://old.a-3.ru/pay taxes https://money.yandex.ru/taxes/

7 Проверка действительности паспорта по паспортным данным на момент запроса. Checking the validity of the passport according to the passport data at the time of the request. http://services.fms. gov.ru/info-service.htm?sid=2000 https://proverk.ru/passport/ http://services.fms. gov.ru/info-service.htm?sid=2000

8 Поисковые системы, связанные с автотранспортными средствами. Search engines related to motor vehicles. https://xn--90adear.xn--p1ai/check/

https^^^^/check https ://www. eaisto .info/ https://avinfotelegraph.com

9 Телефонные справочники, объявления о продаже/утере номерных вещей. Telephone directories, advertisements for the sale/loss of licensed items. http://get-contact.ru/ https://www. imei. info/ https://numbuster.com/ru/ https://sndeep.info/lostolen https://www. oxv gensoftware.ru долго, платный https://smspilot.ru/test.php?type=hlr https://smsc.ru/testhlr/?SE=c6a65a8a https://spravnik.com/ https://xinit.ru/bs/ https://www.kody.su/city/ https://www.spravportal.ru

10 Поисковые системы, справочники абонентских номеров и прочая информация о пользователе сети Интернет (физический адрес устройства, IP-адрес, провайдер, домен и т.п.). Search engines, directories of subscriber numbers and www.2ip.ru/whois/ https://www.wservice.info/ ttp://whoishistory.ru/ http://whoishistory.ru/ https://mailtester.com/testmail.php

№ п.п. Категория/Category Веб-ресурс/ Web resource

other information about the Internet user (physical address of the device, IP address, provider, domain, etc.). https://xinit.ru https://www.shodan.io https://iplocation.com

11 Справочные системы контролирующих государственных органов (Роснадзор и пр.). Reference systems of controlling state bodies (Rosnad-zor, etc.) http://roszdravnadzor.ru/services/licenses ttp://roszdravnadzor.ru/services/licenses https://www.russiatourism.ru/operators/ https://fsa.gov.ru/use-of-technology/elektronnye-reestry/ https://public.fsrar.ru/checkmark/

12 Информация об образовании и научной деятельности физического лица. Information about the education and scientific activity of an individual. https://elibrary.ru/ http://obrnadzor. gov. ru/ru/ activity/main directions/reestr of education/ https://scholar. goo gle.ru https://www.mmnt.ru/

13 Поисковые системы, позволяющие получить информацию от правоохранительных и надзорных органов в отношении юридических и физических лиц, находящихся в розыске. Search engines that allow you to obtain information from law enforcement and supervisory authorities regarding legal entities and individuals who are wanted. https://мвд.рф/wanted/ http://fsin.su/criminal/ http://fssprus.ru/iss/suspect info/ http://eais.rkn.gov.ru/ https://www. interpol.int/How-we- work/Notices/View-Red-Notices/ http://www.fedsfm.ru/documents/terr-list/ https://genproc.gov.ru/anticor/register-of-illegal- remuneration/

14 Справочные системы Федеральной таможенной службы. Reference systems of the Federal Customs Service. http://customs.ru/cars?vin=/ http://customs.ru/checkpoints/ http://customs.ru/servisv-i-reestry-bazv-dannvx/ http://www.tks.ru/db.

15 Поисковые системы проверки сведений о физическом лице, связанных с вопросами миграции. Search engines verify information about an individual related to migration issues. https://мвд.рф/сервисы-гувм https://proverk.ru/passport/ http://services.fms. gov.ru/info-service.htm?sid=2060

16 Сведения о ведении судебного и исполнительного делопроизводства в отношении физического или юридического лица. Information on the conduct of judicial and executive proceedings in relation to an individual or legal entity. https://bsr.sudrf.ru/bigs/portal.html http://sudact.ru/ http://судебныерешения.рф/ http://kad.arbitr.ru/ https://pristav-russia.ru/services/fssp-proverka- zadolzhennosti.html http://fssprus.ru/iss/ip https://www. reestr-zalo gov. ru/search/index http://bankrot.fedresurs.ru/ https ://zalog.lot-online.ru/ http://lawyers.miniust.ru/ExcludeCertificates

17 Открытые сведения, предоставляемые банками, кредитными организациями и т.п. Public information provided by banks, credit institutions, etc. www.fraudassets.com https://check-bin.com/ru/ https://psm7.com/bin-card/ https://karta-banka.ru/ https://finanso.com/ru/bin-search

Как видно из приведенного выше перечня информационных систем, с помощью Интернета можно получать необходимую оперативно значимую информацию в целях повышения эффективности мероприятий по выявлению, расследованию и раскрытию правонарушений и преступлений.

Применим графоаналитический метод исследования потоков информации и представим взаимосвязи между категориями данных, содержащихся в различных государственных информационных ресурсах, в виде взвешенного раскрашенного ациклического графа [11-22].

Для построения графовой модели будем использовать G = (V, E, P, Т), где V- множество категорий; Е ^ Vх V - отношение частичного порядка на множестве категорий; Р - вершины,

различные по цветам и категориям; T - веса вершин, определяемые ценностью полученной информации и затраченным на это временем.

Для решения задачи поиска оперативно значимой информации в различных государственных информационных ресурсах опишем: множество категорий, содержание которых определено предметной областью; отношения частичного порядка на множестве категорий; цвета вершин, соответствующие функциональным возможностям узлов, и их названия, соответствующие определенным категориям графа; веса вершин.

Цвет определяет порядок функционирования и назначение вершины.

Определим информационные (нераскрашенные) и функциональные (раскрашенные) вершины.

Информационными вершинами графа (Zi) будем считать выделенные в ходе анализа категории различных информационных ресурсов, где i = 1,17 - количество информационных вершин графа.

Вершина графа (Zi) включает в себя различные открытые информационные ресурсы (сайты (Sj), где j - количество URL-адресов сайтов, составляющих вершину Z;). Поэтому определим структуру информационной вершины графа как Zt = {S1, S2, S3 ,... , Sj }. Для различных информационных вершин количество URL - адресов может быть разным.

Сайт Sj в свою очередь может иметь одно/несколько вложений (направлений поиска) на которых расположены обязательные/не обязательные поля ввода информации для организации поискового запроса (входные атрибуты).

Также сайты отличаются между собой и количеством выходных атрибутов. Обозначим n - количество вложений для каждого сайта, min - количество входных атрибутов сайта, mout - количество выходных атрибутов сайта. Каждый сайт опишем как

Sj=(a;r}, (1)

где a - ценность, полученной на сайте информации, т - время доступа к сайту.

Для оценки ценности информации используем семантический показатель, основанный на оценке релевантности между всеми выданными поисковой системой документами и запросом. Будем считать ценность информации величиной, соответствующей точности выдачи информации (TV), которая в свою очередь определяется [1] как:

TV = * 100% , (2)

q+b ' v '

где q - множество релевантных и выданных системой документов, b - множество нерелевантных, но выданных системой документов.

C учетом количества выходных атрибутов сайта будем считать

а= ^*100%*mout . (3)

Время работы с сайтом прямо пропорционально количеству вложений (направлений поиска) сайта, а также количеству входных атрибутов сайта.

Поэтому,

т = t * n * min, (4)

где t - время, затрачиваемое на заполнение одного поля ввода (входного атрибута).

Вес вершины Zi можно описать с помощью характеристик a и т, таким образом получим Zi = [ Z ai'; Z Ti]. При этом лучшей по качественным характеристикам для поиска оперативно

„ , _ „ v Œai -^max

значимой информации будем считать вершину для которой Z, = j _ . .

Функциональными (раскрашенными) будем считать вершины a, b, c, d, на которых пользователь принимает решение о переходе к следующему уровню поиска или возврату на -предыдущий. Такое решение принимается исходя из оценки достаточности ценности полученной на уровне информации.

Начальный уровень Основной уровень Дополнительный уровень

Рис. 1. Графовая модель поиска оперативно значимой информации в различных государственных

информационных ресурсах Fig. 1. Graph model of search for operationally significant information in various state

information resources

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Обсуждение результатов. По нашему мнению, наибольший интерес для выявления, расследования и раскрытия правонарушений и преступлений может представлять информация из больших массивов данных государственных информационных систем, связанная с индивидуальным налоговым номером, автотранспортом, паспортными данными, объектами недвижимости физических лиц, их налогами и задолженностями, а также информация об иностранных гражданах и лицах без гражданства.

В связи с этим, из предложенного категорированного списка информационных систем выберем только государственные, в которых содержится наиболее актуальная для правоохранительных органов информация о физическом лице, с указанием принадлежности информационной системы государственной службе или организации:

1) поисковые системы индивидуального налогового номера физического лица (основным источником данных является сервис Федеральной налоговой службы РФ);

2) поисковые системы проверки сведений о физическом лице, связанных с вопросами миграции (основным источником данных являются сервисы Главного управления по вопросам миграции МВД России);

3) поисковые системы кадастровой регистрации объектов недвижимости (основными источниками данных являются сервисы Росреестра и Единого портала государственных услуг РФ);

4) поисковые системы, связанные с автотранспортными средствами физических лиц (основным источником данных являются поисковые сервисы Госавтоинспекции);

5) поисковые системы, позволяющие получить информацию от правоохранительных и надзорных органов в отношении юридических и физических лиц, находящихся в розыске (основным источниками данных являются официальные сайты МВД России, Федеральной службы исполнения наказания и Федеральной службы судебных приставов).

При использовании таких систем не возникает вопроса о достоверности информации, она представлена на официальных сайтах государственных служб и организаций, что гарантирует ее актуальность и достоверность. Проблема заключается в том, что эти информационные системы не связаны между собой, следовательно, получить полную информацию о жизнедеятельности физического лица, используя только один информационный ресурс, не представляется возможным.

В связи с этим возникает необходимость детального исследования значительных массивов данных, содержащихся в различных информационных системах, в целях получения всесторонней оперативно значимой информации об объекте исследования.

В дальнейшем физическое лицо как объект исследования в деятельности правоохранительных органов будем трактовать как информационный объект, а также определим множество физических лиц как предметную область, описанную в различных государственных информа-

ционных системах. Массив информации, относящейся к отдельно взятой сфере жизнедеятельности физического лица (информационного объекта), определим как его сущность.

С другой стороны, каждый аспект (сферу) жизнедеятельности физического лица можно описать с помощью набора специфических параметров, которые в нашем случае будут выступать атрибутами информационных объектов. Таким образом, конечный набор атрибутов качественно описывает сущность информационного объекта.

Вывод. Системный анализ государственных информационных ресурсов сети Интернет позволил выявить взаимосвязи между категориями данных и использовать их для получения оперативно значимой информации из открытых государственных информационных ресурсов. На практике построенная модель может быть использована для оптимизации нечеткого поиска. Для решения поставленной задачи представляется возможным применение нейронных сетей Кохонена или алгоритмов Хемминга. Аппарат нейронных сетей позволит определить закономерностей и оптимизировать поиск оперативно значимой информации.

Библиографический список:

1. Ишин А.М. Современные проблемы использования сети Интернет в расследовании преступлений // Вестник Балтийского федерального университета им. И. Канта. 2013. Вып. 9. С. 116-123.

2. Об информации, информационных технологиях и о защите информации : федер. закон от 27 июля 2006 г. № 149-ФЗ (ред. от 13.07.2015) // Собр. законодательства Рос. Федерации. - 2006. - №31 (1ч.). - Ст. 3448.

3. О персональных данных : федер. закон от 27 июля 2006 г. №152-ФЗ (ред. от 21.07.2014) // Собр. законодательства Рос. Федерации. - 2006. - №31 (1ч.). - Ст. 3451.

4. Гасанов Э. Э. Теория сложности информационного поиска. М.: Изд-во механико-математического ф-та МГУ, 2005.

5. Емельченков Е. П., Киселева О. М. О представлении предметных областей с помощью семантических сетей // NovaInfo.Ru. - 2016. - Т. 2. № 42. - С. 17 - 23.

6. Козлов С.В. Использование соответствия Галуа как инварианта отбора контента при проектировании информационных систем // Современные информационные технологии и ИТ-образование. 2015. Т. 2. № 11. С. 220-225.

7. Козлов С. В. Математические аспекты выбора оптимального набора тестовых заданий индивидуального теста // Психология, социология и педагогика. 2014. № 9 (36) [Электронный ресурс]. URL: http://psychology.snauka.ru/2014/09/3603 (дата обращения: 07.10.2014).

8. Козлов С. В. Применение соответствия Галуа для анализа данных в информационных системах // Траектория науки. -2016. - Т. 2. № 3 (8). - С. 18.

9. Кудрявцев В. Б., Гасанов Э. Э., Подколзин А. С. Введение в теорию интеллектуальных систем. - М.: Изд-во ф-та ВМиК МГУ, 2006.

10. Плотинский Ю.М. Модели социальных процессов: Учебное пособие для высших учебных заведений. - Изд.2-е, перераб. и доп. - M.: Логос, 2001. - 296 с.

11. Кучеренко Н. С. Сложность поиска идентичных объектов для случайных баз данных // Интеллект. сист. - 2007. - Т. 11, № 1-4. - С. 495-516.

12. Гасанов Э. Э. Функционально-сетевые базы данных и сверхбыстрые алгоритмы поиска. - М.: Изд. центр РГГУ, 1997.

13. Гасанов Э. Э. Информационно-графовая модель в теории баз данных // Математические вопросы кибернетики. Вып. 10 -М.: ФИЗМАТЛИТ, 2001. - С.225 - 234.

14. Гасанов Э. Э. Информационно-графовая модель хранения и поиска данных. Интеллектуальные системы (1998) 3, № 3-4, 163 - 192.

15. Гасанов Э. Э. Мгновенно решаемые задачи поиска. Дискретная математика (1996) 8, № 3, 119 -134.

16. Козлов С. В. Интерпретация инвариантов теории графов в контексте применения соответствия Галуа при создании и сопровождении информационных систем //International Journal of Open Information Technologies. - 2016. - Т. 4. - № 7. С. 38-44.

17. Никулина Е.Ю. Декомпозиция графовых моделей информационных систем // Вестник Воронежского института МВД России. - 2009. - № 4. - С. 126 - 131.

18. Никулина Е.Ю. Использование графовой модели для решения общей задачи теории расписаний Вестник Воронежского института высоких технологий. - 2009. - №5. - С. 41-43.

19. Никулина Е.Ю. Разработка модели выбора вариантов модернизации распределенной информационной системы ОВД -Вестник Воронежского института МВД России. - Воронеж: Воронежский институт МВД России. - №4. - 2007. - С. 156160.

20. Силов В. Б. Принятие стратегических решений в нечеткой обстановке. М. : ИНФО-ПРЕСС, 1995. - 228 с.

21. Харина А. А. О сведении нечёткого информационного поиска к информационному поиску большей размерности // Интеллект. сист. - 2005. - Т. 9, № 1-4. - С. 57-76.

22. Шуткин Ю. С. Синтез информационных графов для предполных классов булевых функций // Интеллект. сист. - 2007. -Т. 11, № 1-4. - С. 689-604.

References:

1. Ishin A.M. Modern problems of using the Internet in the investigation of crimes. [Vestnik Baltijskogo federal'nogo universiteta im. I. Kanta]. Bulletin of the Baltic Federal University. 2013; 9: 116-123. (In Russ)

2. About information, information technologies and information protection: Feder. Law of July 27, 2006 No. 149-FZ (as amended on July 13, 2015). Collected. legislation Ros. Federation. 2006; 31 (1). Art. 3448. (In Russ)

3. About personal data: feder. Law of July 27, 2006 No. 152-FZ (as amended on July 21, 2014). Collected. legislation Ros. Federation. 2006; 31(1 ). Art. 3451. (In Russ)

4. Gasanov Je. Je. Complexity theory of information retrieval. M.: Publishing House of the Mechanics and Mathematics Faculty of Moscow State University, 2005. (In Russ)

5. Emelchenkov E. P., Kiseleva O. M. On the representation of subject areas using semantic networks. NovaInfo.Ru. 2016; 2(42): 17 - 23. (In Russ)

6. Kozlov S. V. Using the Galois correspondence as a content selection invariant in the design of information systems. [Sovremennye informacionnye tehnologii i IT-obrazovanie]. Modern information technologies and IT education. 2015; 2. (11): 220-225. (In Russ)

7. Kozlov S. V. Mathematical aspects of choosing the optimal set of test tasks for an individual test. Psychology, sociology and pedagogy. 2014. No. 9 (36) [Electronic resource]. URL: http://psychology.snauka.ru/2014/09/3603.

8. Kozlov S. V. Application of the Galois correspondence for data analysis in information systems. [Traektorija nauki] Trajectory of Science. 2016; 2(3) (8): 18. (In Russ)

9. Kudrjavcev V. B., Gasanov Je. Je., Podkolzin A. S. Introduction to the theory of intelligent systems. M .: Publishing house of the faculty of VMiK MGU, 2006. (In Russ)

10. Plotinskij Ju.M. Models of social processes: Textbook for higher educational institutions. Ed.2nd, revised. and additional. M.: Logos, 2001; 296. (In Russ)

11. Kucherenko N. S. Complexity of searching for identical objects for random databases [Intellektual'nye sistemy]. 2007; 11(1-4): 495-516. (In Russ)

12. Gasanov Je. Je. Funkcional'no-setevye bazy dannyh i sverhbystrye algoritmy poiska. M.: Izd. centp RGGU, 1997. (In Russ)

13. Gasanov Je. Je. Information-graph model in database theory [Matematicheskie voprosy kibernetiki] Mathematical issues of cybernetics. 2001; 10: 225 - 234. (In Russ)

14. Gasanov Je. Je. Information-graph model of data storage and retrieval. [Intellektual'nye sistemy] Intelligent Systems 1998; 3(3-4): 16- 192. (In Russ)

15. Gasanov Je. Je. Instantly Solvable Search Problems. [Diskretnaja matematika] Discrete Mathematics. 1996; 8(3): 119 -134. (In Russ)

16. Kozlov S. V. Interpretation of graph theory invariants in the context of the application of the Galois correspondence in the creation and maintenance of information systems. International Journal of Open Information Technologies. 2016; 4(7): 38-44. (In Russ)

17. Nikulina E.Ju. Decomposition of graph models of information systems. [Vestnik Voronezhskogo instituta MVD Rossii] Bulletin of the Voronezh Institute ofthe Ministry ofInternal Affairs ofRussia. 2009; 4: 126 - 131. (In Russ)

18. Nikulina E.Ju. The use of a graph model for solving a general problem of scheduling theory [Vestnik Voronezhskogo instituta vysokih tehnologij] Bulletin ofthe Voronezh Institute of the Ministry ofInternal Affairs ofRussia. 2009; 5: 41-43. (In Russ)

19. Nikulina E.Ju. Development of a model for choosing options for upgrading a distributed information system of internal affairs . Voronezh Institute of the Ministry of Internal Affairs of Russia [Vestnik Voronezhskogo instituta MVD Rossii]. Bulletin of the Voronezh Institute of the Ministry of Internal Affairs ofRussia. Voronezh: Voronezhskij institut MVD Rossii. 2007; (4): 156160. (In Russ)

20. Silov V. B. Making strategic decisions in a fuzzy environment. INFO-PRESS. 1995; 228. (In Russ)

21. Harina A.A. On the reduction of fuzzy information retrieval to higher-dimensional information retrieval. [Intellektual'nye sistemy] Intelligent Systems. 2005; 9(1-4): 57-76. (In Russ)

22. Shutkin Ju. S. Synthesis of Information Graphs for Precomplete Classes of Boolean Functions.[Intellektual'nye sistemy] Intelligent Systems. 2007; 11, (1-4):. 689-604. (In Russ)

Сведения об авторах:

Никулина Екатерина Юрьевна, кандидат технических наук, доцент, доцент кафедры автоматизированных информационных систем органов внутренних дел; [email protected]

Обухова Людмила Александровна, кандидат технических наук, доцент кафедры автоматизированных информационных систем органов внутренних дел; [email protected]

Рогозин Евгений Алексеевич, доктор технических наук, профессор, профессор кафедры автоматизированных информационных систем органов внутренних дел; еvgеnirоgоzш@,уаndеxru Information about the authors:

Ekaterina Yu. Nikulina, Cand. Sci. (Eng.), Assoc. Prof., Assoc. Prof. , Department of Automated Information Systems of Internal Affairs Bodies; [email protected]

Lyudmila A. Obukhova, Cand. Sci. (Eng.), Assoc. Prof., Department of Automated Information Systems of Internal Affairs Bodies; [email protected]

Evgeny A. Rogozin, Dr. Cand. Sci. (Eng.), Prof., Prof., Department of Automated Information Systems of Internal Affairs Bodies; [email protected]

Конфликт интересов / Conflict of interest.

Авторы заявляют об отсутствии конфликта интересов/ The authors declare no conflict of interest. Поступила в редакцию/Received 30.09.2021. Поступила после рецензирования/ Reviced 25.10.2021. Принята в печать/Accepted for publication 26.10.2021.

i Надоели баннеры? Вы всегда можете отключить рекламу.