УДК 349.2 DOI: 10.31249/iajpravo/2023.03.14
АЛФЕРОВ О.Л.1 БОЛЬШИЕ ДАННЫЕ В ЮРИДИЧЕСКОЙ ДЕЯТЕЛЬНОСТИ. (Обзор)
Аннотация. В обзоре рассматриваются точки зрения ученых-юристов на проблемы правового регулирования больших данных (Big data), преодоления законодательных лакун, в том числе в вопросах защиты как операторов «больших данных», так и персональной информации конечных пользователей. Речь идет о необходимости концептуального реформирования регулирования в сфере автоматизированного сбора данных о человеке, минимизации правовых, репутационных, социальных рисков государства, бизнеса, человека. В центре внимания также вопросы применения в юридической профессии информационных технологий, основанных на использовании больших данных, теоретические и практические исследования в сфере интерпретации результатов анализа больших данных, используемых в юридической практике, в том числе судебной.
Ключевые слова: право; большие данные; информационные технологии; правовое регулирование; юридическая практика; юриспруденция; репутационные риски; права субъектов персональных данных; интерпретация больших данных; анализ больших данных.
ALFEROV O.L. Big data in legal practic. (Review)
Abstract. The article examines the points of view of legal scientists on the problems of legal regulation of big data (Big data), overcoming legislative gaps, including in matters of protection of both
1 Алферов Олег Леонидович, ведущий редактор отдела правоведения ИНИОН РАН.
operators of «Big data» and personal information of end users. We are talking about the need for conceptual reform of regulation in the field of automated data collection about a person, minimizing legal, reputational, social risks of the state, business, and a person. The focus is also on the application of information technologies based on the use of Big data in the legal profession, theoretical and practical research in the field of interpretation of the results of Big data analysis used in legal practice, including judicial.
Keywords, law; Big data; information technologies; legal regulation; legal practice; jurisprudence; reputational risks; rights of personal data subjects; interpretation of big data; analysis of Big data.
Для цитирования: Алферов О.Л. Большие данные в юридической деятельности. (Обзор) // Социальные и гуманитарные науки. Отечественная и зарубежная литература. Сер. 4: Государство и право. - 2023. - № 3. -С. 165-176. DOI: 10.31249/iajpravo/2023.03.14
Введение
Новые информационные технологии и большие данные ворвались в жизнь и труд юристов, и сегодня трудно назвать юридическую профессию, не испытывающую потребности в этих новациях и их применении в юриспруденции и юридической практике. Вместе с тем эти технологии как на практике, так и в теории порождают многие проблемы, над которыми думают ученые-юристы. В данном обзоре представлены исследования, касающиеся использования больших данных в юридической деятельности, интерпретации анализа результатов их применения и возможностей решения различных юридических задач.
Понятие «большие данные» («Big data»). Данное понятие, как утверждают ученые, не имеет четкого определения. Оксфордский английский словарь (The Oxford English dictionary, oEd) содержит следующее определение этого термина: «Данные очень большого размера, обычно в такой степени, что манипулирование ими и управление ими представляют значительные материально-технические проблемы; (также) отрасль вычислительной техники,
использующая такие данные»1. Сайт Кембриджского словаря дает несколько иное его определение, подчеркивающее центральную роль человека и его связи с новыми технологиями: «Очень большие массивы данных, которые создаются людьми, использующими Интернет, и которые могут быть сохранены, поняты и применены только с помощью специальных инструментов и методов»2.
Большинство исследователей и практиков признает сложность выработки единого определения «больших данных». Ин-струментальность понятия, полагает М.С. Корнев, позволяет сфокусироваться на таком определении «больших данных» и его понимании, которое лучше всего подходит для исследовательских задач. Поэтому, полагает он, необходимо не замыкаться на ограниченном круге определений, а использовать различные характеристики понятия, обращаться к различным исследованиям и подходам в определении «больших данных». При этом важен социогуманитарный аспект, когда применение технологий больших данных согласуется с интересами людей, их ценностями, этикой и моралью [2, с. 84-85].
Как отмечает В.А. Родикова, 23 октября 2020 г. в Государственную Думу был внесен законопроект, предполагающий введение в Федеральный закон от 27.07.2006 № 149-ФЗ «Об информации, информационных технологиях и защите информации» долгожданных дефиниций самих «больших данных» и «операторов больших данных», а также императивов, обеспечивающих внутриотраслевое регулирование Big Data, включая правила информирования оператором пользователей и неопределенного круга лиц. Данный законопроект был признан экспертным сообществом3
:«Data of a very large size, typically to the extent that its manipulation and management present significant logistical challenges; (also) the branch of computing involving such data». - URL: http://www.oed.com/view/Entry/18833#eid301162177 (дата обращения: 21.04.2023).
2 «Very large sets of data that are produced by people using the internet, and that can only be stored, understood, and used with the help of special tools and methods». - URL: http://dictionary.cambridge.org/dictionary/english/big-data (дата обращения: 21.04.2023).
3 Как отмечает В.А. Родикова, Правительство РФ отклонило законопроект Минкомсвязи России о больших данных. - URL: https:// https://www.vedomosti.ru/ technology/articles/2020/03/27/826513-pravitelstvo-otklonilo-zakonoproekt (дата обращения: 04.04.2023).
спорным из-за крайне сомнительных и вредных для предпринимателя, в том числе с точки зрения долгосрочных репутационных рисков. По настоящий день работающий нормативный акт, регулирующий вопросы «больших данных» и их оборотоспособности, в Российской Федерации фактически отсутствует [3, с. 52-53].
Наряду с отсутствием легального понятийного аппарата критически важной для дальнейшего функционирования социума институции - «больших данных» как пользовательских, так и научных, персональных и пр., - эксперты определяют следующие правовые уязвимости «больших данных»: риски конфиденциальности, риски потери данных, риски мошенничества и собственно связанный с ними риск репутационного вреда [3, с. 53].
В настоящее время, с учетом введения 15 апреля 2021 г. санкций в отношении крупнейшей в мире IT-компании - разработчика программ в сфере защиты бизнеса с российскими «корнями» Positive Technologies, по мнению В.А. Родиковой, логичным и оправданным стало бы государственное поручение вынужденно исключенной из мирового оборота корпорации, наряду с такими отечественными «игроками» соответствующей отрасли, как Mail.ru Group, Yandex Group, разработки соответствующего программного обеспечения, в том числе образовательного, которое бы обеспечило в условиях современной геополитической обстановки национальную информационную, образовательную, кибер-безопасность как отдельных сегментов общества и рынка, так и государства в целом [3, с. 54].
Использование больших данных и риск репутационных потерь. Риск репутационных потерь в результате использования неквалифицированных либо фальсифицированных Big Data при подключении платных сторонних сервисов сбора и обработки этих данных в условиях отсутствия рабочих инструментов оценки и нивелирования соответствующей правовой уязвимости обозначает очередную законодательную лакуну. Особенно проактивными В.А. Родикова считает репутационные риски в сферах бизнеса, наиболее чувствительных к статистической информации, таких, как биржи. В целях иллюстрации автор приводит «Big-Data-скандалы» на LIBOR и FOREX. Если потерпевшим в результате подобной манипуляции с большими данными становится публичное образование, ущерб общественному доверию и, как следствие,
репутационный вред конкретному искусственному субъекту права и государству, может быть не просто значительным, а критически значительным, поскольку государственной статистике априори присвоена роль поставщика качественных метаданных [3, с. 5455]. В связи с этим автор считает оправданным и целесообразным внесение изменений в российское законодательство о персональных данных, в том числе более четко сформулировать определение термина «персональные данные» и границы его использования, а также установить точные параметры «правомерности» доступа и обработки персональных данных [3, с. 55].
Отдельной социальной, правовой, репутационной угрозой бизнесу и государству стал тот факт, что превалирующая часть «больших пользовательских данных» размещается операторами (медицинскими, образовательными, банковскими учреждениями, операторами связи и так далее) фактически в открытом доступе, и защищена она только стенографическими инструментами без использования криптографии. В связи с этим В.А. Родикова предлагает распространить «правовой щит» от вероятного вреда, наносимого большими данными, защищающий интересы государства и неопределенного круга лиц в результате распространения и, фактически, преобразования в метаданные недостоверной общественно значимой информации, распространяемой под видом достоверных сообщений на субъектов права в широком смысле этого слова: граждан и юридических лиц [там же].
Наиболее «популярной» правовой проблемой бизнеса, связанной с Big Data, с точки зрения В.А. Родиковой, является недееспособность имеющейся договорной конструкции по использованию «больших данных» в коммерческом обороте, в том числе это касается введенной в действие ст. 783.1 ГК РФ в части разрешения вопроса по оборотоспособности, т.е. отчуждению, «больших персональных данных» после их сбора, анализа и обработки в пользу третьих бенефициаров, а также разграничения буквы и духа Big Data, которые «живут» в правовом поле extra jus [3, с. 55-56]. Автор считает оправданным проявление законодательной инициативы, касающейся разграничения режимов пользования конкретными типами больших данных, включая персональные и пользовательские, а также создания специализированных реестродержателей метаданных, оперирующих внятным категорийным
аппаратом, исключающим возможность субъективной трактовки действий тех или иных субъектов права [3, с. 57].
Принципы правового регулирования отношений по автоматизированному сбору данных о человеке. В научной литературе звучат предложения о концептуальной модернизации регулирования использования больших данных, их сбора, обработки и хранения, в том числе сбора данных о человеке с учетом множества социальных, технологических и иных факторов. Над этой проблемой и размышляет в своей статье С.В. Соловкин, пытающийся выявить и проанализировать неявные принципы правового регулирования отношений по автоматизированному сбору данных о человеке [4, с. 93]. Как замечает автор, российский законодатель акцентирует внимание не на защите прав субъектов персональных данных и их интересов, а на самих данных о человеке, на создании свода требований, при соблюдении которых в процессе сбора данных риски нарушений в сфере персональных данных будут минимальными. Вместе с тем сегодня соблюдение указанных правил не исключает риски нарушения прав субъектов персональных данных как минимум по причине существования множества «внешних» угроз, например, рисков взлома информационных систем оператора третьими лицами или злоупотребления операторами своими правами, формальном соблюдении требований законодательства. Фактически интересы субъектов персональных данных не защищаются, поскольку составы правонарушений в сфере персональных данных, предусмотренные КоАП РФ, являются формальными, т.е. само по себе нарушение установленных правил влечет ответственность независимо от наличия или отсутствия общественно опасных последствий [4, с. 95].
Существование неявных принципов правового регулирования сбора данных о человеке, таких как: (1) «превентивная охрана данных о человеке априори обеспечивает охрану и защиту прав субъектов данных; (2) «защита прав субъектов персональных данных должна осуществляться посредством преимущественно публичных способов»; (3) «субъекты данных являются разумными, в связи с чем они должны нести бремя определения судьбы своих персональных данных» - позволяют автору утверждать, что российскому праву персональных данных свойствен патернализм. В случае обнаружения нарушения оператором правил сбора пер-
сональных данных государство предоставляет преимущественно публичные способы защиты. Инструменты самостоятельной (частной) защиты и восстановления нарушенных прав субъектами персональных данных отсутствуют [4, с. 95-96]. Нет также ясности в том, какие именно права в сфере сбора данных о человеке в современных условиях государство должно признавать и обеспечивать; в действующем законодательстве недостаточно четко проведена граница между частной жизнью человека и сферой его персональных данных [4, с. 97]. В связи с этим автор предлагает на законодательном уровне: 1) отказаться от презумпции «охрана персональных данных неизбежно влечет обеспеченность прав субъектов»; 2) не придерживаться тенденции расширения обязанностей операторов и требований к ним; 3) перейти от формального постулирования необходимости защиты прав граждан к созданию эффективных правовых механизмов реализации данного принципа [4, с. 98-99].
Интерпретация анализа результатов применения больших данных в юриспруденции и юридической практике. Проблемам использования информационных технологий и больших данных в юридической науке и практике, перспективным направлениям развития юридической профессии, а также решения целого ряда прикладных юридических задач посвящено монографическое исследование «Интерпретация и применение больших данных в юриспруденции и юридической практике» коллектива авторов Института исследований национального и сравнительного права Факультета права НИУ ВШЭ. Соавтором и научным редактором этого издания является известный российский ученый, доктор юридических наук, профессор Ю.А. Тихомиров [1].
Активный интерес в указанном направлении, как подчеркивается во введении, обусловлен двумя основными обстоятельствами. Во-первых, стали доступны огромные массивы информации, связанной с функционированием социальных систем (социальные сети и корпоративные информационные системы). Во-вторых, появляются и развиваются новые методы анализа больших данных, применимые для анализа социальных, в том числе правовых, явлений на совершенно новом уровне. Большая часть современных LegalTech технологий так или иначе основана на использовании методов анализа больших данных [1, с. 9].
Использование информационных технологий стимулирует к новым исследованиям и важным результатам. Так, технологии искусственного интеллекта (ИИ) позволяют прогнозировать вероятный исход рассмотрения дел в судах, при этом предсказательная способность ИИ в прогнозах достигает 86,6% точности по сравнению с аналогичным показателем в 66,3% команды юристов [1, с. 9]. Вместе с тем авторы не скрывают, что стадия энтузиазма ученых и практиков в отношении технологий стала сменяться этапом скепсиса, почву для которого дает ряд вопросов и сомнений в эффективности и этичности таких технологий, объективности и обоснованности их применяемости с точки зрения целей и ценностей социального управления. Возможность автоматизации решения юридических проблем, включая поиск эффективных способов разрешения споров, дала почву для дискуссий о потере юридической теорией и юридической профессией своей актуальности, их замещения алгоритмами [1, с. 12].
Интерпретация результатов анализа больших данных определяется через синонимичный ряд понятий установления смысла, понимания, объяснения, установления причинно-следственных связей, включения контекста, теорий и ценностей, целей, формирования объяснительных гипотез и предположений. На всех этапах исследования (первый - рассмотрение эпистемологических проблем использования методов анализа больших данных; второй -выявление отдельных проблем интерпретации и применения анализа больших данных в социальных исследованиях и практике; третий - изучение проблем интерпретации результатов применения ряда конкретных технологий и методов анализа больших данных в сфере юридической профессии) центральными вопросами, которые выделяют авторы, являются следующие:
- могут ли сами большие данные, а также результаты их машинного анализа рассматриваться в качестве внеконтекстуальных и теоретически ненагруженных? Этот вопрос они связывают с оценкой полноты и качества данных как собираемых вне связи с юридическими целями (например, принятие решений о ведении карантинных ограничений в 2020 г.), так и с юридическими целями (формирование судебной статистики и статистики федеральных органов исполнительной власти, Картотеки арбитражных дел,
Банка решений арбитражных судов, банка судебных решений ГАС «Правосудие» и др.);
- о чем свидетельствуют массивы данных о судебной практике сами по себе? Могут ли правовые решения основываться исключительно на анализе релевантных больших данных? Эта проблема связана прежде всего с нормативностью права, его невозможностью полной формализации. Большие данные сами по себе не позволяют сделать выбор между целями регулирования, определить эти цели. Они определяются человеком. Именно интерпретатором подбираются данные под те или иные цели. Более того, одни и те же данные могут позволять делать конфликтующие выводы, обосновывать противоположные цели;
- насколько анализ больших данных способен заместить традиционную модель юридического анализа и принятия юридических решений? Возможна ли реализация парадигмы больших данных в юридической сфере? Каковы возможности и ограничения применения методов анализа больших данных в традиционных областях юриспруденции? [1, с. 18, 34-36, 49-56, 70-75].
Одной из базовых проблем использования больших данных в механизме социальной координации является тенденция к консервации описываемых ими социальных, в том числе юридических, практик за счет так называемых эффектов «колеи» и «самооправдывающегося пророчества», названных в работе «искажающие эффекты больших данных» [1, с. 80]. Речь идет в данном случае о том, что собранные данные относятся к прошлому и описывают прошлое поведение. Соответственно, даже те алгоритмы, которые предполагаются нейтральными, основывают свои результаты на уже существующих практиках, во многих случаях способствуя их закреплению [1, с. 81-82].
В отличие от традиционного правового дискурса использование технологий, основанных на больших данных, как правило более директивно и авторитарно. Так, например, функционал Единой информационной системы в сфере государственных закупок, основанный на учете сведений о прошлых злоупотреблениях, просто не дает возможности закупщикам совершить действия, которые отклоняются от принятой модели, даже если это оправданно в данной ситуации.
Современные технологии позволяют связывать большие объемы доступных данных о человеке, его поведении, предпочтениях, выборах и т.п. Человек в принципе может даже не представлять, какие цифровые следы он оставил и как это может быть учтено в будущем, какие это будет иметь последствия. Такие технологии в большинстве случаев представляют собой черный ящик, который трудно считать нейтральным [1, с. 84]. Отмечается, что «внедрение технологий принятия решения на основе больших данных отбирает власть, которая ранее была распределена между политиками, судьями, юристами и участниками оборота, публично взаимодействующими в своих интересах в рамках общих правил, и вручает ее в руки немногих владельцев серверов, действующих в условиях непрозрачности и неподконтрольности» [1, с. 85]. Непрозрачность процедур сбора данных и алгоритмов их анализа подчеркивает необходимость публичной проверки качества (полноты и целостности) собранных данных, корректности применяемых алгоритмов и процедур интерпретации результатов анализа.
Исследования в области автоматизированного анализа судебной практики и перспективных методов такого анализа, проведенного авторами данной монографии, позволяет им выявить следующие тенденции такого рода изысканий: первая - направленность многих исследований на решение прогностических задач, прежде всего предсказание судебных решений; вторая - использование для анализа в основном лишь отдельных ключевых характеристик судебной практики, в том числе характеристик судебного состава (пол, возраст, образование, политические предпочтения и т.п.) и т.д. Третья - использование междисциплинарного подхода, сочетающего методы автоматизированного анализа данных о судебной практике и методы традиционного правового исследования, позволяющего интерпретировать результаты машинного анализа [1, с. 155-156].
Результаты исследования практического применения программных средств Natural Language Processing для упрощения текстов нормативных актов приводят авторов к следующим выводам: если цель упрощения текста преобладает над точностью передачи смысла, то неизбежно алгоритм будет упускать часть юридически значимой информации; надо достаточно осторожно относиться к проектам использования автоматизированных алгоритмов для це-
лей упрощения языка нормативных правовых актов; подобный алгоритм не подходит для целей профессиональной юридической деятельности в силу чрезмерного упрощения и недооценки важных деталей. Целью алгоритма, полагают авторы, является адаптация трудных для восприятия законов для их использования людьми без специальной подготовки [1, с. 185-186].
Выводы
Исследование возможности использования больших данных для решения различных юридических задач позволяет ученым утверждать:
1) текущий этап характеризуется рутинизацией использования информационных технологий для решения частных задач юридической профессии, постепенным их развитием с учетом трезвого осознания их возможностей и ограничений;
2) к базовым постулатам дата-центристской парадигмы следует отнести следующие: большие данные являются полными, охватывают все исследуемые явления; потребность в формировании предваряющих исследование теорий, моделей, гипотез в случае с большими данными отсутствует. Корреляции и паттерны, выявляемые при анализе больших данных, сами по себе способны продуцировать осмысленное знание о сложных феноменах; использование нейтральных алгоритмов позволяет делать результаты анализа свободными от человеческих предубеждений и установок;
3) в сфере юриспруденции парадигма больших данных нашла свое применение в концепции так называемого «персонализированного правового регулирования», исходящей из того, что по мере накопления данных о различных сторонах человеческой жизни появится возможность формулировать более точные правила поведения, применимые к узким группам либо конкретным индивидам. Это позволит отказаться от традиционного метода правового регулирования посредством закрепления общих правил проведения и дискурсивных практик их применения в пользу расчета на основе больших данных оптимального варианта поведения или индивидуального решения в конкретном случае;
4) базовые постулаты дата-центристской парадигмы оказываются ложными, анализ данных и идентификация паттернов не являются свободными от теорий и гипотез, от предшествующего знания и опыта;
5) к использованию технологий анализа больших данных в сфере юридической профессии применимы все критические аргументы, касающиеся теоретической нагруженности и контексту-альности больших данных;
6) цели, ценности и принципы правового регулирования определяются дискурсивно - в ходе демократической процедуры, судом в процессе оценки представленных сторонами доказательств, иными способами. Принципиальным является то, насколько методы больших данных вписываются в указанные процедуры, насколько основанные на больших данных результаты соответствуют указанным целям, ценностям и принципам;
7) для использования больших данных в сфере социальной координации характерен ряд дополнительных проблем: искажающие эффекты больших данных (самооправдывающие пророчества и «эффект колеи», определяющие авторитарную редукцию многообразия и воспроизводство прошлых практик); непрозрачность процедур и алгоритмов сбора и обработки больших данных; скрытая дискриминация по признаку расы, религии, национальности, пола и т.п. и др. [1, с. 96-106].
Список литературы
1. Интерпретация и применение больших данных в юриспруденции и юридической практике : монография / [Ю.А. Тихомиров, А.В. Кашанин, В.Д. Чураков и др.] ; науч. ред. Ю.А. Тихомиров. - Москва : Юстицинформ, 2021. - 188 с.
2. Корнев М.С. История понятия «большие данные» (Big data): словари, научная и деловая периодика // Вестник РГГУ. Сер. Литературоведение. Языкознание. Культурология. - 2018. - № 1. - С. 81-85.
3. Родикова В.А. Шах и мат предпринимателю: гражданско-правовое регулирование Big data // Вестник Челябинского государственного университета. -2022. - Т. 7, № 1. - С. 50-59.
4. Соловкин С.В. Автоматизированный сбор данных о человеке: неявные принципы правового регулирования // Вестник Университета им. О.Е. Кутафина (МГЮФ). - 2023. - № 2(101). - С. 90-101.