УДК 001.81
9L
rl
З.М. Хачецуков
ПРОВЕРКА НА ОРИГИНАЛЬНОСТЬ НАУЧНЫХ ТЕКСТОВ: ВОПРОСЫ ТЕОРИИ И ПРАКТИКИ
В статье рассмотрены проблемы и перспективы процедуры проверки на оригинальность научных текстов. Предложена типология заимствований и структура проверки. Рассмотрены вопросы теории и практики использования автоматических систем проверки оригинальности. Указаны сложности в сфере новой информационной культуры систем науки и образования. Отмечены институциональные сложности в данной сфере. Ключевые слова: плагиат, оригинальность, заимствование, копирайт, экспертиза.
Хачецуков Заур Махмудович
Кандидат философских наук, старший преподаватель кафедры социологии, политологии и права ИППК ЮФУ (г. Ростов-на-Дону)
E-mail: xzm@list.ru © Хачецуков З.М., 2014
Z.M. Khachetsukov TEST
FOR ORIGINALITY SCIENTIFIC TEXTS: THEORY AND PRACTICE
Article considers the problems and prospects of verification procedures on originality of scientific texts. Proposed typology for of borrowing and structure inspection. The questions of theory and practice of the use of automatic inspection systems originality. The shows are the complexity in new information culture systems science and education. Institutional complexities in this area are marked.
Key words: plagiarism, originality, borrowing, copyright and expertise.
Khachetsukov Zaur M.
Candidate of Philosophical Sciences, Senior Lecturer Department of Sociology, Political Science and Law, Institute of Professional Development in the Area of Social Sciences, Southern Federal University (Rostov-on-Don) E-mail: xzm@list.ru
© Khachetsukov Z.M., 2014
В сфере науки новизна и оригинальность результатов интеллектуального творчества являются главным их достоинством. Вместе с тем, современная наука столкнулась с такой проблемой, как массовое производство вторичных «научных текстов», или дубликатов-плагиатов, девальвирующих научно-исследовательскую деятельность.
В настоящее время под плагиатом понимается намеренное частичное или полное копирование чужого интеллектуального продукта с целю представить его как результат собственной интеллектуальный деятельности. Ключевыми в данном случае является факт присвоения авторства и умышленности совершаемого действия. Более широким по смыслу является понятие заимствования, которое включает как плагиат, так и использование чужого интеллектуального продукта со ссылкой на автора, а также представление чужого интеллектуального продукта в качестве своего неосознанно (в результате нарушения логики построения текста и/или правил цитирования). Отличить последнее от плагиата иногда крайне сложно, поскольку единственным существенным признаком, отличающим эти две формы заимствования, является умысел, который крайне сложно устанавливать. Поэтому, важным упоминанием для данной проблемы является тот факт, что согласно законодательству РФ1, факт плагиата может быть установлен только в судебном порядке (да и то в большинстве случаев - после ряда назначенных экспертиз).
Далее надо отметить, что заимствование в большинстве случаев может осуществляться в трех вариантах. Первый и наиболее распространенный - это заимствование содержания чужого интеллектуального продукта. В этом случае речь идет об использовании чужих идей, концепций, мыслей и т.д. Это заимствование, если оно идет с присвоением авторства наиболее сложно диагностировать. Второй вариант представляет собой заимствование как формы, так и содержания чужого интеллектуального продукта. В этом случае речь идет об использовании части или целого самого конечного продукта (в рассматриваемом аспекте - текста). Установление факта заимствования в данном случае, осуществляется куда более просто, путем верификации двух продуктов. Что касается третьего варианта, то он встречается крайне редко и представляет собой заимствование формы с наделением ее другим содержанием. Данный вид заимствований обычно не воспринимается как плагиат, и мы не будем уделять ему много внимания в данном рассмотрении проблемы.
Следует также обратить внимание проблему легальность и легитимности заимствований. Легальным заимствованием мы будем называть заимствование, сопровождаемое указанием на авторство, согласно принятым в данном случае правилам (в частности, на которое дано разрешение
1 Например, ответственность предусмотрена в ч. 1 ст. 146 УК РФ, а также ст. 1252, 1301 ГК РФ.
автора, если это необходимо). Легитимным - заимствование, которое используется обосновано (для подтверждения идей автора, иллюстрирования тезисов и т.д.), и поэтому не заменяет, а дополняет оригинальный авторский текст. Данные определения используются тут без прямого соотнесения с юридическими трактовками этих понятий, поскольку «нелегитимность» заимствования в использованном значении, строго говоря, нелегальна (незаконна) в юридическом смысле этого слова, так как означает нарушение авторских прав и/или плагиат.
Основное внимание мы уделим как раз второму варианту заимствования, по ряду причин. Прежде всего, именно этот вариант более других подлежит явному обнаружению, в связи с наличием возможности проведения верификации. Кроме того, этот вариант наиболее губителен для сферы науки, так как большую часть подобного заимствования можно провести механически, не рефлексируя, что собственно и происходит чаще всего.
В случае текста различие между первым и вторым вариантом в случае с легальным заимствованием будет представлено выбором между косвенной (пересказ своими словами) и прямой цитатами. Здесь надо отметить еще один важный фактор, связанный с изменением информационной культуры в сфере работы с текстом. Во-первых, переход к цифровому представлению текстовой информации максимально снизил сопутствующие затраты на копирование различных текстов. Механическое переписывание аналогового экземпляра текста (например, бумажного носителя) может быть довольно затратным по времени и силам, что снижает ценность создания продукта. В то время как цифровую копию редактировать и множить очень просто. Также надо отметить, что работа с цифровыми носителями текста стимулирует к использованию скорее прямых цитат, нежели косвенных. Работая с бумажными носителями, сложно создать прямую цитату непреднамеренно, поскольку это требует значительных усилий, тогда как в цифровой среде подобное может произойти машинально. Во-вторых, указанный переход во много раз упростил доступ к базе текстов. Информационные сети, прежде всего Интернет, предоставляют очень широкий доступ к источникам потенциального заимствования, стимулируя компиляцию. Такой доступ не ограничен расстоянием или количеством одновременного обращения к источнику. Это делает глобальную сеть, с одной стороны, эффективным инструментом настоящего научного поиска, а с другой - не мене эффективным инструментом его имитации.
Еще одной особенностью Интернета, как среды обращения электронных текстов, является сложность фиксирования авторства. Основными причинами этого можно назвать анонимность пользования и размещения, а также высокую динамичность среды. Легкость копирования и размещения, создает массу дублирующих ресурсов, источник текстов в большом количестве случаев становится неопределенным, авторство потерян-
ным, а динамичность среды делает эти ресурсы кратко «живущими», и их расположение - непостоянным. При этом нет никакой границы между логически выстроенными структурами информационных ресурсов (например, электронными библиотеками и базами данных) и хаотическим, изменчивым пространством остальной глобальной сети. Однажды размещенный в структурированном пространстве информационного ресурса текст, спустя некоторое время, с большой вероятностью будет дублирован, размножен (с искажениями, сокращениями и вероятно потерей авторства) в различных ресурсах.
В научной сфере достаточно большая доля дубликатов-плагиатов создана умышленно, с целью мошенничества, суть которого в данном случае является стремление индивидов сберечь ресурсы и иметь некий интеллектуальный продукт, не создавая его на самом деле. Дело в том, что в науке «текст» уже давно стал тем самым продуктом, который является востребованным не только и не столько по причине своего содержания, а по причине своего наличия. Аспиранты, ученые должны постоянно писать статьи, диссертационные работы, монографии, аналитические обзоры и т.д. Наличие «текста» означает исполнение того или иного задания, При этом речь идет именно наличии текста, а не о его содержании. Эта ситуация благоприятствует стремлению к минимизации усилий по созданию текста, поскольку его качество перестает быть критерием выполнения задания.
Создание оригинального научного текста требует от индивида наличия не только времени и средств, но и соответствующего набора компетенций, навыков, способностей, а также умения применять их на практике, т.е. чтобы написать оригинальный научный текст нужно быть ученым. Отсутствие такого набора у лжеученых компенсируется мошенничеством. Идя по этому пути, мошенник может купить интеллектуальный продукт у настоящего ученого, присвоив себе авторство. Тогда он сможет эксплуатировать полученный статус, но не в полной мере. Профессиональная практика использования купленного интеллектуального продукта будет ему не доступна, по причине отсутствия необходимых навыков, что ведет к разоблачению. Таким образом, мошенник будет пользоваться сопутствующими преференциями статуса ученого (например, уважением в обществе), избегая непосредственной деятельности ученого. Это распространенный, и относительно менее вредный для научного сообщества путь - ведь интеллектуальный продукт все-таки производится и производится он настоящим ученым. Но экономически такой путь не является оптимальным. Если мошенник все равно не в состоянии оценить качество интеллектуального продукта и не собирается его использовать в профессиональной практике, то трата сил и ресурсов на произведение оригинального интеллектуального продукта является избыточной.
Куда менее затратным является имитация интеллектуального продукта, достаточно правдоподобная, чтобы пройти поверхностную проверку научного сообщества. Если система проверки содержит уязвимости для пропуска имитации, возникает второй путь - путь создания суррогата научного продукта наиболее экономичным способом - компиляцией элементов ранее написанных настоящих научных текстов. Таким образом, схема «автор + мошенник» эволюционирует в схему «имитатор + мошенник», а значит, на одного фальшивого ученого становится больше, и на одного настоящего - меньше. Конечно, это предельно упрощенная схема, так как имитатор может возникнуть не путем «моральной мутации» настоящего ученого, а изначально как имитатор, роли мошенника и имитатора могут совпадать в одном индивиде и наконец, вполне возможна ситуация, когда ученый периодически играет роль имитатора, в других случаях оставаясь настоящим ученым.
В последние годы инициирован курс на снижение потока фальшивых научных квалификационных работ, а также на разоблачение мошенников. Так в 2013 г. тридцать человек были лишены ученой степени, а в начале 2014 г. приостановили работу 602 диссертационных совета, в том числе по подозрению в некачественной экспертизе на оригинальность. Создается все больше добровольных сообществ ученых, занимающихся проверкой научных работ публичных лиц. Несмотря на это, состояние с оригинальностью научных текстов в стране довольно проблематичное.
Теперь затронем собственно работу по проверке оригинальности научных текстов. Как следует из вышесказанного, она включает в себя установление нелегального и нелегитимного заимствования формы и/или сущности чужого интеллектуального продукта. Оставим в стороне экспертизу на плагиат. Как уже было отмечено, установление плагиата - компетенция суда и само по себе является отдельной проблемой. Поэтому правила, установленные ВАК и Минобрнауки РФ, наделяют руководство образовательных учреждений и диссертационные советы правом и обязанностью проверки оригинальности представленных к рассмотрению текстов и дают возможность отклонить тексты не прошедшие такой проверки. Однако это не так просто даже в организационном смысле. Очевидно, что решение должно быть принято на основе результатов некоторой экспертизы, но на этом определенность заканчивается.
Первая группа вопросов практики экспертизы оригинальности научных текстов стоит в том, кто будет проводить данную проверку. Должен ли быть создан институт экспертов работ разных уровней или это часть общей проверки работы рецензентом? Должна ли эта проверка (а также вынесение решения) проводиться лично или коллегиально? Каковы требования к персоне эксперта и как регламентируется его работа и оплата его деятельности? Вторая группа вопросов практики данной экспертизы каса-
ется критериев и принципов самой проверки. Каковы критерии оригинальности работы? Какие формы заимствования допустимы, а какие нет? Какие показатели аргументируют то или иное решение эксперта? Каковы возможные результаты проверки и как они должны быть представлены? Третья группа вопросов касается результатов проверки. Какой документ фиксирует результат проверки и каким образом? Является ли проверка единовременной или ступенчатой (т.е. когда существует предварительная проверка и окончательная)? Каковы сроки проведения экспертизы и на какой стадии рассмотрения работы учреждением (кафедрой, советом, деканатом) она проводится? Есть ли механизмы пересмотра решения эксперта, и если да, то как, кем и в какие сроки он производится?
В современной российской науке существует институциональная неопределенность по данным вопросам. Неясным остается также можно ли выработать единый подход к критериям проверки, и каково влияние специфики учреждения, специальности и т.д. В настоящее время на уровне ВАК и Минобрнауки существует только указание на необходимость такой проверки, т.е. требование проводить экспертизу уже есть, а правила ее проведения еще не сформированы. Исторически подобные институциональные системы спускаются сверху и сложно ожидать выработки единой системы в результате взаимодействия проверяющих «на местах». Пока же каждое конкретное сообщество (факультет ВУЗа, диссертационный совет, структурное подразделение научной организации) столкнувшееся с необходимостью проверки самостоятельно вырабатывает ответы на данные вопросы конкретно для себя. Даже на уровне крупного вуза в большинстве своем нет единого подхода - слишком велика специфика разных научных и образовательных направлений. При этом стихийно образованные «правила игры» на уровне такого сообщества обладают сомнительной ценностью в вопросе отчета перед ВАК и Минобрнауки, поскольку ответы на вышеуказанные вопросы «на местах» и «в центре» могут существенно различаться, а единственным, к чему может апеллировать сообщество это авторитет эксперта, проводящего проверку - крайне ненадежное и эфемерное основание.
Таким образом, приходим к выводу, что пока существует институциональная неопределенность в сфере проведения экспертизы на оригинальность, ни о какой эффективности подобной проверки не может быть и речи. Тем не менее, никто не мешает нам проанализировать существующие проблемы и принципы подобной проверки.
Как уже отмечалось, эта проверка имеет 2 аспекта: 1) установление наличия заимствования идей, его легальности и легитимности; 2) установление наличия заимствования по форме и содержанию, его легальности и легитимности. Разбирая эти два аспекта, мы не будем уделять много времени первому, поскольку вопросы заимствования идей достаточно дискус-
сионны и имеют долгую историю, а сосредоточимся на втором аспекте проверки.
Установление наличия заимствования по содержанию - самая сложная часть работы эксперта, которая зависит от его знания научной разработанности темы, на которую написана работа. Разумеется, эксперт не в состоянии помнить все тексты, существующие в науке по данной проблеме, однако высокая квалификация в целом должна способствовать способности диагностировать попытку автора приписать себе мысли, идеи и концепции, известных ученых. Кроме того, заимствование такого рода можно диагностировать, обнаружив нарушение логики и стиля излагаемого материала. И если в вопросе легальности такого заимствования речь идет лишь о наличии или отсутствии правильной библиографической сноски в правильном месте текста, то вопрос легитимности (обоснованности) данного заимствования намного сложнее. Как уже было сказано, эксперт должен решить, является ли чужая мысль в данном тексте необходимой опорой для собственной мысли автора или нет. Последнее встречается, к сожалению, довольно часто. Пересказ чужих идей и теорий может вообще не относиться к размышлениям автора, может быть не связан с ними логическими связями (например, причинно-следственной связью) и даже вообще идти без сопровождения авторской аналитики. Все это делает заимствование нелегитимным (в смысле, оговоренном выше) и превращает научный текст в пересказ или изложение с элементами сочинения. Таким образом, можно заключить, что первый аспект проверки требует большого внимания, времени, а также высокой квалификации эксперта, притом, что результат с большой вероятностью все равно остается дискуссионным.
Более определенная ситуация в плане второго аспекта - проверки. Прежде всего, в плане обнаружения. То, что механическое заимствование чужого текста по форме и содержанию в условиях новой информационной культуры значительно упростилось, также означает, что появилась возможность механического же диагностирования такого заимствования. Цифровой текст очень легко подвергать верификации - для компьютера это просто два набора нулей и единиц, а, следовательно - данную верификацию можно также проводить машинным способом. На этом и основаны многочисленные системы компьютерной проверки оригинальности текста. Они состоят из двух компонентов - модуля анализа и сравнения текста и базы текстов, с которыми осуществляется верификация.
Модули бывают самые различные. Различие состоит в алгоритмах выявления в текстах единиц совпадения - будь то отдельные буквы, слова, словосочетания или целые предложения. Более продуманный алгоритм выявляет заимствование даже при отсутствии полной тождественности. Со временем появляются все более сложные и эффективные алгоритмы анализа текста, включающие анализ распределения единиц текста и его структуру.
Базы данных могут представлять собой реальные информационные массивы, называемые коллекциями. Они хранятся на локальных машинах, принадлежащих сервису проверки, и формируются постепенным увеличением. Другим вариантом базы для верификации является поисковой модуль, сходный с тем, которым обладают поисковые службы (типа Яндекс, Гугл и т.д.) который обращается к глобальной сети Интернет, отыскивая там элементы текста для сравнения. Важно отметить, что работа подобных поисковых модулей заключается не просто в постоянном поиске, а в индексировании найденных материалов. Таким образом, учитывая отмеченную динамику сетевых информационных массивов, найденные модулем копии могут существовать в момент индексации, но не существовать позднее. Это приводит к тому, что обращение к найденному источнику заимствования в сети Интернет может быть крайне затруднено, а порой совсем не возможно в более позднее время. Это обстоятельство, а также постепенное пополнение коллекций сервисов приводит к тому, что важным становится время проведение верификации, а следовательно, - разные по времени обращения к сервису проверки дают разные результаты.
Если рассматривать реальные практики использования подобных сервисов, то обнаруживается немало интересных моментов. Например, существует определенная «гонка вооружений» между мошенниками и работниками сервисов проверки. Мошенники придумывают все новые способы искажения предоставляемого на проверку текста (замена символов, кодировок, скрытые символы, лишние пробелы и т.д.), а сервис в свою очередь все более совершенствует используемые алгоритмы.
В мире существует множество систем автоматической проверки текстов на оригинальность. Так как по своей сути они сильно зависят от языка, на котором написан текст, их сфера применения ограничена. Существует ряд сервисов в рамках действия национальных языков. Есть свои системы для испанского, немецкого, шведского других европейских языков. Множество сервисов для английского, крупнейшим из которых, по словам Ю. Чеховича, генерального директора компании Forecsys, разрабатывавшего систему «Антиплагиат», является ТитШп компании IParadigms1. Существует несколько систем и для русского языка. Хотя ни ВАК, ни Минобрнауки не делали никаких рекомендаций на предмет выбора той или ной системы, наиболее распространенной и популярной в настоящее время является именно система «Антиплагиат» созданная в 2005 г. Ее создатель - фирма Forecsys была образована на базе Вычислительного центра РАН. Система стала быстро набирать популярность, что выразилось в создании варианта пакета услуг «Антиплагиат.ВУЗ», ориентированного на учебные заведения. Главная особенность системы, дающая ей
1 http://www.chaskor.ru/article/antiplagiat_31963 (время обращения 21.01.14).
очевидные преимущества - наиболее обширная база данных, составляющая более 10 млн документов. Системой заключен договор с Российской государственной библиотекой, что позволяет ей иметь уникальную по своей ценности для данной области коллекцию - базу защищенных в России кандидатских и докторских диссертаций. Последняя обновляется не очень быстро, практика показывает, что в системе обнаруживаются тексты, защищенные самое позднее за два-три года до времени проверки. Важно помнить, что как любой проект подобного рода, система «Антиплагиат» -продукт коммерческий. Услуга «Антиплагиат.ВУЗ» в России набирает популярность быстрыми темпами. Если в 2010 г. число подписчиков этой услуги составляло 15 вузов, то уже в 2011 г. их число достигло 45, в 2012 г. -140, а к началу 2014 г. оно составляет 230. Таким образом, несмотря на то, что система «Антиплагиат» не является единственной, можно уверенно считать ее лидером данного рынка. Сами сотрудники сервиса называют своей целью не искоренение плагиата как практики, а всего лишь прекращение «потока заказных работ». Действительно, автоматические системы проверки - всего лишь инструмент установления формального заимствования. Как мы уже отмечали, такое заимствование может иметь вполне легальный характер, а также есть другие варианты заимствования, не детектируемые автоматическими системами. Система «Антиплагиат» добавляет к результатам каждой проверки напоминание, что данная система не обнаруживает плагиат, а всего лишь указывает на наличие совпадений. Определять характер совпадений и делать выводы должен эксперт.
Что же представляет собой работа эксперта с системой автоматической проверки оригинальности?
Прежде всего, надо оговориться, что сервис располагает разными уровнями аккаунтов. Не регистрируясь в сервисе, можно проверить небольшой фрагмент текста и только через интернет-поиск. Бесплатный ак-каунт позволяет загружать целые документы для проверки, но дает только краткий отчет, с указанием процента оригинальности. Базовый платный дает уже расширенный отчет, с выделением совпадающих фрагментов. Стандартный платный аккаунт плюс к этому дает возможность подключать (за дополнительную плату) коллекции документов. И наконец, профессиональный аккаунт позволяет, кроме всего описанного, создавать собственные коллекции. Сервис позволяет преподавателям, подтвердившим свой статус, бесплатно получить несколько урезанный вариант базового аккаунта. Система «Антиплагиат ВУЗ» предоставляет вузам профессиональные аккаунты с подключенными коллекциями.
Итак, проверка производится в личном кабинете пользователя, где могут храниться уже проверенные им работы. Загрузив выбранный документ на проверку, выбрав подключаемые коллекции и запустив проверку, эксперт через некоторое время получает отчет. Отчет представляет собой
общий результат верификации загруженного документа с базой в обратном процентном отношении (т.е. процент оригинальности текста). Далее указываются источники совпадения, с указанием их характера (коллекция или Интернет), ссылки доступа1, процентом совпадения в тексте, процентом совпадения в отчете. Последние два показателя могут отличаться. Первый - это совпадение в абсолютных цифрах, т.е. без учета перекрестного совпадения с другими источниками. Второй - процент совпадения относительно отчета, т.е. с учетом перекрестного совпадения. Например, если между проверяемым текстом Х и источником А имеется совпадение на 15 %, между Х и источником B - на 10 %, и при этом между собой А и В совпадают на 50 %, то процент совпадения в тексте источника А будет 15 %, В - 10 %, но процент совпадения в отчете источника А будет 15 % (он больше, а значит войдет весь), а источника В - 5% (так как та половина, которая совпадает с А уже вошла в отчет). Таким образом, сумма процентов доли в отчете плюс процента оригинальности текста будет всегда равна 100 %, в то время как сумма процентов долей в тексте может значительно превышать это число. Отчет позволяет исключать выбранные источники из проверки, тогда процент будет пересчитан. Расширенный отчет кроме этого содержит сам отправленный на проверку текст, с выделением фрагментов совпадения и указанием на номер источника совпадения в списке.
Получив отчет, эксперт может работать с ним на сайте, а может скачать в особом формате, прочесть который может специальное приложение, скачиваемое с сайта сервиса. Это приложение в свою очередь может сформировать отчет для демонстрации - в формате веб-документа.
Каков же алгоритм работы эксперта? Прежде всего, надо понимать, что сервис не сохраняет множество ключевых деталей проверяемого документа - а именно страницы, сноски, таблицы, графики и картинки. Наиболее оптимальным является отправление документа на проверку в формате pdf - это позволяет сохранить страницы и даже сноски, но в виде сплошного текста. Второе уточнение. Проверяемый текст, или его части уже могли попасть в базу сервиса, если размещались в сети Интернет (не обязательно самим автором). Кроме того, текст может частично совпадать с иными собственными работами автора, что квалифицируется как автоплагиат, и являясь предметом дискуссий, по умолчанию не считается нарушением. Таким образом, прежде всего, эксперт проверяет каждый источник совпадения на предмет авторства. Источники, того же авторства
1 Нужно оговорить один момент. Ссылка на документ в коллекции не дает к нему доступа, только позволяет подтвердить, что такой документ в коллекции есть. Ссылка и интернет-источник по указанным выше причинам является актуальной только на момент индексации данного источника поисковым роботом, а следовательно, зачастую утратившая актуальность.
что и текст из проверки могут исключаться. Второй этап проверки состоит во внимательном анализе совпадающих фрагментов. С точки зрения легальности заимствования каждый такой фрагмент может представлять собой только прямую цитату, а значит, должен быть заключен в кавычки и иметь ссылку на автора. Исключением являются мелкие фрагменты, которые имеют характер общеупотребляемых выражений и оборотов, что естественно для научного текста, использующего соответствующий профессиональны лексикон. Кроме того, квалификационные работы содержат некоторое количество фрагментов текста, формулировка которых задана квалификационными требованиями, стандартами, правилами научной школы. На третьем этапе эксперт оценивает легитимность найденных заимствований - например, при проверке квалификационной работы, заимствований в виде прямых цитат не может быть в некоторых разделах квалификационной части - пунктах новизны, тезисах на защиту, гипотезе, выводах и т.д. Также не всегда обосновано такое явление как оверквотинг - превышение допустимого предела цитирования. Если часть работы состоит из прямых цитат в объеме более страницы перемежающихся с краткими, в пару предложений авторскими комментариями, такую работу также сложно счесть вполне научной. Хотя есть и исключения, о которых далее.
Результатом трех этапов проверки работы является отчет эксперта. Он содержит в себе указание на степень оригинальности текста1, указание на наличие нелегальных и/или нелегитимных заимствований, либо разъяснение относительно легального характера имеющихся заимствований, а также вердикт эксперта. Данный вердикт зависит от того, велик ли процент заимствований и каков их характер. Если некорректность в оформлении ряда прямых цитат или злоупотребление ими можно исправить в достаточно краткий срок в техническом порядке, то наличие серьезных заимствований, особенно в квалификационной части - уже основание для отклонения работы.
Указанная схема на практике осложнена целым рядом нюансов. Во-первых, существуют определенные трудности в определении авторства источников совпадения. Как уже говорилось, иногда авторство нельзя установить в принципе. Более того, остро стоит вопрос первоисточника цепочки копирований. Допустим, автор Х опубликовал текст А. Текст А подвергся массовому дублированию, в результате чего потерял авторство2. Автор F заимствовал часть текста А и опубликовал текст В. Спустя какое-то время X пытается опубликовать текст С, куда включает часть текста А. Но проверка показывает, что текст С имеет низкую оригинальность, совпадая с текстом В. Так как провести проверку текста В эксперт скорее все-
1 Отдельное внимание уделяется величине процента совпадения с одним источником, что само по себе указывает именно на плагиат.
2 То есть копии с указанием авторства X не сохранилось.
го уже не может, он вынужден считать это заимствование нелегальным, так как X не в состоянии подтвердить свои исключительные права на часть текста А. Если учесть, что в этой схеме число узловых точек (авторов заимствующих части текстов и свободно копируемых дубликатов) намного больше чем в описанном примере - ситуация порой становится крайне запутанной.
Во-вторых, особой проблемой являются фрагменты, описанные выше как общеупотребляемые. Прежде всего, речь идет о списке литературы и сносках. Их оформление подчинено требованиям ГОСТа, а так как маловероятно, что автор единственный, кто с ними работает - их совпадение неизбежно. Более того - это не исправляемое совпадение. Опытные эксперты конечно способны сделать определенные выводы относительно последовательности совпадения сносок, но список литературы указан в алфавитном порядке, тут не на чем делать выводы. Такая же проблема с формальными квалификационными формулировками. И наконец, главной такой проблемой является цитирование документов, возможное только в виде прямой цитаты - законодательных актов, исторических источников, прямой речи, статистических таблиц и т.д. Данные фрагменты также не всегда могут быть изложены косвенно.
В-третьих, особую сложность в оценке легитимности заимствований представляет собой специфика характера текста. Так студенческие работы могут содержать достаточно большой процент заимствований, рефераты и вовсе представлять собой качественную компиляцию. Научные же тексты должны содержать больший процент оригинальности, но тут огромную роль начинает играть специфика научной специальности. Например, юридические тексты просто не могут обойтись без больших прямых цитат, а в историографических или литературоведческих работах такие цитаты вообще могут занимать большую часть текста. Таким образом выработать единый критерий оценки чисто формальных результатов первых двух этапов проверки не представляется возможным. Очевидно, что в рамках каждой специальности и категории работы должны быть свои правила и рекомендации для решения эксперта.
Все это еще раз подводит нас к вопросу об институциональной неопределенности в сфере проверки научных текстов на оригинальность который мы отметили ранее. Наиболее логичным выходом является некая формализация правил и критериев оценки для всего сообщества и самого эксперта в рамках данной организации. Тут приходится отметить еще одну трудность. Научное сообщество на уровне учреждения стремится максимально формализовать проверку, добиться максимально четкого и однозначного критерия оценки для решения эксперта. Это создает ощутимый дрейф в сторону примата роли такого формального критерия как процент оригинальности текста по результатам системы. Как уже было показано
выше этот показатель в большинстве случаев - всего лишь отправная точка для настоящего анализа. Конечно, есть четкое понимание, что падение этого процента ниже определенной точки (которая должна определяться спецификой научного направления работы) автоматически лишают текст статуса научной работы. Но после прохождения этой точки в достаточно широком диапазоне должно существовать пространство для экспертной оценки. Но оно менее поддается формализации, и поэтому в большинстве организаций его стараются предельно сократить, поднимая «планку» процента до максимума. Это само по себе лишает смысла второй и третий этап работы эксперта. Разумеется, сложно рассчитывать, что эксперты также не имеют мотивации снизить издержки на каждую проверку, так что тенденция с принятием процента оригинальности как главного критерия принятия решения успешно доминирует в большинстве организаций. Тем более, что неясность позиции проверяющих головных организаций делает позиции экспертов крайне ненадежными, а формальный и наглядны показатель, кажется вполне убедительным аргументом. Однако более разумной политикой была бы более адекватная реальной проверке формализация правил и критериев, хотя бы на уровне локального научного сообщества и коллегиально. После чего было бы необходимо согласовать зафиксированный набор требований и правил с головной организацией и получить возможность стабильно работать без опасения, во всяком случае временно, поскольку в отсутствие автономии проверяющих организаций на местах, рано или поздно головными организациями будет создана директива об общих правилах и подходах в процедуре проверки на оригинальность научных текстов.
До тех пор нужно решить самые сложные вопросы выработки подходов к проверке. Например, остро стоит вопрос автоплагиата. Нужно достаточно четко определиться, как и в каком объеме разрешено использовать собственные тексты, нужно ли оформлять ссылки и каким образом, учитывая, например, практику, когда так называемые «ваковские» статьи практически дословно входят в текст работы, но было бы нелепо заключать десять и более страниц в кавычки. Далее нужно определиться с отношением к формальным фрагментам работы. Если их все равно не изменить, нужно ли их проверять, или можно исключить из проверяемого текста (например, список литературы). Нужно четко определиться с размерами допустимых прямых цитирований применительно к конкретному профилю научных работ. Четко определиться со статусом эксперта и экспертной проверки. И так далее, по всем упомянутым ранее вопросам.
В заключение также хочется отметить, что параллельно с созданием четкой системы проверки требуется проводить определенную работу по повышению информационной культуры учащихся и соискателей научных степеней, для снижения нагрузки на проверяющих. Например, особого
внимания требует контроль над фиксацией авторства любых публикуемых текстов. Если вы предоставляете кому-нибудь текст, не имея гарантии, что у вас есть на него документальное подтверждение авторства (таким подтверждением является, например, публикация в официальных изданиях, где фиксируется дата), и есть возможность, что текст будет размещен в сети, даже со ссылкой на вас, или же вы сами размещаете текст в сети без подтверждения авторства каким-то издательством - можете считать этот текст утерянным. Вам он больше не принадлежит, и не пытайтесь его использовать в других своих работах - вас могут вполне серьезно обвинить в плагиате, и у вас не будет возможности доказать обратное. Также требует определенной дисциплины обращение к интернет-ресурсам, с учетом динамики глобальной сети, любая работа с электронными версиями книг, статей, эмпирических источников. Требуется четкое понимание той информационной среды, в которой приходится работать современному автору научных текстов - среды наводненной дубликатами, полной мошенников и институциональной неопределенности, но в то же время - среды, где динамично развивается теория и практика проверки на оригинальность научных текстов.