Научная статья на тему 'Оценка достоверности информации, найденной в сети Интернет'

Оценка достоверности информации, найденной в сети Интернет Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
8740
782
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПОИСК В СИСТЕМЕ ИНТЕРНЕТ / SEARCH ON THE INTERNET / ДОСТОВЕРНОСТЬ ИНФОРМАЦИИ / ACCURACY OF THE INFORMATION / НЕЧЕТКИЙ ВЫВОД / FUZZY CONCLUSION / ИНТЕГРАЛЬНАЯ ДОСТОВЕРНОСТЬ САЙТА / INTEGRAL RELIABILITY OF THE WEBSITE

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Иванова Светлана Михайловна

В статье рассматриваются вопросы, связанные с проверкой на достоверность информации, найденной в результате поискового запроса в сети Интернет. Достоверность определяется с точки зрения полноты, целостности и истинности информации. При этом последнему фактору уделяется основное внимание. Для определения истинности предлагается использовать аппарат нечеткой логики. Описаны функции принадлежности нечетких множеств условной достоверности и близости материала к искомому. Разработаны правила вывода определения интегральной достоверности страницы сайта относительно искомой информации. Приведен пример для вычисления достоверности информации, представленной на одном из сайтов. Достоверность определялась для способа решения системы линейных уравнений методом Холецкого в соотнесении с рядом других методов решения, таких, как метода Крамера. Показаны результаты экспериментальной проверки метода для найденной информации на нескольких сайтах.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ASSESSMENT OF THE RELIABILITY OF INFORMATION FOUND ON THE INTERNET S.M. Ivanova

The article discusses the issues associated with verification of the accuracy of the information found in the search results on the Internet. The accuracy is defined from the point of view of completeness, integrity, and truthfulness of information. The latter factor is the main focus. To determine its validity, it is proposed to use fuzzy logic. There are membership functions of fuzzy sets for hypothetical accuracy and similarity of the material to the search one. The inference rules for determining the integral of the accuracy of the site page on the search information have been developed. An example to determine the accuracy of the information on one of the sites is presented. Accuracy was determined for the method of solving the system of linear equations by the method of Cholesky in correlation with a number of other methods of solution, such as Kramer method. The results of experimental verification of the method are shown for the search information on different sites.

Текст научной работы на тему «Оценка достоверности информации, найденной в сети Интернет»

УДК 519. 253, 378.147.88 ББК 74.4, 32.973.26.-018.2

ОЦЕНКА ДОСТОВЕРНОСТИ ИНФОРМАЦИИ, НАЙДЕННОЙ В СЕТИ ИНТЕРНЕТ

С.М. Иванова

Аннотация. В статье рассматриваются вопросы, связанные с проверкой на достоверность информации, найденной в результате поискового запроса в сети Интернет. Достоверность определяется с точки зрения полноты, целостности и истинности информации. При этом последнему фактору уделяется основное внимание. Для определения истинности предлагается использовать аппарат нечеткой логики. Описаны функции принадлежности нечетких множеств условной достоверности и близости материала к искомому. Разработаны правила вывода определения интегральной достоверности страницы сайта относительно искомой информации. Приведен пример для вычисления достоверности информации, представленной на одном из сайтов. Достоверность определялась для способа решения системы линейных уравнений методом Холецкого в соотнесении с рядом других методов решения, таких, как метода Крамера. Показаны результаты экспериментальной проверки метода для найденной информации на нескольких сайтах.

Ключевые слова: поиск в системе Интернет, достоверность информации, нечеткий вывод, интегральная достоверность сайта.

S.M. Ivanova

Abstract. The article discusses the issues associated with verification of the accuracy of the information found in the search results on the Internet. The accuracy is defined from the point of view of completeness, integrity, and truthfulness of information. The latter factor is the main focus. To determine its validity, it is proposed to use fuzzy logic. There are membership functions of fuzzy sets for hypothetical accuracy and similarity of the material to the search one. The inference rules for determining the integral of the accuracy of the site page on the search information have been developed. An example to determine the accuracy of the information on one of the sites is presented. Accuracy was determined for the method of solving the system of linear equa-

54

ASSESSMENT OF THE RELIABILITY OF INFORMATION FOUND ON THE INTERNET

tions by the method of Cholesky in correlation with a number of other methods of solution, such as Kramer method. The results of experimental verification of the method are shown for the search information on different sites.

Keywords: search on the Internet, accuracy of the information, fuzzy conclusion, integral reliability of the website.

С каждым годом объем различной информации, представленной во всемирной системе объединенных компьютерных сетей Интернет, растет в геометрической прогрессии. «Всемирная паутина» объединяет миллионы компьютеров, множество разных сетей. Каждый год количество пользователей растет на 30— 50%. Одни и те же данные и факты размещаются одновременно на многих сайтах. Но при этом возрастает и вероятность публикации ошибочных сведений. Как следствие, возникает вопрос: «Как среди потока информации выделить ту, которая является достоверной?»

В соответствии с государственной программой российской Федерации «Развитие образования» на 2013— 2020 гг. [1] и Федеральным государственным образовательным стандартам ФГОС в данный момент уделяется большое внимание организации самостоятельной работы студентов в процессе обучения [2]. Именно здесь Интернет становится необходимым звеном образовательного процесса, дает возможность получать дополнительные знания, что является важным для развития самообразовательной деятельности. Однако, опираясь на исследования социологов, приходится считаться с тем, что статистически средний пользователь тратит на один поисковый запрос не более 15 минут. Поэтому очень важ-

но, чтобы студенты не только умели организовывать поиск, но и быстро определять, является ли полученная информация достоверной [3].

Общие принципы достоверности полученной информации

Достоверность информации определяется:

• полнотой,

• целостностью,

• истинностью.

Поэтому при обучении организации процесса поиска следует уделять внимание всем трем составляющим, определяющим качество полученных данных.

Вопросы полноты информации могут быть решены, в том числе, за счет грамотного построения поискового запроса. Целостность информации, представленной на страницах сайта, во многом зависит от корректности ее сохранения и сочетания форм представления с возможностями используемого браузера. Наиболее сложным и важным является умение определять, является ли полученная информация истинной. От этого, в конечном счете, будет зависеть достоверность полученной информации.

Определение обоснованности и точности информации является довольно сложной задачей для пользователя. К сожалению, существует не так много интернет-сайтов, заслу-

55

56

живающих полного доверия. К таким можно формально отнести только сайты, созданные учеными или официальными сообществами, где информация отслеживается и рецензируется. В Интернете есть ряд зарезервированных адресов. Например, если доменное имя второго уровня — "gov.ru", то данный ресурс принадлежит правительственной организации. Доменное имя "ac.ru" относит ресурс к различным научным или высшим учебным объединениям (научно-исследовательский Институт или высшая школа). Имя "edu.ru" — это ресурс официальных органов образования. То есть только на интернет-сайтах, относящихся к специальным организациям, вероятность ошибки заведомо небольшая. Если нет возможности провести проверку достоверности найденной информации, опираясь на адрес интернет-сайта или с помощью консультации специалиста, то ее надо каким-либо образом анализировать.

Одним из способов является проверка с помощью ссылок на авторов статьи. Однако он возможен, только если на сайте указаны источники информации и источники данных являются доступными.

Достоверность сложного сообщения часто определяется как среднее арифметическое его составляющих [4; 5]. Предлагается для проверки полноты, целостности и истинности информации, представленной на странице сайте, воспользоваться аналогичным методом. Предполагается, что достоверность информации в целом на различных страницах одного сайта примерно одинаковая.

Так как сайт, как правило, содержит несколько страниц, то не

вся информация, размещенная на нем, является новой для пользователя. В этом случае можно определить интегральную достоверность сайта, опираясь на данные, представленные в его разных разделах. Предполагается, что информация, содержащая на других страницах, может быть оценена студентом с опорой на его базовые знания.

Рассмотрим пример, связанный с поиском одного из способов решения системы линейных алгебраических уравнений (СЛАУ). Предположим, что студенту надо изучить метод Холецкого. Даже в том случае, когда на сайте приводится пример решения, нельзя однозначно утверждать, что весь материал является достоверным. Следует отметить, что большинство сайтов, связанных с предоставлением информации о способах решения СЛАУ, содержат, в том числе, два наиболее популярных и распространенных точных метода: метод Гаусса и метод Крамера, которые входят в обязательную образовательную программу. Поэтому студенту предлагается предварительно оценить достоверность представленной информации по известным для них двум методам, являющимися аналогичными тому способу, который они изучают самостоятельно. Возможно, сайт содержит также решение систем уравнений приближенными методами: метод итераций или метод Зейделя. Тогда материал, размещенный на данных страницах, также можно проверить на отсутствие ошибок, однако в силу различия в точности получаемых результатов, достоверность последних страниц сайта должна в меньшей степени влиять на заключение о достоверно-

Рис. 1. Характеристическая функция

условной близости материала, представленного на странице сайта

Рис. 2. Характеристическая функция достоверности материала, представленного на странице сайта

сти информации о методе Холецкого. Таким образом, заключение о достоверности информации, представленной на интересующей студента странице сайта зависит от достоверности остального материала и его условной близости к новому материалу, найденному в сети Интернет.

Аппарат нечеткого вывода достоверности страницы сайта

Для определения достоверности получаемой информации предлагается использовать контроллер Мамдани аппарата нечеткой логики [6; 7].

Лингвистическими переменными в данном случае будут:

1. оценки условной близости информации на каждой странице сайта, достоверность которой можно оценить, к искомой;

2. оценка достоверности материала пункта 1.

Эмпирически для условной близости материала по тематике можно определить понятия «близкие», «похожие», «есть общее» и «нет совпадений», которые дают полную группу (рис. 1).

Аналогично вводится характеристическая функция определения достоверности каждой страницы сайта, определяемая пользователем (рис. 2).

Далее следует определить правила нечеткого вывода определения интегральной достоверности страницы сайта относительно искомой информации. Например, если информацию на станице близка к изучаемой и является достоверной, то можно предполагать, что искомая информация 57 классифицируется как полностью достоверная. Полностью все правила вывода представлены в таблице 1.

Каждой странице сайта следует сопоставить соответствующее нечеткое множество и провести его дефаз-зификацию.

Таблица 1

Правила вывода интегральной достоверности страницы сайта

условная достовер-^^близость ность страниць!"^^ близкие похожие есть общее нет совпадений

недостоверный возможная сомнительная условная недостоверная

что-то похожее вероятная возможная сомнительная условная

можно учесть определенная вероятная возможная сомнительная

достоверный полная определенная вероятная возможная

близкие похожие есть общее нет совпадений

Рис. 3. Определенное значение близости

Определение достоверности информации

Рассмотрим применение предложенного нечеткого вывода для определения достоверности сайта целиком на примере изучения решения СЛАУ методом Холецкого.

Был найден сайт, содержащий как информацию о данном методе, так и о ряде других методов реше-

недостоверный

что-то похожее есть

можно учесть достоверный

Рис. 4. Определенное значение достоверности

ния СЛАУ. Рассмотрим одну из страниц, отображающую решение систем линейных уравнений методом Крамера. Пусть значение близости и достоверности конкретной страницы были эмпирически определены следующим образом (вертикальная пунктирная черта на рисунках 3, 4):

Далее необходимо произвести логические операции над нечеткими

58

• недостоверный

= условная достоверность

■ -сомнительная

достоверность ■-возможная

достоверность = вероятная достоверность

■ -определённая

достоверность

достоверность

А \ ^ !\ !\ г. «; П

• недостоверный

■ условная достоверность •сомнительная достоверность -возможная достоверность = вероятная достоверность -определённая достоверность =полная достоверность

Рис. 5. Информация близка и достоверна

Рис. 6. Информация похожа и достоверна

•• недостоверный

= условная

достоверность ■ -сомнительная достоверность ■-возможная

достоверность = вероятная

достоверность > «определённая достоверность =полная достоверность

1 1 I » »

А /'■,".11

1 ■ ■ • * 1 • I \

1 ■ 11111

•• недостоверный

= условная достоверность

■ -сомнительная

достоверность > -возможная

достоверность = вероятная достоверность

■ «определённая

достоверность =полная

достоверность

Рис. 7. Информация близка и учитываема

Рис. 8. Информация похожа и учитываема

недостоверный

= условная достоверность

■ 'сомнительная

достоверность

■ -возможная

достоверность = вероятная достоверность

■ -определённая

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

достоверность =полная

достоверность

Рис. 9. Нечеткое множество одной страницы и его дефаззификация

множествами. Всего возможно четыре комбинации.

Если информация на странице близка ко вновь изучаемой со степенью 0,75 и достоверна со степенью 0,9, то, согласно таблице 1, страница полностью достоверная со степенью т^п(0,75;0,9)=0,75 (рис. 5). Если информация похожа со степенью 0,25 и достоверна со степенью 0,9, то она определенно достоверная со степенью т^п(0,25;0,9)=0,25 (рис. 6). Аналогично определяется нечеткий вывод для двух оставшихся комбинаций (рис. 7, 8).

Объединения этих четырех результатов дает общее решение (рис. 9), дефаззификацию которого можно проводить, например, определяя центр тяжести нечеткого множества (обозначен на рисунке белой точкой).

После того, как проведена дефаз-зификация для всех страниц сайта, содержащих известную информацию, итоговую достоверность Интернет-ресурса в контексте изучаемой информации предлагается определять как среднеквадратичное всех центров тяжестей полученных нечетких множеств. Данный результат дает возможность определить, следует ли использовать информацию с исследуемого сайта для обучения.

Заключение

Предлагаемый метод определения достоверности сайта был экспериментально проверен для описанного выше поиска информации о решении СЛАУ методом Холецкого. Наибольшую истинность дали, как и следовало ожидать, интернет-ресурсы, специализирующи -еся на предоставлении различного рода обучающей информации (например, http://www.exponenta.ru). Информационные сайты (рассматривались страницы, связанные с решением систем уравнений и работой с 59 матрицами) имели более низкий результат по шкале достоверности.

При этом следует отметить, что исследование материала на академическом студенческом сайте ВШУ (http://students.uni-vologda.ac.ru) дало хороший результат, однако в разных интернет браузерах информация отображалась по-разному. То есть при ее истинности, определенной согласно нечеткому выводу, условие целостности выполнено было не всегда.

Таким образом, предлагаемый способ определения достоверности информации дает хороший результат при условии выполнения условий полноты

60

и целостности представленного материала, что может быть реализовано с помощью грамотно построенных поисковых запросов и возможности предварительного поверхностного анализа. Формализация данных параметров также представляется возможной, хотя и требует некоторого навыка поиска по ключевым словам и общей оценки.

Отметим, что данный процесс можно упростить при автоматизации предложенного алгоритма. Это поможет студентам оценить информацию, представленную в сети Интернет, с точки зрения ее достоверности: полноты, целостности и истинности.

СПИСОК ИСТОЧНИКОВ И ЛИТЕРАТУРЫ

1. Распоряжение правительства Российской Федерации № 792-р от 15 мая 2013 года [Электронный ресурс]. - URL: http://xn--80abucjiibhv9a.xn--p1ai/%D0%B4%D0%B E % D 0 % B A % D 1 % 8 3 % D 0 % B C % D0%B5% D0%BD% D1%82%D1%8B/3409 (дата обращения: 09.02.2015).

2. Ильиченкова, З.В. Аттестационные тесты с функцией мотивации деятельности [Текст] / З.В. Ильиченкова // Актуальные проблемы гуманитарных и естественных наук. - 2013. - № 01 (48). Январь. - С. 283-287.

3. Рекомендации по оцениванию надежности интернет-ресурсов [Электронный ресурс] URL: http://www.pandia.ru/text/78/22 7/92345.php (дата обращения: 05.03.2015).

4. Иванова, С.М. Инновационный подход к восстановлению и фильтрации сигналов в линейных динамических системах [Текст] / С.М. Иванова // Вестник МГТУ Стан-кин. - 2009. - № 3. - С. 83-87.

5. Ильиченкова, З.В. Аксиомы - это интересно [Текст] / З.В. Ильиченкова // Наука и мир. Международный научный журнал. - 2014. -№10 (14). Октябрь. - Том 2. - С. 60-61.

6. Fuzzy logic and fuzzy control / [Electronic resource]. - URL: http://www.flll.uni-linz.ac. at/abouts/fuzzy (дата обращения: 05.03.2015).

7. Введение в нечеткую логику и системы нечеткого управления [Электронный ресурс]. - URL: http://www.gotai.net/documents/doc-l-fl-001.aspx (дата обращения: 02.03.2015).

REFERENCES

1. Fuzzy logic and fuzzy control, available at: http://www.ffll.um-lmz.ac.at/abouts/fuzzy (accessed: 05.03.2015). (in Russian)

2. Ilichenkova Z.V., Attestacionnye testy s funk-ciej motivacii dejatenosti, Actual problems of humanitarian and natural sciences, 2013, No. 01 (48) January, pp. 283-287. (in Russian)

3. Ilyichenkova Z.V., Axiomi - eto interesno? Science and World. International scientific journal, 2014, No. 10 (14) October, Vol. 2, pp. 60-61. (in Russian)

4. Vvedenie v nechetkuju logiku i sistemy nechetkogo upravlenija, available at: http:// www.gotai.net/documents/doc-l-fl-001.aspx (accessed: 02.03.2015). (in Russian)

5. Ivanova S.M., Innovacionnyj podhod k voss-tanovleniju i filtracii signalov v linejnyh din-amicheskih sistemah, Vestnik MSTU STANKIN, 2014, No 3, pp. 83-87. (in Russian)

6. Rekomendacii po ocenivaniju nadjozhnosti internet-resursov, available at: http://www. pandia.ru/text/78/227/92345.php (accessed: 05.03.2015). (in Russian)

7. The order of the government of the Russian Federation No. 792-р of15.05.2013, available at: http://xn--80abucjiibhv9a.xn--p1ai/%D0% B4%D0%BE%D0%BA%D1%83%D0%BC %D0%B5%D0%BD%D1%82%D1%8B/34 09 (accessed: 09.02. 2015). (in Russian)

Иванова Светлана Михайловна, кандидат технических наук, доцент, кафедра информационных систем, Московский государственный технологический университет «СТАНКИН»; учитель математики, средняя общеобразовательная школа № 2107 (1840), г. Москва, sm-ivanova@yandex.ru

Ivanova S.M., PhD in Engineering, Associate Professor, Information Systems Department,, Moscow state technological University "STANKIN", Mathematics Teacher, Secondary School No. 2107 (1840), Moscow, sm-ivanova@yandex.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.