Научная статья на тему 'Grid-организация распределенного ресурсного обеспечения для сетевого обучения'

Grid-организация распределенного ресурсного обеспечения для сетевого обучения Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
141
34
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СЕТЕВОЕ ДИСТАНЦИОННОЕ ОБУЧЕНИЕ / NETWORK AND DISTANCE EDUCATION / АССОЦИАЦИИ СЕТЕВОГО ОБУЧЕНИЯ / ГРИД / GRID / РАСПРЕДЕЛЁННОЕ ХРАНЕНИЕ ОБРАЗОВАТЕЛЬНЫХ РЕСУРСОВ / DISTRIBUTED STORAGE / ASSOCIATIONS OF DISTANCE EDUCATION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Олейников Борис Васильевич, Шалабай Андрей Игоревич

Рассматривается общая ситуация в области ведения дистанционного обучения. Для повышения эффективности этого процесса предлагается консолидация каталогов учебных и методических материалов и одновременное распределённое хранение их полных текстов в образовательных организациях, ведущих сетевое дистанционное обучение. Для этого предлагается использовать Grid-технологии, которые могут послужить основой организации ресурсной технологической платформы сетевого дистанционного обучения

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The Grid-organization of distributed resources for network education

We consider the overall situation in the field of conducting distance learning. To improve the efficiency of this process is proposed to consolidate directories of learning and teaching materials and simultaneous distributed storage of full texts in educational institutions, leading distance learning network. For this purpose the use of Grid-technologies that can serve as the basis of the resource organization technology platform network of distance learning

Текст научной работы на тему «Grid-организация распределенного ресурсного обеспечения для сетевого обучения»

Заключение

В данной статье автор предлагает инструмент для проведения расчетов используемых в экспертной оценке, моделировании, проектировании, анализе различных систем и процессов. Предложенная экспертная система была протестирована на процессе формирования компетентностей учебных планов для подготовки бакалавров по направлениям 230100.62 «Информатика и вычислительная техника», 230400.62 «Информационные системы и технологии» и 231000.62 «Программная инженерия» в Сибирском государственном технологическом университете.

Литература

1. Плотинский Ю.М. Теоретические и эмпирические модели социальных процессов: учебное пособие для высших учебных заведений. - М.: Издательская компания «Логос», 1998. - 280 с.

2. Mathworks MATLAB. [Электронный ресурс]. URL: http://www.stargof.com/soft/ nauchnye-raschety/mathworks-matlab/

3. Модели социальных процессов. Библиотека учебной и научной литературы. [Электронный ресурс]. URL: http://sbiblio.com/biblio/archive/plotinskiy_modeli/01.aspx

4. Доррер Г.А. Когнитивное моделирование динамики компетенций в учебном процессе / Г.А. Доррер, С.С. Москалева // Информатизация и связь. 2012. C. 118-123

5. Национальной системы компетенций и квалификаций (НСКК) Агентства стратегических инициатив. [Электронный ресурс]. URL: http://asi.ru/asi_initiatives/list_molprofi.php

6. Гриценко Е.М. Наполнение вариативной составляющей учебного плана для формирования конкурентно способного ит-специалист / Е.М. Гриценко, А.В. Лоч, А.С. Шельмагин // Информационные системы и технологии. 2011. № 5 (67). С. 74-77.

7. Доррер Г.А. Когнитивное моделирование процесса приобретения компетенций студентами на основе требований ФГОС ВПО / Г.А. Доррер, С.С. Москалева // Хвойные бореальные зоны. 2012. С. 47-61.

8. Москалева С.С. Когнитивная модель управления учебным процессом / С.С. Москалева // Лесной и химический комплексы - проблемы и решения. 2012. Т. 2. С. 224-228.

Program support of the expert assessment of criteria for creation of cognitive model

Svetlana Stanislavovna Moskaleva, associate professor of information technologies Siberian state technological university

The model of learning system when it transforms to new level oriented on the obtaining the students competitions according with 3-d generation of State Learning Standard. As basic formalism the dynamic model of competition grows obtained on basis of cognitive simulation is suggested.

Key words: learning systems, competition approach, cognitive simulation. УДК 004.75:378.6

GRID-ОРГАНИЗАЦИЯ РАСПРЕДЕЛЕННОГО РЕСУРСНОГО ОБЕСПЕЧЕНИЯ ДЛЯ СЕТЕВОГО ОБУЧЕНИЯ

Борис Васильевич Олейников, к.ф.н.,доц., доц. кафедры вычислительных и информационных технологий, Тел.: 902 990 2597, e-mail: oleynik48@mail.ru

Андрей Игоревич Шалабай, аспирант Тел.: 391 208 6486, e-mail: andrsh@gmail.com Институт математики и фундаментальной информатики ФГАОУ ВПО «Сибирский федеральный университет» http://sfu-kras.ru/

Рассматривается общая ситуация в области ведения дистанционного обучения. Для повышения эффективности этого процесса предлагается консолидация каталогов учебных и методических материалов и одновременное распределённое хранение их полных текстов в образовательных организациях, ведущих сетевое дистанционное обучение. Для этого предлагается использовать Grid-технологии, которые могут послужить основой организации ресурсной технологической платформы сетевого дистанционного обучения.

Ключевые слова: сетевое дистанционное обучение, ассоциации сетевого обучения, грид, распределённое хранение образовательных ресурсов.

В настоящее время во всем мире и в нашей стране большое внимание уделяется дистанционному обучению (ДО), которое призвано удовлетворить потребности в образовании представителей всех социальных групп населения, независимо от их места нахождения и времени доступа к образовательным ресурсам, что позволяет совмещать место работы и учёбы, обучаться в любое время суток находясь в любом месте.

Для решения проблемы предоставления качественного дистанционного обучения, а также экспансии своего образовательного ^

влияния многие ведущие иностранные |__ШН

университеты мира объединяются в ^К ^^^^ различные ассоциации дистанционно- ^^И

Б.В. Олейников го обучения, направленные, прежде _ ^^Н

всего, на разработку и предоставление образовательного кон- К 1 ^ВВ

тента, а также ведение собственно процесса обучения на разра- -__

ботанных платформах. Данный подход позволяет одновременно вести обучение по самым разнообразным дисциплинам, охватывая различные слои населения, предоставляя образова- Шалабай тельный контент в любое время суток.

На сегодняшний день в мире существует несколько таких организаций:Udacity (https://www.udacity.com), MIT Open Course Ware (MITOCW - http://ocw.mit.edu), Khan Academy (https://www.khanacademy.org/), EADTU (www.eadtu.eu), Academic Earth (http://academicearth.org/), Сoursera (https://www.coursera.org/), EdX (https://www.edx.org/) и др.

Все они организовывались в период с конца 1980-х годов (например, EADTU) и до 2012 года. Каждая из них представляет многие курсы в свободном доступе по разным направлениям. Каждая из них объединяет многие ведущие университеты мира, которые разрабатывают курсы (в том числе некоторые и на нескольких языках), предоставляют их для открытого доступа и ведут преподавательское сопровождение курсов. По курсам этих организаций уже прошли обучение десятки миллионов человек. В числе партнеров некоторых из этих организаций есть и единичные российские вузы (например, партнером EADTU является МЭСИ).

Особенно впечатляет размах таких организаций как Academic Earth (48 образовательных организаций, 481 курс), Сoursera (107 университетов, 554 курса, более 5 млн. обучаемых), EdX (30 мировых ведущих университетов-партнеров, 110 курсов).

Одним из наиболее значительных последних примеров такой интеграции является уже упомянутая EdX, основанная в 2012 г. на партнерстве таких известных университетов, как Гарвардский университет и Массачусетский технологический институт. Это партнерство направленно на создание новой образовательной платформы Education-eXtended (EdX) с открытым исходным кодом для организации совместного on-line обучения, а в перспективе и создания глобального сообщества on-line обучения путем подключения других вузов, находящихся в любой точке планеты. EdX должна поддержи-

вать все современные технологии дистанционного on-line обучения (сегменты видеокурсов, запоминающиеся викторины, немедленная обратная связь, студенческий рейтинг вопросов и ответов, ориентация на студенческий темп обучения, on-line лаборатории и многое другое). В настоящее время помимо MIT и Гарвардского университета в их число входят еще 28 мировых университетов, включая и такие известные, занимающие верхние позиции в рейтингах вузов мира, как университет Беркли, Калифорнийский технологический институт, а также Австралийский национальный университет, университет Торонто (Канада), Политехническая школа Лозанны (Швейцария) и др.

Важным преимуществом таких крупных ассоциаций в области дистанционного обучения является его высокое качество, достигаемое за счёт технологий, позволяющих использовать в процессе обучения видео-лекции, обратную real-time связь с преподавательским составом, онлайновые практические занятия, контрольные и курсовые работы. Часто загруженность студентов при дистанционном обучении эквивалентна очной форме обучения.

Все это позволяет говорить, что сегодня мы имеем дело с практической реализацией новой парадигмы обучения - распределённого (или сетевого) обучения, осуществляемого ведущими вузами мира, и с мощным их интеграционным движением, направленным на разработку курсов и ведение обучения.

В России такого мощного интеграционного движения вузов, основанного на использовании современных технологических платформ, нет. Есть отдельные образовательные организации, основная образовательная деятельность которых базируется на дистанционном обучении, в основном в пределах России, например, Современная гуманитарная академия (http://www.muh.ru/), действующая с 1992 года. В большинстве же своём государственные (и не государственные) аккредитованные вузы ведут дистанционное обучение самостоятельно по своему усмотрению. Среди организаций, занимающихся дистанционным образованием в России, следует выделить Национальный открытый университет «Интуит» (http://www.intuit.ru/), действующий с 2003 года. Его основная деятельность направлена на создание разнопланового образовательного ресурсного обеспечения (в основном в области информатики, программирования и информационных технологий - лекции, видеокурсы с привлечением сторонних разработчиков курсов) и определённому дистанционному обучению на их основе (в настоящее время для обучения предлагается 536 бесплатных учебных курсов и 170 видеокурсов).

Важнейшим аспектом дистанционного образования является предоставление учащимся различных пособий, методических материалов, записей лекций и т. д. через Интернет. Очень часто подобная информация насыщена графическими элементами, в них присутствует аудио и видеоданные, следовательно, общий объем файлов, размещённых на серверах учреждений дистанционного образования, оказывается, достаточно велик, что влечёт высокую нагрузку на дисковые ресурсы и каналы связи. К тому же такая информация разбросана по многочисленным образовательным порталам, электронным библиотекам учебно-методических материалов и иным хранилищам. Следует учесть также, что для получения качественного образования и ведения исследовательской работы учащемуся часто приходится заниматься поиском дополнительных материалов, которые не представлены в рамках регламентированного образовательного ресурса, обращаясь к традиционным библиотекам, электронным библиотекам и Интернет. Таким образом, для ведения эффективного обучения, включая дистанционное, необходим удобный инструмент для накопления, хранения и обмена цифровыми образовательными и научными материалами. Такой инструмент, учитывающий к тому же телекоммуникационные возможности российского сетевого сегмента, мог бы быть положен в основу технологической платформы для ведения дистанционного обучения.

Современное развитие распределённых информационных технологий, в частности, Grid, позволяет использовать их и для целей дистанционного образования, например, для консолидации каталогов образовательных ресурсов при условии разнесения их

полных текстов по узлам-изготовителям (накопителям или поставщикам). Такой подход позволит с позиций единого окна получать доступ к образовательным ресурсам различных ассоциаций образовательных учреждений, предоставляющих услуги дистанционного обучения, а также снизить нагрузку на серверное оборудование и каналы связи. Если описание данных, представленных в консолидированном каталоге, будет удовлетворять требованиям традиционных библиотек, то можно обеспечить не только поиск ресурсов для дистанционного обучения, но и позволит реализовать гибкую систему поиска по множеству параметров во многих библиотеках и в будущем консолидировать разнообразные цифровые данные (не обязательно предназначенные для дистанционного обучения) с каталогами традиционных библиотек [1].

В настоящей статье представлена концепция подобной распределенной ресурсной образовательной сети, основанная на идеях Grid. Каждая организация, ассоциация, предоставляющая услуги дистанционного обучения, или даже отдельный разработчик, имеющий свои авторские курсы, представляет собой узел Grid-сети, основной ресурсной функций которого является накопление, описание, каталогизация ресурсов, обеспечение доступа к ним, а также участие в формировании консолидированного каталога. Основные положения такой сети следующие:

1. Полные тексты документов хранятся в узлах Grid-сети, являющихся территориально распределёнными клиентскими рабочими местами (персональными компьютерами учащихся, сотрудников образовательных учреждений, а также существующими в этих учреждениях серверами с учебными материалами), имеющими выход в Интернет. Каждый узел сети может быть направлен на сосредоточение определенной тематической информации (соответствующей специальности конкретного преподавателя, учащегося или дисциплине), часть из которой может быть задействована другими узлами. В этом случае, наиболее актуальная информация дублируется на локальных ресурсах множества компьютеров и, следовательно, даже с отключением части узлов, остаётся доступной в сети. Данный подход позволяет экономить серверные ресурсы и обеспечивать более высокую скорость обмена информацией.

2. В случае отсутствия у пользователя узла необходимой информации, производится её поиск в сети Интернет, после чего специализированное программное обеспечение порождает библиографические описания (если это возможно), индексирование документов, размещение соответствующей записи в едином каталоге, а также резервное долговременное хранение полных текстов. Таким образом, узлы Grid-сети являются резервными держателями представляющих интерес документов.

3. Консолидированный каталог сети представляет собой базу данных, в которой размещаются описания имеющихся в системе документов, подготовленных узлами сети, а также ссылки на узлы, содержащие полные тексты этих документов. Использование такого каталога позволяет оперативно осуществлять поиск требуемых документов в образовательной сети без непосредственного поиска в Интернет и последовательного опроса узлов. Дополнительно появляются возможности централизованной каталогизации ценных документов сети Интернет и обмена библиографической информацией с уже существующими системами, находящимися в разных городах и организациях с целью расширения внешней аудитории по поиску интересующих документов.

4. Механизмы, обеспечивающие заинтересованность узлов Grid-сети в таком взаимодействии, могут быть достаточно разнообразны (собственный интерес организации-держателя узла с позиций предоставления услуг дистанционного обучения, материальная заинтересованность, обеспечиваемая, например, какими-либо программами, включая федеральные, направленными на организацию такого взаимодействия, интерес, связанный с непосредственным обменом ресурсами по принципу «ты мне, я тебе», широко распространённому в файлобменных сетях, с начислением определённых бонусов и др.).

5. Внешний пользователь (получатель информации) после осуществления поиска в хранилище, выбирает определённые документы для скачивания, которые предоставляются ему с ближайшего доступного в данный момент узла Опё-сети. При доступности источников полнотекстовых данных скачивание происходит по технологии р2р, в противном случае специальная серверная служба постоянно отслеживает их подключение, самостоятельно скачивает и отправляет получателю требуемые данные.

6. Узлам сети присваиваются определённые полномочия, например, добавление новой информации определённых тематик (размещение информации в хранилище), её модификация, возможность блокировки определённых узлов с изъятием полученных от них данных и т.д. Также целесообразно для каждого узла разделять полномочия для документов разной области знаний.

7. Узлы обеспечивают отслеживание обновление и появление новых ресурсов. Составление библиографического описания найденного узлом Опё-сети документа в общем случае должно осуществляться автоматически [2]. В случае, когда невозможно автоматически определить требуемые для библиографического описания данные, возможно участие человека-сотрудника узла. Так, для текстового документа, размещённого в Интернет, в большинстве случаев возможно автоматически установить название документа, дату его создания (размещения), а в некоторых случаях автора и тематику по одному из библиотечных классификаторов (например, УДК). В случае же невозможности автоматического определения части этих характеристик документа (большей частью это относится к библиотечным классификаторам) эта задача ложится на сотрудника узла Опё-сети, размещающего документ в сети. Корректность определения всей библиографической информации проверяется модераторами соответствующего раздела области знаний при получении библиографического описания от узла Опё-сети, после чего описание записывается в хранилище. Следует отметить, что эта часть работы по распределённой каталогизации интернет-документов нуждается в более детальном рассмотрении.

8. В тематический справочник, кроме тематического классификатора, возможно добавление разделов, посвящённых различным конкурсам и грантам, правилам приёма для абитуриентов и т. д., а также списка образовательных учреждений, входящих в проект, что позволит конкретным учреждениям размещать различные положения и нормативные документы, а при поиске отделять эту информацию от учебных материалов.

9. Доступ к полнотекстовым документам может осуществляться различными способами: возможно отображение списка всех полнотекстовых документов каждого конкретного узла, формирование каталога с документами определённой тематики, полнотекстовый поиск по всему хранилищу или его части.

10. Целесообразным является предоставить возможность узлам прикреплять к документам отсканированные копии авторских согласий на размещение материалов, которые будут доступны всем желающим для ознакомления.

11. Каждый узел может самостоятельно группировать документы из различных источников по определённым признакам. Например, для размещения УМКД в системе достаточно добавить группу, содержащую рабочую учебную программу, методические указания и рекомендации. Список учебной литературы возможно сформировать из уже присутствующих в системе полнотекстовых документов и присоединить его к созданной группе. Таким образом, УМКД будет размещён не на одном узле, а рассредоточен по всей системе, в то же время это не будет видно обычному пользователю, который, выбрав УМКД для ознакомления, получит весь список доступных для скачивания материалов, независимо от того где они физически находятся.

12. Связь с библиотеками может осуществляться с помощью стандартизированного протокола 239.50, что позволяет объединить каталоги Опё-сети и традиционных библиотек. При этом, в результатах поиска будут отображаться ссылки как на полные

тексты, размещённые в системе, так и список библиотек, в которых представлен оригинал того или иного издания.

Возвращаясь к автоматическому формированию библиографических описаний, следует отметить, что его полнота будет зависеть от типа конкретного документа:

1. В случае, если тот или иной материал представляет собой обычную вебстраницу (статьи в электронных журналах, информационных изданиях, агрегаторах контента), автоматически, чаще всего, возможно определить название, URL, язык материала, название компании-владельца электронного ресурса и дату его регистрации, типы доступа и электронного формата, порт, имя хоста и размер файла. Также, с помощью каких-либо алгоритмов классификации текстов (например, [3]) можно попытаться определить тематику документа. Эти данные могут войти составной частью в библиографическую запись ресурса, представленную в формате RusMarc, широко используемом в Российских библиотеках.

2. В случае размещения документа в одном из существующих текстовых форматов (txt, doc, xlt, rtf и др.) возможно определение только данных о названии, языке, размере, типе файла. Также, как и у веб-страниц, в некоторых случаях возможно определение тематики документа.

3. Графические (включая данные в форматах pdf и djvu), аудио и видеоматериалы в общем случае не поддаются автоматическому описанию. Но в данном случае, даже в случае отказа пользователей вручную описывать эти данные, их хранение в представленной системе позволит значительно сократить нагрузку на серверное оборудование организаций дистанционного обучения.

В настоящее время множество современной образовательной литературы, включая УМКД, все еще хранится в библиотеках в бумажном виде. В то же время нарастает лавина электронных версий документов, аудио и видеоматериалов, которые в силу отсутствия требуемых выходных библиографических данных и необходимых инструментов пока не каталогизированы. С внедрением образовательной Grid-сети и объединением баз данных описательной информации с классическими библиотеками появится возможность одновременного её поиска в интернет (в частности, на web-порталах), в классических и электронных библиотеках. При этом будет возможен гибкий доступ к данным с помощью отбора документов практически по всем критериям, принятым в классических библиотеках, тем самым будет обеспечена возможность консолидации требуемых ресурсов, независимо от места их размещения, и возможность доступа к ним с позиций одного окна. Что позволит повысить эффективность ресурсного обеспечения для многих целей, в том числе и для целей сетевого дистанционного обучения.

Литература

1. Олейников Б.В., Шалабай А.И. О консолидации электронных библиотечных и интернет-ресурсов для образовательных и научных целей // Открытое и дистанционное образование. - Томск, 2012 № 4 (48). С. 40-462)

2. Олейников Б.В., Шалабай А.И. Автоматическое порождение библиографического описания Интернет-ресурсов для их хранения в электронных библиотечных системах // В мире научных открытий. 2012. № 8. С. 65-85.

3. Олейников Б.В., Шалабай А.И. Realtime метод автоматической классификации научных текстов // Новые информационные технологии именеджмент качества: материалы IX междунар. науч. конф. - Турция, 2012. С. 34-37.

The Grid-organization of distributed resources for network education

Boris Vasilievich Oleynikov,candidate of philosophical sciences, docent, docent of computing and informational technologies department, institute of mathematics and fundamental informatics, Syberian federal university

Andrey Igorevich Shalabay,post-graduate student, institute of mathematics and fundamental informatics, Syberian federal university

We consider the overall situation in the field of conducting distance learning. To improve the efficiency of this process is proposed to consolidate directories of learning and teaching materials and simultaneous distributed storage of full texts in educational institutions, leading distance learning network. For this purpose the use of Grid-technologies that can serve as the basis of the resource organization technology platform network of distance learning.

Keywords: Network and distance education, Grid, associations of distance education, distributed storage.

УДК 005

КЛАССИФИКАЦИЯ ТЕКСТОВ, СОДЕРЖАЩИХ ФОРМУЛЫ

Антон Олегович Лавренов, аспирант базовой кафедры вычислительных и информационных технологий Тел.: 908 325 8225,e-mail: lavrton@gmail.com Борис Васильевич Олейников, к. филос. наук, доц., доц. базовой кафедры вычислительных и информационных технологий Тел.: 902 990 2597, e-mail: oleynik48@mail.ru Институт математики и фундаментальной информатики ФГАОУ ВПО «Сибирский федеральный университет» http://math.sfu-kras.ru

В работе.указывается на важность учёта формул при классификации математических и иных документов, особенно для целей их поиска. Рассматривается подход к классификации текстов, содержащих формулы, на основе преобразования исходного документа в tex-формат, и создания блочной его структуры. Приводятся первоначальные результаты проведенных тестовых расчетов на основе предлагаемого подхода.

Ключевые слова: классификация текста, tex формат, блочная структура текста, классификация текстов с формулами.

В настоящее время в связи со взрывным характером порождения цифровых текстовых документов (интернет, автоматизированный документооборот, цифровые библиотеки, образовательные сайты и порталы и т.п.) все более насущной является проблема их поиска. Основополагающую роль при построении тематического полнотекстового поиска документов ^^^^^ играет классификация. В настоящее

время разработано достаточно много методов классификации текстов, но практически все из них не учитывают (точнее игнорируют) наличие формул в текстах. Это может привести к значительному искажению классификации, например, в таких предельных случаях, когда основной объем текста занимают формулы, что бывает характерным для математических текстов. Поэтому

„ ■ I необходимо разработать такие подходы к классификации,

А.О. Лавренов г г

которые бы могли учитывать любое состояние текста включая

i Надоели баннеры? Вы всегда можете отключить рекламу.