Научная статья на тему 'МЕТОДОЛОГіЧНі ЗАСАДИ іНТЕЛЕКТУАЛЬНОї ОБРОБКИ ЗНАНЬ'

МЕТОДОЛОГіЧНі ЗАСАДИ іНТЕЛЕКТУАЛЬНОї ОБРОБКИ ЗНАНЬ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
45
10
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
іНФОРМАЦіЙНі СИСТЕМИ / INFORMATION SYSTEMS / іНФОРМАЦіЙНі ТЕХНОЛОГії / МОДЕЛі ТА МЕТОДИ В іНФОРМАЦіЙНИХ СИСТЕМАХ / MODELS AND METHODS OF INFORMATION TECHNOLOGIES / ПРИРОДНО-МОВНі КОНСТРУКЦії / INFORMATION TECHNOLOGY / NATURAL LANGUAGE CONSTRUCTIONS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Бадьоріна Л.М.

Запропоновано універсальну інформаційну технологію інтелектуальної обробки знань, яка за рахунок теоретично обґрунтованої методології дозволить вилучати і обробляти “нову цінну інформацію”. Для професійної підготовки, зокрема в галузях діяльності, пов’язаних з використанням точної, семантично достовірної термінології, де спотворення формулювань, стандартизованих визначень термінів або недостатнє їх розуміння може призвести до відхилень у виконанні професійної діяльності, помилкам. Запропоновано методологічні засади обробки знань на рівні формалізації

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Methodological bases of intellectual processing of knowledge

The paper considers the application of universal information technology of processing of knowledge which at the expense of theoretically reasonable methodology of processing of knowledge will allow to process and withdraw new valuable information. There are offered the methodological bases of processing of knowledge at the level of formalization by means of which are described naturally speech information and methods of its receiving. Development of methods of automatic segmentation of a compound sentence and ways of programming allow to solve an applied problem applying to text

Текст научной работы на тему «МЕТОДОЛОГіЧНі ЗАСАДИ іНТЕЛЕКТУАЛЬНОї ОБРОБКИ ЗНАНЬ»

Г

ТЕХН1ЧН1 НАУКИ

V

УДК 004.681

Б01: 10.15587/2313-8416.2017.118921

МЕТОДОЛОГ1ЧН1 ЗАСАДИ 1НТЕЛЕКТУАЛЬНО1 ОБРОБКИ ЗНАНЬ © Л. М. Бадьорша

Запропоновано утверсальну ¡нформацшну технологт ттелектуально! обробки знань, яка за рахунок теоретично обтрунтовано'1 методологИ дозволить вилучати I обробляти "нову цтну тформацт". Для профестно! тдготовки, зокрема в галузях дгяльностг, пов'язаних з використанням точно!, семантично достовгрно! термгнологИ] де спотворення формулювань, стандартизованих визначень термтгв або не-достатне !х розумгння може призвести до в1дхилень у виконаннг професшно! дгяльностг, помилкам. Запропоновано методологгчт засади обробки знань на ргвнг формал1заци

Ключов1 слова: ¡нформацшнг системи, ¡нформацшнг технологи, модел1 та методи в тформацтних системах, природно-мовн1 конструкцИ

1. Вступ

Аналiз свггових тенденцш розвитку вищо! школи, а також протирiч, що стримують його розви-ток дозволили сформувати наукову проблему, що по-лягае в розв'язанн протирiччя мiж можливостями традицшних методiв навчання (розробленими методами автоматизацп та вилученнi знань) i тенденцiями розвитку сучасного сусшльства заснованого на знан-нях i iнтелектуальних iнформацiйних технологiях, що вимагае систематизованого пiдходу до автоматизацii навчання фах1вщв. Iндустрiя знань активiзуе досль дження з когнiтивноi' лiнгвiстики, а також рiзних аспе-ктiв взаемостосуншв мiж мовними та iнформацiйними системами опрацювання iнформацii. В Украш значш кроки зроблено на шляху створення навчальних тех-нологiй. За допомогою засобiв ввдзначеного типу мо-жлива комунiкацiя через web-середовище. У свiтовiй лiнгвiстицi тдвищуеться значущють мовно-комуш-кативноi проблематики, свщченням чого е науковi i техтчш програми, присвяченi дослiдженню мереже-вих мовно-шформацшних систем та мережевих когнь тивно-лiнгвiстичних процесiв.

Цивiлiзацiйне значення процеав функцюну-вання знання в постшдус^альному суспiльствi та роль мови в цих процесах набувають таких вимiрiв, що надають мовознавству технологiчних якостей. У процеа конструювання сучасних шформацшно-кому-нiкацiйних технологiй постала потреба у застосуванш властивостей природноi мови для створення мовно-iнформацiйних систем, налаштованих на штелектуа-льне опрацювання мови. Еволющя постшдус^ально-го суспiльства [1] привела передовi крану свiту до переходу ввд "шформацшного сусшльства" до "сусшльства знань". Лшгвютичш технологи, що виникли в ХХ столгт, докорiнно змiнили загальну ситуацш в iнформацiйному свiтовому просторi, структурували

лiнгвiстичний аналiз даних i вплинули на подальше формування як практики, так i теорп шформацшного середовища [2].

Лiнгвiстична технологiя щодо засобу комушка-цИ' фiксуе новi форми аналiзу даних у сферi шформа-цiйних технологiй, визначае прюритетш напрями розвитку електронних комушкацш та засобiв масово1' ш-формаци. Тому сьогоднi, коли лiнгвiстика й шформа-цiйнi технологи взаемопов'язанi та взаемозалежш, по-стае проблема дослвдження якiсного рiвня збалансова-ностi комп'ютерно1' лiнгвiстики як у комунiкативному, так i в соцiально-економiчному аспектах, характерних для украшських лiнгвiстичних систем. Зрозумшо, що для цього потрiбнi й ввдповвдш навчальнi i дидактичнi матерiали.

2. Л1тературний огляд

Методологiчною основою дослвджень були досягнення наукових шкш в галузi розробки нових концепцш i сучасних технологiй. Використовувались для дослвдження наступнi методи: обробка знань, 1'х формалiзацiя; накопичення знань в певнш предметнiй областi; перевiрка знань, що мютяться в рiзномовних текстах на предмет функцюнально1' повноти; семанти-чна та логiчна сумiснiсть; загальт методи пiзнання; методи системного аналiзу; методи математичного моделювання тощо. Набули розвиток програмш про-дукти, що мютять лiнгвiстичнi модулi. Навички робо-ти з ними знадобляться тим, хто навчаеться, як при опануванш навчального матерiалу з рiзних дисциплiн, так i у подальшш практичнiй дiяльностi, у будь-якому шформацшно-мовному середовищi. За результатами вивчення наукових джерел, над проблематикою роз-витку штелектуальних iнформацiйних технологiй пра-цюе багато вiтчизняних науковцiв. В умовах оргашза-навчального процесу з використанням тех^чних

засобiв, зокрема комп'ютерних iнформацiйних техно-логiй виникае ряд теоретичних i практичних питань. Пiдхiд, що лежить в основi створення iнформацiйноi технологи iнтелектуальноi обробки природно-мовноi iнформацii' на основi методу вилучення знань, яю мю-тяться в навчальних контентах. Такий пiдхiд дозволить привести на новий рiвень i концептуально-iнструментальнi засоби, i програмне забезпечення. Створення класу нових iнтелектуальних шформацш-них технологiй, використання яких забезпечить якiсно новий рiвень взаемодп людини i комп'ютерними системами, розвиток нових функцюнальних можливостей цифрових технологш [3].

З розвитком систем автоматизованого на-вчання актуалiзувалася проблема побудови форма-льних моделей, що описують т чи iншi аспекти за-значеноi галузi. Серед них особливо вирiзняються моделi та засоби орiентованi на проведення автоматизованого ощнювання результатiв навчального процесу. Слiд вщзначити, що якщо побудова навчальних контенлв та цiлiсних систем у вщзначенш дь лянцi розробленi достатньо повно, то, власне, автоматизация процеав оцiнювання поки що перебувае на початковому етапi. Мовна система являе собою складну iерархiю рiзнорiвневих комплексiв одиниць, об'ектiв та вщношень.

Для створення та^' методологii необхщно розвинути теоретичнi положення, моделi та методи побудови штелектуальних засобiв, що забезпечать можливють 1'х функцiонування при обмежених обчи-слювальних ресурсах та дозволять адаптуватись до яшсно1' обробки рiзнорiдних лiнгвiстичних даних.

З розвитком теоретичних положень, моделей подання знань i на основi проведених дослiджень запропоновано модель подання знань i здшснено формалiзацiю навчального контенту. Подання знань в формi продукцiй (або правил) забезпечуе форма-льний спосiб запису правильних ршень [3]. На ввд-мiну вiд традицiйних методiв розшзнавання когнгги-вне розпiзнавання текстових об'екпв формалiзуе вилучення i подання знань з предметно1' галузi, яш мгс-тяться в природно-мовному текста Входом процеду-ри розпiзнавання е природно мовний текст, який може бути представлений рiзними мовами. Виходом (результатом) процедури розпiзнавання е поняттева структура тексту. Поняттева структура представляе собою формалiзоване подання знань про свгг (пред-метну галузь), вщбите в певному природно мовному текста

Процес розпiзнавання та вилучення знань з природно-мовного тексту базуеться на моделюванш iнтелектуальних функцiй людини, а саме: на комп'ютерному моделюваннi процесу розумшня лю-диною природно мовного тексту. При цьому термiн "розумшня" визначаеться через такi критерii: вмшня переказати текст "власними" словами, тобто шшими мовними (лексичними, синтаксичними) засобами пе-редати змiст вхвдного тексту; вмшня ввдповюти на за-питання стосовно певного тексту.

Процедура розпiзнавання базуеться на засо-бах формалiзацii' (тобто розробки шаблонних моделей) знань про певну мову i знань про свiт (предме-тну галузь).

3. Мета та задачi досл1дження

Метою дослiдження е аналiз, створення, обгру-нтування та практична реалiзацiя методологiчних засад на основi iнформацiйних iнтелектуальних технологш; створення нових форм представлення и спосо-бiв зберiгання знань (навчального контенту), стратеги активацп та використання знань; створення нових стратегш навчання та вивчення начального матерiалу.

Для досягнення цiеi мети були поставлен такi

задачi:

1. Проаналiзувати iснуючi комп'ютеризованi системи оцiнювання знань, системи комп'ютеризо-вано1' обробки природно-мовно1' iнформацii, яка мае рiзний професшний рiвень тексту, з метою максимь зацii ефективного вивчення матерiалу i отримання нових знань.

2. Дослiдити моделi представлення знань на ос-новi морфемно1' обробки термiнiв предметно1' областi.

3. Побудувати лiнгвiстичну модель подання знань за допомогою прикладного морфаналiзу без словника.

4. Розробити методолопю обробки текстово1' вiдповiдi на основi словника синонiмiв.

5. Обчислити збiги текстових висловiв на ос-новi по елементного розбору мовних одиниць, що дасть можливють порiвнювати граматичнi i лексико-семантичнi текстовi конструкцii.

4. Автоматизащя обробки природно-мовних текстiв

Методологiчною основою проведених досль джень були досягнення наукових нацюнальних шкiл в галузi розробки нових концепцiй i сучасних мето-дологiй. Використовувались для дослщження насту-пнi методи:

- обробки знань, 1'х формалiзацiя та приведен-ня до единого подання; накопичення знань в певнiй предметнiй областц

- перевiрка знань, що мютяться в рiзномовних текстах на функцюнальну повноту, логiчну i семан-тичну сумiснiсть;

- iнтегрування i узагальнення знань з певног' предметног' галузц

- загальнi методи пiзнання (спостереження, порiвняння, класифiкацiя);

- методи системного аналiзу для вивчення предметнох' обласп та розвитку iнформацiйних тех-нологш освiтньоi сфери;

- методи математичного моделювання; створення i поповнення лексиконiв, якi мiстять необхiдну для аналiзу морфологiчну i граматичну шформацш.

В зазначенiй постановцi: як задачi автомати-зацii розпiзнавання i вилучення з природно мовних текслв-знань з предметно! галуз^ вiдомi дослiджен-ня, якi спрямованi на реалiзацiю дiалоговоi пiдтрим-ки. При цьому компоненти комушкацп можуть бути представленi наступними чином: К1, К2,..., Кп; ко-мунiкативний текст (дiалог); процеси вербалiзацii i розумiння; позамовна ситуащя; практичнi цiлi; ко-мунiкативнi цш. Найбiльш фундаментальнi когнiти-внi аспекти мови включають:

- механiзми збер^ання i модернiзацii знань в семантичнш пам'ятi комунiкативного тексту;

- когштивш структури тексту, MexaHi3Mi вер-балiзацiï замислу;

- мехашзми поеднання текстових знань з ког-нiтивною картиною екстралiнгвiстичного контексту спшкування;

- стратегiï досягнення комунiкативних i прак-тичних цiлей через мехашзми управлшня дiалогом.

Когнiтивне розпiзнавання текстових об'екпв мае сво1 особливостi, а саме: на вщмшу вiд дiалогу позамовна ситуацiя (обставини) письмових текспв широкого призначення визначаеться лише знаннями з певноï предметно! галузi; засоби вербалiзацiï цих знань спрямованi на певний рiвень фаховоï шдгото-вки; механiзми поеднання знань в тексл з когнггав-ною картиною свиу полягають у взаемодп представ-лення людиною знань про певну мову та знань про фрагменти реальноï дiйсностi.

Природна мова, як явище iнтелектуальноï д!я-льностi людини е дуже складним об'ектом. Але, ма-ючи формальний опис природно1' мови, його можли-во реалiзувати комп'ютерними засобами i таким чином надшита машину здiбнiстю володгги природ-ною мовою. Алгебро-логiчний апарат, що можна знайти в природнш мовi, дозволить розширити мож-ливосл розроблювача, який займаеться створенням нових шформацшних технологiй. Отже, концептуа-льно-методолопчний пiдхiд до природно1' мови, з математично1' точки зору, дозволяе сприймати ïï як деяку алгебру, а тексти - як формули ще1' алгебри.

При цьому змiст думок можна висловлювати реченнями i текстами, яш розглядатимемо з точки зору 1'х математично1' природи як предикати. Надалi вiдправною точкою в наших мiркуваннях е те, що думки - це предикати. Таким чином, кожне речення виражае деяку функцiю з двiйковим значенням, тобто задае деякий предикат P(x) = А. Незалежною змiнною x данох' функцп буде змшна ситуацiя, за-лежною - ютинна змiнна А . Шсля пiдставлення за-мiсть змiнноï x конкретно! постiйноï ситуацй' x = a задане речення стае ютинним ( А = 1 ) або хибним ( А = 0 ). Це залежить вiд того чи вiдповiдае змiст цього речення ситуацй' a, до я^' воно ввднесено. Нехай змiнна ситуащя в якостi набору x = (x,x2,...,xm)предметних змiнних x,X xm. Будь-яка постiйна ситуацiя x = a мае бути набором а = (а,а,•••,а) деяких предметiв х1 = а, X = а2, хт = ат. Таким чином кожне речення можна вирази-ти деяким предикатом P(x, x ,•••, xm ) = А , що пред-ставляе залежнiсть iстинноï змiнноï А вiд предметних змшних x,x •••,хт. Проте будь-яке речення за

природно-мовною формою вiдрiзняеться вiд матема-тичноï формули тим, що виражае не всю функцш P(x, x ,•••, xm), а тшьки ïï iм'я P . I це так, бо щора-зу, коли людина перетворюе те чи шше речення у вщповвдну до нього думку вона добудовуе його до предиката. При цьому вона додае до нього (як до iм'я предиката) ввдсутш предметнi змiннi. Тiльки ш-сля цього речення стае доступним для розумiння. Та, навпаки, перетворюючи деяку думку у речення, людина виключае з неï' предметш змiннi, що дозволяе

передавати шшим людям не саму думку, а лише и ш'я [3].

Таким чином, алгебра розглядаеться як ш-струмент дослiдження, а не його предмет. Це ефекти-вний зааб математичного подання iнформацii' та розв'язання логiчних завдань для розширення мож-ливостей i пiдвищення ефективносп обробки приро-дно-мовно! iнформацii. Завдяки якостi обробки природно! шформацп можливо спростити процес форма-лiзацi!' мовних одиниць iнформацiйних систем та шд-готовки первинно!' iнформацii до етапу про^шно! реалiзацп' задач [4].

Задача обробки словосполучень математични-ми методами вирiшуеться в такш постановцi:

Метод декомпозицп моделi (М, Р) за набором змшних на множину моделей

«m

I = {( M,

)

ст. е А.к = 1л

засновано на TeopeMi про розкладання. Нехай х1,х2,...,х -змшшпредикату Pix,. x2,...,xj ,... хт), . - ïx значения вщюввдно. Предикат, який вадповадае

вiдношенню M

(Т. ,<7? . .,<7

мае вигляд

Предикат моДелi (м^ ^ ^ , Р^ ^ димо за формулою

.)■ (1)

знахо-

3 ycix отриманих таким чином вадношень ,а2,..та предикатив Рп^_ , (CTl,ст2,...,ст, е А)

складаемо моделi (м^^ , PCTi Стг _ ^ , утворюючи з них систему

I =

\Ы„ „ Р„ „ „)}, ст. е A, k = 1,).

I\ (Tj ,(Т2,.. .,(Tj 5 (Tj ,(Т2,.. .,(Tj / I 5 к ' 5

Необхiдно вiдзначити, що не обов'язково роз-кладати математичну модель за першими ) -змiнними. Цей метод застосовуеться для предиката, визначеного на всьому просторi Um . Використо-вуючи метод декомпозицй' моделей за набором змшних, математичну модель природноï' мови розкладено за набором змшних до необхщних для моделювання мовних одиниць. Основними компонентами знань з точки зору ï\ формалiзованого подання е поняття, вь дношення мiж ними, характеристики понять i вщно-шень, а також модальносп цих характеристик. Отже, обробка вхвдного тексту мае бути спрямованою на виявлення (розпiзнавання) в текстi основних компонент знань i встановлення лопко-семантичних вiд-ношень мiж ними з метою формування поняттевоï' структури змюту вхiдного тексту. Iнформацiя, яка мь ститься в текстових джерелах, може бути поданою рiзними мовами, що обумовлюе необхiднiсть перет-

ворення pi3HOMOBHOÏ вхiдноï iнформацiï до единого ïï подання в 6a3i знань. Воно також е основою i для синтезу опису змюту, який вiдобрaжaеться в формаль зованому подaннi. До формaлiзовaного подання знань висуваються нaступнi вимоги: по-перше, воно мае бути представлено в такому вигляд^ який забез-печить можливють коректно1 логiко-семaнтичноï обробки знань; по-друге, воно мае мютити всю необ-хiдну iнформaцiю для виршення певноï зaдaчi, тобто максимально повно на змютовому рiвнi збертати те-кстове представлення елементiв знань [5].

Представлен методи i моделi обробки тексто-вих фрaгментiв в автоматизованих системах обробки знань дозволили розробити модель визначення реле-вантносп довiльноï вiдповiдi. Нехай S - множина всiх термiв нaцiонaльноï мови. Оскшьки кiлькiсть те-рмiв у мовi не е нескiнченною, множина S е кшце-вою i числовою, а також неупорядкованою:

S = {s : 1 < i < n}, (3)

де s - терм; n - цше число

Подамо сукупнiсть термiв будь-якоï предметно1 гaлузi як множину T . Ця множина - частина множини термiв мови S, а отже мае ва ïï властивосп:

T с S ; T = {t,. : 1 < i < m},

де m - цше число; m < n .

Запровадимо тaкi умовш позначення: p(T) - су-купшсть всiх можливих пiдмножин множини T ; e -елемент шдмножин сукупностi p(T), який нaйбiльш повно ввдповвдае описуваному об'ектовi або ситуаци.

Будемо вважати, що один терм не може бути використаний для опису декшькох об'екпв або ситу-aцiй, тобто e ^ e ■ [6].

1з сукупностi p(T) можна видiлити тaкi пвдм-ножини De, елементи яких характеризуються семан-тичною близькiстю, що вiдповiдaе синонiмiчному зв'язку слiв один з одним: De ç p(T).

Елемент e, щодо якого утвориться множина (синонiмiчний ряд) D, назвемо базовим термом, ш-шi елементи множини De (слова, об'еднаш синош-мiчним зв'язком з базовим термом) - залежними термами [5]. У рамках кожно1 множини De введемо вь дношення мiж його елементами, що позначае наяв-нiсть синонiмiчного зв'язку мiж базовим термом i залежними термами. Позначимо цей зв'язок функщею 0(e, t). На кожнш шдмножиш De вона задае частко-вий порядок, такий що:

t < s ^ в(в, t) < в(в, s) ; Vt e D ; e D . (4)

Цей частковий порядок можна задавати у числовому виглядi вiдобрaженням пари термiв на множину дшсних чисел: в: T х T ^ R,

Тодi для двох довшьних термiв e it можна вказати шльшсний показник 1х синонiмiï:

k = e(e, t); e, t e De,

значення якого знаходиться в iнтервaлi [-1, 1].

Властивосп та обмеження функцiï в(г, t) таш:

1) якщо k = e(e, t) = 1, то терм t е повним си-ношмом терму e ;

2) якщо в(г, t) < в(г, s) , то t < s ; e, t, s e De ;

3) якщо в(г, t) ~e(t,s) > 0, то t < s ; e, t, s e De ;

4) якщо e(e, t) > 0 i e(t, s) = 1, то e(e, s) = e(e, t) ;

Деяш зaлежнi терми з множини De можуть

бути базовими й у множинах De . Це означае наяв-

нiсть непрямого синонiмiчного зв'язку мiж базовим термом множини D i залежними термами множини

De . Установимо вiдповiднiсть мiж термами еталон-

ного визначення i термами вщповщ, спираючись на поняття синонiмiчноï вiдповiдностi термiв, i на осно-вi цiеï вiдповiдностi обчисли не його предмет. Це ефективний зааб математичного подання iнформaцiï та розв'язання логiчних завдань для розширення мо-жливостей i пiдвищення ефективносп обробки при-родно-мовно1 iнформaцiï. Завдяки якостi обробки природноï iнформaцiï можливо спростити процес фо-рмaлiзaцiï мовних одиниць шформацшних систем та падготовки первинноï iнформaцiï до етапу прогрaмноï реaлiзaцiï задач.

Лiнгвiстичнa модель подання та обробки знань на основi синошми термiнiв предметноï гaлузi, яка дозволить оцшити збiг елементiв речень складних конструкцiï, поданих у виглядi природного тексту з довiльною довжиною [6]. Автомaтизaцiя процесу лiн-гвiстичноï обробки iнформaцiï представлена матема-тичною формaлiзaцiею взаемопов'язаною сукупнiстю формальних систем, яш вiдбивaють змiст обробки на кожному рiвнi. Ця сукупнiсть оргашзована у вiдповi-дну iерaрхiчну структуру формальних теорш, рiвнi якоï узгоджеш мiж собою за iнтерфейсом. Теорш i -го рiвня можна представити кортежем: T =< A, Si, P, R >, де A - вхiднa iнформaцiя для i -о1 теорiï, яка може бути представленою в текстовiй форм^ множиною ознак, множиною словникiв i таке iнше; p - множина правил /-о1 теорiï лiнгвiстичноï обробки A, R - результати використання правил p для обробки A, S - формaлiзовaнi синтaксичнi правила подання всiх елеменпв A, P, R .

Множина p в загальному випадку може включати двi групи правил - правила безпосередньо лшгвютично1 обробки i правила використання правил першоï групи. Аналогом прикладу правила друго1 групи може бути правило використання синтаксич-ного правила управлшня. Враховуючи, що елементи множини R в результап iтерaтивного використання правил iз множини p можуть використовуватись в якосп елементiв множини A , в загальному випадку А ПЯ,- Виникае необхщшсть в розробщ шлькох

модифшацш Ту деякоï T,-. Враховуючи специфшу природно-мовних текстiв, характерну для конкретноï предметноï гaлузi, особливостями практичних задач обробки текстовоï iнформaцiï виникае необхщнють незнaчноï змiни правил лшгвютичного aнaлiзу або використання цих правил та змши змiсту iнших складових теорiï T

Загальна теорiя T представляе собою множину {Tj} з визначеним на нiй вщношенням строгого порядку iерaрхiчного тдпорядкування. З iншого боку, теорiя T мае бути представлена як загальна формальна система T=<AT, ST, PT, RT>, де AT - видна шформа-цiя для теорп T, PT - правила використання теорш Ty.

RT - результати виконання правил PT, ST - фо-рмaлiзовaнi синтaксичнi правила "зовшшнього" представления теорiй Ty. Необхiднiсть представлення теорiï T у виглядi формально1 системи обумовлена наступним. По-перше, за наявнютю модифiкaцiй тео-рiï TIнеобхiдно чiтко формулювати правила використання певноï Ty при вирiшеннi конкретних задач. Процес лшгвютичного aнaлiзу в цшому е ггератив-ним, тому необхвдно чiтко формулювати правила використання правил залучення теорiй Ty для обробки шформацп.

В процеа лiнгвiстичних дослщжень створюеть-ся i дослвджуеться на коректнiсть iнформaцiйнa база, яка забезпечуе автоматизащю задач обробки текстово1 iнформaцiï. Ця база може включати рiзного призна-чення словники (словники квазшрефшав, квaзiзaкiн-чень, перекладш словники, словники понять в певнш предметнiй гaлузi, словники службових ^в, тощо) [7], якi гад час експлуатаци вщповщних шформацш-них систем поповнюються. Практичний aнaлiз знакового рiвня оргaнiзaцiï природно-мовного тексту обме-жуеться вiддiленням синтаксичних роздiлових знаюв вщ слова, видiленням aбревiaтур, скорочень тощо.

Для автоматизованого виршення задач оброб-ки природно-мовного тексту суттевим е визначення структури тексту, для виокремлення службовоï шфо-рмaцiï, видiлення абзащв, зaголовкiв. Текст при цьо-му розглядаеться як певним чином оргашзована пос-лiдовнiсть рядк1в i грамем. Розпiзнaвaнням е побудова формaлiзовaного подання грамемно1 структури тексту та розробка формального апарату видiлення i класифь кaцiï текстiв на множинi рядшв i грамем. Загальний алгоритм розтзнавання працюе при наступних обме-женнях на вхщний текст: текст е ввдформатованим по лiвому i правому краям; текст не мютить переноав; текст не мiстить таблиць, малюншв, формул, грaфiч-них символiв; текст може бути поданим aнглiйською, украшською або нiмецькою мовами. Розпiзнaвaння грамемного рiвня подання тексту е побудова графема-тично1 структури тексту, яка включае видiлення на множинi рядшв i грамем вхвдного тексту: фрагменпв (дискурав), речень, синтагм, лексем; визначення типiв (клaсiв) перелiчених одиниць тексту та встановлення вщношень мгж ними [7].

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Результат грамемного aнaлiзу е входною шфо-рмaцiею як для лшгвютичного рiвня тексту (мовнi лексеми, мовш речення), так i для прагматичного ш-терпретатора. Задача автоматизованого aнaлiзу зво-диться до двох пaрaметрiв: якостi, яка визначаеться точнютю (рiвнем помилок в побудованих синтаксич-

них конструкцiях речень, повнота (стутнь покриття синтаксичними зв'язками, або зв'язнють графа речення), i швидкють, яка натепер недостатня для при-кладних задач.

Сутнють процедури розпiзнaвaння полягае у приписуванш кожнiй мовнiй лексемi входного тексту вiдповiдноï змiстовоï шформацп. Така iнформaцiя включае: лексико-грaмaтичнi класи (iменник, прик-метник, чисельник, дiеслово тощо), вiдповiднi цим класам граматичш характеристики (наприклад, для iменникiв - це рщ, число, вiдмiнок), синтаксичш характеристики (еталонна модель передбачена лише для прийменник1в), семaнтичнi характеристики (вони переписуються за певними правилами зi словника морфем i представляють собою вщповвдний нaбiр семантичних ознак, як1 привносять до кореню префь кси i суфiкси, наприклад: розмiр, стан, процесуаль-нiсть тощо). Еталонна модель визначае всi притаман-ш певнiй морфемi характеристики. Потiм здшсню-еться aнaлiз 1х взaемодiï у заданш лексемi, при цьому за допомогою певноï множини правил розв'язання перевiряються набори ознак на суперечливють, сумi-снiсть. Результатом розпiзнaвaння е штегрований на-бiр ознак, ввдповщний певнiй лексемi тексту.

Синтаксичне розтзнавання подшяеться на два етапи. Задачею першого етапу е усунення граматич-но1 омошмп морфологiчного рiвня i побудова слово-сполучень. Об'ектом розпiзнaвaння цього рiвня е за-кономiрностi взaемодiï лексем у межах мовно1 синта-гми. Вхщними даними е результати попередшх ета-пiв розпiзнaвaння та еталонш моделi синтаксичних правил, якi описаш в попереднiх роботах i визнача-ють ознаки синтаксичного з'еднання лексем у слово-сполучення.

Семантичне розпiзнaвaння також подметься на два етапи. Задачею першого етапу е усунення син-таксично1 омонiмiï (якщо вона мае мюце) та форму-вання понять, вщношень i 1х характеристик (власти-востей) в межах одного речення. Крiм того, на цьому еташ проходить зaмiщення анафоричних зв'язк1в (коли замють поняття пiдстaвляеться займенник), узагальнення понять i вiдношень, пропуск1в понять i вщношень, що притаманно природнш мовi. Об'ектами розпiзнaвaння, на вщмшу в^д синтаксичного розпiзнaвaння, е ва речення (а не тшьки мовнi), речення-заголовки, якi пiдлягaють обробщ на другому етaпi семантичного розпiзнaвaння, коли будуеться власне поняттева структура входного тексту.

Вх^дними даними семантичного aнaлiзaторa е результати графемного та синтаксичного розпiзнaвaн-ня, а також еталонш модел^ як1 включають тезаурус понять, тезаурус в^дношень та тезаурус лопко-семантичних в^дношень. Структура тезаурусу, як правило, орiентовaнa на прикладт зaдaчi обробки текспв. Для побудови поняттевоï структури тезаурус визначае таю вщношення: р^д - вид, частина - цше, синошми, асощаци. Цi в^дношення на Випадок грaмaтичноï ба-гaтознaчностi. З формально1 точки зору випадок бага-тозначносп можна записати як: Aj^{Q}, де A - поточ-ний образ (в даному випадку слово або словосполу-чення); i - унiкaльний нaбiр граматичних ознак, який характеризуе A в поточному контексп; Q - множина еталонних зразк1в, як1 п^дходять до A [8].

В природно-мовнш системi граматичну бага-тозначнiсть (омонiмiю) розрiзняють таким чином: омошмш граматичних характеристик словоформ (наприклад: для словоформи дивiзli граматична характеристика числа мае значення однина та множина, граматична характеристика вiдмiнка мае значения: родовий, давальний, мiсцевий для однини, та назив-ний i знахщний для множини); лексико-граматичну омонiмiю, яка виникае на рiвнi лексико-граматичних клаав [8].

Граматична омонiмiя усуваеться за рахунок розроблених еталонних зразкiв синтаксичних зв'язкiв мiж словоформами в реченш (метод декларативного подаиия синтаксичних правил) - правил контекстного сполучення. Правила контекстного сполучення подшяються на правила узгодження, управлiния та прилягання. Розв'язаиия граматичноi омонiмii здшс-нюеться на наступних рiвнях. Так, для граматичноi омонiмii - на рiвень розпiзнаваиня синтаксичних сполук (тобто рiвень словосполучень), для лексико-граматичноi омошми на рiвень розпiзнаваиня синта-ксично! структури речення (тобто рiвень речення). Формально сутнiсть усунення граматично! омошми в рамках правила граматичного узгодження полягае у здшсненш операцii перетинання множин граматичних характеристик словоформ А i В :

(5)

У формалiзованому виглядi правило грамати-чного узгодження можна представити формулою:

Пуг : ® N ^м;, (6)

де ЫА - код лексико-граматичного класу словоформи

A, ЫБ - код лексико-граматичного класу словоформи

B, {О}; - множина граматичних ознак, яш е результатом здшснення операцп узгодження граматичних характеристик для двох словоформ [9].

Лексико-граматична омонiмiя може виникати в результата рiзного подiлу обсяпв понять, визначе-них певним словом або словосполученням. Задача

вибору на множиш рiзних лексико-граматичних кла-сiв одного поняття виникае, наприклад, при автоматичному перекладi з однiеi мови шшою [10].

5. Результата дослвдження

Визначено недолiки iснуючих техиологiй спричинеш недосконалiстю обробки рiзнорiвневоi природно мовно! iнформацii на вiдмiну вiд запропо-новаиоi технологii та технологii обробки знань. Проведено аналiз лггературних джерел, щодо штелектуа-льних шформацшних техиологiй, iнтелектуальних технологiй обробки знань, електронного навчання тощо. Обгрунтовано перспектившсть створення комплексно! методологii штелектуально! обробки знань. Дослiджено теоретико- множину модель представ-лення знань на основi морфемно! обробки термiнiв предметно! обласп за допомогою операцiй над мно-жинами знаюв; побудовано лшгвютичну модель по-дання знань за допомогою прикладного морфаналiзу; розроблено методологш i методи обробки текстово! вщповщ на основi словника синонiмiв; визначено сшвпадшня текстових висловiв на основi по- елемен-тного розбору мовних одиниць.

6. Висновки

1нформацшна техиологiя штелектуально! обробки природно-мовно! шформацп на основi методу обробки знань, яш мiстяться в навчальних текстах дозволять перевести на новий рiвень програмне i прикладне забезпечення. Отримано узагальненi результати проведеного дослвдження, а саме:

1. Проаналiзовано iснуючi комп'ютеризоваиi системи оцiнювання знань, системи комп'ю-теризовано! обробки природно-мовно! шформаци, яка мае рiзний професшний рiвень тексту;

2. Досл^джено моделi представлення знань на основi морфемно! обробки термшв предметно! областi;

3. Запропоновано лiнгвiстичну модель подання знань за допомогою прикладного морфаналiзу без словника;

4. Сформовано методолопчш складовi обробки текстово! вщповщ на основi словника синонiмiв;

5. На прикладах показано яким чином можли-во обчислити зб^и текстових висловiв.

Лiтература

1. Павлов, А. А. Информационные технологии и алгоритмизация в управлении [Текст] / А. А. Павлов, С. Ф.Теле-ник. - К.: Техника, 2002. - 344 с.

2. Дерецкий, В. А. Об одном подходе к обработке естественно-языковых данных на основе анализа семантических сетей [Текст] / В. А. Дирецький // Пращ Першоï мiжнародноï конференци з програмування УкрПРОГ'98. - К.: Юбцентр НАНУ, 1998. - C. 405-411.

3. Шенк, Р. Обработка концептуальной информации [Текст] / Р. Шенк. - М., 1980. - 360 с.

4. Bondarenko, M. F. Algebra of predicatives and predicate operations [Text] / M. F. Bondarenko, Z. Dudar, Y. P. Kushnarenko-Shabanov, V. Chikin, N. T. Protsay, V. Cherkashin // Radioelectronics and Computer Science. - 2005. - Vol. 1. -P. 80-86.

5. Badyorina, L. M. Method of grammatical structure formalization of f natural language [Text] / L. M. Badyorina // Journal of Technical and Natural Sciences. - 2015. - Vol. 7-8, Issue 4. - P. 106-111.

6. Бадьорша, Л. М. Метод кшьюсного оцшювання вщповщей в системах тестування знань [Текст] / Л. М. Бадьорша, I. В. Замаруева // Системний аналiз та шформацшш технологи. - 2011. - № 2. - С. 41-46.

7. Бадёрина, Л. Н. Метод лингвистической обработки текстових ответов в системах тестирования знаний [Текст] / Л. Н. Бадёрина // Управляют машини i системи. - 2011. - № 5. - С. 68-72.

8. Широков, В. А. 1нформацшна теорш та системотехшчш засади комп'ютерноï лексикографп [Текст]: автореф. дис. на ... д-ра техн. наук / В. А. Широков. - К., 1999. - 32 с.

9. Zaitseva, L. Course Development for Tutoring and Training Systems in Engineering Education [Text] / L. Zaitseva, J. D. Zakis // Global Journal of Engineering Education. - 1991. - Vol. 1, Issue 3.

10. Horizons of applied linguistics and linguistic technologies «MegaLing-2009" [Text]: abstracts of the IV International Conf. - Kyiv: UMIF Academy of Sciences of Ukraine, 2009. - 104 p.

Дата надходження рукопису 31.10.2017

Бадьорша Любов Миколавна, доктор техтчних наук, старший викладач, кафедра комп'ютерних наук, Кивський нацюнальний уншерситет культури i мистецтв, вул. £вгена Коновальця, 36, м. Кив, Украша, 01601 E-mail: vada@ukr.net

УДК 539.21 : 541.182

Б01: 10.15587/2313-8416.2017.118801

ИССЛЕДОВАНИЕ ФАЗОВОГО СОСТАВА И ЭЛЕКТРИЧЕСКИХ ХАРАКТЕРИСТИК НАНОКРИСТАЛЛИЧЕСКОГО ОКСИДА ЦИНКА, ЛЕГИРОВАННОГО ПЕРЕХОДНЫМИ МЕТАЛЛАМИ

©А. А. Внуков, А. Н. Головачев, А. В. Белая

Рассмотрены предпосылки использования переходных металлов в качестве легирующих элементов при синтезе нанопорошка оксида цинка. Исследовано влияние легирования никелем, марганцем и кобальтом на фазовый состав и диэлектрическую проницаемость спеченных материалов на основе нанокри-сталлического оксида цинка. Результаты исследований могут быть использованы при разработке эффективных технологий получения современных материалов электротехнического назначения с повышенными эксплуатационными свойствами

Ключевые слова:наноструктурные материалы, нанопорошок оксида цинка, допирование, фазовый состав, диэлектрическая проводимость

1. Введение

Последние годы в материаловедении были ознаменованы появлением большого интереса к наноструктурным материалам [1]. В настоящее время разрабатываются и находят применение различные виды наноструктурных материалов: нанопленки и ге-тероструктуры, наночастицы и кластеры, углеродные наноструктуры, субмолекулярные системы, нано-структурные покрытия, нанопористые структуры и др. [2]. Особое место среди них занимают объемные наноструктурные материалы - поликристаллы с размером зерен порядка 100 нм и менее [3]. Эти материалы имеют уникальные физико-механические свойства, значительно отличающиеся от свойств обычных, крупнозернистых материалов [4].

Одним из наиболее востребованных нано-структурныхматериалов является оксид цинка. Высокий интерес к оксиду цинка связан с уникальными электрофизическими свойствами данного материала. Оксид цинка является широкозонным полупроводником. Он может быть использован в качестве компонента газовых сенсоров, прозрачных полупроводников, солнечных батарей, полупроводниковых и пьезоэлектрических устройств [5].

Оксид цинка это функциональный полупроводниковый материал с уникальными свойствами. Одним из важных направлений исследований оксида цинка является изучение зависимости фазового состава и морфологии его частиц, электрических, оптических и магнитных свойств от условий синтеза и введения различных добавок (допирования). Допирование ионами переходных металлов является пер-

спективным способом регулирования как оптических, так и электромагнитных свойств 2пО.

2. Анализ литературных данных и постановка проблемы

Оксид цинка (2пО) относится к бинарным соединениям типа А11БУ[. Химическая связь между атомами цинка и кислорода является средней между ко-валентной и ионной. В нормальных условиях 2пО имеет гексагональную кристаллическую структуру вюрцита.

Схематическое представление структуры 2пО показано на рис. 1.

Структура 2пО состоит из двух взаимопроникающих гексагонально-упакованных подрешеток. Каждая подрешётка включает в себя четыре атома на первичную ячейку. Каждый атом цинка окружен четырьмя атомами кислорода, которые располагаются в углах тетраэдра, и, соответственно, вокруг каждого атома кислорода располагаются четыре атома цинка. В структуре вюрцита нет центра симметрии. Это обуславливает наличие кристаллографической полярности вдоль оси с. На рис. 1. показано чередование слоев атомов кислорода и цинка вдоль направления оси с.

Такое расположение приводит к возникновению положительного и отрицательного заряда на поверхности плоскостей (0001) и (0001). Свойства материала, такие как скорость травления, кинетика роста, образование дефектов, пьезоэлектрические свойства зависят от его кристаллографической ориентации [6].

Оксид цинка обладает целым комплексом свойств, делающих его чрезвычайно привлекатель-

i Надоели баннеры? Вы всегда можете отключить рекламу.