Научная статья на тему 'Модель та індивідуальні метрики якості наукових публікацій'

Модель та індивідуальні метрики якості наукових публікацій Текст научной статьи по специальности «Экономика и бизнес»

CC BY
163
18
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
наукометрія / бібліометрія / якість / стаття / наукова робота / метрика / аналіз цитованості / важливість статті / scientometrics / bibliometrics / quality / paper / scientific work / metric / citation analysis / article importance

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Субботін С. О.

Проаналізовано відомі метрики наукових публікацій. Встановлено, що їх загальним недоліком є оцінювання статей на зовнішньому по відношенню до їхнього вмісту рівню, що не дозволяє явно судити про якість подання матеріалу статті. Метою даної роботи була розробка комплексу показників, які дозволяють характеризувати властивості наукових праць з точки зору їх структури, лексики та форми подання матеріалу, а також бібліографії. Визначено набір метрик, що дозволяють кількісно оцінювати індивідуальні властивості матеріалу і автоматизувати аналіз наукових публікацій. Запропонований набір містить показники статті: потенціал охоплення читацької аудиторії, структурованість, різноманітність географії, мов та видів джерел бібліографії, якість бібліографії, насиченість тексту посиланнями на джерела, число і цитованість рисунків і таблиць, ілюстрованість, обсяг і використання математичного апарату, ефективність абревіатур, показники лексики статті (відповідність назви тексту, назви та авторської анотації, авторської анотації і тексту, ключових слів і анотації, ключових слів і назви, ключових слів і тексту, ключових і характеристичних слів, анотації та характеристичних слів, назви і характеристичних слів, УДК та лексики статті, опису таблиць та рисунків тексту, відповідності лексики абзаців, назв літературних джерел і тексту), самоцитування авторами статті, якість авторського колективу, гібридні та інтегральні показники якості статті. Наведено приклади, що підтверджують практичну застосовність запропонованих показників.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

MODEL AND INDIVIDUAL QUALITY METRICS OF SCIENTIFIC PUBLICATIONS

The existent metrics of scientific publications has been analyzed. Their common disadvantage is the external evaluation of articles relatively to external level to their content. This obviously does not allow to assess the quality of presentation of the article. The purpose of this paper is to develop a set of indicators to characterize the properties of scientific papers in terms of their structure, vocabulary and forms of presentation, as well as a bibliography. The set of metrics allowing to quantificate the material individual properties and to automate the analysis of scientific publications has been defined. The proposed set includes such paper indices as: potential readership coverage, structuring, diversity of geography, languages and types of bibliographic sources, bibliography quality, text richness by the links to sources, figures and tables number and quotability, Illustrativity, mathematical apparatus volume and the use, abbreviation effectiveness, paper vocabulary indices (compliance of title with text, of title with author’s abstracts, of author’s abstracts with text, of keywords with abstracts, of keywords with title, of keywords with text, of keywords with characteristic words, of abstracts with characteristic words, of names with characteristic words, of UDC with paper vocabulary, of tables and figures descriptions with text, of vocabulary compliance with paragraphs, of references names with text), self-citations of the authors, author team quality, hybrid and integrated indicators of paper quality. The examples confirming practical applicability of the proposed indicators are shown.

Текст научной работы на тему «Модель та індивідуальні метрики якості наукових публікацій»

УДК 001.8:002.01

Субботш С. О.

Д-р техн. наук, професор, професор кафедри програмних засоб1в Запорзького национального технчного унверситету,

Запор1жжя, УкраТна

МОДЕЛЬ ТА 1НДИВ1ДУАЛЬН1 МЕТРИКИ ЯКОСТ1 НАУКОВИХ _ПУБЛ1КАЦ1Й_

Проаналiзовано вiдомi метрики наукових публжацш. Встановлено, що 1х загальним недолiком е оцiнювання статей на зовншньому по вiдношенню до 1хнього вмiсту рiвню, що не дозволяе явно судити про ягасть подання матерiалу статтi. Метою дано! роботи була розробка комплексу показнигав, яга дозволяють характеризувати властивостi наукових праць з точки зору !х структури, лексики та форми подання матерiалу, а також бiблюграфil. Визначено набiр метрик, що дозволяють кiлькiсно ощнювати iндивiдуальнi властивостi матерiалу i автоматизувати аналiз наукових публiкацiй. Запропонований набiр мiстить показники статтi: потенцiал охоплення читацько! аудитор», структурованiсть, рiзноманiтнiсть географи, мов та видiв джерел бiблiографil, якiсть бiблiографil, насиченiсть тексту посиланнями на джерела, число i цитовашсть рисункiв i таблиць, iлюстрованiсть, обсяг i використання математичного апарату, ефектившсть абревiатур, показники лексики статтi (вщповщшсть назви тексту, назви та авторсько! анотаци, авторсько! анотаци i тексту, ключових слiв i анотаци, ключових слiв i назви, ключових ств i тексту, ключових i характеристичних ^в, анотаци та характеристичних ств, назви i характеристичних слiв, УДК та лексики статл, опису таблиць та рисунюв тексту, вiдповiдностi лексики абзащв, назв лiтературних джерел i тексту), самоцитування авторами статтi, ягасть авторського колективу, гiбриднi та штегральш показники якостi статтi. Наведено приклади, що тдтверджують практичну застосовнiсть запропонованих показнигав.

Ключовi слова: наукометрiя, бiблiометрiя, якiсть, стаття, наукова робота, метрика, аналiз цитованостi, важливiсть статтi.

НОМЕНКЛАТУРА

IPP - Impact per Publication; SNIP - Source normalized impact per paper; SJR - SCImago Journal Rank; УДК - Утверсальна десяткова класифжащя; ai(/') - коефщент наукового ступеня i-го автора; a2(i) - коефщент вченого звання i-го автора; a3(i) - коефщент посади i-го автора; a 4(i) - коефщент рiвня оргатзацп, де працюе i-й автор;

a5 (i) - сукупна кiлькiсть посилань на статп i-го автора у наукометричних i реферативних базах;

a5(i) - середнш iндекс Гiрша i-го автора у наукомет-ричних базах;

afr - функщя, що повертае кiлькiсну оцiнку наяв-ностi i-го необхiдного елемента у структур j-i статтi; abstract - словник авторсьюл анотацii j-i статп; abstract - словник i-i анотаци до j-i статтi; abstract. - i-те слово у словнику авторсьюл анотацii j-i статтi;

Area. - обсяг, займаний виданою статтею у см2; auditory(x) - функщя, що повертае ощнку кiлькостi людей, що володжггь мовою x;

autk - iдентифiкатор k-го автора j-i статл; bl - рiк виходу j-i статтi;

b2 - кшьюсть робiт авторiв j-й статтi в у бiблiографii до неi (самоцитування);

b3 - найбiльш раннiй рж джерела у бiблiографii до j-i статп;

b4 - найпiзнiший рж джерела в бiблiографii до j-i статп; Base - набiр наукових праць; cwrds - набiр характеристичних отв j-i статтi; cwrds. - i-те слово з набору характеристичних отв j-i статп;

el - формальне позначення i-го елемента j-i роботи; eq - функщя, що щентиф^е авторство статей;

© Субботш С. О., 2015

figcap - словник тексту вмюту k-го рисунка i його тдпису;

figcaptj - i-те слово в словнику тексту вмгсту k-го рисунка i його тдпису;

geo(ref) - функщя, що повертае географiчний щен-тифжатор видавництва i-го посилання у списку бiблiог-рафii j-i статтi;

iq - q-й показник якостi j-i статп; keywords - словник авторських ключових ^вj-i статтi; keywords. - i-те авторське ключове слово у словнику; lang(ref) - функщя, що повертае щентифжатор мови i-го посилання у списку бiблiографii j-i статп;

lang(x) - функщя, що повертае код мови словника x; maxcit - сума максимальних кшькостей цитувань по всiх базах;

N - кшьюсть статей;

Na - кшьюсть отв у словнику анотацii j-i статп; Nabr - кiлькiсть абревiатур (крiм загальновiдомих) без повторень, використовуваних у j-й статп; Nabt - кшьюсть анотащй у j-й статп; Naui - кiлькiсть авторiв j-i статп; N , - кшьюсть характеристичних отв j-i статтi;

cwrds 11 J 7

N l - кiлькiсть позначень змiнних, констант, нестан-

dmsb 3 3

дартних функцiй i операторiв, використаних у формулах статп i розшифрованих у тексп статтi; Nej.- кшьюсть елеменпв j-i статтi; Nf - кшьюсть нумерованих формул у тексп статп; Ng - кiлькiсть рисунюв у статп;

Nfigcap k - кшьюсть отв у словнику тексту вмiсту k-го рисунка i його тдпису;

N.s - кiлькiсть статей, опублжованих у вiдповiдному номерi журналу;

Nw - кiлькiсть авторських ключових отв у словнику keywords;

N , - кiлькiсть позначень змiнних, констант, нестан-

msb

дартних функцiй i операторiв, використовуваних у формулах статп;

DOI 10.15588/1607-3274-2015-3-4

Nn - юльюсть сл1в у словнику назви j-i статга; Npar. - кшьюсть сл1в у словнику i-го абзацу; Nre. - юльюсть разгв, коли i-те джерело цитувалося у текста j-i статга окремо ввд 1нших джерел;

Nrea - юльюсть раз1в, коли i-те джерело цитувалося у текст j-i статга разом з шшими джерелами;

Nrerisi - юльюсть посилань у текст статга на i-й рисунок; Nretabi - кшьюсть посилань у текста статга на i-ту табли-

цю;

Nref - юльюсть джерел у б1блюграфй до j-i статп; Nris - кшьюсть рисунюв у статга;

Nrfi - юльюсть посилань на i-ту нумеровану формулу в текст! статга;

Nsererisi - юльюсть посилань у текста статга на i-й рисунок;

Nseretabi - кшьюсть окремих посилань у текста статга на i-ту таблицю;

Nserf j - юльюсть окремих посилань на i-ту нумеровану формулу у тексга статга;

Nt - юльюсть сл1в у словнику тексту j-i статга; Ntab - юльюсть таблиць у статга;

Ntabcapk - юльюсть сл1в у словнику тексту вмкту k-i таблиц та ii заголовка;

Nudc - юльюсть сл1в у словнику УДК; N„„j - кшьюсть слш у списку сшв з назв джерел у списку лгтератури;

paper. - j-та наукова праця; par. - словник i-го абзацу; par,p - p-те слово словника i-го абзацу; population - загальна чисельтсть населення Земт; Q - наб1р показниюв, що характеризують властивосга статга;

reab. - юльюсть використань i-i абрев1атури в j-й статга; reaut. - список вдентиф1катор1в автор1в i-го джерела в б1блюграфпj-i статт1;

ref - список сл1в з назв джерел у списку лггератури j-i статга;

ref. - i-те слово з1 списку ств з назв джерел у списку лгте-ратури;

sen - к1льк1сть речень у тексга j-i статга; senre - кшьюсть речень у тексгаj-i статга, що мютить поси-лання на джерела;

syn(v) - функщя, що повертае список сл1в-синошм1в для слова v., а також ixm переклади (з iхнiми синошмами) на вс1 доступн1 мови; t - перiод часу;

tabcap - словник тексту вмкту k-i таблищ та ii заголовка; tabcaph. - i-те слово в словнику тексту вмюту k-i таблищ та ii заголовка;

text - словник тексту статга; text - словник тексту j-i статга;

time - функщя, що повертае рж, том, номер для статга-аргументу;

title - словник назвиj-i статга; title. - i-те слово у словнику title;

type(refi) - функщя, що повертае тип i-го джерела бiблiографii до j-i статга;

UDC - словник текстових розшифровок наведених у j-й статга шдекмв УДК;

UDC. - i-те слово зi словника текстових розшифровок

УДК; .

v - словник;

v. - i-те слово у словнику v;

wfr - ваговий коефщент, що характеризуе важливють i-го елемента структури статга;

year. - рж i-го джерела бiблiографii до j-i статга.

ВСТУП

Посгайно зростаючий обсяг наукових публжащй робить практично неможливим iхнiй аналiз людьми вручну i, вiдпо-вщно, викликае необхiднiсть автоматизацii аналiзу властивос-тей наукових публiкацiй.

Державнi структури (у т. ч. фонди, спещатзоват вченi ради iз захисту дисертащй, атестацiйнi органи), дослiдницькi органi-заци, а також приватнi фонди, що фшансують дослiдження, за-цiкавленi у використанш математичного забезпечення, що доз-воляе аналiзувати значимiсть як окремих пубткащй, так i iхнiх авторгв, органiзапiй авторгв, видань, що у единш системi кри-терiiв дае можливють ои^нити i поргвняти рiзнi дослiдження i дослiдникiв, не затрачаючи значних засобгв i часу на проведен-ня iхньоi спепiальноi експертизи людьми.

Для наукови^в таке математичне забезпечення повинне за-безпечувати можливють пiдтримки прийняття рiшень на вибiр наукових журналiв i конференцiй для опублiкування своiх дослiджень, а також можливють оцiнки i порiвняння характеристик своiх публiкапiй i публжащй колег, що стимулюе кон-куренщю дослiдникiв, iхнiх дослiджень i дослщних органiзапiй.

Для редакций наукових журналгв також необхiдно математичне забезпечення, що дозволяе аналiзувати статику i динам-iку властивостей опублiкованих статей, а також характеризу-вати яюсть розглянутих наукових публiкацiй у единш системi показникiв.

На даний час вщомий ряд показникiв та шструментальних засобiв [1-15], що i iх реалiзують та дозволяють аналiзувати публжацй, якi вийшли, iхнiх авторiв, журнали, а також орган-iзацii за числом посилань на них в iнших публжацях, або за числом завантажень файлгв публiкацiй у мережi Интернет.

Недолiком вiдомих засобгв [1-15] е те, що вони не дозволяють ощнити характеристики наукових праць до iхньоi публь кацй на стадii розгляду редакцiею наукового журналу й обме-жуються гальки посиланнями на статтi / авторгв / органiзацii / журнали, не придiляючи уваги структурi, лексицi i формi подання матерiалу публiкацiй.

Метою дажи статт1 е розробка комплексу показниюв, яю дозволять кiлькiсно характеризувати властивостi наукових праць з погляду на iхню структуру, лексику i форму подання матерiалу, а також враховуватимуть бiблiографiю статей i по-силання на неi в опубткованих джерелах.

1 ПОСТАНОВКА ЗАДАЧ1

Нехай ми маемо набiр наукових праць (статей, тез i т.п.) Base ={paperj}, j = 1, 2, ...., N. Кожну наукову працю будемо розглядати як сукупнiсть текстових i графiчних елементiв paper = { el .}, i = 1, 2, ..., Nd..

Тод1 задача оцшювання якост1 науковоi статт1 полягае у виз-

наченнi набору показник1в Q={ Iq}, що характеризують влас-тивосп статт! paper ..

Показники якосп стат роздшимо на абсолюты - та, що визначеш у виидних одинищх вимру, а також в1дност - та, що ствв1днесет з1 значеннями в1дпов1дних показниюв шших статей.

На основ! кожного абсолютного показника якосп статей, опублжованих за визначений перюд (визначаеться роком, томом, номером / випуском) у журнал^ визначи-мо, вщповщно:

- вщносний показник якосп номер1в (випусюв) журналу за перюд /:

га

I,д = ,

] гч '

де середнш показник якосп номер1в (випусюв) журналу за перюд /:

—а 1

I = £ {(Га )\Чте(1а) е /}.

- нормований показник якосп номер1в (випусюв) журналу за перюд /:

jqt - J qt

~ qt =_,

I qt - J qt

де Iqt - мшмальний показник якостi HOMepiB (випускiв) журналу за перюд t:

Jqt =

min

{Iq | time(iq) e t}

7 ■

7=1,2,..., Ns

Itp - максимальний показник якосп HOMepiB (випускiв) журналу за перюд t:

Iqt = max {Iq | time(Iq) e t}.

j ■

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

7=1,2,..., Ns

2 Л1ТЕРАТУРНИЙ ОГЛЯД

Вiдомi показники [1-15], що характеризують науковi публжацп, можна подiлити на дeкiлька груп: метрики на piвнi статей, метрики на piвнi жуpналiв, метрики на piвнi автоpiв.

Метрики на piBm статей характеризують властивостi окремих статей. Найбшьш широко використовуваними метриками дажй групи е: кiлькiсть цитувань статл у пeвнiй базi публiкацiй (чим бiльшe стаття цитуеться, тим вона вважаеться важлившою), кiлькiсть завантажень файлу статл з певжй бази (чим бшьше завантажень статтi, тим вона вважаеться щкавшою i важливiшою), PageRank -кiлькiсна величина, що характеризуе «важливють» публь кацiï в мepeжi 1нтернет або базi щубшкацш, яка визначаеться за вхвдним посиланнями з урахуванням того, як сильно вони рекомендують розглянуту публiкацiю (чим бшьше е посилань на публжащю, тим вона вважаеться бшьш важливою, а ïï вага визначаеться з урахуванням ваг посилань, переданих сторшками, що посилаються). Метрики дажй групи оперують винятково кiлькiстю посилань або завантажень статей без урахування вмюту, його структу-ри, обсягу, форми i якостi подання. Вони дають лише зовшшню оцiнку використання матepiалу статтi в цшо-

му, не дозволяючи охарактеризувати ïï властивосл i зро-бити аналiз умюту.

Метрики на piвнi жуpналiв [13-15] характеризують набip статей, опублiкованих в одному жуpналi за визначений перюд. Найбшьше широко використовуваними метриками дажй групи е: базовi метрики (кшьюсть статей, опублжованих у жуpналi за певний пepiод, кшьюсть цитувань статей, опублжованих у жуpналi за певний пе-piод, середня кiлькiсть цитувань статей, опублiкованих у жуpналi за певний пepiод), iмпакт-фактоp, iндeкс опера-тивностi, напiвжиття цитувань, SNIP, SJR, IPP.

1мпакт-фактор - чисельний показник важливосл на-укового журналу, що розраховуеться за базою Thomson Reuters за визначений часовий перюд як в^ношення юлькосл посилань на статл журналу за рж визначення iмпакт-фактоpа до кiлькостi посилань на статл журналу за декшька (часлше два-чотири) попepeднiх роки (чим вище iмпакт-фактоp, тим сильнiшe вплив статей журналу на iншi статтi за даний пepiод). Переваги iмпакт-фак-тора: велике охоплення науковоï лiтepатуpи базою Thomson Reuters, публiчнiсть, простота у pозумiннi i використант, як правило, бiльш жорстка система резен-зування у жуpналiв з високим iмпакт-фактоpом. Недо-лiки iмпакт-фактоpа: нeвизначeнiсть i нeоднозначнiсть взаемозв'язку юлькоста цитувань i якостi конкpeтноï статл, висока залежтсть iмпакт-фактоpа вiд часового штерва-лу, за який вш визначаеться, велика залeжнiсть iмпакт-фактора вiд обсягу i частоти статей у конкретнш областi науки, непрозорють i монополiзацiя процесу розрахун-ку iмпакт-фактоpа, вплив суб'ективноï думки експерпв при вiдбоpi видань, iндeксованих базою, нepiвномipнe охоплення видань piзних крат i на piзних мовах [13-15].

Зведений 1мпакт-фактор (aggregate impact factor) - ввдно-шення кiлькостi цитат для вих жуpналiв у предметнш об-ластi до числа статей з уах жуpналiв у предметнш областа (чим бiльшe його значення, тим бiльшe середня кшьюсть цитат статей у визначенш пpeдмeтнiй обласп) [14, 15].

1ндекс опepативностi (immediacy index) - кшьюсть цитувань статей журналу за даний рж, подшена на кшьюсть статей, опублжованих у даному pоцi (чим вище значення даного шдексу, тим опepативнiшe цитуються статтi, що публiкуються) [14, 15].

Натвжиття цитувань (dted half-life) - середнш вж статей, що цитувалися щороку, зокрема у Journal Citation Reports, тобто кшьюсть роюв, що безпосередньо пере-дують року розрахунку iндeксу з його урахуванням, на яю приходиться половина цитованих статей з даного журналу у рощ розрахунку шдексу, а шша половина - цита-ти статей за попередш до цього перюду роки (чим вище значення даного шдексу, тим довше цитуються опубль кованi статтi) [14, 15].

Вплив публжацп (IPP) - кшьюсть цитувань за заданий рж наукових праць, опублжованих за три попередшх роки, подiлeна на кiлькiсть наукових статей, опублжованих за цi ж три роки [1].

SNIP (нормований вплив джерела на статтю) визна-чаеться як вщношення сepeдньоï кiлькостi цитувань статей, опублжованих у жуpналi, до частки потенщалу ци-тування i середнього потенщалу цитування статей iз пред-мeтноï областi журналу, де потенщал цитування областi

визначаеться як середня довжина списюв л^ератури в областг SNIP вишрюе вплив контекстного цитування за допомогою зваження цитувань, заснованого на загальнш юлькост цитувань у предметнш областi. Вплив одного цитування одержуе бшьше значення в тих предметних областях, де цитування бувають рщше i навпаки [14, 15].

SJR - це кшьюсть зважених цитувань, отриманих у за-даному рощ, статей, опублiкованих у заданому журналi за три попереднiх роки, подшене на загальну кшьюсть статей, опублжованих у журналi за три попередтх роки. SJR - ]шра наукового впливу журналiв, що враховуе як кшьюсть цитувань, отриманих журналом, так i важливiсть або престиж журнал!в, звщкшя отриманi цитування [2-5].

Власний фактор (eigenfactor) журналу в заданому рощ визначаеться як вщсоток зважених цитат, отриманих журналом у заданому рощ, статей, опублжованих за п'ять попередшх роюв, в!д загального числа цитувань, отри-маного вмма журналами в базi даних. При цьому не вра-ховуються цитати, отриманi журналом, для якого визначаеться власний фактор [6].

Вплив статл (Article Influence) визначаеться як частка вщ дiлення Eigenfactor на вщсоток умх статей, зареестро-ваних у Journal Citation Reports, що були опублжоват в заданому журнал! [6].

Загальним недолiкрм метрик дажи групи е iхня неза-стосовшсть для окремих статей, для неопублжованих робгт, що знаходяться на розгляд^ для окремих учених.

Метрики на р!вт авторiв характеризують вплив ав-тор!в на науковi публжацп, що наявнi у базi. До метрик дажи групи вщносяться: базовi метрики (сума вiдношень юлькост цитувань статей до юлькост авторiв статей, середня кшьюсть автор!в статл, середня кшьюсть цитувань на автора у рж, середня кшьюсть статей на автора), h-шдекс, g-iндекс та i-шдекс й ш. iндекси, визначеш на iхнiй основ!.

1ндекс Прша (h-шдекс) - кшьюсна характеристика продуктивноси вченого, групи вчених, науковоi оргаш-зацii або краiни у щлому, заснована на юлькост публь кацш i юлькосп цитувань цих публжацш: учений мае шдекс h, якщо h з його N статей цитуються як мшмум h раз!в кожна, у той час як (N-h) статей, що залишилися, цитуються не бшьш, шж h раз!в кожна, тобто вчений з шдексом h опубл!кував h статей, на кожну з яких посла-лися як мшмум h раз!в. Переваги шдексу Прша: чим вище шдекс Прша, тим бшьше публжацш написав учений i тем бшьше на них е посилань. Недолжи шдексу Прша: його залежшсть вщ виду, обсягу й охоплення ви-користовуваноi бази публжацш, залежшсть вщ способу тдрахунку (з урахуванням i без урахування самоциту-вання) [7, 13-15].

1ндекс Еггха (g-шдекс) - юльюсний показник для ви-м!рювання науковоi продуктивности що розраховуеться

на 0CH0Bi розподiлу цитувань, отриманих публжащями вченого для заданого набору статей, вщсортованого у порядку убування юлькост цитувань, що одержали щ статтi, тобто g-iндекс - це найбшьшпе число, таке, що g самих цитованих статей одержали (сумарно) не менше g2 цитувань. Колективний шдекс g1 визначають за набором вчених, впорядкованому за убуванням !хшх g-шдекмв, як (ушкальне) найбiльше число, таке що верхш g1 дослiдникiв мають у середньому як мiнiмум g-iндекс g1. Перевагою g-шдексу е те, що вш спрямований на пол-iпшення на й-шдексу, надiляючи великою вагою високо цитоваш статтi. Недолiком g-iндексу е його непристосо-ванiсть до ситуацп, коли середне кiлькiсть цитувань для вшх опублiкованих робiт перевищуе загальну кшьюсть опублжованих робiт [8-10].

I-шдекс - чисельна характеристика публiкацiйноi ак-тивностi науковоi органiзацii, що розраховуеться на ос-новi розподiлу шдексу Гiрша вчених з даноi науковоi органiзацii: наукова органiзацiя мае шдекс i, якщо не менш i учених з цiеi органiзацii мають й-шдекс не мен-ший за i [11, 12].

Загальним недолжом метрик даноi групи е те, що вони не враховують характеристики вмюту статтi, якiсть його подання.

Узагальнюючи результати аналiзу усiх вiдомих шдекив можна дiйти висновку, що iхнiм загальним недо-лiком е ощнювання статей на зовнiшньому стосовно iхнього вмiсту рiвнi. Це не дозволяе явно судити про яюсть подання матерiалу статтi, а також визначати рiвень статтi за вiдсутностi доступу до конкретних баз наукових публ-iкацiй. Крiм того, вiдомi метрики е сильно залежними вiд обсягу i ширини охоплення наукових публжацш викори-стовуваними базами, iхньоi мови.

Тому представляеться необх^ним розробити комплекс шдив^альних метрик якостi для автоматизацп ана-лiзу наукових публжацш, що дозволяють усунути вщзна-чеш недолiки вiдомих метрик.

3 МАТЕР1АЛИ I МЕТОДИ

Пiд словником текстового фрагменту v={vj} будемо розумгги набiр слiв v, що мютяться у текстовому фраг-ментi, поданих у нормалiзованiй формi (наприклад, iмен-ники i прикметники в одниш i називному вiдмiнку, дiесло-ва - у невизначенш формi й одниш i т.п.) без повторень.

Також визначимо на основi словниюв мов syn(v,) -функщю, що повертае список слiв-синонiмiв для слова v., а також iхнi переклади (з iхнiми синошмами) на всi доступнi мови.

Ключовим аспектом будь-я^ публiкацii е ii дос-тупнiсть для читачiв.

Потенщал охоплення читацькоi аудиторп при необме-женому доступi до статтi визначимо за формулою:

1 Nabst

auditory(lang (text)) +--^ {Na t ■ auditory (lang (abstract')) | lang (abstract') ^ lang (text)}

I

NtN,

aud i

trabst ,=1

j population

де ощнку розмiру аудиторп носпв кожноi мови auditory(x) можна одержати з [16].

Запропонований показник буде приймати значення в дш-пазонi [0, 1]: чим бГльше буде його значення, тим стаття буде бiльш доступною за мовою для погенщйно бiльшоï читацькоï аудиторп.

Вiдповiдно до iстоpично сформоважй практики написання наукових статей i ïï вщображенням у вимогах ведучих наукових видавництв свiту [17] структура статей повинна мютити низку обов'язкових елеменпв, явну вiдсутнiсть яких варто розгляда-ти як недолгк форми подання результат дослiджeнь. Кiлькiсно виразити вiдповiднiсть структури статт вимогам пропонуеть-ся за допомогою показника якосп стpукIуpованостi статтi:

N„

str str

Z wr ai

IStr = i=1

J Nsr

Z w

i=1

str

де 0 < wstr < 1, 0 < aStr < 1.

У найпpостiшому випадку функци astr можуть повертати значення «1 » за наявност в стат i-го елемента i значення «0» - за його ввдсутносп. При бшьш складнш iз програмютсь^ точки зору peалiзацiï функцiï astr можуть також визначати неявне наведення в статп ведомостей, що вщносяться до i-го необхадного елемента структури, явно не зазначеного у нш, i повертати число в дiапазонi ввд нуля до одинищ.

Пропонуеться визначати функцй astr програмним способом, а

вщповщт ïм ваги wfr для елеменпв статт - вГдповГдно до табл. 1.

Запропонований показник буде приймати значення в дГа-пазот [0, 1]: чим бшьше буде його значення, тим бГльш яюс-ною за структурою е стаття, тобто тим бГльше вона ввдповщае вимогам [17].

Таблиця 1 - Основш елементи структури статл i 1хш ваги

Елемент структури статп wf

1ндекс УДК чи iншоï системи класифжаци наукових публiкапiй 1

Назва статт англшською мовою 0,9

Назва статт шшою мовою 0,1

Анотащя англшською мовою 0,9

Анотащя шшою мовою 0,1

Ключов! слова англшською мовою 0,9

Ключов! слова шшою мовою 0,1

Автори й оргашзаци англшською мовою 0,9

Автори й оргашзаци шшою мовою 0,1

Номенклатура (перелж позначень i скорочень) 0,1

Вступ 1

Постановка задач! (проблеми) 0,9

Мета роботи 0,1

Огляд лгтератури 1

Експерименти 1

Результати 1

Обговорення 1

Висновки 1

Подяки 0,1

Список л1тератури мовою оритшалу 0,9

Транслирований список лгтератури (якщо наведений тшьки один список уа джерела в якому подаш латиницею, то вважаеться, що транслирований список наявний у статт!) 0,1

Матер!али i методи 1

1нш! п!дрозд!ли (маеться на уваз! наявн!сть одного i бшьш п!дрозд!л!в, з назвами, в!дсутн!ми в дан!й таблиц!) 0,8

Важливою iнфоpмацiею про зв'язок статтi з шшими роботами, що дозволяе також оцшити piвeнь пошфор-мованостi автоpiв про piвeнь науки у ввдповвднш пред-мeтнiй областi, е наведена у нш бiблiогpафiя.

Показник розмаиоси гeогpафiï джерел бiблiогpафiï визначимо як:

Ibib geo =

J = N.

1

ref

\JN:f geo(ref )

Nref > 0.

Запропонований показник буде приймати значення в дiапазонi (0, 1]: його значення буде тим бшьше, чим piзноманiтнiшe мюця розташування видавництв джерел, наведених у бiблiогpафiï.

Показник розмаиосп мов джерел бiблiогpафiï:

I

bib lang _ J ='

1

N

ref

\Nflang (ref, )

N.

f > 0.

Запропонований показник буде приймати значення в дiапазонi (0, 1]: його значення буде тим бшьше, чим piзноманiтнiшe мови джерел, наведених у бiблiогpафiï.

Показник розма^осп видГв джерел у бiблiогpафiï до j-ï статтi пропонуеться визначати за формулою:

Kf

1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

8

= 8 F

f bi \ Z{1| type(ref ) = k} > 01 M=1

де type (refi ) бере значення: 1 - стаття у журнал!, 2 - тези доповвд на конфepeнцiï чи стаття (роздш) у книзГ, 3 -книга, 4 - документ про штелектуальну власшсть (патент на винахщ або авторське сввдоцтво), 5 - дисертащя або автореферат, 6 - електронний ресурс, 7 - стандарт, 8 -шш1 види джерел.

В вдеалГ стаття повинна цитувати ус! основш види наукових джерел. У цьому випадку коефщент розма^оста видГв джерел буде приймати значення «1». Чим менше буде значення даного коефщента, тим менше рГзноман-ггних видГв джерел приведено в бГблюграфп. У найпршо-му випадку (за ввдсутносп бiблiогpафiï як такоï) коефщГент дорГвнюватиме нулю.

Показник якост бiблiогpафiï j-ï статт визначимо за формулою:

(

jbib = IJ

Nref - b2 J langIf ge0KT

N ref 2 (b4 - b3 ) + b - b4 )

Л

f N.

ref

Z yeari - Nrefb3 i=1

N t \

ref

1 - e 2 - b. 1 + e 2

Запропонований показник буде приймати значення в дГапа-зош [0, 1): його значення буде тим бшьше, чим ближче до року виходуj-ï стат найтзтша публжагця у бГблюграфи, чим бшьше даапазон охоплення публжацш, чим бшьш рГзноманггними е гео-графш видавцГв, мови i роки виходу пубткащй, чим бшьшою е юльюсть публжацш у бГблюграфи, чим бшьш рГвжмрним за строками видання е публiкапiï в бГблюграфи.

х

Показник насиченосп тексту стат посиланнями на джере-ла задамо як:

( Nr

cit = senre 1 j

sen

ef

\

Z Nret i=1

Nref

z{n + N )

¿_, V rei ^ reci)

, sen >0.

i=1

Показник якосп цитування буде приймати значення у д!а-пазон [0, 1]: його значення буде тим бiльше, чим бiльшою буде в аналзованш стат частка речень, що мiстять посилання на джерела, а також чим бшьшою буде частка окремих поси-лань на джерела у загальнш кшькосп посилань у текст!

На основi запропонованих показниюв якостi бiблiографii i насиченосп тексту стат посиланнями на джерела визначимо пбрид-ний показник якосп бiблiографii i И використань у текст! стагтi:

jbc = jbib г cit Ij ~Jj Jj .

Запропонований показник буде приймати значення в д!апа-зош [0, 1): його значення буде тим бшьше, чим ближче до року виходу j-i статтi найшзшша публжащя у бiблiографii, чим бшьшим е дiапазон охоплення пубткацш, чим бшьш р!зноман-пними е географ1я видавцiв, мови i роки виходу пубткацш, чим бшьшою е юльюсть пубткацш у бiблiографii, чим бшьш р1вном!рним за строками видання е публжацл в бiблiографii, чим бшьшою буде в анатзованш статп частка речень, що мстять посилання на джерела, а також чим бшьшою буде частка окремих посилань на джерела у загальнш кшькосп посилань у текст!

Поряд з бiблiографiею про р1вень подання матерiалу стат може сввдчити ii шюстративний апарат, що мктить таблицi i рисунки.

Показник кшькосп i цитовносп рисунюв визначимо за формулою:

jris = j =

(i -N ■ Y 1 - e ris

- N

1

Nri

Л

1 + e

(л N ■(

N

Z{1 \Nrerisi > 0}

ris i=1

N

sererisi

Nris i=1

0, Nns = 0.

N

reris i

Y

Nrerisi > 0

Nris > 0,

Запропонований показник буде приймати значення в д!апазош [0, 1): його значення буде тим бшьше, чим бшьше рисунюв е у стат, чим б!льшою е частка рисунюв, на як! у текст! стат е посилання, а також чим бшьше посилань у текст! стат наведено на кожен рисунок окремо.

Показник обсягу i цитовносп таблиць:

jtab = j

1 - e

-N,b Y

1 + e

1

N a

\

N

Z {1 \Nretabi > 0}

tab i=1

Nab (

Nt

tab i=1

0, Ntab = 0.

N

seretabi

N

retab i

Y

N

retab

>0

Ntab > 0,

//

Запропонований показник буде приймати значення в д!апазош [0, 1): його значення буде тим бшьше, чим бшьше таблиць е у стат, чим бшьшою е частка таблиць, на як! в текст! стат е посилання, а також чим бшьше посилань у текст! стат наведено на кожну таблицю окремо.

Показник шюстрованосп стат пропонуеться визна-чати за формулою:

Ij = 0,5( j + jb).

Запропонований показник буде приймати значення в д!апазош [0, 1): його значення буде тим бшьше, чим бшьше шюстрацш (рисунюв i таблиць) е у статл, чим бшьшою е частка шюстрацш, на як! в текст! стат е посилання, а також чим бшьше посилань у текст! стат наведено на кожну шюстращю окремо.

За умови реал!запл програмжй оцшки фактичжй площ!

у см2, займажа шюстращями у стат, Areaj доцшьно ви-користовувати показник, що визначаеться формулою:

I

ilvol = Area'j

Area

Area>0.

j

Запропонований показник буде приймати значення в д!апазош [0, 1]: його значення буде тим бшьше, чим бшьше частка площ!, займаноi шюстращями, у площ! статп.

На основ! запропонованих показниюв визначимо пбридний показник шюстрованосп стат:

Iilh = Iil I ilvol

Важливою складовою будь-яил науковоi статп е ii нотащя i математичний апарат.

Показник обсягу i використання математичного апа-рату статп пропонуеться визначати за формулою:

Ieq = • j л

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(л -Nf Y 1 - e f

" -N7

1 + e f

Nf

1 "f — Z {1 \Nrfi > 0}

Л

N

f i=1

Nf (

1 Nf

N

N

serf i

f i=1

0, Nf = 0.

N

rfi

Y

Nrfl > 0

s j

N dmsb N msb

Nf > 0,

Запропонований показник буде приймати значення в д!апазош [0, 1): його значення буде тим бшьше, чим бшьше в текст! стат нумерованих формул, чим на бшьше число нумерованих формул е посилань у текст! статл, чим бшьше частка окремих посилань на кожну формулу у загальнш кшькосп посилань на формули, а також чим бшьше використаних нестандартних позначень розшиф-ровано у текст! стат.

Значну шформащю про р!вень i зм!ст науковоi стат несе ii лексика.

Показник ефективносл введених абрев!атур у j-й стат визначимо за формулою:

х

х

X

X

X

1

X

labb,

Na,

Nu

Nreabr i=1 0 Nreabr = 0,

Z{reabi | reabi > 2},Nreabr > 0;

N,

N abr

reabr = Z reabi • i=1

Даний показник буде приймати значення в дГапазот [0, 1]: чим бшьше буде його значення, тим бшьш обгрунтованим е використання введених абревГатур уj-й стат.

Вадповадтсть назви тексту стат визначимо за допомогою показника:

Nn

Int. =-Z {11 syn (titlei ) n text Ф 0 }.

j N

Nn i=1

Цей показник буде приймати значення в дГапазош [0, 1]: чим бшьше буде його значення, тим бгльше лексика назви вщпо-ввдае тексту стат.

Вадповадтсть назви стат автоpськоï анотаци стат визначимо за допомогою показника:

1

Nn

*na ■ - » г -Z{11 syn(titlei ) n abstract Ф 0}.

j N . , n i =1

Даний показник буде приймати значення в дГапазот [0, 1]: чим бшьше буде його значення, тим бгльше лексика назви вщпо-вщае лексищ анотаци стат.

Вадповадшсть автоpськоï анотаци тексту статт визначимо за допомогою показника:

1

Na

Iat =-Z{11 syn(abstracti) n text Ф 0}.

j N

a i=1

Цей показник буде приймати значення в дГапазош [0, 1]: чим бшьше буде його значення, тим бГльше лексика авторсь-ffiiï аногацiï вщповщае тексту стат.

Вадповадтсть авторських ключових сл1в i анотацiïj-ï статт можливо оцшити за допомогою показника:

Ika -'

1

Nu

j Nk

Z{11 syn(keywordSi) n abstract Ф 0}.

kw i=1

Даний показник буде приймати значення в дГапазот [0, 1]: чим бшьше буде його значення, тим бшьше видшених автором ключових сл1в або ïхнiх синоим1в чи перекладГв зустрГчаеться в текст! автор^кй анотацiï до статт.

Вадповадшсть авторських ключових сл1в i назвиj-ï статл можливо оцшити за допомогою показника:

Ikn -■

1

Nu

j N,

Z{11 syn(keywordsi ) n title Ф 0}.

kw i=1

Даний показник буде приймати значення в дГапазот [0, 1]: чим бшьше буде його значення, тим бшьше видшених автором ключових сл1в або ïхнiх синоим1в чи перекладГв зустрГчаеться в текст! назви стат.

Вадповадтсть авторських ключових ств i текстуj-ï стат можливо оцшити за допомогою показника:

Ikt =

j N,

Z{1| syn(keywordsi ) n text Ф 0}.

kw i =1

Даний показник буде приймати значення в дГапазот [0, 1]: чим бшьше буде його значення, тим бшьше видшених автором ключових сл1в або ïхнiх синоим1в чи перекладГв зустрГчаеться в текст! стат.

Автори не завжди вдало обирають ключовГ слова. Частко-во це можна пояснити халатним вщношенням або нерозумш-ням призначення ключових сл1в слугувати для пошуку статл у базах публжацш.

Визначимо характеристичне слово як таке слово або його синонм чи переклад, що е одним з найбгльш частих у стат, або таке слово, що дозволяе вГдокремити дану статтю вГд подГбних ш за тематикою. Характеристичт слова можуть видГлятися без учасп людини за допомогою частотного анализу лексики статей, а також кластеризаци бази статей. Характеристичт слова можуть частково збггатися з авторськими ключовими словами i, чим бгльше таких збшв, тим краще автор видшив ключовГ слова.

ВщповГдтсть видшених автором ключових слГв, характери-стичним словам статт пропонуеться оцшювати за формулою:

Ikc

1

Nu

Nk

Z{11 syn(keyworsdi ) n cwrds Ф 0}.

kw i=1

Даний показник буде приймати значення в дГапазот [0, 1]: чим бшьше буде його значення, тим бшьше авторських ключових сл1в або ïхнiх синоим1в чи перекладГв зустрГчаеться серед характеристичних сл1в статт.

Аналопчно, вадповадшсть автоpськоï аногацiï характерис-тичним словам стат пропонуеться ощнювати за формулою:

Iac

1

N„

Nc-

"Z{1| syn(abstracti ) n cwrds Ф 0}.

' cwrds i=1

Даний показник буде приймати значення в дГапазот [0, 1]: чим бшьше буде його значення, тим бшьше характеристичних сл1в статл або ïхнiх синошм1в чи перекладГв зустрГчаеться в текст! автоpськоï аногацiï до статт!, тобто тим можливо вдаль ше обрана лексика анотацiï автором.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Вадповадтсть назви i характеристичних сл1в j-ï статт пропонуеться оцшювати за допомогою показника:

1

Nn

Inc =-Z{11 syn(titlei) n cwrds Ф 0}.

j N ■ , n i =1

Даний показник буде приймати значення в дГапазош [0, 1]: чим бшьше буде його значення, тим бшьше сл1в назви або ïхнiх синошмГв чи перекладГв зустрГчаеться серед характеристичних сл1в стат.

Вадповадтсть УДК лексищ стат пропонуеться оцшювати за допомогою показника:

1

Nu

IUDC

j N,

Z{11 syn(UDCi)

UDC i=1

n (title u abstract u keywords u text) Ф 0},

словник UDC може бути склад ений на основ! [18].

Даний показник буде приймати значення в дГапазош [0, 1]: чим бшьше буде його значення, тим бшьше слГв з

1

1

розшифровок шдекив УДК або ïxhix синон1М1в чи пере-кладiв зустр!чаеться серед слiв статп.

Ввдповщшсть опису таблиць тексту статп пропонуеться визначати за формулою:

( n..^ \

I,

1

tab j

j n,

-Z

tab k=1

1 N N tabcapfc

- Z {11 syn(tabcapk i ) n text * 0}

Ntabcapk i=1

Даний показник буде приймати значення в дiапазонi [0, 1]: чим бшьше буде його значення, тим бшьше сл!в з тексту i заголовюв таблиць зустрiчаеться серед ств стат.

Вщповвдшсть опису рисунюв тексту статтi пропонуеться визначати за формулою:

I

1

fig

j N

Z

fig k=1

N«g ( 1 Nfjgcapk ^

N- Z{11 syn(fjgcaPk,i) n text * 0}

N fjgcaPk j=1

Даний показник буде приймати значення в дiапазонi [0, 1]: чим бшьше буде його значення, тим бшьше сл!в з тексту i шдпис1в до рисунюв зустрiчаеться серед ств статп.

Показник вщповщносп лексики i-го i k-го абзащвj-ï статл визначимо як:

1

Np

1 par , (j>k) = N- Z{11 syn(Pari,p) n Park * 0}

N parj p=1

Даний показник буде приймати значення в дiапазонi [0, 1]: чим бшьше буде його значення, тим бшьш однаковою е лексика вщповщних абзащв.

Узагальнений показник ввдповвдносп лексики назв лттера-турних джерел лексищ тексту стат визначимо за формулою:

Irtj =

1

N

wref

Nw

Z {11 syn(ref ) n text * 0}.

wref i=1

Даний показник буде приймати значення в дiапазонi [0, 1]: чим бшьше буде його значення, тим бшьше сл1в з назв б!блюг-рафiчних джерел, ïxHix синонм!в i перекладiв зустрiчаеться серед ств статп.

Показник самоцитування авторами статп визначимо за формулою:

IscJ

1

N,

ref

N

Z]1

ref i=1

( Nu Л

Z{11 eq(autk,reauti)} > 0 J k=1

де функця, що iдентифiкуе авторство статей, eq повертае значення «1», якщо обидва аргумента вдентифжують одного й того ж автора, «0» - у шшому випадку.

Показник якосп авторського колективу статл визначимо як:

( 1 - e-2z^

1 Qaut.

1 + e"

-2z

1 N aut

=1Z

6

i=1

((i) +a2(i) + a3(i)a4(i))fa5(l) + a6(i>

3 Y

maxcit

//

де а1(/'): 1 - доктор наук (хабшгтований), 0,5 - кандидат наук / доктор фшософи, 0,1 - мапстр наук, iнженер, 0 - шше; а2(/): 1 - професор, 0,5 - доцент / асоцшований професор, 0 - шше;

a3(i): 1 - президент, вще-президент, ректор, проректор, декан, заст. декана, завiдувач кафедри, начальник ввддшу, професор, 0,5 - доцент, науковий ствробгтник, 0,1 - асистент, iнженер, фах1вець, 0 - iнше; a4(i) : 1 - унверситет, шститут, 0,5 - ко-ледж, теxнiкум, 0,1 - шдустр1я, 0 - шше.

1нтегральний показник якосп науковоï статл визначимо на основ! показникiв, що характеризують окремi ïï властивосл:

IQ} = (IaudjlQaut/f )0,5(j + (1 -1 c j )) X

0,2(Ij + j + Iabbj + Itabj + Ifigj ) X

x0,09(Inti + Inaj + IatJ + haj + IknJ + + Iktj + Ikcj + Iac + Incj + IUDC j + Irtj ).

Даний показник буде приймати значення в дiапазонi [0, 1]: чим бшьше буде його значення, тим вищою буде яюсть подан-ня матерiалу i лексичний взаемозв'язок елеменпв статтi.

4ЕКСПЕРИМЕНТИ

Для експериментального дослiдження запропонованих по-казникiв була розроблена комп'ютерна програма, що автоматично визначае розроблеш показники для статл, подажй у вигляд! окремого файлу на диску.

Для розрахунюв використовувався матерiал даноï статтi. У табл. 2 наведет деяю вихвдт характеристики стат.

5 РЕЗУЛЬТАТИ

Для дажй стат за допомогою розробленого програмного забезпечення визначенi значення показниюв, запропонованих у данш робота, що наведет у табл. 3.

Як видно з табл. 3, запропонован показники дозволяють ха-рактеризувати властивосп наукових праць з погляду на ïxню структуру, лексику i форму подання матерiалу, а також бiблiографiю.

6 ОБГОВОРЕННЯ

У пор!внянН з вщомими показниками, що вiдбивають лише властивосп статей на зовтшньому до ïxнього матерiалу р!вН [1-15], запропонованi показники дозволяють юльюсно оцшю-вати iндивiдуальнi властивосп матерiалу, що дозволяе явно судити про яюсть подання матерiалу, а також автоматизувати аналiз наукових пубткацш ВИСНОВКИ

У робот вирiшено завдання автоматизапiï аналiзу якосп наукових пубткацш за допомогою розробки математичного забезпечення для чисельного ощнювання якосп наукових публiкацiй.

Наукова новизна отриманих результата полягае у тому, що вперше запропонована модель якосп наукових пубткацш, що являе собою наб!р метрик, як! дозволяють юльюсно оць нювати вдивщуальш властивосп матер!алу й автоматизувати анатз наукових пубткацш. Запропонований наб!р мютить так! показники стат: потенщал охоплення читацькоï аудиторп, структуровашсть, розмаïтiсть географiï, мов i вид!в джерел бiблiографiï, яюсть б!блюграфи, насичетсть тексту посиланнями на джерела, кшьюсть i цитовашсть рисунюв i таблиць, шюстроватсть, обсяг i використання математичного апарату, ефектившсть абрев!атур, показники лексики статп (ввдповвдшсть назви тексту, назви - авторсьюй анотацп, ав-торськ1й анотацiï - тексту, ключових сл!в - анотацiï, ключових сл!в - назв!, ключових сл!в - тексту, ключових i характерис-тичних сл!в, анотацiï i характеристичних сл!в, назви i характе-

z

Таблиця 2 - Вихщш характеристики статп

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Таблиця 3 - Показники якост статп

Показник Значения

Ъ\ 2015

Ъг 0

Ь3 2005

Ъ4 2014

Nref 18

a1(i) 1

a2(i) 1

a3(i) 1

a,4(0 1

a,5(i) 558

a6(i) 4

Ъ2 0

Ъ3 2005

Ъ4 2014

maxcit 30000

Na 10

Nahr 4

Natst 3

Naut 1

Nref 18

f 0

Ntai 3

Nr 0

N reabr 11

Nr 0

Nref 18

Nt 587

Na, 3

population 7-109

Nkw 10

Nn 6

Nudc 20

Nwref 93

sen 212

senre 20

Показник Значення

1aud j 0,0193

jstr 0,98667

тЫЪ geo 1j 0,5

тЫЪ lang j 0,111111

KTj 0,375

тЫb 1 j 0,0027

TCit 0,008359

тЪс 2,2572-10-5

iris 0

itйЪ j 0,90515

iil 0,45257

Teq j 0

hMj 0,2727

1 ntj 0,8333

Tna j 0,8333

1 atj 0,8279

Tac 0,7895

Tkaj 0,7

Tknj 0,4

Tncj 0,5714

1ktj 0,8

1kcj 0,5

Iudc] 0,4737

^йЪ j 0,9

IfigJ 0

0,4625

IscJ 0

TQautj 0,01037

2,08398T0-5

ристичних сл1в, УДК i лексики статп, опису таблиць i рисунюв -тексту, вiдповiдностi лексики абзацев, назв лггературних дже-рел - тексту), самоцитування авторами статтi, яюсть авторсь-кого колективу, гiбриднi й штегральш показники якостi статтi. Розроблеш показники дозволяють характеризувати власти-восп наукових праць з погляду на !хню структуру, лексику i форму подання матерiалу, а також бiблiографiю.

Практична цiннiсть отриманих результатiв полягае у роз-робленому програмному забезпечент для автоматизацй роз-рахунку запропонованих метрик.

Перспективи подальших дослщжень полягають у тому, щоб iнтегрувати розрахунок запропонованих показникiв до нау-кометричних баз, дослiджувати можливi взаемозв'язки запропонованих i вщомих бiблiометричних показникiв на великому масивi публжащй, вивчити можливий взаемозв'язок запропонованих показниюв i експертних ощнок якостi статей рецен-

зентами-людьми, що е провiдними фах^вщми у ввдповвдних областях науки. ПОДЯКИ

Робота виконана у межах держбюджетно! науково-дослвдно! теми Запор1зького национального техничного ушверситегу «1нге-лекIуальнi шформацшт технологи автоматизацй проектування, моделювання, керування i дiагностування виробничих процеав i систем» (номер держ. реестраци 0112U005350) при частковiй шдтримщ мiжнародного проекту «Центри передового досвiду для молодих учених» програми «Темпус» Свропейсько! Комюй (№ 544137-TEMPUS-1-2013-1-SK-TEMPUS-JPHES). СПИСОК Л1ТЕРАТУРИ

1. Moed H. F. Measuring contextual citation impact of scientific journals / H. F. Moed // Journal of Informetrics. - 2010. - Vol. 4, Issue 3. - P. 265-277. DOI: 10.1016/j.joi.2010.01.002

2. González-Pereira B. A new approach to the metric of journals' scientific prestige: The SJR indicator / B González-Pereira, V. P. Guerrero-Bote, F. Moya-AnegYn // Journal of informetrics. -2010. - Vol. 4, Issue 3. - P. 379-391. DOI: 10.1016/ j.joi.2010.03.002

3. Guerrero-Bote V. P. A further step forward in measuring journals' scientific prestige: The SJR2 indicator / V. P. Guerrero-Bote,

F. Moya-Anegуn // Journal of Informetrics. - 2012. - Vol. 6, Issue 4. - P. 674-688. DOI: 10.1016/j.joi.2012.07.001

4. Butler D. Free journal-ranking tool enters citation market /

D. Butler // Nature. - 2008. - Vol. 451, Issue 6. - P. 6. D0I:10.1038/451006a.

5. Falagas M. E. Comparison of SCImago journal rank indicator with journal impact factor // M. E. Falagas, V D. Kouranos, R. Arencibia-Jorge, D. E. Karageorgopoulos // The FASEB Journal. - 2008. -Vol. 22, Isuue 8. - P. 2623-2628. D0I:10.1096/fj.08-107938.

6. Bergstrom C. T. The Eigenfactor Metrics / C. T. Bergstrom, J. D. West, M. A. Wiseman // Journal of Neuroscience. - 2008. -Vol. 28, Issue 45. - P. 11433-11434.

7. Hirsch J. E. An index to quantify an individual's scientific research output // Proceedings of The National Academy of Sciences. -2005. - Vol. 102, № 46. - P. 16569-16572. D0I:10.1073/ pnas.0507655102.

8. Egghe L. Theory and practise of the g-index / L. Egghe // Scientometrics. - 2006. - Vol. 69, № 1. - P. 131-152. D0I:10.1007/s11192-006-0144-7.

9. Woeginger G. J. An axiomatic analysis of Egghe's g-index /

G. J. Woeginger // Journal of Informetrics. - 2008. - Vol. 2, Issue 4. - P. 364-368. D0I:10.1016/j.joi.2008.05.002

10. Tol R. S. J. A rational, successive g-index applied to economics departments in Ireland / R. S. J. Tol // Journal of Informetrics. -2008. - Vol. 2, Issue 2. - P. 149-155. D0I:10.1016/ j.joi.2008.01.001.

11. Kosmulski M. I - a bibliometric index / M. Kosmulski // Forum Akademickie. - 2006. - Vol. 11. - P. 31.

12. Prathap G. Hirsch-type indices for ranking institutions' scientific research output // Current Science. - 2006. - Vol 91, Issue 11. -P. 1439.

13. Игра в цыфирь, или как теперь оценивают труд ученого Сборник статей о библиометрике). - М. : МЦНМО, 2011. - 72 с.

14. Цыганов А. В. Краткое описание наукометрических показателей, основанных на цитируемости // Управление большими системами : c6. тр. Спец. вып. 44 - Наукометрия и экспертиза в управлении наукой / [под ред. Д. А. Новикова, А. И. Орлова, П. Ю. Чеботарева]. - М. : ИПУ РАН, 2013. - С. 248-261.

15. Штовба С. Д. Обзор наукометрических показателей для оценки публикационной деятельности ученого / С. Д. Штовба,

E. В. Штовба // Управление большими системами : c6. тр. Спец. Вып. 44 - Наукометрия и экспертиза в управлении наукой / [под ред. Д. А. Новикова, А. И. Орлова, П. Ю. Чеботарева]. - М. : ИПУ РАН, 2013. - С. 262-278.

16. List of languages by total number of speakers [Electronic resource]. -Access mode: https://en.wikipedia.org/wiki/ List_of_languages_by_total_number_of_speakers.

17. Рекомендации EASE (Европейской ассоциации научных ре- www.ease.org.uk/sites/default/files/ease_guidelines-june2014-

дакторов) для авторов и переводчиков научных статей, кото- russian.pdf

рые должны быть опубликованы на английском языке [Элект- 18. The UDC Summary [Electronic resource]. - Access mode: http:/

ронный ресурс]. - 16 с. - Режим доступа: http:// /www.udcc.org/udcsummary/php/index.php?lang=ru&pr=Y

Стаття надшшла до редакци 04.02.2015.

Субботин С. А.

Д-р техн. наук, профессор, профессор кафедры программных средств Запорожского национального технического университета, Запорожье, Украина

МОДЕЛЬ И ИНДИВИДУАЛЬНЫЕ МЕТРИКИ КАЧЕСТВА НАУЧНЫХ ПУБЛИКАЦИЙ

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Проанализированы известные метрики научных публикаций. Установлено, что их общим недостатком является оценивание статей на внешнем по отношению к их содержимому уровне, что не позволяет явно судить о качестве представления материала статьи. Целью данной работы являлась разработка комплекса показателей, позволяющих характеризовать свойства научных работ с точки зрения их структуры, лексики и формы представления материала, а также библиографии. Определен набор метрик, позволяющих количественно оценивать индивидуальные свойства материала и автоматизировать анализ научных публикаций. Предложенный набор включает показатели статьи: потенциал охвата читательской аудитории, структурированность, разнообразие географии, языков и видов источников библиографии, качество библиографии, насыщенность текста ссылками на источники, число и цитируемость рисунков и таблиц, иллюстрированность, объем и использование математического аппарата, эффективность аббревиатур, показатели лексики статьи (соответствие названия тексту, названия и авторской аннотации, авторской аннотации и текста, ключевых слов и аннотации, ключевых слов и названия, ключевых слов и текста, ключевых и характеристических слов, аннотации и характеристических слов, названия и характеристических слов, УДК и лексики статьи, описания таблиц и рисунков тексту, соответствия лексики абзацев, названий литературных источников и текста), самоцитирование авторами статьи, качество авторского коллектива, гибридные и интегральные показатели качества статьи. Приведены примеры, подтверждающие практическую применимость предложенных показателей.

Ключевые слова: наукометрия, библиометрия, качество, статья, научная работа, метрика, анализ цитируемости, важность статьи.

Subbotin S. A.

Dr.Sc., Professor, Professor of department of software tools, Zaporizhzhya National Technical University, Zaporizhzhya, Ukraine MODEL AND INDIVIDUAL QUALITY METRICS OF SCIENTIFIC PUBLICATIONS

The existent metrics of scientific publications has been analyzed. Their common disadvantage is the external evaluation of articles relatively to external level to their content. This obviously does not allow to assess the quality of presentation of the article. The purpose of this paper is to develop a set of indicators to characterize the properties of scientific papers in terms of their structure, vocabulary and forms of presentation, as well as a bibliography. The set of metrics allowing to quantificate the material individual properties and to automate the analysis of scientific publications has been defined. The proposed set includes such paper indices as: potential readership coverage, structuring, diversity of geography, languages and types of bibliographic sources, bibliography quality, text richness by the links to sources, figures and tables number and quotability, Illustrativity, mathematical apparatus volume and the use, abbreviation effectiveness, paper vocabulary indices (compliance of title with text, of title with author's abstracts, of author's abstracts with text, of keywords with abstracts, of keywords with title, of keywords with text, of keywords with characteristic words, of abstracts with characteristic words, of names with characteristic words, of UDC with paper vocabulary, of tables and figures descriptions with text, of vocabulary compliance with paragraphs, of references names with text), self-citations of the authors, author team quality, hybrid and integrated indicators of paper quality. The examples confirming practical applicability of the proposed indicators are shown.

Keywords: scientometrics, bibliometrics, quality, paper, scientific work, metric, citation analysis, article importance.

REFERENCES

1. Moed H. F. Measuring contextual citation impact of scientific journals, Journal of Informetrics, 2010, Vol. 4, Issue 3, pp. 265277. DOI: 10.1016/j.joi.2010.01.002

2. Gonzál ez-Pereira B., Guerrero-Bote V. P., Moya-Anegyn F. A new approach to the metric of journals' scientific prestige: The SJR indicator, Journal of informetrics, 2010, Vol. 4, Issue 3, pp. 379391. DOI: 10.1016/j.joi. 2010.03.002

3. Guerrero-Bote V. P., Moya-Anegyn F. A further step forward in measuring journals' scientific prestige: The SJR2 indicator, Journal of Informetrics, 2012, Vol. 6, Issue 4, pp. 674-688. DOI: 10.1016/ j.joi.2012.07.001

4. Butler D. Free journal-ranking tool enters citation market, Nature, 2008, Vol. 451, Issue 6, pp. 6. D0I:10.1038/451006a.

5. Falagas M. E., Kouranos V. D., Arencibia-Jorge R., Karageorgopoulos D. E. Comparison of SCImago journal rank indicator with journal impact factor, The FASEB Journal, 2008, Vol. 22, Isuue 8, pp. 2623-2628. DOI: 10.1096/fj.08-107938.

6. Bergstrom C. T., West J. D., Wiseman M. A. The Eigenfactor Metrics, Journal of Neuroscience, 2008, Vol. 28, Issue 45, pp. 11433-11434.

7. Hirsch, J. E. An index to quantify an individual's scientific research output. - Proceedings of The National Academy of Sciences,

2005, Vol. 102, No. 46, pp. 16569-16572. DOI:10.1073/ pnas.0507655102.

8. Egghe L. Theory and practise of the g-index, Scientometrics,

2006, Vol. 69, No. 1, pp. 131-152. DOI:10.1007/s11192-006-0144-7.

9. Woeginger G. J. An axiomatic analysis of Egghe's g-index, Journal of Informetrics, 2008, Vol. 2, Issue 4, pp. 364-368. DOI: 10.1016/ j.joi.2008.05.002

10. Tol R. S. J. A rational, successive g-index applied to economics departments in Ireland, Journal of Informetrics, 2008, Vol. 2, Issue 2, pp. 149-155. D01:10.1016/j.joi.2008.01.001.

11. Kosmulski M. I - a bibliometric index, Forum Akademickie, 2006, Vol. 11, P. 31.

12. Prathap G. Hirsch-type indices for ranking institutions' scientific research output, Current Science, 2006, Vol 91, Issue 11, P. 1439.

13. Igra v cyfir', ili kak teper' ocenivayut trud uchenogo (cbornik statej o bibliometrike). Moscow, MCNMO, 2011, 72 p.

14. Cyganov A. V. Kratkoe opisanie naukometricheskix pokazatelej, osnovannyx na citiruemosti, Upravlenie bol'shimi sistemami : cb. tr. Spec. vyp. 44 — Naukometriya i e'kspertiza v upravlenii naukoj, [pod red. D. A. Novikova, A. I. Orlova, P. Yu. Chebotareva]. Moscow, IPU RAN, 2013, pp. 248-261.

15. Shtovba S. D., Shtovba E. V. Obzor naukometricheskix pokazatelej dlya ocenki publikacionnoj deyatel'nosti uchenogo, Upravlenie bol'shimi sistemami : cb. tr. Spec. vyp. 44 — Naukometriya i e 'kspertiza v upravlenii naukoj, [pod red. D. A. Novikova, A. I. Orlova, P. Yu. Chebotareva]. Moscow, IPU RAN, 2013, pp. 262-278.

16. List of languages by total number of speakers [Electronic resource]. Access mode: https://en.wikipedia.org/wiki/ List_of_languages_by_total_number_of_speakers.

17. Rekomendacii EASE (Evropejskoj associacii nauchnyx redaktorov) dlya avtorov i perevodchikov nauchnyx statej, kotorye dolzhny byt' opublikovany na anglijskom yazyke [E'lektronnyj resurs], 16 p. Rezhim dostupa: http://www.ease.org.uk/sites/default/files/ ease_guidelines-june2014-russian.pdf

18. The UDC Summary [Electronic resource]. Access mode: http:// www.udcc.org/udcsummary/php/index.php?lang=ru&pr=Y

i Надоели баннеры? Вы всегда можете отключить рекламу.