Научная статья на тему 'Сравнительный анализ статистических программных продуктов для квалификационной экспертизы сортов растений на пригодность к распространению'

Сравнительный анализ статистических программных продуктов для квалификационной экспертизы сортов растений на пригодность к распространению Текст научной статьи по специальности «Прочие технологии»

CC BY
144
8
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СИСТЕМА ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ / КВАЛИФИКАЦИОННАЯ ЭКСПЕРТИЗА / ПРИГОДНОСТЬ СОРТОВ К РАСПРОСТРАНЕНИЮ / УСЛОВНЫЙ СТАНДАРТ / СТАТИСТИЧЕСКИЕ МЕТОДЫ В СЕЛЕКЦИИ / ДИСПЕРСИОННЫЙ АНАЛИЗ / КЛАСТЕРНЫЙ АНАЛИЗ / R / IBM SPSS STATISTICS

Аннотация научной статьи по прочим технологиям, автор научной работы — Лещук Н.В., Мажуга К.М., Орленко Н.С., Стариченко Е.М., Шкапенко Е.А.

Цель. Определить статистические методы и инструментальные средства (пакеты прикладных программ) для создания системы поддержки принятия решения (СППР) квалификационной экспертизы сортов на пригодность их к распространению (ПСР) в разрезе задач обработки данных. Обосновать выбор программных средств обработки статистических данных полевых и лабораторных исследований, которые входят в состав квалификационной экспертизы на ПСР. Методы. Аналитический, основанный на сравнении методов описательной и многомерной статистики и средств интеллектуального анализа данных, полученных при проведении квалификационной экспертизы на ПСР. Сравнительный анализ программных средств обработки статистических данных для подготовки предложений по окончательному решению по заявке на сорт растений. Результаты. Проведена декомпозиция задач, которые входят в состав системы поддержки принятия решений по квалификационной экспертизе сортов-кандидатов на ПСП. Проведено сравнение статистического пакета SPSS, пакета анализа, который входит в состав MS Excel и языка программирования R по критериям: удобство интерфейса, функциональность, качество представления результатов расчетов, наглядность графической информации, стоимость программного средства. Оба пакета широко применяются в мире для статистической обработки данных, имеют аналогичный состав функций для расчета статистик. Выводы. Выделены задачи ПСР, которые рекомендуется решать с применением исследуемых средств. В качестве инструментального средства целесообратно использовать язык программирования R. Основным преимуществом R по сравнению с пакетом IBM SPSS Statistics является то, что R программный продукт с открытым кодом, который свободно распространяется.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по прочим технологиям , автор научной работы — Лещук Н.В., Мажуга К.М., Орленко Н.С., Стариченко Е.М., Шкапенко Е.А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Comparative analysis of statistical software products for the qualifying examination of plant varieties suitable for dissemination

Purpose. To define statistical methods and tools (application packages) for creating the decision support system (DSS) for qualifying examination of plant varieties suitable for dissemination (VSD) in the context of data processing tasks. To substantiate the selection of software for proces­sing statistical data relative to field and laboratory investigations that are included into the qualifying examination for VSD. Methods. Analytical one based on the comparison of methods of descriptive and multivariate statistics and tools of intellectual analysis of data obtained during qualifying examination for VSD. Comparative analysis of software tools for processing statistical data in order to prepare proposals for the final decision on plant variety application. Decomposition of tasks was carried out which were included into the decision support system for qualifying examination of varieties-candidates for VSD. Results. Statistical package SPSS, analysis package included in MS Excel and programe language R was compared for the following criteria: interface usability, functionality, quality of calculation result presentation, visibility of graphical information, software cost. The both packages were widely used in the world for statistical data processing, they have similar functions for statistics calculation. Conclusion. Tasks of VSD were separated and recommended to tackle using investigated tools. Programe language R was a product recommended to use as a tool. The main advantage of R as compared to the package IBM SPSS Statistics is the fact that R is an open source software.

Текст научной работы на тему «Сравнительный анализ статистических программных продуктов для квалификационной экспертизы сортов растений на пригодность к распространению»

УДК 004.4'2: 631.526.3 https://doi.Org/10.21498/2518-1017.13.4.2017.117757

Пор1вняльний анализ статистичних програмних продуклв

• а • • w •• •

для квал1ф1кац1йно1 експертизи сорлв рослин на придатн1сть до поширення

Н. В. Лещук*, К. М. Мажуга, Н. С. Орленко**, £. М. Стариченко, £. А. Шкапенко

Укратський институт експертизи copmie рослин, вул. Генерала Родимцева, 15, м. Kuib, 03041, Украина, e-mail: nadiya1511@ukr.net*, n.s.orlenko@gmail.com**

Мета. Визначити статистичн методи та 1'нструментальт засоби (пакети прикладних програм) для створення сис-теми тдтримки прийняття ршення (СППР) квал1ф1кац1Йно'1 експертизи сорлв рослин на придатн1'сть до поширення (ПСП) у розр131 завдань оброблення даних. Об^рунтувати виб1р програмних засоб1в оброблення статистичних даних польових та лабораторних достджень, що входять до складу квал1'фкац1'йно1 експертизи на ПСП. Методи. Анал1'тичний, який ^рунтуеться на пор1внянн1 метод1в описовоТ та багатовим1рно1 статистики й засоб1в 1нтелектуального анал1зу даних, отриманих тд час квал1'фкац1'йноТ експертизи на ПСП. Пор1вняльний анал1з програмних засоб1в оброблення статистичних даних для тдготовки пропозифй щодо к1'нцевого ршення за заявкою на сорт рослин. Результати. Проведено декомпозицш завдань, що входять до складу системи т'дтримки прийняття ршень з квал1'фжац1йноТ експертизи сорлв-кандидалв на ПСП. Проведено пор1вняння статистичного пакета SPSS, пакета анал1зу, що входить до складу MS Excel, та мови програмування R за критер1ями: зручнкть 1нтерфейсу, функфональтсть, яккть представлен-ня результалв обчислення, наочтсть графтчно'Т 1нформац1Т, варткть програмного засобу. Обидва пакети широко засто-совують у свтп для статистичного оброблення даних, вони мають аналопчний склад функфй для обчислення статистик. Висновки. Виокремлено завдання ПСП, що рекомендовано виршувати 1з застосуванням достджуваних засоб1в. Як 1нструментальний зааб рекомендовано використовувати мову програмування R. Основною перевагою R пор1вняно з пакетом IBM SPSS Statistics е те, що R е програмним продуктом з вщкритим кодом, який в1льно поширюеться.

Ключов1 слова: система т'дтримки прийняття piшень, квалiфiкацiйна експертиза, придатнкть сорmiB до поширення, умовний стандарт, cmаmиcmичнi методи в селекцп, дисперайний аналiз, кластерний аналiз, R, IBM SPSS Statistics.

Вступ

ним завданням. Це зумовлюе актуальшеть створення еиетеми шдтримки прийняття

Створення, поширення та комерщйний р1шень з проведення квал1ф1кащйно'1 екс-o6ir нових сорив рослин е одним i3 значу- пертизи сорив, анал1зу найб1льш придат-щих чинникiв забезпечення продовольчо! них метoдiв та iнструментальних засoбiв об-безпеки Украши. Тому формування нащо- роблення даних квалiфiкацiйнoi експертизи. нальних сортових ресурив е досить актуаль- Одним з важливих завдань планування __та аналiзу даних експертизи е застосування

Nadiya Leschuk

http://ordd.org/0000-0001-6025-3702 Kostiantyn Mazhuha

http://orcid.org/0000-0002-1434-8687

статистичних метoдiв i пакепв оброблення результатiв спостережень i дoслiдiв та ¿х ш-терпретацiя. Встановлено iнструментальнi засоби, що е найб1льш придатними для засто-

Nataliia Orknko сування та включення до системи п1дтримки

http://orcid.org/ 0000-0003-0494-206 прийняття р!шення (СППР ПСП). Результа-

Yevhen Starychenko ти дoслiдження про!люстровано на прикладi

http://orcid.org/0000-0001-8608-5268 статистичного оброблення даних польових та

Yevhenia Shkapenko лабораторних дослвджень сорпв-кандидапв

http://orcid.org/0000-0002-8600-1543 со'1 культурно* (Glicine max (L.) Merrill).

issn 2518-1017 Рьлшт Varieties Studying ftnd Protection, 2017, Vol. 13, no 4 429

1нформац1'йн1' системи i технологИ'

Мета дослгдженъ - визначити та об^рун-тувати наб1р метод1в статистичного анал1зу та шструментальних засоб1в (пакепв прик-ладних програм) для створення СППР ква-л!фшащЁно*1 експертизи на придатшсть сорив для поширення. Визначити наЁдощль-шш! методи статистичного анал1зу для об-роблення даних квал!фшащЁно*1 експертизи та об^рунтувати виб1р програмних засоб1в оброблення статистичних даних польових та лабораторних дослвджень, що входять до складу квал1ф1кащЁно'1 експертизи на придатшсть сорив для поширення.

Материали та методика досл1*джень

Статистичш методи та шструментальш за-соби пор1внювали шд час оброблення даних квал1ф1кащЁно*1 експертизи сорпв-кандида-т1в на ПСП за перюд 2014-2016 рр. ввдповвд-но до методики [1].

Територ1альна неоднорвдшсть дослвдних д1лянок за 1'рунтово-кл1матичними умовами року дослвдження у ввдповвдшЁ зош виро-щування створюе передумови для об^рунту-вання однорвдносп та достов1рност1 отрима-них даних з використанням метод1в описо-во! статистики та диспериЁного анал1зу [2]. При цьому розраховують так показники: середня врожаЁшсть, коригуючиЁ фактор, сума квадрапв розиювань (загального, пов-торень, вар1ант1в, залишку), розиювання, фактичне значення критерпо Фныера, наЁ-менша гстотна р1зниця (Н1Р), ввдносна по-хибка дослвду, значення меж дов1рчого интервалу ввдповвдно до загальноприЁнятих метод1в.

Кластеризащя е лог1чним продовженням процедури класифшаци, розв'язання завдань класифшаци мають виявити групи сорив рос-лин, наЁб1льш под!бш м1ж собою, що охоп-люють як сорти-кандидати для включення до Реестру сорив рослин Украши поточного року, так i сорти, внесен! до Реестру за остан-ш п'ять рок!в ввдповвдно до Положення про ДержавниЁ реестр сорив рослин, придатних для поширення в Укра1Ш.

Розрахунки було проведено з використан-ням пакета анал!зу, що входить до складу електронно! таблиц! Excel, мови програму-вання R та тестово! верси статистичного пакета IBM SPSS Statistics 22 (trial version).

IBM SPSS Statistics - програмниЁ пакет, якиЁ використовують для логачного статистичного анал!зу великих обсягав даних [4-6]. Нин! цеЁ програмниЁ продукт належить компани IBM.

R е безкоштовним програмним середови-щем з ввдкритим кодом, що перебувае у в1ль-

ному доступ!. Середовище R мгстить широ-ку гаму статистичних метод!в, функщЁ та граф!чних шструменпв [7, 8]. На ввдмшу в1д б^ьшосп комерщЁних статистичних програм, R не мае кнопково-вшонного штерфеЁсу, користувач мае знати необхвдш для роботи функци та синтаксис мови програмування. Для зручшшо! роботи користувача з R роз-роблено граф!чш штерфеЁси (GUI).

Результати досл1'джень

В!дпов!дно до методики проектування !н-формащЁних систем (1С), р!зновидом яко! е система шдтримки приЁняття р!шень (СППР), було проведено декомпозиц!ю комплексу завдань ПСП та проанал!зовано при-датн! для застосування статистичн! методи та алгоритми моделювання. Дан! анал!зу наведено в таблиц! 1.

Таблиця 1

Анал1'з метод1'в та алгоритм1*в, що е придатними для оброблення даних

Назва завдання

0бл1'к та анал1'з господарсько-ц'нних ознак сорп'в рослин

Анал1'з на однор1'дн1'сть результат'в дост'дження в межах природно-клтматично'! зони

0блж та анал1'з даних лабораторних дост'джень_

Анал1'з на однор1'дт'сть результат'в дост'дження за роки дост'дження

Класифкац'я сорт1'в-кандидат1'в з урахуванням умовного стандарту для показника врожайносп та анал1'з в1'дпов1'дност1 сорт1'в-кандидат1'в за критерием «середня врожайт'сть», напрям використання b розраху-ванням дов'рчого интервалу

Метод або алгоритм

Методи описово'1 статистики

Дисперс'йний аналЬ

Методи описово'1 статистики

Дисперс'йний аналЬ

Кластерний

анал!з

Оцшювання на придатшсть для MS Excel, IBM SPSS Statistics та R було зд!Ёснено п!д час виконання розрахунк!в !з розв'язання трьох тишв описаних вище завдань за такими критер!ями: як!сть !нтерфеЁсу користу-вача (usability) [9]; функцюнальшсть; яшсть представлення результат!в обчислення; наоч-шсть граф!чно! шформаци; вартгсть про-грамного засобу.

Результати розрахуншв (приклад типових звшв однофакторно! диспериЁно! модел! з повтореннями) наведено в таблицях 2-3.

Шсля знаходження гстотно! р!знищ зд!Ё-снюють апостерюрне тестування коефщ!ен-т!в для анал!зу р!знищ м1ж ознаками (уро-жаЁносп залежно в1д метролоичних умов поточного року в раЁош розмщення пунк-т!в випробування, в яких проведено дослвди).

430

issn 2518-1017 Plant VftRIETIEs studying лло protection, 2017, т. 13, №4

Ta6nuu,n 2

TecT BHyîpiwHbocyô'eKTHMX e$eKTi*B (Test of Within-Subjects Effects)

Measure (Bmmi'p): Harverst (ypoœaém'cTb)

Type III Sum df Mean Squaree F SLg

Source (flœepeëo) of Squares Hwc.no cTynern'B Cepeflm'é KpiiTepié ÉMOBl'pHl'CTb

CyMa KBaflpaiiB Tiny III CBOÖOflM KBaflpaT Ôiwepa HynbOBOi nnoTe3M

Sphericity Assumed 1,12 3 0,37 3,99 0,14

Factor 1 Greenhouse-Geisser 1,12 1,00 1,12 3,99 0,29

Lower-bound 1,12 1,00 1,12 3,99 0,29

Sphericity Assumed 14,41 9 1,60 17,15 0,02

Factor 1 * Point Greenhouse-Geisser 14,41 3,00 4,81 17,15 0,17

Lower-bound 14,41 3,00 4,81 17,15 0,17

Sphericity Assumed 0,28 3 0,09 - -

Error (factor 1) Greenhouse-Geisser 0,28 1,00 0,28 - -

Lower-bound 0,28 1,00 0,28 - -

Taánuun 3

Pe3yëbTaTHi noKa3HMKM 3a nyHKTaMM flocëiflœeHb

Measure (BiiMip): Harverst (ypOœaéHicTb)

LSD (HaéMeHma icTOTHa pi3Hiiöfl)

95% Confidence Interval

(I) ÏyHKT (J) ÏyHKT (I-J) Pi3HMöfl Std. Error SLg 95% AOBI'PHMM iHTepBan

flOcniflœeHHA flOcniflœeHHA cepeflHix ÑTaHflapTHa nOXMÖKa ÉMOBl'pHl'cTb Lower Bound Upper Bound

Hmwha Mema BepxHfl Mema

62 0,66 1,21 0,682 -14,77 16,09

9 114 -1,43 1,08 0,412 -15,15 12,29

174 3,20 1,30 0,246 -13,34 19,75

9 -0,66 1,21 0,682 -16,09 14,77

62 1143 -2,09 1,01 0,286 -14,89 10,70

174 2,54 1,24 0,289 -13,24 18,32

9 1,43 1,08 0,412 -12, 30 15,15

114 622 2,09 1,01 0,286 -10,70 14,88

1744 4,63 1,11 0,150 -9,48 18,75

9 -3,20 1,30 0,246 -19,75 13,33

174 62 -2,54 1,24 0,289 -18,32 13,23

114 -4,63 1,11 0,150 -18,75 9,48

Pe3yëtTaTH TecTyBaHHa 3a KpHTepieM HaËMeH-moï icTOTHOï pi3HHöi (ôararopaçoBHH t-TecT 6eç aëtôa-Kopeëaôiï) HaBe^eHO b Ta6ëHn;i 3.

Tnnoâi rpaôiKH o^HO^aKTopHoi äHcnepcin-Hoï Mo^eëi 3 noBTopeHHaMH HaBe^eHo Ha pH-cyHKax 1-2.

Dependent Variable: crop_yield

da™ ff> Jfp

|8 §8 F

OO O coo 0 CO 0 oco 0

o°o8 88 8 (üßo00 (Pcfcffi S ^ÎÊ&ÏP

0 $ 0 /

Predicted

Model Intercept + point

Std. Residual

ÂiaëoroBe bíkho b o^Ho^aêTopHoï Mo^eëi Ta peçyëtTaTH poçpaxyHêiâ y naêeTi MS Excel HaBe^eHo Ha pncyHKax 3-4.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Ha pncyHKy 5 HaBe^eHo npHKJiaä iMnopTo-BaHHx flaHHx y cepe^oBH^i rpaôi^Horo iHTep-ôeécy R Studio.

Pmc. 1. Tpa^iK oöiH^BaHHfl BpoœaéHocTi coï KyëbTypHoï

Pmc. 2. Tpa^iK MapriHaëbHMX cepeflHix

Однофакторн ы й дисперсион н ы й анализ ? X

Входные данные |-

Входной интервал: |

„ Отмена

Группирование: по столбцам

О по строкам Справка

0 Метки в первой строке Альфа: [^05

Параметры вывода

О Выходной интервал: г№]

® Новый рабочий лисп О Новая рабочая книга

Pèc. 3. Д1aлoгoвe в1кнo п1д 4ac внeceння дaниx oднoфaктopнoï мoдeл1 в пaкeт1 MS Excel

A с в Е F G

3 ГКдсумков! значения

4 Групи Шльмсть Сума Середне Дисперая

5 Сорт 18007 5 69,5418601 13,90837202 3,465053871

6 Сорт 3018009 5 69,2301465 13,8460293 12,09187293

7 Сорт 4018007 5 66,1166863 13,22333727 12,78687633

8 Сорт 4018012 5 68,7020065 13,7404013 10,75815095

9

10

11 Дисперайний анал1з

12 Джерело вар1ацп SS df MS F Р-Значення F критерий

13 M ¡ж трупами 1,459539 3 0,486513019 0,049768666 0,984774391 3,238871517

14 Все редин i груп 156,4078 16 9,77548852

15

16 Всього 157,8674 19

Pèc. 4. Peзyльтaтн1 дaн1 oднoфaктopнoï мoдeл1 в пaкeт1 MS Excel

Import Excel Data

FüeAAfc

Q/Users/Evgenij/Downloads/Cofl no ïOHaM/DataSort.xls

Data Preview;

Point (double) "*" Variety Zone yield.1 yield, 2 fcharacter)ж (double)w fdouble) " (double) ' yield_3 yield _4 1double> * (double) '

29 18007 2 17.6 18.0 17.9 18.1

114 18007 2 12.4 12.6 12.8 13.0

151 18007 2 9.2 10.0 10.0 10.8

174 18007 2 12.3 11.8 12.0 11.S

278 18007 2 11.2 10.8 11.2 19.4 11.3

8 IIS 18007 3 19.2 19.4 19.6

18007 25.7 25.8 25.6 25.9

187 18007 3 Î5.5 34.5 35.2 35!

220 18007 3 13.7 14.1 13.9 14.3

Previewing first 50 entries.

mport Optrons; Code Preview:

INfame: [ DataSort | 0Hrst Kow as Names SheeG Default -j NA! Default ' Skip: 01 0Open Data Viewer "library(readxl) Datasart <- read_exce~l("c:/users/Evgenij/Down~loads/coH no зонам/Datasort.xls") Vi ew(DataSort)

Pèc. 5. Пpиклaд гpaф1чнoгo 1нтepфeйcy R

Type ill Repeated Measures manova Tests:

Term: (intercept)

Sum of squares and products for the hypothesis:

(intercept) 63100.6 Б a ra то в им трн i критерИ' (для intercept) Multivariate Tests: (Intercept)

Df test stat approx F num Df den Df Pr(>F) Pillai 1 0.8626B2 81.63658 1 13 5.7604e-07 ***

Wilks 1 0.137368 81.63658 1 13 5.7604e-07 ***

Hotel"!ing-Lawley 1 6.279737 81.63658 1 13 5.7604e-07 ***

Roy 1 6.279737 81.63658 1 13 5.7604e-07 ***

Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

432

Pèc. 6. Peзyльтaти диcпepc1йнoгo aнaл1зy MANOVA Tests

issn 2518-1017 Plant Varieties Studying and Protection, 2017, т. 13, №4

Term: Crop_yield

Sum of squares and products for the hypothesis: crop_yieldl crop_yield2 crop_yield3 Crop_yieldl 0.19993460 0.23726678 0.04811704 Crop_yield2 0.23726678 0.28156971 0.05710155 Crop_yield3 0.04811704 0.05710155 0.01158003 Багатовимтрн! критерИ' (для Crop_yield) Multivariate Tests: Crop_yield

Df test stat approx F num Df den Df Pr(>F) Pillai 1 0.0411320 0.1572871 3 11 0.92279

Wilks 1 0.9588680 0.1572871 3 11 0.92279

Hotelling-Lawley 1 0.0428965 0.1572871 3 11 0.92279 Roy 1 0.0428965 0.1572871 3 11 0.92279

Рис. 7. Результати MANOVA за пунктами досл1*дження

Таблиця 4

Анал1'з 1'нструментальних метод1'в та алгоритм1*в тд час проведення квал1'фжафйно1 експертизи

щодо придатносл сорттв для поширення

Назва iнcтpyмeнтальнoгo заcoбy

IBM SPSS Statistics Microsoft Excel (Пакeт аналiзy даниж) R

Яккть iнтepфeйcy кopиcтyвача (usability)

Роботу можна виконувати з використанням RKward, RapidMiner, Deducer, R Commander, RExceL, Sage, але для побудови статистично'1 модел1 засто-совують консольне введення 1'нфор-мац11 Дiалoгoвi вжна дають змoгy фop-мувати мoдeль анал1'зу та oбиpати чиcлo пoвтopeнь та вимipy, за якими зд^н^ив^я poзpаxyнки, фopмyва-ти cкладoвi мoдeлi, вибиpати тип мo-дeлi, кoнтpаcти, апpoпpiopнi кpитepiï, тип гpафiкiв Heдoлiкoм е тe, щo нeoбxiднo вига-нувати дoдаткoвi дл з тpанcпoнyван-ня ма^ву даниx. Дiалoгoва фopма нe дае кopиcтyвачy змoги вибpати кpитepiï для poзpа-xyнкy

Оц'нювання наявнocri функц'й для peалiзацiï завдань ПСП

Oпиcoва cтатиcтика Диcпepciйний анал1'з Kлаcтepний анал1'з Опигава cтатиcтика Диcпepciйний анал1'з Kлаcтepний анал1'з

Яккть пpeдcтавлeння peзyльтаtiв oбчиcлeння

Анал1'з багатoфактopниx кpитepi-1в, пepeвipки внyтpiшнix гpyпoвиx eфeктiв, пepeвipки внyтpiшнix гpyпo-виx кoнтpаcтiв тoщo Пepeлiк peзyльтатниx пoказникiв, щo фopмye пакeт, oбмeжeнo такими зна-чeннями: cyма квадpатiв, диcпepciя, чиcлo cтyпeнiв cвoбoди, cepeднe квадpатичнe вiдxилeння, кpитepiй Фiшepа, значущкть Анал1'з з викopиcтанням багатофак-тopниx кpитepiïв, пepeвipка внурш-нix гpyпoвиx eфeктiв i кoнтpаcтiв та фактopiв

Hаoчнicть гpафiчнoï iнфopмацiï

£ мoжливicть peдагyвати фopмат та напи^ гpафiкiв y гpафiчнoмy peдактopi Гpафiки мoжна cфopмyвати cтандаpт-ними загабами пакeта Фopмат гpафiкiв задаeтьcя пpoгpам-ним кoдoм i пoтpeбye дoдаткoвиx знань та навичoк з ïx пpавильнoгo пpeдcтавлeння

0 т

2

ю

- 1

2 n=2G n=28 n=16

2 3 4

Зона

Рис. 8. Графж оц'нювання середньо' врожайносп coi культурно' по природно-кл1*матичних зонах

Результати дисперсшного анал1зу наведено на рисунках 6—7. Графши, що побу-довано з використанням програмного коду мови R для дисперсшно! модел1, наведено

21 31 41 22 32 42 23 33 43 24 34 44

Рис. 9. Д1'аграма взаемодй для середньо! врожайносп со1 культурно1

на рисунках 8-9. Шдсумков1 результати анал1зу шструментальних засоб1в: IBM SPSS Statistics, MS Excel, R зведено в таб-лицю 4.

Bиcнoвки

Пpoвeдeнo aнaлiз мeтoдiв тa aлгopитмiв, шр е пpидaтними для oбpoблeння дaниx квaлiфi-кaцiйнoï eкcпepтизи copтiв pocлин нa ПCП.

Здiйcнeнo пopiвняльний aнaлiз rnrapy-мeнтaльниx зacoбiв, пpизнaчeниx для CTa-тиcтичнoгo oбpoблeння дaниx. Пpoвeдeнo cтaтиcтичний aнaлiз нa eкcпepимeнтaльниx дaниx пoльoвиx дocлiджeнь coï кyльтypнoï iз зacтocyвaнням MS Excel, R, IBM SPSS Statistics, викopиcтoвyючи Kprnepii: якгсть iнтepфeйcy кopиcтyвaчa, фyнкцioнaльнicть, якicть пpeдcтaвлeння peзyльтaтiв oбчиcлeн-ня, нaoчнicть гpaфiчнoï iнфopмaцiï.

Bиявлeнo, щo пaкeт пpиклaдниx пpoгpaм IBM SPSS Statistics пepeвaжae зa кpитepiя-ми: якicть iнтepфeйcy кopиcтyвaчa, якicть пpeдcтaвлeння peзyльтaтiв oбчиcлeння, Ha-кeт aнaлiзy MS Excel тa R. Для викopиcтaн-ня пiд чac oбpoблeння зaвдaнь ПCП peкoмeн-дoвaнo зacтocoвyвaти мoвy пpoгpaмyвaння R, ocкiльки цeй iнcтpyмeнтaльний зaciб ^oipa-мyвaння poзпoвcюджyeтьcя бeзкoштoвнo зa лiцeнзieю GNU General Public License.

Bикopиcтaнa л1тepaтypa

1. Meтoдикa пpoвeдeння квaлlфlкaцlйнoï eкcпepтизи copтlв pocлин нa пpидaтнlcть дo пoшиpeння в y^aïm. Зaгaльнa чacтинa. В1нниця : ФOП Kopзyн Д. Ю., 2016. 120 c.

2. Гopяинoвa E. P., Пaнкoв A. P., Плaтoнoв E. H. Пpиклaдныe мeтoды aнaлизa ^a™c™Hec^x дaнныx. Mocквa : Bыcшaя шкoлa экoнoмики, 2012. 312 c.

3. Compton M. E. Statistical methods suitable for the analysis of plant tissue culture data. Plant Cell. Tiss. Organ. Cult. 1994. Vol. 37, Iss. 3. P. 217-242. doi: 10.1007/BF00042336

4. Bryman A., Cramer D. Quantitative Data Analysis with IBM SPSS 17, 18 and 19: A Guide for Social Scientists. New York : Routledge, 2011. 408 p.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

5. Levesque R. SPSS Programming and Data Management: A Guide for SPSS and SAS Users. 4th ed. Chicago, IL : SPSS Inc, 2007. 540 p.

6. Бююль A., Цeфeль П. SPSS: иcкyccтвo oбpaбoтки. Aнaлиз ^a-™c™Hec^x дaнныx и вoccтaнoвлeниe c^bi^ix зaкoнoмep-нocтeй. Сaнкт- Пeтepбypг : ДиaСoфтЮП, 2002. 608 c.

7. Baumer B. S., Kaplan D. T., Horton N. J. Modern Data Science with R. Boca Raton : Chapman & Hall/CRC, 2017. 556 р.

8. Чешкова А. Ф., Алейников А. Ф., Степочкин П. И. Применение графических возможностей программной среды R для анализа экспериментальных данных по селекции тритикале. Вычислительные технологии. 2016. Т. 21, спец. вып. 1. С. 104-115.

9. Юр^енко Ю., Кузнецова Ю., Соколова £., Фролова Г. Методи оц'нювання usability ''нтерфейсу користувача. Вкн. Нац. унту «Mbeie. nолiтехнiка». Cерiя: Комп'ютерт науки та 1'нфор-мащйт технологИ'. 2013. № 751. С. 244-256.

References

1. Metodyka provedennia kvalifikatsiinoi ekspertyzysortivroslyn na prydatnist do poshyrennia v Ukraini. Zahalna chastyna [Regulations on the procedure and the conduct of qualification tests for suitability of crop varieties for dissemination in Ukraine. General part]. (2016). Vinnytsia: FOP Korzun D. Yu. [in Ukrainian]

2. Goryainova, E. R., Pankov, A. R., & Platonov, E. N. (2012). Priklad-nye metody analiza statisticheskikh dannykh [Applied methods of statistical data analysis]. Moscow: Vysshaya shkola eko-nomiki. [in Russian]

3. Compton, M. E. (1994). Statistical methods suitable for the analysis of plant tissue culture data. Plant Cell. Tiss. Organ. Cult. Vol. 37, Iss. 3. P. 217-242. doi: 10.1007/BF00042336

4. Bryman, A., & Cramer, D. (2011). Quantitative Data Analysis with IBM SPSS 17, 18 and 19: A Guide for Social Scientists. New York: Routledge.

5. Levesque, R. (2007). SPSS Programming and Data Management: A Guide for SPSS and SAS Users. (4th ed.). Chicago, IL: SPSS Inc.

6. Byuyul, A., & Tsefel, P. (2002). SPSS: iskusstvo obrabotki. Analiz statisticheskikh dannykh i vosstanovlenie skrytykh zakono-mernostey [SPSS: Art of Handling. Analysis of statistical data and restoration of hidden patterns]. St. Petersburg: DiaSoftYuP. [in Russian]

7. Baumer, B. S., Kaplan, D. T., & Horton, N. J. (2017). Modern Data Science with R. Boca Raton: Chapman & Hall/CRC.

8. Cheshkova, A. F., Aleynikov, A. F., & Stepochkin, P. I. (2016). Application of graphical capabilities of the R programming environment for analysis of experimental data on triticale breeding. Vychislitel'nye tekhnologii [Computational Technologies], 21(1), 104-115. [in Russian]

9. Kirilenko, Yu., Kuznetsova, Yu., Sokolova, Ye., & Frolova, H. (2013). Methods to estimate the usability of a user's interface. Visnyk Natsionalnoho universytetutu «Lvivska politekhnika». Seriia: Kom-piuterni nauky ta informatsiini tekhnolohii [Bulletin of National University "Lvivska Politechnika". Ser.: Computer Engineering and Information Technologies], 751, 244-256. [in Ukrainian]

УДК 004.4'2: 631.526.3

Лещук H. В.", Мажуга К. М., Орленко Н. С.**, Стариченко Е. М., Шкапенко Е. А. Сравнительный анализ статистических программных продуктов для квалификационной экспертизы сортов растений на пригодность к распространению // Plant Varieties Studying and Protection. 2017. Т. 13, № 4. С. 429-435. https://doi.org/10.21498/2518-1017.13.4.2017.117757

Украинский институт экспертизы сортов растений, ул. Генерала Родимцева, 15, г. Киев, 03041, Украина, e-mail: nadiya1511@ukr.net", n.s.orlenko@gmail.com""

^ль. Oпpeдeлить ^a^c^ec^e мeтoды и ин^у-мeнтaльныe cpeдcтвa ^^ты пpиклaдныx пpoгpaмм) для coздaния cиcтeмы пoддepжки пpинятия peшeния (СППP) квaлификaциoннoй экcпepтизы copтoв нa пpигoднocть иx к pacпpocтpaнeнию ^CP) в paзpeзe зaдaч oбpaбoтки дaн-ны^. Oбocнoвaть выбop пpoгpaммныx cpeдcтв oбpaбoтки cтaтиcтичecкиx дaнныx пoлeвыx и лaбopaтopныx иccлe-дoвaний, кoтopыe вxoдят в гаг^в квaлификaциoннoй

экcпepтизы нa ПCP. Meтoды. Aнaлитичecкий, ocнoвaн-ный нa cpaвнeнии мeтoдoв oпиcaтeльнoй и мнoгoмepнoй cтaтиcтики и cpeдcтв интeллeктyaльнoгo aнaлизa дaнныx, пoлyчeнныx пpи пpoвeдeнии квaлификaциoннoй экcпep-тизы нa ПCP. Cpaвнитeльный aнaлиз пpoгpaммныx cpeдcтв oбpaбoтки cтaтиcтичecкиx дaнныx для пoдгoтoвки пpeд-лoжeний пo oкoнчaтeльнoмy peшeнию пo зaявкe нa copт pacтeний. Peзyльтaты. Пpoвeдeнa дeкoмпoзиция зaдaч,

434

issn 2518-1017 Plant Varieties Studying and Protection, 2017, т. 13, №4

которые входят в состав системы поддержки принятия решений по квалификационной экспертизе сортов-кандидатов на ПСП. Проведено сравнение статистического пакета SPSS, пакета анализа, который входит в состав MS Excel и языка программирования R по критериям: удобство интерфейса, функциональность, качество представления результатов расчетов, наглядность графической информации, стоимость программного средства. Оба пакета широко применяются в мире для статистической обработки данных, имеют аналогичный состав функций для расчета статистик. Выводы. Выделены задачи ПСР,

которые рекомендуется решать с применением исследуемых средств. В качестве инструментального средства целесообратно использовать язык программирования R. Основным преимуществом R по сравнению с пакетом IBM SPSS Statistics является то, что R - программный продукт с открытым кодом, который свободно распространяется.

Ключевые слова: система поддержки принятия решений, квалификационная экспертиза, пригодность сортов к распространению, условный стандарт, статистические методы в селекции, дисперсионный анализ, кластерный анализ, R, IBM SPSS Statistics.

UDC 004.4'2: 631.526.3

Leschuk, N. V.*, Mazhuha, K. M., Orlenko, N. S., Starychenko, Ye. M., & Shkapenko, Y. A. (2017). Comparative analysis of statistical software products for the qualifying examination of plant varieties suitable for dissemination. Plant Varieties Studying and Protection, 13(4), 429-435. https://doi.org/10.21498/2518-1017.13.4.2017.117757

Ukrainian Institute for Plant Variety Examination, 15 Henerala Rodymtseva Str., Kyiv, 03041, Ukraine, e-mail: nadiya1511@ukr.net*, n.s.orlenko@gmail.com**

Purpose. To define statistical methods and tools (application packages) for creating the decision support system (DSS) for qualifying examination of plant varieties suitable for dissemination (VSD) in the context of data processing tasks. To substantiate the selection of software for processing statistical data relative to field and laboratory investigations that are included into the qualifying examination for VSD. Methods. Analytical one based on the comparison of methods of descriptive and multivariate statistics and tools of intellectual analysis of data obtained during qualifying examination for VSD. Comparative analysis of software tools for processing statistical data in order to prepare proposals for the final decision on plant variety application. Decomposition of tasks was carried out which were included into the decision support system for qualifying examination of varieties-candidates for VSD. Results. Statistical package

HadiuM^a / Received 06.09.2017 noeodmeHO do dpyny/ Accepted 09.11.2017

SPSS, analysis package included in MS Excel and programe language R was compared for the following criteria: interface usability, functionality, quality of calculation result presentation, visibility of graphical information, software cost. The both packages were widely used in the world for statistical data processing, they have similar functions for statistics calculation. Conclusion. Tasks of VSD were separated and recommended to tackle using investigated tools. Programe language R was a product recommended to use as a tool. The main advantage of R as compared to the package IBM SPSS Statistics is the fact that R is an open source software.

Keywords: decision support system, qualifying examination, varieties suitability for dissemination, conditional standard, statistical methods in breeding, dispersion analysis, cluster analysis, R, IBM SPSS Statistics.

i Надоели баннеры? Вы всегда можете отключить рекламу.