Научная статья на тему 'Прикладные генетико-статистические программы: настоящее и перспективы'

Прикладные генетико-статистические программы: настоящее и перспективы Текст научной статьи по специальности «Прочие технологии»

CC BY
200
60
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук

Аннотация научной статьи по прочим технологиям, автор научной работы — Сергей Дромашко

В настоящее время на рынке информационных продуктов отсутствуют современные объектно-ориентированные программные средства для обработки генетико-селекционных данных, оптимизации и ускорения процесса количественной оценки нового генофонда по показателям продуктивности с учетом влияния факторов среды (общей и специфической комбинационной способности, коэффициентов наследуемости, зависимости урожайности от эколого-генетических факторов, устойчивости к основным биотическим и абиотическим стрессам, минимизации приемов интенсификации выращивания). Имеющиеся статистические пакеты, например SYSTAT, STATGRAPH, STATISTICA, нацелены на обработку обезличенных данных и не включают блока генетико-статистического анализа, учитывающего специфику требований селекционера [1].

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

A package of applied programs for personal computers RISHON for different kinds of biometrical analysis directed at inquiries of geneticists and breeders was developed for operational system MS DOS. Modernization of the package by equipping it with modern user interface on MS Windows basis is supposed to be promising.

Текст научной работы на тему «Прикладные генетико-статистические программы: настоящее и перспективы»

УДК 681.518:575.113

Сергей Дромашко

заместитель директора по научной работе, заведующий лабораторией моделирования генетических процессов Института генетики и цитологии НАН Беларуси, доктор биологических наук

Прикладные генетико-статистические программы: настоящее и перспективы

В настоящее время на рынке информационных продуктов отсутствуют современные объектно-ориентированные программные средства для обработки генетико-селекционных данных, оптимизации и ускорения процесса количественной оценки нового генофонда по показателям продуктивности с учетом влияния факторов среды (общей и специфической комбинационной способности, коэффициентов наследуемости, зависимости урожайности от эколого-генетических факторов, устойчивости к основным биотическим и абиотическим стрессам, минимизации приемов интенсификации выращивания). Имеющиеся статистические пакеты, например SYSTAT, STATGRAPH, STATISTICA, нацелены на обработку обезличенных данных и не включают блока генетико-статистического анализа, учитывающего специфику требований селекционера [1].

Институт генетики и цитологии НАН Беларуси является ведущим учреждением республики в области математической генетики и моделирования селекционного процесса. Более 30 лет здесь разрабатываются прикладные программы для ЭВМ по генетико-статистическому анализу экспериментальных данных и математическому моделированию. Появление в конце 1980-х гг. персональных компьютеров позволило поставить задачу объединения уже накопленного опыта. К 1995 г. под операционную систему MS DOS был создан пакет прикладных генетико-ста-тистических программ для персональных компьютеров RISHON, в который вошло около 40 программ по различным видам биометрического анализа [2]. Среди них следует выделить:

• элементарный статистический анализ — первичная обработка, вычисление критериев Стьюдента и Фишера, сравнение распределений, разбиение по классам;

• корреляционный анализ — выбор уравнения регрессии (17 различных аппроксимирующих формул, включая полином степени определение множественной нелинейной регрессии, вычисление корреляционного отношения, нахождение линейных корреляций, вычисление корреляций по Спирмену и т.п.;

• дисперсионный анализ — однофактор-ный, двухфакторный и трехфакторный (в том числе учет неполноблочных планов, расчет коэффициентов наследуемости);

• многомерный анализ — построение дендрограммы, компонентный анализ, разные виды кластерного анализа;

• генетический анализ — вычисление общей и специфической комбинационной способности (по четырем методам Гриффинга), оценка комбинационной способности при скрещивании с тестерами, нахождение генетических параметров по методу Хеймана, определение экологической стабильности и пластичности по Эберхарту и Расселу, вычисление путевых коэффициентов райта и целый ряд других методов. В отличие от других программных биометрических продуктов того периода, таких как DAVEP-PC(Германия),Биостат(Mолдова)[3], пакет RISHON ориентирован на запросы генетиков и селекционеров, в первую очередь растениеводов. Он обладает удобным интерфейсом, снабжен сквозной терминологией, что позволяет легко и естественно перейти от стандартных статистических методов

Рис. 1. Схема пакета прикладных генетико-статистических программ RISHON

обработки экспериментальных данных к блоку генетического анализа. программы составлены таким образом, что позволяют в ходе корреляционного, дисперсионного или генетического анализа провести всю необходимую первичную статистическую обработку исходных данных и выдать их пользователю. при желании в ряде программ можно использовать ранее полученные расчеты основных статистических параметров. результаты их можно по выбору сохранить в файле или вывести на печать. оболочка пакета написана на C, программы первоначально — на Basic, затем большая их часть переведена на Pascale. Это позволило весь пакет поместить на одну дискету емкостью 1,2—1,44 мв.

Блок генетического анализа занимает около трети всего пакета и постоянно пополняется новыми программами. в настоящее время в него входит более 10 программ, написанных как по известным из литературы методам анализа [4], так и на основе оригинальных,

разработанных в институте генетики и цитологии нАн Беларуси моделей (в частности программы ADIS определения адаптивной способности по А.в. кильчевскому и л.в. хотылевой [5] и др.).

ориентированность на запросы генетики сельскохозяйственных растений позволила внедрить пакет в практику учебного процес-

са на биологическом факультете гомельского государственного университета, ряде кафедр Белорусской государственной сельскохозяйственной академии. пакет был также передан для использования на опытную станцию по птицеводству нАн беларуси, в институт генетики и физиологии хлопчатника Ан таджикистана.

однако за 10 прошедших лет дизайн пакета RISHON, ориентированный на MS DOS, морально устарел. назрела необходимость перевода его на более современную платформу. в начале 2000-х гг. нами была предпринята попытка разработки комплексной программы теоретико-информационного анализа генетических процессов в сельскохозяйственных растениях с учетом влияния сре-довых факторов в формализме MS Excel [6]. с учетом этого опыта представляется перспективным создать пакет прикладных генетико-селекционных программ для персональных компьютеров с современным пользовательским интерфейсом на платформе MS Windows, то есть определить принципы и дизайн пакета, интегрировав в него базы генетико-селекционных данных, и апробировать его на конкретных экспериментальных данных.

в предлагаемом для разработки пакете на современной, удобной и привычной для пользователей платформе Windows будет реализован системный подход, позволяющий осуществлять весь комплекс необходимых вычислений, в частности провести генетико-статистическую обработку данных на Эвм, дать количественную оценку перспективности тех или иных генотипов для

KIÏHUH

□! M jgjg Л]

îiiiieMH рнии<1нис щдвядаддетс я

ДШИДМЯ .■■■.{■.."¡Спии-шчникий HdKHi M ISHClN (вчисин 1 . (01 '.'.'. ими и ¡г; миг ...;.;;;

1 ЩЯ обр ДОСТУП Г.ппдк ПИОН HO~r fil ЦН'ИОрИЛИЦк

........—

Fi - дч;н мопицм

LnciiKuirniH S Ппог^ /члммик

Kuil'fpOflb Дс|||||ЕХ D

ÎÎHXOfl 0

Рис. 2. Стартовая страница пакета RISHON

№6(40)_2006 НАУКА И ИННОВАЦИИ

33

¿г™ п| |i-a| ^ й]б aJ

■ кмм KHMrtrtHHKi и[№пннглкн:н

¡Статистический пакет RISHON (сессия 1.01:1

[раэоайотап п Ипстититс гепстикн и цитологии НИ ЫХР5

-HeLp Screen-

Итак. G" решили работать с пакетам RISHON . После

U Fine НЛ ПОйкпи^1<:Я ОГЯОШЛр !HF:Hi: :

иситишкп аввод цннЩ ЭЖОНГРЩЙ рнннык шыкоа . й адалине "СТАТИСТИКА" Ви выбиваете и яйпу^клйтй нйор HtJflHMji; прогринми. В "BBUfIL ДШНЩ" Ban предоставляется воэнмЯшНгь иябирать н когчэсктирсюать исходные длимые. "КОН I РШ[Ь JLNHHÜH" гпужш дпн ирнкерхн 31[>инигн .нос: E И на даини;-;, Здесь Lk монете найти п:;?пидыши13 эаплтию или еще какцю ынбидь дспщеннн» ошибки. "ВЫИЩ" 5то окоыча

KU« f»i:lilllll 1-1 H]IKC]f| И!-! MiJKHIiJ _

H5PS Pf) On

Рис. 3. Первая страница помощи в пакете RISHON

использования в селекционном процессе, спланировать оптимальные севообороты, сделать расчеты наиболее экономичного применения удобрений и препаратов химической защиты растений и т.д.

Кроме того, в результате общения с пользователями встала задача совершенствования генетической части пакета, ее существенного расширения за счет создания ряда новых компьютерных моделей, позволяющих еще больше упростить процесс обработки экспериментальных данных и дающих возможность извлекать дополнительную информацию из анализируемого материала (например экспресс-метод наименьших квадратов для обработки данных, сгруппированных по типу «шаблона»; программа доказательства генотипического различия между группами сортов по эколого-географическому происхождению; анализ преимущества сортов по показателям величины признака, его стабильности и пластичности; интегральная оценка генотипов по сумме признаков с учетом их взаимодействия со средой и др.) [7].

Разработанные новые генетико-статисти-ческие компьютерные модели позволят получать более полную информацию о развитии количественных признаков сельскохозяйственных растений в зависимости от генотипа и условий среды и на этой основе рекомендовать перспективные для селекции и агротехники сорта, определять задачи и направления гибридизационных программ и т.д.

В целом современный пакет прикладных генетико-селекционных программ

для персональных компьютеров с удобным пользовательским интерфейсом на платформе Windows будет востребован в учебных, научно-исследовательских и селекционных учреждениях республики и стран СНГ и явится хорошим примером использования информационных технологий для оптимизации и ускорения селекционного процесса.

первоначально предложения по разработке пакета подавались в упомянутой государственной программе ориентированных фундаментальных исследований «Селекция, семеноводство и генетика», структура которой предполагала направление «информационные основы повышения эффективности управления селекционными процессами на базе современных компьютерных средств и новых информационных технологий».

Однако в окончательном варианте в ГПОФИ тем по информационно-технологическому обеспечению селекционного процесса не осталось. Но потребность в соответствующем программном обеспечении существует. в частности, только в высших учебных заведениях биологического и аграрного профиля страны имеется свыше 10 тыс. по-

тенциальных пользователей — студентов и преподавателей. Еще не менее 1,5 тыс. специалистов — в научно-исследовательских и селекционных учреждениях Беларуси. С учетом России, Украины и Казахстана эту цифру можно смело увеличить на порядок. Разработка при ее переводе на английский язык будет также востребована в дальнем зарубежье. С учетом этого представляется целесообразным заявить проект в Инновационный фонд НАН Беларуси или подать его в Парк высоких технологий.

Литература

1. Реброва О.Ю. Статистический анализ медицинских данных. Применение пакета прикладных программ STATISTICA. - М., 2002. - 312 с.

2. Дромашко С.Е., Мац С.Р., Френкель Г.И. О логической схеме и структуре пакета прикладных программ по генетико-статистическим расчетам // Генетика, 1995. Т, 31, № 9. С. 1314-1316.

3. Смиряев A.B., Мартынов С.П., Кильчевский A.B. Биометрия в генетике и селекции растений. — М.: Изд-во МСХА, 1992. — 269 с. (электронный доступ, глава 11: URL http://library.timacad.ru/dow-nload/genetics/11.pdf).

4. Турбин H.B., Хотылева Л.В., Тарутина Л.А. Ди-аллельный анализ в селекции растений. — Мн.: Наука и техника, 1974. — 181 с.

5. Кильчевский A.B., Хотылева Л.В. Генотип и среда в селекции растений. — Мн.: Наука и техника, 1989. — 191 с.

6. Дромашко С.Е., Мащиц A.B. Теоретико-информационный анализ генетических процессов. Новая компьютерная программа в формализме Excel // Генетика и селекция в XXI веке: Материалы VIII съезда генетиков и селекционеров РБ. Минск, 23—25 июля 2002 г. — Мн., 2002. С. 364—365.

7. Дромашко С.Е., Пятковская О.М., Клевченя Е.М. пакет прикладных генетико-статистических программ для персональных ЭВМ RISHON: пути совершенствования // Весц АН Беларусь Сер. бiял. Навук, 1997, № 1. С. 67—70

SUMMARY

A package of applied programs for personal computers RISHON for different kinds of biomedical analysis directed at inquiries of geneticists and breeders was developed for operational system MS DOS. Modernization of the package by equipping it with modern user interface on MS Windows basis is supposed to be promising.

i Надоели баннеры? Вы всегда можете отключить рекламу.