Научная статья на тему 'Обработка и анализ генетических последовательностей при помощи методов математической статистики с целью выявления новых признаков'

Обработка и анализ генетических последовательностей при помощи методов математической статистики с целью выявления новых признаков Текст научной статьи по специальности «Нанотехнологии»

CC BY
72
12
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по нанотехнологиям , автор научной работы — Харитонов Тимофей Андреевич, Саяпин Александр Владимирович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Обработка и анализ генетических последовательностей при помощи методов математической статистики с целью выявления новых признаков»

ОБРАБОТКА И АНАЛИЗ ГЕНЕТИЧЕСКИХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ ПРИ ПОМОЩИ МЕТОДОВ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ С ЦЕЛЬЮ

ВЫЯВЛЕНИЯ НОВЫХ ПРИЗНАКОВ

Харитонов Тимофей Андреевич

Аспирант, Сибирский государственный аэрокосмический университет имени академика

М. Ф. Решетнева, г. Красноярск Саяпин Александр Владимирович

Канд. тех. наук, доцент кафедры прикладной математики, Сибирский государственный аэрокосмический

университет имени академика М. Ф. Решетнева, г. Красноярск

Настоящая работа посвящена оценке и методам статистической обработки генетических последовательностей популяций голштинизированного скота некоторых хозяйств Красноярского края для выявления новых признаков. В статье описывается применение статистических гипотез и статических тестов для проверки зависимости и связности выборок.

Породой называют достаточно большую группу животных, которых можно разводить, не прибегая к вынужденному родственному спариванию, связанных общностью происхождения и отличающихся характерными особенностями типа и продуктивности, поддерживаемых, и развиваемых трудом человека в определенных природных и хозяйственных условиях. В настоящее время отсутствуют формальные признаки, позволяющие определить, представляет ли определенная группа животных новую породу. В настоящей работе предлагается использовать для этой цели методы математической статистики.

Поскольку фенотипические признаки животных определяются генетическим кодом, представляется обоснованным использовать для выявления пород генетический материал животных. Таким образом, для разработки методологии выявления новых признаков необходимо обработать и проанализировать генетические последовательности животных. На основе проведенного анализа предполагается выявить нужные признаки и затем разработать наиболее эффективную методологию выявления этих признаков.

В качестве экспериментальных данных были выбраны генетические последовательности популяций голштинизированного скота некоторых хозяйств Красноярского края. Генетические последовательности представляют собой последовательность генов (антигенов), основанных на одном факторе крови. Замеры проводились по 10 факторам крови у более чем двух тысячей особей.

Эти данные подходят по нескольким причинам. Так как известно, что рассматриваемые хозяйства производили обмен генетическим материалом, мы можем сделать вывод, что данные разных хозяйств имеют некоторое сходство. Степень сходства нам неизвестна. Это помогает выявлять общие признаки (в отличии от не связанных данных), но не позволяет выявить признаки не прибегая к статистическому анализу.

Данная выборка достаточно велика для проведения большинства статистических тестов и достаточно мала что бы проведение классификации и кластеризации не вызывало затруднений (в плане выбора методов и расчетных мощностей).

Исходя из вышесказанного для разработки методологии выявления новых признаков были поставлены следующие задачи:

1. Обработка данных (генетических последовательностей) с целью вычисления частот встречаемости генов и их комбинаций.

2. Расчет генетического расстояния и степени сходства между представленными в исследовании выборками (популяций скота хозяйств), а также между генеральной совокупностью и выборками.

3. Кластеризация данных по нескольким изменяемым параметров (размер кластера, количество кластеров и т.д.).

4. Анализ кластеризованных данных. Выявление сочетаний генов и их комбинаций, которые оказали наибольшее влияние на кластеризацию.

5. Проверка статистических гипотез, проверка данных статистическими тестами и критериями для выявления новых признаков.

6. Анализ разброса частот встречаемости генов.

На основании предоставленных данных были построены матрицы генетического сходства и генетических расстояний (Таб. 1, Таб. 2).

Таблица 1

Генеральная совокупность Выборка 1 Выборка 2 Выборка 3 Выборка 4

Генеральная совокупность 0 0,0445344 0,0354276 0,0334643 0,0172739

Выборка 1 0 0,1429289 0,0719334 0,0578487

Выборка 2 0 0,0694216 0,0586471

Выборка 3 0 0,0700737

Выборка 4 0

На основе матриц сделано наблюдение - генетическое расстояние между популяциями отдельных хозяйств составляет не более 0,143, что является достаточно небольшим значением (Таб. 1).

Набольшее сходство демонстрируют выборки 1 и 4. Наименьшее сходство демонстрируют выборки 1 и 2 (Таб. 2).

С целью проверки зависимости и связности выборок была сформулирована следующая статистическая гипотеза: значимое различие частот встречаемости генов

представленных выборок отсутствует либо не превышает случайных отклонений.

Для проверки гипотезы, она была разделена не несколько дополняющих друг друга гипотез. Гипотезы были проверены соответствующими критериями.

Проверив критерием Зигеля-Тьюки выборки, мы выяснили, что разброс частот встречаемости генов двух выборок одинаков.

Для установки статистической связи между частотами встречаемости генов использовали множественный коэффициент корреляции рангов Кендалла. Мы можем сделать вывод о зависимости частот встречаемости генов выборок.

Метод Уилкоксона-Манна-Уитни определяет, достаточно ли мала зона перекрещивающихся значений между двумя выборками. По результатам проверки значимых различий между выборками нет.

Таблица 2

Генеральная совокупность Выборка 1 Выборка 2 Выборка 3 Выборка 4

Генеральная совокупность 1 0,9564427 0,965193 0,9670894 0,9828745

Выборка 1 1 0,8668158 0,9305929 0,9437928

Выборка 2 1 0,9329333 0,9430395

Выборка 3 1 0,932325

Выборка 4 1

На основании результатов проверки критериями принята основная гипотеза: значимое различие частот встречаемости генов представленных выборок отсутствует либо не превышает случайных отклонений.

Таким образом, зависимость и связность выборок доказана.

Тест Лемана-Розенблатта показывает, на сколько однородна выборка. В ходе проведения теста Лемана-Ро-зенблатта получены следующие результаты: для большей части выборок принята нулевая гипотеза об однородности выборок. Для выборок 1 и 2, выборки 4 и генеральной совокупности приняли альтернативную гипотезу - частота встречаемости антигенов неодинакова между двумя различными выборками. Следовательно, на данном этапе сделать однозначный вывод об однородности всего массива популяций невозможно.

Проведенные тесты и проверки критериями дали лишь общее представление о предоставленных данных. В дальнейшем предполагается провести анализ несколькими критериями.

Выполнение кластерного анализа и анализ выходных данных является приоритетным в дальнейших исследованиях. Кластерный анализ позволит обнаружить новые признаки и на основе этого разработать методологию их выявления.

Библиографические ссылки

1. Хабибрахманова Я.А. Полиморфизм генов молочных белков и гормонов крупного рогатого скота: автореф. дис. канд. биолог. наук / ФГНУ ВНИИП-ЛЕМ: 2009.

2. Урядников М.В. Частота встречаемости разных генотипов по соматотропину у коров разного происхождения: ФГОУ ВПО: 2012.

3. Игнатьев И.В. Полиморфизм гена MDR1: популя-ционные и фармакогенетические аспекты: автореф. дис. канд. биолог. наук / ГУ НЦ Биомедицинских технологий РАМН: 2007.

4. Василевич В. И. Статистические методы в геоботанике: Л.: Наука, 1969.

ВЛИЯНИЕ ТЕМПЕРАТУРЫ И НАНОЧАСТИЦ СЕРЕБРА НА ФЛУОРЕСЦЕНЦИЮ И ФОСФОРЕСЦЕНЦИЮ РОДАМИНА 6Ж В ПЛЕНКЕ ПОЛИВИНИЛОВОГО СПИРТА

Константинова Елизавета Ивановна

Аспирант, КГТУ, г. Калининград Боркунов Родион Юрьевич Студент, БФУ имени И. Канта, г. Калининград Брюханов Валерий Вениаминович

Доктор ф.- м. наук, профессор, БФУ имени И. Канта, г. Калининград

Введение. Металлические наноматериалы привлекают внимание исследователей и практиков своими уникальными оптическими свойствами (локальный поверхностный плазмонный резонанс (Л1II1Р)) [1, С.1536; 2, С.1025; 3, С.], имеющих практическое применение в наноплазмонике и нанофотонике.

Важнейшим направлением оптической нанофо-тоники является использование полимерных материалов в качестве матриц для люминофоров, наночастиц благородных металлов, квантовых точек и пр., которые участвуют в процессах передачи и преобразования электронной энергии. Так, внося в полимерные матрицы при

стекловании наночастицы металлов серебра или золота, можно целенаправленно увеличить эффективность переноса энергии [4, С. 570]. Однако при внесении в полимер наночастиц металлов могут не только быть изменены оптические свойства полимерной пленки, но и ее структурные и релаксационные свойства.

В настоящей работе спектрально-кинетическими методами в широком диапазоне температур исследованы пленки поливинилового спирта (ПВС), содержащие красители - родамин 6Ж и наночастицы (НЧ) цитратного золя серебра.

i Надоели баннеры? Вы всегда можете отключить рекламу.