Научная статья на тему 'Визуализация результатов секвенации последовательностей ДНК'

Визуализация результатов секвенации последовательностей ДНК Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
134
34
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НАУЧНАЯ ВИЗУАЛИЗАЦИЯ / МОБИЛЬНЫЕ УСТРОЙСТВА / МУЛЬТИПЛАТФОРМЕННОСТЬ / OPENGL(ES) / SCIENTIFIC VIZUALIZATION / MOBILE DEVICES / MULTIPLATFORM PORTABILITY

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Рябинин К. В.

В статье рассмотрено использование адаптивной мультиплатформенной клиент-серверной системы научной визуализации для решения задачи наглядного отображения результатов множественного выравнивания последовательностей ДНК и построения филогенетических деревьев.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

VISUALIZATION OF DNA SEQUENCING RESULTS

The article is devoted to the automated creation of graphical representation for the DNA sequences multiple alignment results and building of phylogenetic trees with help of adaptive multiplatform client-server scientific visualization system.

Текст научной работы на тему «Визуализация результатов секвенации последовательностей ДНК»

1) to make a periodic adjustment of the chemical composition of the electrolyte, subject to changing of overheat of the electrolyte, depending on the speed of its movement;

2) to stabilize the level of electrolyte in the area of feed zone for more than 19 cm to ensure complete dissolution of the alumina before obtaining the boundaries of the «metal-electrolyte»;

3) to control the apparent density and the fluorine content in alumina from the output of the alumina feeding system in order to optimize cycles of dosing of the discrete feeding system;

4) to monitor the process to stabilize the parameters of electrolysis and efficiency of dissolution of alumina.

A new approach to the algorithmization process of alumina feeding, provides the supply of the individual signals on each point feeder of the cell, with the ability of the correction of feeding cycles depending on the intensity of dissolution of alumina and taking into account the boundary values of process parameters, will allow:

- to lower the number of process variations,

- to realize the feeding without anode effects (less than 0.03 pcs/day) and without the formation of precipitation on the bottoms of the bath with a maximum close to the theoretical loading of alumina,

- to reduce the losses of alumina, and therefore to increase the energy efficiency of higher amperage cells.

Conclusions

Although the Hall-Heroult electrolysis process was discovered more than one century ago, the behavior and optimization of the electrolysis cells are still challenging researchers around the world due to its complexity. Such behavior is the resultant of a wide range of self-interacting parameters. Some parameters are defined by the cell design (cell thermal insulation, production capacity, MHD situation), while other parameters are controlled by a computerized system (cell voltage drop, alumina feeding) and there are also parameters dependent on human interaction (anode changing, anode covering, bath corrections, aluminium tapping).

Because of the large scale production, fine tuning of such complex net of parameters can provide significant energy and cost savings and, as well, important reduction in harmful emission levels.

High technical and economical parameters for higher amperage reduction cell are provided with application of technical and technological actions: use of limit acid electrolyte (CR = 2.25-2.35); metal and bath optimum heights; settlement value of anode cathode distance; alumina concentration in the bath (1.5-3.5 %); use of sandy alumina type; application of integrated alumina systems AFS; increase of MHD stability.

Such technical decisions are provided increasing of electric power consumption 400-600 kWh/per t for primary aluminium for new project of aluminium smelters.

References

1. J. Marks. Global Anode Effect Performance: 2010 PFC Emissions Reduction Objective Met // Light Metals. - 2009. - Р. 251-257.

2. Kumar, A. Zaroni, and M. Jallaf. Initiatives to Reduce Anode Effect Frequency at Dubal // Light Metals. - 2009. - Р. 259.

3. Патент РФ №2011116273. Способ контроля технологических параметров электролита алюминиевого электролизера / Бажин В.Ю., Сизяков В.М., Лупенков А.В., Власов А.А., Фещенко Р.Ю. Опубл. 28.02.2012.

4. Патент РФ №2010134138. Катодное устройство электролизера для получения алюминия / Бажин В.Ю., Сизяков В.М. Власов А.А. Патрин Р.К. Опубл. 27.12.2011. Бюлл. №12.

5. V. Gusberti, D. S. Severo, B. J. Welch, M. Skyllas-Kazacos. Modelling the Aluminium Smelting Cell Mass and Energy Balance - a Tool Based on the 1st Law of Thermodynamics, 10th Australasian Aluminium Smelting Technology Conference, Launceston, Australia, 2011. - P. 934-940.

6. Свидетельство об официальной регистрации программы для ЭВМ №2012614704. Дискретное питание алюминиевого электролизера фторированным глиноземом / Петров П.А., Власов А.А., Выходцев Я.Н., В.Ю. Бажин. Опубл. 25.05.2012. Бюл. изобр.

7. Свидетельство об официальной регистрации программы для ЭВМ №2011615779. Программа управления алюминиевым электролизером по граничным значениям технологических параметров / Петров П.А., Белоглазов И.Н., Бажин В.Ю., Лупенков А.В., Власов А.А. Опубл. 22.07.2011. Бюл. изобр.

Рябинин К.В.

Аспирант, Пермский государственный национальный исследовательский университет ВИЗУАЛИЗАЦИЯ РЕЗУЛЬТАТОВ СЕКВЕНАЦИИ ПОСЛЕДОВАТЕЛЬНОСТЕЙ ДНК

Аннотация

В статье рассмотрено использование адаптивной мультиплатформенной клиент-серверной системы научной визуализации для решения задачи наглядного отображения результатов множественного выравнивания последовательностей ДНК и построения филогенетических деревьев.

Ключевые слова: научная визуализация, мобильные устройства, мультиплатформенность, OpenGL(ES).

Ryabinin K.V.

Postgraduate student, Perm State National Research University VISUALIZATION OF DNA SEQUENCING RESULTS

Abstract

The article is devoted to the automated creation of graphical representation for the DNA sequences multiple alignment results and building ofphylogenetic trees with help of adaptive multiplatform client-server scientific visualization system.

Keywords: scientific vizualization, mobile devices, multiplatform portability, OpenGL(ES).

Введение

В настоящее время научная визуализация является одним из наиболее востребованных и активно развивающихся направлений компьютерной графики. Существует большое количество прикладных программных продуктов и библиотек, которые предоставляют возможность строить наглядные изображения по большим объёмам входных данных, являющихся результатами каких-либо научных экспериментов. Эти входные данные, как правило, порождаются решателями (англ. solver) - программами, производящими математическое моделирование объектов и процессов, или, в более сложном случае, программно-аппаратными комплексами, производящими научный эксперимент с объектами реального мира. Однако, несмотря на значительное количество существующих средств научной визуализации, в данном направлении на сегодняшний день остаётся ещё ряд проблем, требующих проведения исследований и поиска эффективных решений.

В работах [1], [2], [3] нами был проведён анализ современных средств научной визуализации и сформулированы основные проблемы, присущие им:

1. Узкая специализация; отсутствие высокоуровневых средств интеграции со сторонними решателями.

2. Небольшое количество мультиплатформенных решений (то есть решений, способных работать под управлением различных операционных систем на высокопроизводительных вычислительных комплексах, настольных компьютерах и мобильных устройствах одновременно).

3. Недостаточная проработанность вопроса организации эффективной распределённой визуализации.

55

Для решения указанных проблем был разработан унифицированный подход к созданию систем научной визуализации, а затем на его основе была спроектирована и реализована система, получившая название SciVi.

Целью данной работы является тестирование и отладка системы научной визуализации SciVi на реальной научной задаче визуализации результатов множественного выравнивания последовательностей ДНК и построения филогенетических деревьев.

Ключевые особенности SciVi

Система научной визуализации SciVi является универсальной благодаря наличию эффективных высокоуровневых средств интеграции со сторонними решателями. Процесс интеграции происходит в полуавтоматическом режиме и основан на методах онтологического инжиниринга. Суть интеграции состоит в том, что пользователь, зарегистрировав интересующий его решатель в системе SciVi, получает возможность при помощи единого интерфейса управлять работой этого решателя и процессом визуализации генерируемых этим решателем данных. Принцип интеграции состоит в том, что при регистрации решателя система SciVi формирует описание его входных и выходных параметров. На основе входных параметров затем создаётся интерфейс управления решателем, а на основе выходных - шаблон графической сцены, в который затем подставляются генерируемые решателем данные. При наличии исходного кода решателя SciVi осуществляет поиск входных и выходных параметров автоматически, используя для этого онтологию синтаксических конструкций ввода-вывода различных языков программирования. В условиях отсутствия исходного кода пользователь должен сформировать список входных и выходных параметров самостоятельно (для чего SciVi предоставляет удобный графический интерфейс). Шаблон сцены также создаётся с участием пользователя. Он представляет собой связь выходных параметров решателя с визуальными образами, описанными в системе SciVi при помощи соответствующей онтологии.

Целевыми операционными системами для SciVi являются Windows, GNU/Linux, OS X, iOS и Android, то есть она может работать на ЭВМ различных классов (на высокопроизводительных вычислительных комплексах, настольных компьютерах и мобильных устройствах). Мультиплатформенность достигнута путём архитектурного деления SciVi на платформенно-независимое ядро и платформенно-зависимую прослойку, при этом наибольшая часть кода (порядка 85%) сосредоточена в ядре и написана на C++. Абстракция от функций операционной системы обеспечивается использованием разработанного в пермской IT-компании ООО «Ньюлана» фреймворка NFoundation, который предоставляет механизмы для работы с памятью, сетью, файлами и т. д. Для работы с графикой используются фреймворки NGraphics и NChart3D [4], разработанные в ООО «Ньюлана» при активном участии автора, а также распространяемые по лицензии BSD библиотеки научной визуализации семейства VTK [5]. Как фреймворки NGraphics и NChart3D, так и библиотеки семейства VTK используют для отображения графики стандарт OpenGL(ES), а потому совместимы со всеми вышеперечисленными операционными системами. NGraphics предоставляет базовые методы визуализации двумерных и трёхмерных сцен, воспроизведения анимации, работы со сложными материалами и освещением, а также организации интерактивности. NChart3D служит для построения графиков и диаграмм. VTK используется для эффективной организации специализированных режимов визуализации, таких как рендеринг сечений и объёмов.

Графический интерфейс пользователя строится при помощи модуля GUIBuilder [6]. Преимуществом этого модуля перед аналогами является его высокая эффективность в контексте совмещения графического интерфейса со сложной трёхмерной визуализацией: GUIBuilder основан на фреймворке NGraphics, то есть элементы управления рисуются на экране посредством OpenGL(ES), так же, как и подлежащая визуализации сцена. Такой подход обеспечивает использование одного графического контекста и одного графического API для отображения всех визуальных элементов на экране. Отсутствие переключения графических контекстов экономит время, требуемое на прорисовку каждого кадра, ускоряя процесс визуализации и увеличивая производительности приложения в целом. В особенности прирост производительности заметен на мобильных устройствах, вычислительная мощность которых заметно уступает настольным компьютерам. Кроме того, модуль GUIBuilder позволяет решить проблему двойного дизайна - необходимость разрабатывать графический интерфейс пользователя для настольных компьютеров и мобильных устройств по отдельности. GUIBuilder принимает на вход высокоуровневое декларативное описание интерфейса пользователя на языке XML, а затем в каждой конкретной операционной системе автоматически отображает нужные элементы управления и обеспечивает нужные механизмы взаимодействия с ними, извлекая необходимые данные и ресурсы из платформенно-зависимых субмодулей.

SciVi построена на принципах клиент-серверной архитектуры, при этом процесс визуализации адаптивно распределяется между клиентом и сервером. Планирование этого распределения является задачей сервера и осуществляется на основе эвристик: учитывается быстродействие клиента, загруженность сервера и скорость сетевого соединения. Сервер выполняет визуализацию тех данных, которые остаются неизменными в процессе интерактивного взаимодействия пользователя со сценой, например, текстур для трёхмерных моделей. Кроме того, сервер выполняет упрощение данных, подлежащих визуализации, и адаптацию их к аппаратным особенностям клиента. Затем эти данные отправляются клиенту по сети, и клиент строит итоговое изображение, обеспечивая максимальную интерактивность и плавность воспроизведения анимации.

Архитектура системы научной визуализации SciVi представлена на рис. 1.

Рис. 1. Архитектура системы научной визуализации SciVi

56

Высокое визуальное качество изображения, которое строится клиентом, обеспечивается использованием разработанного автором алгоритма адаптивного сглаживания границ объектов. Этот алгоритм основан на суперпозиции суперсемплинга [7] и быстрого аппроксимированного антиалиасинга [8]. Он является адаптивным, так как автоматически настраивается на аппаратные особенности конкретной платформы, а также предусматривает автоматическое отключение сглаживания на периоды, когда критична высокая скорость визуализации. К таким периодам относится динамическое изменение сцены в процессе интерактивного взаимодействия с ней пользователя и в процессе воспроизведения анимации.

Визуализация ДНК и филогенетических деревьев

В качестве одной из тестовых задач для системы научной визуализации SciVi была взята задача визуализации результатов множественного выравнивания последовательностей ДНК и построения филогенетических деревьев по этим последовательностям. В роли решателя использовалась программа Clustal [9]. Входными данными выступали результаты секвенации штамма бактерий, осуществлённой на базе Института экологии и генетики микроорганизмов УрО РАН (Пермь).

Результат секвенации представляет собой строки в некотором заранее заданном алфавите, каждая буква в котором соответствует определённому азотистому основанию (как правило, A - аденин, G - гуанин, С - цитозин, T - тимин, N -нераспознанное основание). Каждая строка соответствует одной из цепочек ДНК. Clustal обрабатывает эти строки, выполняя множественное выравнивание путём добавления символов пробела между буквами таким образом, чтобы в соответствующих позициях различных строк оказались по возможности одинаковые буквы. На основе множественного выравнивания осуществляется сравнение последовательностей ДНК и оценка степени их соответствия.

После множественного выравнивания Clustal формирует данные филогенетического дерева последовательностей. Филогенетическое дерево является наглядным способом отображения родственных связей между организмами, в данном случае -между носителями изучаемых ДНК.

Сервер SciVi подставляет данные, генерируемые программой Clustal, в шаблон сцены, и отправляет полученное описание сцены клиенту.

Визуализация ДНК осуществляется при помощи диаграммы последовательности, которая строится на клиенте SciVi средствами фреймворка NChart3D. Буквы алфавита заменяются прямоугольниками разных цветов; соответствие цветов буквам прописывается в легенде диаграммы. Результат визуализации представлен на рис. 2 (а).

Для визуализации филогенетических деревьев фреймворк NChart3D был расширен специальным типом диаграммы. Результат визуализации представлен на рис. 2 (б).

ООО Симулятор iOS - iPad / iOS 7,0.3 (11В508)

1-1F well E01 171008

4-6F HlllinilllHinillllllllllll lllllllllllllllllllllllilllllllll

3H1F lllllllllllllllllllllllllllll nil 111

2H1F lllllllllllllllllllllllllllllllllllllllllllllllllllllllllB llllllllllllllllllllll llllllll llllllllllllllllllll lllllllirillШМllllllllllllll

2-33F lllllllinillllllllllllllllllllllllllllllllllllllllllllllllllll llllllllllllllllllПII■IIIIBIIIIIIIIIIIIIIПIII■llillIIIIIIIIIIIIIIIIIIHIIIIIIIIII■IIIIIIIIIIIIIIIIIIIIIIINIIIIIIIIIII

2-32F III nil llllllll llllllll illllilllll Hill 1 1 II 1 llllllll NilIIIIIHI III 1 llllllll 1 lllll IIIIIIIIIIIIIIIIIIIIIIIIIIIIILIIIIIIII HIM

2-31F iiiiiiii iiiiiiiiiiiiiiiiiiiiiiiii и iiiiiiii iniinniiiiiiiiiiiiiiiiginiiiiiiiniiiiiiiiiiiniiini IIIIIIIIIIIIIIIMIIIIIIIIIIIIIIIIIIIIII llllllllllll III 111 llllllll lllll llllllllllll|i№

,1F iiiiiiii iiiiiimiiiiiiiiiiiiniiiiii ■■■■nn lllillllllllllllllllllllllllllllllllllllllllliniiil IHUIIIIIliyillNI II III HI III 1

1-1F iiniiiiiiiiiiniiiia ■iiiiiiiiiiiii

ЖТ1 378.33 756.67 1135.00

Рис. 2 - Визуализация последовательности ДНК (а) и филогенетического дерева (б)

В процессе решения описанной задачи было отлажено использование фреймворка для построения диаграмм NChart3D в составе системы научной визуализации SciVi, а также увеличена стабильность работы клиент-серверного взаимодействия в этой системе.

Система SciVi представляет собой удобный и эффективный инструмент для научной визуализации. Успешное её тестирование на реальных научных задачах доказывает жизнеспособность принятых архитектурных решений. В будущем планируется совершенствование SciVi путём расширения используемых в ней онтологий, портирования клиентской и серверной частей на другие платформы и улучшение эвристик, используемых при планировании адаптивного распределения рендеринга. Кроме того, планируется тестирование системы на других научных задачах из различных предметных областей.

Литература

1. Рябинин К.В. Разработка адаптивного мультиплатформенного визуализтора результа-тов научных расчётов для высокопроизводительных вычислительных систем. // XXII Международная конференция по компьютерной графике и машинному зрению «ГрафиКон'2012»: труды конф. (Москва, 1-5 октября 2012 г.). - М., 2012. - С. 193-198.

2. Рябинин К.В. Разработка мультиплатформенной клиент-серверной системы для научной визуализации // Научнотехнический вестник Поволжья. - Казань, 2013. - №2. - С. 197-203.

3. Ryabinin, K., Chuprina, S. Adaptive Scientific Visualization System for Desktop Computers and Mobile Devices // Procedia Computer Science. - 2013. - V. 18. -P. 722-731.

4. Рябинин К.В. Разработка мультиплатформенной библиотеки построения и визуализации диаграмм // Научная визуализация. - 2014. - К. 1, Т. 6, № 1. -С. 41-57.

5. Ahrens, J. A Parallel Approach for Efficiently Visualizing Extremely Large, Time-Varying Datasets / James Ahrens, Charles Law, Will Schroeder, Ken Martin, Michael Papka // Los Alamos National Laboratory. - Technical Report #LAUR-00-1620. - 2000.

6. Рябинин К.В. GUI-фреймворк для настольных компьютеров и мобильных систем // Актуальные проблемы механики, математики, информатики: сб. тез. науч.-практ. конф. (Пермь, 30 октября - 1 ноября 2012 г.) / гл. ред. В.И. Яковлев; Перм. гос. нац. исслед. ун-т. - Пермь, 2012. - 195 с.

7. Carmen Juan Lizandra, M. Graphic libraries for Windows programming // Crossroads, the ACM Student Magazine. - 2000. Vol. 6, Iss. 4 - P. 14-18.

8. Lottes, T. Fast Approximate Anti-aliasing [Электронный ресурс] URL:

http://developer. download. nvidia. com/assets/gamedev/files/sdk/ 11/FXAA_WhitePaper.pdf (дата обращения 28.04.2014).

9. Larkin, M. ClustalW and ClustalX version 2 / M.A. Larkin, G. Blackshields, N.P. Brown, R. Chenna, P.A. McGettigan, H. McWilliam, F. Valentin, I.M. Wallace, A. Wilm, R. Lopez, J.D. Thompson, T.J. Gibson, D.G. Higgins // Bioinformatics - 2007. Vol. 23, Iss. 21 - P. 2947-2948.

57

i Надоели баннеры? Вы всегда можете отключить рекламу.