Научная статья на тему 'ОСНОВАННЫЕ НА ДНК СИСТЕМЫ ХРАНЕНИЯ ДАННЫХ'

ОСНОВАННЫЕ НА ДНК СИСТЕМЫ ХРАНЕНИЯ ДАННЫХ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
57
11
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДНК / КОДИРОВАНИЕ / АРХИВАЦИЯ / КОД ХАФФМАНА / БИОТЕХНОЛОГИИ / ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ / ДАННЫЕ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Нечай-Гумен А.В.

Статья посвящена проблеме разработки системы хранения данных в основе которых лежит ДНК. Также рассмотрены особенности кодирования информации в этой системе и дальнейшие направления её развития.The article is devoted to the problem of development of DNA-based archival storage system. Also, describes features of encoding in this system and its further directions of development.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Нечай-Гумен А.В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «ОСНОВАННЫЕ НА ДНК СИСТЕМЫ ХРАНЕНИЯ ДАННЫХ»

3. Эли Шрагенхайм, Уильям Детмер «Производство с невероятной скоростью: Улучшение финансовых показателей предприятия». -М.: Альпина Паблишер, 2010

4. Ангелина Яковлева «Информационные системы в экономике». -М.: Литрес,2015

5. Олейник П.П. «Корпоративные информационные системы: для бакалавров и специалистов». -М.: Питер, 2012

УДК 004.08/577.21

Нечай-Гумен А.В. студент бакалавриата 3 курса факультет «Информатика и вычислительная техника»

Барашко Е.Н.

научный руководитель, стпреподаватель Донской Государственный Технический Университет

Россия, г. Ростов-на-Дону

ОСНОВАННЫЕ НА ДНК СИСТЕМЫ ХРАНЕНИЯ ДАННЫХ

Статья посвящена проблеме разработки системы хранения данных в основе которых лежит ДНК. Также рассмотрены особенности кодирования информации в этой системе и дальнейшие направления её развития.

Ключевые слова: ДНК, кодирование, архивация, код Хаффмана, биотехнологии, информационные технологии, данные.

DNA-BASED ARCHIVAL STORAGE SYSTEM

The article is devoted to the problem of development of DNA-based archival storage system. Also, describes features of encoding in this system and its further directions of development.

Keywords: DNA, encoding, archiving, Huffman code, biotechnology, information technologies, data.

В наши дни, когда накоплено невообразимое количество данных, становится актуальной проблема их длительного хранения. Нынешние средства хранения рассчитаны на 5-10 лет для жестких дисков и 15-30 лет в случае магнитной ленты, после чего возникают ошибки и необходимость их перезаписи на новый носитель. Также, очень важным моментом является емкость носителя: сейчас лидирует магнитная лента - 185 ТБ на катушку (плотность записи примерно 10 ГБ/мм3) и еще не используемая технология записи на оптический диск с емкостью в 1 ПБ (100 ГБ/мм3).

Соответственно, возникает вопрос: «Как сохранить данные для наших далёких потомков?». На 2016 год в мире накоплены примерно 16 зеттабайт информации и их сохранение займёт миллионы единиц носителей, для которых необходима соответствующая инфраструктура обслуживания. К тому же, их придётся обновлять каждые ~30 лет (в идеальном случае). Обе эти проблемы решает система хранения данных, основанная на синтетически

синтезированных ДНК. Она имеет теоретический предел плотности равный 1 ЭБ (экзабайт)/мм3 и период полураспада более 500 лет в жестких условиях.

Одним из основных преимуществ данной технологии также является то, что человечеству, как форме жизни, в основе которой лежит ДНК, будет крайне выгодно развивать это направление исследований. Секвенцирование и синтез ДНК в наши дни - довольно распространённая практика, используемая повсеместно, как в биотехнологических исследованиях, так и в клиниках для диагностики и непосредственно терапии.

Однако, есть и минусы, один из которых - большое время доступа к данным. Если расположить средства хранения данных в своеобразной иерархии по времени доступа, то на самом верху будет флеш-память с временем доступа в считанные миллисекунды. За ней следуют традиционные HDD - десятки миллисекунд, потом магнитная лента - минуты и уже в самом низу окажутся основанные на ДНК хранилища - десятки часов. Еще одним весомым недостатком является высокая стоимость синтезирования и секвенцирования ДНК.

Первые успехи в сохранении данных в синтезированных ДНК были достигнуты в 1999 году, когда закодировали и восстановили 23-х символьное сообщение, а в 2013 году исследователи уже успешно восстановили сообщение в 739 кб. Рост возможностей данной технологии происходит экспоненциально и подчиняется закону Мура. На сегодняшний день объём синтезированных данных ограничен лишь стоимостью синтеза и секвенцирования. Пока их стоимость довольно высока, однако, с развитием биотехнологий падает в разы.

В ходе работы исследователи столкнулись с некоторыми затруднениями, связанными с особенностями строения ДНК. Каждый нуклеотид ДНК содержит одно из четырёх азотистых оснований — гуанин (G), аденин (A), тимин (T) и цитозин (C). Так как ДНК состоит из четырёх оснований, наиболее логичным вариантом было бы использование четверичной системы счисления. То есть, провести четкое соответствие между цифрами и нуклеотидами (0,1,2,3 записывать как A,C,G и T соответственно). Однако, в таком случае стабильность нитей оставляла желать лучшего: при появлении длинных последовательностей из одного нуклеотида (гомополимеров) возникают риски разрушения структуры и распадения нити ДНК.

Потому, для снижения вероятности ошибок при секвенцировании, было принято решение использовать троичную систему счисления. При переходе на неё теряется до 25% информационной ёмкости, однако значительно повышается стабильность нитей. Непосредственные реализации кодировки несколько отличаются.

В первом случае использовали три нуклеотида для кодирования и один для разделения их на блоки, во избежание появления гомополимеров. Однако, эта система всё еще имела множество недостатков: в самом блоке вполне были возможны повторения, что ослабляло структуру.

Потому было решено систему кодирования усложнить и использовать код Хаффмана и кодирование со сдвигом (таблицы 1,2).

Таблица 1

Перевод двоичных данных в форму ДНК-цепочки с использованием _кода Хаффмана_

Двоичные данные P 01010000 o 01101111 l 01101100 y 01111001 a 01100001 00111011

Троичная система в кодировке Хаффмана 12011 02110 02101 222111 01112 222021

ДНК нуклеотиды GCGAG TGAGT ATCGA TGCTCT AGAGC ATGTGA

Таблица 2

Кодирование со сдвигом нуклеотидов во избежание появления _гомополимеров_

Выбор нуклеотида для кодирования Предыдущий нуклеотид

A C G T

Кодируемое троичное число 1 C G T A

2 G T A C

3 T A C G

В результате экспериментов, проведённых исследователями, были получены впечатляющие результаты информационной плотности в 2.2 петабайта на грамм биологического материала, а также сроков хранения информации: эксперимент позволяет утверждать, что спустя 100 лет хранения (в надлежащих условиях) потребуется всего 10 копий для 99,99% вероятности их успешного восстановления.

Так образом, можно утверждать, что у основанных на ДНК системах хранения данных имеется потенциал стать почти идеальным решением для архивации данных благодаря их высокой информационной плотности и длительному сроку хранения. На данный момент проблемой остаётся высокая стоимость записи и чтения (т.е. синтезирования и секвенцирования ДНК), но с дальнейшим развитием биотехнологий, эта проблема наверняка будет решена. Так же, само развитие основанных на ДНК систем хранения данных даст толчок развитию сопутствующих биотехнологий.

Использованные источники:

1. A DNA-Based Archival Storage System URL: https://homes.cs.washington.edu/~bornholt/papers/dnastorage-asplos 16.pdf (дата обращения 07.12.2016)

2. A Rewritable, Random-Access DNA-Based Storage System

URL: https://arxiv.org/pdf/1505.02199v1.pdf (дата обращения 07.12.2016)

3. Goodbye Silicon, Hello DNA. The Future of Data Storage? URL: http://science.time.com/2013/01/24/goodbye-sincon-hello-dna-the-future-of-data-storage/#ixzz2JAGTgDCT (дата обращения 07.12.2016)

4. Why DNA Will Someday Replace the Hard Drive URL: http://mashable.com/2013/01/23/dna-replace-hard-drive/#piTE.kF7ikqS (дата обращения 07.12.2016)

УДК 364.027(470.45)

Нухрадинова З.Н. студент магистратуры 2 курса Институт истории, международных отношений и социальных технологий кафедра социальной работы и педагогики

Волгоградский государственный университет

Россия, г. Волгоград

ОРГАНИЗАЦИЯ КОНТРОЛЯ КАЧЕСТВА ПРЕДОСТАВЛЕНИЯ СОЦИАЛЬНЫХ УСЛУГ ПРИ ОПТИМИЗАЦИИ СОЦИАЛЬНОЙ РАБОТЫ С

ПОЖИЛЫМИ ЛЮДЬМИ (НА ПРИМЕРЕ ГБУ СО «ЦЕНТРАЛЬНЫЙ ЦСОН») Аннотация: В данной статье рассматривается организация контроля качества оказания социальных услуг учреждениями социального обслуживания. Являясь подсистемой социальной сферы общества, социальное обслуживание оказывает существенное влияние на развитие личности, социальных групп и общества в целом.

Грамотно организованный контроль в учреждении социального обслуживания позволяет формировать у пожилых граждан, находящихся в сложной жизненной ситуации, социальную субъектность, т.е. способность удовлетворять и развивать свои интересы и потребности с помощью социальных институтов, учреждений и организаций общества, улучшать качество жизнедеятельности, а учреждению - обеспечивать обратную связь, необходимую для саморазвития системы.

Ключевые слова: социальная работа, контроль качества, социальные услуги, пожилые люди, оптимизация, эффективность.

Nuradinova Z. N. student 2 course

Institute of history, international relations and social technologies

Department of social work and pedagogy Volgograd state University

Russia, Volgograd

THE ORGANIZATION QUALITY CONTROL OF SOCIAL SERVICES IN THE OPTIMIZATION OF SOCIAL WORK WITH OLDER PEOPLE Abstract: This article discusses the organization of quality control of social services by social service agencies. As a subsystem of the social sphere of society, social services has a significant impact on the development of personality, social

i Надоели баннеры? Вы всегда можете отключить рекламу.