Научная статья на тему 'Масштабная нейронаука и большие данные'

Масштабная нейронаука и большие данные Текст научной статьи по специальности «Медицинские технологии»

CC BY
147
39
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
БОЛЬШИЕ ДАННЫЕ / МАСШТАБНАЯ НЕЙРОНАУКА / МОЗГ / ПОВЕДЕНИЕ / ПСИХОЛОГИЯ
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по медицинским технологиям , автор научной работы — Сущин М.А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Масштабная нейронаука и большие данные»

вать качественный анализ и как эта связь между количественным и качественным подходами воплощается в разных методах получения исследовательских данных, например в интервью, глубоких case studies и т.д. Поиск данных - сложный процесс взаимодействия технологии и социальных практик, теории и эмпирии, не сводимый ни к одной из взаимодействующих сторон. Есть явная необходимость в разработке моделей поиска открытых исследовательских данных (поскольку спрос на такой поиск велик) на пути дальнейшего исследования феномена социально-технической системы, в которой, как в новой парадигме, современное общество и существует» (с. 18).

А.А. Али-заде

2019.04.007. М.А. СУЩИН. МАСШТАБНАЯ НЕЙРОНАУКА И БОЛЬШИЕ ДАННЫЕ. (Обзор).

Ключевые слова: большие данные; масштабная нейронаука; мозг; поведение; психология.

Человеческий мозг представляет собой, вероятно, наиболее сложный объект в известной Вселенной (6). Задачи понимания принципов его функционирования и порождения им высших форм поведения и познания, а также его отношения к сознанию, безусловно, являются одними из важнейших задач для всей современной науки (1). Последние годы развития нейронаук, находящихся на переднем рубеже решения этих задач, были отмечены возникновением целого ряда масштабных проектов и инициатив исследования мозга. Так, вслед за почти синхронно анонсированными в 2013 г. американским проектом The BRAIN (Brain Research through Advanced Innovative Neurotechnologies - исследование мозга при помощи передовых инновационных нейротехнологий) Initiative и европейским проектом The Human Brain Project аналогичные инициативы начали развиваться и в других странах и регионах мира.

В настоящее время к числу такого рода масштабных проектов относятся также другой американский проект The Human Connectome Project (Проект коннектом человека), японский проект The Brain / MINDS (Brain Mapping by Integrated Neurotechnologies for Disease Studies - картирование мозга посредством интеграционных нейротехнологий для изучения заболеваний), австралий-

ский проект The Brain Dialogue, а также реализуемые, соответственно, в Китае и Южной Корее инициативы The China Brain Project и The Korea Brain Initiative. (Кроме того, масштабная работа по изучению мозга ведется в Институте изучения мозга Аллена в Сиэтле (США) и в других крупных научных центрах мира.)

С данными проектами и инициативами связаны большие надежды, поскольку они могут помочь в постижении нейронных основ поведения, познания и сознания, в лечении нейродегенератив-ных заболеваний и психических расстройств (болезни Альцгеймера, шизофрении, аутизма и др.), а также в конструировании продвинутых интеллектуальных устройств в области искусственного интеллекта.

При этом почти одновременное появление такого количества масштабных проектов изучения мозга может радикальным образом трансформировать организацию ведения исследований в ней-ронауке. Так, по словам директора отдела биологических наук Национального научного фонда США (ННФ) Дж. Олдса, поскольку целью этих масштабных проектов является достижение существенного прогресса в понимании структуры и функционирования мозга человека, необходимо поддерживать научные подходы и методы, позволяющие наиболее продуктивно исследовать сложную нервную систему человека (содержащую около 1015 синапсов, которые оперируют на шкале миллисекунд). Даже организмы наподобие дрозофилы фруктовой или данио-рерио обладают мозгом такой степени сложности, что для достижения полного понимания его структуры и принципов работы требуются большие коллективные проекты (6, с. 601). Соответственно, недавние масштабные инициативы изучения мозга, по мнению Дж. Олдса, знаменуют собой необходимость перехода в нейронауке от традиционных видов исследований, выполняемых отдельными коллективами под руководством одного лидера (single-principal-investigator (PI)-led projects), к коллективной или командной форме организации исследований.

Масштабные коллективно организованные научные и научно-технологические проекты возникли в XX в. Первым такого рода проектом стал Манхэттенский проект. На пике работ в Манхэт-тенском проекте было задействовано более 125 тыс. человек. Позднее масштабные коллективно организованные проекты ус-

пешно реализовывались как в физике и астрономии (например, исследования, проводимые при помощи Большого адронного кол-лайдера в ЦЕРНе и лазерно-интерферометрической гравитационно-волновой обсерватории в США), так и в науках о жизни (проект «Геном человека»).

Как отмечает Дж. Олдс, переход к коллективно организованной форме исследований в нейронауке означает не только вовлечение большего количества исследователей, но и возросшую стоимость самих исследований (6, с. 601). Так, расходы на исследования на базе лазерно-интерферометрической гравитационно-волновой обсерватории на два порядка превосходили размер среднестатистического гранта, выдаваемого ННФ. В области нейронауки проекты, направленные на составление описания всех связей в нервной системе организма (известного как коннектом), основываются на сложных рабочих процедурах, включающих приготовление тканей в промышленном масштабе, затратные методы визуализации, а также наличие актуального программного и аппаратного обеспечения для сегментации и реконструирования данных. Все это ведет к переоценке традиционной системы финансирования исследований в нейронауке.

«Переход к коллективной нейронауке, - пишет Дж. Олдс, -ставит вызовы перед всеми участниками исследований в этой сфере» (6, с. 601). Научные фонды будут ориентироваться на поддержку коллективной нейронауки, а непосредственно сами нейро-ученые окажутся вовлечены в широкий междисциплинарный контекст, требующий взаимодействия с математиками, физиками, инженерами и специалистами из других областей. Вовлечение в широкий междисциплинарный контекст может привести к изменению навыков и квалификации будущего поколения нейроученых, когда от одного исследователя будет требоваться обладание многими умениями, например работать с электрофизиологической аппаратурой, владеть языками программирования (например, Python) и т.п. Поэтому нейронаука, считает Дж. Олдс, должна эволюционировать в направлении сотрудничества и кооперации, а не соперничества, и пример физики и астрономии показывает, что эта цель является достижимой (6, с. 602).

С интенсивным развитием наук о мозге в последние годы связаны и определенные технологические вызовы и проблемы.

Так, например, один из руководителей американского проекта The BRAIN Initiative нейроученый Р. Юсте выразил надежду на успех в разработке новых нейротехнологий, которые позволили бы «регистрировать "каждый потенциал действия каждого нейрона" в нейронной цепи» (8, с. 727). По его мнению, попытка понять принципы работы мозга на основе регистрации активности отдельных нейронов подобна попытке понять «телевизионную программу на основе наблюдения за единичным пикселем»1. Вполне естественно, что после старта таких масштабных инициатив в США и Европе были высказаны предположения, что в ближайшее десятилетие в нейронауке можно ожидать «беспрецедентного количества новых данных на беспрецедентном уровне детализации, определенно относящихся к животным и, возможно, к человеку» (5, с. XII-XIII).

Между тем даже менее масштабные исследовательские проекты в нейронауке в настоящее время производят огромное количество новых данных. Например, в рамках реализуемого в Тайване проекта по картированию мозга дрозофилы фруктовой за 10 лет ученым удалось картировать 60 тыс. нейронов со средним объемом результатов порядка 1 Гб на каждую клетку (4, с. 559).

Используемая в нейробиологических лабораториях световая микроскопия позволяет получать изображения с разрешением 0,25-0,5 мкм. Этой разрешающей способности достаточно для получения изображений тела индивидуальных нейронов, однако для того, чтобы получить изображения синапсов (места контакта двух нейронов), требуется уже нанометровая разрешающая способность электронных микроскопов. Ясно, что большее разрешение означает меньший угол обзора и большее количество изображений, что, в свою очередь, требует больше места.

Как утверждает заведующий лабораторией нейровизуализа-ции Университета Южной Калифорнии в Лос-Анджелесе А. Тога, в настоящее время нейроученые типичным образом имеют дело даже не с гигабайтами, а с терабайтами информации. При этом 2 Тб информации способны заполнить жесткий диск большей части современных настольных компьютеров. Просто задача переноса этого объема информации в другое место, отмечает А. Тога,

1 Marcus G., Freeman J. Preface // The future of the brain: Essays by the world's leading neuroscientists / Ed. by G. Marcus, J. Freeman. - Princeton: Princeton univ. press, 2014. - P. XI-XII.

«представляет собой проблему»1. Поэтому революция больших данных в нейронауке и, например, в генетике носит другой характер: объем данных единичного нейровизуализационного исследования может измеряться в терабайтах, что на два или три порядка больше объема данных секвенирования генома млекопитающих (4, с. 559).

Если вернуться к уже упомянутому исследованию мозга дрозофилы фруктовой, то результаты картирования 1 тыс. нейронов (менее 1% от общего числа нейронов в мозге этого организма -135 тыс.) занимают объем в 1 Тб. А для того чтобы картировать кору мозга человека в рамках проекта «Коннектом человека», исследователям пришлось проанализировать 6 Тб данных, полученных с помощью МРТ от 210 здоровых взрослых испытуемых (4, с. 560). Наконец, электрофизиологические исследования становятся более требовательными и в вычислительном отношении. Сегодня исследователи способны регистрировать активность сотен нейронов за единицу времени. Однако, по словам нейроученого из Женевского университета А. Пуже (A. Pouget), вскоре нейроуче-ные окажутся в состоянии регистрировать активность тысяч и сотен тысяч нейронов единовременно (4, с. 560).

Чтобы сделать столь объемные результаты экспериментальных исследований пригодными для анализа и последующей обработки, нейроученые разрабатывают соответствующие алгоритмы сжатия массивов данных. Например, регистрация активности в мозге мышей в течение 20 мин. может дать запись размером в 500 Пб информации, на которой разрядка нейронов представлена изменением значений отдельных пикселей. После изоляции отдельных нейронов и прикрепления к ним временных штампов в момент разрядки этот объем можно сократить до более поддающихся анализу 500 Гб (4, с. 560). Соответственно, для получения значимых сведений сырые данные нуждаются в последующей обработке.

То же самое относилось и к техникам секвенирования генома, до того как появились компьютерные алгоритмы, позволяющие конвертировать изображения спиралей в последовательности

1 Landhuis E. Neuroscience: Big brain, big data // Nature. - 2017. - Vol. 541, N 7638. - P. 559-561.

нуклеотидов А, Г, Ц, Т. Таким образом, по мнению нейроученого Ф. Энгерта из Гарвардского университета, нейроученые должны сосредоточиться на разработке эффективных алгоритмов извлечения и сжатия нужных данных. Между тем на этом пути они могут столкнуться с проблемой парадигмального характера, поскольку в настоящее время отсутствует модель, которая бы напрямую связывала активность нейронов с поведением, памятью или познанием (4, с. 560).

Именно отсутствие организующей теории в нейронауке часто рассматривается в качестве главной проблемы на пути масштабных проектов изучения мозга. Как пишет по этому поводу известный философ Н. Блок: «Значительные объемы новых данных об активациях нейронов в высоком разрешении являются бесполезными без понимания того, что активации нейронов делают на психологическом уровне. Как только мы будем располагать теорией на психологическом уровне, данные о мозге в высоком разрешении могут сообщить нам, делает ли теория верные предсказания. Но без теории на психологическом уровне данные не обладают пользой вне зависимости от того, сколь высоким является разрешение» (2, с. 164). Схожей точки зрения придерживается и нейроученый И. Фрегнац (У. Frëgnac), утверждая, что новые масштабные проекты изучения мозга и «индустриализация нейронау-ки» ведут к рискам «создания научного пузыря, наполненного экономическими и политическими обещаниями, за счет постепенно развивающихся подходов в фундаментальных исследованиях, основанных на разнообразии дорожных карт и теоретически вдохновленных гипотез» (3, с. 470). По его мнению, «в случае неумелого руководства доминирование меганауки может привести к пересыханию традиционных источников финансирования и исчезновению менее масштабных и рационально организованных исследовательских программ, которые все еще являются главным источником прорывных открытий» (3, с. 476).

Отсутствие направляющей теории в нейронауке в контексте эпохи больших данных и масштабных проектов изучения мозга отмечается также в работе Т. Сейновски, П.С. Черчленд и Дж.Э. Мовшона. С их точки зрения, наступление эры больших данных в нейронауке знаменует собой смену исследовательских установок - переход от множества изолированных «вертикаль-

ных» исследований, которые применяют отдельные методы для прояснения отдельных вопросов, относящихся к отдельным видам, к более «горизонтально» организованным исследованиям, «которые интегрируют данные, собранные с помощью широкого ряда техник, проблем и видов» (7, с. 1440).

По замечанию Т. Сейновски, П.С. Черчленд и Дж.Э. Мов-шона, повсеместное распространение больших данных в нейро-науке может нести с собой не только новые возможности, но и определенные угрозы. Помимо уже указанного выше отсутствия организующей теории в нейронауке, авторы выделяют еще четыре проблемы использования больших данных в науках о мозге.

Во-первых, данные в нейронауке аккумулируются с помощью широкого круга методов, от метода локальной фиксации потенциала (patch clamping) до оптогенетики. По большей части эти методы используются в исследованиях изолированно. Из различий между этими методами, утверждают авторы, следует, что стандартизация в нейронауке должна проводиться с учетом конкретных методов и что интеграция данных, собранных на разных уровнях с применением различных методов, не может быть с легкостью автоматизирована (7, с. 1440).

Во-вторых, как известно, для экспериментов в нейронауке используются разные организмы, включая человека. В связи с этим интеграция данных, относящихся к разным организмам, потребует углубленных знаний из сравнительной и эволюционной нейробиологии (7, с. 1441). Кроме того, традиционно в экспериментах круг поведенческих реакций организмов ограничивался для удобства работы экспериментаторов. Большие данные позволяют регистрировать активность тех же самых нейронов, допуская участие организма в более широком поведенческом контексте. Трудность здесь, полагают Т. Сейновски, П.С. Черчленд и Дж.Э. Мовшон, состоит в том, чтобы связать большие нейронные данные и большие поведенческие данные (7, с. 1441).

В-третьих, интеграция функциональных данных в нейронау-ке в настоящий момент осуществляется в отдельных лабораториях, исследователи которых взаимодействуют между собой. Между тем этот способ взаимодействия и обмена данными имеет свои ограничения, поскольку отдельным исследователям тяжело быть в курсе всех последних технологических новаций и в особенности

данных, которые могут оказаться значимыми в будущем, при появлении новых технологий. Для изменения этой ситуации, по мнению авторов, необходимо пересмотреть подход к обмену данными между лабораториями (7, с. 1441).

В-четвертых, увеличение объема и сложности комплексов данных в науках о мозге делает более сложной задачу их анализа и извлечения ценных выводов. Здесь возникает необходимость в новых подходах к анализу данных с использованием обнаруживающих паттерны (pattern-searching) алгоритмов, разработанных в области статистики и машинного обучения. Так, в одном из недавних исследований самообучающаяся программа была использована для установления связей между зарегистрированной нейронной активностью и поведением1. В этом случае, замечают Т. Сейновски, П.С. Черчленд и Дж.Э. Мовшон, статистическая организация экспериментов будет иметь решающее значение в плане пригодности получаемых данных для последующего анализа и возможности их использования другими исследователями для решения других задач (7, с. 1441).

В заключение необходимо еще раз отметить, что новые масштабные проекты в нейронауке и получаемые с их помощью массивы данных открывают небывалые возможности для понимания принципов работы мозга, а также для лечения пациентов с повреждениями мозга и расстройствами психики. Вместе с тем извлечь максимальную пользу из этих массивов можно только с помощью теории деятельности мозга. Поэтому разработка единой теории мозга и разума должна занять центральное место в поисках нейроученых и когнитивных ученых.

Список литературы

1. Анохин К.В. Коды вавилонской библиотеки мозга // В мире науки. - 2013. -№. 5. - С. 82-89.

2. Block N. Consciousness, big science, and conceptual clarity // The future of the brain: Essays by the world's leading neuroscientists / Marcus G., Freeman J. (ed.). -Princeton: Princeton univ. press, 2014. - P. 161-176.

1 Discovery of brainwide neural-behavioral maps via multiscale unsupervised structure learning / Vogelstein J.T., Park Y., Ohyama T., Kerr R.A., Truman J.W., Priebe C.E., Zlatic M. // Science. - 2014. - Vol. 344, N 6182. - P. 386-392.

3. Frégnac Y. Big data and the industrialization of neuroscience: A safe roadmap for understanding the brain? // Science. - 2017. - Vol. 358, N 6362. - P. 470-477.

4. Landhuis E. Neuroscience: Big brain, big data // Nature. - 2017. - Vol. 541. -P. 559-561.

5. Marcus G., Freeman J. Preface // The Future of the brain: Essays by the world's leading neuroscientists / Marcus G., Freeman J. (ed.). - Princeton: Princeton univ. press, 2014. - P. XI-XIII.

6. Olds J.L. The rise of team neuroscience // Nature reviews neuroscience. - 2016. -Vol. 17, N 10. - P. 601-602.

7. Sejnowski T.J., Churchland P.S., Movshon J.A. Putting big data to good use in neuroscience // Nature neuroscience. - 2014. - Vol. 17, N 11. - P. 1440-1441.

8. Yuste R. The origins of the BRAIN Initiative: A personal journey // Cell. - 2017. -Vol. 171, N 4. - P. 726-735.

i Надоели баннеры? Вы всегда можете отключить рекламу.