Вісник НАН України. 2018. № 10. С.44-51
https://doi.org/10.15407/visn2018.10.044
КОРНЕЛЮК Олександр Іванович —
член-кореспондент НАН України, доктор біологічних наук, професор, завідувач відділу білкової інженерії та біоінформатики Інституту молекулярної біології і генетики HAH України
КОМП’ЮТЕРНІ ГРІД-ТЕХНОЛОГІЇ ТА ЇХ ЗАСТОСУВАННЯ В МОЛЕКУЛЯРНІЙ БІОЛОГІЇ
За матеріалами наукової доповіді на засіданні Президії НАН України 12 вересня 2018 року
У доповіді наведено огляд розвитку комп’ютерних грід-технологій та їх застосування в молекулярній біології. У рамках Українського національного гріду створено віртуальну лабораторію MolDynGrid для вирішення завдань у галузях структурної біології та біоінформатики, зокрема моделювання молекулярної динаміки білків. Віртуальна організація VO:moldyngrid інтегрована в EGI і є частиною її інфраструктури. На прикладі досліджень мутантних форм аміноацил-тРНК синтетаз, пов’язаних з нейродегенеративними захворюваннями, показано ефективність грід-технологій для моделювання динаміки білків. Коротко описано інші віртуальні організації біологічного та медичного профілю у складі Українського національного гріду. Обговорено перспективи грід-технологій для розвитку нанобіотехнологій та створення нових біомедичних препаратів в Україні.
Ключові слова: грід-технології, Український національний грід, MolDynGrid, моделювання білків, молекулярна динаміка.
Комп’ютерна біологія, або біологія in silico — це міждисциплінарна галузь науки, що використовує досягнення молекулярної біології, біофізики, генетики, інформатики, обчислювальної техніки, прикладної математики і статистики для вирішення біологічних проблем. На сьогодні методом рентгеноструктурного аналізу встановлено просторові структури понад 100 000 протеїнів та їх комплексів, які депоновані в базі даних Protein Data Bank (PDB, http://www.rcsb.org/). Однак координати молекул, отримані методом рентгеноструктурного аналізу, є статичними, а їх конформації в фізіологічних умовах у розчині та у складі макромолекулярних комплексів можуть суттєво відрізнятися одна від одної. У випадках, коли немає експериментальних даних щодо просторової організації досліджуваного протеїну або його структурного комплексу з субстратами, ефективною альтернативою стають методи комп’ютерної структурної біології, або біології in silico.
Комп’ютерна біологія і біоінформатика використовують комп’ютерні технології при аналізі та систематизації генетичної інформації, створенні баз даних, розробленні нових алгоритмів для аналізу інформації, закодованої в експериментальних даних геноміки, транскриптоміки, протеоміки та структурних базах білків. Важливою причиною інтенсивного розвитку біоінформатики стало завершення багатьох геномних досліджень, зокрема розшифровки геному людини, та перехід молекулярної біології в постгеномну еру. Структурна біоінформатика використовує методи комп’ютерного аналізу для моделювання просторової структури білків і складних макромолекулярних комплексів та для аналізу механізмів молекулярного впізнавання. Важливою метою структурної біоінформатики є створення селективних модуляторів функціональної активності біополімерів, які можуть стати прототипами нових лікарських препаратів. Розвиток методів структурної біоінформатики зумовив появу можливостей для створення нових лікарських препаратів за допомогою комп’ютерного дизайну специфічних інгібіторів ферментів. Слід зазначити, що розроблення нового фармацевтичного препарату потребує близько 10 років, а його вартість у середньому становить приблизно 500 млн доларів. Застосування комп’ютерних методів дає змогу істотно прискорити процес створення нових лікарських препаратів та зменшити його вартість.
Комп’ютерні грід-технології широко застосовують у сучасній молекулярній біології для проведення обчислень, що потребують значних комп’ютерних потужностей та оперують великими об’ємами пам’яті [1, 2]. Грід — це інфраструктура засобів обчислень, яка складається з окремих географічно розподілених комп’ютерних ресурсів: процесорів, оперативної пам’яті, зовнішньої пам’яті, файлів та баз даних. Грід-інфраструктура забезпечує просторово розподілене операційне середовище з гнучким, безпечним і скоординованим розділенням ресурсів для виконання обчислень у віртуальних організаціях.
В Україні створено сучасну грід-інфраструктуру — Український національний грід (УНГ) — у рамках виконання Державної цільової науково-технічної програми з впровадження і застосування грід-технологій на 2009–2013 роки (науковий керівник — академік НАН України А.Г. Загородній) [3]. Проведено системну інтеграцію елементів Української грід-інфраструктури у європейську і світову грід-інфраструктуру, українських науковців залучено до унікальних сучасних експериментів та комп’ютерної обробки їх результатів у віртуальних наукових співтовариствах. Для керування сегментом виділено спеціальні сервери, які підтримують такі сервіси, як реєстрація обчислювальних ресурсів, інформаційна служба ресурсів гріду, сервіс керування сертифікатами користувачів та обчислювальних ресурсів, система моніторингу грід-сегмента.
В Інституті молекулярної біології і генетики НАН України за підтримки Державної цільової науково-технічної програми з впровадження і застосування грід-технологій створено та успішно працює 360-процесорний обчислювальний кластер (рис. 1). Кластер ІМБГ НАН України функціонує під керуванням операційної системи Scientific Linux 6.2 Carbon x86-64, на якій інстальовано необхідне програмне забезпечення. Використовується елемент збереження даних uSystem ErgoLAN 6036T-3RF-36 об’ємом близько 100 ТБ. Кластер з’єднаний оптоволоконною лінією з пропускною здатністю 10 Гбіт/c через мережу UARNET.