Інститут харчової біотехнології та геноміки НАН України

Формування порталу CyberPlantUA як логічного етапу еволюційного розвитку інформаційних ресурсів та сервісів, розвинутих в Інституті (CSModDB і GMPlantsGW) надаватиме ряд переваг для наукової спільноти України. Зокрема, більш детальна спеціалізація сервісу для проведення досліджень у галузі клітинної біології, молекулярної генетики та філогенії рослин, верифіковані алгоритми для пошуку та аналізу цільових мішеней, аналіз інформації про структуру геномів рослин, а також кваліфікована підтримка аналітичної групи Державної установи «Інститут харчової біотехнології та геноміки Національної академії наук України». Завдяки розвитку плідної співпраці з іншими організаціями НАН України колектив проекту пропонує реалізацію ідеї, яка сприятиме об’єднанню науковців, а, в перспективі, і комерційних організацій для вирішення задач біології рослин, актуальних не лише для наукової спільноти України, але розвитку міжнародних платформ співробітництва у цьому напрямку.
Розділи web-порталу CyberPlantUA будуть включати розроблені бібліотеки та бази даних єдиної системи аналізу, зокрема у 2020-му році будуть інтегровані напрацювання у галузі:
· даних генетично-модифікованих рослин;
· молекулярної філогенетики цільових мішеней цитоскелету (*.fasta бібліотеки тубулінів, FtsZ-білків, БАМів, кінезинів, протеїнкіназ та протеїнфосфатаз, ацетилтрансфераз послідовностей тощо);
· розробки біологічно-активних речовин (побудова системи віртуального скринінгу в аспекті задач рослинної біології, яка раніше була реалізована колективом на прикладі віртуальної грід-організації CSLabGrid);
· даних просторових структур білків цитоскелету.
Слід зазначити, що аспекти таргетних бібліотек у відкритому доступі web-порталу CyberPlantUA є дуже актуальними в економічному плані у зв’язку з існуванням патогенних ліній і штамів збудників захворювань сільськогосподарських рослин, які специфічні саме для України. Більше того, що за доступністю сервісів web-портал CyberPlantUA буде сайтом напіввідкритого типу, тобто для повного доступу до інструментів і репозиторіїв буде необхідно пройти безкоштовну реєстрацію.
За схемою подання інформації, її обсягом і типом задач web-порталу CyberPlantUA буде відноситись до змішаного типу веб-ресурсів. Відповідно до розробленої концепції, web-ресурс CyberPlantUA буде містити декілька елементів: інтернет-портал, інформаційний ресурс і набір веб-сервісів. Перший (інтернет-портал) буде представляти собою багатокомпонентну розгалужену структуру, скомпоновану з функціонально самодостатніх підрозділів відкритого і закритого типів. В свою чергу, інформаційний ресурс буде об’єднувати тематичні сторінки.
За технологією відображення інформації ресурс CyberPlantUA буде також мати змішану природу. Тобто передбачається, що статичні сторінки html будуть доповнюватися базами даних, які будуть побудовані із застосуванням динамічних сторінок-шаблонів (CSS - Cascading Style Sheets), які у свою чергу будуть формуватися за запитом в режимі взаємодії статичних таблиць і баз даних, що будуть містити інформацію, скрипти і графічний контент у виді дискретних файлів.
У аспекті соціального та економічного значення проекту слід зауважити відсутність на сьогодні в Україні професійної соціальної мережі, що виконує функцію дискусійної платформи спілкування наукової спільноти біологів рослин, викладачів вузів, фахівців суміжних галузей (хіміки, програмісти, математики, тощо), бізнесу, та ін. Так, існує брак обміну інформацією, обговорення семантичної складової нових термінів. В останній час це особливо актуально у зв’язку із інвазією нових термінів, які у більшості випадків є калькою з англійської мови (приклад - біоінформаційні методи / біоінформатичні методи та ін.), а також відкритих репозитаріїв для результатів наукових досліджень.
Немає жодного сумніву, що одним із найбільш фундаментальних і складних питань біології є коректна систематика видів. Розвиток молекулярної біології і біоінформатики відкрив новий етап у цій найбільш традиційній галузі біології. Послідовності генів і білків стали невід’ємними факторами, що враховуються під час філогенетичних досліджень. Один з розділів ресурсу CyberPlantUA буде присвячено питанням молекулярної філогенетики і екстраполяції її результатів на традиційні постулати систематики рослин. Планується створення як галерей зображень філогенетичних дерев, побудованих із використанням різних біополімерів, так і репозиторіїв вихідних файлів в форматі *.fasta для їх вільного завантаження користувачами ресурсу. Зараз, подібні сервіси в Україні відсутні.
Іншим запланованим сервісом має стати блок, присвячений вирішенню комплексу обчислювальних задач, пов'язаних з дослідженням молекулярної організації цитоскелету (в тому числі рослинного), дослідження механізмів клітинного поділу, а також розкриття потенціалу основних білків цитоскелету і асоційованих з ним білків (БАМ, протеїнкінази, протеїнфосфатази та ін.) як перспективних молекулярних мішеней для біологічно активних сполук. Стратегічно, обчислювальні задачі, що вирішуються ВО CSLabGrid, охоплюють високопропускний молекулярний скринінг, молекулярний докінг, обрахунки задач з молекулярної динаміки, 3D-QSAR, задачі класичної біоінформатики, а також зберігання та обробку даних лазерної конфокальної та електронної мікроскопії.
На даний час авторами запиту це частково реалізовано в базі даних структурних моделей білків цитоскелету - CSModDB (http://csmoddb.ifbg.org.ua/). Передбачається, що подальше наповнення CSModDB буде здійснюватись з різних джерел, але штатним інструментом для реконструкції просторової структури білків має стати розроблений раніше грід-сервіс ITS (https://grid.ifbg.org.ua/its/submit.php). Даний мережевий сервіс є спеціалізованою адаптацією популярного інструменту I-TASSER (Iterative Threading ASSEmbly Refinement), але його актуальна реалізація підтримує виконання обрахунків у Грід (UNG), а також відсутність обмежень по кількості задач, що подаються окремим користувачем (за наявності відповідного сертифікату користувача).
Іншою складовою ресурсу CyberPlantUA має стати Український портал даних по генетичним модифікаціям рослин “Genetically Modified Plants Gateway” (GMPlantsGW). Метою якого є інтеграція ключової інформації по генетичним модифікаціям рослин та методам їх детекції з відкритих джерел – Інтернет баз даних, статей і документів, та можливість доповнення зазначеної інформації даними, специфічними для України – інформацією про використання окремих сортів, результатами тестів та випробувань, правовими актами та документами, рекомендаціями по застосуванню та визначенню.
У базі даних GMplantsGW міститься інформація з детальним описом кожного окремого епізоду генетичної модифікації, що сприяє аналізу та розробці методів виявлення. А також, по кожній події генетичної модифікації – детальна інформація по методам виявлення. Загальна інформація про події ГМО включає її назву, OECDUI (унікальний ідентифікатор Організації економічного співробітництва та розвитку ОЕСР/OECD), торгове найменування, вихідний вид, нововведені риси, екзогенні вставки, методи трансформації, вектори трансформації і розробник або компанія, що тримає ліцензію.
Джерелом даних про послідовності-вставки ГМО є опубліковані наукові статті, публічно доступна база даних нуклеотидних послідовностей GenBank, патенти і офіційні петиції розробників до урядових організацій. На додаток до інформації про послідовності, для доступу до іншої інформації про модифікації, такі як результати тестування та висновки з огляду біобезпеки наведено посилання на відповідні документи – американські офіційні петиції, японські офіційні петиції, Agbios, GMO-Compass, Biodiv LMO Database, звіти GMO watch і т.д.
Інформація про методи виявлення ГМ організмів згрупована за методами, що базуються на аналізі білкових продуктів і нуклеотидних послідовностей. Інформація про методи, що ґрунтуються на аналізі нуклеїнових кислот, включають: праймери, зонди, інформацію про довжину амплікона, маркери позиції пар праймерів, ендогенні референсні гени, сертифіковані еталонні зразки, стандартні референсні молекули, інформацію про статус валідації, а також – довідкові статті.
У даний час більшість методів на основі аналізу білків засновані на готових комерціалізованих наборах, тому необхідно відстежувати, як відкриті, так і комерційні набори та інші засоби для аналізу – причина, чому GMDD охоплює як комерційні набори, так і методи, які не вимагають їх використання.
Джерелом інформації про методи детекції ГМ організмів є опубліковані наукові статті, звіти перевірки Community Reference Laboratory for Genetically Modified Food and Feed (CRL-GMFF), національні стандарти та міжнародні стандарти, такі, наприклад, як стандарти китайської і Міжнародної організації по стандартизації (ISO) тощо.
З технічної точки зору проект реалізується у вигляді веб-додатку на основі Grails – високопродуктивного програмного каркасу для веб-розробки на платформі Java. Мовою програмування є Groovy, заснований на Java. Рівень object relational mapping (ORM) побудовано на основі Hibernate. Поведінковий рівень – на основі Spring MVC. Окрім того, пакети NCBI BLAST2 і BioPerl також застосовані для можливості запровадження функцій BLAST (Basic Local Alignment Search Tool - https://blast.ncbi.nlm.nih.gov/Blast.cgi) для всіх екзогенно-інтродукованих послідовностей.
Система складається з двох частин – інформаційного шлюзу і сховища. Шлюз агрегує і впорядковує дані із зовнішніх баз даних. Ці дані після валідації згодом переходять до сховища, де вони можуть бути доповнені новими отриманими даними та інформацією від українських дослідників. Актуальний web-інтерфейс системи Genetically Modified Plants Gateway (GMPlants, GMPlantsGW, gmpgw) знаходиться за адресою http://gmpgw.ifbg.org.ua:8080/gmodb.

CSLabGrid

Віртуальна організація CSLabGrid створена для вирішення наукових та прикладних задач у галузі дослідження цитоскелету.

CSModDB

CSModDB - CytoSkeleton protein MODelling DataBase.

GMPlantsGW

Укрїнський шлюз до інформації по ГМ рослинам.