ОБРАБОТКА ИНФОРМАЦИИ И АНАЛИЗ ДАННЫХ
А. В. Мордвинов, А. В. Стучинский, А. П. Девятериков, С. С. Хайрулин, Н. В. Пальянова, А. Ю. Пальянов "Проект эффективной программной платформы для работы с генетическими данными респираторных вирусов"
ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ И ТЕХНОЛОГИИ
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
МАТЕМАТИЧЕСКИЕ ОСНОВЫ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ
А. В. Мордвинов, А. В. Стучинский, А. П. Девятериков, С. С. Хайрулин, Н. В. Пальянова, А. Ю. Пальянов "Проект эффективной программной платформы для работы с генетическими данными респираторных вирусов"
Аннотация. 

Статья посвящена разработке отечественной веб-платформы с необходимыми возможностями получения доступа к банкам генетической информации. Основная цель – предоставить исследователям возможность эффективно решать задачи биоинформатики, вирусологии и эпидемиологии, при необходимости расширяя набор доступных на сервере программ для анализа и моделирования. Проект основан на современных, эффективных, обоснованно выбранных программных решениях, обеспечивающих высокую производительность и предоставляющих множество полезных функциональных возможностей. Реализуемая веб-платформа позволяет загружать, хранить, искать и анализировать геномные последовательности вирусов, таких как грипп и SARSCoV-2, а в перспективе и другие вирусные патогены. Планируется сделать ее доступной для исследователей и периодически обновлять из открытых источников, чтобы повысить удобство и эффективность работы ученых, ведущих исследования в соответствующих областях науки.

Ключевые слова: 

веб-платформа, биоинформатика, вирусология, эпидемиология, хранение данных, анализ данных, алгоритмы, эффективность.

DOI 10.14357/20718632240406 

EDN EUCRNU

Стр. 60-73.

Литература

1. Bogner P., Capua I., Lipman D.J., Cox N.J. A global initiative on sharing avian flu data // Nature. 2006. № 442(7106), С. 981. https://doi.org/10.1038/442981a.
2. Farley M.M. 2009 H1N1 influenza: a twenty-first century pandemic with roots in the early twentieth century // Am. J. Med. Sci. 2010. № 340(3), С. 202-208. https://doi.org/10.1097/MAJ.0b013e3181e937b0.
3. Tanner W.D., Toth D.J., Gundlapalli A.V. The pandemic potential of avian influenza A(H7N9) virus: a review // Epidemiol. Infect. 2015. № 143(16), С. 3359-3374. https://doi.org/10.1017/S0950268815001570.
4. Martellucci C.A., Flacco M.E., Cappadona R., Bravi F., Mantovani L., Manzoli L. SARS-CoV-2 pandemic: An overview // Advances in Biological Regulation. 2020. № 77, С. 100736. https://doi.org/10.1016/j.jbior.2020.100736
5. Si Y., Wu W., Xue X., Sun X., Qin Y., Li Y., Qiu C., Li Y., Zhuo Z., Mi Y., Zheng P. The evolution of SARS-CoV-2 and the COVID-19 pandemic // PeerJ. 2023. № 11, С. e15990. https://doi.org/10.7717/peerj.15990.
6. Lenharo M. GISAID in crisis: can the controversial COVID genome database survive? // Nature. 2023. № 617(7961), С. 455-457. https://doi.org/10.1038/d41586-023-01517-9
7. https://microbius.ru/news/gisaid-v-krizise-smozhet-li-vyzhitvyzyvayuschaya-spory-baza-dannyh-genomov-covid.
8. Sayers E.W., Cavanaugh M., Clark K., Pruitt K.D., Schoch C.L., Sherry S.T., et al. GenBank // Nucleic Acids Res. 2022. №50(D1), С. D161-D164. https://doi.org/10.1093/nar/gkab1135.
9. Sayers E.W., Cavanaugh M., Clark K., Pruitt K.D., et al. GenBank 2024 Update // Nucleic Acids Research. 2024. № 52(D1), С. D134–D137. https://doi.org/10.1093/nar/gkad903.
10. Wu F., Zhao S., Yu B., Chen Y.M., Wang W., et al. A new coronavirus associated with human respiratory disease in China // Nature. 2020. № 579(7798), С. 265-269. https://doi.org/10.1038/s41586-020-2008-3
11. http://courseware.cutm.ac.in/wp-content/uploads/2020/10/Gen-Bank.pdf.
12. Pertsemlidis A., Fondon J.W. Having a BLAST with bioinformatics (and avoiding BLASTphemy) // Genome Biology. 2001. № 2(10), С. reviews2002.1. https://doi.org/10.1186/gb-2001-2-10 reviews2002.
13. Aksamentov I., Roemer C. et al. Nextclade: clade assignment, mutation calling and quality control for viral genomes // J. Open Source Software. 2021. № 6(67), С. 3773. https://doi.org/10.21105/joss.03773.
14. Ahdritz G., Bouatta N., Floristean C., Kadyan S., et al. OpenFold: retraining AlphaFold2 yields new insights into its learning mechanisms and capacity for generalization // Nature Methods. 2024. №21(8), C. 1514-1524. https://doi.org/10.1038/s41592-024-02272-z.
15. Девятериков А.П., Пальянов А.Ю. Ускорение поиска рекомбинантных вирусных последовательностей для алгоритма 3SEQ за счет многопоточности и учета дат сбора образцов // Математическая биология и биоинформатика. 2024. № 19(2), С. 338-353. https://doi:10.17537/2024.19.338, https://github.com/NotNa19/RecombinantDetector.
16. Lam H.M., Ratmann O. and Boni M.F. Improved algorithmic complexity for the 3SEQ recombination detection algorithm // Mol. Biol. Evol. 2018. №35, С. 247–251. https://doi.org/10.1093/molbev/msx263.

2024 / 04
2024 / 03
2024 / 02
2024 / 01

© ФИЦ ИУ РАН 2008-2018. Создание сайта "РосИнтернет технологии".