Мы столкнулись со всемирной инвазией нового коронавируса. Она последовала за несколькими ограниченными вспышками похожих вирусов в различных местах в недавнем прошлом (ОРВИ, MERS). Хотя основной текущей целью исследователей во всём мире является обеспечение эффективных терапевтических и профилактических решений для населения планеты , нам также обязательно нужно лучше понять происхождение новой эпидемии, вызванной коронавирусом, чтобы избежать будущих вспышек. Данное молекулярное исследование ставило своей целью изучение с помощью биоинформационного подхода фактов, касающихся вируса и его предшественников.
В этой статье показано, что 16 фрагментов (гены Env Pol и Integrase) различных штаммов, в том числе, диверсифицированных ретровирусов HIV1, HIV2 и SIV имеют высокий процент гомологии в части генома COVID_19. Кроме того, каждый из этих элементов состоит из 18 или более нуклеотидов и поэтому можетбытьй связан с функцией . Они называются экзогенными информативными элементами (ЭИЭ).
Среди этих ЭИЭ 12 сосредоточены в очень небольшой области генома COVID-19, длиной менее 900 пар оснований, то есть менее 3% от общей длины этого генома. Кроме того, эти ЭИЭ позиционируются в двух функциональных генах COVID-19: генах orf1ab и S-шипа.
Представляем два основных факта, которые способствуют нашей гипотезе о том, что геном КОВИД-19 был частично синтезирован: смежная область, представляющая 2,49% всего COVID-19 генома, 40,99% которого состоит из 12 различных фрагментов, происходящих из различных штаммов ретровирусов SIV ВИЧ (вируса иммунодефицита обезьян. Некоторые из этих 12 ЭИЭ выглядят конкатенированными. Примечательно, что ретровирусная часть этих областей, которая состоит из 8 элементов из различных штаммов ВИЧ-1, ВИЧ-2 и ВИО (SIV, обезьяний ретровирус), охватывает длину 275 смежных оснований COVID-19. Совокупная длина этих 8 элементов ВИЧ/SIV составляет 200 пар оснований. Следовательно, плотность ВИЧ SIV в этой области COVID-19 составляет 200/275 = 72,73%.
Большая часть из этих 16 ЭИЭ уже существовала в первых геномах атипичной пневмонии еще в 2003 году. Однако мы продемонстрировали, как новый регион включая 4 HIV1 HIV2 Внешние Информативные Элементы радикально отличают все штаммы COVID-19 от всех SARS вирусов и коронавирусов летучих мышей, за исключением вируса летучих мышей RaTG13.
Мы собрали факты о возможных истоках COVID_19. Мы, в частности, проанализировали эту небольшую область из 225 оснований, общих для COVID_19 и летучих мышей RaTG13.
Мы изучили самую последнюю генетическую эволюцию COVID_19 штаммов, вовлеченных в мировую эпидемию. Мы обнаружили значительное возникновение мутаций и делеций в области 225 оснований.
На выборке геномов мы показали, что этот участок из 225 основных ключевых областей каждого генома, богатых ЭИЭ и 1770 пар оснований области, кодирующей шиповидный S-белок развивались гораздо быстрее, чем весь геном (выборка геномов 44 пациентов из Сиэтла в штате Вашингтон, оригинального эпицентра в США).
В сравнительном анализе обоих генов SPIKES COVID_19 и Bat RaTG13 мы отметили два аномальных факта:
1) вставка 4 смежных аминокислот PRRA в середине SPIKE (мы показали, что этот сайт уже был оптимальным сайтом расщепления до этой вставки).
2) аномальное распределение синонимичных кодонов во второй половине SPIKE.
Наконец, мы показали вставку в эту область 1770 оснований SPIKE значительной пары ЭИЭ из Plasmodium Yoelii и апозитивной ВИЧ-1 ЭИЭ с критической мутацией Spike.