sobota, 26 listopada, 2022
Strona głównaZdrowieNowości medyczneModelowanie genomu dla przewidywania patogenności koronawirusów

Modelowanie genomu dla przewidywania patogenności koronawirusów

Wirusowe informacje genomowe zebrane podczas ognisk choroby są często wykorzystywane w badaniach epidemiologicznych długo po wybuchu epidemii, aby wywnioskować statystyki dotyczące mutacji i ich wpływu na zdolność do przenoszenia, łańcuchy przenoszenia i ryzyko dla zdrowia publicznego. Eksperymenty w zakresie tworzenia i optymalizacji wirusów patogennych są bardzo ograniczone ze względu na obawy dotyczące bezpieczeństwa związane z przypadkowym wydostaniem się, co sprawia, że społeczność naukowa nie jest w stanie przewidzieć i nie jest przygotowana na duże i nagłe wybuchy epidemii, jak zaobserwowano w przypadku pandemii choroby koronawirusowej 2019 (COVID-19) spowodowanej przez ciężki ostry zespół oddechowy koronawirus 2 (SARS-CoV-2).

Study: A Genotype-to-Phenotype Modeling Framework to Predict Human Pathogenicity of Novel Coronaviruses. Image Credit: peterschreiber.media/ Shutterstock

Ostatnie techniki uczenia maszynowego pozwoliły na wykorzystanie sekwencjonowania genomu wirusowego w charakterze predykcyjnym, przed wybuchem epidemii, rzucając światło na pojawienie się pewnych fenotypów wirusowych. W pracy niedawno umieszczonej na serwerze preprintów bioRxiv*, takie techniki są dalej udoskonalane i stosowane do szerokiej gamy koronawirusów, tworząc model, który może zidentyfikować znane ludzkie patogeny ze 100% pewnością i być stosowany do wirusów zwierzęcych, aby przewidzieć ich skłonność do przenoszenia się na ludzi.

Wersja preprint badania jest dostępna na serwerze bioRxiv*, podczas gdy artykuł przechodzi proces peer review.

Identyfikacja cech ludzkich patogenów

Grupa opracowała technikę „ekstrakcji cech”, która obliczeniowo przypisuje słowa do specyficznych cech genomowych i ma zastosowanie do szeregu wirusów z rodziny koronawirusów, o których wiadomo, że są patogenami dla ludzi lub nieludzi. Obejmowało to SARS-CoV-2 i dziesięć wariantów budzących obawy, składających się z 42 kompletnych genomów mających reprezentować różnorodność zaobserwowaną podczas pandemii COVID-19.

Ponadto, 34 kompletne genomy wirusa ostrej biegunki świń (SAD) zostały zatrudnione w celu reprezentowania patogenów innych niż ludzkie. Grupa zauważa, że koronawirusy świń, takie jak SAD, pozornie nigdy nie przeszły zoonotycznego transferu do ludzi. W związku z tym wybrano ten wirus ze względu na widoczną barierę genetyczną dla przejścia.

Grupa ograniczyła swoje poszukiwania genomu do 11, 13, 15 i 17 monomerowych sekwencji i zidentyfikowała kilka, które korelowały z prawdopodobieństwem patogenu ludzkiego, dla większości z nich, zgodnie z oczekiwaniami, SARS-CoV-2 uzyskał wyższy wynik niż SAD. Modele 15- i 17-merowe są według grupy dokładniejsze, przy czym każdy z tych testowanych prawidłowo sklasyfikował wszystkie 42 genomy SARS-CoV-2 jako patogeny człowieka.

Aby wyprowadzić technikę poza identyfikację cech genomowych i opracować model predykcyjny, grupa po pierwsze uporządkowała sekwencje genomowe taksonomicznie, symulując problem posiadania kilku gatunków każdej klasy wirusa w zbiorze treningowym, aby zmaksymalizować udane gatunki w zbiorze walidacyjnym. Po drugie, zastosowano technikę stratyfikowanego resamplingu w celu uniknięcia tendencyjności, często generowanej przy użyciu tej techniki, takiej jak skośna reprezentacja ludzkich patogenów.

Niektóre motywy SARS-CoV-2 w szczególności, które są związane z patogennością dla człowieka, zostały zauważone w całej gamie gatunków koronawirusów, gdzie motyw jest podatny na dryfowanie, znajdując się na różnych loci. Inne motywy promujące patogenność dla człowieka były albo binarne, albo zależne od częstotliwości, działając jak przełącznik wymagający tylko jednego lub wielu wystąpień. Na przykład, sekwencja NTRNWRNTSNWSHTA pojawia się w izolatach ludzkiego koronawirusa HKU1 aż 45 razy, ale tylko 4 razy w koronawirusie wróbla HKU17.

Przewidywanie patogenności dla człowieka

Inny motyw, RATGTTRTTMDWCDA, występuje w różnych kontekstach genomowych w ludzkich koronawirusach alfa i beta, znajdując się na przykład w białku spike w ludzkim koronawirusie 229E (alfa), niestrukturalnych białkach 3 i 15 w zespole oddechowym środkowego wschodu (beta) oraz niestrukturalnym białku 5 w SARS-CoV-2 (beta).

We wszystkich przypadkach motyw występuje zawsze w tej samej ramce odczytu, składającej się z pięciu tripletów (15-mer). Jednak w gammacoronawirusie indyka motyw ten uległ przesunięciu ramki o jedną pozycję, co wskazuje, że jest on zbędny dla patogenu pozaludzkiego.

Dodatkowo, w ludzkich patogenach, motyw ten występuje również bliżej miejsc N-linked glikozylacji, dowód na adaptację w kierunku wydajności translacyjnej, ponieważ wzbogacenie rzadkich kodonów w tych miejscach wiąże się z solidną ekspresją w pewnych warunkach.

Wnioski

Modele opracowane przez grupę, która poprawnie sklasyfikowała sekwencje testowe SARS-CoV-2 i SAD, zostały zastosowane do szerokiej gamy innych koronawirusów, a kilka o znanych podobieństwach filogenetycznych zostało wyróżnionych.

Koronawirus nietoperzy WIV16 dzielił 96% podobieństwo sekwencji z SARS-CoV-1 i dawał prawdopodobieństwo patogenności dla człowieka 0,78, podczas gdy koronawirusy cywet dawały prawdopodobieństwo około 0,89. Cywety są blisko spokrewnione z norkami, u których podczas pandemii zaobserwowano odzwierzęcą transmisję SARS-CoV-2 od ludzi.

Inne koronawirusy nietoperzy RmYN02, RpYN06, i RaTG13, wykazywały prawdopodobieństwo klasy patogenów ludzkich rywalizujące z SARS-CoV-2, a każdy z nich jest znany z wysokiego podobieństwa sekwencji.

Używając modelu, kilka kolejnych wirusów nietoperzy pochodzących z jaskini w Guangdong zostało rutynowo sklasyfikowanych jako patogeny ludzkie. Grupa spekulowała, że może to wyjaśniać wiele skądinąd niezidentyfikowanych ognisk wirusów podobnych do SARS zgłaszanych w tym regionie w poprzednich latach.

CZYTAJ WIĘCEJ

Najpopularniejsze