HomeSaluteVirus e parassitiSARS-CoV-2 : recuperati i dati cancellati da Wuhan

SARS-CoV-2 : recuperati i dati cancellati da Wuhan

Il rinomato ricercatore evoluzionista, Jesse Bloom del Fred Hutchinson Cancer Research Center, ha condotto un’analisi filogenetica suggerendo che le sequenze di SARS-CoV-2 che sono state ottenute dal mercato del pesce di Huanan a Wuhan, in Cina, non sono pienamente rappresentative dei virus che circolavano in città al momento dell’epidemia di COVID-19.

I risultati di Bloom si basano sull’identificazione e il recupero di un set di dati contenente sequenze SARS-CoV-2 dall’inizio dell’epidemia di Wuhan che era stato cancellato dall’archivio di lettura della sequenza del National Institutes of Health. Bloom afferma che l’analisi suggerisce che il progenitore delle sequenze conosciute di SARS-CoV-2 differisce dalle sequenze del mercato dei frutti di mare di Huanan ed è di almeno tre mutazioni più vicine ai parenti del coronavirus del pipistrello SARS-CoV-2. L’attuale studio suggerisce che almeno in un caso, le strutture di fiducia della scienza sono state abusate per oscurare sequenze rilevanti per la diffusione precoce di SARS-CoV-2 a Wuhan“, scrive Bloom. “Un’attenta rivalutazione di altre forme archiviate di comunicazione scientifica, resoconto e dati potrebbe gettare ulteriore luce sull’emergenza precoce del virus“.

Una versione prestampata del documento di ricerca è disponibile sul server bioRxiv *, mentre l’articolo è sottoposto a peer review.

Studio: il recupero dei dati di sequenziamento profondo cancellati fa più luce sulla prima epidemia di Wuhan SARS-CoV-2.  Credito di immagine: NIAID / Bloom

Studio: il recupero dei dati di sequenziamento profondo cancellati fa più luce sulla prima epidemia di SARS-CoV-2 di Wuhan. Credito di immagine: NIAID / Bloom

L’origine di SARS-CoV-2 rimane un mistero

Comprendere la diffusione di SARS-CoV-2 a Wuhan è essenziale per tracciare l’origine del virus. I primi rapporti al di fuori della Cina alla fine di dicembre 2019 hanno evidenziato il mercato del pesce di Huanan come un sito di diffusione zoonotica. Tuttavia, questa teoria è diventata sempre più improbabile quando sono emerse segnalazioni di casi precedenti nel 2019 che non avevano alcun collegamento con il mercato. Ad esempio, il Professor Yu Chuanhua dalla Wuhan University ha detto al “Times” che ha passato in rassegna due casi a metà novembre e un caso sospetto il 29 settembre.

Vedi anche:Come SARS-CoV-2 si è adattato negli esseri umani

 

Esempio del processo per eliminare i dati SRA.  L'immagine mostra le e-mail tra l'autore principale del documento sul coronavirus del pangolino Xiao et al.  (2020) e personale SRA tratto da USRTK (2020).

Esempio del processo per eliminare i dati SRA. L’immagine mostra le e-mail tra l’autore principale del documento sul coronavirus del pangolino Xiao et al. (2020) e personale SRA tratto da USRTK (2020).

Il CDC cinese ha vietato la condivisione di informazioni senza approvazione

Più o meno nello stesso periodo, i Centri cinesi per il controllo e la prevenzione delle malattie (CDC) hanno emesso un’ordinanza che vietava la condivisione di informazioni sull’epidemia di COVID-19 senza approvazione. Il Consiglio di Stato cinese ha quindi emesso un ordine molto più ampio che richiede l’approvazione centrale di qualsiasi pubblicazione relativa a COVID-19. Sebbene vi sia un ampio dibattito su come esattamente SARS-CoV-2 abbia infettato la popolazione umana, è universalmente accettato che i profondi antenati del virus siano coronavirus di pipistrello.“Di conseguenza, c’è un conflitto diretto tra i due principi principali usati per dedurre il progenitore di un focolaio: vale a dire che dovrebbe essere tra le prime sequenze e che dovrebbe essere più strettamente correlato agli antenati più profondi”, scrive Bloom.

In cosa consisteva l’attuale studio?

Bloom ha identificato un set di dati di sequenze SARS-CoV-2 isolate da campioni ambulatoriali raccolti all’inizio dell’epidemia di Wuhan che erano stati cancellati dal Sequence Read Archive del NIH. Ha recuperato i file da Google Cloud e ha ricostruito sequenze parziali di 13 primi virus epidemici.

L’analisi filogenetica di queste sequenze, insieme a un’attenta annotazione di quelle esistenti, ha suggerito che le prime sequenze di Wuhan dal mercato del pesce di Huanan che sono state al centro del rapporto congiunto OMS-Cina non sono pienamente rappresentative dei virus che erano effettivamente presenti in Wuhan all’epoca.

È stato identificato che il coronavirus RaTG13 che infetta il pipistrello ferro di cavallo ( Rhinolophus affinis) condivide la più grande identità di sequenza genomica con SARS-CoV-2 fino ad oggi. Tuttavia, le prime sequenze del mercato del pesce di Huanan sono più distanti da RaTG13 rispetto alle sequenze raccolte a gennaio da altre località della Cina e persino da altri paesi. “Tutte le sequenze associate a questo mercato differiscono da RaTG13 per almeno tre mutazioni in più rispetto alle sequenze successivamente raccolte in varie altre località – un fatto che è difficile conciliare con l’idea che il mercato fosse il luogo originale della diffusione di un coronavirus di pipistrello a umani”, scrive Bloom.

Maggiori informazioni sulle sequenze cancellate

L’analisi filogenetica delle sequenze cancellate ha rivelato che quattro sequenze GISAID (Global Initiative on Sharing Avian Influenza Data) raccolte nel Guangdong che rientrano in un nodo progenitore sono state isolate da due diversi gruppi di persone che si sono recate a Wuhan alla fine di dicembre del 2019. Questi individui quindi hanno sviluppato sintomi prima o il giorno in cui sono tornati nel Guangdong, dove i loro virus sono stati infine sequenziati. “Tutte le sequenze di pazienti infetti a Wuhan, ma sequenziate nel Guangdong sono più simili all’outgroup del coronavirus dei pipistrelli rispetto alle sequenze del mercato del pesce di Huanan”, scrive Bloom.

Questi dati cancellati, così come le sequenze esistenti di pazienti infetti da Wuhan ricoverati nel Guangdong, mostrano che le prime sequenze di Wuhan contenevano spesso la mutazione T29095C ed avevano meno probabilità di portare le mutazioni T8782C e C28144T rispetto alle sequenze nel rapporto congiunto OMS-Cina.

La cancellazione dei dati ha importanti implicazioni per gli studi futuri

Bloom afferma che la cancellazione di un set di dati così informativo ha implicazioni oltre  quelle raccolte direttamente dalle sequenze recuperate. In primo luogo, i campioni dei primi pazienti ambulatoriali di Wuhan rappresentano una miniera d’oro per chiunque cerchi di comprendere la diffusione di SARS-CoV-2. In secondo luogo, gli studi di epidemiologia genomica del primo SARS-CoV-2 devono concentrarsi sulla provenienza e sull’annotazione delle sequenze sottostanti tanto quanto su considerazioni tecniche. “Inoltre, gli studi futuri dovrebbero dedicare lo stesso impegno ad andare oltre le annotazioni in GISAID per tracciare attentamente la posizione dell’infezione del paziente e il sequenziamento del campione”, afferma Bloom. “Inoltre, suggerisco che potrebbe valere la pena rivedere i documenti di posta elettronica per identificare altre eliminazioni di SRA [Sequence Read Archive]”.

Fonte:Biorxiv

 

 

Newsletter

Tutti i contenuti di medimagazine ogni giorno sulla tua mail

Articoli correlati

In primo piano