Genotyping of human adenovirus C by tiled amplicon sequencing
Master thesis
Permanent lenke
https://hdl.handle.net/11250/3016717Utgivelsesdato
2022Metadata
Vis full innførselSamlinger
Beskrivelse
Full text not available
Sammendrag
adenovirus (HAdV) er et vanlig humanpatogent virus som vanligvis forårsaker milde ogselvbegrensende sykdommer i øvre luftveier eller i gastrointestinaltraktus. Alvorlige og livstruendeinfeksjoner kan imidlertid oppstå, spesielt hos pasienter med nedsatt immunforsvar. Det finnes merenn 100 anerkjente HAdV typer, og disse er klassifisert i syv ulike grupper (A-G).Klassifiseringssystemet for HAdV var tidligere basert på serologiske metoder, men har stort sett blitterstattet av molekylære metoder som neste generasjon sekvensering (NGS) teknologi. På grunn avvirusenes små genom, sett sammen med potensielt lave virusmengder og rikelige mengder av annetDNA fra både vert og andre bakgrunnsorganismer, er derimot anrikningsstrategier ofte nødvendigefor å oppnå tilstrekkelig sensitivitet når NGS utføres for genotyping av virus i kliniske prøver. Måletmed dette prosjektet var derfor å utvikle en anrikningsprotokoll for NGS av HAdV genomer for åoppnå sensitiv og høyoppløselig klassifisering av HAdV fra kliniske prøver.En tilnærming basert på overlappende amplikonsekvensering ble valgt som anrikningsstrategi forHAdV. På grunn av høy grad av genetisk variasjon mellom HAdV gruppene og tidsbegrensninger bledet besluttet at studien skulle begrenses til HAdV gruppe C. To primerpooler med totalt 49 primereble designet for å generere 24 overlappende amplikon for å gi ~92% genomdekning for HAdV C-typer.Anrikningsprotokollen ble evaluert og optimalisert ved å bruke referansestammer fra American TypeCulture Collection (ATCC), først ved å visualisere PCR produktene med Bioanalyzer, deretter ved NGSutført med Illumina teknologi for å vurdere genomdekning, sekvenseringsdybde og spesifisitet.Metoden ble videre validert vha. 20 HAdV-positive kliniske prøver hvor genotyping hadde blitt utførttidligere med Sanger-sekvensering av en del av hekson-genet. Sytten av disse hadde blitt funnet til åinneholde HAdV C-stammer, mens genotyping hadde feilet for de resterende tre prøvene på grunnav lav virusmengde. Resultatene fra NGS genotyping ble sammenlignet med resultatene fra Sangersekvenseringi forbindelse med klassifisering og oppløsning.Resultatene viste at den utviklede metoden var vellykket i å amplifisere hele målgenomområdet foralle HAdV C referansestammene, og at referansestammene fra andre HAdV grupper var dårligamplifisert. For de kliniske prøvene var 21-24 av amplikonene velamplifisert med ensekvenseringsdybde >30x for 18 av de 20 prøvene, og resulterte i tilstrekkelig data for meromfattende genotyping. Sammenligningen av resultatene fra genotyping utført med denne metodenog med Sanger-sekvenseringsmetoden viste noen avvik som forklares med de store forskjellene ioppløsning som oppnås med disse to metodene. I tillegg viste resultatene indikasjoner på at HAdVstammenevar rekombinante for tre av de kliniske prøvene.For å konkludere har vi utviklet en ny NGS-basert genotypingsmetode som er svært spesifikk forHAdV C og som gir bred genomdekning med tilstrekkelig sekvenseringsdybde for mer omfattendeklassifisering av HAdV C-stammer. Sammenlignet med den nåværende Sangersekvenseringstilnærmingenfant vi at denne metoden var mer sensitiv og ga et mer robust grunnlagfor genotyping, og kan dermed forhindre feilklassifisering av HAdV C-typer, i tillegg til å muligensdetektere rekombinante stammer. Human adenovirus (HAdV) is a common human pathogen which usually causes mild and self-limitingdiseases of the upper respiratory and gastrointestinal tracts. However, serious, and life-threateninginfections may occur, especially in immunocompromised patients. More than 100 different HAdVtypes are currently recognized, which are classified within seven species (A-G). HAdV classificationsystems were previously based on serological assays, but have largely been replaced by molecularassays such as next generation sequencing (NGS) technologies. However, due to the small genomesizes of viruses, along with potentially low viral loads and abundant host and background genomes,enrichment strategies are often necessary to achieve sufficient sensitivity when performing NGS forgenotyping of viruses in clinical samples. The aim of this project was thus to develop an enrichmentprotocol for NGS of HAdV genomes to allow sensitive and high resolution classification of HAdV fromclinical samples.A tiled amplicon sequencing approach was chosen as enrichment strategy for HAdV. Due to the highdegree of genetic variation between the HAdV species along with time constraints, it was decided tolimit the study to HAdV species C. Two primer pools with a total of 49 primers were designed togenerate 24 overlapping amplicons targeting ~92% genome coverage for HAdV C types. Theenrichment protocol was evaluated and optimized using reference strains from American TypeCulture Collection (ATCC), first by visualization of PCR products using Bioanalyzer, then by NGS usingIllumina technology to assess genome coverage, sequencing depth and specificity. The assay wasfurther validated using 20 HAdV-positive clinical samples which had previously been genotyped bySanger sequencing of a portion of the hexon gene. Of these, 17 had been determined to containHAdV C strains, whereas genotyping had failed for the remaining three samples due to low viralloads. NGS genotyping results were compared to genotyping results from Sanger sequencing in termsof classification and resolution.Results showed that the developed assay successfully amplified the entire targeted genome areas forall HAdV C reference strains, while reference strains from other HAdV species were poorly amplified.For the clinical samples, 21-24 amplicons were successfully amplified to a sequencing depth >30x for18 of the 20 samples, resulting in sufficient data for comprehensive genotyping. Comparing thegenotyping-results from this assay with the Sanger-sequencing genotyping results showed somediscrepancies, explained by the vast differences in resolution achieved by these two methods.Additionally, the results for three of the clinical samples indicated that the HAdV strains wererecombinant.In conclusion, we have developed a novel NGS-based genotyping assay which is highly specific forHAdV C, yielding broad genome coverage with sufficient sequencing depth for comprehensiveclassification of HAdV C strains. Compared to the current Sanger sequencing approach, we found thatthis assay is more sensitive and yields a more robust foundation for genotyping, and may thusprevent misclassification of HAdV C types, as well as possibly detect recombinant strains.