dc.description.abstract | adenovirus (HAdV) er et vanlig humanpatogent virus som vanligvis forårsaker milde og
selvbegrensende sykdommer i øvre luftveier eller i gastrointestinaltraktus. Alvorlige og livstruende
infeksjoner kan imidlertid oppstå, spesielt hos pasienter med nedsatt immunforsvar. Det finnes mer
enn 100 anerkjente HAdV typer, og disse er klassifisert i syv ulike grupper (A-G).
Klassifiseringssystemet for HAdV var tidligere basert på serologiske metoder, men har stort sett blitt
erstattet av molekylære metoder som neste generasjon sekvensering (NGS) teknologi. På grunn av
virusenes små genom, sett sammen med potensielt lave virusmengder og rikelige mengder av annet
DNA fra både vert og andre bakgrunnsorganismer, er derimot anrikningsstrategier ofte nødvendige
for å oppnå tilstrekkelig sensitivitet når NGS utføres for genotyping av virus i kliniske prøver. Målet
med dette prosjektet var derfor å utvikle en anrikningsprotokoll for NGS av HAdV genomer for å
oppnå sensitiv og høyoppløselig klassifisering av HAdV fra kliniske prøver.
En tilnærming basert på overlappende amplikonsekvensering ble valgt som anrikningsstrategi for
HAdV. På grunn av høy grad av genetisk variasjon mellom HAdV gruppene og tidsbegrensninger ble
det besluttet at studien skulle begrenses til HAdV gruppe C. To primerpooler med totalt 49 primere
ble designet for å generere 24 overlappende amplikon for å gi ~92% genomdekning for HAdV C-typer.
Anrikningsprotokollen ble evaluert og optimalisert ved å bruke referansestammer fra American Type
Culture Collection (ATCC), først ved å visualisere PCR produktene med Bioanalyzer, deretter ved NGS
utført med Illumina teknologi for å vurdere genomdekning, sekvenseringsdybde og spesifisitet.
Metoden ble videre validert vha. 20 HAdV-positive kliniske prøver hvor genotyping hadde blitt utført
tidligere med Sanger-sekvensering av en del av hekson-genet. Sytten av disse hadde blitt funnet til å
inneholde HAdV C-stammer, mens genotyping hadde feilet for de resterende tre prøvene på grunn
av lav virusmengde. Resultatene fra NGS genotyping ble sammenlignet med resultatene fra Sangersekvensering
i forbindelse med klassifisering og oppløsning.
Resultatene viste at den utviklede metoden var vellykket i å amplifisere hele målgenomområdet for
alle HAdV C referansestammene, og at referansestammene fra andre HAdV grupper var dårlig
amplifisert. For de kliniske prøvene var 21-24 av amplikonene velamplifisert med en
sekvenseringsdybde >30x for 18 av de 20 prøvene, og resulterte i tilstrekkelig data for mer
omfattende genotyping. Sammenligningen av resultatene fra genotyping utført med denne metoden
og med Sanger-sekvenseringsmetoden viste noen avvik som forklares med de store forskjellene i
oppløsning som oppnås med disse to metodene. I tillegg viste resultatene indikasjoner på at HAdVstammene
var rekombinante for tre av de kliniske prøvene.
For å konkludere har vi utviklet en ny NGS-basert genotypingsmetode som er svært spesifikk for
HAdV C og som gir bred genomdekning med tilstrekkelig sekvenseringsdybde for mer omfattende
klassifisering av HAdV C-stammer. Sammenlignet med den nåværende Sangersekvenseringstilnærmingen
fant vi at denne metoden var mer sensitiv og ga et mer robust grunnlag
for genotyping, og kan dermed forhindre feilklassifisering av HAdV C-typer, i tillegg til å muligens
detektere rekombinante stammer. | |
dc.description.abstract | Human adenovirus (HAdV) is a common human pathogen which usually causes mild and self-limiting
diseases of the upper respiratory and gastrointestinal tracts. However, serious, and life-threatening
infections may occur, especially in immunocompromised patients. More than 100 different HAdV
types are currently recognized, which are classified within seven species (A-G). HAdV classification
systems were previously based on serological assays, but have largely been replaced by molecular
assays such as next generation sequencing (NGS) technologies. However, due to the small genome
sizes of viruses, along with potentially low viral loads and abundant host and background genomes,
enrichment strategies are often necessary to achieve sufficient sensitivity when performing NGS for
genotyping of viruses in clinical samples. The aim of this project was thus to develop an enrichment
protocol for NGS of HAdV genomes to allow sensitive and high resolution classification of HAdV from
clinical samples.
A tiled amplicon sequencing approach was chosen as enrichment strategy for HAdV. Due to the high
degree of genetic variation between the HAdV species along with time constraints, it was decided to
limit the study to HAdV species C. Two primer pools with a total of 49 primers were designed to
generate 24 overlapping amplicons targeting ~92% genome coverage for HAdV C types. The
enrichment protocol was evaluated and optimized using reference strains from American Type
Culture Collection (ATCC), first by visualization of PCR products using Bioanalyzer, then by NGS using
Illumina technology to assess genome coverage, sequencing depth and specificity. The assay was
further validated using 20 HAdV-positive clinical samples which had previously been genotyped by
Sanger sequencing of a portion of the hexon gene. Of these, 17 had been determined to contain
HAdV C strains, whereas genotyping had failed for the remaining three samples due to low viral
loads. NGS genotyping results were compared to genotyping results from Sanger sequencing in terms
of classification and resolution.
Results showed that the developed assay successfully amplified the entire targeted genome areas for
all HAdV C reference strains, while reference strains from other HAdV species were poorly amplified.
For the clinical samples, 21-24 amplicons were successfully amplified to a sequencing depth >30x for
18 of the 20 samples, resulting in sufficient data for comprehensive genotyping. Comparing the
genotyping-results from this assay with the Sanger-sequencing genotyping results showed some
discrepancies, explained by the vast differences in resolution achieved by these two methods.
Additionally, the results for three of the clinical samples indicated that the HAdV strains were
recombinant.
In conclusion, we have developed a novel NGS-based genotyping assay which is highly specific for
HAdV C, yielding broad genome coverage with sufficient sequencing depth for comprehensive
classification of HAdV C strains. Compared to the current Sanger sequencing approach, we found that
this assay is more sensitive and yields a more robust foundation for genotyping, and may thus
prevent misclassification of HAdV C types, as well as possibly detect recombinant strains. | |