Inference of migration patterns from genetic data using Approximate Bayesian computation
Description
Full text not available
Abstract
Det er i teorien mulig å rekonstruere historien til en populasjon ut fra "dagens" genfrekvenser. Å finne en måte å kunne både estimere migrasjonsmønstre og stamtrær, er spesielt viktig. Estimering av migrasjonmønstre er spesielt interessant, da det gir en idé om hvilken rolle migrasjon har hatt for en gitt art, som for eksempel i å begrense utviklingen av lokale tilpasninger. Dersom migrasjonsraten mellom subpopulasjoner er relativt høy, motvirker den effekten av genetisk drift slik at genfrekvensene vil nå en stasjonær likevektsfordeling. En generell utfordring er at likelihoodfunksjonen knyttet til disse migrasjonsmønstrene er utilgjengelig, enten fordi det ikke er mulig uttrykke den på lukket form, eller fordi den er for beregningskrevende å finne. Approximate Bayesian computation er en simuleringsbasert metode som unngår all eksplisitt evaluering av likelihoodfunksjonen. Målet med denne oppgaven er å undersøke potensialet Approximate Bayesian computation har til å gjøre inferens av migrasjonsmønstre fra genfrekvensdata. En ABC Markov Chain Monte Carlo algoritme har blitt implementert for en endimensjonal stepping-stone migrasjonsmodell. In theory, it is possible to reconstruct the history of a population based on the gene frequencies of today. To find an approach that puts the estimation of migration patterns and the estimation of evolutionary trees into a common framework, would be of substantial value. Estimation of migration patterns between colonies or subpopulations is important because they give an idea of the role migration has for the given species, such as in limiting the development of local adaptions. When migration rates are high between different subpopulations, it interacts with genetic drift in such a way that the gene frequencies will eventually reach a stationary equilibrium distribution. A prominent issue associated with these migration patterns is that the resulting likelihood function is unavailable, either because it is unavailable in closed form or it is too computationally expensive to calculate.Approximate Bayesian computation is a simulation-based approach that circumvents any explicit evaluation of the likelihood function. The aim of this thesis is to explore the potential of Approximate Bayesian computational methods in making inferences of migration patterns from gene frequency data. In particular, an ABC Markov Chain Monte Carlo sampler has been implemented for the one-dimensional stepping-stone model of migration.