I disse år kortlægges en række organismers arvelige materiale. Det humane genom blev kortlagt i 2001, og kort tid efter fulgte musens og rottens genomer. Dele af chimpanzens, grisens, hundens og kyllingens genomer er ligeledes til rådighed.
Et genom er en DNA sekvens bestående af de fire nukleotider: adenosine, guanine, cytosine og thymine. Den menneskelige DNA sekvens består af 3 milliarder nukleotider, men kun en lille mængde af nukleotiderne er særlig vigtige. Der er omkring 25.000 gener i det menneskelige genom, og længden af et gen er cirka 30.000 nukleotider.
Identificeringen af væsentlige og mindre væsentlige områder i et genom kan kun lade sig gøre ved hjælp af komplekse matematiske modeller og effektive algoritmer. Der vil blive givet en introduktion til nogle af de mest anvendte modeller og deres tilhørende algoritmer. Dette inkluderer skjulte Markov modeller i diskret tid samt Backward, Forward og Viterbi algoritmerne. Metodernes anvendelighed vil blive illustreret på DNA sekvenser fra mennesket.
Ved at sammenligne det menneskelige genom med andre organismers genomer kan man opnå en øget forståelse af genernes funktioner, og dermed udvikle strategier til bekæmpelse af arvelige sygdomme. Det vil blive diskuteret, hvordan de ovenstående metoder kan udvides til at analysere flere organismers DNA sekvenser under hensyntagen til deres slægtsforhold.
|
Asger Hobolth |
|
Telefon: 8942 3099 |