Bäst på håll
Man kan räkna fram och tillbaka på mångahanda sätt. Mina bravader med cnf2freq fortgick under större delen av arbetsveckan, om än inte helt på ordinarie kontorstid. Arbetsdagarna tenderade att börja vid 13 och sluta långt, långt senare. I en stund tror man att 32*16 tillstånd är precis vad som behövs, i nästa 8*16, eftersom F0-generationen ju egentligen saknar haplotypinformation. Det är förstås fel, i alla fall om man vill utvinna densamma. Men om man bara utgår från 0,5 som ursprungsgissning i alla markörer så finns heller ingen preferens för endera haplotyptilldelningen. Lokalt i varje markör kommer fördelningen på spegeltillstånd att vara identisk och då blir approximationen i nästa iteration också en 50/50-fördelning. Det är ett av problemen med Baum-Welch allmänt. Ursprungsgissningen har enorm betydelse, särskilt om den har en egenskap som ger symmetri eller icke-ergodicitet i relevant omfattning.
Lösningen är lika enkel som hackig: välj en godtycklig markör med icke-homozygota markörvärden i F0-generationen. Tvinga in haplotyptilldelning där åt endera hållet. DÅ har vi löst upp symmetrin och kan sedan glatt tuffa vidare.
Komplexiteten fortsätter emellertid att öka med en faktor 64 per generation. Det är ett reellt hinder för allmän tillämplighet, men en uppenbar metod är att titta 2-3 generationer i taget och sedan propagera enbart haplotypfrekvenser. Förfarandet fångar inte all information, men tillräckligt mycket [citation needed].
Någon gång borde jag prata med någon och få förklarat för mig hur man kanske kan publicera detta. (Ja, materialet här är nog tillräckligt konvolerat för att bara ondingar skall reproducera det och försöka publicera först...)
En mobilbild säger mer än tusen ord. Tusen trista ord ibland. Men jag har nästan jobbat på McDonald's nu i alla fall. Nästan. Då går man ju nästan ut med flaggan i topp. Nästan.
Inga kommentarer:
Skicka en kommentar