2007-07-05

Flugpapper

(En observation när jag befann mig hemma-hemma i måndags kväll var att flugor ansamlas i viss mån ute på landet, även om det inte är som det märkliga året.)

Jag har skrivit väldigt mycket de senaste dagarna, antagligen för att platsen-som-inte-får-nämnas-vid-namn inducerade skrivklåda på något vis. Intryck föder uttryck. Nåväl, trots flera avrivna inlägg under det senaste dygnet finns det mer att säga. Jag har också påmint mig om att en anledning till att jag slutligen öppnade detta var att blaha-tankar av tveksam relevans man annars skulle tendera att skicka/prata om åt höger och vänster i stället kunde kondenseras (nåja, omfånget kan vi tala om någon annan gång) i bulletinartad textform. Därav följer kanske också frånvaron av högre politiska och andra funderingar, även om jag gjort undantag. Det finns helt enkelt fora för dessa.

I alla fall skall jag i korthet redogöra för mina körningsresultat. Jag börjar inbilla mig att jag med några miljoner funktionsevalueringar kan nå en stabil situation, där modeller med 4 och 5 loci bör peka mot samma resultat. Dessutom återspeglar dessa resultat nästan lite väl bra vad man fick med tidigare 2D-scan. Knäckfrågan är fortfarande modellvalet. Om den naiva sannoliketstolkningen tillämpas är det bara två loci som har en sannolikhet högre än hälften att ingå. Om vi dessutom skall tillämpa kriterier som 95 % och liknande blir situationen bara löjlig.

Jag ser i alla fall konvergens när antalet evalueringar ökas. Det är "rätt" loci som höjer sig ur skvalpet. Och kan dubbeltoppar förklaras enbart genom fel i Haley-Knott? Jag borde nog ta och titta på teckenfördelningen i en sådan regression. Ja, det borde jag verkligen... hmhm. Vete katten om bra värden gynnas för mycket vid den rena summeringen, men en korrekt kompensationsmetod är inte heller uppenbar. Det känns liksom paradoxalt att multiplicera en box betydelse i en enskild position med boxens volym, och det vore nog den enda förändring jag kan tänka mig just nu.


För den oinvigde


En box här består av ett rätblock i rummet av möjliga lociuppsättningar. Närmare bestämt är det n positioner, med breddangivelser runt var och en. Optimeringsmetoden består av intervalltredelning i en dimension i taget, med en strävan att dela på den längsta ledden i varje steg (oavsett vilken dimensions derivata som skulle luta mest). Blocken bör alltså alltid vara tämligen kubiska. (om proportionerna 3:1:1:1 kan ses som kubiska...)

exp(-RSS) för regressionen i varje punkt i varje lövblock när metoden avslutas antas vara proportionellt mot sannolikheten för att den modell blocket representerar gäller. Man kan ana varför multiplikation med volymen vore en rimlig vikt, för att normalisera mot splittningen i block. Samtidigt kan man intuitivt inbilla sig att man borde dividera med volymen, då sannolikheten skulle vara utsmetad över hela blocket. Detta är dock fel, då sannolikheten är per infinitisemal enhet, blocket är bara en approximation av sannolikheten i varje punkt inom dess volym. Jag får nog testa med att multiplicera imorgon. Synd på mina så fina pågående körningar. (MacOS X har sämre scheduler än även Windows, kan meddelas.)

Nu skall jag rensa jordgubbar, vilka har stigit i pris, och kanske se om mina utskrifter från 4 respektive 5 dimensioner med lite olika storlek kan visa att man faktiskt borde multiplicera.

Inga kommentarer: