SuomeksiEnglanniksi
Annales Universitatis Turkuensis

Analysis of high-dimensional and left-censored data with applications in lipidomics and genomics

Pesonen Maiju

Uudet mittausteknologiat kykenevät tuottamaan valtavia tietomääriä yksittäisten geenien, proteiinien ja rasvojen ilmentymisestä ja pitoisuuksista kehossa ennennäkemättömällä tarkkuudella. Tarve uutta tietoa analysoiville menetelmille on kasvanut, jotta massiivisesta määrästä informaatiota saadaan louhituksi esiin olennainen.

– Tiedetään esimerkiksi, että muutokset ihmisen rasva-aineenvaihdunnassa ovat yhteydessä useisiin vakaviin sairauksiin, kuten diabetekseen, ylipainoon, joihinkin syöpiin, valtimotautiin ja Alzheimerin tautiin. Nyt kun tarkka mittausteknologia on olemassa, tarvitaan uudentyyppisille aineistoille kohdennettuja analyysimenetelmiä, jotka ottavat huomioon aineistojen erityisominaisuudet ja hyödyntävät kaiken tarjolla olevan tiedon mahdollisimman tehokkaasti. Tämän kaltaiset analyysit mahdollistavat sairauksiin liittyvien uusien diagnostisten testien ja hoitomenetelmien kehittämisen, Maiju Pesonen sanoo.

Pesonen tarttui väitöstutkimuksessaan tähän haasteeseen ja vertaili nykyisiä sekä kehitti uusia lipidomiikka- ja genomiikka-aineistoille soveltuvia tilastollisia analyysimenetelmiä. Väittelijän kiinnostuksen kohteena olivat erityisesti sairauksien riskiä ennustavien merkkiaineiden tunnistamiseen liittyvät menetelmät sekä biologisten verkkojen mallintaminen. Biologisilla verkoilla voidaan kuvata, miten esimerkiksi tuhannet geenit vaikuttavat yhdessä tai toistensa kautta jonkin ilmiön, esimerkiksi sairauden, taustalla.

– Kehonnesteiden ja kudosten rasvojen mittauksiin tiivistyy monipuolista tietoa geenisäätelystä, proteiinikoneiston toiminnallisuudesta, ympäristötekijöistä ja ruokavaliosta. Rasvoja ja niiden muutoksia tarkastelemalla voidaan muodostaa kokonaisvaltainen kuva kehon tilasta ja siksi niiden analysointi on erityisen mielenkiintoista, Pesonen sanoo.

Haasteena muuttujien suuri lukumäärä ja epätäydelliset havainnot

Biolääketieteellisessä tutkimuksessa on totutusti tarkasteltu kerrallaan yhden muuttujan, eli geenin, proteiinin tai lipidin, korrelaatiota tunnettuun fenotyyppiin tai esimerkiksi valtimotaudin vaikeusastetta koskevaan ennusteeseen. Usein kuitenkaan yhden geenin, proteiinin tai lipidin tutkiminen muista erillisenä osana ei riitä useimpien sairauksien ymmärtämiseen.

Siksi on tärkeää tutkia biologisia ilmiöitä kokonaisvaltaisesti käyttäen tilastollisia menetelmiä, jotka sallivat kaikkien mitattujen muuttujien yhtäaikaisen tarkastelemisen. Tällaisia ovat esimerkiksi tilastolliset monimuuttujamenetelmät ja regularisoidut regressiomallit.

Myös modernin mittausteknologian rajoitteet tuovat omat haasteensa suurten biolääketieteellisten aineistojen analysointiin. Laitteille ominaisten mittaustarkkuuksien alapuolelle jääviä pitoisuuksia ei voida havaita, jonka seurauksena aineistoista tulee reikäisiä.

Väitöskirjatutkimuksessaan Pesonen räätälöi olemassa olevia ja kehitti uusia analyysimenetelmiä vastaamaan näihin tarpeisiin. Työssä kehitettiin esimerkiksi reikäiselle aineistolle sopivan suurimman uskottavuuden estimaattorin kovarianssimatriisille. Tämä mahdollistaa useiden monimuuttujamenetelmien, kuten pääkomponenttianalyysin, soveltamisen ilman aineiston puuttuvien havaintojen korvaamista ”hyvillä arvauksilla” tai pahimmassa tapauksessa kaikkien epätäydellisten havaintojen kokonaan poissulkemista analyysista.

Toisena tärkeänä kokonaisuutena Pesonen kehitti uusia menetelmiä omiikka-aineistojen verkkorakenteiden mallintamiseen sekä reikäisille että lukumääräaineistoille.

– Inspiraationa biologisten verkkojen mallintamisen yleistämiselle lukumääräaineistoihin oli uuden sukupolven geeni-ilmentymisaineistot, joissa geenien ilmentymistä mitataan kokonaisluvuin. Tällöin aiemmat jatkuville muuttujille kehitetyt menetelmät eivät olekaan enää suoraan sovellettavissa, Pesonen kertoo.

Väitöskirja on englanninkielinen

 

Tuotenumero:9789512966424
Leveys:175 mm
Korkeus:8 mm
Syvyys:250 mm
Paino:495 g
Ulkoasu:nid.
Tekijä:Pesonen Maiju
Laajuus:156 s.
ISBN:
Julkaisuvuosi:2016
Sarja:AI osa 548
15,00 €
(sis. ALV 10%)


13,64 €
(ALV 0%)
Määrä: kpl