Aika ja paikka : Ensi ma ja to 20.5. ja 21.5. klo 16.15-17.45 (Kuopiossa Technopoliksen sali F213 ja Joensuussa Tiedepuiston sali TB178, videointi oletusarvoisesti Kuopiosta Joensuuhun, mahdollisesti jokin esitys toiseen suuntaan).
Sisältö: Tiedonlouhintakurssin opiskelijat esittelevät poikkitieteellisten projektiensa tuloksia. Projektit toteutettiin Tietojenkäsittelytieteen ja soveltavien alojen (Biologia, Ympäristötiede) opiskelijoiden ja jatko-opiskelijoiden yhteisprojekteina, joissa kukin ryhmä analysoi jonkin oikean elämän kiinnostavan datajoukon. Analyysissä käytettiin tiedonlouhinnan menetelmiä kuten tilastollista riippuvuusanalyysiä, klusterointia, luokittelua ja ongelmakohtaisia erikoismenetelmiä. Vähintään yhtä merkittävässä roolissa olivat datan esiprosessointi (erityisesti hyvien piirteiden muodostus datasta), havainnollinen visualisointi ja tulosten tulkinta.
Tervetuloa!
Analysoitiin kaatopaikka- ja turkistarharottien hyvinvointia ja vatsahaavan esiintyvyyttä erilaisten fysiologisten indikaattorien perusteella.
Vertailtiin geenien aktiivisuutta erilaisilla hiirillä (terveet ja sairaat, normaaligeeniset ja mutantit) sekä rotilla (eri-ikäiset sikiöistä vanhuksiin). Erikoisuutena kokeiltiin, löytyisikö eri ryhmien eroja kuvaavia geenien GO-luokkiin (kuten funktioihin) liittyviä tilastollisia riippuvuushahmoja.
Kehitettiin menetelmiä vapaamuotoisia tekstikenttiä sisältävien kyselydatojen automaattiseen analyysiin. Esimerkkidatana oli lukiolaisille etäopetuksena tarjottujen ohjelmointikurssien esikyselydata. Kyseisen datan osalta kiinnostavin kysymys oli, mitkä (jos mitkään) esitietokyselystä löytyvät piirteet voisivat indikoida kurssin keskeyttämistä, hylkäämistä tai erinomaista suoritusta.
Tutkittiin mitä kiinnostavia hahmoja löytyy lehmien ruokinta-automaattidatan lokista. Erityiskiinnostuksena olivat lehmäyksilöiden väliset erot sekä lehmien väliset sosiaaliset suhteet.
Analysoitiin poikivien lehmien käyttäytymisestä kerättyä yksityiskohtaista dataa. Erityisesti tutkittiin ruumiinlämmön vaihteluita (Mahdollisesti myös ekg-datasta löytyviä hahmoja?). Kiinnostavin kysymys oli etsiä piirteitä, jotka indikoisivat poikimista tietyn ajan (esim. 12h, 6h, 3h tms.) kuluessa.
Selvitettiin voisiko kiihtyvyysdatasta johtaa lehmien (poikimis-)toimintoja tai yleistä aktiivisuustasoa kuvaavia piirteitä. Erityistavoitteena oli kehitellä menetelmää, jolla voisi tunnistaa lehmien aktiivisuustason pelkästä kiihtyvyysdatasta ilman työlästä videoiden katselua, jolloin asiantuntijoiden ajankäyttö voitaisiin kohdistaa hankalimpiin osiin.
Analysoitiin useista kouluista sekä yhdestä omakotitalosta pitkältä aikaväliltä kerättyä huoneilman laatua, lämpötilaa jne. kuvaavaa mittausdataa. Erityiskiinnostuksena oli tutkia, eri havaintopaikkojen välisiä eroja sekä mitä trendejä, syklejä tai korrelaatioita muuttujista löytyy ja mistä nämä kertovat.