Loppuraportti

Seuraavassa on loppuraportin sisältö. Voitte halutessanne käyttää toisenlaista otsikointia/rakennetta, mikäli se tuntuu sopivammalta, kunhan samat asiat tulee kerrottua. Mukana on apukysymyksiä, mutta soveltakaa niitä aiheenne mukaan. (Apukysymykset koskevat yleisimpiä menetelmiä.) Raportin pituus riippuu esitystyylin tiiviydestä (suositus: 12pt fontti). Oletusarvoisesti 6-10 sivua, mutta jos mukana on paljon kuvia (hyvä asia), niin sitten voi olla pidempikin (kuvia voi laittaa liitteeseen jos niitä on paljon). Pääasia että kaikki oleellinen tulee kerrottua riittävällä tarkkuudella.

Voitte halutessanne käyttää oheista latex-templaattia. (Käännettynä se näyttää tältä )

TÄRKEÄÄ:

  • Laittakaa jokaisen luvun alkuun luvun kirjoittaja(t).
  • Palauttakaa pdf:nä (voitte lähettää dokumentin tai vain linkin siihen)
  • Ehdoton deadline ke 29.5. klo 24.00.

    Otsikkotiedot (halutessa kansilehti)

    Keksikää aiheelle kuvaava nimi. Alaotsikoksi "Tiedonlouhinnan harjoitustyö" ja päivämäärä. Tekijöiksi ryhmän jäsenet (jotka jatkoivat loppuun asti) ja ainakin yhden kontaktihenkilön sähköposti (Tämä on tulevaisuutta varten, jos joku haluaa jälkikäteen kysellä lisää projektistanne.).

    1. Yleiskuvaus aiheesta

    Lyhyesti mikä oli aihe, mihin se liittyi, ihan yleisellä tasolla millainen data ja mihin kysymyksiin toivottiin erityisesti vastauksia tai mitä mallinnusmenetelmää haluttiin testata (Siis "tutkimusongelma(t)", jos sellaisia oli). Muistakaa: Tiiviisti ja yleisellä tasolla eli pituus vain 1-2 kpl.

    2. Data

    Alkuperäisen datan kuvaus eli seuraavat asiat
    1. Datan määrä eli montako riviä ja montako muuttujaa.
    2. Datan alkuperä (sikäli kuin tiedätte): Mistä kerätty? Oliko esim. tietyltä aikaväliltä tai tietyiltä yksilöiltä? Mihin tarkoitukseen?
    3. Minkä tyyppistä dataa? Jos "tavallista" eli ei aikadimensiota ja esitetty valmiina muuttuja-arvopareina, voi luonnehtia staattiseksi ja rakenteelliseksi. Muuten miten poikkesi tästä: esim. oliko temporaalista eli aikasarja- tai tapahtumalokidataa tai sisälsikö rakenteettomia elementtejä (kyselydata).
    4. Mitä muuttujia? Merkitys lyhyesti ellei ihan triviaali (tyyliin paino). Mittayksiköt? Mittausfrekvenssi (jos aikasarjadataa)? Muuttujan tyyppi? Tässä mainitaan myös "rakenteettomat muuttujat" (käytännössä merkkijonotyyppisiä muuttujia).
    5. Datan laatu ja anomaliat (eli kaikki ongelmat): Oliko puuttuvia tai virheellisiä arvoja? Kuinka paljon? Keskittyivätkö tiettyihin muuttujiin vai tasaisesti? Tiedättekö syytä? (esim. lähestykatkot). Missä määrin (arvioitte) oli outliereita ja kohinaa? Olivatko ne mittausvirheitä vai aitoa vaihtelua kohteissa? (Tämä on tärkeää, jos vain erotettavissa!) Mikäli kohina tai outlierit selvisivät vasta esiprosessoinnissa tai mallinnuksessa, niitä voi käsitellä tarkemmin vastaavissa luvuissa ja tässä vain ennakkomainostaa.
    6. Oliko varsinaisen datajoukon lisäksi jotain apudatoja (joissa lisätietoja joistain muuttujista, tyliin lehmäyksilöistä)?

    3. Esiprosessointi

    eli datan siivous, tilastollinen perusanalyysi (muuttujien jakaumat), uusien muuttujien muodostus ja mahdollinen muuttujien valinta -- mitä kaikkea teitte ennen varsinaista mallinnusta?

    4. Mallinnus

    Kaikki kokeillut menetelmät, niissä käytetyt muuttujat ja parametriasetukset. Muistakaa mainita, jos menetelmässä käytettiin vain jotain datan osaa. Esim.

    Extraplussaa: Mitä esioletuksia menetelmään (tai valitsemiinne parametreihin) liittyy? Tästä voi kertoa myös tulosten yhteydessä eli mitä implisiittisiä rajauksia olitte asettaneet hakuavaruudelle (eli mitä mahdollisesti missattiin).

    5. Tulokset

    Kertokaa sekä negatiiviset että positiiviset tulokset ja pohtikaa niiden luotettavuutta ja merkitystä.

    Lisäksi pohdintaa käytännön merkityksestä (nimenomaan sovellusalan kannalta)!

    Johtopäätökset ja jatkokehitysideat

    Löytyikö kiinnostavaa uutta tietoa? Mitkä menetelmät osoittautuivat parhaiksi ja mitkä huonoimmiksi? Myös vinkit, millaista dataa kannattaisi jatkossa kerätä tai miten samantapaisia ongelmia kannattaisi ratkaista.

    Tämä luku voi puuttuakin, jos kaikki tuli jo kerrottua tuloksissa.