Hyödyllisiä ohjelmia
Kaikki seuraavista ohjelmista ovat ilmaisia.
Yleistyökaluja
- Weka. Helppokäyttöinen yleistyökalu. Sekä windows- että linux-versio. (mm. klusterointi- ja luokittelualgoritmeja ja joitain piirteiden eristysmenetelmiä)
- Orange Yleistyökalu datan visualisointiin ja analysointiin. (Monet kehuvat, kertokaa jos on hyvä!)
- RapidMiner Erittäin suosittu tiedonlouhintatyökalu. Erikoisuus: SVM-klusterointi. Voi yhdistää Wekaan? (Kertokaa jos hyvä!)
- Tanagra Wekan tapainen, ei mitään mitä siinä ei olisi(?). Kuulemma helppo lisätä omia menetelmiä.
- R
tilastollisen laskennan ohjelmointiympäristö (löytyy paljon valmiita
paketteja eri tarkoituksiin)
- Borgeltin työkaluja
data-analyysiin sekä komentorivipohjaisia että erillinen graafinen
käyttöliittymä. Mm. probabislitistinen klusterointi, decision and regression
tree, multilayer perceptron, Bayes-luokittelijoita.
- Gnumeric Hyvä
taulukkolaskentaohjelma. Sopii numeerisen datan tilastolliseen
analyysiin ja yksinkertaiseen mallinnukseen (monimutkaisimpia toimintoja
lienevät PCA ja monen muuttujan lineaariregressio). Sekä linux- että
windows-versio.
Klusterointiohjelmia
- Klusterointityökaluja ja tarvittavia konverttereita (Laitoksen tutkijoiden koodaamia) (Voi olla hankala saada toimimaan linuxissa?)
- Cluster 3.0
erityisesti geenidatan klusterointiin tarkoitettuja algoritmeja yhdessö paketissa
- ELKI Työkalu klusterointiin ja ulkopuolisten
tunnistukseen. Sis. mm. tiheysperustaisia menetelmiä
- MixModMalliperustaisia klusterointimenetelmiä. Voi käyttää Matlabista, ajaa suoraan komentoriviltä tai kutsua omista ohjelmista.
Riippuvuus- ja luokittelusääntöohjelmia
- Kingfisher 1.2 Tilastollisesti merkitsevien riippuvuussääntöjen etsintä binääridatasta erilaisilla hyvyysmitoilla.
Huom! uusi versio jolle voi antaa eheysehtoja! Ohjeita muuttujien esiprosessointiin täällä.
- namescodes-apuohjelma
muuntaa nominaaliattribuutit (transaktiodatassa) koodinumeroiksi ja
tulostiedoston koodatut riippuvuussäännöt takaisin
nominaalisiksi. (Kun attribuuteille antaa alkujaan kuvaavat nimet,
säännöt ovat helposti ymmärrettäviä.)
- MagnumOpus ilmainen demoversio (max 1000-riviselle datalle). Etsii tilastollisesti päteviä assosiaatiosääntöjä eli riippuvuussääntöjä.
Eri hyvyysmittoja ja hieman erilaisia hahmoja kuin Kingfisherissä
- Mutuali kahden
muuttujan välisten riippuvuuksien systemaattinen haku Mutual
Information-mitalla. Uusi svg-versio piirtää myös kuvat.
- Autokorrelaatiot Hyvin simppeli ohjelma vuorokausirytmin tarkistukseen tuntikohtaisesta datasta. Mukana gnuplot-skripti korrelogrammin tulostukseen.
Bayes-verkko-ohjelmia
Kattava lista
ohjelmia
täällä
Apuskriptejä
Yksinkertainen skripti jos haluat plotata automaattisesti useita syötetiedostoja gnuplotilla. (Linuxiin)
Muuta
HITS-algoritmin C-kielinen toteutus
tekstidatan analysointiin. (Voi käyttää muuhunkin, kun kutsut omasta ohjelmasta vain hits-funktiota.)