Yksityisyyden säilyttäminen asiakastietokannoissa on mahdollista
09.10.2007
VTT on tutkinut yksityisyyden säilyttävien tiedonlouhintamenetelmien soveltuvuutta asiakastietokantoihin. VTT arvioi asiakaskannan segmentoinnin eli suuresta tietomäärästä toisiaan muistuttavien tietoesiintymien löytämisen olevan mahdollista niin, että yksityisyys säilyy. Myös useiden tietolähteiden käyttö yhteisesti ilman, että yksittäiset liikesalaisuudet tai asiakastiedot paljastuvat, onnistuu – tosin esteitäkin on.
Joka paikan tietotekniikan mukanaan tuomat, lukuisat hajautetut tietolähteet
ja tavat yksilön tunnistamiseen nostavat esille huolen yksityisyydestä: mitä
voidaan ja mitä ei pidä tehdä yksilön tiedoilla. Yksilön yksityisyyden lisäksi
yritystietojen yksityisyys nousee esiin, kun tiedon louhinnan menetelmiä
sovelletaan asiakastietoihin.
Tiedon louhinnalla
tarkoitetaan uusien ja hyödyllisten säännönmukaisuuksien löytämistä suurista
tietomassoista. Yksityisyyden säilyttävä tiedon louhinta on suhteellisen nuori
ala, ja alalla tehty tutkimus on tähän mennessä ollut varsin teoreettista. VTT
on nyt selvittänyt olemassa olevien tiedonlouhintamenetelmien soveltuvuutta
käytäntöön sekä erityisesti yksityisen tiedon säilymistä. Työn tulokset
osoittavat, että yksityisyyden säilyttävä asiakaskannan segmentointi on
mahdollista ja yhteisesti suoritettu segmentointi tuottaa uutta tietoa. Tässä
on selkeänä hyötynä VTT:n mukaan se, että useita tietolähteitä voidaan käyttää
ja hyödyntää yhteisesti ilman, että yksittäiset liikesalaisuudet tai
yksittäisten asiakkaiden tiedot paljastuvat. Tämän tyyppisen hyödynnettävyyden
esteenä on tosin myös muita, kuten teknisiä, osapuolten luottamukseen ja
lainsäädäntöön liittyviä, seikkoja.
Käytännössä
yksityisyys säilyy tietuetasolla kryptaus, kohinan lisäyksen ja
tietuesekoituksen avulla. Algoritmitasolla yksityisyys puolestaan säilyy
suojattujen rutiinien avulla, näistä laskentaosapuolet saavat tuloksina tietää
vain koko dataa kuvailevat piirrearvot. Yksittäiset tietuearvot eivät paljastu.
Vallitseva
suuntaus yksilöllistämisen kasvavasta määrästä verkkopalveluissa on luonut
myös markkinoita yksilölliselle markkinoinnille. Yksilölliset
markkinointipalvelut hyödyntävät yksityiskohtaisia tietoja asiayhteydestä ja
yksilön käytöshistoriasta. Tämä vaatii kehittyneitä menetelmiä yksilön
tunnistamiseen, ja menetelmät nostavat huolen yksityisyydestä. Yksityisyyden
säilyttävien menetelmien uutuusarvo on mahdollisuus käyttää arkaluontoista ja
hajautettua tietoa tiedon louhintaan niin, että yksityisyys säilyy.
Tutkimus
verkossa: http://www.vtt.fi/inf/pdf/publications/2007/P647.pdf
