De Amerikaanse overheid heeft sinds de 9/11 aanslagen 14 data mining programma’s lopen, waarvan er tien zeer waarschijnlijk persoonlijke informatie gebruiken, zoals belgedrag en financiele transacties.
Nutteloos en een schadelijke verspilling van (belasting)geld en tijd stellen Jeff Jonas en Jim Harper in het interessante artikel Effective Counterterrorism and the Limited Role of Predictive Data Mining, waarbij ook nog eens onnodig inbreuk wordt gemaakt op de privacy.
Redenen:
- Door het relatief kleine aantal aanlagen of pogingen daartoe is er te weinig historische data om patronen in planning en voorbereiding van een aanlag te ondekken. Citaat: “The one thing predictable about predictive data mining for terrorism is that it would be consistently wrong”
- Zelfs een uitstekend model zal nog teveel vals positieve resultaten opleveren. Bij Direct Marketing is dit niet erg (een goed model levert een winst op in de kosten/baten verhouding), bij terrorismebestrijding zal het er op neer komen dat je miljoenen mensen onder de loep moet nemen die ten onrechte zijn gekenmerkt als potentieel terrorist.
Daarbij maken de auteurs pijnlijk duidelijk dat met ambachtelijk speurwerk, wat meer inzet, betere samenwerking en het delen en gemakkelijker toegankelijk maken van bepaalde informatie de aanslagen wellicht wel waren te voorkomen: Van twee kapers wisten ze dat ze in het land waren, dat ze banden hadden met al-Qaeda en dat ze mogelijk betrokken waren bij de aanslagen op ambassades en de USS Cole. Veel moeite om zich te verstoppen, deden ze niet: ze gebruikten hun eigen naam om rijbewijzen aan te vragen en rekeningen te openen. De plegers stonden geregeld met elkaar in contact.
Zie ook het artikel Data mining: The new weapon in the war on terrorism? dat ik eerder aanstipte op deze blog.
Bronnen:
CATO: Effective Counterterrorism and the Limited Role of Predictive Data Mining
FCW.com: Data mining: The new weapon in the war on terrorism?




RSS