Ik had een tijdje vakantie en een weekje training, dus daarom deze week het leesvoer van drie weken opgestapeld op de leestafel. En da’s veel werk.
Afgelopen weken was “Big Data” het woord voor de buzz-word bingo. Zelfs in nrc.next stond hier een klein artikel over.
Erg interessant is het artikel Big and Fast van Information Week over “Big Data”. Hierin wordt het bedrijf Catalina Marketing aangehaald.
Ik was niet bekend met dit bedrijf, maar in de VS verzorgt het een gigantisch loyalty programma voor zo’n 24.000 supermarkten, drogisterijen en andere retailers. Plat gezegd wordt bij elke transactie bij de kassa een couponnetje geprint met een aanbieding of een korting voor een volgende transactie. Het aanbod is afhankelijk van de transactiehistorie en de demografische gegevens van de betreffende klant. Sinds een paar jaar zijn ze ook actief in Nederland en België, Intergamma (Gamma en Karwei bouwmarkten) werkt met Catalina.
Maar nu even in cijfertjes: Zeven jaar geleden, toen wij nog stoer deden over Gigabytes, had Catalina de eerste Petabyte al te pakken. Nu zitten ze met 2,5PB van ondermeer 195 miljoen klanten in de VS. Elke week verstouwen ze zo’n 300 miljoen transacties. Dit soort “Big Data” heeft een hele eigen dynamiek. Records vanuit de database naar een flat file kopiëren, model bouwen in een statistisch pakket en vervolgens het resultaat weer terug laden in de database is er dan niet meer bij. Veel leveranciers werken dan ook samen om in-database analytics mogelijk te maken, zo ook in het geval van Catalina (SAS en Netezza). Erg interessant wat mij betreft, binnenkort hoop ik wat meer over Catalina te kunnen schrijven!
Aanbevolen literatuur van deze week:
Deze pagina is alleen toegankelijk voor leden.
Login. Heeft u nog geen account? Registreer nu!




RSS