Je zal er misschien niet dagelijks mee bezig zijn, maar soms vraag je je misschien wel eens bij een tabel of view af van welke andere objecten (tabellen, views, stored procedures) deze afhankelijk zijn. In SQL server kan je dit in principe zien door op het object te klikken en de dependencies te bekijken. Of via de sys.sysdepends tabel.
Ik zeg in principe, want waanzinnig betrouwbaar blijken deze methodes (iig in SQL Server 2005) niet te zijn. Daarom ben ik aan het knutselen gegaan en heb ik een script gemaakt dat in een database van alle stored procedures en views onderzoekt welke tabellen en views worden aangeroepen, gemaakt, gevuld, gewijzigd, verwijderd, etc. Je vindt het script, sp_ObjectDependencies_v0_2_beta, in de download sectie . Script is nog in onwikkeling, maar toch al erg bruikbaar.
Maar ik ben ook een mooie tool tegengekomen van redgate. Deze tool visualiseert alle afhankelijkheden. Zie de video hieronder. Een ander tool van dit bedrijf, geeft je zelfs de mogelijkheid op kolomniveau te zien wat de afhankelijkheden zijn (SQL Prompt). Veel hoeft het allemaal niet te kosten, SQL Dependencies is 240 euro. Je kan een gratis trial versie (14 dagen) downloaden om er eens mee te spelen.
Persbericht van OPTA vandaag: Het eerste jaar van het bel-met-niet register heeft OPTA bijna 10.000 klachten ontvangen over ongewenste commerciële telefoontjes. Opvallend: 21% van de klachten betreft consumenten die gebeld zijn door een bedrijf waar ze klant zijn of waren. Alhoewel dit gewoon mag, is het geen gek idee om ook je klanten even langs het bel-me-niet register te halen.
Blijkbaar zijn het wel een handvol bedrijven die het gros van de klachten veroorzaken: OPTA is 48 onderzoeken gestart. Deze bedrijven zijn samen verantwoordelijk voor 80% van de klachten (hebben we hier een 20/80 regel?).
“top”-5 klachten: Telefonie & televisie (12%), energie (12%), loterijen (11%), kranten & tijdschriften (8%) en goede doelen (7%).
Beste collega’s: Wees niet irritant, maar relevant voor uw klant. En dat rijmt.
Ik was vorige week zo druk bezig om een leuk SQL script te maken dat laat zien welke bronnen (tabellen / views) gebruikt worden in stored procedures en views, dat ik niet meer toe ben gekomen aan de aanbevolen leesvoer editie. En het script is nog geeneens af, tsss. Maar daarover meer in een volgende post. Bij deze alsnog het aanbevolen leesvoer!
Leukste quote uit deze editie:
Database Marketers spent two decades trying to impress each other … trying to top each other using fancier and fancier techniques, until we couldn’t even explain what the heck it is we were doing and how we were doing it (i.e. Neural Networks).
Deze pagina is alleen toegankelijk voor leden. Login. Heeft u nog geen account? Registreer nu!
Zullen er later nog dingen zijn waar we geen Google voor gebruiken? Kijk eens naar onderstaande video over Google Refine, een tool om orde te scheppen in wanordelijke data. Of, zoals Google zelf zegt:
“Google Refine is a power tool for working with messy data, cleaning it up, transforming it from one format into another, extending it with web services (…)”.
Bijzonder is dat de tool ook zelf voorstellen doet voor transformaties om de vervuiling in je data tegen te gaan. Ook bijzonder: Google Refine is geen web service, maar gewoon een stukje software dat je kan installeren op je computer. Je hoeft dus geen data te uploaden naar Google. Volgens één van onderstaande video’s werkt het ook nog prima met een paar honderdduizend records, mits je pc snel genoeg is.
De site Information is Beautiful, van data-journalist David McCandless, heeft een onweerstaanbaar leuke animatie gemaakt waarin de uitgaven van de VS (er is ook een versie voor GB) mooi in perspectief wordt geplaatst.
Allereerst natuurlijk, gewaardeerde bezoeker, de beste wensen! Dat we maar weer veel nieuwe dingen mogen leren in dit nieuwe jaar.
Er is weer genoeg te lezen in deze aanbevolen leesvoer editie. Bijvoorbeeld een interessant artikel in The New Yorker over de (mogelijke) redenen dat verbanden gevonden in, gepubliceerde, wetenschappelijke studies na de hype ofwel niet meer te reproduceren zijn, danwel dat het effect veel kleiner blijkt.
De quote uit deze leesvoer-editie is meteen wel de meest bijzondere beeldspraak die ik ooit heb gezien om te demonstreren dat een populatie zag lastig door een gemiddelde laat beschrijven:
“The “average” adult in a global sample has one breast and one testicle”
Veel wijsheid toegewenst voor 2011!
Aanbevolen literatuur van deze week:
Deze pagina is alleen toegankelijk voor leden. Login. Heeft u nog geen account? Registreer nu!
De komende weken trek ik de stoute schoenen aan en zet ik mijn eerste kleine stapjes op het vlak van Text Mining. Vandaag de eerste aflevering in een, naar ik hoop, lange en interessante reeks in dit voor vele database marketeers onontgonnen terrein. Heb je tips & tricks voor me? Ik hoor het graag!
In de aflevering van vandaag ga ik data verzamelen. Het leek me leuk om reviews te gebruiken van mobiele telefoons. Reviews bevatten vaak grote stukken tekst in combinatie met gestructureerde data zoals een rapportcijfer. We gaan deze data natuurlijk niet zelf copy-pasten, we gebruiken daarvoor de webscraping tool Mozenda (we hebben hier eerder over deze tool geschreven).
In onderstaande video (de eerste DBM Cafe video!), laat ik Mozenda alle reviews en rapportcijfers van alle HTC smartphones verzamelen op de site kieskeurig.nl. In amper zes minuten tijd krijg je zo een goed beeld wat je met deze tool kan! De video heeft geen geluid, ik heb een toelichting als ondertiteling toegevoegd. Je kan de video dus rustig kijken zonder je omgeving te storen.
Een database marketeer zou er geen omkijken naar moeten hebben, maar sommigen zullen toch wel eens confronteerd worden met databases of logfiles die te groot worden, dat je zware queries alleen op bepaalde tijdstippen mag afvuren of er achter moet komen dat een database toch niet wordt gebackupt. Of testen van migraties naar andere servers, upgrades, etc.
Nu is er een verscheidenheid aan cloud diensten (zo verkoopt Amazon niet alleen boeken, maar ook serverruimte, zie Amazon Elastic Compute Cloud), zullen we in de toekomst allemaal aan “database marketing in the cloud” doen? Of aan “Cloud mining”?
Hieronder een leuk reclamefilmpje van database.com (van SalesForce):
database.com
Maar kan je het label “cloud” niet overal op plakken, zo vraagt Oracle’s CEO Larry Ellison – en blijkbaar parttime komiek – zich af:
Why Larry Ellison hates Cloud computing
En ten slotte een wat conceptueler filmpje van Salesforce’s Peter Coffee aan het MIT Enterprise Forum:
Het boek Introduction to Information Retrieval staat in het geheel op het internet. Het boek is gebaseerd op de module die de schrijvers geven op de universiteit van Stanford en die van Stuttgart.
Je vindt hier ondermeer het e.e.a. of text mining!
De University of Toronto heeft een handig overzicht van allerlei data mining technieken gemaakt. Je kan op de onderdelen van de map klikken voor meer achtergrondinformatie over de betreffende procedure.
Zie ook de site van de data mining groep van de afdeling Chemical Engineering and Applied Chemistry, voor meer data mining presentaties en links.