Als je snel een eerste gevoel wil hebben van de data in een tabel, heb je met SQL een probleem. Bij bijvoorbeeld SPSS is dit een eitje, je selecteert alle kolommen die je wilt in het menu “Explore” en je krijgt van alle (numerieke) data het aantal records, minimum, maximum, standaard deviatie, etc, etc. Erg fijn als je een dataset voor het eerst onder handen hebt.
In SQL ben je dan wel even bezig, voorwaar geen leuke taak. Daarom heb ik enige tijd een stored procedure geschreven die automatisch voor alle kolommen in een tabel (of view) metadata laat zien. Informatie over de variabelen zelf (datatype, is het een primary index, etc.) en statistieken over de inhoud. Ik heb het script nu aangepast zodat je meer statistieken op kan vragen. Naast het aantal records, missings, min, max, gemiddelde, etc. heb je nu ook de mogelijkheid om de kwartielen op te vragen, alsook de mediaan, kurtosis en skew.
Ook is het nu mogelijk om alleen een subset van kolommen als input te geven.
Het script kan je hier downloaden (wel even inloggen!).
Mocht je op- of aanmerkingen op het script hebben, ik hoor het graag!




RSS