Wat is data analyse?

Home Project Management Wat is data analyse?

Om de juiste beslissingen te kunnen nemen heb je inzicht nodig. En dus zul je aan data analyse moeten doen om vanuit data inzicht te verkrijgen. Maar hoe gaat dat in zijn werk? Lees er alles over in deze blog!


Data ophalen

Om data te kunnen analyseren zal het eerst ergens moeten worden opgehaald. Dit is de eerste fase van het proces wat veelal wordt afgekort met ETL: Extract, Transform and Load. Dat komt neer op het ophalen van data, waar het ook leeft, om het vervolgens te transformeren en inladen. Over de die laatste 2 dadelijk meer.

Organisaties beschikken over data op allerlei verschillende locaties. Denk aan databases, datawarehouses, websites, bestanden (veelal maar niet alleen Excel en CSV bestanden), sharepoint lijsten, boekhoudpakketten en nog veel meer. Je wilt ervoor zorgen dat je direct op die bronnen aansluit zodat je niet elke keer weer met handmatig werk wordt geconfronteerd als je nieuwe gegevens in je rapporten wilt verwerken.


Data transformeren

Het zou mooi zijn als data altijd keurig netjes geordend beschikbaar is, precies zoals jij het nodig hebt. Maar in de praktijk gebeurt dat eigenlijk nooit. Dus komen we bij de T van ETL, het transformeren, vaak ook wel opschonen genoemd, voordat je het kunt gaan analyseren. Het uitfilteren van gegevens die je niet nodig hebt, het vullen van missende waarden, het splitsen van gegevens of juist toevoegen ervan valt daar allemaal onder. En nog veel meer uiteraard!


Data samenvoegen

Heel vaak zul je zien dat er voor een bepaalde analyse data vanuit verschillende bronnen nodig is. Bijvoorbeeld als je data zich in meerdere Excel bestanden bevindt. Of je baseert een analyse op gegevens vanuit een database maar hebt ook nog wat informatie vanuit een CSV bestand nodig. Of je haalt gegevens vanuit Google Analytics op en wilt dat aanvullen met gegevens vanuit je datawarehouse. En zo zijn er nog allerlei situaties denkbaar.

Je zult in de eerste fase dan een directe aansluiting op meerdere bronnen aanleggen. Maar als je die gegevens niet op een bepaalde manier met elkaar samenvoegt om er één integraal datamodel van te maken heb je er niet zoveel aan. Daarom zul je tijdens het ophalen van je data het voorbereidende werk gaan verzetten. Of, technisch gesproken, je data onderverdelen in dimensie- en feitentabellen. Lang verhaal kort; je zorgt ervoor dat je dimensietabellen gegevens over business-entiteiten bevatten. Denk aan je producten, medewerkers, klanten etc. En je feitentabellen bevatten numerieke informatie over een proces. Denk bij een verkoopproces aan het aantal verkochte stuks per verkooptransactie of de verkoopprijs per eenheid verkocht product.

Dan volgt de L van ETL; in inladen van de opgeschoonde data. Na inladen van de data zul je relaties tussen de tabellen aanleggen om ervoor te zorgen dat alles met elkaar gaat samenwerken.


Data onderzoeken

Na afronding van de vorige fase heb je je data geprepareerd en kun je beginnen met het onderzoeken van je data, ook wel data exploratie genoemd. Dit is de fase waarin je op zoek gaat naar verborgen inzichten in je data. Wat is het verhaal wat zich achter de cijfers afspeelt? Dit zul je doen door vanuit allerlei dwarsdoorsnedes naar je data te kijken. En door allerlei patronen in je data in kaart te brengen en je analyse daarop te richten. Maar steeds meer ook door gebruik te maken van AI (Artificial Intelligence). De ontwikkelingen op dat gebied gaan erg snel en AI is inmiddels al zover dat je geen rocket scientist meer hoeft te zijn om het toe te passen. Je kunt bijvoorbeeld maand op maand verschillen laten analyseren of laten onderzoeken of er opvallende afwijkingen in je data zijn en waardoor die worden veroorzaakt. 


Informatie visualiseren

Tijdens de vorige fase heb je data omgezet naar informatie. De visualisatie fase betreft het inzichtelijk maken van die informatie op een rapport. Het uiteindelijke doel van je rapport is een betere (business) beslissing door de rapportgebruiker. Dus het is van belang om dat in gedachte te houden bij het maken van het rapport. Het is verreweg het beste om eerst een rapport te ontwerpen zonder een computer. Gebruik gewoon een whiteboard als je met meerdere mensen ontwerpt of simpelweg potlood en papier als je dit alleen doet.

Bij dat ontwerp wil je ervoor zorgen dat de belangrijkste informatie direct in het oog sprint. Veelal betekent dit dat rapportgebruikers direct kunnen zien of KPI’s conform doelstelling zijn. Dit toon je bovenaan, en laat je door grootte en kleur ook echt eruit springen. Bij KPI’s die achterblijven op doelstellingen moet het zo eenvoudig mogelijk zijn om vanuit het verdere rapport te achterhalen waar dat door komt.


Informatie distribueren

De distributie van je rapport kán wel gebeuren door simpelweg je bestandje rond te mailen. Maar dat is niet eenvoudig te bekijken en, veel belangrijker, je hebt geen zekerheid dat alle gebruikers naar dezelfde versie en dus dezelfde cijfers kijken. Daarom plaats je een rapport in de cloud. Daar zijn ook mogelijkheden om met een team samen te werken aan meerdere rapporten en deze heel gecontroleerd ter beschikking te stellen aan rapportgebruikers. Je kunt ook binnen een rapport weer informatie afschermen voor bepaalde gebruikers. Bijvoorbeeld aan de manager van een sales team alle sales informatie maar aan accountmanagers ditzelfde rapport presenteren maar dan alleen met informatie van hun eigen klanten.


Tot slot

Dit proces is eigenlijk niet echt een proces met een begin en een eind, maar meer een cyclus. Als een rapport ook echt in de weerbarstige praktijk gebruikt wordt zullen er namelijk altijd opvolgverzoeken komen vanuit de rapportgebruikers. Kernwoorden hier zijn “ondervinden” en “voortschrijdend inzicht”. Maar organisaties (en hun omgeving) zijn ook continu in beweging. Dus blijft het altijd nodig om het rapport optimaal aan te laten sluiten op de informatiebehoefte van de gebruikers. Al met al is data analyse dus een veelomvattende, dynamische en vooral erg interessante bezigheid!


En die 6 stappen? Die komen vanuit de Power BI “Dashboard in a Day” training, ontwikkeld door Microsoft. En die stappen behandel ik ook uitgebreid in mijn basistraining. Kijk voor meer informatie op de trainingen pagina op deze website!