Datagedreven bedrijven maximaliseren de potentiële voordelen van hun data. De datateams binnen deze bedrijven hebben efficiënte processen om data om te zetten in actie en acties weer om te zetten in data. Het kan behoorlijk complex en uitdagend zijn om zo’n transformatie te starten. Deze tips geven je daarom handvatten om deze transformatie succesvol te doorlopen.
1. Zorg voor buy-in en organisatorische verandering
Meer datagedreven worden heeft een enorme impact op de organisatie en vereist dan ook buy-in en ondersteuning tot aan het hoogste niveau. Alleen dan pas kun je beginnen met het ontwerp van een moderne cloudinfrastructuur die je deze transformatie laat doorlopen.
Daarnaast is het nodig de werkwijzen van je datamedewerkers te veranderen. De neuzen van je datawetenschappers, data engineers, bedrijfsanalisten en andere experts moeten dezelfde kant op staan, zodat ze beter samen kunnen werken met dezelfde datasets.
2. Identificeer en prioriteer de meest waardevolle use cases
Je data-experts kunnen nu beter samenwerken – maar aan wat? Om ervoor te zorgen dat ze aan de meest waardevolle use cases werken, moeten de leidinggevenden in de organisatie en de technische experts dezelfde prioriteiten hebben.
De juiste prioritering heeft een evenwicht tussen offensieve en defensieve use cases. Offensieve use cases zijn bedoeld om de omzet en klantenwerving te verhogen en tegelijkertijd de operationele kosten te verlagen. Een voorbeeld is het gebruik van AI om de segmentatie van klantmarketing te sturen en zo de klantengroep te vergroten waarvan de kans groot is dat deze tot conversie zal overgaan. Defensieve use cases daarentegen zijn er om je organisatie te beschermen tegen risico’s en te zorgen voor naleving van regelgeving. Denk aan het gebruik van AI-monitoring van mobiele- en webapplicaties om fraude op te sporen.
Door use cases regelmatig te evalueren en te classificeren, kun je de strategische impact, haalbaarheid en ROI bepalen. Onthoud daarbij dat niet elke use case dezelfde prioriteit heeft, zelfs niet als ze evenveel bedrijfswaarde toevoegen. Sommige use cases zullen immers moeilijker te implementeren zijn of andere datasets vereisen die wellicht niet zo gemakkelijk beschikbaar te maken zijn. Voor data- en AI-succes moet je eerst op zoek gaan naar de quick wins en van daaruit het momentum opbouwen.
3. Maak data toegankelijk voor de hele organisatie
Data van hoge kwaliteit kent ook een tijdsfactor. Wanneer een stukje data voor het eerst binnenkomt in de organisatie, is het vaak zeer actueel. Als je op basis van een enkel data-item – zoals een verdachte creditcardtransactie – meteen kunt handelen, kun je fraude sneller detecteren en realtime beslissingen nemen. Terwijl de tijdgebonden waarde van een individueel data-item afneemt naarmate het ouder wordt en zijn relevantie verliest, wordt geaggregeerde oudere data juist weer waardevol. Deze data kun je gebruiken voor trendanalyse of het trainen van een ML-model om fraudedetectie of een soortgelijk proces te verbeteren.
Om kwaliteitsdata zo breed mogelijk toegankelijk te maken, moet het aantal kopieën van data tot een minimum worden beperkt. Maar al te vaak werken datateams in gescheiden omgevingen, met zowel data lakes als enterprise data warehouses. Dit leidt tot kopieën van dezelfde datasets op verschillende platforms. Die aanpak is sterk af te raden, omdat je het risico op extra kopieën van data vergroot en het erg moeilijk is om al je gegevens synchroon te houden. Ga dan ook waar mogelijk voor één gezamenlijke dataset, een ‘single source of truth’.
4. Besluit of je een oplossing wilt kopen of bouwen
Ga je het dataplatform zelf bouwen, of schaf je een extern product of dienst aan? Wanneer je besluit om bedrijfscapaciteit in te zetten om je eigen oplossing te bouwen, word je in principe je eigen softwareleverancier – met alle verantwoordelijkheden van dien.
Het voordeel hiervan is dat je de roadmap van het product/platform volledig kunt beheren en de ontwikkeling kunt sturen. Het nadeel is dat je aanzienlijke investeringen zal moeten doen in het stroomlijnen van je CI/CD-proces om ervoor te zorgen dat wijzigingen en fixes snel kunnen worden uitgevoerd en dat je gedetailleerde documentatie en training kunt bieden aan gebruikers en ontwikkelaars.
Het antwoord op de volgende vraag zal je wellicht helpen bij deze keuze. Is het voor de beoogde gebruikers van belang wie het platform heeft gebouwd, of is het belangrijker dat functies snel beschikbaar zijn, het platform hun use cases ondersteunt en dat het betrouwbaar is?
5. Maak gebruik van een lakehouse-architectuur
Het data-ecosysteem is de afgelopen decennia sterk ontwikkeld. Van datawarehouses in de jaren tachtig naar de data lakes van begin deze eeuw, tot de opkomst van het data lakehouse – een nieuwe, open architectuur die de beste aspecten van data lakes en data warehouses combineert.
Met een lakehouse-architectuur beschikken datateams over een efficiëntere datapijplijn, krachtige resources die naar wens op- en teruggeschaald kunnen worden én een dataplatform dat zich houdt aan het kosten- en datagovernancebeleid van de organisatie. Of je nu een platform koopt of zelf ontwikkelt, een data lakehouse zorgt voor de flexibiliteit en kostenefficiëntie waarmee iedere organisatie een AI-gedreven databedrijf kan worden.
Door Pieter Senster, Engineering Director bij Databricks