Big data zijn in de ogen van velen even waardevol als goud en olie. Maar ook al zitten organisaties boven op een goudmijn of oliebron, ze weten die vaak niet te ontginnen.
Het volume aan data in de wereld heeft onvoorstelbare proporties aangenomen. Het wordt inmiddels gemeten in zettabytes: 1 ZB = 1.000.000.000.000.000.000.000 bytes = 1021 bytes = 1 biljoen GB = de opslagcapaciteit van ongeveer 250 miljard dvd’s.
In 2009 bevatte alleen het internet 0,5 ZB. In 2011 bedroeg het totale volume aan digitale data in de wereld 1,8 ZB en de verwachting is dat het groeit naar 90 ZB in 2020. 90% van alle digitale data is in de afgelopen twee jaar gecreëerd. Het gaat dus ook in dit opzicht om BIG data.
Strategisch belang
Het strategisch belang van big data is al even BIG: het is een gigantische bron van concurrentievoordeel. Tegelijkertijd lukt het de meeste organisaties niet om goed te profiteren van de goudmijn waarop ze zitten.
Er zijn vijf barrières, zeggen Abdulkhaliq Alharti (Abu Dhabi University), Vlad Krotov en Michael Bowman (beiden Murray State University).
De infrastructuur is er niet klaar voor
Het vergt grote investeringen in hard- en software om een IT-infrastructuur voor big data te ontwikkelen en de meeste bestaande technologieën zijn niet ontworpen op big-data-analyse. Vaak is de hoop gevestigd op architecturen voor cloudcomputing en heterogene computing. Maar die schieten meestal tekort in technisch en economisch opzicht (veel te duur).
Oplossing: commodity-hardware voor het versterken van de verwerkingsvermogen en opslagcapaciteit.
90% van alle digitale data in de wereld is in de afgelopen twee jaar gecreëerd
Datacomplexiteit
Drie dingen spelen hier een rol. De hoeveelheid data groeit onvoorstelbaar snel, iets waar organisaties niet op zijn berekend. De data komen uit talrijke bronnen die data op verschillende manieren hebben georganiseerd en gedefinieerd. Daardoor ontstaan er semantische conflicten (de term earnings betekent bijvoorbeeld de ene keer ‘winst’ en de andere keer ‘inkomsten’ of ‘omzet’). Bovendien hebben de data allerlei formats, zowel gestructureerd (relationele databases) als ongestructureerd (tekstdocumenten, sms’jes, beelden, video’s, e-mails enzovoort). Dat maakt ze nagenoeg onhandelbaar en moeilijk te analyseren.
Oplossing: gespecialiseerde softwaretools en algoritmes als MapReduce en Hadoop.
Lees ook: Je hebt geen Big Data nodig, maar de juiste Data
Gebrek aan vaardigheden
Er zijn weinig of geen medewerkers met de vereiste vaardigheden op het vlak van big-data-analytics of algemene analytics. Alleen al in de VS is er in 2018 een tekort van 120.000 tot 190.000 big-datadeskundigen.
Oplossing: samenwerken met opleidingsinstituten.
Privacy
Zorgen over de privacy verhinderen vaak dat organisaties aan big-data-analytics gaan doen. Bij big-data-analytics gaat het immers vaak over persoonlijke data die met een geheel ander doel verzameld zijn. De wettelijke en ethische risico’s zijn groot.
Oplossing: betere, gerichte wetgeving en toepassing van best practices voor de verwerking van gevoelige klantendata.
Culturele barrières
Sommige organisaties begrijpen gewoon te weinig van big data om de waarde ervan in te zien. Dat kan resulteren in weerstanden.
Oplossing: een heldere organisatievisie op big data.
Bron: Business Horizons, mei-juni 2017