Wat is het verschil tussen gestructureerde en ongestructureerde data?

Antwoord

Kun je het in een Excel-bestand kwijt, dan is de kans groot dat je met gestructureerde data van doen hebt. Informatie met een bepaalde structuur en waarvan de vorm bekend is, kan eenvoudig worden verwerkt, geïnterpreteerd en is bovenal erg toegankelijk. Hierbij is SQL (Structured Query Language) de standaard: deze taal is sinds de jaren tachtig de standaard taal voor het beheren van gegevens in een relationele database.

Ongestructureerde data bestaan daarentegen uit verschillende typen informatie, afkomstig uit diverse bronnen. 80% van alle Big Data is ongestructureerd. Echter, vanwege de enorme hoeveelheid informatie is in de onderliggende lagen van Big Data vaak wel enige vorm van structuur terug te vinden. De kunst is dan ook om gestructureerde en ongestructureerde data samen te brengen, door bij laatstgenoemde structuur aan te brengen. Bedrijven zetten om die reden massaal in op (zelflerende) verwerkingssystemen die genoeg rekenkracht hebben om de hoeveelheid data aan te kunnen en tegelijkertijd patronen in de data kunnen herkennen. Hoe beter deze verwerkingssystemen hierin slagen, hoe nauwkeuriger de analyses worden en hoe waardevoller de informatie.

Datum: 14 juni 2018