Blog
for at definere, hvor Big Data begynder, og hvorfra den målrettede brug af data bliver et Big Data-projekt, skal du se på detaljerne og nøglefunktionerne i Big Data. Dens definition er oftest baseret på 3-V-modellen fra analytikerne hos Gartner, og selvom denne model bestemt er vigtig og korrekt, er det nu tid til at tilføje yderligere to afgørende faktorer.
Big Data definition – de tre grundlæggende Vs:
- volumen definerer den enorme mængde data, der produceres hver dag af virksomheder, for eksempel. Genereringen af data er så stor og kompleks, at den ikke længere kan gemmes eller analyseres ved hjælp af konventionelle databehandlingsmetoder.
- Variety refererer til mangfoldigheden af datatyper og datakilder. 80 procent af dataene i verden i dag er ustrukturerede og viser ved første øjekast ingen indikation af forhold. Takket være Big Data sådanne algoritmer, data er i stand til at blive sorteret på en struktureret måde og undersøgt for relationer. Data omfatter ikke altid kun konventionelle datasæt, men også billeder, videoer og taleoptagelser.
- hastighed refererer til den hastighed, hvormed dataene genereres, analyseres og oparbejdes. I dag er dette for det meste muligt inden for en brøkdel af et sekund, kendt som realtid.
Big Data definition – to afgørende, yderligere Vs:
- gyldighed er garantien for datakvaliteten, eller alternativt er Sandhed ægtheden og troværdigheden af dataene. Big Data indebærer at arbejde med alle grader af kvalitet, da Volumenfaktoren normalt resulterer i mangel på kvalitet.
- værdi angiver merværdien for virksomheder. Mange virksomheder har for nylig etableret deres egne dataplatforme, fyldt deres datapuljer og investeret mange penge i infrastruktur. Det er nu et spørgsmål om at generere forretningsværdi fra deres investeringer.
som vi skrev i vores tidligere blogindlæg, er det ikke så let at definere Big Data, da udtrykket vedrører mange aspekter og discipliner. Og for mange mennesker er det vigtigste virksomhedernes succes (værdi), hvis nøgle er at få ny information – som skal være tilgængelig for mange brugere meget hurtigt (hastighed) – ved hjælp af enorme mængder data (volumen) fra meget forskellige kilder (variation) og af forskellig kvalitet (gyldighed) for hurtigt at kunne træffe vigtige beslutninger for at opnå eller opretholde konkurrencefordel.i bogen “Big Data – Brug af smart Big Data analytics og metrics til at træffe bedre beslutninger og forbedre ydeevnen” skriver Bernard Marr, at hvis Big Data i sidste ende ikke resulterede i en fordel, ville det være ubrugeligt. Vi kunne ikke være mere enige.
Her er noget andet, der kan interessere dig:
hvor begynder Big Data? – Mange perspektiver, en klassifikation
de næste store ting i dataverdenen (Del 1) – datavidenskab på skala
de næste store ting i dataverdenen (Del 2) – maskinlæring/dyb læring som en Servicelæring/dyb læring som en tjeneste
de næste store ting i dataverdenen (Del 3) – Human Data Interfaces (HDI) Interfaces (HDI)
Radioeins udsender re:publica special – *um forklarer Big Data
Leave a Reply