Articles

blogi

määrittelemään, mistä Big Data alkaa ja mistä kohdasta datan kohdennettu käyttö muuttuu Big Data-projektiksi, on tutustuttava Big Datan yksityiskohtiin ja keskeisiin ominaisuuksiin. Sen määritelmä perustuu yleisimmin Gartnerin analyytikoiden 3-V-malliin, ja vaikka tämä malli on varmasti tärkeä ja oikea, nyt on aika lisätä vielä kaksi ratkaisevaa tekijää.

Big Data definition-the three fundamental Vs:

  • volyymi määrittelee sen valtavan määrän dataa, jota esimerkiksi yritykset tuottavat päivittäin. Datan tuottaminen on niin suurta ja monimutkaista, ettei sitä voida enää tallentaa tai analysoida perinteisin tietojenkäsittelymenetelmin.
  • lajike viittaa tietotyyppien ja tietolähteiden moninaisuuteen. 80 prosenttia maailman nykytiedoista on jäsentymättömiä, eikä ensisilmäyksellä näy mitään viitteitä ihmissuhteista. Big Datan kaltaisten algoritmien ansiosta dataa voidaan lajitella jäsennellysti ja tutkia ihmissuhteita. Data ei aina sisällä vain tavanomaisia aineistoja, vaan myös kuvia, videoita ja puhetallenteita.
  • nopeus tarkoittaa nopeutta, jolla data syntyy, analysoidaan ja käsitellään uudelleen. Nykyään tämä on useimmiten mahdollista sekunnin murto-osassa, joka tunnetaan reaaliaikaisesti.

Big Data definition – two critical, additional Vs:

  • validiteetti on tietojen laadun tae tai vaihtoehtoisesti todenmukaisuus on tietojen aitous ja uskottavuus. Big dataan kuuluu työskentely kaikilla laatuasteilla, sillä Volyymikerroin johtaa yleensä laadun puutteeseen.
  • arvo tarkoittaa yrityksille koituvaa lisäarvoa. Monet yritykset ovat viime aikoina perustaneet omat data-alustansa, täyttäneet datapoolinsa ja investoineet paljon rahaa infrastruktuuriin. Nyt on kyse liiketoiminnan arvon tuottamisesta niiden investoinneista.

kuten kirjoitimme edellisessä blogikirjoituksessamme, Big Datan määrittely ei ole niin helppoa, sillä termi liittyy moniin osa-alueisiin ja tieteenaloihin. Ja monille ihmisille tärkeintä on yritysten menestys (arvo), jonka avain on saada uutta tietoa – jonka on oltava monien käyttäjien saatavilla hyvin nopeasti (nopeus) – käyttämällä valtavia määriä dataa (määrä) hyvin erilaisista lähteistä (lajike) ja laadultaan (pätevyys), jotta voidaan nopeasti tehdä tärkeitä päätöksiä kilpailuedun saamiseksi tai säilyttämiseksi.

kirjassaan ”Big Data – käyttämällä älykästä Big Data-analytiikkaa ja mittareita parempien päätösten tekemiseen ja suorituskyvyn parantamiseen” Bernard Marr kirjoittaa, että jos Big Data ei lopulta tuottaisi etua, se olisi hyödytöntä. Olemme täysin samaa mieltä.

tässä on jotain muutakin, joka saattaa kiinnostaa:
mistä Big Data alkaa? – Many perspectives, one classification
the next big things in the data world (Part 1) – Data Science on scale
the next big things in the data world (Part 2) – Machine Learning/Deep Learning as a ServiceLearning/Deep Learning as a Service
the next big things in the data world (Part 3) – Human Data Interfaces (HDi) Interfaces (HDi)
Radioeins broadcasts re:publica special – *um explains Big Data