Articles

Blog

aby określić, gdzie zaczyna się Big Data i od którego momentu ukierunkowane wykorzystanie danych staje się projektem Big Data, musisz przyjrzeć się szczegółom i kluczowym cechom Big Data. Jego definicja opiera się najczęściej na modelu 3-V analityków Gartnera i choć model ten jest z pewnością ważny i poprawny, nadszedł czas, aby dodać kolejne dwa kluczowe czynniki.

definicja Big Data-trzy podstawowe Vs:

  • wolumen określa ogromną ilość danych, które są produkowane każdego dnia przez firmy, na przykład. Generowanie danych jest tak duże i złożone, że nie można ich już zapisywać ani analizować przy użyciu konwencjonalnych metod przetwarzania danych.
  • różnorodność odnosi się do różnorodności typów danych i źródeł danych. 80 procent danych w dzisiejszym świecie jest nieustrukturyzowane i na pierwszy rzut oka nie wykazują żadnych oznak związków. Dzięki takim algorytmom Big Data dane mogą być sortowane w sposób uporządkowany i badane pod kątem relacji. Dane nie zawsze obejmują tylko konwencjonalne zbiory danych, ale także obrazy, filmy i nagrania mowy.
  • prędkość odnosi się do prędkości, z jaką dane są generowane, analizowane i ponownie przetwarzane. Obecnie jest to możliwe w ułamku sekundy, czyli w czasie rzeczywistym.

definicja Big Data – dwa kluczowe, dodatkowe Vs:

  • Ważność to gwarancja jakości danych lub, alternatywnie, prawdziwość to autentyczność i wiarygodność danych. Big Data obejmuje pracę ze wszystkimi stopniami jakości, ponieważ współczynnik objętości zwykle powoduje niedobór jakości.
  • wartość oznacza wartość dodaną dla firm. Wiele firm niedawno założyło własne platformy danych, wypełniło swoje pule danych i zainwestowało dużo pieniędzy w infrastrukturę. Jest to teraz kwestia generowania wartości biznesowej z ich inwestycji.

jak pisaliśmy w poprzednim wpisie na blogu, definiowanie Big Data nie jest takie proste, ponieważ termin odnosi się do wielu aspektów i dyscyplin. A dla wielu osób najważniejszy jest sukces firmy( wartość), którego kluczem jest zdobycie nowych informacji – które muszą być dostępne dla wielu użytkowników bardzo szybko (prędkość) – przy użyciu ogromnych ilości danych (wolumen) z bardzo różnych źródeł (różnorodność) i różnej jakości (trafność), aby móc szybko podejmować ważne decyzje o zdobyciu lub utrzymaniu przewagi konkurencyjnej.

w książce „Big Data – Using smart Big Data analytics and metrics to make better decisions and improve performance” Bernard Marr pisze, że jeśli Big Data ostatecznie nie przyniesie korzyści, będzie bezużyteczny. Nie mogliśmy się bardziej zgodzić.

oto coś jeszcze, co może Cię zainteresować:
od czego zaczyna się Big Data? – Wiele perspektyw, jedna klasyfikacja
kolejne wielkie rzeczy w świecie danych (Część 1) – Data Science on scale
kolejne wielkie rzeczy w świecie danych (Część 2) – Machine Learning / Deep Learning as a ServiceLearning / deep Learning as a Service
kolejne wielkie rzeczy w świecie danych (Część 3) – Human Data Interfaces (HDI)Interfaces (HDI)
Radioeins broadcasts re: publica special – * um explains Big Data