大數(shù)據(jù)概念及應(yīng)用_奇酷大數(shù)據(jù)培訓(xùn)
來源:
奇酷教育 發(fā)表于:
麥肯錫是最早提出大數(shù)據(jù)時(shí)代已經(jīng)到來:各個(gè)行業(yè)和領(lǐng)域都已經(jīng)被數(shù)據(jù)給滲透了,目前數(shù)據(jù)已成為非常重要的生產(chǎn)因素了。對于大數(shù)據(jù)的處理和
麥肯錫是最早提出
大數(shù)據(jù)時(shí)代已經(jīng)到來:“各個(gè)行業(yè)和領(lǐng)域都已經(jīng)被數(shù)據(jù)給滲透了,目前數(shù)據(jù)已成為非常重要的生產(chǎn)因素了。對于大數(shù)據(jù)的處理和挖掘?qū)⒁馕吨乱徊ǖ纳a(chǎn)率不斷增長和消費(fèi)者盈余浪潮的到來。”
大數(shù)據(jù)概念最早是IBM定義的,將大數(shù)據(jù)的特征歸納為4個(gè)“V”(量Volume,多樣Variety,價(jià)值Value,速Velocity),或者說特點(diǎn)有四個(gè)層面:第一,數(shù)據(jù)體量巨大。大數(shù)據(jù)的起始計(jì)量單位至少是P(1000個(gè)T)、E(100萬個(gè)T)或Z(10億個(gè)T);第二,數(shù)據(jù)類型繁多。比如,網(wǎng)絡(luò)日志、視頻、圖片、地理位置信息等等。第三,價(jià)值密度低,商業(yè)價(jià)值高。第四,處理速度快。最后這一點(diǎn)也是和傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)有著本質(zhì)的不同。
有人把數(shù)據(jù)比喻為蘊(yùn)藏能量的煤礦。煤炭按照性質(zhì)有焦煤、無煙煤、肥煤、貧煤等分類,而露天煤礦、深山煤礦的挖掘成本又不一樣。與此類似,大數(shù)據(jù)并不在“大”,而在于“有用”。價(jià)值含量、挖掘成本比數(shù)量更為重要。
哪些傳統(tǒng)企業(yè)最需要大數(shù)據(jù)服務(wù)呢?拋磚引玉,先舉幾個(gè)例子:1)對大量消費(fèi)者提供產(chǎn)品或服務(wù)的企業(yè)(精準(zhǔn)營銷);2) 做小而美模式的中長尾企業(yè)(服務(wù)轉(zhuǎn)型);3) 面臨互聯(lián)網(wǎng)壓力之下必須轉(zhuǎn)型的傳統(tǒng)企業(yè)(生死存亡)。
對于企業(yè)的大數(shù)據(jù),還有一種預(yù)測:隨著數(shù)據(jù)逐漸成為企業(yè)的一種資產(chǎn),數(shù)據(jù)產(chǎn)業(yè)會(huì)向傳統(tǒng)企業(yè)的供應(yīng)鏈模式發(fā)展,最終形成“數(shù)據(jù)供應(yīng)鏈”。這里尤其有兩個(gè)明顯的現(xiàn)象:1) 外部數(shù)據(jù)的重要性日益超過內(nèi)部數(shù)據(jù)。在互聯(lián)互通的互聯(lián)網(wǎng)時(shí)代,單一企業(yè)的內(nèi)部數(shù)據(jù)與整個(gè)互聯(lián)網(wǎng)數(shù)據(jù)比較起來只是滄海一粟;2)能提供包括數(shù)據(jù)供應(yīng)、數(shù)據(jù)整合與加工、數(shù)據(jù)應(yīng)用等多環(huán)節(jié)服務(wù)的公司會(huì)有明顯的綜合競爭優(yōu)勢。