科技專論
根據有關學者的研究,數據密集型科學將成為繼實驗科學、理論科學、電腦科學之後,人類科學研究的第四個範式。以大數據為代表的數據密集型科學將成為新一次技術變革的基石。隨著數據的進一步集中和數據量的增大,對海量數據進行安全防護變得更加困難,數據的分佈式處理也加大了數據洩露的風險,資訊安全正成為制約大數據技術發展的瓶頸。
大數據時代已經到來
物聯網、雲計算、移動網際網路等新技術的發展,使得手機、平板電腦、PC及遍佈地球各個角落的感測器,成為數據來源和承載方式。據估計,網際網路上的數據量每兩年會翻一番,到2013年,網際網路上的數據量將達到每年667EB(1EB=230GB)。這些數據絕大多數是“非結構化數據”,通常不能為傳統的數據庫所用,但這些龐大的數據“寶藏”將成為“未來的新石油”。
1.大數據具有四個典型特徵
大數據(Big Data)是指“無法用現有的軟體工具提取、存儲、搜索、共用、分析和處理的海量的、複雜的數據集合”。業界通常用四個V來概括大數據的特徵。
——數據體量巨大(Volume)。到目前為止,人類生産的所有印刷材料的數據量是200PB(1PB=210TB),而歷史上全人類説過的所有的話的數據量大約5EB(1EB=210PB)。當前,典型個人電腦硬碟的容量為TB量級,而一些大企業的數據量已經接近EB量級。
——數據類型繁多(Variety)。這種類型的多樣性也讓數據被分為結構化數據和非結構化數據。相對於以往便於存儲的以文本為主的結構化數據,非結構化數據越來越多,包括網路日誌、音頻、視頻、圖片、地理位置資訊等,這些多類型的數據對數據的處理能力提出了更高要求。
——價值密度低(Value)。價值密度的高低與數據總量的大小成反比。以視頻為例,一部1小時的視頻,在連續不間斷的監控中,有用數據可能僅有一兩秒。如何通過強大的機器演算法更迅速地完成數據的價值“提純”,成為目前大數據背景下亟待解決的難題。
——處理速度快(Velocity)。這是大數據區分于傳統數據挖掘的最顯著特徵。根據IDC的“數字宇宙”報告,預計到2020年,全球數據使用量將達到35.2ZB(1ZB=210EB)。在如此海量的數據面前,處理數據的效率就是企業的生命。
2.大數據成為國家和企業的核心資産
2012年瑞士達沃斯論壇上發佈的《大數據大影響》報告稱,數據已成為一種新的經濟資産類別,就像貨幣或黃金一樣。奧巴馬政府已把“大數據”上升到國家戰略層面,2012年3月,美國宣佈投資2億美元啟動“大數據研究和發展計劃”,藉以增強收集海量數據、分析萃取資訊的能力。美國政府認為,大數據是“未來的新石油”,一個國家擁有數據的規模、活性及解釋運用的能力將成為綜合國力的重要組成部分,未來對數據的佔有和控制甚至將成為繼陸權、海權、空權之外國家的另一個核心資産。
對企業來説,數據正在取代人才成為企業的核心競爭力。在大數據時代,數據資産取代人才成為企業智商最重要的載體。這些能夠被企業隨時獲取的數據,可以幫助和指導企業對全業務流程進行有效運營和優化,幫助企業做出最明智的決策。此時,企業智商的基礎就是形形色色的數據。
大數據在重新定義企業智商的同時,對企業核心資産也進行了重塑,數據資産當仁不讓地成為現代商業社會的核心競爭力。在大數據時代,企業必須熟悉和用好海量的數據,而網際網路行業已提早感受到了大數據帶來的深切變化。一些網際網路企業已經完成了核心競爭力的重新定義。
3.大數據“藍海”成為競爭的新焦點
大數據所能帶來的巨大商業價值,被認為將引領一場足以與20世紀電腦革命匹敵的巨大變革。大數據正在對每個領域造成影響,在商業、經濟和其他領域中,決策行為將日益基於數據分析,而不再是憑藉經驗和直覺。大數據正在成為政府和企業競爭的新焦點。各大企業正紛紛投向大數據促生的新藍海。甲骨文、IBM、微軟和SAP共投入超過15億美元成立各自的軟體智慧數據管理和分析專業公司。在大數據時代,商業生態環境在不經意間發生了巨大變化:無處不在的智慧終端、隨時線上的網路傳輸、互動頻繁的社交網路,讓以往只是網頁瀏覽者的網民的面孔從模糊變得清晰,企業也有機會進行大規模的精準化的消費者行為研究。大數據藍海將成為未來競爭的制高點。