繼物聯網、云計算之后,“大數據”成為熱門科技概念。“大數據”作為信息社會發展的一個新生事物,目前尚處在逐漸被認識、被應用的初始階段,學術界、IT行業對大數據的理解各有側重,尚未形成一套完整的理論體系,因此很難進行精準定義。
事實上,大數據不是一個戰場層面的技術性名詞,而是一個戰略層面上的社會性名詞,并不是其構成數據的簡單累計,而是一個量變到質變的產生了飛躍的事物。
大數據的核心關鍵是組織結構,而不是構成大數據的數據本身,這個特征類似人工生命之父克里斯·蘭頓(Chris Langton)對生命的描述,“生命的本質在于物質的組織形式,而不在于物質的本身”,事實上,宇宙模型里的全部事物似乎都遵循這樣的構成規則。
數據是網絡空間里的構成事物,如同物質是物理空間里的構成事物一樣。貴州搶先建立大數據基地,是具有前瞻性戰略眼光的,但能否真正達到預期目標,成為在全球有影響力的數據集散地,核心技術、顛覆性技術是關鍵,對于那些想通過大數據戰略來發展區域經濟的地方政府來說,以下幾點或許值得參考:
(1)大數據和數據是兩個完全不同的概念,數據具有強烈的個體標識特色,是對客觀事物的屬性邏輯描述,大數據是對數據進行管理的存在形式,除了數據,還有存放數據的空間,以及連接空間的組織結構。數據與大數據的關系類似產品與產品集散地的關系。
(2)產品集散地只關心產品本身,并不關心產品的生產過程,因此不會在集散地生產產品,比如種玉米、生產服裝等。同樣,大數據只關心數據本身,并不關心數據的產生過程,因此不會在大數據集散地生產數據,比如農村數據、政府部門數據等。也就是說,大數據集散地聚集的是交易數據的企業,而不是聚集生產數據的企業。
這可能是比較難理解的應用模型,因為這個模型屬于未來網絡空間里的存在形式,當前的互聯網體系屬于初級產品,如同新石器時代的科技工具和現在的科技工具之間的差距。不過人類科技的發展是一個加速的模式,網絡空間的出現并不需要太長時間。
(3)數據和大數據屬于不同層面的事物,數據屬于戰場層面的事物,主要由企業來主導,可以提高數據的活躍度;大數據屬于戰略層面的事物,需要由政府來主導,才能在區域范圍內平衡數據之間的關聯關系和整體活躍度。
(4)大數據是革命性的新生事物,不止于傳統思維上的技術創新。所以,大數據競爭也一定需要一些顛覆性的理論和技術,如果只是傳統的技術或者在傳統技術上的升級創新,基本上不會形成國際競爭優勢。
(5)科技慣性是自然規律,傳統的大型科技企業很難產生顛覆性的技術,這是由企業的產品結構和技術人員的思維模式決定的。所以對于地方政府來說,不要把扶持資金全部投給目前的成熟型大型企業,最好采用田忌賽馬的方式,選擇不同發展階段的企業進行資金支持,這樣就做到了讓現在風光的大型企業給當地帶來當下的風光,讓有核心技術的當前不風光的企業給當地帶來未來的風光。事實上,很多科技園區在這個方面已經吃了虧,有政府資金投入的時候熱鬧了幾年,吸引了一些當時有名的企業,錢花完了也就冷清了,沒有出現真正推動當地產業革命的顛覆性的支撐技術和產品。
大數據競爭中的幾個誤區值得特別關注:
(1)嚴格地講,企業級的數據都不會成為大數據,無論這個企業的規模有多大。這是因為大數據是由大量不同類型的數據形成的多樣化的生態應用體系,類似生物圈的食物鏈體系。而企業的數據只是基于滿足少量應用需求而組織起來的數據,比如Google的數據管理結構。大數據屬于區域性的社會型數據,區域內的任何有數據需求的企業、機構或者個人,都可以從大數據里獲得所需的數據。
(2)大數據是網絡空間里的數據存在形式,所以在未來的網絡空間競爭里,大數據是最重要也是最殘酷的競爭,統一的大數據模型是網絡空間的發展目標,如同星系結構模型是物理空間的唯一模型一樣,在不同的觀察尺度里,其結構模型是相似的。
從這個角度講,網絡空間競爭的焦點之一就是大數據模型的建立,這是通過顛覆性的技術確立模型標準的過程。網絡空間的主權共享是指網絡空間創建完成后的應用資源共享,并不是指共享創建網絡空間的所有技術。擁有創建網絡空間的源頭核心技術,等同于擁有源頭的控制權,相當于擁有修改網絡空間結構和規則的權力。
(3)大數據是邏輯過程發生后的結果,不是邏輯過程,所以大數據本身不是方法論。為大數據提供處理方法的是云計算,弄不清楚這個關系,地方政府就很難對大數據產業進行合理有效的規劃布局,企業在發展過程中也會產生迷茫。
(4)大數據里的原始數據來源具有多樣性、動態性、小規模、碎片化等特征,政府部門或者機構、企業提供的專業性數據盡管數量龐大,但是也不是真正的大數據。
(審核編輯: 智匯小蟹)
分享