李 振 鮑宗豪
“雲治理”的核心概念:作為“服務資源”的“大數據”
“大數據時代”的核心詞匯和存在依據,無疑是由“數據”轉化為“大數據”而來的。雖然對大數據時代的理解不能局限於“概念和技術”,而應該引申至文化、哲學、社會學、政治學、管理學等諸領域,但是無論如何引申和擴展,其本身所具有的“雲技術”特征,依然是最穩固、最鮮明的核心根據。
按照一般計算機信息的界定,“數據”(Data)是載荷或記錄信息的按一定規則排列組合的物理符號,可以是數字、文字、圖像,也可以是計算機代碼。信息接收始於對數據的接收,對信息的獲取隻能通過對“數據背景”11 的解讀進行判斷。“數據背景”是接收者針對特定數據的信息准備,即當接收者了解物理符號序列的規律,並知道每個符號和符號組合的指向性目標或含義時,便可以獲得一組數據所載荷的信息。這意味著,信息的存在形式與實質就是數據,數據轉化為信息可以用公式“數據+背景=信息”來表示。在漢語世界中,“數據”原指用於統計、計算的數值、數字,而且是具有一定“邏輯指向”的“數字”,屬於一個“專業性”比較強的詞匯,以至於“基於數據”本身就帶有強烈的科學性、客觀性色彩。
如果追根溯源,可以發現,“數據”(data)在拉丁文裡是“已知”的意思,也可以理解為“事實”,是一種可以用“數字”表示的、更為精確的“事實”。也就是說,在任何口頭事實、書面事實的構建中,“數據事實”幾乎成為所有“事實存在”的根本依據。“數據”代表著對某件事物的客觀描述,數據可以記錄、分析和重組事物。在這個意義上,“數據”超越了“數字”的一般性,內涵了更為具體、更具邏輯性的特殊意義。顯然,“我們經常把‘數字化’和‘數據化’這兩個概念搞混,但是對這兩個概念的區分實際上非常重”。12 在計算機出現后,“數據”則指“一切以電子形式存儲的記錄”,而“數字化”指的是把模擬數據轉換成“0和1”表示的二進制碼,這樣電腦就可以處理這些數據了。1995年,美國麻省理工學院媒體實驗室的尼古拉斯·尼葛洛龐帝出版了他的標志性著作《數字化生存》(Being Digital)13,他的主題就是“從原子到比特”,而不是針對處理信息數量的邏輯判斷。顯然,這裡的“數據”已經不再純粹的屬於論証“1與2”之間的數字邏輯關系,而是致力於一種更為龐大的“數字資源”的整理、分析和應用。
以此為基礎,我們來看待“大數據”是否意味著一種“大現實”?
“大數據”(Big Data)概念最早源於20世紀80年代,是一個與計算信息直接相關的專業術語,它直接超越了“數據”的一般性特征,而是指那些數據規模已經超出了“傳統數據”的衡量尺度,一般的軟件工具難以捕捉、存儲、管理和分析的數據。14 顯然,“大數據背景”所指向的范圍和內容更為復雜多變,不僅包括各種規律性的數據符合,還包括各種長時段、非規則性、流動性和開放性的數據,其數據所指向的意義並非是顯而易見的,而是必須通過特定的“復雜運算”之后才可能有所顯現。15
2011年5月,麥肯錫全球研究所(MGI)發表研究報告《大數據:下一個創新、競爭和生產率的前沿》(Big Data: The Next Frontier For Innovation: Competition and Productivity),使得數據之“大”成為一個嶄新的“時代生產”判斷符號。2012年1月,在瑞士達沃斯經濟論壇上發布的一份名為《大數據,大影響》(Big Data, Big Impact)的報告認為,大數據就像“黃金”一樣。2012年3月,華盛頓宣布“大數據研究和發展倡議”(Big Data Research and Development Initiative),倡導“腦計劃”發展戰略,加強從大數據提取、分析主要信息的能力。此后,英國、日本、德國、加拿大等國紛紛效仿,推出與大數據應用相關的戰略研究,一場關於“大數據”的戰略爭奪自此拉開戰幕。
但是,“大數據”成為一種日常流行性的學術概念,則是在2013年。2013年被稱為“大數據元年”,英國牛津大學維克托教授的《大數據時代:生活、工作和思維的大變革》,《外交》發表兩位作者的《大數據的崛起》,新加坡《聯合早報》亦發表《大數據政治》的文章,美國Market Watch網站、美國科技網站“商業內幕”等刊文專論大數據時代的來臨及其發展趨勢,等等。這些專論都指向一個核心的事實判斷和價值判斷,即“大數據”的來臨非同小可,認為“大數據”將改變商業運作、政府管理、生活方式、信息的積累,促使整個社會發生偉大的變革。政論家認為,“大數據的民意和政治”將開啟網絡民主的新時代,指出執政者應該適應大數據時代的要求,積極應對“快速自由”的民意要求,善於應對各種“民意事件”﹔媒體專家認為,大數據時代使得任何有關“民生問題”的信息傳播,都有可能引發公共危機事件﹔信息技術專家認為,新的“移動革命”將產生“移動形態的大數據”,最終產生“移動性質的信息爆炸”﹔社會學家認為,信息增長量將進一步增強,不斷制造出信息的碎片、歧義化,形成“信息分層”的新現實﹔哲學家認為,大數據開啟了一個新的流動性“時間坐標”,開啟了一個“信息時間”無所不在、到處侵擾的新型的現代性存在形態。
表面上,“大數據”僅僅是對社會存在的“數據狀態”的一種描述而已,本身談不上什麼新的更深刻的含義。“大數據”概念得以成立,還必須與“雲計算”相聯系。傳統的數據處理根據已經不能適應大數據的收集、整理、儲存、檢索、共享、分析等多重功能。倘若不加整理,所謂的大數據的網絡空間就成為“塞滿垃圾信息的曠野”。16 顯然,“大數據”存在的根據是技術信息的飛速膨脹。但是,這裡的技術信息並非純粹的技術性范疇,而已經與全球化的生活、生產緊密地融為一體。從經濟到文化、從意識形態到社會治理、從政治到國際關系等,“大數據”之所以能夠在其中發揮著越來越重要的作用,其關鍵的根據就在於大數據背后所隱含著的“雲計算”。對海量的、多樣化的“大數據”現象進行“雲計算”,可以快速獲得各取所需的有價值信息。在這個意義上,擁有“大數據”是一種“資料前提”,更是一種“資源前提”。
顯然,“雲治理”(Cloud Governance)的概念能夠成立的邏輯前提,是網絡化資源、服務的不斷增加本身所具有的強大力量。其中,“計算機化”(computerization)17 則是促使“雲治理”走向社會、走近民間的一個關鍵性的技術應用和操作概念。“計算機化”、“數字化”是網絡化的技術前提與基本保証。當然,計算和存儲的設備越廉價,人們對於各類數據的應用范圍就會越廣泛,應用頻率就會越強,大數據之“大”的可能性就會增強。這是一個更多地依賴於技術創新、技術普及的范疇。
這意味著,“大數據”的真實價值,即所謂“大”的價值本身隱藏於各種各樣好像彼此無關、毫無規則的數據之下,發掘數據價值(即數據發掘,Data Mining)、征服“數據海洋”的“關鍵性動力”,就在於“雲”的邏輯計算能力。隨著數據總量呈幾何級數增長,處理數據的技術將跨越式提升,“算法”會更加高明、高效,不僅軟硬件升級,人類對數據的認識也不斷深化。數據量擴展並不等於一個公司或機構具備擁有和利用大數據的前景,能夠進行數據的深度發掘與關聯性建構才能稱得起擁有大數據。在20世紀末討論互聯網時代的社會現象時,我們最大的關注點,是對世界各種各樣的信息化、網絡化現象判斷與反思。而今天,我們再討論相同的問題時,社交網絡、電子商務與移動通信把人類社會帶入了一個以PB(即1024TB,1TB 18 =1024GB)為單位的“結構化與非結構化”19 的各類“數據事實”的新時代。
由此可見,從單獨應用的計算機到互聯網,從純粹數字交換的互聯網到更富有精神性交往的社交媒體,從聚合各種數字化資源的智能手機到物聯網相繼出現,通信技術與互聯網技術已經實現了高度結合,各種以“數字形式”存儲的“數據庫”以幾何級數增長,其數量之大,已經無法進行准確測量,隻能進行估算。一般認為,人類當下一年生產的“數據量”至少是上年的150%。這意味著,從“數字”到“數據”,再到“大數據”,本身已經不再專屬於“技術發展”的范疇,而是指示社會發展(尤其是經濟運行)形式、模式發生變化的重要象征和線索。通過“大數據”我們可以看到一種嶄新的個體化存在、群體運動和社會運行諸多嶄新的特征。
相關專題 |
· 《學術前沿》 |