中國共產黨新聞>>理論

(學科走向)

網絡信息技術推動史學研究進入新時代

李伯重

2017年07月31日08:12    來源:人民網-人民日報

今天,我們已經生活在一個由網絡信息技術參與構建的世界裡。不論一個人喜歡還是厭惡,其工作和生活都越來越離不開網絡信息技術所帶來的一切,這已經是不爭的現實。這個現實也清楚地表現在學術研究方面。那麼,這個勢不可擋的技術進步與史學研究有什麼關系呢?

在今天所有的學術分支中,史學可以說是最古老的學科了。經過數千年的發展,史學到今天已成為一個高度專業化的學科。由於有長期形成的專業化的學術體系,過去史學工作者做研究很少使用新科技,像今天飛速發展的網絡信息技術這樣的高科技,更是少有人問津。

一個最古老的學科和一種最新的科技,二者似乎是風馬牛不相及的。使用網絡信息技術研究歷史,一些學者覺得是中看不中用,也有一些學者覺得這是時代潮流,應當努力追趕。不管看法有多大分歧,對於所有史學工作者來說,怎樣把握網絡信息技術與史學研究之間的關系,都是一個繞不過去的問題。

使用網絡信息技術研究歷史是大勢所趨

網絡信息技術為史學研究帶來了巨大便利。利用這種新技術所創造的新資源,研究者可以突破原有時間、空間的局限,在短時間內佔有更多的研究資料﹔同時,這種新技術還為史學研究提供了新方法、新思路,可以使研究者開辟新的研究領域、進行更為科學的研究。

史學是一門科學,正如馬克思和恩格斯所說:“我們僅僅知道一門唯一的科學,即歷史科學。”史學研究必須以史實為基礎。馬克思說得很清楚:“研究必須充分地佔有材料,分析它的各種發展形式,探尋這些形式的內在聯系。隻有這項工作完成以后,現實的運動才能適當地敘述出來”。因此,充分佔有材料(即史料)是進行歷史研究的基礎。但是,如何充分佔有史料卻是一個問題。在史料有限的古代,做歷史研究時“讀萬卷書”就能夠充分佔有史料了。但在今天,情況發生了巨大變化,一個人讀書萬卷已經遠遠不夠了。

最近幾十年,出現了史無前例的“史料大爆炸”,即可以利用的史料以不可想象的速度急劇增加。我國本是歷史文獻大國,現存各種文獻資料數量巨大,僅僅只是收藏在圖書館和檔案館中的明清歷史檔案,就以數千萬件計。這些明清史的第一手資料具有極為重要的史料價值,但是過去隻有少數學者能夠接觸這些文獻中非常小的部分。最近20年來,這些文獻的數字化迅速展開。以中國第一歷史檔案館為例,館藏清代檔案文獻達1000余萬件,2005年底該館正式啟動《清代檔案文獻數據庫》重點檔案文獻數字化項目,使得這些以前“養在深閨人未識”的文獻能夠展現在所有學者面前。除了國家資助的項目,許多私營機構也在大力開展歷史文獻的數字化工作,其所收文獻數量都很驚人。

大量散落在民間的歷史文獻,也包含許多重要史料。在過去20多年中,一些機構開始收集這些文獻。例如,山西大學中國社會史研究中心在過去20多年中,收集了大量20世紀中期集體化時期山西農村的第一手資料,總數達1500萬件以上。貴州清水江中下游地區近年來也發現了近400多年來的大量民間契約和交易記錄,有專家推測其總數可能多達30余萬件。像這樣的第一手史料,對於歷史研究來說極為重要。現在這些史料也正在數字化,一旦完成,我們將看到一大批從未見過的全新史料。

“史料大爆炸”帶來的結果是,無人能夠自夸讀遍天下書。即使一個學者過目成誦,要讀遍現在已經建成的任何一個大型數據庫中的書,也是很難做到的。法國年鑒學派代表人物勒高夫說:“歷史學今天正經歷著一場‘資料革命’,這一革命與新史學有著千絲萬縷的關系”。史料的革命必將引起研究方法的革命。這在網絡信息技術突飛猛進和研究方法推陳出新、層出不窮的今天,顯得尤為突出。

史學研究如何使用網絡信息技術

在過去20多年中,歷史文獻的數字化工作取得了重大進展,已經建成一些歷史文獻數據庫,而更高級、更專業的數據庫建設也在積極推進之中。這些網絡信息技術所帶來的成果,為我們的史學研究帶來了很大便利。不過,許多史學工作者雖然認同這一點,但是覺得無從下手,因此不敢嘗試。事實上,網絡信息技術在史學研究中的運用有多種方法,研究者可以根據自己研究課題的需要採用不同的方法,以充分利用網絡信息技術提供的豐富資源。

網絡信息技術運用於歷史文獻數據庫建設,最初的工作是將文獻掃描后上網,供讀者使用。在此基礎上,又增加了檢索功能,使這些文獻能夠方便地檢索。用這兩種方法建立的數據庫,實際上是傳統圖書館的發展和擴大,在台灣被稱為“數位典藏”。數位典藏雖然作用很大,但它是被動的。對使用者來說,數據庫中存儲的大量文獻數據除了檢索,難以被更充分地使用。為了克服這個弊端,后來又興起了“數碼人文”,即建立的數據庫不僅能實現資料檢索,而且還能為研究者提供一個觀察歷史事件發生的環境,呈現出資料之間的脈絡關系,以彌補史料本身存在的不足。在使用這種“數碼人文”數據庫時,隻要輸入一個搜索詞,檢索成果將是一個有意義的文件集,為使用者提供各種方法以觀察其中的脈絡。總之,網絡信息技術提供的這些成果,使研究者能夠更好地利用數字資源進行人文研究。

史學工作者可以根據自己研究的課題,採用不同的方法來使用不同的數據庫。例如,對於許多研究者來說,最簡單的方法就是使用可檢索的歷史文獻數據庫,用檢索的方法從海量的文獻中搜尋自己所需要的史料,然后對多種史料進行篩選和比對,得到那些最可靠的史料,進而通過綜合找出這些史料之間的內部聯系。有學者談道,自己為研究《紅樓夢》與曹雪芹家世及其本人經歷之間的關系,用了幾年時間查閱了近百億字的各種史料,從中挖掘出大批過去不為人知的史料,以此為基礎進行研究,從而得出了若干新的結論。他之所以能夠如此高效地查閱文獻,就是得益於可檢索的歷史文獻數據庫。否則,依靠傳統的方法,用100年工夫也未必能夠遍覽這些文獻。

史學工作者還可以利用更高級、更專業的數據庫進行自己的課題研究。經過學界多年努力,現在已經建成一些可供歷史研究使用的專業數據庫。這些專業數據庫和僅僅隻提供關鍵詞檢索的歷史文獻數據庫不同,其中的信息已經過加工,可以直接使用。比如,北京大學中國古代史研究中心、哈佛大學費正清中心和台灣“中央研究院”歷史語言研究所合作建設的“中國歷代人物傳記資料庫”(China Biographical Database Project,簡稱CBDB),就是這樣一個數據庫。經過10年努力,到今天該數據庫已經收入了37萬古代歷史人物的傳記資料。它在數據結構上更加復雜和精細,將歷史事件轉化為結構化數據,數據架構由人物、親屬、非親屬社會關系、社會區分、入仕途徑、宦歷、地址、著述等部分構成。通過對這種結構化數據的提取、分析,研究者可以對歷史人物進行群體研究,能夠得到相關人物、事件的空間分布以及復雜的社會關系網絡。

如果條件具備,史學工作者還可以依照自己研究課題的需要,進一步建立課題專用數據庫,以此為依據進行相關研究。比如,有研究團隊把l949—2002年北京大學和蘇州大學全部近8萬名學生學籍卡中的信息建成一個數據庫,開展中國大學生來源研究,以此為基礎寫成了《無聲的革命》一書。依據這些數據得出的結論,已經受到各界的重視。

以上這些都表明,史學工作者不僅應當使用網絡信息技術,而且可以使用好網絡信息技術。

技術應用要不斷改進,史學工作者要與時俱進

2015年12月,中國史研究雜志社和上海大學歷史系聯合主辦了“傳承與開啟:大數據時代下的歷史研究”國際學術研討會。海內外110余位專家學者圍繞“數據庫的建設與使用”“大數據與史學研究”“大數據在歷史研究中的技術問題”“大數據時代下的人文關懷”等議題展開了深入研討。這表明國內史學工作者對於使用網絡信息技術研究歷史在認識和運作上都有了長足進步。不過我們也要看到,盡管這方面工作已經取得重要進展,但要更加普遍地使用網絡信息技術開展史學研究,還有很長的路要走。這有兩方面的原因:

第一,由於史學的特殊性,建設專業、完備和易於使用的歷史文獻數據庫,目前還處於起步階段。已建成的歷史文獻數據庫數量有限,而且其中隻有一部分可以檢索全文。能夠直接使用的專業數據庫,數量更是寥寥可數,而且還存在一些問題。

第二,使用已經建成的各種數據庫來研究歷史,現在還處於嘗試階段。一些學者過分迷信現有數據庫提供的信息,認為有了數據庫,史學研究中的問題就很容易解決。這種看法顯然過於樂觀。統計學家達萊爾·哈夫和新聞學教授查爾斯·塞費在他們各自撰著的《統計數字會撒謊》和《數字是靠不住的》這兩本有名的書中,就明確反對過分依賴數據。

網絡信息技術正在改變史學研究的現狀和未來。然而,如同電腦不可能取代人腦,網絡信息技術也不可能取代史學工作者的主觀思考、取代史學研究的基本理論與方法。更好使用網絡信息技術研究歷史,要求史學工作者積極投身於這一工作,充分發揮主導作用,改進相關技術的應用。這樣,不僅自己不會落后於時代,而且相關技術手段也會不斷完善,從而更好地服務於史學研究。40年前,巴勒克拉夫就指出:史學發展的最大敵人在於史學家自己,因為“當前在歷史學家當中的一個基本趨勢是保守主義”“歷史學家不會心甘情願地放棄他們的積習並且對他們工作的基本原理進行重新思考”。因此,關鍵是史學工作者要與時俱進,張開雙臂擁抱新技術,把最古老的學科和最新的科技完美地結合起來,把史學研究帶入一個新時代。

(作者為北京大學歷史學系教授)

《 人民日報 》( 2017年07月31日 16 版)

(責編:萬鵬、謝磊)
相關專題
· 人民日報理論版
  • 最新評論
  • 熱門評論
查看全部留言
微信“掃一掃”添加“學習大國”

微信“掃一掃”添加“學習大國”