中國共產黨新聞網>>理論
分享

提供新的研究素材和分析技術

大數據助力政治學研究(學苑論衡)

夏  瑛

2021年10月25日08:07    來源:人民網-人民日報

隨著信息技術迅猛發展,新型信息分析技術被應用到政治學研究中來。許多政治學研究者採用當前比較成熟的大數據爬取、大數據文本分析等技術,獲取新的研究素材並進行分析整理。同時,以億萬為量級單位的大數據本身就具有政治學研究價值。可以說,大數據為政治學帶來研究方法上的創新,也進一步拓展了政治學研究領域。

基於大數據對網絡民意進行研究。網絡上有許多現成數據可以用於對網絡民意和政府部門回應進行研究。一些政治學研究者常把兩類網絡大數據用作分析素材:一類是政府網絡問政平台上的群眾留言及相關部門回復信息,另一類是主流媒體網站以及微博、微信等社交媒體平台上的網民發帖信息。這些數據都可通過數據爬取技術直接獲取。第一類數據經過分析處理后,可以反映群眾關注的議題類型分布、政府相關部門回應的特點和問題解決程度。還可以進一步分析特定類型群體在什麼時期大致提出哪些類型的訴求。第二類數據主要用於分析網民對某一具體事件的看法和態度。對微博等社交媒體的數據分析,不僅關注具體話題,還將話題和情感、偏好等因素分析相結合,呈現網絡民意對某個具體事件的態度演變過程及影響網絡民意變化的具體因素。可以說,網絡大數據的應用極大豐富了政治學對網絡民意的研究方式。

對文本轉換后的大數據進行分析。在網絡大數據之后,研究者嘗試挖掘其他非現成的、更具獨特性的大數據信息。這類信息主要有兩種,一種是從公開平台獲取的大數據文本。這類數據通過數據爬取技術獲得,但發布這些數據的平台並非人人皆知,需要研究者去搜尋。目前,政治學研究者較多關注並取得研究進展的大數據主要有:從裁判文書網獲取的司法大數據,從人大代表的議案建議庫和政協委員的提案庫中獲得的文本大數據等。隨著政府信息公開力度加大,這類可供研究的信息資源會越來越豐富。另一種數據需要先進行文本轉換才可使用,如對歷史資料的研究。相當數量的歷史資料是以圖片形式而非文本形式存在的,這就需要通過識別技術將圖片信息轉換為文字文本,然后進行大數據分析。這類數據的獲取難度較高,不過一旦形成數據庫,對政治學研究則有較大幫助。

大數據為政治學提供新的研究素材和分析技術,但並未改變政治學研究的本質。面對層出不窮的新素材和新工具,政治學研究者需要保持清醒頭腦,不能陷入對數據和方法的盲目追求中。同時,應結合政治學研究本身的特點,發揮大數據技術優勢,推動信息技術在政治學研究應用中取得更多突破。一是開發更多樣化的大數據類型。目前,政治學研究分析的大多是文本形式的大數據。文本信息只是浩瀚信息世界中的一種,還有圖片、音頻、視頻等大量信息類型有待開發利用。這些類型的大數據有的在商業領域已有較成熟的應用,研究者可考慮以合適方式將其應用於政治學研究。二是探索更前沿的大數據分析技術。現有的分析技術還離不開人工標注,需要政治學研究者從大數據中抽出很小一部分,對這部分數據進行人工閱讀和標注,然后利用機器學習的方法,讓計算機基於人工標注的數據去分析剩下的大量數據,嘗試得出相應結論。由於人工標注的數量不等,分析的效果也參差不齊。在文本挖掘上,需要進一步開發更先進的技術。三是實現更復雜的大數據分析目標。現有的大數據分析主要是對數據所體現的政治現象進行描述,尚未具備解釋政治現象、發現運行規律以及進行預測的功能,這需要更進一步的技術支持和研究突破。從這個角度看,大數據的開發利用在政治學研究領域還有更為廣闊的發展前景。

(作者為中山大學政治與公共事務管理學院教授)

《 人民日報 》( 2021年10月25日 09 版)

(責編:代曉靈、萬鵬)
相關專題
· 人民日報理論版
微信“掃一掃”添加“學習大國”

微信“掃一掃”添加“學習大國”

微信“掃一掃”添加“黨史學習教育”官微

微信“掃一掃”添加“黨史學習教育”官微