法律人工智能的十大前沿問題

熊明輝

2019年08月06日08:22 來源：光明日報

原標題：法律人工智能的十大前沿問題

　　法律人工智能是指人工智能技術在法律中的應用，其目標是充分提升法治效能。我國的智慧法院、智慧檢務建設等國家重大工程，就是法律人工智能的落地應用。目前，法律人工智能的系統工程標杆是“上海刑事案件智能輔助辦案系統”，其將公檢法三機關的刑事業務在一個雲平台內打通，部分實現了自動法律推理，大幅提升了工作實效和程序公正性。法律人工智能研發中的問題主要有理論建模和具體應用兩大類，可以總結為十大前沿問題。

　　法律推理的形式模型。法律推理的形式建模是實現自動法律推理最基礎的問題。自動推理與智能密切相關。智能即會思維。什麼叫“會思維”？英國數學家圖靈認為，如果機器能在互不接觸的相當長時間內與人類對話，而被對方誤判為人類的概率達到一定程度，那就有理由說這台機器“會思維”。這就是“圖靈測試”。這表明，人工智能的關鍵在於能否實現自動推理。作為人工智能子領域，法律人工智能的關鍵就在於法律自動推理的實現。為此，需要給出面向自動法律推理的形式模型。有三種可能的法律推理建模方案：一是規則推理方案，即利用演繹推理將法律規范編碼成法律解釋庫和案件事實庫，以實現自動法律演繹推理﹔二是案例推理方案，即利用類比推理將案例編碼成法律解釋庫和案件事實庫，以實現自動法律類比推理﹔三是數據推理方案，即利用歸納推理將有價值的法律信息編碼成法律解釋庫和案件事實庫，以實現自動法律大數據推理。在成文法國家，第一種方案是最主要的。

　　法律決策的計算模型。能行可計算是人工智能得以實現的必要條件。“能行”強調要有實效，“可計算”強調能夠通過編輯方式來實現。法律決策能行可計算是法律人工智能的前提條件。法律決策可分為立法、執法、司法和守法決策，其理性根基即立法論証、執法論証、司法論証和守法論証。然而，傳統法律論証主要由人工完成，優度完全取決於法律論証者的知識結構和論証能力，而作為自然人的論証者總有知識結構、價值取向等局限，得出的結論難免存在主觀偏差。在法律決策中，尤其是在法律論証者經驗不足的階段，常常會犯常識或邏輯錯誤，而設計相關法律決策輔助系統，保障法律問題部分可計算，可以減少這類錯誤發生。概言之，為了逼近客觀性，充分利用人工智能技術是一種切實可行的方案。

　　証據推理的計算模型。証據推理的計算模型是實現自動法律証據推理的前提條件。在審判過程中，法律從業者通過証據累積來確認或否認有關法律假設。服務司法証明過程的法律人工智能應用必須具備為用戶提供在案件中進行証據表達和推理的復雜能力，因此，研發者必須使用復雜的技術來表示、探索、推斷和分析訴訟過程中出現的假設和証據的可替代性解釋。這需要計算技術來表示訴訟參與者、實體、事件和世界情形語境，將解釋証據的替代假設進行結構化處理，通過評估証據的相關性和權重來確証或否定假設，做出假設真實的推論，而將貝葉斯推理網絡與人工智能中的知識表示組合起來，就可以對事實論証進行結構化分析。

　　法律推理多主體建模。法律審判是建立在訴訟基礎之上的，而訴訟是一種三方法律論証博弈。利用人工智能中的多主體系統思想，就能實現訴訟論証博弈的邏輯建模。在計算機科學中，多主體系統又稱多智能體系統，是指由多個相互作用的智能體組成的計算機系統。典型的多智能體系統研究指向軟件智能體，其主體可以是機器人、人或人機組合團隊，智能則可以包括條理方法、功能方法、程序方法、算法搜索或強化學習。多智能體系統可以解決單個智能體或單個系統難以解決甚至不可解決的問題。法律訴訟恰恰是一種多主體互動的論証活動。訴訟中，起訴、應訴和裁判三方需要就法律論証中的法律規范及其解釋、法律証據及其支持的事實主張以及法律論証的強度進行互動，做出相應法律決策。多主體系統為智能訴訟系統（如智慧法院等）提供了可能的建模方案。

　　可執行立法檢驗建模。黨的十八大提出了“科學立法”。從邏輯學角度講，科學立法就是將法律體系視為一個准邏輯體系，要求法律體系原則上具有一致性、完備性、有效性和可靠性。其中，最為核心的是一致性，因為完備性、可靠性和有效性均可通過法官的自由裁量權彌補，而一致性卻很難。法律體系的一致性，要求法律體系原則上無矛盾，不應出現法律沖突。不一致會導致法律體系紊亂和法律從業者無所適從，並削弱司法公信力。同一法律內部的沖突，立法者一般可自行解決，但不同部門法以及上下位法的沖突往往超出立法者能力范圍。而自動實現法律法規體系一致性檢測的法律人工智能，將大大提升我們的科學立法水平。

　　文本自動分類與總結。該問題包括兩個方面：一是法律文本的自動分類。當前，大多數法律文件以電子形式提交，但對這些電子文件的分類多停留在傳統的人工階段，而利用機器學習技術中的文本自動分類技術，可實現法律文本的自動分類。智慧司法的一大目標就是要借此提高文件的歸檔效率和后期利用率。二是文本中法律論証的自動總結。法律決策建立在法律論証之上，而法律論証埋藏在法律文本之中。借助機器學習中的文本自動總結技術，可以大大提高法律論証挖掘的效率。更重要的是，使用傳統的人工方法挖掘法律論証，其質量主要取決於論証挖掘者的能力和水平，優度參差不齊，而研發法律文本的自動總結應用程序，可以普遍提升論証挖掘優度，並確保論証挖掘質量的穩定性和評估的客觀性。

　　法律信息的自動提取。法律信息提取過程中產生的信息是后續立法和構建新的法律論証的基礎，也是處理電子証據的有效手段和幫助用戶評估相關信息的能行工具的重要組成部分。但由於數據量過於龐大，對法律信息手工分析顯然不可行。自動信息提取的任務就是從非結構化或半結構化的機器可讀文檔中自動提取並生成結構化信息。在大多數情況下，信息提取涉及通過自然語言處理分析人類語言文本。目前，人工智能技術已支持多媒體文檔信息的處理，如圖像、音頻和視頻文檔的自動注釋和內容提取。法律信息自動提取涉及一般自然語言的文本處理和具體法律領域語言處理，因此，相關模型需要同時兼顧這兩個方面。

　　電子取証的機器學習。電子取証是指在法律訴訟或法律調查中為回應舉証要求而進行的電子存儲信息的辨識、收集和舉証。這些電子存儲信息包括文檔、電子郵件、音頻、視頻、數據庫、社交媒體等。電子數據不僅數量巨大，取証過程和技術往往也很復雜。電子文檔富有動態性，常常包含如時間—日期戳、作者和收信人等元數據。為避免証據后期被篡改或毀損，需保存電子存儲信息的原始內容和元數據，並置於法律監管之下。數據分析就是要篩選和隔離明顯不相關的電子信息，將數據托管於安全環境中，使得編寫文檔代碼的審閱人員可以訪問這些數據，了解它們與法律事項的關系。使用計算機輔助評估、預測編碼和其他用於電子取証的分析軟件，可以大幅降低法律從業者審查証據的時間等人力成本。

　　法律信息的檢索系統。法律信息檢索是一門應用於包括法律法規、判例和學術論著在內的法律文本的信息檢索科學，是法律信息學的一個領域。通過電子手段可獲得的法律文件數量龐大且呈爆炸式增長，故法律信息精准檢索日漸重要。一般來講，為了達到信息檢索的目標，有三種可運用的檢索技術——布爾檢索、法律文本手工分類和法律文本自然語言處理。對於整體的法律文檔而言，目前通常使用的方法是布爾檢索法，也就是與特定術語進行精確匹配。一般來說，研究人員相信他們通過這種方法已經檢索了大多數的相關文件，事實上這種方法的平均查全率隻有20%，所遺漏信息可能相當重要。法律信息檢索試圖通過增加相關文檔的數量（高查全率）和減少不相關文檔的數量（高准確率）提高法律搜索的效率。但這是一項艱巨的任務，因為在法律領域行話和多義詞非常普遍，而且有些詞義還經常變化。

　　法律機器人的研發。法律機器人是一類面向客戶的法律人工智能應用程序，用於自動執行具體法律任務，如文檔自動化和計算機輔助法律檢索。從智能搜索機器人、表單程式機器人到法律咨詢機器人，法律機器人的用戶界面多種多樣。根據任務的不同，面向律師事務所客戶的法律機器人解決方案往往需要在律師監督下運行，而面向消費者和企業客戶的法律機器人解決方案則通常不需要法律專業人士的直接監督。法律機器人不是用來取代諸如法官、律師等法律從業者的，它是人類智能之延伸，是法律人的得力助手，而並不會替代法律人。

　　 （作者：熊明輝，系中山大學哲學系教授，國家“2011計劃”司法文明協同創新中心教授）

(責編：任一林、萬鵬)

學習路上
時習之

習近平
系列重要講話數據庫
中央文件

學習貫徹
黨的十九屆五中全會
精神

習近平總書記
領導“十四五”
規劃編制

中央和國家機關
創建模范機關

重溫
馬克思主義經典

微信“掃一掃”添加“學習大國”

微信“掃一掃”添加“人民黨建雲”