中國共產黨新聞網>>理論

受腦認知和神經科學啟發的人工智能

鄭南寧

2018年04月23日15:16    來源:人民網-理論頻道

人工智能滲透到了人類社會各個領域,但目前來看,無論是深度學習還是其它方法,解決的都是單一問題。人類大腦是一個多問題求解的結構,怎麼從腦認知和神經科學中得到構造健壯的人工智能的啟示,國內外都做了非常多有成效的研究。

一、實現健壯的人工智能的方法

人類面臨的許多問題具有不確定性、脆弱性和開放性。今天人工智能的理論框架,建立在演繹邏輯和語義描述的基礎方法之上,但我們不可能對人類社會的所有問題建模,因為這中間存在著條件問題,我們不可能把一個行為的所有條件都模擬出,這是傳統人工智能的局限性。

這個局限性主要表現在幾個方面:

1、需要對問題本身抽象出一個精確數學意義上的解析式的數學模型(抽象不出,即歸納為不可解問題)﹔

2、需要為已建立的數據模型設計出確定的算法(容易產生諸如NPC等問題)﹔

3、處理的結果無法表現現實世界所固有的不確定性﹔

4、圖靈意義下的可計算問題都是可遞歸的(“可遞歸的”都是有序的)﹔

5、用“度量”來區分模式,隻能處理可向量化的數據。

我們要構造一種更加健壯的人工智能,需要腦認知和神經科學的啟發。計算機和人類大腦是對問題求解的物質基礎。在智力和計算能力方面,計算機遠遠超過了人類,但是人類面對的大部分問題都是開放的、動態的、復雜的,大腦在處理這種問題時表現出的想象和創造,還有對復雜問題的分析和描述,是傳統人工智能的方法所不能企及的,我們隻能夠從人類大腦的神經網絡結構中去獲得構造新的人工智能的因素。

人類大腦非常奇妙,也正是在這個物質基礎之上,才演繹出人類世界的發展和對問題求解的各種方法。在神經元的結構模型中,神經元的連接並不是像我們一般理解的物理方式,而是靠突觸,神經元之間突觸間隙產生的反應,構成了大腦中奇妙的演進。人類大腦中的思維或學習都是發生在突觸這個層面上的。實際上在大腦的神經網絡連接中,不同空間對應不同功能,不同功能在自身內部產生著不同的成本函數。

人出生之后,大腦會不斷發展,發展到一定程度,神經元增長到一定數量,又會遞減,把不需要的神經元刪掉。大腦是慢性記憶神經元,它需要具有高度的容錯性。

實際上,人出生時大腦是一樣的,如三字經所提到的“性相近,習相遠”,6歲以前,大腦在發育,到6歲左右,從生物學角度上講,這種發育就完成了,大家的記憶力、智商等都是教育上的反應。教育的基礎就是大腦。所以,大腦不是通過一個統一的沒有分化的神經網絡來實現單一的全景優化學習的,不同的功能和區域會生成不同的成本函數。它是模塊化的,同時具有獨特的系統來支撐注意、記憶、語言等功能。因此,我們可以從腦認知和神經科學中去獲得發展新的人工智能的靈感。

二、腦認知與人工智能的結合

人類大腦有800億個神經元的容量,它主要有三種研究方式:結構研究、功能研究和有效研究。

大腦的結構連接是靜態的,功能連接和有效研究則具有時空動態演化的特性。在視覺和聽覺神經網絡的區域空間中,功能連接和有效連接是不一樣的。

有效連接是針對具體任務的,在同一個視覺功能連接空間中,當我們執行不同視覺任務時,它所形成的神經網絡的有效連接是不一樣的。有效連接描述了神經元之間的因果與相互影響關系。

從這種結構化的觀點來看,我們構造的神經網絡還沒辦法模擬同時具有結構連接、功能連接、有效連接的方式。我們可以通過獲取某一區域的活躍程度,或活躍狀態,辨別大腦正在執行什麼樣的視覺任務。知道它在執行什麼樣的視覺任務,我們就得到了它有效連接的狀態,也可以求出它的有效連接在時空演化中的特性。如果能夠求出其中的規律,我們就可以設計相應的人工智能方式去實現。也就是說,我們可以採用可觸的、動態的、非線性的關系網絡進行認知任務的輸入。

再對它的科學問題做一個總結,我們要回答出三點:1、大腦是如何實現優化的﹔2、腦網絡的監督訓練信號從哪裡來﹔3、在不同的神經功能研究區域中,存在什麼樣的有效連接的約束和優化。

前面講了概念,在概念基礎上我們要抽象出科學問題,這樣才能指導我們進一步的研究,找到解決問題的方法。那麼這個方法如何和現在的方法結合?

去年,谷歌和MIT聯合發表了一篇文章,文章的中心思想是怎麼利用神經科學構造健壯的人工智能系統。我們現在深度學習的基本框架,是通過多層神經網絡輸入,根據誤差來調整連接,這建立在大量數據標注的基礎上,通過標記數據得到網絡優化的成本函數。

我要強調一點,我們通常講深度學習是從機器學習發展來的,要構造一個學習機器,關鍵是在不同區域、不同任務下,怎麼去構造一個成本函數。

三、大腦的認知活動

大腦的認知活動分為三個不同層次:一是哲學,二是形象思維和邏輯思維,三是敏感性。

直覺和敏感都屬於創造性思維,警察在破案中,靠的是多年積累和實踐,形成的直覺判斷。靈感、頓悟與直覺的區別是,直覺是對當前環境的反應,它在現在人工智能的發展中扮演著十分重要的角色。我們需要一種基於直覺的人工智能,也可以將它看成一種基於直覺的推理。

人的直覺反應實際上是尋找全局最優解。要構造直覺推理,需要兩個關鍵因素:一是需要構造一個成本函數﹔二是需要給出一個決策結構,而這個決策結構就建立在記憶基礎上。

人在觀察事物時,一定會形成一種與時間相關的影像。如果把直覺推理和數學歸納演繹推理兩類機制組合,就可以實現基於認知計算或受神經科學啟發的人工智能。

我們把認知推理稱為直觀、朴素的物理推理。物理層面的認知推理可以化解時間與空間,追蹤事物的發展軌跡。認知推理的另一個要素在心理層面,簡而言之就是學習方向受心理狀態的引導。我們需要把物理層面和心理層面的推理嵌入到推理的人工智能系統中。

在直覺和認知推理中,我們還需要構造一種模型,其中因果模型是基礎。認知計算框架下的因果模型既要滿足物理因果關系所產生的物理約束,同時又要讓機器理解當前認知任務下的因果關系。

直覺推理、認知推理和因果模型是構建健壯的人工智能必須考慮的基本因素。那麼如何來構造一個具體的系統?構造機器人需要三個基本要素:1、對環境中的所有對象進行特征識別,並且進行長期記憶﹔2、理出對象間的關系,並對它們相互間的作用進行描述﹔3、基於想象力的行為模型,人在進行具體行動之前,會想象其帶來的后果,但機器就需要分析物體之間的各種關系。

這三種要素是讓機器像人一樣理解物理世界的基礎。具有想象力的人工智能,就需要:1、行動之前預想到結果﹔2、構造一個位置模型﹔3、給出環境模型,提取有用信息﹔4、規劃想象行為,最大化任務效果。

四、認知如何解決實際問題

我們在2000年初就開始做無人駕駛,有人說要把無人駕駛汽車和城市真實場景的車融合,我們還面臨非常艱難的挑戰,有相當長的路要走。在這種局部、動態的場景中,我們怎樣讓自動駕駛跟環境融合,確實是一個很大的問題。

無人駕駛的挑戰存在於:

1、必須准確感知周圍環境,在所有條件下安全行駛﹔

2、自動駕駛必須能夠抽象,要完成一種交互情境中的記憶計算﹔

3、自動駕駛必須能夠理解預行為。

現在絕大多數自動駕駛採取了場景感知與定位,決策規劃與控制,這是一種簡單的ADAS形式,但我們要如何通過新的方法來解決這個問題?

場景是某個交互場合在特定時間和空間中的具體情境和影象,它可以定義為一種實體。情境是指這種實體隨著時間和空間變化而產生的關聯。情境計算是對場景各個關聯的對象做解釋,可以定義為一個行為相關體。

這裡的問題就是,第一,要讓自動駕駛汽車像人一樣理解和記憶,就要具有記憶推理和經驗分析的技術﹔第二,進化發展的自動駕駛,其學習過程要像人類一樣熟能生巧。

人類視覺關注的基本機制是選擇、組織、整合、編碼。人對變化是非常敏感的,可以提取交通場景中的顯著性變化。比如你在開車時,如果右前方突然來了一個騎自行車的人,你的注意力會轉移到騎車人的身上。在自動駕駛汽車上,我們要構造一個選擇性的注意機制網絡,對數種圖像進行理解,並根據內部狀態的表示,忽略不相關的對象,選擇下一步要採取的動作。

把場景感知和情景認知結合起來,需要我們構建一個模型,融合先進知識概念,實現記憶學習。

場景感知是將通過各種不同屬性的傳感器獲得的不同數據,提供到深度學習中,之后再根據長短期記憶和定位網絡,進行情境計算。在這種框架中,我們可以把場景感知和情境計算融合在一起。

一個高效的情景計算要運用實際情境的因果關聯,在最前端的數據層面進行有效計算,這就需要把數據驅動變成事件驅動。人在開車時,根據情境判斷前方可不可以行駛,這就是把數據驅動變成事件驅動。

怎麼構造事件驅動?就是把可見光和激光點雲數據融合在一起,把三維數據轉化成二維圖像數據。點雲數據給出了每一個生物體的明確的點,二維圖像沒有深度信息,它是圖像的幾何形狀變化。把人的數據和激光點雲的數據融合,用數據驅動轉變為事件驅動,就得出了可行駛數據和不可行駛數據大的劃分。

人開車的時候,他在注意什麼,我們就來構建一個類似的選擇性基礎,把同樣的場景輸入到一個深度學習網絡中,通過深度學習網絡提取特征和人的注意力。

(來源:《網信軍民融合》2017年11月刊)

(責編:任一林、謝磊)
相關專題
· 《網信軍民融合》
微信“掃一掃”添加“學習大國”

微信“掃一掃”添加“學習大國”

微信“掃一掃”添加“人民黨建雲”

微信“掃一掃”添加“人民黨建雲”