繁榮與寒冬
2016年恰好是人工智能發展60周年。人工智能的標志性事件是1956年在美國Dartmouth大學召開的一個為期兩個月的會議。在會議上,來自美國幾個大學和企業的10位年輕人聚在一起,從不同角度討論用計算機來實現人的一些能力。會議提出用“人工智能”來命名所討論的內容,這成為人工智能研究公認的起始事件,而該會議也被賦予了專稱——“Dartmouth會議”。后來,從參會的年輕人中,走出了四位計算機科學最高獎“ACM/圖靈獎”得主、一位諾貝爾經濟學獎得主,並且創立了“信息論”。
人工智能發展的第一個階段大約在20世紀60年代初到70年代中期。在這一階段,人們認為邏輯推理能力是機器具有智能的重要成分,甚至一度認為推理就是智能。這一階段的代表性工作主要有A.Newell和H.Simon兩位后來的圖靈獎得主研發的“邏輯理論家”程序,該程序在1952年証明了著名數學家羅素和懷特海的名著《數學原理》中的38條定理,並在此11年后証明了全部的52條定理,而且定理2.85甚至比羅素和懷特海的証明更加巧妙,令人驚嘆。因此,這一時期可以稱為“推理期”。
隨著研究的推進,人們逐漸認識到,單靠邏輯推理能力遠不足以實現人工智能,以E.A. Feigenbaum為代表的學者認為,知識是有智能的機器所必備的,於是在他們的倡導下,在20世紀70年代中后期,人工智能進入了“知識期”,E.A.Feigenbaum后來被稱為“知識工程”之父。在人工智能“知識期”,大量專家系統問世,在很多領域做出了巨大貢獻。但這些系統中的知識,大多是人們總結出來並手工輸入計算機的,機器能進行多少推斷完全由人工輸入了多少知識決定,也因此有這麼一句對人工智能的調侃:“有多少人工就有多少智能”。之后,人們意識到專家系統面臨“知識工程瓶頸”,尋找專家來輸入大量知識一方面成本極高,另一方面,對一個特定領域建立的系統無法用在其他領域中,缺乏通用性。於是,一些學者嘗試讓機器自己來通過學習得到知識,而不依賴於人工輸入,這就是人工智能現在所處的“學習期”——從數據中學習到有價值的知識。
人工智能從“推理期”到“學習期”,走的並不是康庄大道,而是崎嶇山路。在“推理期”的高峰,一些進展讓人們對人工智能過於樂觀,產生了不切實際的想法。A.Newell和H. Simon曾在1958年預言,1968年前計算機將成為世界象棋冠軍(實際是1997年,將近30年后)。
對人工智能的過於樂觀導致了人們過高的期望,而當時的人工智能隻能解決“玩具”問題,難以在現實問題中發揮作用,一時間,預言失敗、承諾無法實現、期望破滅,人工智能遭遇了誤解和冷遇,研究經費也被大量削減甚至取消,人工智能進入被稱為“AI Winter”的人工智能之冬。
進入“知識期”后,從1980年代開始,由於專家系統得到應用,人工智能才再次受到關注。這一時期,日本開始巨額投資“第五代計算機”計劃,英國、美國也啟動了相應的投資項目,人工智能被推進了第二次繁榮。然而在1980年代末,“知識期”人工智能技術局限日益突出,專家系統維護困難、弱點不斷暴露,日本五代機計劃破產,人工智能第二次進入冬天。
直到1990年代中期,進入“學習期”的人工智能開始從數據中學習知識,通用的學習方法在許多商業應用中顯示出無可替代的價值,人工智能再度掀起浪潮。此時,我們正處於人工智能“學習期”的浪潮之巔。
為什麼是AlphaGo
棋類游戲通常被認為是人類智慧的濃縮,常常被用於開發兒童智力,因此,對於追求智力的人工智能,棋類游戲一直被作為檢驗其智能程度的試金石。
早在1951年,研究者們就設計了西洋跳棋程序。1997年,IBM“深藍”擊敗國際象棋世界冠軍,舉世矚目。而在“完全信息”棋類游戲(即沒有隱藏信息,例如扑克、麻將不屬於此類)中,圍棋是最難的,也是之前唯一沒有被機器攻破的。甚至在一年前,還沒有任何圍棋程序能夠達到職業棋手水平。因此,AlphaGo戰勝曾獲得世界冠軍的人類九段圍棋高手,在人工智能歷史上記下了重重一筆。
下棋的本質是搜索,通過交替思考自己和對方可能的走法,找到最有利於自己的落子。AlphaGo的基礎框架是“蒙特卡洛樹搜索”,是一種聰明的搜索算法,但即使該算法已經聰明地避免了很多無效搜索,也隻能達到業余五段、六段的水平。AlphaGo還引入了“機器學習”,通過學習人類歷史上高手對弈的棋局數據,對人類的走法進行模擬:記住人類看到一盤棋是如何走下一步的,當碰到沒有見過的棋局時,則參考以往相似的棋局,但它完全不懂得人為何要下這一步。進一步,AlphaGo通過“強化學習”,即自己與自己下棋來提高自己。許多人驚訝於這種類似於“左右手互博”的學習機制,但這早在20年前就有。實際上,隻要使用“強化學習”來訓練對弈游戲,都是“左右手互博”。最終學習得到的模型,被用在“蒙特卡洛樹搜索”中,來為一盤棋的好壞做出較為精確的評估,指導避免更多的無效搜索,從而能夠在短時間內看得更遠、看得更准,找到更好的走法。
AlphaGo涉及的所有算法部件都是現成的,其“蒙特卡洛樹搜索”已經發展了十年,其學習模型CNN成形於上世紀,被大量使用在圖像識別也有多年,強化學習也是經歷了數十年的發展,大量應用在機器人控制等領域。這些技術的結合在近年也成為研究熱點。AlphaGo的貢獻在於使用卓越的工程水平,實現了這些技術的結合,用上千CPU和上百顯卡進行加速計算,最終取得了與人匹敵的圍棋能力。
我們一方面肯定AlphaGo展現的實力,一方面還要注意到,其中涉及的人工智能技術,都是許多年基礎研究的成果,並不是突然就從平地冒出來的。未來人工智能的發展也會如此,今天有哪些積累,未來才會有哪些突破。
人工智能的下一步
人工智能已經進入人們的生活,正試圖讓生活變得更美好。例如,美國DARPA支持的CALO研究計劃所產生的一個成果——SIRI個人助理,已綁定在蘋果的手機等產品中,能支持用戶在簡單的任務上使用自然語言與系統進行交互﹔微軟也推出了Cortana智能助理用於Windows產品﹔ 微軟翻譯工具內置到了通訊軟件Skype中,可以在Skype聊天時實時翻譯漢、英、法、德、意、西、葡等7種語言﹔自動駕駛汽車也在蓬勃發展。可以預見,人工智能將成為越來越有力的工具,更好地服務人類。
然而目前,人工智能技術的瓶頸仍有很多。例如,在人工智能頂級國際會議AAAI’16大會上,國際人工智能協會主席T. G. Dietterich發表主席報告,針對目前人工智能技術缺乏穩健性(例如AlphaGo對戰李世石第四局時下出多步臭棋),指出了“穩健人工智能”的發展方向。
在社會環境方面,人工智能最近可能要面臨更大的瓶頸是,由“人工智能科幻”而導致的“人工智能威脅”論不斷出現。事實上,正如Facebook人工智能實驗室負責人LeCun最近所說,“有些人是因為對人工智能的原理不理解導致恐懼,有些人是為了個人名望宣揚人工智能威脅論,而有些人是為了商業的利益推動人工智能威脅論”。
另一方面,人工智能發展歷史上經歷了多次繁榮和低谷的交替。在每一次人工智能的繁榮期,人們往往在取得一些進步后就對人工智能技術的發展盲目樂觀,逐漸產生了不切實際的預期和承諾,最終帶來的沮喪是導致人工智能進入低谷的直接原因。對於人工智能未來的發展,抱以信心的同時還需冷靜對待,防止過大的起伏造成的不利影響。
(作者系南京大學計算科學與技術系副教授,主要研究方向為人工智能、機器學習等)
相關專題 |
· 《中國發展觀察》 |