当前位置 - 股票行情交易網 - 財經資訊 - IEEEFellow李世鵬:人工智能與機器人前沿研究之思考

IEEEFellow李世鵬:人工智能與機器人前沿研究之思考

作者|維克多

編輯|青暮

2021年12月9日,由粵港澳大灣區人工智能與機器人聯合會、雷峰網合辦的第六屆全球人工智能與機器人大會在深圳正式啟幕,140余位產學領袖、30位Fellow聚首,從AI技術、產品、行業、人文、組織等維度切入,以理性分析與感性洞察為軸,***同攀登人工智能與數字化的浪潮之巔。

大會次日,思爾實驗室主任、前深圳市人工智能與機器人研究院執行院長、國際歐亞科學院院士、IEEEFellow李世鵬在GAIR大會上做了《人工智能與機器人前沿研究之思考》的演講。

李世鵬博士,IEEEFellow,國際歐亞科學院院士。歷任深圳市人工智能與機器人研究院首席科學家和執行院長、科大訊飛集團副總裁及訊飛研究院聯席院長、微軟亞洲研究院創始成員與副院長。李院士在多媒體、IoT及AI等領域頗具影響力。他擁有203項美國專利並發表了330多篇被引用了的論文。被Guide2Research列為世界頂尖1000名計算機科學家之壹。培養出四位MITTR35創新獎的獲得者。是新壹代人工智能產業技術創新戰略聯盟發起人之壹及聯合秘書長。

在演講中,李世鵬介紹並展望了人工智能與機器人前沿研究方向,他指出:未來機器學習突破深度學習的數據瓶頸或許可以借助認知科學的方法得到突破,學習範式可從依靠大數據轉變成依靠大規則;人機協作也要進化為人機諧作,只有將耦合、交互、增強、互補等目標納入研究方向,才能實現人機的無縫連接。

以下是演講全文,AI科技評論做了不改變原意的整理:

今天的演講題目是《人工智能與機器人前沿研究之思考》,分為三個部分,先談

人工智能

機器人研究全景

,然後

聚焦研究方向

,包括機器學習、運動智能、人機諧作、群體協作;最後進行總結。

人工智能相關研究的關鍵元素有三個:

人、機器人/物聯網以及AI

。之所以將機器人和物聯網歸為壹類,是因為這兩者是物理世界和虛擬世界的接口。如果三個元素兩兩之間發生聯系就會形成壹個新的學科,例如機器人和AI相結合會產生智能體,AI和人類相結合會產生人機耦合以及增強智能,而機器人和人類相融合會形成增強機體。隨著人工智能與機器人領域的發展,研究對象不再局限在單個智能體,而是越來越多地對多個智能體的協作進行研究,例如人類社會群體如何更好地相融合?如何設計出能夠精妙協作的機器群體?

總體而言,我認為重要的基本研究方向是:

機器學習、運動智能、人機諧作、群體協作。

1

聚焦方向之機器學習

機器學習的發展離不開深度學習加持,它給行業帶來許多研究成果,並賦能了語音識別、人臉識別、物體識別、自動駕駛等方面,推動人工智能產業高速發展。

雖然成果頗豐,但成也蕭何敗也蕭何。深度學習依賴於大數據,其瓶頸也在於大數據。例如國內的智能語音技術盡管處於行業領先,但仍依賴技術積累和數據積累。現在想要讓深度學習發揮巨大威力,仍然需要大量數據的加持,如果想讓深度學習從壹個領域擴展到另壹個領域,也少不了數據支撐。

如何突破?研究者已經探索了多條路徑,其中壹個解決方案是:

擴展深度學習框架。

例如優化深度學習算法、知識圖譜+深度學習、專家系統+深度學習等等。另壹條路徑是

因果推理

,其目標是借助人類舉壹反三的能力,期望超越數據之間的相關性,進而探索數據之間的因果性,從而得到數據之間的邏輯推理。

第三條路徑是

類腦計算

,從生物學角度,探索人腦認知元素和機制,以仿真方法再現人類大腦。

個人認為認知科學是突破深度學習框架的著力點。理由是人類認知過程有兩點需要我們去進壹步借鑒:生而知之、學而知之。

生而知之是指部分認知能力與生俱來,新生兒的腦神經有很多先天的連接。它給我們的啟示是:現在的大多深度學習算法,大部分都是從零開始訓練,而沒有充分或者高效利用先驗知識或者已有模型。如何利用現有知識是深度學習的下壹個熱門方向。

學而知之是指大部分認知能力是後天學習到的,尤其是早期學習。通過學習腦神經建立了更多的連接。孩子很多能力,包括感知、應對、語言、讀寫和理解,甚至分析問題和解決問題的思路和能力在很小時候已經基本定型;以後基本都是知識的積累。這意味著腦神經元很早的時候就連接定型成壹個元模型,剩下的是只是利用這個元模型去解決具體領域的問題。這個與當前的大規模預訓練模型有著驚人的相似之處。

學而知之的另壹層次是:人類學習過程依靠多源的、多傳感的、多模態的、多角度的數據,例如視覺、聽覺、嗅覺、觸覺和語境等聯合信息,而今天的深度學習依靠大都是壹段語音、壹張照片,因此,未來AI模型的輸入數據可能不僅是單壹的數據,而是多個信號源的融合。如何模仿人類學習的過程,這是認知科學對深度學習的另壹個啟示。

再者,人類學習過程是壹個從樣本示例到原理歸納的過程,而不是僅停留在樣本示例層面;目前深度學習卻都是停留在樣本層面。那麽,未來是否能夠構造類人的機器學習框架,無論輸入什麽樣的數據,只要邏輯相通,都會收斂到壹致的模型?

突破深度學習的數據瓶頸,可以嘗試構建規則的眾包系統,讓人類教機器學習過程,其目的不是輸入數據,而是讓機器學習規則。由於我們試圖從日常的活動中學習規則,這種規則普通人都可以標註示教,這就打破了以前專家系統地需要專家的局限。這種從大數據過渡到大規則模型構建方式顯然也更符合人類的認知。

2

聚焦方向之運動智能

眾所周知,在機器人領域,波士頓動力公司的產品最像人,如上動圖,機器人跳舞絲毫看不出生硬的感覺。但受計算資源、能量、運動控制的限制,它只能運行幾十分鐘。其實,波士頓動力機器人的運行方式是基於電機驅動,存在很多缺點,例如剛性運動、自重比較大、反應速度和靈活性的矛盾以及耗能大。

對比人類和其他動物的運行方式,肌肉、骨骼、傳感和神經的結合可以在低能耗情況下,實現靈活運行。這給研究者的啟示是,機器人的運行系統應該像人壹樣滿足:高效、靈活、精確、魯棒、剛柔並濟、輕量、自適應等指標。當前的運動智能可能在某壹個維度表現優秀,但綜合考量仍然有很多缺點。

因此,運動智能的壹個重要研究方向是:仿生。仿照動物的運動智能,例如運動控制采用逼近反饋式,運動過程視變化隨時靈活調整。

如果說機器人是靠內力驅動,而醫療微納米機器人是外力研究方向的代表。例如依靠磁力,小機器人精確地將藥物從壹個管道運送到另壹個管道。

3

聚焦方向之人機諧作

在人機諧作層面,區別於協作,諧作代表人機協作中的耦合、交互、增強、互補、協作、和諧等意思。人機諧作的目標是:不需要告訴機器人類的意圖,機器就能領會,從而達到人機的無縫連接。

在達成人機諧作的過程中,重點研究人機自然交互、感知及增強。具體可能包括:生物特征檢測和識別、人機接口、腦機接口、語音識別、動作識別、表情識別、語言理解、意圖理解、體態感知、無隙增強,以及在擴展現實與遠程現實的延伸等等。

人機增強智能方面,今天的機器學習框架大都是基於大數據的深度學習框架,肯定會遇到機器智能處理不了的情景。這對於某些高風險領域,例如自動駕駛、金融等來說是致命的。

針對這壹問題,當前的解決方案是人類接管。這會涉及三個核心問題:

核心問題1:機器智能如何感知自己處理不了壹些情況,而主動要求人來接管?

核心問題2:什麽時候人類可以完全放手給機器自主完成任務?

核心問題3:什麽樣的人機交互設計能充分發揮人和機器各自的長處,同時又無需非必要地麻煩對方?

三個核心問題如果無法解決,會導致壹些困境。例如,以自動駕駛為例,目前安全員並不是開了自動功能就壹勞永逸,仍然需要時時監測路況與路線,壹刻都不能分神。這其實增加了安全員的負擔,因為在沒有自動駕駛的時候,人類對自己的駕駛環境會有壹定的預測,而機器駕駛的情況人類無法預測。

人機增強機體也屬於人機諧作的壹個領域,能夠幫助人類增強物理機體能力,完成壹些人類自身體力完不成的事情。但機器可能過於復雜,需要人類培訓後才能操作。人機增強機體的未來目標是實現人與機器和諧***處,操控起來如同人類的自己的器官壹樣自然。其中,涉及的核心研究課題包括:機器感知人的意圖、人的姿態、理解人的自然語言命令、肢體語言等等,從而讓機器以最適合人類接受、恰到好處的平滑方式幫助人解決問題。

4

聚焦方向之群體協作

目前單智能體已經可以完成許多任務,但如何發揮每個智能體集合起來的威力?這涉及群體協作的研究方向。在倉儲場景下,存在許多抓取分類的機器人,如果能夠有效調度,那麽必將大大提高工作效率。

當前主流的調度方式是中心化的控制方式,但面對成千上萬的規模的智能體,則需要非中心化的控制,允許智能體之間存在自主行為,在相互協作的同時,還能做自己的事。即單獨的有智能可獨立行動的智能體,通過協作而達到的更高效的群體/系統智能和行為。

智能體群體協作目前涉及的規則包括,群體行為模型和激勵機制、群體智能協同決策。這壹方面,螞蟻是我們的學習對象。另外,在自動駕駛方面,越來越多自主駕駛機器人出現,它們之間如何做到協同感知和協同控制也是當今熱門話題。

上述四個方面屬於基礎性的研究,任何壹個領域出現了突破,那將對其領域以及下遊應用而言都是革命性的突破,也將帶來工業數智化原創技術的創新,會我們在競爭中占領優勢地位!

雷峰網雷峰網