日本少妇寂寞少妇aaa-亚洲av无码一区二区三区系列-精品久久人人妻人人做精品-久久精品麻豆日日躁夜夜躁

|EN
新聞中心
首頁新聞中心新聞速遞

【WRC 大咖觀點】孫富春《移動雙臂機器人的智能感知與安全操作》

時間:2021-10-11

2021世界機器人大會第一天線下主論壇——“領航峰會”群星璀璨,產、學、研各領域大咖齊聚首,共話巔峰,為機器人未來發(fā)展領航。

峰會現(xiàn)場,清華大學孫富春教授上臺發(fā)言,演講主題為《移動雙臂機器人的智能感知與安全操作》。以下為孫富春教授演講內容全文整理。

61654e995d8e5.png

尊敬的各位嘉賓,女士們、先生們,大家下午好!非常感謝大會組委會的邀請,有機會和大家匯報一下我對移動飛行雙臂機器人的感知和安全操作做的一些工作,我的匯報分為四個主要部分:目前在移動平臺上,包括地面移動的車、空間飛行器上的裝備,多個器件操作是重要的發(fā)展趨勢。軍事場景中的反恐,包括礦山的開發(fā)、巡檢安防、搶險救災、物流和建筑、農業(yè)三保系統(tǒng),包括民生和健康領域,比如疫情下的巡診機器人就是由移動平臺加上機械臂,隔離間中做輕診、測血壓,包括輔助作業(yè)。

61654ea75e469.png

飛行操作平臺和移動操作平臺相結合能夠解決很多問題,把機械手的操作能力和平臺大空間的移動結合起來,實現(xiàn)遠距離大場景下的作業(yè)過程,小到醫(yī)院里的手術機器人,大到農業(yè)山區(qū)采摘機器人,這些是未來很重要的發(fā)展趨勢。剛才張鈸老師也有提到主要用來解決從結構化到非結構化的問題,也要通過主動感知技術,就是把行為和感知結合做閉環(huán)實現(xiàn)精細化感知。我們可以把多個無人機集聯(lián),平臺和機械臂聯(lián)合運動,解決機動性的問題,包括多臂協(xié)同實現(xiàn)靈巧操作,通過人工智能里的一些技術,比如操作技能的學習增強技術、遷移學習技術,不斷地提高機械臂的能力。現(xiàn)在有一種學習叫做連續(xù)學習和終身學習,不斷提高機器人的操作能力。

目前把感知和操作能力結合缺少理論構架,怎樣通過理論構架把感知和操作能力閉環(huán)起來,這是未來人工智能和機器人結合點的一個非常重要的問題,下面我們就介紹這個計算構架,叫做Bcent。剛才張老師也談到行為和感知的問題,這個正好印證了人工智能的第三范式。

感知怎樣增強行為,行為怎樣增強感知,所以是一個動態(tài)的過程,恰恰能夠解釋機器人的感知和行為如何有效結合的問題。

這里涉及到一個很重要的問題就是智能體的改變,智能體就是研究如何跟環(huán)境交互,通過獎懲機制不斷增強行為的過程。目前智能體大多數(shù)采用的是部分可觀測的建模,現(xiàn)有條件下最大的弱點就是沒有考慮和物理環(huán)境實體的交互。另外就是記憶和知識如何嵌入到這樣一個Agent,視頻中是一個啤酒加蓋的場景,由于瓶蓋出了問題,因為機器沒有這個先驗知識,還是按照傳統(tǒng)的方式操作,結果出現(xiàn)了這樣的問題,由此可以看出知識和記憶的嵌入在未來操作過程中是非常重要的。

現(xiàn)有的智能體概念是不是需要擴展?比如智能體中有一個非??量痰臈l件,就是要知道狀態(tài),通過大腦的人工智能算法的推理得到Action,就是行為和行動,這是狀態(tài)到行為的映射過程,也是一個單向的過程,但實際上機器人的傳感器得到的信息恰恰是一個異構的、大的數(shù)據(jù)空間,要把這些變成狀態(tài)就是人工智能算法,大的異構數(shù)據(jù)空間映射到一個狀態(tài),我們把這個叫做數(shù)據(jù)空間的映射,這樣才能實現(xiàn)狀態(tài)表示,狀態(tài)表示是現(xiàn)有智能體實際應用中最重要的問題,就是如何得到狀態(tài),包括知識怎么產生。大家都知道,只有知道自己錯了才能產生新的知識,所以交互過程在這里是非常重要的,我們把大腦的處理部分通過感知和行為跟環(huán)境交互的過程產生知識。

Action究竟做得對不對、好不好,要讓行為體和環(huán)境交互,才能知道這個結果是對的或者是不好的,由此我們提出智能體要擴展,要把感知和行為變成兩個體,而且是物理過程,信息處理過程叫做認知體,作用過程叫做行為體,就是三個體構造具有交互能力的系統(tǒng),可以稱之為腦機接口,大腦通過感應器和環(huán)境協(xié)同,包含感知動力學、行為動力學,而且感知動力學和行為動力學跟環(huán)境交互產生偏差的話要修正大腦的認知過程,所以這是一個感知和行為的交互過程,包括物理體系結構,智能體體系結構,還有一點很重要的就是交互知識。

我們提出從狀態(tài)表示到認知體和決策,通過交互的過程產生的偏差能夠實現(xiàn)知識的生長和知識的利用。

有人說這是在造詞,實際上Bcent翻譯成中文就是知行體,究竟和智能體有什么不一樣呢?智能體考慮的是從狀態(tài)到Action的映射過程,知行體考慮的是感知體和行為體要不斷交互,所以從信息輸入來說智能體是被動的,知行體是主動的,智能體主要是信息交互,知行體是物理交互,而從應用領域來講,智能體很多用于輔助推理和決策,知行體主要是認知和行為。

我們來看感知部分,剛才談到感知應該是一個閉環(huán),感知體到數(shù)據(jù)O,然后映射到空間狀態(tài),最后通過感知體作用到行為體,通過行為增強感知,鷹在捕獵的時候用的就是這個過程。我們提出不需要候選窗的目標檢測算法,這個動作強調的是兩個模態(tài)信息融合,傳統(tǒng)方法需要在物理位置和時間形成同步,同時實現(xiàn)對齊,這個條件無疑是太苛刻了,那么有沒有辦法呢?我們通過通道編碼和交互的辦法可以減弱這個要求,現(xiàn)在是通過紅外和可見光,另外就是目標檢測,現(xiàn)有的目標用的很多都是單模態(tài),第一次實現(xiàn)從可見光和紅外相結合的檢測方法,特別適合夜晚的作業(yè)過程。

可以看到我們用知行體、智能體和行為體的交互實現(xiàn)主動感知,相比傳統(tǒng)方法,整個調節(jié)時長大大縮短,耗時的準確性大大提高。

究竟怎么去做認知體呢?我們希望機器有一個人的大腦,形象地講就是如何從特征空間到概念空間到知識空間,機器就是根據(jù)知識庫和現(xiàn)有的狀態(tài)進行規(guī)劃,規(guī)劃的作用應該是什么樣子,這個作用的狀態(tài)對應的就是期望的狀態(tài),機器人操作過程又產生實際狀態(tài),這里就會有一個交互殘差,一方面是修改知識庫,另一方面是通過底層控制,就是從兩條途徑消除偏差。規(guī)劃和控制之間是一個雙向關系,傳統(tǒng)的是一個單向關系。

我們的傳統(tǒng)方法就是根據(jù)知識庫規(guī)劃一條痕跡,可能不一定能夠達到期望的位置,中間就會產生交互殘差,這樣會有兩個部分:通過知識庫模糊化,這里還有新的方法來做,認知體里面有知識,然后產生下一個時刻的期望狀態(tài),兩個狀態(tài)有一個差,然后把這個時刻的交互殘差算出來,根據(jù)剛才講到的修改知識庫再去操作完成這個過程。大家看到這個方法和傳統(tǒng)的控制方法、機器學習的強化模型不一樣,最大的不一樣就是整個任務規(guī)劃控制之間有修正過程,也就是說規(guī)劃期需要通過知識庫修改。

可以看到通過4次學習就可以很快穩(wěn)定下來,最近從六連桿機器人來看比傳統(tǒng)的強化學習方法收斂性大大提高,至少提高5倍甚至更多。人手把手地教機器人學習和機器人僅僅通過眼睛來看學習,二者之間究竟存在什么關系?主要就是一個散度,這個散度可以算出來,然后可以增強視覺學習方法。

基于示教的學習下一步性能的提高就是通過人工智能的算法,行為空間中找到最優(yōu)解。基于偏好的算法,我們能不能讓人工智能把偏好學出來,我們通過軌跡概率來把特殊的技能定義出來,對抗式學習產生滿足這個偏好的最佳樣板,從而讓機器人學習,久而久之機器人就把這種行為學到了,我們可以學習某些總經理管理的偏好。

接下來介紹一下團隊的工作:移動雙臂機器人上面有很多傳感器,這是到指定場所做的拆彈的工作,其中用到主動視覺感知和觸覺感知,包括聲音感知,通過雙臂協(xié)調完成包扎物的拆卸。這是無人機上的兩個機械臂,其中有各種傳感器,我們大概裝了三種傳感器,紅外可見光、避光相機,這是在黑夜什么都看不見的地方,通過多模態(tài)融合實現(xiàn)目標檢測,圖中是單向靜態(tài)抓取任務以及視覺伺服,空中對爆炸物進行隱性的解除。

最后就是未來展望,今天我們談到的認知體就是一個腦袋的問題,實際上很多情況下是一個平臺加上多個臂,那么這種結構就顯得非常重要,多認知體的協(xié)同是未來理論非常重要的工作,如何在動態(tài)場景下實現(xiàn)機器工作的協(xié)同。比如美國做的有人機和無人機的協(xié)同,再就是在云端環(huán)境下如何實現(xiàn)分布式的操作和感知,如何在框架實現(xiàn)知識和數(shù)據(jù)的有機結合。比如大象是通過記憶記錄自己的行跡,而且會利用知識實現(xiàn)自己的行為。