時間:2021-10-19
2021世界機器人大會第二天線下主論壇——“未來峰會”群星璀璨,產(chǎn)、學(xué)、研各領(lǐng)域大咖齊聚首,共話巔峰,為機器人未來發(fā)展領(lǐng)航。
峰會現(xiàn)場,西安電子科技大學(xué)副校長石光明先生上臺發(fā)言,演講主題為《語義——機器人群交流的基礎(chǔ)》。以下為石光明校長演講內(nèi)容全文整理。
剛才聽了蒲院士的演講,覺得很有啟發(fā),希望能夠多講一點,因為做工科的人這方面的研究太少了,今天我想介紹的也是受這些的影響。
大家知道,機器人現(xiàn)在已經(jīng)在很多地方逐漸普及,機器人群的相互交流靠的是什么?其實以前已經(jīng)有了,為了把這樣的效率提升,我們有什么技術(shù)和方法能夠做到這一點呢?這是今天我要給各位帶來的一個主題,就是用語義的概念來做。
我們的工業(yè)革命經(jīng)過一系列的變化,現(xiàn)在已經(jīng)來到了工業(yè)4.0時代,這個時代最多的就是智能機器人的協(xié)同操作,實際上和傳統(tǒng)工業(yè)自動化最大的不同就是我們面臨著很多大量的個性化的生產(chǎn)的模式,要求我們的機器人具有很好的智能性,工業(yè)制造中有很多這樣的特點,這是和我們過去傳統(tǒng)的自動化有一個最大的不同,就是適應(yīng)多品種的生產(chǎn)模式。
要想解決這些,機器人要從過去的自動化生產(chǎn)變成能夠適應(yīng)動態(tài)環(huán)境的變化,比如我們的產(chǎn)能的變化、品種的變化、電力的波動、原材料的變化,這個變化過程中各個機器人之間要相互協(xié)調(diào),調(diào)整和適應(yīng)這樣的環(huán)境,保證生產(chǎn)的產(chǎn)品達到我們需求的目的。
多智能體之間的相互協(xié)同操作是非常重要的,包括機和機之間的操作,人和人之間的操作,最主要的就是要形成一個很好的操作策略。協(xié)同操作的過程中最離不開的就是信息交流,有了信息的交流才能協(xié)同,其實最主要的就是為了我們生產(chǎn)線能夠及時生產(chǎn),最主要的是傳遞的和理解的延遲要很短,兩個機器人之間、人和機器交互的信息理解延時要比較短。
大家都知道,現(xiàn)在5G已經(jīng)普遍應(yīng)用了,其實5G應(yīng)用和現(xiàn)在相比,我們已經(jīng)經(jīng)過了幾年的時間,但5G生產(chǎn)線上大規(guī)模的自動化應(yīng)用還是沒有普遍出現(xiàn),最主要的原因各位也很清楚,就是有這樣幾個方面:機器人的能力遠遠沒有達到人類預(yù)期的理想能力,信息傳遞網(wǎng)絡(luò)沒有實現(xiàn)真正低延遲,因為5G最大的特點就是這樣一個大容量、廣連接、低延遲,我說沒有低延遲好像和人家唱反調(diào)。其實5G只是指信號傳遞的延遲,大家協(xié)同工作的時候除了信號傳遞還要理解延遲,就是你傳過來的東西我要很快理解,要是花很長時間理解的話也不是我們工業(yè)期望的,我們期望的是傳遞和理解這兩個都要達到低延遲,這樣才能為后面的協(xié)同策略、協(xié)同工作做好準(zhǔn)備。5G其實并沒有關(guān)系到傳遞信息的內(nèi)容,低延遲最關(guān)鍵的就是內(nèi)容,所以這是非常重要的。
5G需要很多的資源,包括對帶寬和能耗都是比較大的,5G在工業(yè)中的智能工廠是大家期待的,但還沒有在我們工業(yè)生產(chǎn)環(huán)境普遍應(yīng)用,真正做到普遍應(yīng)用還是有很多工作要做,其中最主要的就是工作信號傳遞能夠做到低延時,這是一個非常關(guān)鍵的領(lǐng)域。實際上傳遞過程最主要的就是傳遞信息,關(guān)于信息的理解,盡管現(xiàn)在我們已經(jīng)馬上就要步入智能時代,信息時代已經(jīng)即將過去了,但對信息本身定義的理解還有不同的說法,如果有機會的話可以單獨討論一下。
實際上信息是對未知主客觀事物時空狀態(tài)的刻畫,我們把這個說好了,后面理解的時候就可以有很好的基礎(chǔ)。大家可以從不確定性和復(fù)雜性等等狀態(tài)刻畫,最主要的還是對事物主客觀狀態(tài)進行刻畫,要讓接受方理解主客觀的時空狀態(tài),這是非常關(guān)鍵的一點。我們現(xiàn)在表達信息當(dāng)然是用這樣一個最簡單的0和1比特表達,支撐著我們現(xiàn)在這項技術(shù),當(dāng)然如果從我們理解的角度來講,如果是一個非常大的數(shù),我們?nèi)死斫馄饋硎欠浅ky的,要是二維碼的話機器可以很快地掃出來,但是人很難理解它的意義,只是因為表達的方式和人的表達方式是不一樣的。我們能不能在表達信息的時候直接從比特,或者用語義的方式去傳遞,也許是解決問題很好的方式。
當(dāng)然,語義這個概念應(yīng)該不是現(xiàn)在提出來的話題,早在上個世紀五十年代就有提出,只是因為當(dāng)時的語義概念很難用一個數(shù)學(xué)的方式表達出來,但沒有很好的手段和方法,所以語義在信息發(fā)展過程中暫且擱置下來了?,F(xiàn)在是到了一個非常重要的時機,就是應(yīng)該大力發(fā)展應(yīng)用。語義除了數(shù)學(xué)上難以刻畫,很重要的原因就是語義是具有客觀和主觀的關(guān)系,因為某個信號到底是什么含義,好像是腦子里的想法和特點。大家都知道自然科學(xué)一般是處理客觀事物,我們不研究這樣主觀的東西,要是主觀的東西研究起來就太復(fù)雜了,所以有著這樣的不確定性,導(dǎo)致語義研究暫且擱置了一段時間,我想這也是一個重要的原因。
很早以前大家就已經(jīng)認識到這個問題了,最主要的就是語義不具有普適性。剛才蒲院士介紹了神經(jīng)網(wǎng)絡(luò),語義的概念到底在我們腦子里是不是具有普適性?其實生物學(xué)家、腦神經(jīng)科學(xué)家做過很多研究,最后得出了這樣一個結(jié)論。語義是怎么產(chǎn)生的?很多學(xué)者做了一些研究,人腦對某種信號的刺激是在大腦中的某個區(qū)域,如果是語言的話會在語言區(qū)出現(xiàn)反應(yīng),如果是視覺的話會在視覺區(qū)出現(xiàn)反應(yīng),至少現(xiàn)在有一個大的概念,語音信號處理固定在某個區(qū)域,而且不是我經(jīng)常在這個區(qū)域,你經(jīng)常在另一個區(qū)域,而是所有人都在同一個區(qū)域,一個信號刺激在腦子里的某個區(qū)域反應(yīng)。
我們做了這樣一個實驗,就是講一段故事,故事中有一些特定的詞,假設(shè)大家都知道這個詞的含義,那么都會在腦子的同一個區(qū)域進行反應(yīng),如果大家都認為這是同一個含義的話,所以語義具有普適性和客觀性。那么從這樣的概念來講的話,語義還是可以計算和進行推理的,我們應(yīng)該把語義納入到自然科學(xué)研究的范疇中來。
關(guān)于語義的推理,生物學(xué)家還在不斷努力,正如剛才蒲院士講的類腦,我們只是類腦,不是仿腦,所以從中可以得到啟發(fā),能不能用于智能系統(tǒng)中來是非常關(guān)鍵的。我們覺得語義是可知的、可學(xué)習(xí)的,可以有進一步的普適性的概念。我們信息科學(xué)很多領(lǐng)域已經(jīng)開始做這項工作,比如因果性推測,跟這個方面都有關(guān)聯(lián)關(guān)系。
什么是語義的基本概念?不同的人有不同的說法,最后都統(tǒng)一起來了。語義是多種模態(tài)之間的互相度量,比如一塊紅的顏色,自然是圖像的表示,互相關(guān)聯(lián)起來就會知道這個東西的含義就是這樣。某種意義上講,語義有類似的語句的概念,就是從最基本的發(fā)展到最大的過程。我們的語義是各種多模態(tài)信號相互發(fā)展,就是剛才蒲院士講的祖母記憶中大分子的概念,有點類似這樣的過程,可以看到用這個東西刻畫語義的過程。
語義分為很多種,名詞性、動詞性、副詞性等等,我們可以用各種函數(shù),因為有信號以后就可以進行刻畫,某種程度上我們可以用數(shù)學(xué)的方式表達這樣的結(jié)果。簡單來說,語義就是特定的特征信號來做這個事情,某種意義上來講,有些和時間有關(guān),有些和時間無關(guān),和時間無關(guān)的就是名詞性的,和時間有關(guān)的就是動詞性的。當(dāng)然,語義可以組成基本的概念,正如現(xiàn)在由點到面、由面到底,分子組成物質(zhì)、原子組成分子,所以就是用類似的概念組成這些東西。
當(dāng)然,語義最主要的特點就是一個固定的特征,實際上這是可以變化的,某種意義上有標(biāo)準(zhǔn)的特征,也有偏位的特征,比如標(biāo)準(zhǔn)普通話發(fā)音的時候有某個單詞的標(biāo)準(zhǔn)發(fā)音,很多人的發(fā)音都不是那么普通話,我們可以用數(shù)學(xué)圖譜的形式表達這些結(jié)果。
實際上工作中我們也做了很多語義相似度的度量,那么這樣一個數(shù)學(xué)的刻畫最主要是為剛才我們的傳和支一體做好理論基礎(chǔ),只有這些做好了后面才能有可操作性,大家都知道語義通訊也是現(xiàn)在剛剛起來的熱點,其實語義通信和過去的不同就是有些是比特,現(xiàn)在就是從比特變成語義進行度量,傳遞的過程中保證語義,所以從帶寬和效率可以大大降低資源,達到我們能夠理解的效果,這也是非常重要的一個方面。除了過去的符號建立的知識庫,現(xiàn)在還有語義建立知識庫,后面的理解會更快一些。
簡單地說一說語義通訊和傳統(tǒng)通訊最大的區(qū)別,傳統(tǒng)通訊是從信號到信號的傳遞,語義通訊是從內(nèi)容上的傳遞,先理解再傳遞,傳統(tǒng)通訊是把比特傳給你就可以自己理解,通訊過程中可能是把理解的東西傳給你,所以傳發(fā)接收會有一個很好的共識,之前有一個很好的語義符號,傳遞的過程中就會理解了,所以我們的理解幾乎是理想化了,沒有實現(xiàn)延時,傳遞的過程中就理解了,所以能夠做到傳支一體的低延遲概念。
我們自己也做了一些原理性的實驗,就是用聲波傳遞視頻,大家知道聲波只能控制3Ppb,可以傳遞很好的視頻效果,第一個是原始圖像,第二個是實驗場景,第三個是傳統(tǒng)的編解碼,效果根本不行,第四個就是語義通訊做到的結(jié)果,所以從語義概念來講這是非常接近的,效果也是非常不錯的。
目前按照知識學(xué)習(xí)的角度來講,可以用很少的數(shù)據(jù)量學(xué)習(xí),最近我們也投了一些稿子,原來的只有1/10的數(shù)據(jù)量達到什么樣的識別率,這也是我們比較欣喜的方面,放在工業(yè)上作為應(yīng)用和協(xié)同,我們是正在做這項工作,這個時間還是比較短的,當(dāng)然還有一些抓取方面的工作。
以上就是和各位匯報用語義的概念來做傳支一體,希望將來能夠?qū)I(yè)生產(chǎn)線的變革起到一點作用。