時(shí)間:2021-09-24
2021世界機(jī)器人大會(huì)第一天線下主論壇——“領(lǐng)航峰會(huì)”群星璀璨,產(chǎn)、學(xué)、研各領(lǐng)域大咖齊聚首,共話巔峰,為機(jī)器人未來發(fā)展領(lǐng)航。
峰會(huì)現(xiàn)場(chǎng),世界工程組織聯(lián)合會(huì)主席、中國(guó)電子學(xué)會(huì)副理事長(zhǎng)龔克上臺(tái)發(fā)言,演講主題為《新趨勢(shì):AI+機(jī)器人》。以下為龔克副理事長(zhǎng)演講內(nèi)容全文整理。
各位老師、各位同事、各位朋友,大家上午好!我的標(biāo)題還有一個(gè)副標(biāo)題“門外漢的思考”,王天然老師是真正門內(nèi)的,我只是門外漢。人工智能發(fā)展戰(zhàn)略研究院是中國(guó)工程院和天津市合作在南開大學(xué)的一個(gè)智庫機(jī)構(gòu),就是研究戰(zhàn)略的,不是研究具體技術(shù)。2017年國(guó)務(wù)院發(fā)布的《新一代人工智能發(fā)展規(guī)劃》是一個(gè)中長(zhǎng)期規(guī)劃,時(shí)間是2017年到2030年,我們觀察的是規(guī)劃進(jìn)展過程中有什么問題,特別關(guān)注和實(shí)體經(jīng)濟(jì)的結(jié)合是怎樣的,所以中間也會(huì)涉及到工業(yè)和機(jī)器人。前面的幾位發(fā)言者都認(rèn)同一個(gè)趨勢(shì),就是AI和Robot的結(jié)合,王耀南和John Hennessy都有談到這一點(diǎn),下面我談一談我的看法。
趨勢(shì)是一個(gè)時(shí)間軸的概念,按照總書記的話來講,社會(huì)發(fā)展史上人類經(jīng)歷了農(nóng)業(yè)革命、工業(yè)革命,正在經(jīng)歷信息革命。我們現(xiàn)在說的智能化其實(shí)是信息革命的一個(gè)階段,信息自古就有,信息革命是從數(shù)字化開始發(fā)動(dòng)起來的,網(wǎng)絡(luò)化將其提升到了一個(gè)非常重要的階段,現(xiàn)在進(jìn)入一個(gè)新的階段就是智能化階段,我認(rèn)為這是信息化革命中的一個(gè)新的階段。信息革命和工業(yè)革命有什么不一樣呢?工業(yè)革命是拓展人類的體力,信息革命則是增強(qiáng)人類的腦力。機(jī)器人最早出來也是解決體力問題的,因?yàn)闄C(jī)器本來就是解決體力問題的,但機(jī)器人是從解決體力加上腦力融合起來。機(jī)器人從剛開始就是有一點(diǎn)智能的,現(xiàn)在只不過智能化的水平處于提高階段,剛開始要是一點(diǎn)智能沒有的話就是一個(gè)機(jī)器,只是Machine而不是Robot,Robot就是帶有一點(diǎn)智能的。
那么智能化是誰在推動(dòng)呢?人工智能是引領(lǐng)這一輪科技產(chǎn)業(yè)變革的戰(zhàn)略性技術(shù),具有溢出性、帶動(dòng)性很強(qiáng)的頭雁效應(yīng),這句話是習(xí)近平總書記說的,代表我們國(guó)家對(duì)智能化的重要判斷。什么是AI呢?其實(shí)AI有不同的概念,我的理解是分為人工和智能兩個(gè)方面:智能是經(jīng)濟(jì)學(xué)習(xí)形成的一個(gè)自主的感知、認(rèn)知和決策能力,感知和決策能力沒有問題,但我特意加上這是學(xué)習(xí)形成的。一個(gè)孩子生下來哪怕大腦特別發(fā)達(dá),如果不讓孩子學(xué)習(xí),關(guān)起來只吃飯,那不會(huì)有什么智能。人工智能就在于這個(gè)智力是依托于一個(gè)人工設(shè)計(jì)的裝置,通過人工設(shè)計(jì)的算法、人工直接或者間接提供的數(shù)據(jù)進(jìn)行學(xué)習(xí)。目前這個(gè)裝置運(yùn)用得越來越多,就是Robot,智能要在這個(gè)裝置上發(fā)揮作用。
這些年來人工智能的研究不斷增長(zhǎng),今年早些時(shí)候我們做了統(tǒng)計(jì),2018年以來不斷增長(zhǎng),這些研究論文涉及到的應(yīng)用領(lǐng)域也在不斷拓展。新一代人工智能有幾個(gè)關(guān)鍵技術(shù),大數(shù)據(jù)智能、群體智能、人機(jī)混合智能、自主無人智能、跨媒體智能都在向前發(fā)展,而這些在發(fā)展的過程中要解決人工智能發(fā)展的幾個(gè)瓶頸問題。John Hennessy剛才特別強(qiáng)調(diào)機(jī)器學(xué)習(xí)要依賴大量的數(shù)據(jù)和大量的算力,數(shù)據(jù)的可用性和質(zhì)量問題就是現(xiàn)在新一代人工智能面臨的第一個(gè)大的問題。大量數(shù)據(jù)的獲得不是那么容易的,目前Infinite Net大概有5000個(gè)圖在上面,每個(gè)Object都有很多的圖,這些都是互聯(lián)網(wǎng)搜集起來的,而且是眾包的形式做了標(biāo)注,有的時(shí)候上一個(gè)軟件可以識(shí)別哪個(gè)是貓、哪個(gè)圖里有燈桿,其實(shí)都是幫他們?cè)谧鲞@個(gè)圖的標(biāo)注。一般的企業(yè)沒有那種能力獲得這么大量的數(shù)據(jù),花不起那樣的成本去做這種標(biāo)注,甚至由于數(shù)量特別大,用的算力也特別大,所以這是我們碰到的第一個(gè)特別重大的瓶頸。
剛才John Hennessy提到能量的瓶頸,人類折算成功率的話大約是20W,機(jī)器至少是它的1000倍,就是現(xiàn)在我們用的機(jī)器學(xué)習(xí),李世石和Alpha-Go下棋的時(shí)候,Alpha-Go是花了3000美元的電費(fèi),可想而知電量有多大。目前我們?cè)谶@方面已經(jīng)有了一定進(jìn)展,比如TB3自然語言的預(yù)訓(xùn)練模型,利用大量數(shù)據(jù)、大量算力,由我們主要的平臺(tái)企業(yè)事先訓(xùn)練好,這些是關(guān)于自然語言處理的模型,可以達(dá)到人類的程度,有了這個(gè)模型以后就是開源的,去年8月份這個(gè)模型完全開源,我們現(xiàn)在做自然語言處理的這些公司就可以在開源的基礎(chǔ)上利用特殊場(chǎng)景的特殊語音資料做詳細(xì)說明,比如加上云南話和廣東話,那么就不需要特別大的數(shù)據(jù)量、特別大的計(jì)算量。去年北京元智研究所的清華團(tuán)隊(duì)發(fā)表了比這個(gè)參數(shù)還要大的模型,達(dá)到1750億個(gè)參數(shù),也就是175GB的參數(shù),任何一個(gè)復(fù)雜函數(shù)可以用無窮多的簡(jiǎn)單函數(shù)的級(jí)數(shù)精確進(jìn)行模擬,這個(gè)無窮多就是參數(shù),只要參數(shù)足夠多就可以足夠逼近,但這里計(jì)算量和代價(jià)非常大,有了預(yù)渲染模型門檻就可以降低。
算法需要加速,過去我們說計(jì)算機(jī)是CPU的天下,但這次人工智能計(jì)算就讓CPU有些不適應(yīng),因?yàn)槿斯ぶ悄艿拇罅坑?jì)算都是處理圖形,用不著CPU那么多邏輯的計(jì)算,用的是矢量和向量計(jì)算,所以就出現(xiàn)向量計(jì)算的GPU,Google還有Tensor Processing張量計(jì)算,包括NPU神經(jīng)網(wǎng)絡(luò)計(jì)算,這些新的硬件的產(chǎn)生不僅加速了計(jì)算的速度,而且降低了計(jì)算的能耗,使其有很大的進(jìn)展。因?yàn)檫@是一個(gè)新的藍(lán)海,所以在這里,我國(guó)有些企業(yè)比如寒武紀(jì)和華為就打破了原來在CPU長(zhǎng)期形成的壟斷性的英特爾一統(tǒng)天下,日本做了很多CPU都撼動(dòng)不了,但這次硬件加速器有了新的進(jìn)展。
目前也有出現(xiàn)一些新的算法,自動(dòng)駕駛系統(tǒng)是一個(gè)非常復(fù)雜的機(jī)器人系統(tǒng),去年有一個(gè)重要的研究成果發(fā)表就是來自MIT維也納工業(yè)大學(xué)、奧地利科技學(xué)院的團(tuán)隊(duì)用19個(gè)類腦神經(jīng)元實(shí)現(xiàn)了控制自動(dòng)駕駛汽車,替代了數(shù)百萬個(gè)神經(jīng)元,使得計(jì)算量大大下降,能耗也大大下降,這在去年10月份的《自然》雜志發(fā)表。目前我們將其叫做ANN就是Artificial Neural Network,SNN是Spiking Neural Network,相當(dāng)于一個(gè)脈沖,現(xiàn)在輸入進(jìn)來的是實(shí)數(shù),各個(gè)層次中間傳輸?shù)臋?quán)重也都是實(shí)數(shù),脈沖的話涉及到到達(dá)時(shí)間,這個(gè)時(shí)候權(quán)重就可能會(huì)帶上延時(shí),也是和人腦的情況更加接近,所以這是類腦神經(jīng)元。其實(shí)SNN最早出現(xiàn)和CNN幾乎是同時(shí)的,之所以在過去那些年沒有能夠做得這么好,主要是以CPU為主的計(jì)算機(jī)不適合計(jì)算SNN的網(wǎng)絡(luò),現(xiàn)在我們有了新的網(wǎng)絡(luò)以后就起來了。
圖中是中國(guó)人做的一項(xiàng)很重要的工作,去年在《Nature》發(fā)表,就是清華大學(xué)儀器系團(tuán)隊(duì)做的芯片,也是使用了SNN,現(xiàn)在是自行車在跟隨、避障、轉(zhuǎn)彎、加速,跟隨人的速度,這些就是使用SNN和ANN融合的芯片,28×28毫米的大小。有的人說一輛自行車不用這么復(fù)雜,沒錯(cuò),不用SNN也可以平衡這個(gè)自行車,并不是說只有它才能平衡自行車,但我們用原有的人工神經(jīng)網(wǎng)絡(luò)做平衡自行車和現(xiàn)在芯片上實(shí)現(xiàn)ANN和SNN的結(jié)合,上限是什么樣子?恐怕將來就不是控制SNN,可以做得更好,所以這個(gè)叫做Dual Control,這是最重要的,自行車并不是那么重要。
類腦計(jì)算把SNN引進(jìn)以后,由于這種特點(diǎn),過去的幾年一直跟硬件的設(shè)計(jì)是緊密聯(lián)系在一起的,所以總是做一個(gè)軟硬結(jié)合的設(shè)計(jì),缺少通用性,也是去年發(fā)表了一篇比較重要的文章,又是清華大學(xué)的團(tuán)隊(duì),這個(gè)團(tuán)隊(duì)是計(jì)算機(jī)團(tuán)隊(duì),也是和機(jī)械學(xué)院的團(tuán)隊(duì)緊密結(jié)合,提出一個(gè)理論就是類腦計(jì)算的完備性。現(xiàn)在我們做CPU計(jì)算的時(shí)候不會(huì)擔(dān)心寫一個(gè)程序CPU執(zhí)行不了,因?yàn)槭褂玫某绦蚨际蔷哂型陚湫缘某绦颍珻PU是具有完備性的硬件,總是可以執(zhí)行的,效率可能高也可能低,但是可以執(zhí)行,不會(huì)覺得某個(gè)軟件硬件不能執(zhí)行,前期的類腦計(jì)算就有這個(gè)問題,必須和硬件緊密結(jié)合設(shè)計(jì)。這個(gè)團(tuán)隊(duì)中間提出了一個(gè)編譯層,現(xiàn)在的計(jì)算機(jī)把軟件和硬件分開的中間就是編譯層,《自然》雜志評(píng)價(jià)說完備性新概念推動(dòng)類腦計(jì)算,對(duì)類腦系統(tǒng)存在的軟硬件緊耦合的問題是一個(gè)突破性的方案,我們認(rèn)為這是AI近幾年比較重要的進(jìn)展。
除了這些以外還有一個(gè)重要進(jìn)展,就是使用新器件,叫做相變存儲(chǔ)器。我們說神經(jīng)網(wǎng)絡(luò)計(jì)算反復(fù)調(diào)整的是什么呢?就是輸出,本來應(yīng)該是貓,但輸出的不是貓,看一看跟貓有多少差距,然后是Backwards Propagation,反向調(diào)整的過程非常耗時(shí)耗力,通過隨機(jī)調(diào)整函數(shù)使得能量和效率大大提高。這是北大去年做的工作,去年發(fā)表出來以后也非常有影響。
我們看到無論是算法、理論、硬件和基礎(chǔ)器件,這些年都有重要的進(jìn)步,盡管還沒有達(dá)到最終突破的階段。一方面是幾個(gè)關(guān)鍵技術(shù),另一方面是幾個(gè)瓶頸問題,新一代的人工智能器件正在向前發(fā)展,使得功能更強(qiáng)、效率更高,也有出現(xiàn)ANN、SNN結(jié)合這樣的新體系。
我們從產(chǎn)業(yè)上可以看到什么呢?過去三年我們研究院一直選擇以人工智能的解決方案為主業(yè)的企業(yè),去年有2205家,我們來看這些企業(yè)的資金是哪里來的,如果投資的話到哪里去,就是一進(jìn)一出兩條線,可以連接到投資者和被投資者,同時(shí)也要看人才是哪里來的,要是跳槽的話到哪里去,所以根據(jù)資金、技術(shù)和人才關(guān)系聯(lián)系到背后有200多家大學(xué)、100多個(gè)研究所,參加1000多個(gè)會(huì)議,涉及到400多個(gè)聯(lián)盟,3741家投資者,地級(jí)以上政府的500多條政策,涉及到1000多個(gè)地級(jí)以上政府產(chǎn)業(yè)園,連成一個(gè)密密麻麻的圖,我們叫做價(jià)值網(wǎng)絡(luò)圖。
過去三年中我們看到了什么呢?2018年連接度最高的是BAT三個(gè)平臺(tái),也是在這里起著非常明顯的重要作用,華為就已經(jīng)突出出來了,富士康也突出出來了,我們從這張圖可以看到和實(shí)體經(jīng)濟(jì)的結(jié)合越來越緊密,一些原來不是以這個(gè)為主業(yè)的企業(yè),由于采用人工智能技術(shù)正在其中起到越來越重要的作用,希望將來新松也可以在里面扮演一個(gè)非常重要的角色。
我們?cè)谛乱淮斯ぶ悄艿睦碚?、方法、器件的基礎(chǔ)上,五大技術(shù)都在向前發(fā)展,加上智能基礎(chǔ)設(shè)施建設(shè)、人才、法律、政策標(biāo)準(zhǔn),我們正在構(gòu)建一個(gè)智能社會(huì)。
剛才說的是AI,再來說一說Robot。為什么要關(guān)心Robot?我們研究院提出培育高端高效的智能經(jīng)濟(jì),主要是四條:大力發(fā)展人工智能的新興產(chǎn)業(yè),包括智能軟硬件、物聯(lián)網(wǎng)傳感器、智能終端、虛擬現(xiàn)實(shí)、智能運(yùn)載和智能機(jī)器人,其中對(duì)智能機(jī)器人專門有一段規(guī)劃的描述,這是導(dǎo)致我們關(guān)心智能機(jī)器人發(fā)展情況的一個(gè)原因。大力發(fā)展智能產(chǎn)業(yè),其中特別提出智能制造,總書記在兩院大會(huì)上的講話就提到要以智能制造為主攻方向促進(jìn)人工智能技術(shù)和實(shí)體經(jīng)濟(jì)的結(jié)合,而在智能制造中智能機(jī)器人又變成非常重要的角色。我們認(rèn)為智能機(jī)器人和智能制造是工業(yè)和人工智能緊密結(jié)合的一條主線。
什么是機(jī)器人?我其實(shí)是非常困惑的,我是1970年進(jìn)工廠當(dāng)車工,直到1978年3月上大學(xué),干了將近八年的車工,我們的車間基本上就是五六種產(chǎn)品,年復(fù)一年、日復(fù)一日,一天三班倒地干活,所以當(dāng)時(shí)我看卓別林的《摩登時(shí)代》特別有同感。當(dāng)時(shí)說的是資本主義把人變成機(jī)器,我想社會(huì)主義好像人也和機(jī)器差不多,整天重復(fù)做這種勞動(dòng),所以我最早理解的機(jī)器人是一個(gè)像機(jī)器那樣工作的人,后來我才知道機(jī)器人恰恰是讓人重新成為人,發(fā)展更好的東西讓人還原成人,而不是像機(jī)器那樣簡(jiǎn)單地干活。八十年代初我出國(guó)留學(xué),拿到ARV的獎(jiǎng)學(xué)金,然后有一次讓我們這些外國(guó)留學(xué)生報(bào)名參加自動(dòng)化工廠,我覺得這樣很好,這是一個(gè)機(jī)器人車間,當(dāng)時(shí)我就提出第一個(gè)問題,機(jī)器人在哪里?他們說這就是機(jī)器人,我一下子才明白,機(jī)器人不是像人一樣的,這些就叫機(jī)器人。
ISO對(duì)機(jī)器人的定義是什么呢?工業(yè)機(jī)器人是一種具有自動(dòng)控制、操作、移動(dòng)功能,完成各種作業(yè)可編程的操作機(jī),所以機(jī)器人不是人,是工具,因此才叫做Robot,特別是疫苗機(jī)器人最好叫做智能化醫(yī)療機(jī)械,不然醫(yī)生覺得聽著不是很順,好像要代替他們。
人工智能會(huì)出現(xiàn)什么問題呢?剛才說過圍欄式生產(chǎn),最早機(jī)器人不是圍欄式的,因?yàn)槌隽艘馔馐鹿试斐闪怂劳?,所以有能力之憂,到底能不能可靠、安全、穩(wěn)定、敏捷、精確、靈活地完成各種各樣不同的任務(wù),協(xié)同起來完成任務(wù),高能效、零碳排地完成各種任務(wù),能不能保證受控,此外還有對(duì)成本的擔(dān)憂,對(duì)造成人的失業(yè)的擔(dān)憂,以及會(huì)不會(huì)把我們?nèi)祟惤o滅了。就像以前捷克的主席說要到我們那里開會(huì),就說我們是機(jī)器人的故鄉(xiāng),我說Robota是什么意思?他說最開始是干重體力勞動(dòng)的奴隸,我說機(jī)器干的其實(shí)就是這個(gè),而且干得特別好。
要想解決這些問題,機(jī)器人需要增智,提高智力發(fā)育,但增智有一個(gè)前提,就是必須上網(wǎng),不上網(wǎng)就沒有大數(shù)據(jù),沒有大數(shù)據(jù)就很難和人工智能結(jié)合,而且還要立德,就是要有道德,我們現(xiàn)在要把這種倫理植入系統(tǒng),做到可檢測(cè)、可檢驗(yàn),不只是寫在紙上的。
要想做到二者結(jié)合,信息技術(shù)和制造技術(shù)深度結(jié)合,原來信息工業(yè)化本來說的就是這些,這種融合體現(xiàn)在體現(xiàn)在以機(jī)器人為載體,以工業(yè)互聯(lián)網(wǎng)為基礎(chǔ),進(jìn)入制造業(yè)互聯(lián)網(wǎng),新一代人工智能和實(shí)體經(jīng)濟(jì)深度融合。
這條曲線是大家都比較熟悉的,左邊講的是人,縱軸是智力,橫軸是環(huán)境,小的時(shí)候智力很小,隨著年齡增長(zhǎng)可以達(dá)到很高的智力水平,智能機(jī)械的智力在一個(gè)確定的環(huán)境下可以達(dá)到越來越接近人的智力,如果環(huán)境越來越開放、越來越不受控的話,各種智能機(jī)的智力就越來越下降。
人是怎么智力增長(zhǎng)的呢?不是隨著歲數(shù)簡(jiǎn)單增長(zhǎng),而是在這個(gè)過程中實(shí)踐學(xué)習(xí),通過經(jīng)驗(yàn)逐漸增長(zhǎng),現(xiàn)在我們的智力系統(tǒng)就是通過引入學(xué)習(xí),也在破這條逐漸下降的曲線,逐漸能夠適應(yīng)各種不同的工作環(huán)境,那么就需要這樣一個(gè)增長(zhǎng)。
還有一個(gè)問題就是人機(jī)共融,機(jī)器本體的行為能力需要加強(qiáng),需要更加敏捷,同時(shí)智能技術(shù)、智能水平要匹配人的水平,行為水平也要匹配人的水平,這樣才能跟人協(xié)同,如果機(jī)械動(dòng)作可以匹配人,但智力不如人的話就不行,有的時(shí)候可能會(huì)出事故,或者只是智力達(dá)到了人,但動(dòng)作特別不好的話也很難和人協(xié)同。
傳統(tǒng)的人工智能技術(shù)是做問題求解、定理證明、模式識(shí)別,就是專家智能、人機(jī)博弈,是在一個(gè)非行為空間起作用,也有確定性的因素和規(guī)則下的推理,現(xiàn)在我們正在突破。Robot是有行為能力,就是需要?jiǎng)拥?,約束條件有非預(yù)知性和動(dòng)態(tài)性,操作和合作對(duì)象可能也存在隨機(jī)性,這個(gè)時(shí)候就要實(shí)時(shí)魯棒,這跟傳統(tǒng)人工智能是有差別的,我們就需要人工智能向前發(fā)展,讓機(jī)器人的智能發(fā)育和人工智能的發(fā)展相互配合起來。
這些是我們學(xué)校的研究工作,實(shí)際上要求類人的人工智能形成一個(gè)研究發(fā)育機(jī)理,包括研究對(duì)意圖的理解和行為決策能力,就是讓人工智能和機(jī)器人相向而行,共同支撐我們的智能制造,實(shí)現(xiàn)人工智能和實(shí)體經(jīng)濟(jì)的深度融合。
以上就是我對(duì)這些趨勢(shì)的理解,不對(duì)的地方請(qǐng)大家批評(píng)指正。