服務(wù)熱線
新一輪科技浪潮的推動(dòng)下,具身智能(Embodied Intelligence, EI)這一智能系統(tǒng)與物理實(shí)體相結(jié)合的科技創(chuàng)新產(chǎn)物,正悄然改變著世界。它不僅超越了單純的技術(shù)革命范疇,更預(yù)示著未來對人類生活方式、制造模式乃至社會(huì)結(jié)構(gòu)都將帶來一次深刻的重塑。
據(jù)不完全統(tǒng)計(jì),僅2024年上半年,關(guān)于具身智能的研討已多達(dá)500余次。來自不同領(lǐng)域的行業(yè)精英、產(chǎn)業(yè)高管、高校學(xué)者,都在試圖找到具身智能技術(shù)進(jìn)化的規(guī)律性與確定性。
盡管從2020年以來,斯坦福、伯克利、MIT、CMU、谷歌、微軟、亞馬遜、OpenAI、英偉達(dá)等眾多學(xué)者與企業(yè)家,對該領(lǐng)域的進(jìn)化路徑孜孜以求。但至今尚未找到機(jī)器人或具身智能的通用大模型Scaling Law。
盡管訓(xùn)練參數(shù)還在“無限”增加,這一現(xiàn)狀甚至不可避免地導(dǎo)致算力需要“無限”增加,能源也需要“無限”增加,相關(guān)大模型的單次訓(xùn)練成本已經(jīng)少則1千萬美元,多則接近上億美元。但大力并沒有出奇跡,諸如功能、安全、質(zhì)量以及實(shí)時(shí)性等關(guān)鍵指標(biāo)并沒有明顯提高。
一種對技術(shù)與供應(yīng)鏈迭代的“無力感”,在業(yè)界蔓延。7月22日,馬斯克在推特上宣布,特斯拉Optimus人形機(jī)器人二代因未能獲得高性價(jià)比的成熟供應(yīng)鏈支持,而推遲發(fā)布。據(jù)悉,這代機(jī)器人將自主設(shè)計(jì)全新雙手、FSD芯片等核心零部件,以便提高30%的行走速度、減輕10kg的重量,并將成本控制在1萬美元,售價(jià)控制在2萬美元左右。但供應(yīng)鏈因素直接導(dǎo)致了馬斯克的夢想,被延遲實(shí)現(xiàn)。
在中國,人形機(jī)器人也是熱鬧非凡,一級(jí)市場可落地產(chǎn)品尚待成熟,二級(jí)市場卻已率先上揚(yáng);人形樣機(jī)尚未明確具體的應(yīng)用場景,量產(chǎn)之路也大受供應(yīng)鏈掣肘,人形機(jī)器人的價(jià)格戰(zhàn)卻已打響。此外,隨著7月武漢蘿卜無人出租車在指定區(qū)域以低速模式嘗試商業(yè)化短途打車服務(wù),人們開始對未來社會(huì)的就業(yè)問題產(chǎn)生擔(dān)憂。
在這樣的背景下,“2024科技創(chuàng)變者大會(huì)”即將開啟。政產(chǎn)學(xué)研金多方力量的匯聚與助力,推動(dòng)了這次大會(huì)的籌備工作。在此我由衷地感謝北京市科委、中關(guān)村管委會(huì)各位領(lǐng)導(dǎo)的鼎力支持,還有海淀區(qū)、中關(guān)村科學(xué)城管委會(huì)以及東升鎮(zhèn)領(lǐng)導(dǎo)的竭力相助,感謝參與并貢獻(xiàn)智慧的各位知名大學(xué)院所頂級(jí)專家、奮斗在科研一線的青年科學(xué)家、大廠杰出的企業(yè)家、資深投資人、獨(dú)角獸企業(yè)的CEO以及初創(chuàng)企業(yè)的創(chuàng)變者們。
8月8日,期待與各界精英在北京中關(guān)村東升科技園萬麗酒店相聚一堂,聚焦《具身智能 產(chǎn)業(yè)智變新引擎》這一主題,圍繞具身智能如何實(shí)現(xiàn)高質(zhì)量發(fā)展并探索出一條有效的進(jìn)化路徑展開深入探討。以下為本次大會(huì)的核心議題與前置性思考:
什么是具身智能?它是未來社會(huì)的長期剛性需求嗎?它是推動(dòng)新質(zhì)生產(chǎn)力的重要引擎嗎?
沿著熱潮的方向出發(fā),你會(huì)發(fā)現(xiàn),當(dāng)下幾乎所有的困惑與糾結(jié)都聚焦在人形機(jī)器人身上。這個(gè)“笨手笨腳的家伙”距離能力爆發(fā)到底還要多久?人類還有沒有超級(jí)場景留給它?未來,真如馬斯克所言,全球?qū)⒂?00億臺(tái)套人形機(jī)器人的市場嗎?也許,將視野打開,答案也躍然紙上了。
我想,擁有智慧大腦的人形機(jī)器人,固然是具身智能的一種形態(tài)。但是具身智能并不局限于“AI+人形機(jī)器人”這一范疇,它同樣涵蓋“AI+通用機(jī)器人結(jié)構(gòu)”、“AI+高端制造裝備”等多種形式。
自1950年圖靈在其論文《計(jì)算機(jī)器與智能》中提出“非具身或具身智能”概念以來,具身智能這一概念逐漸被廣義理解為:智能系統(tǒng)通過物理實(shí)體(機(jī)器人、無人機(jī)、無人車、制造裝備甚至各類終端設(shè)備等)與環(huán)境互動(dòng)時(shí)所展現(xiàn)的一種智能能力。簡單理解,具身智能是生成式AIGC與機(jī)器人RT的融合,通過人機(jī)或環(huán)境交互,基于底層模型與數(shù)據(jù)驅(qū)動(dòng)的離線或在線感知學(xué)習(xí)、認(rèn)知判斷、智能控制等技術(shù),提升智能機(jī)器在本體層、環(huán)境層、任務(wù)層的人機(jī)交互、決策推理及操作行動(dòng)等智能化水平,并增強(qiáng)其適應(yīng)不同環(huán)境的泛化能力。
而具身智能突出的特點(diǎn)主要體現(xiàn)在兩個(gè)方面:一方面,它具備人機(jī)交互、自然語言理解與認(rèn)知能力,通過機(jī)器學(xué)習(xí)或大模型,讓機(jī)器按照人的意圖,將目標(biāo)分解系列化的子目標(biāo)或思維鏈,以完成相應(yīng)的復(fù)雜任務(wù);另一方面,具身智能可通過感知、認(rèn)知、決策,與時(shí)變環(huán)境及對象進(jìn)行實(shí)時(shí)校準(zhǔn)互動(dòng),在非結(jié)構(gòu)化的復(fù)雜環(huán)境中,它能夠?qū)崟r(shí)在線學(xué)習(xí)、識(shí)辨或修正補(bǔ)償時(shí)變環(huán)境。由此看來,只要把感知、學(xué)習(xí)、判斷和認(rèn)知能力有效嵌入到任何形態(tài)的硬件中,都可以被視為廣義上的具身智能。
將具身智能落地到服務(wù)、制造、商務(wù)等多元化的場景中,面對錯(cuò)綜復(fù)雜的動(dòng)態(tài)環(huán)境,我們進(jìn)而發(fā)現(xiàn)具身智能以其自主感知、快速?zèng)Q策、行動(dòng)與學(xué)習(xí)迭代的技術(shù)能力,展現(xiàn)出前所未有的靈活性和適應(yīng)性潛力。這不僅有望為傳統(tǒng)工業(yè)帶來新一輪革命性影響,更是未來社會(huì)的長期剛性需求。
在這個(gè)“布局未來”的過程中,具身智能領(lǐng)域的企業(yè)百花齊放,他們各自在奮斗與攻克中展現(xiàn)獨(dú)特風(fēng)采。有的專注于人形機(jī)器人的研發(fā),力求在人機(jī)交互、情感識(shí)別等方面取得突破;有的則深耕于高端制造裝備領(lǐng)域,通過優(yōu)化算法、提升精度和效率,推動(dòng)制造業(yè)的智能化升級(jí)。
從無人快遞車,到無人外賣車,再到如今的蘿卜快跑;從智能家電,到智能家居,再到智慧城市;從智能裝備,到智能制造,再到柔性供應(yīng)鏈……實(shí)際上,具身智能已經(jīng)潛移默化的深入到人類社會(huì)的方方面面。
但未來,隨著社會(huì)發(fā)展的不斷演進(jìn),一系列趨勢性變化凸顯了具身智能的長期剛性需求。由于人們不愿意從事單獨(dú)枯燥繁重甚至危險(xiǎn)勞動(dòng),同時(shí)智慧城市人口在不斷增加,這對工業(yè)制造的效率要求越來越高,社會(huì)化智能服務(wù)更是期待著更加便捷的模式出現(xiàn)。此外,老齡化社會(huì)的加劇將引發(fā)更為迫切的康養(yǎng)需求,搶險(xiǎn)救災(zāi)等高風(fēng)險(xiǎn)工作也亟待智能化的解決方案。從這樣的必然趨勢看,具身智能是長期的剛性需求。未來在工業(yè)制造、商業(yè)服務(wù)、家庭服務(wù)甚至國防軍事等方面,將具有廣泛的應(yīng)用市場。
基于上述分析,我愈發(fā)認(rèn)定:具身智能將成為未來新質(zhì)生產(chǎn)力的一個(gè)重要引擎。其將AIGC+RT兩者結(jié)合,極大的推動(dòng)了機(jī)器人、制造裝備、智能終端以及其大腦的進(jìn)一步進(jìn)化、泛化與遷移,有望將“一腦多機(jī)”與“一腦多型”的技術(shù)創(chuàng)想變?yōu)楝F(xiàn)實(shí)。我們相信,語言“認(rèn)知”世界,具身智能工具“改造”世界!它終將改變?nèi)?、工具、社?huì)三者之間的生產(chǎn)關(guān)系,極大提高生產(chǎn)力效率,這一變革不僅對促進(jìn)我國實(shí)體經(jīng)濟(jì)的高質(zhì)量增長發(fā)揮作用,更將對未來國際產(chǎn)業(yè)競爭格局與我國綜合新質(zhì)生產(chǎn)力的發(fā)展產(chǎn)生重大影響。
具身智能百花齊放,創(chuàng)新的熱點(diǎn)方向又有哪些?
盡管大模型在通用性和知識(shí)覆蓋廣度上擁有優(yōu)勢,但其泛化能力在某些特定場景的局限性依舊存在。疊加經(jīng)濟(jì)性、落地性等一系列現(xiàn)實(shí)問題,行業(yè)走向了多模態(tài)、專業(yè)化、輕量化的探索之路。
圍繞這些方面,近期領(lǐng)域內(nèi)的研究取得了多項(xiàng)引人注目的進(jìn)展。在法國,Mistral模型以70億參數(shù)擊敗了擁有130億參數(shù)的LLama模型,展示了參數(shù)效率的提升;在中國,面壁智能的MiniCPM模型以僅24億參數(shù)就達(dá)到了接近1750億參數(shù)GPT-3的性能水平,其背后的首席科學(xué)家——清華大學(xué)劉知遠(yuǎn)教授,更是提出“知識(shí)密度=模型能力/模型參數(shù)”的創(chuàng)新概念,強(qiáng)調(diào)模型效率的重要性。
此外,年輕科學(xué)家馬毅教授預(yù)告將在斯坦福大學(xué)主持召開“簡約與學(xué)習(xí)”的學(xué)術(shù)會(huì)議,聚焦于低維結(jié)構(gòu)的研究,這進(jìn)一步推動(dòng)AI模型向更加精簡、高效的方向發(fā)展。
而在7月30日的SIGGRAPH大會(huì)上,黃仁勛與扎克伯格的對話也聚焦于小模型或分段模型的應(yīng)用前景上。黃仁勛不僅展示了英偉達(dá)在具身智能領(lǐng)域的布局,還透露了由90后華人博士Jim Fan領(lǐng)導(dǎo)的具身智能實(shí)驗(yàn)室的研究成果:基于定義具身智能結(jié)構(gòu),感知環(huán)境、潛在學(xué)習(xí)完成技能等相互嵌入的動(dòng)態(tài)Agents思路。
另一方面,7月25日,斯坦福大學(xué)計(jì)算機(jī)系的李飛飛教授在短短三個(gè)月內(nèi)就完成了一個(gè)AI獨(dú)角獸企業(yè)的誕生,該企業(yè)利用“三維空間智能技”實(shí)現(xiàn)了機(jī)器對環(huán)境的理解與導(dǎo)航能力,通過模擬貓與桌子上玻璃杯等物體的空間、幾何及關(guān)系作用,探索了機(jī)器“看”與“做”的良性閉環(huán)。
7月29日,騰訊RoboticsX實(shí)驗(yàn)室張正友團(tuán)隊(duì)在《自然機(jī)器智能》(Nature子刊)封面發(fā)表了重要研究成果,該團(tuán)隊(duì)成功將生成式AI-Agent嵌入機(jī)器人智能控制系統(tǒng)中。在本體、環(huán)境、任務(wù)三個(gè)層面中,通過快速系統(tǒng)1處理90%的簡約感知、認(rèn)知和行動(dòng)決策,同時(shí)利用復(fù)雜認(rèn)知慢系統(tǒng)2進(jìn)行知識(shí)學(xué)習(xí)、歸納、推理及決策,實(shí)現(xiàn)了機(jī)器在本體、環(huán)境和任務(wù)三個(gè)層次上的高效協(xié)同。
伴隨著具身智能的發(fā)展,科學(xué)家們對規(guī)律的渴求還遠(yuǎn)不止于此。目前,盡管任務(wù)規(guī)劃的Scaling Law已有一定進(jìn)展,但環(huán)境空間和操作本體的Scaling Law仍處于探索階段。是堅(jiān)定不移?還是轉(zhuǎn)變路徑?雖沒有絕對答案,但我堅(jiān)信中國的工程師紅利即將在其中發(fā)揮作用。
甚至在不久的將來(3-5年),我們是不是就將見證一個(gè)全新的智能時(shí)代到來呢?那時(shí)候,API免費(fèi),AI服務(wù)80%由機(jī)器完成,20%通過人工對齊完成,通用的AI服務(wù)或產(chǎn)品會(huì)不會(huì)就像水、電、煤氣等基礎(chǔ)設(shè)施一樣,無處不在,觸手可得?當(dāng)終端客戶已經(jīng)不知道他所獲得的咨詢與解決方案來自哪個(gè)具體大模型公司時(shí),這又會(huì)引發(fā)科技創(chuàng)新領(lǐng)域中怎樣的連鎖反應(yīng)呢?
如今,科技創(chuàng)新的浪潮以前所未有的速度席卷全球,顯著縮短了從科研探索到商業(yè)應(yīng)用的周期。昔日需數(shù)十載方能達(dá)成的技術(shù)飛躍,如今幾年間甚至更短便能觸手可及。科技創(chuàng)新的加速,不僅體現(xiàn)在時(shí)間維度上,更體現(xiàn)在探索的深度與覆蓋的廣度上。當(dāng)多學(xué)科交叉融合成為新常態(tài),基礎(chǔ)科學(xué)、工程技術(shù)、經(jīng)濟(jì)學(xué)及人文社科等領(lǐng)域的深度融合,構(gòu)建了一個(gè)多元共生、相互推動(dòng)的創(chuàng)新生態(tài),驅(qū)動(dòng)著科技與產(chǎn)業(yè)不斷向前躍進(jìn)。新技術(shù)、新業(yè)態(tài)、新模式不斷涌現(xiàn),不僅為傳統(tǒng)產(chǎn)業(yè)注入創(chuàng)新活力,同時(shí)也催生了一批高技術(shù)含量、高附加值、高成長性的新興產(chǎn)業(yè),成為推動(dòng)未來經(jīng)濟(jì)發(fā)展的新引擎。
與此同時(shí),市場快速變化與競爭也在日益激烈。面對挑戰(zhàn),小微企業(yè)需要聚焦于細(xì)分領(lǐng)域,深耕細(xì)作,以“專精特新”為路徑,鍛造核心競爭力;而大型企業(yè)則可依托資源優(yōu)勢,構(gòu)建平臺(tái)型或鏈主型生態(tài)系統(tǒng),整合上下游資源,實(shí)現(xiàn)規(guī)模效應(yīng)與協(xié)同效應(yīng)的雙贏,穩(wěn)固市場領(lǐng)先地位。
另一方面,具身智能領(lǐng)域的“行業(yè)依附性”特點(diǎn),又將深入挖掘應(yīng)用場景的價(jià)值提到了更重要的位置上。技術(shù)創(chuàng)新,只有與產(chǎn)業(yè)需求緊密結(jié)合,才能推動(dòng)具身智能產(chǎn)品的不斷升級(jí)。這一過程不僅是技術(shù)的精進(jìn),更是對市場需求的精準(zhǔn)把握與快速響應(yīng)。同時(shí),具身智能形態(tài)作為未來發(fā)展的重要趨勢,其確立對于企業(yè)的長遠(yuǎn)發(fā)展具有關(guān)鍵意義。通過場景資源、融資資源等多方資源的交叉融合與螺旋式迭代發(fā)展,方能避免“醒得早,起得晚”的遺憾,防止在時(shí)代的洪流中被邊緣化甚至淘汰。
回望歷史長河,每一次科技的里程碑式突破,都無可避免地伴隨著質(zhì)疑的眼光和挑戰(zhàn)的洗禮。數(shù)百年前,世界第一艘輪船“克萊蒙特號(hào)”在眾人懷疑的目光中入水,它搖搖晃晃地模樣仿佛隨時(shí)都會(huì)淪為笑柄。然而,正是這份“不在乎他人眼光”的探索精神,讓人類得以跨越海洋的阻隔。
在眼前的具身智能浪潮中,顛覆傳統(tǒng)、重塑未來的歷史再次上演。我無比相信:擁抱變革,穿越周期,堅(jiān)定信念的創(chuàng)變者們,終將是這次浪潮的贏家!
讓我們懷揣著對具身智能的美好期待,在8月8日的“2024科技創(chuàng)變者大會(huì)”上,不見不散。