必讀視頻專題飛象趣談光通信人工智能低空經濟5G手機智能汽車智慧城市會展特約記者

倪光南:發(fā)展“AI+機器人”,向新質生產力加速躍遷

2025年11月5日 07:49環(huán)球時報

當前,人工智能(AI)已經成為助推世界科技和產業(yè)蓬勃發(fā)展的強大引擎。習近平總書記指出:“以人工智能引領科研范式變革,加速各領域科技創(chuàng)新突破!秉h的二十屆四中全會提出,加快高水平科技自立自強,引領發(fā)展新質生產力。在這一目標的指引下,我國正在深入實施“人工智能+”行動。機器人產業(yè)作為一個新興產業(yè)、未來產業(yè),要順勢而為,聚焦提升生產力,通過AI+賦能,使機器人產業(yè)向新質生產力加速躍遷,成為“AI+機器人產業(yè)”,為國民經濟、為人民的生產生活,創(chuàng)造更大的經濟效益和社會效益。

發(fā)展機器人產業(yè)并不是要替代人類

我們要明白,機器人是拓展人類的能力完成任務,而不是替代人類。

人類大腦的起源和演化經歷了漫長而復雜曲折的過程。今天作為智人的我們,其繁盛興起得益于偶然性和在自然環(huán)境中的適應性。我們的祖先克服了其他類人物種沒能克服的困難,那時地球上的智人既不是最強壯的,不是行動最迅捷的,也不是數(shù)量最多的(螞蟻和磷蝦的數(shù)量要比人類多得多)。應當說,是龐大和復雜的大腦使我們有能力去適應和影響這個星球。

大腦是目前宇宙中最復雜的物質集合,其進化讓人類成為生物界中的最高級動物。Meta首席科學家、圖靈獎的獲得者楊樂昆教授在一次報告中提到,“一個典型的大語言模型大約是10的14次方字節(jié)信息量的基礎上訓練出來的,這幾乎是互聯(lián)網上所有公開文本的總和。一個人要花幾十萬年才能讀完這些材料,這是海量的信息。”但大模型僅僅依賴文本訓練是不夠的,我們還要繼續(xù)探究經過數(shù)億年進化的大腦的奧秘。生成式AI的出現(xiàn)預示著未來深層經濟結構的重塑,當我們謀劃發(fā)展機器人產業(yè)時,應當深刻地思考人和機器人之間的關系和變革,包括對知識工作的重新定義和勞動力結構的重塑,而不是簡單地以機器人大規(guī)模替代人類。為此,要聚焦提升生產力,通過AI+賦能,使機器人產業(yè)向新質生產力加速躍遷,讓機器人作為人類能力的擴展去高效完成任務,機器人帶來的將不是崗位的終結,而是工作任務的重構。

我們要研究不同工業(yè)化時期制造業(yè)的變化和機器人的定位。在不同工業(yè)化時期,對制造業(yè)而言工廠的定位是在變化的。德國提出了工業(yè)化4.0(即第四次工業(yè)革命),中國則處于從傳統(tǒng)工業(yè)化發(fā)展到新型工業(yè)化的階段。隨著人工智能引領的科技變革的推進,中國大多數(shù)企業(yè)將從自動化發(fā)展到智能化,生產模式將從剛性化、標準化,發(fā)展到柔性化、定制化兼?zhèn)洹?/P>

機器人將從過去自動化工具逐漸過渡到“AI+機器人”;機器人的控制者從過去的實時操作系統(tǒng)發(fā)展到“AI+機器人”智能系統(tǒng);自動化機器人交互用按鈕、鍵盤、鼠標、屏幕,“AI+機器人”可增加語音交互等;自動化機器人用人工編程,“AI+機器人”依賴大模型;自動化機器人在固定工位工作,“AI+機器人”是多工位自主移動工作;自動化機器人需要提前部署、調整、編程,“AI+機器人”將實現(xiàn)即插即用;自動化機器人是人機分工、難以互動,“AI+機器人”是人機協(xié)同、取長補短?傊癆I+機器人”是今后機器人的發(fā)展方向,機器人的形狀會多樣化,也許會根據(jù)場景需求以最經濟合理的方式完成具體任務。

機器人要用起來必須注重三大核心智能協(xié)同

從現(xiàn)有產業(yè)現(xiàn)狀著眼,中國機器人產業(yè)發(fā)展的關鍵是提升機器人智能等級。機器人的控制需要從過去“機器人操作系統(tǒng)”,發(fā)展到“機器人智能系統(tǒng)”。一般認為,三大核心能力支撐著機器人智能系統(tǒng):一是“眼睛”即機器人環(huán)境感知能力;二是“行動”即運動控制能力;三是“大腦”即交互決策能力。三者互相融合而又相對獨立,協(xié)同構成一個機器人智能系統(tǒng)。目前我國機器人產業(yè)對運動控制(“行動”)的投入較大,而對環(huán)境感知(“眼”)和交互決策(“腦”)的投入不足,迫切需要提升。

大語言模型構成了“機器人之腦”。機器人智能系統(tǒng)以“腦”為核心,基于大語言模型的“腦”推進了從“機器人操作系統(tǒng)” 到“機器人智能系統(tǒng)”的技術架構性變革。大語言模型帶來的是效率提高和工作流程的再設計,在大模型加持下,機器人能自主實施知識積累、接受指令、動作實施、人機交互等等。大模型將提供相應的工作流程,引導機器人完成各種任務。

AI+空間計算作為“機器人之眼”,開啟機器人認識世界的新范式。根據(jù)生物智能進化原理,眼睛是生物進化中智能的起點。機器人智能系統(tǒng)要突出“眼”的作用,以AI+空間計算作為機器人眼睛的支撐是適合的,能以“類人眼”方式采用普通單目攝像頭+神經網絡學習,預先對環(huán)境進行學習訓練,提升對物理世界的感知和理解,并具有自適應和持續(xù)學習能力,實現(xiàn)機器人睜開眼睛看世界,具有好用、易用、實用等特點。

空間計算作為一種面向三維世界的計算模式,正在重塑人類、機器和世界的交互方式,是推動機器人落地的關鍵核心技術之一。歷史上人機交互范式經歷了從電報、文字到語音、圖形、視頻等的發(fā)展,當前我們正從二維向三維新的交互范式轉變,空間計算是引領這種交互范式變革的重要技術支撐?臻g計算是對物理世界的“重構”,生成式AI并不能替代。今天生成式大語言模型的發(fā)展很快,但并不能覆蓋我們世界的全部。來自物理世界的數(shù)據(jù)復雜、模態(tài)多樣,目前大模型還不能輕易解析出視頻、動作、物理規(guī)則等等。

AI+空間計算的融合創(chuàng)新,有望打破物理世界和數(shù)字世界的界限,引領我們進入新的信息時代,是支撐低空經濟、機器人等產業(yè)發(fā)展的關鍵技術。它與傳統(tǒng)機器視覺的不同在于:它是采用AI+空間計算重構物理世界,而后者往往是基于多種物理硬件的疊加去看世界。

開源AGIROS支撐“機器人行動”,有助于機器人產業(yè)生態(tài)建設。AGIROS是由中國科學院軟件所支持、擬定為標準的開源機器人操作系統(tǒng)。其開源社區(qū)由中國科學院軟件所倡議發(fā)起,旨在通過凝聚機器人產學研用各方力量,全面推進智能機器人領域的開源開放、協(xié)同創(chuàng)新,為智能機器人產業(yè)夯實基礎。迄今為止,已有大批機器人領域的產學研用等單位和廣大開發(fā)者加入這一社區(qū)。

我們相信,借助開源的力量,AGIROS將大大增強AI+機器人的“腦、眼、行動”協(xié)同系統(tǒng)的競爭力,在全球機器人業(yè)界引領潮流,成為傳統(tǒng)機器人躍升為AI+機器人的主要推動力量。

構建“基于RISC-V架構的AI+機器人”生態(tài)系統(tǒng)

歷史上,信息技術領域出現(xiàn)過一些規(guī)模龐大的生態(tài)系統(tǒng),如“Wintel”“AA”,正在興起的還有“RV+OSS”,包括“RV+OpenHarmony”“RV+openKylin”等等,這些都是面向人類的信息技術生態(tài)。未來面向“AI+機器人”可能也會形成類似的生態(tài)系統(tǒng),例如本文討論的“基于RISC-V架構的AI+機器人” 那樣的生態(tài)系統(tǒng)(即RV芯片+腦、眼、行動智能系統(tǒng))。

我們希望中國機器人業(yè)界為這個生態(tài)作出更大貢獻,大家共同努力構建一個人機共融的世界,讓機器人成為我們能力的擴展,幫助人類實現(xiàn)所向往的美好生活。讓我們幫助機器人構建一個屬于它的智能系統(tǒng),來看見世界、理解世界、行動于世界。(作者是中國工程院院士)

編 輯:章芳
飛象網版權及免責聲明:
1.本網刊載內容,凡注明來源為“飛象網”和“飛象原創(chuàng)”皆屬飛象網版權所有,未經允許禁止轉載、摘編及鏡像,違者必究。對于經過授權可以轉載,請必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網來源。
2.凡注明“來源:XXXX”的作品,均轉載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網贊同其觀點和對其真實性負責。
3.如因作品內容、版權和其它問題,請在相關作品刊發(fā)之日起30日內與本網聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內容核實”、“商務聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
推薦閱讀

精彩視頻

精彩專題

關于我們廣告報價聯(lián)系我們隱私聲明本站地圖

CCTIME飛象網 CopyRight © 2007-2025 By CCTIME.COM

京ICP備08004280號-1 電信與信息服務業(yè)務經營許可證080234號 京公網安備110105000771號

公司名稱: 北京飛象互動文化傳媒有限公司

未經書面許可,禁止轉載、摘編、復制、鏡像