?恒立佳創(chuàng):物理AI時代來臨,英偉達Cosmos平臺機器訓練
北京時間 2025 年 1 月 7 - 10 日,在全球科技盛會 CES2025 于美國拉斯維加斯盛大舉辦之際,英偉達 CEO 黃仁勛的開幕主題演講,無疑成為了機器人領(lǐng)域的焦點。此次演講,英偉達在機器人技術(shù)方面釋放出諸多重磅信息,為整個人形機器人產(chǎn)業(yè)的發(fā)展帶來了新的契機與方向。
黃仁勛在演講中推出了名為 Cosmos 的生成式世界基礎(chǔ)模型開發(fā)平臺,這一平臺的誕生,可謂是機器人領(lǐng)域的一次重大突破。與之相伴的 “物理人工智能” 概念,更是為機器人的訓練與發(fā)展開辟了全新路徑。Cosmos 平臺能夠生成高質(zhì)量合成數(shù)據(jù),這些數(shù)據(jù)對于訓練機器人和自動駕駛系統(tǒng)至關(guān)重要。
在實際應(yīng)用中,Cosmos 模型展現(xiàn)出了強大的功能。它可依據(jù)文本、圖像、視頻等多種輸入組合,以及機器人傳感器或運動數(shù)據(jù),生成基于物理學的視頻。這意味著,通過該模型,機器人在模擬環(huán)境中能夠更為真實地模擬物體的運動和相互作用。例如,在模擬的工業(yè)環(huán)境如倉庫或工廠中,以及各種復(fù)雜的駕駛環(huán)境里,Cosmos 模型生成的虛擬場景高度逼真,使得機器人能夠在其中進行貼近現(xiàn)實的訓練。同時,Cosmos 模型與 Omniverse 的協(xié)作,進一步為開發(fā)人員提供了極大的便利。開發(fā)人員能夠借此更輕松地生成大量可控且逼真的合成數(shù)據(jù),構(gòu)建出符合物理規(guī)律的虛擬世界,進而打造出更為完善的 “物理人工智能” 機器人系統(tǒng)。
值得一提的是,Cosmos 模型具有三個不同版本,分別為 Nano、Super 和 Ultra。Nano 版本約 150 億參數(shù),具有較低延遲的特點,非常適合在邊緣端設(shè)備進行部署,能夠滿足一些對實時性要求較高的場景需求。Super 版本擁有 340 億參數(shù),作為高性能基線模型,支持開箱即用的微調(diào)與部署,為開發(fā)人員提供了便捷的開發(fā)基礎(chǔ)。Ultra 版本參數(shù)約 700 億,在準確度和質(zhì)量方面達到比較高水平,適用于大規(guī)模數(shù)據(jù)中心場景,能夠處理更為復(fù)雜和龐大的任務(wù)。這些模型經(jīng)過了海量數(shù)據(jù)的訓練,高達 18000 萬億次 tokens 的訓練數(shù)據(jù),其中包含 2000 萬小時的真實世界自動駕駛、機器人、無人機鏡頭以及合成數(shù)據(jù),通過如此大規(guī)模的訓練,使得 AI 能夠更好地理解物理世界。
目前,人形機器人在平衡和運動能力方面已普遍達到較為成熟的階段。然而,行業(yè)進一步發(fā)展并實現(xiàn)大規(guī)模放量的關(guān)鍵瓶頸,在于訓練,尤其是提升機器人的能力泛化訓練。傳統(tǒng)的通過人類演示獲取真實世界數(shù)據(jù)的方式,不僅成本高昂,而且高質(zhì)量的機器人運動素材極為稀缺。而英偉達的 Cosmos 模型恰恰針對這一痛點,幫助開發(fā)者生成指數(shù)級規(guī)模的合成運動數(shù)據(jù),為解決這一難題提供了有效途徑,有望開啟機器人物理 AI 時代的新篇章。
鑒于目前人形機器人產(chǎn)業(yè)的發(fā)展現(xiàn)狀,我們?nèi)詫?2025 年定義為人形機器人的能力成熟之年。在這一年,期望通過大規(guī)模的場景部署,實現(xiàn)訓練素材的大量富集,并將這些素材反饋至機器人能力端,從而進一步提升機器人的性能。英偉達的生成式開發(fā)平臺,無疑為達成這一目標提供了有力支持,有望大幅提升人形機器人的訓練效率,助力人形機器人產(chǎn)業(yè)走向成熟。
基于以上分析,我們堅定看好人形機器人產(chǎn)業(yè)的未來發(fā)展。立足當前硬件技術(shù)路線以及各廠商的實際進展,相信在英偉達等科技巨頭的推動下,人形機器人產(chǎn)業(yè)將迎來更加輝煌的發(fā)展階段。
(恒立佳創(chuàng)是恒立集團在上海成立的一站式客戶解決方案中心,旨在為客戶提供恒立全球12個生產(chǎn)制造基地生產(chǎn)的液壓元件、氣動元件、導軌絲桿、密封件、電驅(qū)電控、精密鑄件、無縫鋼管、傳動控制與系統(tǒng)集成等全系列產(chǎn)品的技術(shù)支持與銷售服務(wù)。)