Sora到底懂不懂物理世界? AI視頻生成引發(fā)行業(yè)震驚
Sora最近很火爆,AI視頻生成讓行業(yè)內(nèi)發(fā)生了很大變動,對于Sora已經(jīng)有不少業(yè)內(nèi)的大佬開始激烈探討,想要了解Sora到底懂不懂物理世界,那么大家可以看看下方游戲鳥小編帶來的最新資訊,方便大家更好的了解哦。
Sora到底懂不懂物理世界
Sora 到底是不是物理引擎甚至世界模型?圖靈獎得主 Yann LeCun、Keras 之父 Francois Chollet 等人正在深入探討。
最近幾天,OpenAI 發(fā)布的視頻生成模型 Sora 成了全世界關(guān)注的焦點。
【關(guān)注機(jī)器之心視頻號,第一時間看到有趣的 AI 內(nèi)容】
和以往只能生成幾秒鐘視頻的模型不同,Sora 把生成視頻的長度一下子拉長到 60 秒。而且,它不僅能了解用戶在 Prompt 中提出的要求,還能 get 到人、物在物理世界中的存在方式。
以經(jīng)典的「海盜船在咖啡杯中纏斗」為例。為了讓生成效果看起來逼真,Sora 需要克服以下幾個物理難點:
規(guī)模和比例的適應(yīng):將海盜船縮小到能夠在咖啡杯中纏斗的尺寸,同時保持它們的細(xì)節(jié)和結(jié)構(gòu),是一個挑戰(zhàn)。AI 需要理解和調(diào)整這些對象在現(xiàn)實生活中的相對尺寸,使得場景在視覺上顯得合理;
流體動力學(xué):咖啡杯中的液體會對海盜船的運動產(chǎn)生影響。AI 模型需要模擬液體動力學(xué)的效果,包括波浪、濺水和船只移動時液體的流動,這在計算上是復(fù)雜的;
光線和陰影的處理:為了使場景看起來真實,AI 需要精確地模擬光線如何照射在這個小型場景中,包括咖啡的反光、船只的陰影,以及可能的透光效果;
動畫和運動的真實性:海盜船的運動需要符合真實世界的物理規(guī)律,即使它們被縮小到咖啡杯中。這意味著 AI 需要考慮到重力、浮力、碰撞以及船體結(jié)構(gòu)在動態(tài)環(huán)境中的行為。
雖然生成效果還有些瑕疵,但我們能明顯感覺到,Sora 似乎是懂一些「物理」的。英偉達(dá)高級研究科學(xué)家 Jim Fan 甚至斷言,「Sora 是一個數(shù)據(jù)驅(qū)動的物理引擎」,「是一個可學(xué)習(xí)的模擬器,或『世界模型』」。
部分研究者同意這樣的觀點,但也有不少人反對。
Yann LeCun:生成視頻的過程與基于世界模型的因果預(yù)測完全不同
圖靈獎得主 Yann LeCun 率先亮明觀點。在他看來,僅僅根據(jù) prompt 生成逼真視頻并不能代表一個模型理解了物理世界,生成視頻的過程與基于世界模型的因果預(yù)測完全不同。
他接著講到,模型生成逼真視頻的空間非常大,視頻生成系統(tǒng)只需要產(chǎn)生一個合理的示例就算成功。不過對于一個真實視頻而言,其合理的后續(xù)延續(xù)空間卻非常小,生成這些延續(xù)的代表性片段,特別是在特定行動條件下,任務(wù)難度更大。此外生成視頻的后續(xù)內(nèi)容不僅成本高昂,實際上也毫無意義。
因此,Yann LeCun 認(rèn)為,更理想的做法是生成視頻后續(xù)內(nèi)容的抽象表達(dá),并消除與我們可能所采取動作無關(guān)的場景中的細(xì)節(jié)。
當(dāng)然,他借此又 PR 了一波 JEPA(Joint Embedding Predictive Architecture,聯(lián)合嵌入預(yù)測架構(gòu)),認(rèn)為上述做法正是它的核心思想。JEPA 不是生成式的,而是在表示空間中進(jìn)行預(yù)測。與重建像素的生成式架構(gòu)(如變分自編碼器)、掩碼自編碼器、去噪自編碼器相比,聯(lián)合嵌入架構(gòu)(如 Meta 前幾天推出的 AI 視頻模型 V-JEPA)可以產(chǎn)生更優(yōu)秀的視覺輸入表達(dá)。
以上就是Sora到底懂不懂物理世界? AI視頻生成引發(fā)行業(yè)震驚全部內(nèi)容,希望對你有幫助。想查找更多游戲資訊,歡迎持續(xù)關(guān)注游戲鳥查看。
-
- 國產(chǎn)肉鴿《霓虹深淵2》定價公布!7月17日58元登錄Steam平臺!
- 阿姆羅2025-07-04 16:31:13
-
- 《絕區(qū)零》聯(lián)動芬達(dá)PV公布,還有限定周邊!
- 卡繆2025-07-02 17:55:35
-
- 像素火影網(wǎng)頁版一周年入口 像素火影一周年網(wǎng)頁版鏈接
- 技能魔法師2025-07-01 10:35:12
-
- 送完P(guān)S5PRO又送NS2!《劍星》開發(fā)商為慶祝游戲大賣贈送每位員工一臺NS2!
- 卡繆2025-06-18 15:22:28
-
- 開啟卡牌新紀(jì)元,《影之詩》新資料片“超凡世界”正式上線!
- QQlove2025-06-18 15:10:19
-
- 魔獸世界冰dk天賦加點推薦
- 阿姆羅2025-04-07 17:11:51
-
- NS2發(fā)布會匯總:港版售價3450港幣,馬車新作首發(fā)護(hù)航,支持4K120FPS輸出!
- 卡繆2025-04-03 10:14:35
-
- 可能漲價?CDPR稱《GTA6》漲價對他們來說是有利的。
- 卡繆2025-03-28 17:31:44
-
- 古龍風(fēng)云錄借花獻(xiàn)佛任務(wù)攻略 借花獻(xiàn)佛支線任務(wù)圖文通關(guān)流程
- 燃燒軍團(tuán)2024-05-06 16:14:39
-
- 古龍風(fēng)云錄人心難測任務(wù)怎么做 人心難測支線任務(wù)攻略
- 破碎之王2024-05-06 16:14:38
- 1 國產(chǎn)肉鴿《霓虹深淵2》定價公布!7月17日58元登錄Steam平臺!
- 2 《絕區(qū)零》聯(lián)動芬達(dá)PV公布,還有限定周邊!
- 3 像素火影網(wǎng)頁版一周年入口 像素火影一周年網(wǎng)頁版鏈接
- 4 送完P(guān)S5PRO又送NS2!《劍星》開發(fā)商為慶祝游戲大賣贈送每位員工一臺NS2!
- 5 開啟卡牌新紀(jì)元,《影之詩》新資料片“超凡世界”正式上線!
- 6 魔獸世界冰dk天賦加點推薦
- 7 NS2發(fā)布會匯總:港版售價3450港幣,馬車新作首發(fā)護(hù)航,支持4K120FPS輸出!
- 8 可能漲價?CDPR稱《GTA6》漲價對他們來說是有利的。
-
魔獸奇兵
魔獸奇兵是一款魔幻RPG冒險手游,無盡的世界蘊(yùn)藏著神秘的寶藏,滿世界的種族都在追尋著寶藏,明知不可能得到但是卻有著堅定的... -
魔域之歌
魔域之歌手游是一款西方3D冒險擴(kuò)張領(lǐng)土類手機(jī)網(wǎng)絡(luò)游戲,玩家將會扮演一個領(lǐng)主,建造自己的家園,讓自己越來越強(qiáng)大,具有特色戰(zhàn)斗系統(tǒng)... -
Fixum2
Fixum2是一款拼圖類型的趣味闖關(guān)游戲,在游戲里你需要面對的是散亂的圖紙殘片,將破碎的它們重新組合在一起形成最美麗的圖... -
綠寶石妖怪
綠寶石妖怪是一款懷舊題材的休閑類手機(jī)游戲。在綠寶石妖怪安卓版玩家化身為一個勇敢的公主,為了保護(hù)自己的子民和可愛的精靈們,... -
3C大亂斗
3C大亂斗是一款魔獸3C類型的單機(jī)對戰(zhàn)游戲,豐富的關(guān)卡搭配可聯(lián)機(jī)的玩法帶來暢快戰(zhàn)斗體驗,無論是單人展開闖關(guān)戰(zhàn)斗,還是通過... -
智力立方
智力立方是一款非常有趣的益智類的燒腦游戲,在智力立方安卓版玩家需要把白色的石塊挪動,通過黑色石塊的洞洞,以最少的步數(shù)完成... -
Idle Drops
Idle Drops是一款休閑一直類手機(jī)游戲,一個個轉(zhuǎn)動的木棍橫在空中,上面會降下一個個的小球,跟隨木棍轉(zhuǎn)動的節(jié)奏,一點... -
按螞蟻
按螞蟻是一款休閑智益手機(jī)小游戲,這款游戲就是將自己手機(jī)上會顯示出很多大大小小的螞蟻,并且你要不斷的按壓這些螞蟻,螞蟻會跟... -
涂鴉戰(zhàn)爭英雄傳說
涂鴉戰(zhàn)爭英雄傳說游戲是一款策略戰(zhàn)斗類的戰(zhàn)爭游戲,在地圖之上自己的王國正在飽受著戰(zhàn)火的困擾,大量的外敵想要入侵我們的領(lǐng)土,霸占我... -
上古修仙訣
上古修仙訣手游是一款奇幻的遠(yuǎn)古冒險競技玩法的手機(jī)網(wǎng)絡(luò)游戲,采用了以上古時代作為整體的背景,玩家將會以一個不養(yǎng)的角色進(jìn)入其中,進(jìn)...