用戶登錄投稿

中國作家協會主管

OpenAI發布文生視頻大模型引關注 寥寥數語生成60秒視頻 Sora能否改變影視行業?
來源:解放日報 | 俞陶然  2024年02月20日08:29

Sora生成的視頻截圖

Sora生成的視頻截圖

近期,OpenAI公司發布的文生視頻大模型Sora引發全球關注。只要輸入一句或寥寥幾句描述畫面情節的提示詞,它就能生成一段時長60秒的視頻。這些視頻的質量和準確性達到了令人驚艷的程度。

Sora的技術原理是什么?其應用價值有多大?記者采訪了上海交通大學計算機科學與工程系教授趙海。

趙海教授介紹,Sora屬于多模態混合模型,由大語言模型和文圖生成器拼接而成。純文圖生成模型對提示詞的理解能力很弱。比如,用戶輸入“世界和平”,它往往無法生成準確的圖片。如果把文圖生成器與大語言模型拼接在一起,后者就能把“世界和平”轉化為和平鴿、橄欖枝等文圖生成器“看得懂”的提示詞,從而生成切題的作品。

文圖生成器經改造后,也能生成視頻。因此,從文圖生成器過渡到文生視頻大模型,不需要很大的技術突破,研發團隊主要依靠的是大算力、大模型、大樣本訓練數據等“先天條件”?!斑@些條件都是OpenAI所具備的,所以Sora的問世不能算技術革命,而是工程實踐的成功。”趙海說。

Sora展示的一批文生視頻案例令人驚艷。比如,輸入這樣一段提示詞:“一位時尚女性走在充滿霓虹燈和城市標牌的東京街道上。她穿著黑色皮夾克、紅色長裙和黑色靴子,拎著黑色錢包。她戴著太陽鏡,涂著紅色口紅。她走路自信又隨意。街道潮濕且反光,在彩色燈光的照射下形成鏡面效果。許多行人走來走去。”Sora根據這段話生成的60秒視頻效果頗佳,頭發、服裝等細節都沒問題,并實現了連貫的場景轉換,達到以假亂真的水平。

Sora與同類產品相比,具有三大優勢——60秒時長、單視頻包含多角度鏡頭、遵循部分物理規律。

Sora問世前,同類產品只能根據提示詞生成5秒以內的短視頻。Sora的作品不僅長達1分鐘,而且有多角度鏡頭,這些鏡頭里的人和物還能保持前后一致性,不會因角度變換而出現問題。在對物理規律的掌握方面,Sora也有不俗表現,比如在其生成的一段SUV(運動型多用途汽車)行駛視頻中,汽車影子與車身始終契合。

不過,Sora的作品也存在不少瑕疵。如輸入“五只灰狼幼崽在一條偏僻的碎石路上互相嬉戲、追逐”,視頻中狼的數量會莫名改變,幾只狼憑空出現或消失。趙海分析:“目前的文圖生成器對數字不夠敏感,比如生成的一些手會有6根手指,今后要加強這方面的訓練?!?/p>

在他看來,視頻大模型將改變影視行業的游戲規則。以技術含量最高的科幻電影為例,目前拍攝一部科幻大片往往需要數年時間,視頻大模型用于這個領域后,特效畫面的制作時間有望縮短到幾天,從而大幅降低科幻電影拍攝的時間成本和技術門檻。視頻攝制成本的降低,也將給傳媒行業帶來變革。今后,部分視頻的攝制也許只要在電腦前輸入一些提示詞,省去了現場拍攝、后期剪輯等耗時費力的過程。

主站蜘蛛池模板: 亚洲伊人久久大香线蕉综合图片| 区三区激情福利综合中文字幕在线一区亚洲视频1 | 精品综合久久久久久888蜜芽| 一本久久a久久精品vr综合| 国产成+人+综合+亚洲专| 亚洲国产精品综合久久20| 国产成人综合日韩精品无码不卡| 国产成人综合精品一区| 久久综合九九亚洲一区| 激情综合婷婷色五月蜜桃| 国产精品综合AV一区二区国产馆| 色噜噜狠狠狠狠色综合久不| 激情综合色五月六月婷婷| 亚洲中文字幕无码久久综合网| 国产香蕉久久精品综合网| 亚洲色婷婷综合久久| 国产综合在线观看视频| 亚洲综合无码一区二区| 三级韩国一区久久二区综合| 亚洲国产成人久久综合碰碰动漫3d| 99久久婷婷国产综合精品| 亚洲婷婷第一狠人综合精品| 人人狠狠综合久久亚洲88| 久久天天日天天操综合伊人av| 亚洲av日韩综合一区二区三区| 亚洲欧洲日产国产综合网| 色综合色综合色综合| 色天天综合色天天碰| 热综合一本伊人久久精品 | 久久综合国产乱子伦精品免费| 婷婷久久香蕉五月综合| 亚洲欧美日韩综合久久久| 色综合色综合色综合色综合网| 国产色综合天天综合网| 国产色婷婷五月精品综合在线| 久久88色综合色鬼| 亚洲伊人tv综合网色| 国产精品综合AV一区二区国产馆| 色欲天天婬色婬香视频综合网| 综合欧美五月丁香五月| 国产成人综合亚洲|