新影片生成 AI 模型「Sora」的上市備受期待,Sora 技術長 Mira Murati 與《華爾街日報》訪談透露預計在今年稍晚上線,然而,當主持人詢問其資料來源時,技術長卻回答對「此並不確定」。
(前情提要: OpenAI 新推文字生成影片「Sora」AI 模型,社群嚇呆:電影等級,能顛覆影視產業)
(背景補充: OpenAI的Sora最大敵人?馬斯克:特斯拉影片生成AI「全世界最強」)
人工智慧(AI)新創公司 OpenAI 在 2 月發布新影片生成 AI 模型「Sora」,這款工具能夠根據文字敘述或提供的靜態圖片,製作出高達 1080p 解析度的動畫影片,其中包含多角色、多元場景與運鏡技巧,試用者利用「Sora」創造的影片作品已經在社群平台 X 上瘋傳,成果驚艷。
預計今年稍晚上線
根據 Sora 技術長 Mira Murati 與《華爾街日報》訪談,OpenAI 不僅計劃向公眾開放「Sora」,更著手進一步升級這項技術。其未來的發展方向,將包括整合影片音效,使得「Sora」生成的影片更為逼真,不再僅僅是無聲的視覺作品,Murati 也透露 Sora 預計今年上市。
雖然「Sora」在創造影像方面取得了顯著的進步,但同時也面臨著成本和倫理上的挑戰,Murati 透露運算「Sora」所需的電力成本相當高昂。為了使這項創新技術更加普及,OpenAI 正在努力將其成本結構調整至接近於 DALL·E 的水平,以便將來能夠更廣泛地提供給大眾使用。
隨著年底美國總統大選的臨近,以及世界各地即將舉行的多場選舉,人們對於生成式 AI 工具可能產生錯誤資訊的擔憂日益加深。對此,Murati 強調,「Sora」在上線後可能不會允許製作公眾人物的影像,這與 DALL·E 目前的政策相似,並且在 Sora 生成的影片中加入浮水印,這一措施將有助於避免生成影片被誤解或被用於不當用途。
訓練數據避而不談
然而,有關 Sora 其資料來源的疑問卻在同一時刻浮上檯面,技術長 Mira Murati 在《華爾街日報》的採訪中對此提供了部分但不全面的解答。
在訪問中,當問及 Sora 的資料來源時,Murati 並未提供明確答案。她僅表示 OpenAI 使用了「公開數據和授權數據」來訓練即將推出的 Sora 模型,但具體細節仍不清楚。
當主持人 Joanna Stern 提問 Sora 是否經由如 YouTube、Instagram 或 Facebook 等社群媒體平台的數據訓練時,Murati 回答稱「實際上對此並不確定」,Murati 雖然避免詳細介紹使用的數據,但她最終向《華爾街日報》證實,Sora 確實使用了 Shutterstock 的數據。
值得一提的是,2018 年加入 OpenAI 以來,Murati 已領導許多 OpenAI 重要項目,包括圖像生成器模型 DALL-E 3、語音識別工具 Whisper 以及最新版本的聊天機器人 GPT-4。
在 2023 年 11 月,隨著 OpenAI 董事會罷免 Sam Altman,Murati 暫時接任了執行長的職務,對於 OpenAI,她的角色舉足輕重,而針對 Sora 的訓練來源回應,Murati 更有可能的是選擇不透露。
OpenAI CTO Mira Murati says Sora was trained on publicly available and licensed data pic.twitter.com/rf7pZ0ZX00
— Tsarathustra (@tsarnick) March 13, 2024
📍相關報導📍
AI概念幣夯!市值加總破120億鎂,Sora熱潮下$LPT飆漲150%