編輯周記 - AI影視製作的局限
撰文: Kantorates | 發布日期: 2026年02月21日
2026年02月21日
AI影視製作的局限 by Kantorates
新年伊始,今年電影界的焦點,離不開AI人工智能的進迫。上周說到中國幾間科技公司推出的AI短片製作工具,足以震憾業界。果不其然,荷里活看到這些工具製作的短片後,立即提出涉嫌侵權的指控,相信有關方面的法律交鋒,將於今年上演。
有看過Seedance、Kling等工具製作的短片,都擔心電影工業快將被摧毀,甚至有人認為,電影已死。但實際上,AI是否真能在短時間內取代人類製作的影視作品呢? 上周說過我的預測,三至五年之內,一般電腦用戶,都可以利用AI創作30分鐘或以下的影視作品,或者最多十年內,任何人都能夠僅用一個AI模型,便能拍攝劇情長片。意思就是說,以今年來說,AI要立即取代電影工業的真人作業,還不是時候。
儘管網絡上看到的一系列AI短片都非常擬真,如周星馳電影被惡搞、湯告魯斯和畢彼特對打、以至那些仿邵氏電影的動作短片,但如果細心留意就會發現,不論主角人物是否改變,這些短片不論運鏡、剪接,幾乎都是一模一樣,依循既定模式呈現,換句話說,就像是一個模板,而非完全的天馬行空創作。這是因為不論任何AI模型,都必須經過訓練,才能生成影片。
AI模型不能完全憑空創作,不論是如Seedance、Kling或開源的Wan、混元等,以至美國的Meta、Grok,都必須經過訓練,才能生成。所謂的訓練,就是不斷把參考資料輸入到模型之中,供其學習和記憶,然後模型就能按照這些資料,再組合產生作品。以往AI模型訓練耗時,如幾年前曾經引發恐慌的Deepfake,訓練時間特別長,每次要製作換臉動畫,可能都要花費十多小時才能完成,而且效果參差。現在的AI模型,某程度就是這種訓練的升級版,而且不用用戶自行訓練,而是由科技公司從各方搜材,為模型訓練。
正因為AI模型需要訓練,除非是製作量產式的商業電視劇或短劇,基本上不求創意,劇情、拍攝風格都是如出一轍,否則AI很難無中生有,製作前人未見,具有藝術質素的影視作品。當然,我說的只是目前情況,不排除稍後AI技術再有新突破,如更準確捕捉人類面孔或動作的模型,令到其學習能力更進一步,能夠融匯貫通,那樣便離自行創作之路不遠。
AI創作另一難題,是如何有效輸入指令(prompt)。如上述的周星馳電影惡搞片,普通人都能製作,主要是因為操作簡單,用戶主要上載主角照片,AI便會自動生成如模板的影片。但要說到複雜的創作,對於指令的要求,便不可同日而語。有玩過AI短片製作的朋友或許都知道,輸入指令是知易行難的事,如果要求簡單,純粹嘗鮮,當然問題不大,但想製作較細緻的短片,便會發現AI並不比想象聰明。有時明明很直白的概念,無論怎麼輸入,AI就是聽不懂,或理解錯誤。這不是說AI出現故障,而是其本身有特別的語言理解系統,要達成某些畫面效果,必須使用AI聽得懂的關鍵字或啟動字,否則無論如何長篇大論,均不能正確出片。
說到如何輸入指令,首先用戶本身必須具備一定的文字運用水平,不管是中文還是英文,應有高水準的表達能力,尤其是詞匯不能少。有一些小聰明的人會說,可以直接把指令編寫也交由AI去做,這確是可行的辦法,但即便如此,有試過這樣做的人或許都會發現,就算是AI本身寫出來的指令,也不一定百分百有效,不要說是由一過AI文字模型為另一個AI短片模型寫指令,就算是同一個系統,如兼具文書和短片製作功能的ChatGPT、Meta 、Grok等,它們生成的指令,也不一定能產生理想的短片效果。
其二難題就是穩定性,意思就是前文後理的對照。用AI製作一張照片或一段短片,通常不會太困難,但如果是一部電影,或至少是超過一個鏡頭的短片,難度便大大提升。這是因為AI不如人類一樣,明白何謂「連戲」。即便是一些有「連戲」功能的AI模型,如谷歌的Image FX,技術上也難言百分百準確,有時可能是主角的面孔不太一樣,或者是衣服顏色、樣式有點小變化,這都不是人力能夠控制,但卻是最教AI短片製作者頭痛的部分。「連戲」問題一日未能徹底解決,AI影視製作始終還是未能成熟。
再來就是門檻。雖然現在要製作AI短片的硬件門檻,已是愈來愈低,但要拍攝影視製作,使用如Seedance和Kling這種收費模型,論成本是不太可行,畢竟按照他們的收費標準,要大量製作短片或進行實驗,花費可能會比真人拍攝更大。相對來說,開原模型的應用較可行,但論技術先進性,顯然不及上述的付費模型,另外,即便是開源模型本身,電腦硬件要求也不低,並不是一般家庭用戶能夠輕易負擔。
綜合以上所說,AI影視製作還有不少障礙要跨越,所以業界人士不用杞人憂天,但由於科技發展一日千里,也不宜放下戒心,相反更應溫故知新,盡快掌握這種新技術,以便在大環境的迅速變化下能夠順利轉型,避過被淘汰的命運。
Kantorates