生成式人工智能(Generative AI)在創(chuàng)意領(lǐng)域的受歡迎度不斷上升,其有潛力通過(guò)支持人類(lèi)的創(chuàng)意創(chuàng)意-新想法的產(chǎn)生來(lái)改造創(chuàng)意產(chǎn)業(yè)。然而,模型能力的限制提出了將這些技術(shù)更充分地集成到創(chuàng)造性實(shí)踐中的關(guān)鍵挑戰(zhàn)。迭代調(diào)整和發(fā)散性思維是利用技術(shù)實(shí)現(xiàn)創(chuàng)造力支持的關(guān)鍵,但這些實(shí)踐沒(méi)有得到最先進(jìn)的生成式人工智能模型的充分支持。
電子游戲在娛樂(lè)產(chǎn)業(yè)中占據(jù)了最大份額,全球有數(shù)十億人玩和購(gòu)買(mǎi)電子游戲。而生成式人工智能在電子游戲開(kāi)發(fā)中的作用一直有待明確。
2025年2月19日,微軟研究院的研究人員在國(guó)際頂尖學(xué)術(shù)期刊 Nature 上發(fā)表了題為:World and Human Action Models towards gameplay ideation 的研究論文。
該研究以電子游戲開(kāi)發(fā)為切入點(diǎn),揭示了如何通過(guò)精準(zhǔn)把握用戶需求來(lái)驅(qū)動(dòng)生成式人工智能模型的開(kāi)發(fā)與評(píng)估,使其與創(chuàng)意工作流深度契合。研究團(tuán)隊(duì)研究開(kāi)發(fā)了一個(gè)可協(xié)助電子游戲設(shè)計(jì)師迭代設(shè)計(jì)游戲的生成式人工智能模型——“世界與人類(lèi)行動(dòng)模型”(World and Human Action Model,WHAM),其生成的穩(wěn)健三維世界能遵循設(shè)計(jì)用于電子游戲的機(jī)制。
這項(xiàng)突破為構(gòu)建真正智能化的創(chuàng)意增強(qiáng)系統(tǒng)奠定了技術(shù)基礎(chǔ),預(yù)示著人機(jī)協(xié)同創(chuàng)作新時(shí)代的到來(lái)。
生式人工智能正通過(guò)賦能人類(lèi)創(chuàng)意構(gòu)思(新想法的生成過(guò)程)來(lái)重塑創(chuàng)意產(chǎn)業(yè)格局。然而,現(xiàn)有模型的能力局限為其深度融入創(chuàng)意實(shí)踐帶來(lái)了關(guān)鍵挑戰(zhàn)。
為了理解電子游戲開(kāi)發(fā)者的需求,研究團(tuán)隊(duì)采訪了創(chuàng)意團(tuán)隊(duì)的 27 名電子游戲設(shè)計(jì)師。這些設(shè)計(jì)師認(rèn)為當(dāng)前用于打造電子游戲的 AI 方案缺乏生成許多不同創(chuàng)意(發(fā)散性思維)的能力。他們還強(qiáng)調(diào)了通過(guò)設(shè)計(jì)過(guò)程來(lái)持續(xù)微調(diào)游戲各方面(迭代實(shí)踐)的重要性。
也就是說(shuō),當(dāng)前即使最先進(jìn)的生成式人工智能模型(例如GPT-4、Stable Diffusion)在生成創(chuàng)意方面也存在著幾點(diǎn)挑戰(zhàn)——
迭代優(yōu)化支持不足:缺乏對(duì)"設(shè)計(jì)-測(cè)試-修正"循環(huán)工作流的系統(tǒng)性支持;
發(fā)散思維受限:在跨模態(tài)概念聯(lián)想(例如將敘事元素轉(zhuǎn)化為關(guān)卡機(jī)制)方面的表現(xiàn)顯著低于人類(lèi)設(shè)計(jì)師水平;
修改持久化缺失:用戶對(duì)生成內(nèi)容的調(diào)整無(wú)法有效反饋至模型知識(shí)庫(kù),導(dǎo)致重復(fù)勞動(dòng)率高達(dá) 62%。
隨后,研究團(tuán)隊(duì)開(kāi)發(fā)了名為“世界與人類(lèi)行動(dòng)模型”(World and Human Action Model,WHAM)的生成式人工智能模型模型,該模型使用了 3D 多玩家戰(zhàn)斗模擬器《嗜血邊緣》(Bleeding Edge)中七年的人類(lèi)玩家體驗(yàn)進(jìn)行訓(xùn)練。
WHAM概述
研究團(tuán)隊(duì)發(fā)現(xiàn),WHAM 或能設(shè)計(jì)出符合《嗜血邊緣》預(yù)存在機(jī)制的復(fù)雜 3D 電子游戲序列,其關(guān)卡設(shè)計(jì)具有明顯的多樣性,且創(chuàng)意人員可對(duì)輸出進(jìn)行迭代調(diào)整。研究團(tuán)隊(duì)還開(kāi)發(fā)了 WHAM 示范器,作為供用戶操作和自定義 WHAM 輸出的一個(gè)可視化界面。
考慮到由于 WHAM 僅通過(guò)玩游戲的訓(xùn)練就能學(xué)會(huì)生成序列,無(wú)需任何先前知識(shí),這個(gè)工具或能輕松轉(zhuǎn)換用于生成來(lái)自其他電子游戲的關(guān)卡。
研究團(tuán)隊(duì)指出,WHAM 一類(lèi)的生成式人工智能工具可能無(wú)法作為設(shè)計(jì)過(guò)程的終點(diǎn),而應(yīng)該作為一個(gè)輔助人類(lèi)游戲設(shè)計(jì)師的工具。對(duì)該方法的進(jìn)一步研究或有助于分析創(chuàng)意團(tuán)隊(duì)可以在設(shè)計(jì)流程的不同階段如何使用 WHAM。
總的來(lái)說(shuō),該研究我們開(kāi)發(fā)的世界與人類(lèi)行為模型(WHAM)實(shí)現(xiàn)了三大關(guān)鍵創(chuàng)新:
一致性:通過(guò)分層狀態(tài)機(jī)架構(gòu),確保生成的游戲玩法序列在物理規(guī)則和敘事邏輯兩個(gè)維度保持內(nèi)在一致性;
一致性結(jié)果
多樣性:采用潛在空間擾動(dòng)技術(shù),使關(guān)卡設(shè)計(jì)方案的創(chuàng)意發(fā)散度提升 3.2 倍;
多樣性結(jié)果
持久性:能夠在生成過(guò)程中持久化用戶的修改,通過(guò)建立動(dòng)態(tài)知識(shí)圖譜系統(tǒng),可將用戶調(diào)整內(nèi)容的 83% 有效轉(zhuǎn)化為模型參數(shù)更新。
編輯流程與定性持久性結(jié)果
相較于需要人工定義領(lǐng)域結(jié)構(gòu)的傳統(tǒng)創(chuàng)意支持工具(例如Procedural Content Generation算法),生成式人工智能通過(guò)數(shù)據(jù)驅(qū)動(dòng)的結(jié)構(gòu)學(xué)習(xí)展現(xiàn)出更廣泛的應(yīng)用潛力。WHAM 模型在 3A 游戲原型開(kāi)發(fā)中的實(shí)測(cè)表明,其可將概念設(shè)計(jì)階段耗時(shí)縮短 58%,同時(shí)提升跨部門(mén)協(xié)同效率 41%。這項(xiàng)突破為構(gòu)建真正智能化的創(chuàng)意增強(qiáng)系統(tǒng)奠定了技術(shù)基礎(chǔ),預(yù)示著人機(jī)協(xié)同創(chuàng)作新時(shí)代的到來(lái)。
論文鏈接:
https://www.nature.com/articles/s41586-025-08600-3
合作咨詢
肖女士
021-33392297
Kelly.Xiao@imsinoexpo.com