要一个人完成类似游戏的虚拟世界,可能需要以下软件:
完成所需的时间因多种因素而异,包括个人的技能水平、项目的复杂程度、投入的时间和精力等。像《Red Dead Redemption 2》这样复杂的游戏,制作成本近 5 亿美元,花了将近 8 年的时间来建造。但如果是相对简单的虚拟世界,时间可能会短很多。不过,这需要您具备扎实的相关技能和持续的努力。
首先,让我们探索这篇博客文章余下部分的一些基本假设:1.一般而言,人工智能的研究数量将继续增长,创造出更有效的技术考虑一下这张图,它显示了每月在[arXiv存档](https://arxiv.org/)上发表的关于机器学习或人工智能的学术论文的数量:如您所见,论文的数量正在呈指数增长,且没有放缓的迹象。这仅包括已发布的论文-大量的研究甚至从未发布,直接转为开源模型或产品研发。结果是对兴趣和创新的爆炸性增长。1.在所有娱乐中,游戏将受到生成性AI的最大影响游戏是最复杂的娱乐形式,就涉及的资产类型数量而言(2D艺术、3D艺术、音效、音乐、对话等)。游戏也是最具交互性的,强调实时体验。这为新游戏开发者创造了一个陡峭的进入障碍,以及制作现代、登顶榜单的游戏的陡峭成本。它还为生成性AI创新创造了巨大的机会。考虑一款像[Red Dead Redemption 2](https://www.rockstargames.com/reddeadredemption2/)这样的游戏,这是有史以来制作成本最高的游戏之一,制作成本近5亿美元。很容易理解为什么-它拥有市场上任何游戏中最美丽、最完整的虚拟世界。它也花了将近8年的时间来建造,拥有超过1000个非玩家角色(每个都有自己的性格、艺术作品和配音演员),一个近30平方英里的世界,超过100个分为6章的任务,以及由超过100名音乐家创作的近60小时的音乐。这款游戏的一切都很宏大。
生成式人工智能工具,在帮助像游戏设计师这样的角色进行游戏概念探索与灵感启发都比较有用处。这也是生产过程的一个关键环节,例如,某个游戏工作室正在使用上述工具,从根本上加快了他们的概念艺术的开发流程,因为他们只用了一天时间就创造出了一个图像,而在以前,这个过程需要长达3周的时间,但是具体怎么操作呢?首先,游戏设计师使用Midjourney来探索不同的灵感,并生成他们认为合适的概念图像。之后,图像会被交给专业的概念艺术家,艺术家可以把这些图像组合在一起,然后创建一个相关主题的连贯图像,然后将这些图片输入Stable Diffusion,以形成系列的图像变化。大家会共同讨论这些风格各异的图像风格,然后确定一个,用画笔手动编辑,然后继续重复以上过程,直到大家对作品结果感到满意。在这个阶段,再把这个图像最后上传给Stable Diffusion,创造出最后的艺术作品。2D Production Art还有的游戏工作室在尝试使用类似的人工智能工具来制作游戏中的美术作品。例如,下图是来自Albert Bozesan,关于如何使用Stable Diffusion来创建游戏中的2D资产的教程。来源:https://www.youtube.com/watch?v=blXnuyVgA_Y3D Artwork3D立体模块,是目前所有现代游戏以及即将到来元宇宙的重要构建源。虚拟世界和游戏关卡,本质上都是一个3D资产的集合,通过不同的组合和放置方法,修改不同的参数来填充游戏环境。而创建3D元素比创建2D平面图更为复杂,涉及多个步骤,包括需要制作3D模型、添加纹理和效果。而对于动画人物来说,还涉及到需要创建一个内部"轮廓",然后在轮廓之上创建动画。我们发现有不同的初创公司,在寻找有关3D资产创建过程的各个阶段的机会,包括模型创建、角色动画和关卡制作等等。然而,这部分的业务和创新尚在探索中。
当我们人类看到一个桌上的水杯,大脑就会自动计算它在三维空间中的位置,以及它与桌子和周围一切事物的关系,还会预测接下来会发生什么。行动的冲动是所有空间智能生命形式所固有的,它将感知与行动联系起来。一个具有空间智能的AI,它也能自动做类似的预测与行动冲动。空间智能将推动AI系统获得具身智能(Embodied Intelligence),能够像生物一样与环境互动,FSD就是典型的例子,现在Tesla正通过其改进版本来驱动Optimus机器人,Elon Musk在Tesla最近一次财报电话会上说今年底就计划让Optimus能够在Gigafactroy代替人类干点活。不过Nvidia有一个更宏大的计划,这是今年GTC上的One More Thing,他们计划推出GR00T项目,一个通用智能体(Foundation Agent)。其目标是为通用的人形机器人构建基础模型,使其能在不同实体之间迁移,训练过程类似OpenAI训练GPT-4,通过在海量环境中训练来获得通用性,这里就要用到我们在上一小节中提及的Isaac Sim来创造GPU加速的虚拟世界。Nvidia将通过它来以1000倍速运行物理模拟,生成无限复杂精细的虚拟世界,正所谓AI不用一天,人间就得一年。。这个项目的负责人Jim Fang在一次TED演讲上概括了通用智能体的三大特征:能在开放世界中探索;拥有海量世界知识;能执行无数任务;