Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

有没有类似游戏情境创设的闯关游戏,人物与虚拟角色在文生视频搭建的环境中进行智能对话的案例

Answer

《Im Here2》就是一个利用文生视频搭建游戏环境,通过人物与虚拟角色进行智能对话来解谜的游戏案例。

Content generated by AI large model, please carefully verify (powered by aily)

References

Others are asking
可以自己制作游戏吗?
可以自己制作游戏。 目前,利用生成式人工智能制作游戏具有以下情况: 1. 第一阶段重点在工具方面。生成式人工智能可作为人类创作者的辅助,让现有的 UGC(用户生成内容)工作流程更强大和易操作。现有的 UGC 平台(如 Roblox)会在现有工具集中添加生成人工智能工具,初创公司也会复制当前 UGC 工作流程并针对生成人工智能进行优化。 2. 第二阶段会有新公司出现,重新构想创作工作流程。这一阶段的产品可能更像基于生成人工智能构建的引擎或操作系统,会出现全新的创作范式,但具体形式难以预测。 在实际操作中,要求 GPT4 使用高层次规格在 HTML 和 JavaScript 中编写 3D 游戏是可行的,GPT4 能以 zeroshot 方式生成满足要求的工作游戏。但创建 HTML 和 JavaScript 的 3D 游戏需要大量编程知识和经验,并非轻松快速能完成,要花费大量时间和精力开发 3D 图形、物理、用户输入和人工智能等必要功能。 对于 AI 游戏的商业化,由于消耗算力,目前 AI 游戏多为网游形态,买断制游戏回收成本困难。可采用聊天模块按量付费(如原神中充值月卡附带与 AI 对话次数,用完再收费)、UGC 模块包装成抽卡等方式将消耗 AI 的成本转嫁给玩家。 此外,有人希望自己制作的游戏能被更多人玩到、启发他人创作,成长为平台和生态,甚至成为划时代产品载入游戏史册。但游戏形式是否会造成冲突尚无答案,做游戏的目的不同(如注重游戏本身还是赚钱),选择也会不同。
2025-01-26
有用来做网络游戏研发和运营的全套AI工具吗?
目前游戏领域还没有涵盖整个制作过程(包括代码、资产生成、纹理、音频等)的全套生成式人工智能工具,也没有能与流行的游戏引擎(如虚幻和 Unity)紧密结合使用、专为适应典型的游戏生产流程而设计的一体化平台。但有一些相关的工具和平台在不同方面发挥作用,例如: 生成可以互动的角色方面:有很多初创公司在研究,如 Charisma.ai、Convai.com、Inworld.ai 等平台,它们可以为具有情感和自主权的完全渲染的 3D 角色提供动力,并提供工具让创作者给角色设定目标。 语音生成方面:Coqui Studio(https://coqui.ai)、Bark(https://github.com/sunoai/bark)、Replica Studios(https://replicastudios.com)等。 语音识别方面:OpenAI Whisper(https://huggingface.co/openai/whisperbase)、Facebook Wav2Vec2(https://huggingface.co/facebook/wav2vec2largexlsr53)。 对话模型方面:ChatGPT(https://chat.openai.com)、HuggingChat(https://huggingface.co/chat)。 故事讲述模型方面:MPT7BStoryWriter65k+(https://huggingface.co/mosaicml/mpt7bstorywriter)、Claude 100k(https://www.anthropic.com/index/100kcontextwindows)、GTP4 32k(https://platform.openai.com/docs/models/overview)。 游戏设计方面:Ludo.ai(https://ludo.ai)。 搜索引擎方面:Haddock(https://www.haddock.ai)。 AI NPC 方面:Inworld(https://inworld.ai)。
2025-01-23
AI开发游戏
以下是用国产 AI 开发游戏的过程: 1. 元素设计: 狼:图片放进去,调整大小。 栅栏:图片放进去,调整大小。 洞:调整背景颜色,让 AI 提供。 槌子:点一下转动,实现方式从动画效果改为点一下马上旋转 90 度,放开时恢复,点击时洞的高度变短。 羊:生成 20 只羊时出现重叠问题,通过让 AI 调整每只羊间隔 10PX 解决。控制羊的移动花费较多时间,重写多轮代码。 2. 图片生成: 直接让智普生成羊、狼、锤子、栅栏、胜利图片、失败图片。其中羊、狼、锤子、栅栏生成无背景的,用 PS 做成透明 PNG。栅栏和胜利、失败图片生成多次。 3. 框架搭建: 让智普生成 HTML 的大框架,验证元素摆放位置。生成的 HTML 代码简洁,CSS 结构不错但 position 定位模式不对,修改为 position:fixed 修复 BUG。 4. 效果制作: 失败判断在羊的跑的动作中实现,羊跑光显示失败图像。 胜利判断在槌子事件中,洞全部修好即胜利。 第二关在胜利时多一个步骤跳转到第二页,复制代码并修改,增加一只凶狠的狼,用 AI 作图。 5. 完成与测试: 2024 年 5 月 11 日 17:34:04 完成所有内容,上传服务器测试,存在小 BUG 但先凑合用。 开发过程中发现 AI 生成的内容不能完全信任,可能 90%能用,但剩下 10%需要人工调整,学习还是有必要的,AI 只是辅助,有条件问专家是好的解决方案。
2025-01-11
如果自己一个人要完成一个类似游戏的虚拟世界,需要一些什么软件,并且需要多久完成
要一个人完成类似游戏的虚拟世界,可能需要以下软件: 1. 图像生成软件,如 Midjourney、Stable Diffusion 等,用于生成概念图像和美术作品。 2. 3D 建模软件,用于创建 3D 模型、添加纹理和效果等。 完成所需的时间因多种因素而异,包括个人的技能水平、项目的复杂程度、投入的时间和精力等。像《Red Dead Redemption 2》这样复杂的游戏,制作成本近 5 亿美元,花了将近 8 年的时间来建造。但如果是相对简单的虚拟世界,时间可能会短很多。不过,这需要您具备扎实的相关技能和持续的努力。
2025-01-10
如果自己一个人要完成一个类似游戏的虚拟世界,需要一些什么软件
如果您想一个人完成类似游戏的虚拟世界,以下是一些可能会用到的软件: 1. Scenario、Iliad:可以创建游戏资源。 2. Promethean:能够构建整个虚拟世界的平台。 3. Inworld、Charisma、Convai:可用于生成非玩家角色(NPC)。 4. Midjourney:有助于游戏设计师进行游戏概念探索与灵感启发。 5. Stable Diffusion:可用于处理图像,如形成系列的图像变化、创建最后的艺术作品等。 6. 谷歌的 Genie:可以通过单张图像提示生成可玩的交互式环境,由潜在动作模型、视频 tokenizer 和动态模型组成。 此外,生成式人工智能工具在游戏概念探索、美术作品制作等方面也能发挥作用,比如加快概念艺术的开发流程。但需要注意的是,创建 3D 元素比创建 2D 平面图更为复杂,目前相关业务和创新尚在探索中。
2025-01-10
ai数学游戏
以下是为您提供的关于 AI 数学游戏的相关信息: 图灵测试游戏: 游戏背景:参与者包括人类和 AI,通过互相提问和答题协助裁判判断身份。人类和 AI 初始各有 3 点生命值,被裁判认为更像 AI 的一方每轮扣 1 点生命值,生命值为 0 时游戏结束。胜场会被记录,胜利最多者拥有 AI 冠名权。 游戏特色:加入了辩论环节,玩家可反驳裁判的初步判断。 开发情况:已在 coze 上开发完成。 国内版: 国外版: (国外平台昨天开始收费,已从 32k 降级为 8k) 游戏中的生成式 AI 革命: 结论:对于游戏创作者来说是令人难以置信的时代,生成构建游戏所需内容变得简单,甚至可想象为玩家创建完全个性化的游戏。 什么是生成式 AI:是一种机器学习类别,能根据用户提示生成新内容,目前文本和图像应用成熟,在多个创意领域都有工作进行。AI 在游戏中并非新鲜事,但早期游戏中的虚拟对手只是简单脚本程序,不能学习,如今因更快的微处理器和云技术,有更多计算能力可构建大型神经网络,用于识别复杂领域的模式和表示。该博文分为两部分,第一部分是对游戏领域生成式 AI 的观察和预测,第二部分是该领域的市场地图,概述细分市场并确定关键公司。
2025-01-07
哪一款免费的文生视频工具最好用
以下是一些免费的文生视频工具推荐: 1. Pika:是一款出色的文本生成视频AI工具,擅长动画制作,并支持视频编辑。 网址:https://pika.art/ https://discord.gg/pika 教程: 2. SVD:如果熟悉Stable Diffusion,可以直接安装这款最新的插件,在图片基础上直接生成视频。这是由Stability AI开源的video model。 3. Kaiber:这是一款视频转视频AI,能够将原视频转换成各种风格的视频。 网址:https://kaiber.ai/ 4. Hidreamai(国内,有免费额度): 网址:https://hidreamai.com//AiVideo 特点:支持文生视频、图生视频,提示词使用中文、英文都可以,文生视频支持正向提示词、反向提示词、运镜控制、运动强度控制,支持多尺寸,可以生成5s和15s的视频 5. ETNA(国内): 网址:https://etna.7volcanoes.com/ 特点:是一款由七火山科技开发的文生视频AI模型,可以根据用户简短的文本描述生成相应的视频内容。生成的视频长度在8~15秒,画质可达到4K,最高38402160,画面细腻逼真,帧率60fps。支持中文,时空理解 更多的文生视频的网站可以查看这里: 需要注意的是,这些工具均适合于不同的使用场景和需求,您可以根据自己的具体情况进行选择。内容由AI大模型生成,请仔细甄别。
2025-02-06
哪一款文生视频的工具最好用
以下是一些好用的文生视频工具: 1. Pika:非常出色,擅长动画制作,支持视频编辑。 2. SVD:如果熟悉Stable Diffusion,可安装此最新插件,在图片基础上生成视频,由Stability AI开源。 3. Runway:老牌AI视频生成工具,提供实时涂抹修改视频功能,但收费。 4. Kaiber:视频转视频AI,能将原视频转换成各种风格的视频。 5. Sora:由OpenAI开发,可生成长达1分钟以上的视频。 此外,还有以下工具可供选择: 1. PixVerse:人少不怎么排队,还有换脸功能,网址:https://pixverse.ai/ 。 2. GigaStudio:创作者可申请免费会员,文生视频效果好,网址:https://studio.gigaai.cc/ 。 3. Heygen:最近不好注册使用,网址:https://www.heygen.com/ 。 4. Krea:12 月 13 日免费公测,网址:https://www.krea.ai/ 。 5. Moonvalley:网址:https://moonvalley.ai/ 。 6. Mootion:3d 人物动作转视频,网址:https://discord.gg/AapmuVJqxx 。 7. 美图旗下:网址:https://www.miraclevision.com/ 。 8. Neverends:有 2 次免费体验,操作傻瓜,网址:https://neverends.life/create 。 9. SD:Animatediff SVD deforum 。 10. Morph Studio:还在内测,网址:https://app.morphstudio.com/ 。 11. Dreamina:剪映旗下,动作幅度有很大升级,网址:https://dreamina.jianying.com/ 。 12. 七火山:网址:https://etna.7volcanoes.com/?ref=pidoutv.com 。 更多的文生视频的网站可以查看这里:https://www.waytoagi.com/category/38 。 需要注意的是,这些工具均适合于不同的使用场景和需求,您可以根据自己的具体情况进行选择。内容由AI大模型生成,请仔细甄别。
2025-02-06
DeepSeek可以文生图吗
DeepSeek 可以文生图。 DeepSeek 深夜发布的大一统模型 JanusPro 将图像理解和生成统一在一个模型中。全新的 Emu3 仅通过预测下一个 token 这一建模范式进行训练,可完成文本、图像、视频三种模态数据的理解和生成。Emu3 支持高质量文生图,支持灵活的分辨率和风格。 JanusPro7B 远好于 Janus,更稳定,提示词更短。JanusPro 是一个统一理解和生成多模态语言模型(MLLM),它将多模态理解和生成的视觉编码解耦。 此外,DeepSeek 开源的多模态模型 JanusPro 寓意古罗马双面神雅努斯,既能进行视觉理解,也能生成图像。与 DALLE 3 相比,JanusPro 在参数上领先,并具备图像识别、地标识别等多种能力。该模型通过更优化的训练策略、更海量的数据和更大规模的参数(70 亿)实现了更强的智能表现。
2025-02-05
文生视频的 AI 能力
以下是关于文字生成视频的 AI 能力的相关信息: 文字生成视频的 AI 产品有: 1. Pika:擅长动画制作,支持视频编辑。 2. SVD:可在 Stable Diffusion 图片基础上直接生成视频,是 Stability AI 开源的 video model。 3. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但收费。 4. Kaiber:视频转视频 AI,能将原视频转换成各种风格的视频。 5. Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多的文生视频的网站可以查看:https://www.waytoagi.com/category/38 (内容由 AI 大模型生成,请仔细甄别) 对于视频模型的评估,可从以下方面全面评估 AI 视频生成模型的各种能力: |测试类型|提示词(Prompt)| ||| |生成质量|“A highresolution 4K video of a sunset over the ocean with smooth transitions.”| |生成速度|“A short 10second clip of a running dog in a park.”| |一致性|“A person walking from left to right across the screen with consistent motion and background.”| |多样性|“A fantasy world with dragons flying in the sky and wizards casting spells.”| |可控性|“Generate a video of a beach scene with a setting sun and seagulls flying,with the ability to change the weather from sunny to cloudy.”| |音频生成|“A video of a thunderstorm with synchronized sound effects of thunder and rain.”| |界面友好度|“Test the user interface by generating a video of a mountain landscape with easytouse controls for adjusting the time of day and weather conditions.”| |可定制性|“Create a video of a city street with customizable options for the number of people,types of vehicles,and time of day.”| |计算资源|“Generate a 30second video of a busy market scene and measure the CPU,GPU,and memory usage.”| |运行成本|“Produce a 2minute educational video on the water cycle,evaluating the cost efficiency for longer videos.”| |错误处理|“Generate a video with an incomplete prompt to test how the model handles missing information.”| OpenAI 发布的首款文生视频模型 Sora 具有强大的能力,不仅能根据文字指令创造逼真且充满想象力的场景,还能生成长达 1 分钟的超长视频,且一镜到底。在视频中的女主角、背景人物等方面都达到了惊人的一致性,各种镜头随意切换,人物保持了神一般的稳定性。相比之下,Runway Gen 2、Pika 等 AI 视频工具在几秒内的连贯性方面还有待突破。
2025-02-05
文生图
以下是关于文生图的相关知识: 1. 简明操作流程: 定主题:明确生成图片的主题、风格和要表达的信息。 选择基础模型 Checkpoint:根据主题选择贴近的模型,如麦橘、墨幽的系列模型。 选择 lora:寻找与生成内容重叠的 lora,以控制图片效果和质量。 ControlNet:可控制图片中特定的图像,如人物姿态、特定文字等,属于高阶技能。 局部重绘:下篇再教。 设置 VAE:选择 840000 即可。 Prompt 提示词:用英文写需求,使用单词和短语组合,用英文半角逗号隔开。 负向提示词 Negative Prompt:用英文写要避免产生的内容,单词和短语组合并用英文半角逗号隔开。 采样算法:一般选 DPM++2M Karras,也可参考模型作者推荐的采样器。 采样次数:根据采样器特征,选 DPM++2M Karras 时在 30 40 之间。 尺寸:根据喜好和需求选择。 2. 提示词: Stable Diffusion 的生成方式主要分为文生图和图生图两种,文生图仅通过正反向词汇描述发送指令。 文本描述分为内容型提示词和标准化提示词,内容型提示词用于描述想要的画面,如“1 个女孩,黑发,长发,校服,向上看,短袖,粉红色的花,户外,白天,蓝色的天空,云,阳光,上身,侧面”。 采样迭代步数通常控制在 20 40 之间,采样方法常用的有 Euler a、DPM++2S a Karras、DPM++2M Karras、DPM++SDE Karras、DDIM 等,有的模型有指定算法,搭配更好用。 比例设置为 800:400,尺寸并非越大越好,模型练图基本按 512x512 框架,可点选高清修复放大图像倍率。 3. 文生图工具: DALL·E:OpenAI 推出,可根据文本描述生成逼真图片。 StableDiffusion:开源,能生成高质量图片,支持多种模型和算法。 MidJourney:图像生成效果好,界面设计用户友好,在创意设计人群中流行。 在 WaytoAGI 网站(https://www.waytoagi.com/category/104 )可查看更多文生图工具。
2025-02-02
文生图如何提高字在图中的准确率
要提高文生图中字在图中的准确率,可以从以下几个方面入手: 1. 数据准备: 对于中文文字的生成,Kolors从两个方面准备数据。一是选择 50000 个最常用的汉字,机造生成了一个千万级的中文文字图文对数据集,但机造数据真实性不足。二是使用 OCR 和 MLLM 生成海报、场景文字等真实中文文字数据集,大概有百万量级。 Hugging 和英特尔发布了提高文生图模型空间一致性的方案,包括一个详细标注了空间关系的 600 万张图片的数据集,模型和数据集都会开源。 2. 模型能力: DALLE 3 和 SD3 已经有了很强的英文文字生成能力,但目前还未有模型具有中文文字的生成能力。中文文字的生成存在困难,一是中文汉字的集合大且纹理结构复杂,二是缺少中文文字的图文对数据。 作者观察到,使用机造数据结合高质量真实数据后,中文文字生成能力的真实性大大提升,而且即使是真实数据中不存在的汉字的真实性也得到了提升。 3. 训练方法: 在包含大量物体的图像上进行训练,可以显著提高图像的空间一致性。 此外,在写文生图的提示词时,通常的描述逻辑是这样的:人物及主体特征(服饰、发型发色、五官、表情、动作),场景特征(室内室外、大场景、小细节),环境光照(白天黑夜、特定时段、光、天空),画幅视角(距离、人物比例、观察视角、镜头类型),画质(高画质、高分辨率),画风(插画、二次元、写实)。通过这些详细的提示词,能更精确地控制绘图。对于新手而言,还有一些功能型辅助网站来帮我们书写提示词,比如:http://www.atoolbox.net/ 、https://ai.dawnmark.cn/ 。还可以去 C 站(https://civitai.com/)里面抄作业。但要注意图像作者使用的大模型和 LORA,不然即使参数一样,生成的图也会截然不同。
2025-01-29