直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

你知道AI模拟NPC有什么项目吗?

回答

以下是一些 AI 模拟 NPC 的项目:

  1. Character.ai:是一个 AI 虚拟陪伴平台,用户可与数百个 AI 驱动的角色交流,包括名人、动漫角色等,还能创建自己的角色并赋予其描述、图像、个性等特性。
  2. Replika:一款 AI 虚拟陪伴应用,用户能设计理想伴侣,其会存储记忆并在未来对话中参考,甚至发送照片。
  3. Talkie:主打情感路线的 AI 虚拟陪伴应用,设计有大量 NPC,游戏和休闲娱乐体验感更强,每个 NPC 都带有自己的剧情体系,交流中会触发抽取卡牌机会。
  4. Inworld AI:开发了 Inworld 的 AI 角色引擎,可将游戏的 NPC 进行 AI 化并集成到游戏中。该引擎超越大语言模型,增加可配置的安全性、知识、记忆、叙事控制、多模态等功能,使 NPC 能够自我学习和适应,具有情绪智能。
  5. Suck Up!:这是一款 AI 冒险独立游戏,没有固定脚本,由 AI 实时生成剧情,地图中的每个 NPC 都由 LLM 实时驱动,玩家通过语音输入,AI 结合玩家服装、环境等实时判断与输出结果并做出反应。游戏中加入了换装要素,不同装束会引起 NPC 不同反应。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

问: 现在 AI 虚拟陪伴有哪些产品和项目?

AI虚拟陪伴是一个新兴的领域,已经有一些产品和项目在这个领域中取得了显著的进展。以下是一些例子:1.Character.ai:这是一个AI虚拟陪伴平台,用户可以与数百个AI驱动的角色进行信息交流,包括名人、动漫角色等。用户还可以创建自己的角色,赋予他们描述、图像、个性,甚至更高级的特性。2.Replika:这是一款AI虚拟陪伴应用,用户可以设计理想的伴侣,随着时间的推移,你们的关系会有所发展。你的Replika会存储记忆,以便在未来的对话中参考,甚至可以给你发送照片。3.Talkie:这是一款AI虚拟陪伴应用,主打情感路线。Talkie中设计有大量的npc,游戏和休闲娱乐体验感更强,每个npc即带着一个自己的剧情体系,在与角色交流过程中会触发抽取卡牌机会。以上产品和项目都在尝试通过AI技术来满足人们在社交、情感、陪伴、支持等需求。但是,每个产品和项目都有其特定的应用场景和功能,建议您根据自己的具体需求来选择合适的产品或项目。内容由AI大模型生成,请仔细甄别

Inworld AI :可以使NPC能够自我学习和适应,具有情绪智能!

https://twitter.com/xiaohuggg/status/1687047341969440768?s=46Inworld AI是一家专注于游戏和人工智能的初创公司,他们开发了一种名为Inworld的AI角色引擎,它可以将游戏的NPC进行AI化,并可以集成到游戏当中。这个引擎超越了大语言模型,增加了可配置的安全性、知识、记忆、叙事控制、多模态等功能。它可以使NPC能够自我学习和适应,具有情绪智能!Inworld的角色引擎可以创建具有独特个性和上下文意识的角色,这些角色可以无缝地集成到实时应用中,同时内置了优化规模和性能的功能。这个引擎可以让AI非玩家角色(NPC)通过模拟人类的全方位沟通方式(包括语言、手势、表情和动作)来表达个性。为了让NPC更加人性化,他们开发了Character Brain(性格大脑)引擎这种引擎不仅仅是一个对话AI,它使AI NPC能够学习和适应,具有情绪智能的关系导航能力,具有记忆和回忆能力,并能够自主地发起目标,执行动作并遵循自己的动机。它的功能包括:1、目标和行动:使用定义的触发器、意图识别和动机来触发角色对玩家行为的反应,并在游戏中驱动交互。允许你驱动响应玩家输入的NPC行为,以一种动态和自定义的方式。

这款AI冒险独立游戏玩的就是骗人,上线三周油管播放超千万!

Suck Up!这款游戏“没有固定脚本,而是由AI实时生成剧情”,地图中的每一个NPC都由LLM实时驱动,玩家在游戏过程中通过语音进行输入,再由AI结合玩家服装、环境等实时进行判断与结果输出,最后做出包括追问、开门、或者拒绝的一系列反应。和一般有AI NPC的游戏不同,Suck Up!中的AI不是用来单纯聊天的,而是用来欺骗的:面对头戴耳机的NPC就说自己是个rapper面对医生就说自己受了伤急需治疗还有玩家在面对老奶奶居民的时候大喊“我从小就没有奶奶你能不能暂时当我的奶奶”套路层出不穷,这些五花八门的急中生智的借口给游戏增添不少喜剧效果。我大明湖畔的奶奶哥,你戴个马桶搋子,谁会开门换个贝雷帽,味儿对了。你说你是法国帅哥,我信了当然,只靠一张嘴还有些单调。为了丰富游戏性和平衡体验,制作组在游戏中特地加入了换装这个要素。你可以选择一些“貌似正常”的衣服——在头上戴一个雪糕筒假装是艺术家,又或者在干掉一位居民的时候拾取他们的装备来一场酣畅淋漓的cosplay……总之,不同装束也会引起NPC不同的反应,也算是另一种形式的常玩常新。

其他人在问
制作图片的AI工具,名字好像叫comfyUI
ComfyUI 是一个基于节点流程式的 stable diffusion AI 绘图工具 WebUI。 其优势包括: 1. 对显存要求相对较低,启动和出图速度快。 2. 生成自由度更高。 3. 可以和 webui 共享环境和模型。 4. 能搭建自己的工作流程,可导出并分享,报错时能清晰定位错误。 5. 生成的图片拖进后会还原整个工作流程,模型也会选择好。 劣势在于: 1. 操作门槛高,需要清晰的逻辑。 2. 生态不如 webui 丰富,但有针对其开发的有趣插件。 您可以从 github 上下载作者部署好环境和依赖的整合包,按照官方文档安装,官方链接为:https://github.com/comfyanonymous/ComfyUI 。 此外,有人认为如果 contornet 让 AI 绘画从玩具变成工具,那 ComfyUI 就是制作工具的工具。同时,藏师傅介绍了用 ComfyUI 三步制作任意公司周边图片的流程,整个流程分为获取 Logo 图片的描述、根据描述和生成意图生成图片提示词、将图片和提示词输入 ComfyUI 工作生成。
2024-11-23
最新的AI资讯
以下是为您提供的最新 AI 资讯: 新手学习 AI 方面:AI 是快速发展的领域,新的研究成果和技术不断涌现。您可以关注 AI 领域的新闻、博客、论坛和社交媒体,保持对最新发展的了解。考虑加入 AI 相关的社群和组织,参加研讨会、工作坊和会议,与其他 AI 爱好者和专业人士交流。 AIGC Weekly 32 方面: Netflix 列出了一个年薪 90 万美元的机器学习平台产品经理的 AI 产品工作岗位: Shopify 的 AI 助手现已上线。Sidekick 是一个帮助机器人,它知道如何在 Shopify 中执行任何操作提取相关数据、操作新功能或创建报告: Artifact(Ins 创始人做的 AI 新闻浏览软件)推出了自定义内容阅读语音的功能: OpenAI、谷歌、微软和 Anthropic 组建了前沿模型论坛,主要目的是确保 AI 模型的安全发展: Open AI 悄咪咪下线了他们的 ChatGPT 生成内容的检测器: 2024 人工智能报告方面: 全球芯片出口管制下,中国仍成重要市场。美国商务部长吉娜·雷蒙多警告英伟达,中国在美芯片制造商中所占的份额正在减少。字节跳动通过美国的甲骨文租用 NVIDIA H100 访问权限,而阿里巴巴和腾讯则与 NVIDIA 就在美国建立自己的数据中心进行谈判。与此同时,谷歌和微软直接向中国大型企业推销他们的云服务。 模型变得更便宜了。以前认为提供强大模型的成本过高,但现在提供这些模型的推断成本正在下降。OpenAI 更达到 100 倍下降!Google Gemini 生产了一种具有很强竞争力的定价系列!Gemini 1.5 Pro 和 1.5 Flash 的价格在推出后几个月内下降了 64%86%,而性能强劲,例如 Flash8B 比 1.5 Flash 贵 50%,但在许多基准测试中表现相当。注意:价格适用于<128K 令牌提示和输出。检索日期为 2024 年 10 月 4 日。考虑到计算成本很高,模型构建者越来越依赖与大型科技公司建立合作伙伴关系。反垄断监管机构担心这将进一步巩固现有公司的地位。
2024-11-23
那个文生视频或图生视频的AI可以生成融合变化的效果
以下是关于文生视频或图生视频的 AI 生成融合变化效果的相关信息: 在人工智能技术迅速发展的当下,AI“词生卡”技术兴起,它将文字描述转化为视觉图像,重塑了创意产业格局。AI 的多模态输出能力已基本成型,包括文生文、文生图、文生码、文生视频、图生视频等,但大多在某个维度能力强,跨界融合还不够。 从生成方式分类,AI 视频生成包含: 1. 文生视频、图生视频,如 Runway、Pika labs、SD + Deforum、SD + Infinite zoom、SD + AnimateDiff、Warpfusion、Stability Animation 等。 一些热门产品如 Luma AI,其 Dream Machine 目前支持 txt2vid 文生视频和 img2vid 图生视频两种能力,8 月底最新发布的 Dream Machine 1.5 增强了提示词理解能力和视频生成能力。Luma AI 的 img2vid 生成效果在多方面表现出色,如生成时长较长、运动幅度大、能产生相机多角度位移、运动过程一致性保持较好、分辨率高且有效改善模糊感等。
2024-11-23
怎么用ai制作由人变成动物的视频
以下是使用 AI 制作由人变成动物视频的方法: 一、创建视频内容 1. 准备内容 先准备一段视频中播放的内容文字,可以是产品介绍、课程讲解、游戏攻略等任何您希望推广让大家了解的文字。 您也可以利用 AI 来生成这段文字。 2. 制作视频 使用剪映 App 对视频进行简单处理。电脑端打开剪映 App,点击“开始创作”。 选择顶部工具栏中的“文本”,点击默认文本右下角的“+”号,为视频添加一个文字内容的轨道。 在界面右侧将准备好的文字内容替换默认文本内容。 二、生成数字人 1. 生成数字人 在剪映右侧窗口顶部,打开“数字人”选项,选取一位免费且适合的数字人形象,如“婉婉青春”。 选择数字人形象时,软件会播放其声音,可判断是否需要,点击右下角“添加数字人”,软件会根据提供的内容生成对应音视频并添加到当前视频轨道中。 左下角会提示渲染完成时间,完成后可点击预览按钮查看效果。 2. 增加背景图片 删除先前导入的文本内容。 点击左上角“媒体”菜单,点击“导入”按钮,选择本地一张图片上传。 点击图片右下角的加号将图片添加到视频轨道上(会覆盖数字人)。 点击轨道最右侧的竖线,向右拖拽直到视频最后,使图片在整个视频播放时都显示。 选中背景图片所在轨道,拖动图片的角将其放大到适合尺寸,并将数字人拖动到合适位置。 此外,如果您想创作一个生物融合成新物种的视频,例如猪和老鹰融合成一个新的物种,以 GPT4 为例的制作教程如下: 1. 故事情节的构思 构思一个吸引人的故事情节,比如新物种的起源故事,结合猪和老鹰的特点以及这种融合带来的独特能力和挑战,考虑添加神秘或奇幻元素增强阴暗风格。 2. 视觉效果的设计 使用 3D 建模和特效技术创造出既霸气又具有阴暗风格的新物种形象,高质量的视觉效果和流畅的动画能吸引更多观众并提高视频的分享率。 3. 音乐和声音设计 配置适当的背景音乐和声效,以增强视频的氛围,选择能激起观众情绪的音乐和声音效果,让视频更加引人入胜。 4. 社交媒体互动
2024-11-23
AI分镜
以下是关于《李清照》AI 视频创作的分镜内容: |分镜|子分镜|分镜主视觉|配音|角色|配音|画面| |||||||| |8|0801<br>0802|嗯~谁在叫我<br>小姑娘,你从哪里来?你叫什么名字呀?|王维||| |9|0901 疑惑<br>0902 诗文|疑惑自言自语<br>疑惑的表情<br>看到明月松间照,清泉石上流惊喜|我叫什么名字呢?(疑惑)<br>哦~(惊讶)<br>李清照吟诵:明月松间照,清泉石上流。|少年李清照|| |10|1001 惊喜<br>1002 照清高亮|李清照灵机一动<br>墙上诗:明月松间照,清泉石上流。照和清高亮显示|背景音效:灵机一动|||| |11|11 得意|李清照脸部特写,惊喜表情|我叫李清照(高兴)|少年李清照|| |12|12 王维沉思|王维沉思|李清照~李清照,好名字、好名字|王维|| |13|13 夜景|明月下溪水潺潺|王维吟诵:明月松间照,清泉石上流。|王维|| |20|20|画面穿越到当代写字楼办公室|忙乱和电话铃声|背景声|| |21|21|面对电脑的李清照一脸茫然|||| |22|22|旁边两个同事聊天|你们打算什么时间要孩子?<br>要孩子,要什么孩子,我们是丁克家庭。|同事甲<br>同事乙|| |23|23|李清照满脑子疑惑,丁克是什么意思|疑问背景音|背景声|| |24|24|李清照查询丁克的意思,发现是不要孩子的家庭。|||| |25|25|旁边两个同事聊天|那你不打算结婚吗?<br>我才 30 岁,结哪门子婚,我的环游世界梦想还没有实现呢|同事甲<br>同事乙|| |26|26|李清照满脑子疑惑,为什么可以不结婚?怎么生活?|疑问背景音|背景声|| |27|27|李清照开始查阅资料|清照~清照~你不下班吗?<br>哦哦~我查点资料|同事甲<br>李清照|| |1||远景一个古装小女孩草丛中嬉戏|背景音乐:小女孩嬉戏声|||| |2|0201 欢快<br>0202 疑惑|李清照与蝴蝶对话:远景、特写|蝴蝶:你叫什么名字呀?(欢快)<br>李清照:嗯~嗯~我叫什么名字呢?(疑惑)|蝴蝶<br>少年李清照|| |3|0202 放大|李清照特写|||| |4|04 穿越唐代|李清照满是疑惑|画外音:这是什么地方?(疑惑)|少年李清照|| |5|《辋川别业》建筑|写有《辋川别业》的古代建筑|辋川别业、辋川别业,难到这是王维的住处!(恍然大悟)|少年李清照|| |6|06|《维摩诘诗集》特写|真的是王维(高兴)|少年李清照|| |7|07|李清照高兴奔向王维|王伯伯~王伯伯~(高兴)|少年李清照||
2024-11-23
学习AI
以下是针对新手学习 AI 的建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,可根据自己的兴趣选择特定模块深入学习。 掌握提示词的技巧,其上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库中有很多大家实践后的作品、文章分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解其工作原理和交互方式。 对于中学生学习 AI,建议如下: 1. 从编程语言入手学习: 从 Python、JavaScript 等编程语言开始,学习编程语法、数据结构、算法等基础知识。 2. 尝试使用 AI 工具和平台: 使用 ChatGPT、Midjourney 等 AI 生成工具,体验 AI 的应用场景。 探索面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识: 了解 AI 的基本概念、发展历程、主要技术如机器学习、深度学习等。 学习 AI 在教育、医疗、金融等领域的应用案例。 4. 参与 AI 相关的实践项目: 参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动。 尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 5. 关注 AI 发展的前沿动态: 关注 AI 领域的权威媒体和学者,了解 AI 技术的最新进展。 思考 AI 技术对未来社会的影响,培养对 AI 的思考和判断能力。 记住,学习 AI 是一个长期的过程,需要耐心和持续的努力。不要害怕犯错,每个挑战都是成长的机会。完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。
2024-11-23
通过ai建立游戏npc
以下是关于通过 AI 建立游戏 NPC 的相关信息: Inworld AI 是一家专注于游戏和人工智能的初创公司,其开发的 Inworld 角色引擎可以将游戏的 NPC 进行 AI 化并集成到游戏中。该引擎超越了大语言模型,增加了可配置的安全性、知识、记忆、叙事控制、多模态等功能,能使 NPC 自我学习和适应,具有情绪智能。 Inworld 的角色引擎具有以下特点和功能: 1. 可以创建具有独特个性和上下文意识的角色,无缝集成到实时应用中,内置优化规模和性能的功能。 2. 让 AI 非玩家角色(NPC)通过模拟人类的全方位沟通方式(包括语言、手势、表情和动作)来表达个性。 3. 开发了 Character Brain(性格大脑)引擎,使 AI NPC 能够学习和适应,具有情绪智能的关系导航能力,具有记忆和回忆能力,并能够自主地发起目标,执行动作并遵循自己的动机。 4. 功能包括: 目标和行动:使用定义的触发器、意图识别和动机来触发角色对玩家行为的反应,并在游戏中驱动交互。 长期记忆:角色以类似人类的记忆功能操作,从闪存和长期记忆中检索信息,创建吸引玩家回归的引人入胜的体验。 个性:通过使用自然语言创建不同的个性,添加关于角色背景故事、动机和缺点的丰富细节,使角色生动起来。 情绪:Inworld 角色能够对与用户的互动表达情绪,情绪可以映射到动画、目标和触发器。 实时语音:使用内置的语音设置进行最小延迟,并配置角色的性别、年龄、音调和说话速度。或者,使用来自 Eleven Labs 的第三方服务创建自定义和克隆语音。 Inworld AI 的"Contextual Mesh"功能还提供了以下方式来定制 AI 非玩家角色(NPC)的行为和知识: 1. 可配置的安全性:可以配置 NPC 的对话方式,在诸如亵渎、暴力、成人话题、酒精、药物使用、政治和宗教等话题上有一定灵活性。 2. 知识:可以输入"个人知识"来控制他们的角色应该知道或不应该知道的信息,使用"共享知识"来定义多个角色拥有的知识,如共享的传说、世界背景等。 3. 玩家档案:收集关于玩家的信息,并允许 NPC 在形成互动时考虑到这些信息。 4. 关系:通过配置每个角色的关系流动性设置,让玩家有能力与 NPC 建立关系。 5. 第四堵墙:确保角色只从他们的世界中存在的知识中获取信息,创建更沉浸的故事讲述和游戏体验。 Inworld 可以与各种游戏引擎(如 Unity、Unreal Engine 等)和其他游戏开发工具无缝对接,使得开发者可以更容易地在他们的游戏中引入 AI NPC。Inworld AI 还可以帮助品牌能够创建交互性强的 AI 角色,无需编码。 此外,电子游戏与人工智能的结合有着广泛的可能,包括玩家建模、辅助设计、代码辅助和代码自动生成等等。其中与游戏直接相关的应用主要包括构建游戏中的智能体、构建玩游戏的智能体、程序化内容生成(Procedural Content Generation,PCG)。“构建游戏中的智能体”是指构建游戏的非玩家角色(Nonplayer character),也就是常说的 NPC,包括构建智能对象,创建其移动、寻路、攻击等行为,以及对话等交互行为。
2024-10-21
有什么工具专门用来进行模拟辩论的吗?
以下是一些可用于模拟辩论的工具和方法: 1. 基于 GPT4 的谈判模拟器: 作为 AI 导师,会保持沉默观察和策划。进行 6 轮后引导用户做重要决策,结束谈判。挑战用户了解关键谈判概念,如提问重要性、判断事物价值等。角色扮演结束后,以导师身份提供反馈、建议,并创建包含重要要点的文件和链接。 作为游戏主持 AI,先为用户设定场景,根据用户回答提出 3 种场景供选择,提供细节后宣布“开始角色扮演”,然后扮演对手角色进行谈判。 2. 法律相关的模拟辩论: 可以通过 Prompt 指令词模拟涉及知识产权侵权、股东权益、劳动法等方面的法庭辩论,分析原告和被告的观点及抗辩理由。 需要注意的是,AI 目前发展迅速,相关工具和方法可能会被先进技术取代,但其中的思维、场景和逻辑能带来启发。
2024-11-15
有哪些AI 语音对话工具能模拟英语六级的口语考试场景
以下是一些能够模拟英语六级口语考试场景的 AI 语音对话工具: 1. Coze: 首先打开其首页,点击左上角的创建 AI Bot 按钮。 在弹窗输入 Bot 的相关信息,完成创建后细化功能。 设计人设与回复逻辑,根据需求调整模型设置,如将对话轮数改为 20 轮。 使用英文名言警句、Simple OCR 等插件。 设置开场白和预置问题,选择亲切的英语音色。 2. 语言学习应用: Duolingo:使用 AI 个性化学习体验,根据进度和错误调整练习内容,通过游戏化方式提供词汇、语法、听力和口语练习。下载应用,选择语言,按课程指引学习。 Babbel:结合 AI 技术提供个性化课程和练习,重点在实际交流所需技能。注册账户,选择课程,按学习计划学习。 Rosetta Stone:使用动态沉浸法,通过 AI 分析进度,提供适合练习和反馈。注册并选择语言,使用多种练习模式学习。 3. AI 对话助手: ChatGPT:可模拟对话练习,提高交流能力。在聊天界面选择目标语言,与 AI 对话,询问语法、词汇等问题,模拟实际交流场景。 Google Assistant:支持多种语言,可进行日常对话练习和词汇学习。设置目标语言,通过语音命令或文本输入互动,练习日常用语。
2024-10-16
能够模拟心理咨询对话的AI有哪些?
市场上存在一些能够模拟心理咨询对话的 AI 产品,例如: 1. Woebot:这是一个基于聊天机器人的心理健康平台,通过对话方式帮助用户探索和处理情绪问题,使用认知行为疗法(CBT)原理引导用户进行自我反思和情绪管理。 2. Replika:AI 驱动的个人 AI 朋友,通过日常对话提供情感支持和心理健康指导。 3. Talkspace:在线心理咨询平台,提供与专业心理咨询师进行视频、音频或文本会话的服务,也使用 AI 技术匹配用户与适合的咨询师。 4. Wysa:AI 心理健康应用,提供情绪管理和心理健康支持,结合了 AI 聊天机器人和人类专家的支持。 5. Moodfit:心理健康和情绪跟踪应用,使用 AI 算法分析用户情绪模式,并提供个性化建议和干预措施。 6. Youper:结合了 AI 和虚拟现实(VR)的心理健康平台,通过沉浸式体验和 AI 辅助对话改善用户情绪和心理健康。 需要注意的是,虽然这些 AI 可以提供初步支持和建议,但对于严重的心理健康问题,仍需寻求专业心理咨询师或医生的帮助。此外,AI 心理咨询产品应作为传统心理咨询的补充,而非替代品。在使用时,用户应保持谨慎,并确保其使用符合当地法律和伦理标准。早期研究发现,像 Woebot 和 Wysa 这样的产品在治疗心理健康问题方面可能有效,且已获得相关认证。在成年人心理健康状况不容乐观且治疗师存在全国性短缺的情况下,聊天机器人可能是部分非急性病例的可行解决方案。
2024-10-15
AI可以做社会学模拟实验吗
AI 可以做社会学模拟实验。例如,在游戏领域,有过类斯坦福小镇游戏——伊甸岛,它既是游戏也是基于 Generative AI 的社会实验虚拟模拟。在这个模拟中,让每个 AI 都有自己的角色身份,通过 AI 与 AI 以及 AI 与玩家的互动,产生可归纳枚举的游戏行为,最后进行剧情包装时,让 AI 根据自身和玩家的行为通过大语言模型进行二次创作,类似 AI 剧本杀。另外,也期待看到更多使用基础模型进行模拟社会科学的研究,通过不同方式 prompt 基础模型并观察相关性,来复制社会科学中的一些显著成果。现代人工智能还有一个有前途的应用是建立“可重复的角色”,具有某些特征的有效行为像人类的实体,可在其上进行物理科学中典型的大规模可重复实验。
2024-10-08
模拟真人绘画的AI有哪些
以下是一些模拟真人绘画的 AI 相关内容: 小码哥:提供了多种以汉服为主题的 AI 绘画描述,如可爱的小老鼠、小龙、小猴、小鸡等穿着汉服的形象,涉及 Pixar 风格、超清晰细节、电影灯光等元素。 探讨了 AI 艺术的相关概念,包括从语言学角度研究提示词,以及对 AI 艺术本体形态的思考,如生成式空间计算的使命是创造生命体验。 提到生成式 AI 在视觉效果方面的应用,以漫画家 Yoko Li 为例,训练的模型能够模仿生成图像,在经济效益、创造新风格和概念的灵活性以及生成完整工作成果的能力等方面具有优势,这种变化不仅限于图像,还适用于整个设计领域。但 AI 模型生成的图像拥有一个非白色背景。
2024-10-08
我想让ai模拟抖音网红说话,有最佳实践可以参考吗?
目前暂时没有关于让 AI 模拟抖音网红说话的最佳实践内容。但一般来说,您可以先分析一些抖音网红的语言特点,比如常用的词汇、语气、口头禅、表达方式等,然后为 AI 提供这些特征的描述和示例,让其学习和模仿。同时,您还可以通过不断调整输入的提示词和训练数据,来优化 AI 的模拟效果。
2024-09-29
ai 语音,ai语音,ai 文转语音,有哪些成功的商业化落地项目吗
以下是一些成功的 AI 语音商业化落地项目: 语音合成(TTS)方面: :为所有人提供开放的语音技术。 :基于 AI 的语音引擎能够模仿人类语音的情感和韵律。 :基于 NLP 的最先进文本和音频编辑平台,内置数百种 AI 声音。 :使用突触技术和脑机接口将想象的声音转化为合成 MIDI 乐器的脑控仪器。 :为出版商和创作者开发最具吸引力的 AI 语音软件。 :使用户能够使用文本转语音技术生成播客。 :基于生成机器学习模型构建内容创作的未来。 :从网页仪表板或 VST 插件生成录音室质量的 AI 声音并训练 AI 语音模型。 :演员优先、数字双重声音由最新的 AI 技术驱动,确保高效、真实和符合伦理。 :将书面内容转化为引人入胜的音频,并实现无缝分发。 :专业音频、语音、声音和音乐的扩展服务。 (被 Spotify 收购):提供完全表达的 AI 生成语音,带来引人入胜的逼真表演。 :利用合成媒体生成和检测,带来无限可能。 :一键使您的内容多语言化,触及更多人群。 :生成听起来真实的 AI 声音。 :为游戏、电影和元宇宙提供 AI 语音演员。 :为内容创作者提供语音克隆服务。 :超逼真的文本转语音引擎。 :使用单一 AI 驱动的 API 进行音频转录和理解。 :听起来像真人的新声音。 :从真实人的声音创建逼真的合成语音的文本转语音技术。 :生成听起来完全像你的音频内容。 语音转录方面: :为聋人和重听者提供专业和基于 AI 的字幕(转录和说话人识别)。 :专业的基于 AI 的转录和字幕。 :混合团队高效协作会议所需的一切。 :音频转录软件 从语音到文本到魔法。 :99%准确的字幕、转录和字幕服务。 :为语音不标准的人群提供的应用程序。 :通过 AI 语音识别实现更快速、更准确的语音应用。 :会议的 AI 助手。 :让孩子们的声音被听见的语音技术。 :使用语音识别自动将音频和视频转换为文本和字幕的 SaaS 解决方案。 :实时字幕记录面对面小组会议中的发言内容。 :理解每个声音的自主语音识别技术。 :支持 35 多种语言的自动转录。 :端到端的边缘语音 AI,设备上的语音识别。
2024-11-19
认为如果我是一个大学生,想要通过大模型去参加项目什么样的方向会比较好我应该做一个怎样的大模型?
对于大学生想要通过大模型参加项目,以下是一些方向和相关知识: 大模型的概念: 通俗来讲,大模型是输入大量语料,让计算机获得类似人类的“思考”能力,能够进行文本生成、推理问答、对话、文档摘要等工作。可以用“上学参加工作”来类比大模型的训练和使用过程: 1. 找学校:训练大模型需要大量计算,GPU 更合适,只有有资本购买大量 GPU 的才有能力训练自己的大模型。 2. 确定教材:大模型需要大量的数据量,几千亿序列(Token)的输入基本是标配。 3. 找老师:即选择合适的算法让大模型更好地理解 Token 之间的关系。 4. 就业指导:为了让大模型更好地胜任某一行业,需要进行微调(fine tuning)指导。 5. 搬砖:就业指导完成后,进行如翻译、问答等工作,在大模型里称之为推导(infer)。Token 被视为模型处理和生成的文本单位,会对输入进行数字化形成词汇表。 大模型的训练: 一般训练会有 3 个步骤,每个步骤都需要资金投入。 1. 无监督学习:模型通过分析大量文本数据,学习语言的基本结构和常识,具备文本补齐能力而非直接回答问题,将人类的知识通过向量化的方法转换,从而获得基础的语言模型。 2. 清洗出好的数据。 3. 指令微调:模型被训练以理解并执行具体指令,如翻译文本,从而能够回答问题。输入内容包括 3 个部分,中间可能有分隔符。还有对齐过程,通过引入人类的评价标准和处理特定格式要求,进一步优化模型的输出以符合人类的期望。 大模型的微调: 在人工智能领域,通常会根据应用领域将大模型分为通用大模型和领域特定模型。通用大模型如 GPT4.0、GPT3.5 等,通过训练获得广泛的自然语言理解能力,但在特定领域表现可能不理想。微调是对大模型针对特定领域进行的训练过程,通过在特定领域的数据上训练模型,优化所有层的参数,提高其在该领域的专业性。从头开始训练一个具备自然语言处理能力的大模型需要大量时间和资源,小公司负担不起,微调可以在现有模型基础上更经济、高效地适应新的应用领域。
2024-11-18
比较好用的项目管理的能生成项目进度甘特图的可以免费使用的AI软件有哪些
以下是一些可以免费使用且能生成项目进度甘特图的 AI 软件: 1. 项目管理和任务跟踪工具: Jira:已开始集成 AI 功能,可辅助制定计划、分配任务、跟踪进度等。 Trello:能辅助项目管理。 2. 文档和协作工具: 微软的 Copilot:可集成到 Office 套件中,为项目文档撰写、编辑等提供助手功能。 云存储服务如 Google Drive 也开始提供 AI 驱动的文档管理和协作功能。 3. 创意生成工具: 文心一格、Vega AI 等:可帮助快速生成创意图像素材。 此外,在绘制逻辑视图、功能视图、部署视图方面,以下工具可供选择: 1. Lucidchart:流行的在线绘图工具,支持多种图表创建,包括逻辑视图、功能视图和部署视图,用户可使用拖放界面轻松创建架构图。 2. Visual Paradigm:全面的 UML 工具,提供创建各种架构视图的功能。 3. ArchiMate:开源的建模语言,与 Archi 工具一起使用可创建逻辑视图。 4. Enterprise Architect:强大的建模、设计和生成代码的工具,支持多种架构视图创建。 5. Microsoft Visio:广泛使用的图表和矢量图形应用程序,提供丰富模板。 6. draw.io(现称为 diagrams.net):免费的在线图表软件,支持多种类型图表创建。 7. PlantUML:文本到 UML 的转换工具,可通过编写描述性文本自动生成相关视图。 8. Gliffy:基于云的绘图工具,提供创建架构图的功能。 9. Archi:免费开源工具,用于创建 ArchiMate 和 TOGAF 模型,支持逻辑视图创建。 10. Rational Rose:IBM 的 UML 工具,支持多种视图创建。 如果您需要创建项目管理流程图,可按以下步骤使用 Lucidchart: 1. 注册并登录: 2. 选择模板:在模板库中搜索“项目管理流程图”。 3. 编辑图表:根据项目需求添加和编辑图形和流程步骤。 4. 优化布局:利用 AI 自动布局功能,优化图表外观。 5. 保存和分享:保存图表并与团队成员分享,或导出为 PDF、PNG 等格式。 利用这些 AI 工具,您可以快速、高效地创建专业的示意图,满足各种工作和项目需求。请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-11-14
请告诉我有哪些AI+医疗项目
以下是一些 AI+医疗项目: 蛋白质结构预测和蛋白质合成:用于生成漂亮图片的 AI 也可以帮助科学家研究并设计新的蛋白质。 健康生物制药的研究:AI 极大加速了医疗健康生物制药的研究,在抗癌、抗衰老、早期疾病防治等的研究应用中起着重要作用。 医学:中医应用:将人工智能与中医结合,通过观察口腔、舌苔和抓脉,生成选择题让患者作答,最后 AI 生成药方,目前用于辅助看诊,提高诊疗效率,未来愿景是实现 24 小时独立问诊开药。 AI 洞察:一线医生如何实际使用 ChatGPT:来自纽约时报最新报道,再现了 ChatGPT 在美国一流医院的实际场景。
2024-11-05
字节跳动也被曝出在其秘密研发的大模型项目中存在违规调用 OpenAI 的 API ,你如何看待
2023 年下半年,部分声称性能卓越的中国大模型被揭露为“套壳”产品。如李开复创办的“零一万物”被国外开发者质疑为“套壳”产品,其团队承认在训练过程中沿用了开源架构,但强调是为快速起步。12 月,字节跳动被曝出在其秘密研发的大模型项目中调用了 OpenAI 的 API 并使用 ChatGPT 的输出数据来训练自己的模型。OpenAI 反应迅速坚决,暂停相关账号并表示将进一步调查。字节跳动回应称在 2023 年初技术团队在大模型探索初期有部分工程师将 GPT 的 API 服务用于较小模型的实验性项目研究,且自 2023 年 4 月引入调用规范检查后已停止。此外,不仅国内存在此类现象,24 年也有更多被指“套壳”的事件。同时,提示词攻击在业内是公开的秘密,国内外各大著名的 AI 厂商几乎无一幸免,系统提示处于泄露状态,大模型应用脆弱,数据易被获取。
2024-11-03
最新的开源数字人项目
以下是一些最新的开源数字人项目: 1. 项目地址:https://github.com/wanh/awesomedigitalhumanlive2d ,选择了 live2d 作为数字人躯壳,其驱动方式相比 AI 生成式更可控和自然,相比虚幻引擎更轻量和简单,卡通二次元形象接受度更高。Live2D 的 SDK 驱动方式可参考官方示例:https://github.com/Live2D 。 2. 开源数字人组合方案: 第一步:先剪出音频,使用 https://elevenlabs.io/speechsynthesis 或使用 GPTsovits克隆声音,做出文案的音频。 第二步:使用 wav2lip 整合包,导入视频和音频,对口型得到视频。基础 wav2lip+高清修复整合包下载地址:https://github.com/Rudrabha/Wav2Lip 。产品:https://synclabs.so/ 。 3. 构建数字人灵魂:可借助开源社区的力量,如 dify、fastgpt 等成熟的高质量 AI 编排框架。在开源项目中使用了 dify 的框架,可利用其编排和可视化交互任意修改流程,构造不同的 AI Agent,具体部署过程参考 B 站视频:https://www.bilibili.com/video/BV1kZWvesE25 。如有更高度定制的模型,也可在 Dify 中接入 XInference 等模型管理平台部署自己的模型。数字人 GUI 工程中保留了 LLM、ASR、TTS、Agent 等多个模块,便于扩展。
2024-11-01