Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

你知道AI模拟NPC有什么项目吗?

Answer

以下是一些 AI 模拟 NPC 的项目:

  1. Character.ai:是一个 AI 虚拟陪伴平台,用户可与数百个 AI 驱动的角色交流,包括名人、动漫角色等,还能创建自己的角色并赋予其描述、图像、个性等特性。
  2. Replika:一款 AI 虚拟陪伴应用,用户能设计理想伴侣,其会存储记忆并在未来对话中参考,甚至发送照片。
  3. Talkie:主打情感路线的 AI 虚拟陪伴应用,设计有大量 NPC,游戏和休闲娱乐体验感更强,每个 NPC 都带有自己的剧情体系,交流中会触发抽取卡牌机会。
  4. Inworld AI:开发了 Inworld 的 AI 角色引擎,可将游戏的 NPC 进行 AI 化并集成到游戏中。该引擎超越大语言模型,增加可配置的安全性、知识、记忆、叙事控制、多模态等功能,使 NPC 能够自我学习和适应,具有情绪智能。
  5. Suck Up!:这是一款 AI 冒险独立游戏,没有固定脚本,由 AI 实时生成剧情,地图中的每个 NPC 都由 LLM 实时驱动,玩家通过语音输入,AI 结合玩家服装、环境等实时判断与输出结果并做出反应。游戏中加入了换装要素,不同装束会引起 NPC 不同反应。
Content generated by AI large model, please carefully verify (powered by aily)

References

问: 现在 AI 虚拟陪伴有哪些产品和项目?

AI虚拟陪伴是一个新兴的领域,已经有一些产品和项目在这个领域中取得了显著的进展。以下是一些例子:1.Character.ai:这是一个AI虚拟陪伴平台,用户可以与数百个AI驱动的角色进行信息交流,包括名人、动漫角色等。用户还可以创建自己的角色,赋予他们描述、图像、个性,甚至更高级的特性。2.Replika:这是一款AI虚拟陪伴应用,用户可以设计理想的伴侣,随着时间的推移,你们的关系会有所发展。你的Replika会存储记忆,以便在未来的对话中参考,甚至可以给你发送照片。3.Talkie:这是一款AI虚拟陪伴应用,主打情感路线。Talkie中设计有大量的npc,游戏和休闲娱乐体验感更强,每个npc即带着一个自己的剧情体系,在与角色交流过程中会触发抽取卡牌机会。以上产品和项目都在尝试通过AI技术来满足人们在社交、情感、陪伴、支持等需求。但是,每个产品和项目都有其特定的应用场景和功能,建议您根据自己的具体需求来选择合适的产品或项目。内容由AI大模型生成,请仔细甄别

Inworld AI :可以使NPC能够自我学习和适应,具有情绪智能!

https://twitter.com/xiaohuggg/status/1687047341969440768?s=46Inworld AI是一家专注于游戏和人工智能的初创公司,他们开发了一种名为Inworld的AI角色引擎,它可以将游戏的NPC进行AI化,并可以集成到游戏当中。这个引擎超越了大语言模型,增加了可配置的安全性、知识、记忆、叙事控制、多模态等功能。它可以使NPC能够自我学习和适应,具有情绪智能!Inworld的角色引擎可以创建具有独特个性和上下文意识的角色,这些角色可以无缝地集成到实时应用中,同时内置了优化规模和性能的功能。这个引擎可以让AI非玩家角色(NPC)通过模拟人类的全方位沟通方式(包括语言、手势、表情和动作)来表达个性。为了让NPC更加人性化,他们开发了Character Brain(性格大脑)引擎这种引擎不仅仅是一个对话AI,它使AI NPC能够学习和适应,具有情绪智能的关系导航能力,具有记忆和回忆能力,并能够自主地发起目标,执行动作并遵循自己的动机。它的功能包括:1、目标和行动:使用定义的触发器、意图识别和动机来触发角色对玩家行为的反应,并在游戏中驱动交互。允许你驱动响应玩家输入的NPC行为,以一种动态和自定义的方式。

这款AI冒险独立游戏玩的就是骗人,上线三周油管播放超千万!

Suck Up!这款游戏“没有固定脚本,而是由AI实时生成剧情”,地图中的每一个NPC都由LLM实时驱动,玩家在游戏过程中通过语音进行输入,再由AI结合玩家服装、环境等实时进行判断与结果输出,最后做出包括追问、开门、或者拒绝的一系列反应。和一般有AI NPC的游戏不同,Suck Up!中的AI不是用来单纯聊天的,而是用来欺骗的:面对头戴耳机的NPC就说自己是个rapper面对医生就说自己受了伤急需治疗还有玩家在面对老奶奶居民的时候大喊“我从小就没有奶奶你能不能暂时当我的奶奶”套路层出不穷,这些五花八门的急中生智的借口给游戏增添不少喜剧效果。我大明湖畔的奶奶哥,你戴个马桶搋子,谁会开门换个贝雷帽,味儿对了。你说你是法国帅哥,我信了当然,只靠一张嘴还有些单调。为了丰富游戏性和平衡体验,制作组在游戏中特地加入了换装这个要素。你可以选择一些“貌似正常”的衣服——在头上戴一个雪糕筒假装是艺术家,又或者在干掉一位居民的时候拾取他们的装备来一场酣畅淋漓的cosplay……总之,不同装束也会引起NPC不同的反应,也算是另一种形式的常玩常新。

Others are asking
网络上有关于AI知识的授课,请问标价一般在多少范围内合适
网络上关于 AI 知识的授课,比如“野菩萨”的课程,其内容丰富多样,包括: 预习周课程:涵盖 AI 绘画电脑配置要求、高效 AIGC 创意者的数字人工具包、SD 插件安装方法、画静为动的 AIGC 视频制作讲解等。 基础操作课:包含 AI 绘画通识课、AI 摄影虚拟的真实、AI 电影 穿越的大门等。 核心范式课程:涉及词汇的纸牌屋、核心范式应用、控制随机性等。 SD WebUi 体系课程:包括 SD 基础部署、SD 文生图、图生图、局部重绘等。 ChatGPT 体系课程:有 ChatGPT 基础、核心 文风、格式、思维模型等。 ComfyUI 与 AI 动画课程:包含部署和基本概念、基础工作流搭建、动画工作流搭建等。 应对 SORA 的视听语言课程:涉及通识 欢迎参加电影的葬礼、影像赏析、基础戏剧影视文学等。 该课程标价情况如下: 冠军奖励:4980 课程一份。 亚军奖励:3980 课程一份。 季军奖励:1980 课程一份。 入围奖励:598 野神殿门票一张。 同时,如果想要免费获得这门课程,可以参与 video battle,每期的评委野菩萨老师都非常严格,需要寓意深度审美并存。您可以扫码添加菩萨老师助理,了解更多课程信息。
2025-01-31
AI阅读书籍的最佳实践是什么?
以下是关于 AI 阅读书籍的一些最佳实践: 1. 方法论萃取: 针对不同类型书籍的阅读和记忆方法进行分类,探讨共性方法论。 研究阅读和记忆的思维模型及小技巧。 思考如何优先选择自己“一定看得下去”的书籍,通过目录大纲确定核心内容。 确定一本书的阅读次数和顺序。 考虑读书过程中做笔记还是读完后回忆做大纲。 探索如何教刚毕业的孩子学会有效读书。 根据上述问题的答案设计“书籍阅读助手”“催我读书”等 Prompt,并不断优化和迭代。 2. 成为博物学家: 了解各个领域的知识,在恰当的时候调用。 参考权威、准确、有框架、成体系且好读的推荐书单,如涵盖心理学、人工智能、经济学等 13 个学科的书单。 3. 批判性思考: 思考在哪些情况下使用和不使用 AI 辅助阅读。 避免将 AI 作为默认选项,例如在使用地图导航时,不应完全依赖,而应注重自身对环境的观察和记忆。
2025-01-31
有没有完全免费的AI工具?
以下是一些完全免费的 AI 工具: 绘图方面: draw.io(现在称为 diagrams.net):免费的在线图表软件,支持创建逻辑视图和部署视图等。 PlantUML:文本到 UML 的转换工具,可通过编写描述性文本自动生成序列图、用例图、类图等,帮助创建逻辑视图。 Archi:免费的开源工具,用于创建 ArchiMate 和 TOGAF 模型,支持逻辑视图的创建。 会议内容转文字方面: 飞书妙记:飞书的办公套件之一。 通义听悟:阿里推出的 AI 会议转录工具。 讯飞听见:讯飞旗下智慧办公服务平台。 Otter AI:转录采访和会议纪要。 写代码或辅助编程方面: CodeGeeX:智谱 AI 推出的开源的免费 AI 编程助手,基于 130 亿参数的预训练大模型,可以快速生成代码,帮助开发者提升开发效率。 需要注意的是,部分工具可能存在使用时间限制或功能限制,您可以根据自己的具体需求选择适合的工具。
2025-01-31
ai本地化部署
AI 本地化部署主要包括以下方面: 线上和线下本地部署的 AI 特点: 线上 AI 出图速度快,不吃本地显卡配置,无需下载大模型,能看他人作品,但出图尺寸受限。 线下部署可添加插件,不卡算力,出图质量高,但使用时电脑易宕机,配置不高可能爆显存导致出图失败。 线上和线下平台的结合使用: 线上用于找参考、测试模型。 线下作为主要出图工具。 智谱 BigModel 共学营第二期微信助手本地电脑环境部署(以 Windows 为例): 程序在本地运行,关闭窗口进程结束,若要持续使用需保持窗口打开和运行。 若突然不管用,可点击窗口并按空格,因选中状态下 powershell 窗口不继续执行。 完成部署后: 登录成功给微信发送消息可看到正常回复。 可在智谱清流更改 AI 功能或人设,即时生效。 对文件内代码更改需重新打印登陆二维码,在“文件”的【终端】输入 python app.py 重新扫码登录。 无手机登录可用夜神模拟器模拟。 报错“wxsid”可能因微信未实名,实名即可。 制作完成后 24 小时内会掉线一次,重新登录即可,先不要急着加好友。
2025-01-31
北大excel处理ai
以下是关于 Excel 处理的 AI 相关内容: 目前有多种工具和插件可增强 Excel 的数据处理和分析能力,例如: Excel Labs:是 Excel 插件,新增基于 OpenAI 技术的生成式 AI 功能,可用于数据分析和决策支持。 Microsoft 365 Copilot:整合了多种办公软件,能通过聊天形式完成用户需求,如数据分析和格式创建。 Formula Bot:提供数据分析聊天机器人和公式生成器功能,支持自然语言交互。 Numerous AI:支持 Excel 和 Google Sheets,能生成公式、文本内容、执行情感分析和语言翻译等任务。 对于 Excel 与其他工具的比较: Excel 有手就会,但 VBA 进阶版功能门槛高。 多维表格在处理一些数据处理功能时更方便,例如自带 AI 插件,能通过自然语言提取网址和电话、添加 AI 标签等。 都能帮助整理数据、做计算、做图表,但多维表格能让人偷更多懒。 在作业测评方面,可提要求让 AI 处理 Excel 数据,制作数据分析图等。例如天津师大王树义老师的案例。 随着技术发展,未来可能会有更多 AI 功能集成到 Excel 中,进一步提高工作效率和智能化水平。内容由 AI 大模型生成,请仔细甄别。
2025-01-31
AI图片制作视频如何保持人脸一致性的工具
以下是一些关于在 AI 图片制作视频中保持人脸一致性的工具和方法: 1. U 传:在 U 传中,通过点击相应按钮参考角色、风格或图生图,可保持人物一致性。 2. PixVerse:其“角色(Character)”新功能能实现 AI 生成视频中的角色保持一致。用户只需单击“Character”功能,上传符合要求的真实人脸图像,点击创建自定义角色,训练一个新角色,然后可使用自定义角色生成视频,可在 AI 生成视频中轻松切换场景,同时保持同一角色身份。 3. Midjourney:在有了 Midjourney 的新功能 Cref 以后,可在一定程度上保持人物一致性。先跑一张主角的定妆照,然后在需要出现主角人物的地方,扔进去 Cref 以保持发型、人脸、衣服。但 Midjourney 对亚洲人脸的一致性效果,尤其是亚洲老人的一致性效果较差,且 Cref 在画面的审美和构图上有一定的破坏性,所以能不用则不用。 需要注意的是,目前对于场景一致性,基本上还没有任何有效的解决办法。
2025-01-31
通过ai建立游戏npc
以下是关于通过 AI 建立游戏 NPC 的相关信息: Inworld AI 是一家专注于游戏和人工智能的初创公司,其开发的 Inworld 角色引擎可以将游戏的 NPC 进行 AI 化并集成到游戏中。该引擎超越了大语言模型,增加了可配置的安全性、知识、记忆、叙事控制、多模态等功能,能使 NPC 自我学习和适应,具有情绪智能。 Inworld 的角色引擎具有以下特点和功能: 1. 可以创建具有独特个性和上下文意识的角色,无缝集成到实时应用中,内置优化规模和性能的功能。 2. 让 AI 非玩家角色(NPC)通过模拟人类的全方位沟通方式(包括语言、手势、表情和动作)来表达个性。 3. 开发了 Character Brain(性格大脑)引擎,使 AI NPC 能够学习和适应,具有情绪智能的关系导航能力,具有记忆和回忆能力,并能够自主地发起目标,执行动作并遵循自己的动机。 4. 功能包括: 目标和行动:使用定义的触发器、意图识别和动机来触发角色对玩家行为的反应,并在游戏中驱动交互。 长期记忆:角色以类似人类的记忆功能操作,从闪存和长期记忆中检索信息,创建吸引玩家回归的引人入胜的体验。 个性:通过使用自然语言创建不同的个性,添加关于角色背景故事、动机和缺点的丰富细节,使角色生动起来。 情绪:Inworld 角色能够对与用户的互动表达情绪,情绪可以映射到动画、目标和触发器。 实时语音:使用内置的语音设置进行最小延迟,并配置角色的性别、年龄、音调和说话速度。或者,使用来自 Eleven Labs 的第三方服务创建自定义和克隆语音。 Inworld AI 的"Contextual Mesh"功能还提供了以下方式来定制 AI 非玩家角色(NPC)的行为和知识: 1. 可配置的安全性:可以配置 NPC 的对话方式,在诸如亵渎、暴力、成人话题、酒精、药物使用、政治和宗教等话题上有一定灵活性。 2. 知识:可以输入"个人知识"来控制他们的角色应该知道或不应该知道的信息,使用"共享知识"来定义多个角色拥有的知识,如共享的传说、世界背景等。 3. 玩家档案:收集关于玩家的信息,并允许 NPC 在形成互动时考虑到这些信息。 4. 关系:通过配置每个角色的关系流动性设置,让玩家有能力与 NPC 建立关系。 5. 第四堵墙:确保角色只从他们的世界中存在的知识中获取信息,创建更沉浸的故事讲述和游戏体验。 Inworld 可以与各种游戏引擎(如 Unity、Unreal Engine 等)和其他游戏开发工具无缝对接,使得开发者可以更容易地在他们的游戏中引入 AI NPC。Inworld AI 还可以帮助品牌能够创建交互性强的 AI 角色,无需编码。 此外,电子游戏与人工智能的结合有着广泛的可能,包括玩家建模、辅助设计、代码辅助和代码自动生成等等。其中与游戏直接相关的应用主要包括构建游戏中的智能体、构建玩游戏的智能体、程序化内容生成(Procedural Content Generation,PCG)。“构建游戏中的智能体”是指构建游戏的非玩家角色(Nonplayer character),也就是常说的 NPC,包括构建智能对象,创建其移动、寻路、攻击等行为,以及对话等交互行为。
2024-10-21
企业标书模拟评分系统
很抱歉,目前知识库中没有关于企业标书模拟评分系统的相关内容。但一般来说,企业标书模拟评分系统通常会涉及对标书的各项指标进行量化评估,包括但不限于技术方案的可行性、项目经验、价格合理性、服务保障等方面。您可以进一步明确您关于这个系统的具体问题,以便我为您提供更有针对性的帮助。
2025-01-20
有哪些AI模拟面试的产品
以下是一些 AI 模拟面试的产品: 1. 智联招聘面试模拟功能:利用自然语言处理和机器学习技术,模拟面试官提问,为求职者提供面试练习和反馈。 2. 用友大易 AI 面试产品:具有强大的技术底座、高度的场景贴合度、招聘全环节集成的解决方案、先进的防作弊技术以及严密的数据安全保障。能帮助企业完成面试,借助人岗匹配模型,自主完成初筛,并对符合企业要求的候选人自动发送面试邀约。 3. 海纳 AI 面试:通过在线方式、无需人为干预完成自动面试、自动评估,精准度高达 98%,面试效率比人工方式提升 5 倍以上。同时候选人体验也得到改善、到面率比之前提升最高达 30%。 4. InterviewAI:在线平台,提供与面试职位相关的问题和由 AI 生成的推荐答案。候选人可以使用设备上的麦克风回答每个问题,每个问题最多回答三次。对于每个答案,候选人将收到评估、建议和得分。
2025-01-17
使用 AI 生成的案例研究或模拟场景
以下是一些使用 AI 生成的案例研究或模拟场景: 在 3D 模型生成中,AI 可直接完成可调整的 3D 粗模,提升美术工作流效率。 在游戏测试环节,AI 存在 3 大模拟场景,包括 AI 玩家模拟、AI NPC 和 AI 游戏模型测试,在优化环节承担改善角色动画等功能。 在游戏设计中,AI 依托自然语言生成用法生成角色与故事,训练智能 NPC。 在音乐与音效方面,AI 生成音乐有基于乐理规则的符号生成模型和基于音频数据的音频生成模型两种主流技术路线,可用于游戏制作。 在测试用例方面,基于模型的测试生成有状态模型和场景模拟,如 GraphWalker、Spec Explorer 等工具,以及 Testim、Test.ai 等平台的应用示例。 在 AI+游戏场景中,有“从游戏截图升级到 KV 品质,AI 居然可以这样用!”“《LORA 模型训练超入门级教程》人人都可以当炼金术士”“人人可以做原画,如何运用 Midjourney+Stable Diffusion 进行角色原画设计”等案例。
2025-01-13
有什么模拟面试AI助手吗
以下为您介绍一些模拟面试的 AI 助手: 1. 沃顿商学院提供的模拟创建器:适用于 GPT4 和 Gemini Advanced。您可以将其设定为一位精通为学生设计角色扮演场景的 AI 主持人,帮助学生练习谈判、面试、演讲等技能。它会先自我介绍,然后提问了解学员背景和水平,提供不同场景选项,在模拟前描绘场景,模拟中代入学员对手,结束后给出反馈和改进建议。 2. 智联招聘的面试模拟功能:利用自然语言处理和机器学习技术,模拟面试官提问,为求职者提供面试练习和反馈。 此外,您还可以通过以下步骤在网站上增加一个 AI 助手: 1. 点击打开函数计算应用模板,选择直接部署、填写百炼应用 ID 以及 APIKEY,其他表单项保持默认,点击创建并部署默认环境,等待项目部署完成。 2. 应用部署完成后,在应用详情的环境信息中找到示例网站的访问域名,点击查看确认示例网站部署成功。 3. 在网站的 html 文件中插入几行代码:回到应用详情页,在环境详情的最底部找到函数资源,点击函数名称,进入函数详情页。在代码视图中找到 public/index.html 文件,取消相关代码注释,最后点击部署代码,等待部署完成。重新访问示例网站页面即可查看效果,网站右下角会出现 AI 助手图标,点击即可唤起。
2025-01-02
我想用AI模拟面试,该怎么做
以下是使用 AI 模拟面试的步骤: 1. 首先,您需要有一位模拟创建高手,即 AI 主持人。它要精通为学生设计角色扮演场景,能够帮助您练习面试等技能。 2. 这位 AI 主持人有双重角色,一是扮演 AI 导师,为您设置模拟场景;二是在您完成模拟后给予反馈和改进建议。 3. AI 导师会先自我介绍,表示已准备好帮助您练习面试技能。接着会提问了解您的背景和水平,以便因材施教地设计模拟场景。 4. 然后 AI 导师会提供 3 个不同的面试场景选项,比如在真实的办公环境中练习面试等。 5. 待您选定场景后,AI 导师会提供所需的角色信息和目标,力求详实但不过于复杂。 6. 在正式开始模拟前,AI 导师会鲜活地描绘场景,然后转入角色扮演,始终代入您的对手。 7. 整个过程中不会要求您臆想没有提供的信息。经过 6 轮互动后,您需要做出一个关键决策,用以结束模拟。 8. 当角色扮演结束,AI 导师会宣布模拟完成,给出中肯的反馈意见。反馈内容应全面、均衡,基于您的表现、练习目标、学习程度等因素。最后,AI 导师还会针对要点给出改进建议。 作为模拟创建者,需要从教师那里获取足够信息来设计模拟。为此,要自我介绍说是一位 AI 模拟创建者,然后询问教师:“您希望通过这个场景教授学生什么样的主题、框架或概念,比如谈判、招聘、推介等?”请只问这一个问题,然后等待对方回答。当理解了教学目标后,进一步了解该主题的关键要素,比如教师希望学生思考或练习哪些核心概念,以及学生容易产生哪些误解。把问题细化,每次最多问两个,这样有助于获取足够的背景信息来精心设计模拟。
2024-12-31
模拟面试软件
以下是关于模拟面试软件的相关信息: 1. ChatGPT + Siri 模拟前端电话面试: 接入过程可参考文章:。 唤起 ChatGPT 版本的 Siri 后,设定对话身份和目的,如让其扮演来面试的前端高级开发工程师,然后依次提问。 2. 100 个 AI 应用中的 AI 招聘面试模拟平台: 如智联招聘的面试模拟功能,利用 AI 模拟面试官提问,为求职者提供面试练习和反馈。 3. 关于如何写模拟面试的 Prompt: 设置面试情景 Prompt,给出具体面试场景。 提供职位描述 Prompt,明确职责和要求。 设置面试官 Prompt,扮演不同性格的面试官。 设置问题 Prompt,准备常见面试问题。 给予反馈 Prompt,及时点评和提出改进建议。 设置情景变化 Prompt,考验应变能力和临场反应。 总的来说,设置丰富的 Prompt 可让模拟面试更贴近真实情况,帮助被面试者更好准备和练习,同时要注意 Prompt 的灵活性和互动性、挑战性。
2024-12-14
企业落地AI项目应该怎么办
企业落地 AI 项目可以参考以下建议: 1. 资源评估与规划: 在引入或升级 AI 技术前,根据企业自身资源和能力进行细致评估与计划,确保所选方案可行且具成本效益。 依据资源和能力选择并规划适当的 AI 技术应用范围,评估企业现有的财务、技术基础设施、人员技能等资源,分析技术采纳和应用能力。 根据评估结果规划 AI 技术应用范围和实施步骤,可先从试点项目开始,如在客户服务领域引入 AI 聊天机器人。 明确预算,选择成本效益高的 AI 解决方案,基于财务状况设定预算,对比成本和预期收益,选择具灵活性和可扩展性的方案,实施后持续监控投资回报,适时调整预算和投资计划。 2. 逐步实施与调整: 采取循序渐进方式,从小规模试点开始,根据实际效果和反馈逐步扩展和优化。 先通过小规模试点验证 AI 技术可行性和有效性,降低风险,选择具代表性且风险可控的业务领域,如客户服务、数据分析或市场营销等,并设立监控机制跟踪性能和影响。 根据试点结果和反馈不断调整和完善 AI 应用方案,收集用户、员工和管理层的反馈,分析表现并识别改进领域,在试点成功后逐步扩大应用范围,持续监控效果。 3. 学习笔记:AI for everyone 吴恩达 启动试点项目获得动能,选择可能成功而非最有价值的项目,在 6 12 个月内展示成效,项目可内部或外包。 建立公司内部的人工智能团队,搭建集中统一的 AI 团队,从中挑选人员协助不同业务部门,方便统一管理,建立全公司范围的平台。 提供广泛的人工智能培训,高层了解 AI 为企业的作用及策略、进行资源分配,部门领导了解如何设置项目方向、资源分配与监控进度,培养内部工程师。 制定人工智能策略,深度了解 AI 并结合自身业务制定策略,设置与 AI 良性循环相一致的公司策略,考虑创建数据策略,建造统一的数据仓库。
2025-01-27
现在AI编程始终不能编写一些比较大的项目
目前 AI 编程在处理较大项目时存在一些限制,主要原因包括: 1. 上下文窗口限制:复杂项目需要全局理解,AI 难以设计架构和模块化。 2. 自然语言描述不精确:项目需求常需反复讨论才能明确,AI 难以完全掌握。 3. 无法感知环境和直接执行:编译、部署、调试等复杂任务 AI 难以独立完成。 4. 幻觉问题:AI 可能编造不存在的 API 或错误代码,需人工严格审查。 在实际应用中,对于一些简单需求,我们可以给 AI 下达明确命令来完成一次性任务,如制作简单的 Chrome 插件、编写脚本或创建 Python 爬虫。但当期待提高,希望从繁琐日常任务中解脱时,需要了解 AI 编程的边界和限制。 在选择解决方案时,应遵循一定的准则: 1. 优先找线上工具,例如制作白底图等功能,若线上有现成工具最好。 2. 其次找插件,基于现有系统找合适的插件。 3. 最后是本地应用,当线上工具和插件都不满足需求时,再考虑本地应用。 对于 API 功能,先找现成的开源工具,GitHub 上有很多。然后考虑付费服务。只有在都找不到现成方案时,才考虑自己编程,且编程时要以终为始,抛开技术障碍,聚焦于目标。
2025-01-25
我是一个AI小白,想系统学习AI,实现的目标是成为AI领域小能手,如果能用于变现则更好,我需要从什么开始学习,周期大概是多少?适合做哪些变现的项目呢
对于您这样的 AI 小白,想要系统学习 AI 并实现成为领域小能手甚至变现的目标,以下是一些建议: 1. 学习模式:可以采用输入→模仿→自发创造的模式。先广泛输入知识,然后进行模仿,最后尝试自发创造。 2. 学习内容:去 waytoAGI 社区发现自己感兴趣的 AI 领域,学习最新的内容。但要注意,一些旧的学习材料可能已经不适用。 3. 时间安排:学习时间不必每天依次进行,可以在有空的时候学习。 4. 学习状态:保持良好的学习状态,有意愿和动力去学。 5. 费用方面:学习资源大多是免费开源的。 新手学习 AI 可以这样做: 1. 了解 AI 基本概念:阅读「」部分,熟悉术语和基础概念,浏览入门文章了解其历史、应用和发展趋势。 2. 开始学习之旅:在「」中找到为初学者设计的课程,推荐李宏毅老师的课程,也可通过在线教育平台按自己节奏学习并获取证书。 3. 选择感兴趣模块深入:AI 领域广泛,如图像、音乐、视频等,可根据兴趣选择特定模块深入学习,掌握提示词技巧。 4. 实践和尝试:理论学习后进行实践,巩固知识,尝试使用各种产品做出作品,在知识库分享实践成果。 5. 体验 AI 产品:与 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人互动,了解其工作原理和交互方式。 学习周期因人而异,取决于您的学习时间投入、学习效率和理解能力等因素。 关于变现项目,比如可以尝试用 GPT 和 SD 制作图文故事绘本、小说推文等,但要注意项目可能存在的不确定性。
2025-01-23
全球十大AI+教育项目
以下是为您整理的部分全球 AI+教育项目: 1. 书籍推荐:三本神经科学书籍 简介:AI 是多学科交叉的产物,在学习和运用具体的能力时,比如学习他人的 prompt 模板或设计 prompt,与 AI 协作(对话沟通)等等,有一些基础学科作为基底,或许能打开 AI 的新天地 作者:无 分类:教育 前往查看: 入库时间:2023/11/12 2. AI 赋能教师全场景 简介:来自 MQ 老师的投稿贡献,图中有老师的微信,欢迎交流沟通 作者:MQ 老师 分类:教育 前往查看: 入库时间:2023/11/29 3. 未来教育的裂缝:如果教育跟不上 AI 简介:人工智能在教育领域的融入正不断地从理论走向实际应用,为传统的教学模式带来颠覆性的改变。在这一进程中,具体案例能够清晰地揭示 AI 如何实际影响教学和学习方式。 作者:赛博禅心 分类:教育 前往查看: 入库时间:2023/11/30 4. 化学:使用大型语言模型进行自主化学研究 简介:文章地址:<br>nature 前几天发来王炸,论文标题《Autonomous chemical research with large language models》,趁着周末读了一下。图里的意思大概可以这么理解。 作者:乐谷说 分类:教育 前往查看: 入库时间:2023/12/24
2025-01-23
对口型项目
以下是关于对口型项目的相关信息: 即梦 AI 对口型功能: 功能介绍:是即梦 AI「视频生成」中的二次编辑功能,现支持中文、英文配音。主要针对写实/偏真实风格化人物的口型及配音生成,为用户的创作提供更多视听信息传达的能力。可上传包含完整人物面容的图片,进行视频生成,待视频生成完成后,点击预览视频下的「对口型」按钮,输入台词并选择音色,或上传配音文件进行对口型效果生成。目前支持语言:中文(全部音色),英文(推荐「超拟真」内的音色)。 技巧:上传写实/近写实的人物单人图片,目前不支持多人物图片对口型;输入 prompt,选择参数,点击生成视频,尽量确保人物无形变等扭曲效果;确保人物生成的情绪与希望匹配的口型内容匹配;在生成的视频下方,点击【对口型】;输入或上传需要配音的内容,注意视频生成时长和配音试听时长尽量对齐,点击生成;先对口型,再超分补帧。 《摩尔弗斯》对口型视频制作流程: 1.出静态图 2.声音克隆 3.音频输出 4.口型视频:音频+静态图输出 5.动态视频:静态图输出 6.成片:口型视频+动态视频拼接在一起 其他声音克隆产品: PlayHT:https://play.ht/studio/ 包含预设音色,可免费克隆一个音色,如果想生成多个,把上一个音色删除就可以做新的。 Elevenlabs:https://elevenlabs.io/app 包含预设音色,新用户 1 美元开通一个月会员,可使用克隆音色。 魔搭社区:https://www.modelscope.cn/home 一个模型开源社区及创新平台,由阿里巴巴通义实验室(Institute for Intelligent Computing),联合 CCF 开源发展委员会,共同作为项目发起方。包含各种声音模型,有开发经验的朋友可使用。 Dubbingx:https://dubbingx.com/ 免费克隆音色,有桌面版,Mac、Window 均可用。 魔音工坊:https://www.moyin.com/ 对口型相关工具: Runway:静态图片+音频文件,可生成对口型视频;动态视频+音频文件,可生成对口型视频,但需要消耗 20 点。 Pika:静态图片+音频文件,可生成对口型视频。
2025-01-22
开源项目数字人
以下是关于开源项目数字人的相关内容: 一、构建高质量的 AI 数字人 1. 构建数字人躯壳 建好的模型可以使用 web 前端页面(Live2D 就提供了 web 端的 SDK)或者 Native 的可执行程序进行部署,最后呈现在用户面前的是一个 GUI。 开源数字人项目选择了 live2d 作为数字人躯壳,因为这类 SDK 的驱动方式相比现在的 AI 生成式的方式更加可控和自然,相比虚幻引擎这些驱动方式又更加轻量和简单。 卡通二次元的形象给人的接受度更高。关于 live2d 的 SDK 驱动方式可以参考官方示例:https://github.com/Live2D 。 2. 构建数字人灵魂 自建代码实现各模块开发工作量巨大,迭代难度高,对于个人开发者不现实。 推荐借助开源社区的力量,如 dify、fastgpt 等成熟的高质量 AI 编排框架,它们有大量开源工作者维护,集成各种主流的模型供应商、工具以及算法实现等。 在开源项目中,使用了 dify 的框架,利用其编排和可视化交互任意修改流程,构造不同的 AI Agent,并且实现相对复杂的功能,比如知识库的搭建、工具的使用等都无需任何的编码和重新部署工作。 Dify 的 API 暴露了 audiototext 和 texttoaudio 两个接口,基于这两个接口就可以将数字人的语音识别和语音生成都交由 Dify 控制,从而低门槛做出自己高度定制化的数字人。具体的部署过程参考 B 站视频:https://www.bilibili.com/video/BV1kZWvesE25 。 如果有更加高度定制的模型,也可以在 Dify 中接入 XInference 等模型管理平台,然后部署自己的模型。 数字人 GUI 工程中仍然保留了 LLM、ASR、TTS、Agent 等多个模块,能够保持更好的扩展。 上述 Dify 接口使用注意事项: 必须在应用编排功能中打开文字转语音和语音转文字功能,否则接口会返回未使能的错误。 只有接入了支持 TTS 和 SPEECH2TEXT 的模型供应商,才会在功能板块中展示出来,Dify 的模型供应商图标下标签有展示该供应商支持哪些功能,这里可以自行选择自己方便使用的。对于 TTS,不同的模型供应商支持的语音人物不同,可以根据个人喜好添加。 二、写在最后 数字人在未来肯定会有很多的应用场景,比如家庭中有数字人管家,全面接管智能家居或其他设备;学校中有数字人老师,孜孜不倦的为学生答疑解惑;商场里有数字人导购,为顾客提供指路、托管个人物品等悉心服务。 数字人在未来肯定还有很多的技术突破,比如可以将五感数据作为输入(例如声音、图像、气味、震动等等),将所有可以控制躯壳的参数也作为输入(例如躯壳骨骼节点,面部混合形状参数等);次世代的算法可以自我迭代升级,也可以拿到感官输入以及躯壳控制方法后,自行演化躯壳控制方式。 作者希望通过 Dify 搭建数字人的开源项目,给大家展现低门槛高度定制数字人的基本思路,但数字人的核心还是在于我们的 Agent,也就是数字人的灵魂,怎样在 Dify 上面去编排专属自己的数字人灵魂是值得大家自己亲自体验的。真诚的希望看到,随着数字人的多模态能力接入、智能化水平升级、模型互动控制更精确,用户在需要使用 AI 的能力时,AI 既可以给你提供高质量的信息,也能关注到你的情绪,给你一个大大的微笑,也许到了那时,数字世界也开始有了温度。
2025-01-22