直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

ai agent多角色对话

回答

以下是关于 AI Agent 多角色对话的相关内容:

在红杉 AI Ascent 2024 会议中,吴恩达谈到了 Agent Workflow 以及 4 种主流设计模式。其中包括:

  1. Reflection(反思):可以有一个代码 Agent 和一个反思 Agent,它们可以是相同的基础 LLM 但以不同方式提示,例如一个是专家级的代码撰写者,另一个是专家级的代码审查者,这种工作流容易实现,能显著提高 LLM 性能,但不总是有效。
  2. 规划:通过规划设计模式提升 LLM 性能和拓展应用领域。
  3. 多 Agent 合作:不同 Agent 之间的辩论,如让 ChatGPT 和 Gemini 互相辩论,能带来更好的表现,多个模拟的 Agent 一起工作也是强大的设计模式。
  4. Agent 推理:这种设计模式将会很重要。

此外,生成式 AI 的人机协同分为 3 种产品设计模式:Embedding(嵌入式)、Copilot(副驾驶)、Agent(智能代理)。在 Agent 模式下,AI 完成大多数工作,可使用 Multiagent Collaboration 的方法,让不同角色的 Agent 按照任务要求自主规划选择工具、流程进行协作完成任务。例如产品经理可以通过 Agents 将任务拆解,最后获得大体符合期望的输出结果再进行修改。

总之,通过这些设计模式,能够提升 LLM 的性能和拓展应用,期待未来 AI Agent 在更多场景发挥关键作用。

内容由 AI 大模型生成,请仔细甄别(powered by aily)
其他人在问
ai agent 就是 ai 工具吗
AI Agent 是基于大型语言模型(LLM)和其他技术实现的智能实体,其核心功能在于自主理解、规划决策、执行复杂任务。 AI Agent 包括以下几个概念: 1. Chain:通常一个 AI Agent 可能由多个 Chain 组成。一个 Chain 视作一个步骤,可以接受一些输入变量,产生一些输出变量。大部分的 Chain 是大语言模型完成的 LLM Chain。 2. Router:可以使用一些判定(甚至可以用 LLM 来判定),然后让 Agent 走向不同的 Chain。例如:如果这是一个图片,则 a;否则 b。 3. Tool:Agent 上可以进行的一次工具调用。例如,对互联网的一次搜索,对数据库的一次检索。 总结下来需要三个 Agent: 1. Responser Agent:主 agent,用于回复用户(伪多模态)。 2. Background Agent:背景 agent,用于推进角色当前状态(例如进入下一个剧本,抽检生成增长的记忆体)。 3. Daily Agent:每日 agent,用于生成剧本,配套的图片,以及每日朋友圈。 这三个 Agent 每隔一段时间运行一次(默认 3 分钟),运行时会分析期间的历史对话,变更人物关系(亲密度,了解度等),变更反感度,如果超标则拉黑用户,抽简对话内容,提取人物和用户的信息成为“增长的记忆体”,按照时间推进人物剧本,有概率主动聊天(与亲密度正相关,跳过夜间时间)。 此外,AI Agent 也像是在 RAG 的基础上更进一步。RAG 是给大模型一个浏览器工具使用,而 Agent 给了大模型更多工具,比如长期记忆(给大模型一个数据库工具记录重要信息)、规划和行动(在大模型的 prompt 层做逻辑,将目标拆解并输出不同的固定格式 action 指令给工具)。 总的来说,AI Agent 代表了在流程中给大模型使用工具的能力,为大模型的应用提供了更广阔的空间。例如可以让大模型安排差旅,它会判断完成目标所需步骤,搜索近期差旅记录,在相关平台预订酒店和机票,最终完成任务。
2024-09-18
ai agent
AI 智能体(Agent)是随着 ChatGPT 与 AI 概念爆火而出现的新名词,简单理解就是 AI 机器人小助手,参照移动互联网,类似 APP 应用的概念。AI 大模型是技术,面向用户服务的是产品,因此很多公司关注 AI 应用层的产品机会。 在做 Agent 创业的公司有不少,C 端案例中,比如在社交方向,用户注册后先创建自己的 Agent,然后让其与他人的 Agent 聊天,两个 Agent 聊到一起后真人再介入,这是有趣的场景;还有借 Onlyfans 入局打造个性化聊天的创业公司。B 端案例中,如果字节扣子和腾讯元器是面向普通人的低代码平台,类似 APP 时代的个人开发者,那么还有帮助 B 端商家搭建 Agent 的机会,类似 APP 时代专业做 APP 的。 此外,字节于 2 月 1 日正式推出 AI 聊天机器人构建平台 Coze 的国内版“扣子”,主要用于开发下一代 AI 聊天机器人。还有一个情绪主题角色扮演小游戏,本文会按照需求分析、分步实现需求、提示词编写测试、GPTs 使用链接、总结的顺序进行介绍。智能体来源于 Cathy 教练和 Leah 老师的情绪力手册,这是帮助家长和孩子从源头了解、分辨、分析、处理和控制情绪的手册,内涵多个相关的智能体。
2024-09-18
agent 相关的知识
以下是关于 Agent 的相关知识: 在人工智能领域,Agent 通常被定义为一种具有感知能力的实体,它能够通过对其所处环境的观察来做出相应的决策和反应。Agent 既可以是软件形式的程序,例如对话机器人,也可以具备物理形态,比如扫地机器人。 从产品经理角度思考 Agent: Agent 可以是一个历史新闻探索向导。 身份:历史新闻探索向导。 性格:知识渊博、温暖亲切、富有同情心。 角色:主导新闻解析和历史背景分析。 为使角色更生动,可为其设计简短的背景故事,比如曾是一位对世界重大历史事件了如指掌、充满热情且愿意分享知识的历史学家。 写好角色个性的方法: 角色背景和身份:编写背景故事,明确起源、经历和动机。 性格和语气:定义性格特点,如友好、幽默、严肃或神秘;确定说话方式和风格。 角色互动方式:设计对话风格,从基本问答到深入讨论。 角色技能:明确核心功能,如提供新闻解析、历史背景分析或心理分析;增加附加功能以提高吸引力和实用性。 “智能体”(Agent)在人工智能和计算机科学领域是一个非常重要的概念,指的是一种能够感知环境并采取行动以实现特定目标的实体,可以是软件程序,也可以是硬件设备。
2024-09-14
我想设计一款符合企业内部办公的ai agent,有哪些资料可以辅助参考
以下是一些可辅助您设计符合企业内部办公的 AI Agent 的资料和相关信息: Agent 构建平台: 1. Coze:新一代一站式 AI Bot 开发平台,集成丰富插件工具,适用于构建各类问答 Bot,能拓展 Bot 能力边界。 2. Microsoft 的 Copilot Studio:主要功能包括外挂数据、定义流程、调用 API 和操作,可将 Copilot 部署到各种渠道。 3. 文心智能体:百度推出的基于文心大模型的智能体平台,支持开发者打造产品能力。 4. MindOS 的 Agent 平台:允许用户定义 Agent 的个性、动机、知识,以及访问第三方数据和服务或执行工作流。 5. 斑头雁:基于企业知识库构建专属 AI Agent 的平台,适用于客服、营销、销售等场景,提供多种成熟模板,功能强大且开箱即用。 6. 钉钉 AI 超级助理:依托钉钉强大的场景和数据优势,在处理高频工作场景如销售、客服、行程安排等方面表现出色。 AI Agent 的概念和组成: 1. LLM(大模型):提供庞大的信息存储和处理能力,以理解和响应问题。 2. Planning(规划):如同园丁制定种植计划,决定任务执行步骤。 3. Memory(记忆):类似于园丁的笔记本,记录经验和已完成任务。 4. Tools(工具):指可运用的各种软件和程序,帮助执行复杂任务。 AI Agent 的相关概念: 1. Chain:通常一个 AI Agent 可能由多个 Chain 组成,每个 Chain 可视为一个步骤,接受输入变量并产生输出变量,大部分是由大语言模型完成的 LLM Chain。 2. Router:可使用判定(甚至用 LLM 判定)让 Agent 走向不同的 Chain。 3. Tool:Agent 上的一次工具调用,如对互联网的搜索或对数据库的检索。 此外,还包括以下三种 Agent: 1. Responser Agent:主 agent,用于回复用户(伪多模态)。 2. Background Agent:背景 agent,用于推进角色当前状态,如进入下一个剧本,抽检生成增长的记忆体等。 3. Daily Agent:每日 agent,用于生成剧本、配套图片和每日朋友圈。 这三种 Agent 每隔一段时间运行一次(默认 3 分钟),分析期间的历史对话,变更人物关系、反感度等,抽简对话内容提取信息成为“增长的记忆体”,按照时间推进人物剧本,有概率主动聊天(与亲密度正相关,跳过夜间时间)。 以上信息提供了关于 AI Agent 的概述,您可以根据自己的需求选择适合的平台和概念进行进一步探索和应用。请注意,内容由 AI 大模型生成,请仔细甄别。
2024-09-13
AI agent 落地例子
以下是关于 AI agent 的相关信息: AI agent 是在 rag 的基础上更进一步,给大模型提供了更多工具,如长期记忆(相当于给大模型一个数据库工具记录重要信息)、规划和行动(在大模型的 prompt 层做逻辑,将目标拆解并输出固定格式的 action 指令给工具)。例如可以让大模型安排差旅,它会判断完成目标所需步骤,搜索差旅记录,预订酒店和机票等。 一些 Agent 构建平台包括: Coze:新一代一站式 AI Bot 开发平台,集成丰富插件工具拓展 Bot 能力。 Microsoft 的 Copilot Studio:具备外挂数据、定义流程、调用 API 和操作等功能,并能部署到多种渠道。 文心智能体:百度推出的基于文心大模型的智能体平台。 MindOS 的 Agent 平台:允许用户定义 Agent 的个性、动机、知识等,并能访问第三方数据和服务或执行工作流。 斑头雁:2B 基于企业知识库构建专属 AI Agent 的平台,适用于多种场景,提供多种成熟模板。 钉钉 AI 超级助理:依托钉钉优势,在处理高频工作场景表现出色。 大型语言模型置于 Agent 的“大脑”或“控制器”核心位置,赋予强大语言理解和生成能力。通过多模态感知技术和工具利用策略扩展感知和行动范围,采用思维链和问题分解技术展现出推理和规划能力,能从反馈中学习并与环境互动,在软件开发、科学研究等现实世界场景中得到应用,还能与其他 Agent 交流协作。
2024-09-11
什么是agent,技术原理是什么,有哪些应用
智能体(Agent)是指能够自主感知环境、做出决策并执行动作以实现特定目标的实体。 其技术原理包括: AppAgent 可以通过自主学习和模仿人类的点击和滑动手势,能够在手机上执行各种任务。它是一个基于大语言模型的多模态代理,能够处理和理解多种类型的信息(如文本、图像、触控操作等)。 沉浸式单机剧本杀 Bot 由多个 agent 共同协作完成,包括主持人 Agent 通过对话引导玩家,条件判断 Agent 负责解析玩家输入判断触发条件,以及通过对剧本内容进行向量化处理和构建索引来使剧情展开更流畅。 智能体的应用领域广泛,例如: 自动驾驶:自动驾驶汽车中的智能体感知周围环境,做出驾驶决策。 家居自动化:智能家居设备(如智能恒温器、智能照明)根据环境和用户行为自动调节。 游戏 AI:游戏中的对手角色(NPC)和智能行为系统。 金融交易:金融市场中的智能交易算法,根据市场数据做出交易决策。 客服聊天机器人:通过自然语言处理与用户互动,提供自动化的客户支持。 机器人:各类机器人(如工业机器人、服务机器人)中集成的智能控制系统。
2024-09-11
去ai味
要去除 AI 味,可以从以下几个方面入手: 1. 对于聊天 AI,使其变得不正经、放肆、幽默、通俗。注意语气的自然化,比如使用语气词嗯、吧、啊、哈哈哈等,让回答更自然、贴近日常对话风格。还要注意口语化词语(相对于书面语)的使用,不过增加网络语言语料库需谨慎,以免生搬硬套带来副作用。 2. 对于睿声生成的配音,若语速慢有 AI 味儿,可使用剪映的音频变速功能加速配音,以消除 AI 味儿并配合视频前段的快节奏。 3. 对于 GPT 的回复,避免其用 1、2、3、4 或“首先、其次、最后”这种模式,可让其扮演特定角色并给出明确输出要求。但这种方法可能换汤不换药,要想让其更有趣,可让它在回复中加点感情,比如用括号补充动作,营造特定环境等。
2024-09-19
可以建立知识库的ai有哪些
以下是一些可以建立知识库的 AI 工具和平台: 1. 飞书软件:例如“通往 AGI 之路”,您可以在飞书大群中与机器人对话获取对应的资料。 2. Coze:在“大圣:胎教级教程:万字长文带你使用 Coze 打造企业级知识库”中有相关介绍。 3. Mem:如 https://get.mem.ai/ ,它可以保存组织中每次会议的记录,并在人们开始新项目时主动建议相关的决策、项目或人员,节省时间。 4. GPT:通过 OpenAI 的 embedding API 解决方案,可以搭建基于 GPT API 的定制化知识库,但需要注意其免费版 ChatGPT 一次交互的容量限制。
2024-09-19
notion ai的功能
Notion AI 具有以下功能: 直接在 Notion 中接入 AI 的能力,能让工作更迅速,写作更出色,思考更伟大。 可以在笔记和文档中应用 AI 的力量。 能够实现 AI 数据库自动填充功能。 可以改变知识管理的方式,让人们摆脱繁琐的信息组织工作,用户只需简单地将信息丢到 Notion 中,就可以通过各种方式进行检索。
2024-09-19
PopAI的功能
PopAI 是一款办公效率工具,具有以下功能: 1. 类似 ChatGPT 的聊天功能。 2. 集成了众多工作中可用的效率工具,如 PPT 和流程图生成、提示生成等。 3. 率先集成了 GPT4V 的图像 API 且调教良好,能清晰解释图像相关内容。 4. 具有创新的交互,在回答内容后可进行如翻译为中文、扩写重新排版并添加内容变为一篇文章等“Enrich”操作。 5. “Enrich”操作不仅不是干巴巴的填充,还会配合相关图片,必要时绘制流程图。
2024-09-19
popai 的功能
Poe 是一个 AI 聊天网站,支持与多个智能 AI 机器人(如 GPT4 等)进行实时在线交流。注册账号后可免费使用,部分功能需要付费订阅。不同的 AI 机器人有不同特点,可根据需求选择使用。总体而言,Poe 为用户提供了便捷的智能对话体验。其官网地址是:https://poe.com/ ,在官网帮助中心上可以找到具体教程。 此外,Poe 平台还推出了其他多种功能,比如多个机器人一起聊天、文件上传和视频输入等。Odyssey 是一个能提供好莱坞级别的 AI 视频生成和编辑工具的项目。PaintsUndo 可以输入静态图像自动生成整个绘画的全过程视频,该项目主要研究和再现数字绘画中的绘画行为,为数字艺术创作提供新的工具和方法。更多详细介绍可参考:https://xiaohu.ai/p/10996 、https://x.com/imxiaohu/status/1810574723048489063 、https://xiaohu.ai/p/11005 、https://x.com/imxiaohu/status/1810589354114626008 、https://xiaohu.ai/p/11010 、https://lllyasviel.github.io/pages/paints_undo/
2024-09-19
可用于记笔记的ai有哪些
以下是一些可用于记笔记的 AI 相关产品: 1. MeetRecord:这是一家专注于销售通话记录和辅导的软件公司。其核心功能包括 AI 驱动的笔记记录,能通过人工智能技术自动记录和分析销售通话,提供会议内容的关键词和主题分析,自动生成会议纪要和行动项;还有个性化辅导计划,能生成个性化的辅导计划,模仿表现最好的销售人员,并实施自动呼叫评分系统;此外,还具备交易智能和推荐、CRM 自动化、多语言支持以及安全性与企业化支持等功能。 2. 目前没有更多明确提及专门用于记笔记的其他 AI 产品的相关信息。但在一些关于人工智能的讨论中,提到了手写笔记对于信息留存和思维培养的重要性,例如在关于防止 AI 取代人类思考的论述中,指出手写笔记有助于将信息从短期记忆转移到长期记忆,成为更好的概念思考者。
2024-09-19
这个对话,是怎么调用WaytoAGI知识库的?
在 WaytoAGI.com 网站,新增了智能对话功能,您可以在首页输入 AI 相关问题,系统会迅速提供答案要点和参考文章。在导航目录下,还能看到别人在问的 AI 问题。该功能的上线离不开飞书 Aily 团队的支持。
2024-09-19
如何让对话几条消息合并意图回复
默认情况下,Cursor Chat 位于 AI 窗格中,与您的主要侧边栏相对。用户消息包含您键入的文本以及您引用的上下文。您可以返回任何以前的用户消息来编辑和重新运行查询,这将覆盖此后的所有消息并重新生成新消息。AI 消息是您选择的 AI 模型生成的响应,它们与前面的用户消息配对,可能包含已解析的代码块,这些代码块可以通过添加到您的代码库中。同一线程中的所有用户/AI 消息称为聊天线程,每个聊天线程都保存在您的聊天历史记录中。
2024-09-16
如何搭建一个微信对话AI
以下是搭建微信对话 AI 的步骤: 1. 配置极简未来(Link.AI)平台 按照官方教程操作:https://docs.linkai.tech/platform/createapp ,学习补充:https://docs.linkai.tech/platform/quickstart 。 注意以下几点: 教程中的应用是创建具体的 AI 问答机器人应用。 教程中的知识库是给绑定到指定问答机器人的资料数据集,让机器人基于这些内容回答问题。 知识库应用中的应用设定是给 AI 机器人的提示词内容或者人设,具体可看教程:https://waytoagi.feishu.cn/wiki/OqJQwzq2wi9EIOkFtFkclM24nSe 。 创建成功的 AI 应用,记住应用 ID,用于后续对接微信聊天机器人。 2. 配置腾讯云轻量应用服务器 配置部署 COW 组件,例如配置 GROUP_NAME_WHITE_LIST 参数来设定哪些群组的消息需要自动回复。 基于创建的模板切换到容器编排界面进行 COW 服务部署,等待部署成功。 3. 登录微信绑定 COW 组件 若扫描二维码等出现意外情况,可退回到容器配置处重启容器服务,重新扫码登录。 后续若想修改 COW 组件的配置,如修改机器人回复的前缀或开启语音识别等,进入编排模板的配置界面修改参数,保存后回到容器编排界面重新部署新的容器编排。 至此,完成 COW 组件的部署和微信号的绑定,即可开始与机器人微信号进行对话。
2024-09-10
ai 视频对话,会有哪些应用场景呢,能解决哪些文字性ai 解决不了的复杂性问题呢
AI 视频对话具有以下应用场景和能够解决的文字性 AI 难以处理的复杂问题: 快速的视频剪辑:仅需输入镜头脚本,即可从素材库提取内容进行拼接。 快速的图生视频:结合图像识别,根据镜头脚本提取相同 seed 值的图片,通过特定思路生成短时长视频并自动化拼接。 快速诊断:类似于医疗诊断。 为视觉障碍人士提供视频内容的音频描述。 在视频监控中自动识别和报告重要事件。 一些领先的视频配音特效 AI 工具包括: Wavel Studio:支持 30 多种语言的配音,音质自然流畅,能自动去除背景噪音和杂音,提供添加字幕和文本叠加层的工具,界面友好且有多种自定义选项。 Elai.io:支持 65 多种语言的配音,音色和语调真实,能自动将唇形与语音同步,生成字幕提高视频可访问性,支持多位配音者适合复杂对话场景。 Rask AI:支持 130 多种语言的配音,包括稀有和濒危语言,采用先进语音合成技术音质高保真,提供语音参数自定义和音效添加工具,与多种视频编辑平台和工作流程整合。 Notta:提供快速实惠的多语言配音解决方案,保留原声说话风格和细微差别,提供调整语音速度和音调的工具,支持批量处理。 Dubverse:支持 60 多种语言的配音,音质接近真人,提供文本转语音和语音克隆功能,提供语音参数自定义和情感添加工具。 MMVID 能够执行的任务包括: 音频描述:为视觉障碍人士提供视频内容的详细音频描述。 基于视频的问答:根据视频内容回答问题,需深入理解情节和上下文。 视频摘要:创建视频的摘要,突出重要或有趣部分。 说话人识别:在视频中识别说话人。
2024-09-10
有支持语音的外语对话ai吗
以下是一些支持语音的外语对话 AI: 1. Google Assistant:支持多种语言,可用于日常对话练习和词汇学习。使用方法是设置目标语言,通过语音命令或文本输入与助手进行互动,练习日常用语。 2. ChatGPT:能够模拟对话练习,帮助提高语言交流能力。在聊天界面选择目标语言,与 AI 进行对话练习,可以询问语法、词汇等问题,甚至模拟实际交流场景。
2024-09-06
你认为Agent和ChatBot聊天对话机器人的差异在哪?
Agent(智能体)和 ChatBot 聊天对话机器人存在以下差异: 任务执行方式:Agent 是执行特定任务的 AI 实体,拥有复杂的工作流程,可以迭代运行,模型本质上能够自我对话,无需人类驱动每一部分的交互;而 ChatBot 通常是用户提出问题后获得一个答案作为回应。 组成和功能:Agent 是大型语言模型(LLM)、记忆(Memory)、任务规划(Planning Skills)以及工具使用(Tool Use)的集合,例如在自动驾驶、家居自动化、游戏 AI、金融交易、客服聊天、机器人等领域发挥作用;而 ChatBot 相对功能较为单一。 处理能力和效率:像 Coze Agent 这样的多 Agent 模式采用分布式计算范式,将复杂任务分解为多个子任务并由独立的智能体并行处理,从而提高系统的处理能力和效率。 参考文章: https://logankilpatrick.medium.com/whataregptagentsadeepdiveintotheaiinterfaceofthefuture3c376dcb0824 https://lilianweng.github.io/posts/20230623agent/ https://waytoagi.feishu.cn/record/1sfvuej0sATQfbO6zbeEAWk02
2024-09-04
如何使用AI 工具分析内容,提取文章关键场景、角色和情节
使用 AI 工具分析内容并提取文章关键场景、角色和情节可以参考以下步骤: 对于将小说做成视频: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。 对于利用 AI 写课题: 1. 确定课题主题:明确研究兴趣和目标,选择具有研究价值和创新性的主题。 2. 收集背景资料:使用 AI 工具如学术搜索引擎和文献管理软件来搜集相关的研究文献和资料。 3. 分析和总结信息:利用 AI 文本分析工具来分析收集到的资料,提取关键信息和主要观点。 4. 生成大纲:使用 AI 写作助手生成课题的大纲,包括引言、文献综述、方法论、结果和讨论等部分。 5. 撰写文献综述:利用 AI 工具来帮助撰写文献综述部分,确保内容的准确性和完整性。 6. 构建方法论:根据研究需求,利用 AI 建议的方法和技术来设计研究方法。 7. 数据分析:如果课题涉及数据收集和分析,可以使用 AI 数据分析工具来处理和解释数据。 8. 撰写和编辑:利用 AI 写作工具来撰写课题的各个部分,并进行语法和风格的检查。 9. 生成参考文献:使用 AI 文献管理工具来生成正确的参考文献格式。 10. 审阅和修改:利用 AI 审阅工具来检查课题的逻辑性和一致性,并根据反馈进行修改。 11. 提交前的检查:最后,使用 AI 抄袭检测工具来确保课题的原创性,并进行最后的格式调整。 在扣子 AI 应用于故事与绘本创作中,角色方面的技能包括: 首先引导用户说出故事的中心主题(theme),耐心倾听并给予鼓励。接着询问故事的情节(Plot),帮助用户梳理思路。再让用户描述故事存在的角色(Characters),共同构思角色特点。引导用户设定故事的背景(Setting),丰富故事场景。了解故事的视角(Point_of_view),明晰叙述角度。确定故事的文章风格(Tone),为创作定下基调。基于上述获取的关键词,传入对应的工作流中,调用工作流生成精彩的故事内容。
2024-08-26
我做了一个视频,背景是实拍的城市照片,角色是一个卡通角色,通过即梦让照片上的卡通角色动起来后,发现卡通角色的脸跟手臂动作都糊了。 我现在有什么办法优化,对卡通角色五官重绘更清晰的情况下,还保留现实的照片背景。(用sd重绘的话是不是就丢失了)
以下是一些可能有助于您优化视频的建议: 1. 对于您提到的卡通角色动作模糊的问题,可以尝试使用 Dreamina 工具,并将运动速度设为慢速,同时在 Prompt 里写轻微的动作描述,可能会有不错的效果。 2. 由于 Dreamina 工具存在只有 8 帧和 720P 的限制,您可以使用 Topaz Video AI 将其增强到 24 帧和 4K。在 B 站搜索“Topaz Video AI 4.2.1”关键词能找到相关教程。增强完成后,再放到剪映里裁成 21:9 的比例。 3. 对于卡通角色五官不清晰的情况,如果 AI 工具无法处理,可能需要使用传统的 AE 软件自己制作,比如普通的下沉位移动画。 需要注意的是,在某些情况下,如人物在水中下沉时,AI 视频可能会出现脸糊的情况,这种情况可能需要传统手段来解决。
2024-08-25
我创作了一个AI视频,背景是实拍的城市照片,角色是一个卡通角色,通过即梦让照片上的卡通角色动起来后,发现卡通角色的脸跟手臂动作糊了,我期望通过comfy对其重绘,能解决保留现实背景,卡通角色五官重绘更清晰吗?
在处理您提到的这种情况时,有以下一些建议和方法: 1. Dreamina 对 Prompt 的语义理解较好,您可以将运动速度设为慢速,并在 Prompt 里写轻微的相关描述,可能会有不错的效果。但需要注意的是,Dreamina 存在只有 8 帧和 720P 的限制,对比 Runway 的 24 帧和 4K 有差距。所以需要使用 Topaz Video AI 去增强到 24 帧和 4K,您可以在 B 站通过“Topaz Video AI 4.2.1”这个关键词搜索教程进行学习。增强完以后,再扔到剪映里裁成 21:9。 2. 对于人物在水中下沉等情况导致的脸糊问题,很多时候 AI 搞不定,可能需要使用传统 AE 自己制作普通的下沉位移动画。 不过,需要说明的是,在一些复杂的场景和动作中,AI 可能仍然存在一定的局限性,需要综合多种工具和方法来达到理想的效果。
2024-08-25
AI角色扮演类的平台有哪些
以下是一些 AI 角色扮演类的平台: 1. Replika:一款 AI 虚拟陪伴应用,用户可以设计理想的伴侣,关系会随时间发展,其能存储记忆并在未来对话中参考,甚至发送照片。 2. Anima:正在尝试建立虚拟朋友。 3. Charisma.ai:旨在为具有情感和自主权的完全渲染的 3D 角色提供动力,并提供工具以便创作者给角色设定目标。 4. Convai.com:为具有情感和自主权的完全渲染的 3D 角色提供动力的平台。 5. Inworld.ai:为具有情感和自主权的完全渲染的 3D 角色提供动力,并提供工具以便创作者给角色设定目标。 6. 筑梦岛:AI 角色扮演对话平台,背靠阅文,内容 IP 资源相对比较丰富。具有单人聊天、多人聊天、AI 角色设定、梦境分享、小剧场、创建角色和群聊等功能。 7. Character.ai:用户可以与数百个 AI 驱动的角色进行信息交流,包括名人、动漫角色等,还可以创建自己的角色。 8. Talkie:主打情感路线,设计有大量 npc,游戏和休闲娱乐体验感更强,每个 npc 带着自己的剧情体系,交流中会触发抽取卡牌机会。
2024-08-21
lora训练的数据集没有闭眼,如何保证人物一致性前提让角色闭眼
在训练 Lora 模型以保证人物一致性的前提下让角色闭眼,以下是一些可能的方法和参考信息: 得益于对 AI 大模型微调 finetuning 技术的研究,摸索出的训练特定画风 Lora 和特定角色 Lora 的方法,对角色一致性的锁定有决定性帮助。比如完善哪吒短褂、小短裤、额前火焰印记、流苏耳饰等细微之处的统一,最终针对不同主要角色分别训练角色 Lora,保障多人同框镜头的一致性。 实现角色一致性最好的方法是使用 Lora。训练 Lora 时,至少要有 15 到 20 张图片的训练集。对于固定形象,面部五官最重要,其次是体型、服装、配饰等。收集训练集时,收集形象的头部图片很重要。对于现实人物可通过照片训练,虚构角色则要能稳定输出多张不同角度的图片以达到训练集要求。 在预处理生成 tags 打标文件后,对文件中的标签进行优化。保留全部标签适用于训练画风或省事快速训练人物模型,优点是省时省力、过拟合出现情况低,缺点是风格变化大、训练时间长。删除部分特征标签适用于训练特定角色,将特征与 Lora 做绑定,优点是调用方便、更精准还原特征,缺点是容易过拟合、泛化性降低。需要删掉如人物特征 long hair、blue eyes 这类标签,不需要删掉如人物动作 stand、run,人物表情 smile、open mouth,背景 simple background、white background,画幅位置 full body、upper body、close up 这类标签。过拟合会导致画面细节丢失、模糊、发灰、边缘不齐、无法做出指定动作、在一些大模型上表现不佳等情况。
2024-08-12
工具助手类ai角色和角色扮演类ai角色在撰写prompt时主要差异是什么
工具助手类 AI 角色和角色扮演类 AI 角色在撰写 prompt 时的主要差异在于: 工具助手类 AI 角色的 prompt 通常更注重明确和直接的指令,以确保其能够准确地执行任务。例如,在解决逻辑谜题时,需要清晰地描述问题和要求。 角色扮演类 AI 角色的 prompt 则需要明确其扮演的角色,这会从两方面改变其响应: 准确性:在某些情况下,如解数学题,能得到提高。 语气和举止:可以调整为与角色匹配的语气和举止。 在具体的应用中,如生成 AI 视频时,可以通过详细描述角色特征、位置关系、环境等,来获得更符合需求的角色形象。同时,对于特定的 AI 工具,如 Niji·journey 5,了解其输入要求和特点,如对二次元风格的偏好,以及通过强调特定关键词来引导生成特定效果,如角色三视图,也是撰写有效 prompt 的关键。
2024-07-03