Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

AI Agent 规划是什么,怎么使用

Answer

AI Agent 规划是一个复杂但关键的概念,主要包括以下方面:

  • 自行规划任务执行的工作流路径,适用于简单或线性流程的运行。例如,先识别男孩的姿势,再利用相关模型合成新的女孩图像,接着使用特定模型处理,最后进行语音合成输出。
  • 包含子目标分解、反思与改进。子目标分解将大型任务分解为较小可管理的子目标,以处理复杂任务。反思与改进则可以对过去的行动进行自我批评和自我反思,从错误中学习并改进未来的步骤,从而提高最终结果的质量。
  • 规划通常涉及五种主要方法:
    • 任务分解:将复杂任务分解为简单子任务以简化问题,如 CoT(2022)、ReAct(2022)、HuggingGPT(2023)等。
    • 多计划选择:生成多个备选计划并通过搜索算法选择最优计划执行,如 ToT(2023)、GoT(2023)、LLM-MCTS(2023)。
    • 外部模块辅助规划:引入外部规划器来提升规划过程,解决效率和可行性问题,如 LLM+P(2023)、LLM-DP(2023)、DRRN(2015)。
    • 反思与细化:通过反思和细化提高规划能力,纠正错误,如 Reflexion(2023)、CRITIC(2023)、Self-Refine(2023)。
    • 记忆增强规划:利用额外记忆模块增强规划能力,存储有价值的信息,如 REMEMBER(2023)、MemoryBank(2023)。

在使用方面,AI Agent 的规划可以帮助其更高效、准确地完成任务,例如在多角色协作的场景中,不同角色的 Agent 相互协作,根据需求共同开发一个应用或者复杂程序。同时,OpenAI 的研究主管 Lilian Weng 提出了“Agent = LLM + 规划 + 记忆 + 工具使用”的基础架构,其中大模型 LLM 扮演了 Agent 的“大脑”。

Content generated by AI large model, please carefully verify (powered by aily)

References

Inhai: Agentic Workflow:AI 重塑了我的工作流

[title]Inhai:Agentic Workflow:AI重塑了我的工作流如果大家使用Kimi Chat来查询某个问题,你会发现它会在互联网上检索相关内容,并基于检索结果进行总结分析,最后给出结论。这其实是大模型利用「网页搜索」工具的一个典型例子,同时你也会看到PPT中介绍了非常多的不同领域类型的工具,它其实是为大模型在获取、处理、呈现信息上做额外的补充。PlanningAgent通过自行规划任务执行的工作流路径,面向于简单的或者一些线性流程的运行。比如下图中:Agent会先识别男孩的姿势,并可能找到一个姿势提取模型来识别姿势,在接下来要找到一个姿势图像模型来合成一个新的女孩图像,然后再使用图像理解文本的模型,并在最后使用语音合成输出,完成这个流程任务。Multiagent Collaboration吴恩达通过开源项目ChatDev进行举例,你可以让一个大语言模型扮演不同的角色,比如让一个Agent扮演公司CEO、产品经理、设计师、代码工程师或测试人员,这些Agent会相互协作,根据需求共同开发一个应用或者复杂程序。AI Agent基本框架OpenAI的研究主管Lilian Weng曾经写过一篇博客叫做《LLM Powered Autonomous Agents》,其中就很好的介绍了Agent的设计框架,她提出了“Agent = LLM +规划+记忆+工具使用”的基础架构,其中大模型LLM扮演了Agent的“大脑”。Planning(规划)主要包括子目标分解、反思与改进。将大型任务分解为较小可管理的子目标处理复杂的任务。而反思和改进指可以对过去的行动进行自我批评和自我反思,从错误中学习并改进未来的步骤,从而提高最终结果的质量。Memory(记忆)

AI Agent系列(二):Brain模块探究

[title]AI Agent系列(二):Brain模块探究[heading2]七、规划规划是一个依赖于强大推理能力的复杂过程,通常涉及五种主要方法:任务分解、多计划选择、外部模块辅助规划、反思与改进以及记忆增强规划。以下是完整方向列表:|方向|描述|子类|代表性工作及年份|备注|<br>|-|-|-|-|-|<br>|任务分解|将复杂任务分解为简单子任务以简化问题。|分解优先|CoT[2022]、ReAct[2022]、HuggingGPT[2023]|分解优先方法在子任务间创建强关联,减少任务遗忘和幻觉风险。交错分解动态调整基于环境反馈,提高容错性,但可能导致LLM在后续子任务中出现幻觉。|<br>|多计划选择|生成多个备选计划并通过搜索算法选择最优计划执行。|多计划生成、最优计划选择|ToT[2023]、GoT[2023]、LLM-MCTS[2023]|多计划选择提供广泛的潜在解决方案探索。|<br>|外部模块辅助规划|引入外部规划器来提升规划过程,解决效率和可行性问题。|符号规划器、神经规划器|LLM+P[2023]、LLM-DP[2023]、DRRN[2015]|符号规划器基于符号推理模型,神经规划器基于训练数据。|<br>|反思与细化|通过反思和细化提高规划能力,纠正错误。|反思、细化|Reflexion[2023]、CRITIC[2023]、Self-Refine[2023]|反思帮助代理从错误中学习并改进计划。|<br>|记忆增强规划|利用额外记忆模块增强规划能力,存储有价值的信息。|RAG-based Memory、Embodied Memory|REMEMBER[2023]、MemoryBank[2023]|记忆增强规划提升代理的规划能力和容错性。|下面我们来详细谈谈每种规划研究方向的详细内容:

AI-Agent系列(一):智能体起源探究

[title]AI-Agent系列(一):智能体起源探究[heading2]十、基于LLM的AI Agent[heading3]10.1大脑模块(Brain)��力的关注点:|类别|子类别|描述|<br>|-|-|-|<br>|自然语言交互|多轮对话能力|LLM能理解自然语言并生成连贯且与上下文相关的回复,帮助Agent进行有效交流。|<br>||生成能力|LLM展示卓越的自然语言生成能力,可生成高质量文本。|<br>||意图理解|LLMs能够理解人类意图,但模糊指令可能带来挑战。|<br>|知识|语言知识|包括词法、句法、语义学和语用学,使Agent能理解句子和进行对话。|<br>||常识知识|世界常识,如药和伞的用途,帮助Agent做出正确决策。|<br>||专业领域知识|特定领域的知识,如编程、医学,对解决领域内问题至关重要。|<br>||潜在问题|知识可能过时或错误,需通过重新训练或编辑LLM解决。|<br>|记忆|记忆机制|存储过去的观察、思考和行动,帮助Agent处理连续任务。|<br>||记忆提升策略|包括提高输入长度限制、记忆总结、用向量或数据结构压缩记忆。|<br>||记忆检索|Agent检索记忆以访问相关信息,包括自动检索和交互式记忆对象。|<br>|推理和规划|推理|基于证据和逻辑,对解决问题、决策至关重要。|<br>||规划|组织思维、设定目标和确定实现目标的步骤。|<br>||计划制定|分解任务、制定计划,包括一次性全面分解和自适应策略。|

Others are asking
AI课程
以下是为您提供的关于 AI 课程的相关信息: 麻省理工学院(MIT)为 8 18 岁孩子推出了免费的 AI 课程 Day of AI,该课程席卷全球,来自 110 多个国家的 50 万名学生都在使用。但此课程资源主要面向家长和老师群体,大孩子可自学,小孩子可能需要家长辅助。同时,MIT 作为世界级学府肩负社会责任,用技术实现教育平等。国内有机构将其免费课程下载后开卖录播课收费。 对于新手学习 AI,首先要了解 AI 基本概念,建议阅读“从这里启程”部分熟悉术语和基础概念,浏览入门文章。然后开始学习之旅,在“入门:AI 学习路径”中可找到为初学者设计的课程,推荐李宏毅老师的课程,还可通过在线教育平台按自己节奏学习。选择感兴趣的模块深入学习,比如掌握提示词技巧。学习后要实践,在知识库有实践作品和文章分享。同时,体验如 ChatGPT 等 AI 产品。 如果让我推荐一门 AI 课,【野菩萨的 AIGC 资深课】由工信部下属单位人民邮电出版社开设,是市面上值得推荐的课程之一,技术更新快,涵盖 AI 绘画、视听语言和 ChatGPT 等知识,无论初学者还是进阶者都适用。
2025-04-08
ai制作网站免费的
以下是一些关于免费的 AI 制作网站的信息: 1. 选择合适的 AI 网站制作工具时,需要考虑以下因素: 目标和需求:明确网站的目标(如个人博客、商业网站、在线商店)和功能需求。 预算:部分工具提供免费计划或试用版,但高级功能可能需付费订阅。 易用性:选择符合自身技术水平,能轻松使用和管理的工具。 自定义选项:检查工具是否提供足够的自定义选项,满足设计和功能需求。 支持和资源:查看是否有充足的客户支持和学习资源(如教程、社区论坛)以解决问题。 2. 麻省理工(MIT)为 8 18 岁孩子推出了免费的 AI 课程 Day of AI,该课程包含在 MIT 的 RAISE 项目中。其课程资源面向家长、老师群体,大孩子可自学,小孩子可能需要家长辅助。 3. ProductHunt 2023 年度最佳产品榜单中的 AI 产品: Dora AI:通过一个 prompt,借助 AI 3D 动画生成强大网站,支持文字转网站、生成式 3D 互动、高级 AI 动画。 Bard(免费):谷歌推出的官方 ChatGPT 竞争者。 Chat.DID(免费):首个允许人们以人类方式与 AI 进行视频聊天的 APP,处于测试阶段。 Pika(免费):能将创意转化为动态视频的概念 视频平台。
2025-04-08
ai制作网站
以下是一些制作网站的 AI 工具: 1. Wix ADI(Artificial Design Intelligence) 网址:https://www.wix.com/ 特点:基于用户提供的信息自动生成定制化网站,提供多个设计选项和布局,集成了 SEO 工具和分析功能。 2. Bookmark 网址:https://www.bookmark.com/ 特点:AIDA 通过询问用户几个简单问题快速生成网站,提供直观的拖放编辑器,包括多种行业模板和自动化营销工具。 3. Firedrop 网址:https://firedrop.ai/ 特点:Sacha 是其 AI 设计助手,可根据用户指示创建和修改网站设计,提供实时编辑和预览功能,包含多种现代设计风格和自定义选项。 4. The Grid 网址:https://thegrid.io/ 特点:Molly 是其 AI 设计助手,可自动调整网站设计和布局,基于内容和用户互动进行优化,支持多种内容类型。 5. Zyro 网址:https://zyro.com/ 特点:使用 AI 生成网站内容,包括文本、图像和布局建议,提供 AI 驱动的品牌和标志生成器,包含 SEO 和营销工具。 6. 10Web 网址:https://10web.io/ 特点:基于 AI 的 WordPress 网站构建工具,可自动生成网站布局和设计,提供一键迁移功能,集成 AI 驱动的 SEO 分析和优化工具。 7. Jimdo Dolphin 网址:https://www.jimdo.com/ 特点:Dolphin 是 Jimdo 的 AI 网站构建器,通过询问用户问题定制网站,提供自动生成的内容和图像,包含电子商务功能。 8. Site123 网址:https://www.site123.com/ 特点:简单易用,适合初学者,提供多种设计模板和布局,包括内置的 SEO 和分析工具。 选择合适的 AI 网站制作工具时,您可以考虑以下因素: 1. 目标和需求:确定网站目标(如个人博客、商业网站、在线商店)和功能需求。 2. 预算:有些工具提供免费计划或试用版,但高级功能可能需要付费订阅。 3. 易用性:选择符合您技术水平的工具,确保能轻松使用和管理网站。 4. 自定义选项:检查工具是否提供足够的自定义选项,以满足设计和功能需求。 5. 支持和资源:查看是否有足够的客户支持和学习资源(如教程、社区论坛),帮助解决问题。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-04-08
AI的发展史
AI(人工智能)的发展历程如下: 1. 起源阶段: 1943 年,心理学家麦卡洛克和数学家皮特斯提出机器的神经元模型,为后续的神经网络奠定基础。 1950 年,计算机先驱图灵最早提出图灵测试,作为判别机器是否具备智能的标准。 1956 年,在美国达特茅斯学院召开的会议上,人工智能一词被正式提出,并作为一门学科确立下来。 2. 发展阶段: 早期阶段(1950s 1960s):包括专家系统、博弈论、机器学习初步理论。 知识驱动时期(1970s 1980s):有专家系统、知识表示、自动推理。 统计学习时期(1990s 2000s):出现机器学习算法如决策树、支持向量机、贝叶斯方法等。 深度学习时期(2010s 至今):深度神经网络、卷积神经网络、循环神经网络等得到发展。 3. 前沿技术点: 大模型:如 GPT、PaLM 等。 多模态 AI:包括视觉 语言模型(CLIP、Stable Diffusion)、多模态融合。 自监督学习:自监督预训练、对比学习、掩码语言模型等。 小样本学习:元学习、一次学习、提示学习等。 可解释 AI:模型可解释性、因果推理、符号推理等。 机器人学:强化学习、运动规划、人机交互等。 量子 AI:量子机器学习、量子神经网络等。 AI 芯片和硬件加速。 在过去的几十年里,AI 的发展起起落落,经历了多次热度的起伏。如今,生成式 AI 等新技术的出现引发了新的关注和探索。
2025-04-08
AI音频使用了哪些技术
以下是一些关于 AI 音频所使用技术的介绍: 声音检测方面: :通过更强的听觉感知创造卓越的人类体验。 :先进的声音识别解决方案,能够分类如尖叫、枪声、咳嗽和哭泣等声音。 :下一代声音 AI 平台,能够像人类一样理解任何声音。 :语音控制的家庭自动化系统。 :世界上首个智能家居听觉系统。 :可用于从音频源中提取隐藏数据的 AI 模型。 :无需键盘、按钮或触摸屏,无缝融合物理世界和数据世界。 :为手机、VR/AR 头戴设备、智能手表、扬声器和笔记本电脑提供上下文感知。 :智能音频穿戴设备。 :将声音转化为信息。 :使用先进的深度学习技术进行声音事件检测和上下文识别,为世界上的每一个声音赋予意义。 音乐方面: :免费的 DAW,提供高质量的人声、鼓点、旋律、贝斯分离、全能音频分离、编辑和人声/乐器转 MIDI 功能。 :AI 音频处理。 :在音乐/视频流媒体和虚拟/增强现实中重新定义音频体验。 :为音乐行业提供按需创建音轨的平台。 :为娱乐行业提供音频分离解决方案,释放经典内容的全部潜力。 :在几秒钟内将任何歌曲的人声和音乐分离。 :基于世界排名第一的 AI 技术的高质量音轨分离。 :使用强大的 AI 算法免费将歌曲中的人声与音乐分离。 :使用 HiFi AI 分离歌曲中的人声、鼓点、贝斯和其他乐器。 :为 DJ 歌手提供的在线 AI 人声移除器。 :人声移除和在线卡拉 OK。 :使用多种不同算法(Demucs、MDX、UVR 等)免费分离歌曲。 语音合成(TTS)方面: :为所有人提供开放的语音技术。 :基于 AI 的语音引擎能够模仿人类语音的情感和韵律。 :基于 NLP 的最先进文本和音频编辑平台,内置数百种 AI 声音。 :使用突触技术和脑机接口将想象的声音转化为合成 MIDI 乐器的脑控仪器。 :为出版商和创作者开发最具吸引力的 AI 语音软件。 :Wondercraft 使用户能够使用文本转语音技术生成播客。 :基于生成机器学习模型构建内容创作的未来。 :从网页仪表板或 VST 插件生成录音室质量的 AI 声音并训练 AI 语音模型。 :演员优先、数字双重声音由最新的 AI 技术驱动,确保高效、真实和符合伦理。
2025-04-08
吉卜力风格的生成是哪个ai
以下 AI 工具可以生成吉卜力风格的图像: Midjourney:仿照 GPTs 里的 MJ prompt 改了一版提示词,可以用在 coze 或者其他国内的 agent 里。不是很挑模型,基本上都可以用。方便的地方在于如果提示词懒得写全,可以让 agent 直接帮助补全润色,黏贴就可以。例如生成一个巨大鲸鱼头部的特写,鲸鱼的眼睛显示疲惫的神情,一个小女孩站在鲸鱼的旁边抚摸鲸鱼的脸,小女孩占画面比例很小,体现鲸鱼的巨大,吉卜力工作室风格的提示词为:A closeup of a huge whale's head with its tired eyes. A little girl in red dress stands beside the whale, gently touching its face. The girl takes up a small portion of the frame, emphasizing the whale's enormity. Created Using: soft colors, gentle lighting, wideangle lens, Ghibli Studio style ar 16:9 style raw niji 6(画面需要改成了 niji) Sora:生成过左半部分为超现实主义风格,细腻刻画皮肤纹理与光影变化,右半部分为吉卜力动画风格,柔和笔触呈现幻想世界魅力的震撼图像。
2025-04-08
AI chatbot、agent、copilot区别
AI chatbot、agent、copilot 主要有以下区别: 1. 定义和角色: Copilot:翻译成副驾驶、助手,在帮助用户解决问题时起辅助作用。 Agent:更像主驾驶、智能体,可根据任务目标自主思考和行动,具有更强的独立性和执行复杂任务的能力。 Chatbot:具备基本对话能力,主要依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。 2. 核心功能: Copilot:更多地依赖于人类的指导和提示来完成任务,功能很大程度上局限于在给定框架内工作。 Agent:具有更高的自主性和决策能力,能够根据目标自主规划整个处理流程,并根据外部反馈进行自我迭代和调整。 3. 流程决策: Copilot:处理流程往往依赖于人类确定的静态流程,参与更多是在局部环节。 Agent:解决问题的流程由 AI 自主确定,是动态的,不仅可以自行规划任务步骤,还能根据执行过程中的反馈动态调整流程。 4. 应用范围: Copilot:主要用于处理简单、特定的任务,更多是作为工具或助手存在,需要人类引导和监督。 Agent:能够处理复杂、大型的任务,并在 LLM 薄弱的阶段使用工具或 API 等进行增强。 5. 开发重点: Copilot:主要依赖于 LLM 的性能,开发重点在于 Prompt Engineering。 Agent:同样依赖于 LLM 的性能,但开发重点在于 Flow Engineering,即在假定 LLM 足够强大的基础上,把外围的流程和框架系统化。 以下是一些 Agent 构建平台: 1. Coze:新一代一站式 AI Bot 开发平台,适用于构建基于 AI 模型的各类问答 Bot,集成丰富插件工具。 2. Mircosoft 的 Copilot Studio:主要功能包括外挂数据、定义流程、调用 API 和操作,以及部署 Copilot 到各种渠道。 3. 文心智能体:百度推出的基于文心大模型的智能体平台,支持开发者根据需求打造产品能力。 4. MindOS 的 Agent 平台:允许用户定义 Agent 的个性、动机、知识,以及访问第三方数据和服务或执行工作流。 5. 斑头雁:2B 基于企业知识库构建专属 AI Agent 的平台,适用于多种场景,提供多种成熟模板。 6. 钉钉 AI 超级助理:依托钉钉强大的场景和数据优势,在处理高频工作场景方面表现出色。 以上信息由 AI 大模型生成,请仔细甄别。
2025-04-07
有没有可以抓取公众号文章的 agent
以下是一些可以抓取公众号文章的方法和相关信息: 1. 可以通过读 SQLiteDB 或者获取 RSS XML 页面(http://127.0.0.1:4000/feeds/all.atom)来获取更新的公众号。个人选择在公众号订阅不太多时,建议使用分析 XML 页面,比较简单。可以写个程序获得公众号的更新文章,由于本地部署,无法直接将文章同步到 Coze,所以选择使用多维表格(当在线数据库,事实飞书多维表格后台也是使用类似 redis 或 TiDB 这样的数据库实现的)及飞书机器人 API 的方式来实现中间数据的传递。只要在多维表格中设置一个状态转换,就可以知道文章是否已经被解读和推送。 2. 可以通过文章链接订阅公众号,定时推送情报消息,并实现情报 CoT 问答。例如使用 Docker 浏览器打开:http://127.0.0.1:4000 也可以 http://wewerss 服务的 IP:端口为上面设置的外部端口。先点帐号管理,然后点“添加读书帐号”(即使用微信读书来实现公众号订阅),扫码添加帐号。然后在公众号源上,点添加。然后将想订阅的公众号的一篇文章链接粘贴并点确定即可订阅公众号文章。但建议不要短时间订阅太多公众号(经测试最好不要超 40 个)。 3. 瓦斯阅读平台可以抓取公众号的内容,但平台上公众号不太全。 4. GitHub 上的 WeWe RSS 工具可以通过微信读书的方式订阅公众号。
2025-04-05
dify工作流中agent节点怎么使用
在 Dify 工作流中使用 Agent 节点的步骤如下: 1. 搭建工作流框架: 进入 Coze,点击「个人空间工作流创建工作流」,打开创建工作流的弹窗。 根据弹窗要求自定义工作流信息,点击确认完成新建。 左侧「选择节点」模块中,根据子任务需要,实际用上的有插件(提供能力工具拓展 Agent 能力边界)、大模型(调用 LLM 实现文本内容生成)、代码(支持编写简单脚本处理数据)。 按照流程图在编辑面板中拖入对应的 LLM 大模型、插件、代码节点完成框架搭建。 2. 测试 Agent 节点功能: 完成任何一个节点的配置后,都需要进行试运行测试以验证节点的运行效果。 步骤一:点击「测试该节点」。 步骤二:按格式要求输入待测试的输入内容,如果是 array 等其他格式,请自行对话 AI 或搜索网络确认格式要求。 步骤三:点击「展开运行结果」,检查输入、输出项是否有误。如果有误,请依次检查“测试输入内容”、“节点配置”是否有误,以及优化“提示词”以提升对生成内容的约束力。当多次测试时输入与输出都符合预期,就可以进入下一个子任务的配置。
2025-04-05
钉钉多维表格属于agent吗
钉钉多维表格本身不属于 Agent,但在某些特定的场景和应用中,可以将其与其他技术结合来构建类似于 Agent 的功能。 例如,在搭建信息情报官 Agent 的过程中,会利用飞书多维表格作为中间数据的传递工具,实现数据的存储和状态转换。同时,经过调研发现,飞书多维表格插件支持新增和查询数据表记录,能满足存储和检索数据的需求,为构建 AI 智能体提供支持。但这并不意味着多维表格本身就是 Agent,而是在特定的技术架构和应用中发挥了重要的数据处理和存储作用。
2025-04-01
多维表格属于agent
多维表格在搭建信息情报官 Agent 方面有以下应用: 1. 因为前面需要对多维表格操作,所以要先在 http://open.feishu.cn 上建一个飞书机器人,并添加知识库或多维表格编辑权限,通过机器人的 app_id 和 app_secret 获得租用 token:tenant_access_token 来获取多维表格数据和编辑能力。 2. 可以通过读 SQLiteDB 或者获取 RSS XML 页面 http://127.0.0.1:4000/feeds/all.atom,写程序获得公众号的更新文章,由于本地部署无法直接将文章同步到 Coze,选择使用多维表格作为在线数据库及飞书机器人 API 的方式来实现中间数据的传递,在多维表格中设置状态转换来了解文章是否已被解读和推送。 3. 应用背景包括解决数据高效抓取与批量 AI 化处理的问题,涉及 Coze 定义智能体发布到飞书多维表格字段捷径、多维表格中使用和配置自定义的 AI 字段捷径、Coze 应用将数据导入到飞书多维表格并驱动其自动运行、多维表格仪表盘对数据的可视化等技术场景,期望达到让大家学会最高效率使用 AI 并将方案泛化到实际工作中的目的。
2025-04-01
公司给我了一个调研作业,收集 市场上其它公司在agent业务变革上的优秀实践
很抱歉,目前没有关于市场上其他公司在 agent 业务变革方面优秀实践的相关内容。建议您通过以下途径进行收集和调研: 1. 行业报告和研究机构发布的分析:这些通常会涵盖多个公司在特定领域的实践和趋势。 2. 专业的行业论坛和社区:与同行交流,获取他们的经验和见解。 3. 公司的官方网站和公开资料:了解其业务变革的介绍和相关案例分享。 4. 新闻媒体报道:关注相关的商业新闻,获取最新的动态和实践案例。
2025-03-31
自动规划的prompt如何设计编写
自动规划的 prompt 设计编写可以参考以下要点: 对于简单任务场景: 设定人物:描述 Bot 所扮演的角色或职责、回复风格。 描述功能和工作流程:明确 Bot 的功能和工作流程,约定在不同场景下的回答方式,可通过自然语言强调调用工具以提升约束力,也可为 Bot 提供回复格式示例。 指示 Bot 在指定范围内回答:明确告知回答与不回答的内容。 对于复杂任务场景:推荐使用结构化格式编写提示,使用 Markdown 语法,增强可读性和对 Bot 的约束力。扣子支持将 Bot 的提示自动优化成结构化内容,您可直接使用或修改。 此外,PromptAgent 是一种将提示词优化视为策略性规划问题的方法,采用基于蒙特卡洛树搜索的规划算法,策略性地导航专家级提示词空间。它通过反思模型错误并生成建设性反馈,诱导出精确的专家级见解和深入指令,能高效制定专家级、详细且富有领域洞察力的提示词。 同时,当您理解 chatGPT 如何理解人类语言和文明后,有助于解决 prompt 编写中遇到的问题。比如,找到真正的需求来开始第一个 prompt 编写,这需要一定的洞察能力,可采用“如果某事重复做了三遍,就要思考如何将它自动化”的方法论。例如,若多次在群里发同样的自我介绍,可编写自动优化排版的 Prompt。
2025-04-08
我们是搜索团队的产品经理,团队定位倾向于“对于插件的建设与调用”定位,现在要做AI相关的产品规划,请以通俗易懂的方式对以下问题做出回答 1、请通过流程图的方式,介绍【插件/工具】能力在大模型生态架构中的环节、定位、实现流程是什么 2、调研下对于我们搜索团队而言,插件应该做什么,可以做什么 3、思考对于大模型来说,有哪些(通用或垂类)的模块/功能/插件是无法绕开的,或高频使用的,作为我们团队后续争取的发力点(如搜索推荐对于传统综合搜索结果页)
以下是为您提供的关于 AI 相关产品规划的回答: 一、插件/工具能力在大模型生态架构中的环节、定位、实现流程 从 2023 年 3 月份 OpenAI 宣布插件计划开始,到 5 月份上线,其中包括联网、代码、画图三个插件。其实现流程大致为: 1. 经过对模型的微调,检测何时需要调用函数(取决于用户的输入)。 2. 使用符合函数签名的 JSON 进行响应。 3. 在接口层面声明可调用的工具。 4. 使用函数和用户输入调用模型。 5. 使用模型响应调用 API。 6. 将响应发送回模型进行汇总。 二、对于搜索团队,插件可以做和应该做的事 目前没有直接针对搜索团队插件具体可做和应做事项的明确内容,但可以参考 OpenAI 的插件计划,例如开发与搜索相关的特定功能插件,或者探索如何将现有的搜索推荐功能与大模型更好地结合。 三、对于大模型无法绕开或高频使用的模块/功能/插件 目前没有直接指出对于大模型无法绕开或高频使用的具体模块、功能或插件。但从相关信息中可以推测,例如与数据获取和处理相关的插件(如联网)、与技术开发相关的插件(如代码)以及与内容生成相关的插件(如画图)可能是较为重要和高频使用的。对于搜索团队来说,可以考虑在这些方向上寻找发力点,结合搜索推荐等传统功能,开发出更具竞争力的插件。
2025-04-08
哪个AI能帮助初中生规划学习计划
以下几个 AI 可以帮助初中生规划学习计划: 1. 文心大模型 4.0:它可以按照以下步骤为用户制定学习计划。首先询问学习目标或需要解决的问题,然后依次询问并收集学习目标与个人或职业发展目标的关系、具体学习内容、量化学习进度和成功的标准、目标完成的时间框架、目标的现实可行性等信息,最后综合这些信息制定详细的分步骤学习计划,包括每日和每周的学习内容及目标。 2. ChatGPT:可以协助设定量化目标,比如以考取雅思 8.0 且能和朋友或客户流利交谈为目标。然后会询问达成目标的时间框架,比如半年。还会询问目标的现实可行性,比如考虑目前的英语水平、日常时间安排、学习资源等情况。 例如,如果一个初中生想要提高英语水平,设定半年内考取雅思 8.0 且能流利交流为目标,目前雅思 6.5,每天能投入 2 小时,周末更多,有网络课程访问条件且能购买学习材料,那么这些 AI 可以根据这些信息为其制定具体的学习计划。
2025-03-30
我该如何学习AGI,请给我规划一条可行的学习之路
以下是为您规划的学习 AGI 的可行之路: 1. 应用方面: 深入了解 Prompt,选择适合自己的 AI 对话、绘画和语音产品,每天使用并用于解决实际问题或提升效率。 2. 分析方面: 大量阅读各类文章、视频以及行业报告,理解各知识之间的关系。 3. 记忆方面: 先从 AI 的历史、基本术语、重要人物、方法和原理等开始了解,查看入门课程。 具体的学习资源包括: 关于 Prompt 的了解:https://ywh1bkansf.feishu.cn/wiki/Q5mXww4rriujFFkFQOzc8uIsnah?table=tbldSgFt2xNUDNAz&view=vewo2g2ktO 适合的 AI 对话:https://ywh1bkansf.feishu.cn/wiki/QddLw0teKi7nUCkDRIecskn3nuc 绘画相关:https://ywh1bkansf.feishu.cn/wiki/Q5ddwxfkMiVUZBkQXN7cgXf4nOb 语音相关:https://ywh1bkansf.feishu.cn/wiki/ZXPiw2OuLi2YsxkkmaLcPTyInrc AI 历史:https://ywh1bkansf.feishu.cn/wiki/PFXnwBTsEiGwGGk2QQFcdTWrnlb?table=tbl1tOC3ZKbrcHVn&view=vewTtypUZc 基本术语:https://ywh1bkansf.feishu.cn/wiki/PFXnwBTsEiGwGGk2QQFcdTWrnlb?table=tbltvr7KExCt7Jpw&view=vewjxk9tDu 重要人物:https://ywh1bkansf.feishu.cn/wiki/PFXnwBTsEiGwGGk2QQFcdTWrnlb?table=tblLtN12KuvP5reO&view=vewuvGBXhd 方法和原理:https://ywh1bkansf.feishu.cn/wiki/PFXnwBTsEiGwGGk2QQFcdTWrnlb?table=tblolGx2mprs1EQz&view=vewx5ROYtl 入门课程:https://waytoagi.feishu.cn/wiki/ZYtkwJQSJiLa5rkMF5scEN4Onhd?table=tblWqPFOvA24Jv6X&view=veweFm2l9w
2025-03-28
我是一名ai小白,我想学习这门课程,请你帮我规划一下
以下是为您规划的 AI 学习路径: 预习周课程: AI 绘画电脑配置要求 高效 AIGC 创意者的数字人工具包 SD 插件安装方法 画静为动的 AIGC 视频制作讲解 基础操作课: AI 绘画通识课 AI 摄影虚拟的真实 AI 电影 穿越的大门 核心范式课程: 词汇的纸牌屋 核心范式应用 控制随机性 SD WebUi 体系课程: SD 基础部署 SD 文生图 图生图 局部重绘 ChatGPT 体系课程: ChatGPT 基础 核心 文风、格式、思维模型 ComfyUI 与 AI 动画课程: 部署和基本概念 基础工作流搭建 动画工作流搭建 应对 SORA 的视听语言课程: 通识 欢迎参加电影的葬礼 影像赏析 基础戏剧影视文学 学习建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,了解人工智能的主要分支及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前应用和未来发展趋势。 2. 开始 AI 学习之旅: 在「」中找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: 根据自身兴趣选择特定的 AI 模块(如图像、音乐、视频等)进行深入学习。 掌握提示词的技巧。 4. 实践和尝试: 理论学习后进行实践,尝试使用各种产品做出作品。 在知识库分享实践后的作品和文章。 5. 体验 AI 产品: 与 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人互动,了解其工作原理和交互方式。 开始方式选择: 1. 本地部署: 如果您的电脑是 M 芯片的 Mac 电脑(Intel 芯片出图速度慢,不建议)或者 2060Ti 及以上显卡的 Windows 电脑,可以选择本地部署。强烈建议在配有 N 卡的 Windows 电脑上进行。 2. 在线平台: 对于电脑不符合要求的小伙伴可以直接使用在线工具,在线工具分为在线出图和云电脑两种,前者功能可能会受限、后者需要自己手动部署,大家根据实际情况选择即可。 3. 配台电脑: 非常不建议一上来就配主机,因为大概率会变成游戏机或者吃灰(土豪请随意)。玩几个月后还对 AI 有兴趣的话再考虑配个主机。主机硬盘要大,显卡预算之内买最好,其他的随意。 先验经验: 需要熟练使用文生图、图生图;需要有一定的逻辑思考能力以及推理能力;适合炼丹新人、小白。 课程安排: 课程大约 70 80%是理论和方法论的内容,大部分练习会在课外跟大家沟通、练习。只有少部分必要内容会在课上演示。 您还可以通过参与 video battle 争取免费课程的机会。每期的 video battle 的评委野菩萨老师都非常严格,需要寓意深度审美并存。冠军奖励 4980 课程一份,亚军奖励 3980 课程一份,季军奖励 1980 课程一份,入围奖励 598 野神殿门票一张。 您可以扫码添加菩萨老师助理,了解更多课程信息。让我们一起在“通往 AGI 之路”社区学习成长,探索 AI 的无限可能!
2025-03-23
我是ai基础小白,我想学习这个ai知识,请你帮我规划一下学习路径
以下是为您规划的 AI 学习路径: 一、了解 AI 基本概念 1. 阅读「」部分,熟悉 AI 的术语和基础概念,包括人工智能的定义、主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 2. 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 二、开始 AI 学习之旅 1. 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 2. 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 三、选择感兴趣的模块深入学习 1. AI 领域广泛,比如图像、音乐、视频等,您可以根据自己的兴趣选择特定的模块进行深入学习。 2. 掌握提示词的技巧,它上手容易且很有用。 四、实践和尝试 1. 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。 2. 在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 五、体验 AI 产品 1. 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 如果您的学习方向偏向技术研究: 1. 掌握数学基础,包括线性代数、概率论、优化理论等。 2. 学习机器学习基础,如监督学习、无监督学习、强化学习等。 3. 深入研究深度学习,包括神经网络、卷积网络、递归网络、注意力机制等。 4. 钻研自然语言处理,如语言模型、文本分类、机器翻译等。 5. 探索计算机视觉,如图像分类、目标检测、语义分割等。 6. 关注前沿领域,如大模型、多模态 AI、自监督学习、小样本学习等。 7. 进行科研实践,包括论文阅读、模型实现、实验设计等。 如果您的学习方向偏向应用: 1. 具备编程基础,如 Python、C++等。 2. 掌握机器学习基础,如监督学习、无监督学习等。 3. 熟悉深度学习框架,如 TensorFlow、PyTorch 等。 4. 涉足应用领域,如自然语言处理、计算机视觉、推荐系统等。 5. 学会数据处理,包括数据采集、清洗、特征工程等。 6. 掌握模型部署,如模型优化、模型服务等。 7. 参与行业实践,包括项目实战、案例分析等。 无论是技术研究还是应用实践,数学和编程基础都是必不可少的。同时需要紧跟前沿技术发展动态,并结合实际问题进行实践锻炼。 如果您想将 AI 与宠物结合: 1. 掌握基础的机器学习、计算机视觉、自然语言处理等 AI 技术。 2. 了解宠物行为学、宠物医疗等相关领域知识。 3. 关注业内先进的 AI+宠物应用案例,学习其技术实现。 4. 尝试开发简单的 AI 宠物应用原型,并不断迭代优化。
2025-03-23
基于规则的测试生成: 测试用例生成工具: Randoop:基于代码路径和规则生成测试用例,适用于 Java 应用程序。这个应该怎样使用呢
很抱歉,目前没有关于 Randoop 工具使用方法的相关内容。您可以通过以下途径获取更详细的信息: 1. 官方文档:访问 Randoop 的官方网站,查找其提供的详细使用说明和教程。 2. 技术论坛:在相关的技术论坛上搜索关于 Randoop 使用的讨论和经验分享。 3. 开源社区:参与开源社区中关于 Randoop 的交流,向其他开发者请教。
2025-04-08
如何使用AI给测试进行提效
以下是关于如何使用 AI 给测试提效的详细内容: 1. 基于规则的测试生成: 测试用例生成工具: Randoop:基于代码路径和规则生成测试用例,适用于 Java 应用程序。 Pex:微软开发的智能测试生成工具,自动生成高覆盖率的单元测试,适用于.NET 应用。 模式识别: Clang Static Analyzer:利用静态分析技术识别代码模式和潜在缺陷,生成相应的测试用例。 Infer:Facebook 开发的静态分析工具,自动生成测试用例,帮助发现和修复潜在错误。 2. 基于机器学习的测试生成: 深度学习模型: DeepTest:利用深度学习模型生成自动驾驶系统的测试用例,模拟不同驾驶场景,评估系统性能。 DiffTest:基于对抗生成网络(GAN)生成测试用例,检测系统的脆弱性。 强化学习: RLTest:利用强化学习生成测试用例,通过与环境交互学习最优测试策略,提高测试效率和覆盖率。 A3C:基于强化学习的测试生成工具,通过策略梯度方法生成高质量测试用例。 3. 基于自然语言处理(NLP)的测试生成: 文档驱动测试生成: Testim:AI 驱动的测试平台,通过分析文档和用户故事自动生成测试用例,减少人工编写时间。 Test.ai:利用 NLP 技术从需求文档中提取测试用例,确保测试覆盖业务需求。 自动化测试脚本生成: Selenium IDE + NLP:结合 NLP 技术扩展 Selenium IDE,从自然语言描述中生成自动化测试脚本。 Cucumber:使用 Gherkin 语言编写的行为驱动开发(BDD)框架,通过解析自然语言描述生成测试用例。 4. 基于模型的测试生成: 状态模型: GraphWalker:基于状态模型生成测试用例,适用于复杂系统的行为测试。 Spec Explorer:微软开发的模型驱动测试工具,通过探索状态模型生成测试用例。 场景模拟: Modelbased Testing:基于系统模型自动生成测试用例,覆盖各种可能的操作场景和状态转换。 Tosca Testsuite:基于模型的测试工具,自动生成和执行测试用例,适用于复杂应用的端到端测试。 5. 实践中的应用示例: Web 应用测试:使用 Testim 分析用户行为和日志数据,自动生成高覆盖率的测试用例,检测不同浏览器和设备上的兼容性问题。 移动应用测试:利用 Test.ai 从需求文档中提取测试用例,确保覆盖关键功能和用户路径,提高测试效率和质量。 复杂系统测试:采用 GraphWalker 基于系统状态模型生成测试用例,确保覆盖所有可能的状态和操作场景,检测系统的边界情况和异常处理能力。 总结:AI 在生成测试用例方面具有显著的优势,可以自动化和智能化生成高覆盖率的测试用例,减少人工编写测试用例的时间和成本。通过合理应用 AI 工具,前端开发工程师可以提高测试效率、增强测试覆盖率和发现潜在问题,从而提升软件质量和用户体验。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-04-08
开源flux模型如何快速使用
以下是关于开源 Flux 模型快速使用的方法: 1. 模型的下载: 如果因为环境问题,可以在网盘中下载。 siglipso400mpatch14384(视觉模型):siglip 由 Google 开发的视觉特征提取模型,负责理解和编码图像内容。工作流程包括接收输入图像、分析图像的视觉内容并将这些视觉信息编码成一组特征向量。打开 ComfyUI\models\clip,在地址栏输入 CMD 回车,打开命令行,输入下面的命令拉取模型(也可以在网盘里下载)。 image_adapter.pt(适配器):连接视觉模型和语言模型,优化数据转换。工作流程包括接收来自视觉模型的特征向量、转换和调整这些特征,使其适合语言模型处理。通过 https://huggingface.co/spaces/fancyfeast/joycaptionprealpha/tree/main/wpkklhc6 下载,放到 models 的 Joy_caption 文件夹里,如果该文件夹不存在,就新建一个。 MetaLlama3.18Bbnb4bit(语言模型):大型语言模型,负责生成文本描述。工作流程包括接收经过适配器处理的特征、基于这些特征生成相应的文本描述、应用语言知识来确保描述的连贯性和准确性。打开 ComfyUI\models\LLM,地址栏输入 CMD 回车,在命令行里面输入下面命令。 2. 下载地址: ae.safetensors 和 flux1dev.safetensors 下载地址:https://huggingface.co/blackforestlabs/FLUX.1dev/tree/main 。 准备了夸克和百度的网盘链接,方便部分同学下载: flux 相关模型(体积较大)的夸克网盘链接:https://pan.quark.cn/s/b5e01255608b 。 flux 相关模型(体积较大)的百度网盘链接:https://pan.baidu.com/s/1mCucHrsfRo5SttW03ei0g?pwd=ub9h 提取码:ub9h 。 如果 GPU 性能不足、显存不够,底模可以使用 fp8 的量化版模型,速度会快很多,下载地址:https://huggingface.co/Kijai/fluxfp8/tree/main 。 3. 工作流下载: 最后我们再下载 dev 的工作流: 。或者下面官方原版的图片链接,图片导入 comfyUI 就是工作流:https://comfyanonymous.github.io/ComfyUI_examples/flux/flux_dev_example.png 。我们打开 ComfyUI,把工作流或图片拖拽到 ComfyUI 里。
2025-04-08