Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

最近Agent方面的场景案例

Answer

以下是一些关于 Agent 方面的场景案例:

  1. 吴恩达最新演讲中提到的四种 Agent 设计范式:

    • Reflection(反思):例如让用 Reflection 构建好的 AI 系统写代码,AI 会把代码加上检查正确性和修改的话术再返回给自己,通过反复操作完成自我迭代,虽不能保证修改后代码质量,但效果通常更好。
    • Tool Use(工具使用):大语言模型调用插件,极大拓展了 LLM 的边界能力。
    • Planning(规划):属于比较新颖且有前景的方式。
    • Multi-agent(多智能体):也具有发展潜力。
  2. Ranger 文章中的相关内容:

    • Agent 被认为是大模型未来的主要发展方向。
    • 中间的“智能体”通常是 LLM 或大模型,通过为其增加工具、记忆、行动、规划这四个能力来实现。
    • 行业里主要用到的是 langchain 框架,它在 prompt 层和工具层完成主要的设计,将 LLM 与 LLM 以及 LLM 与工具进行串接。
  3. 从词源和历史变迁来看:

    • 在不同时期,“Agent”在商业、政府、情报、娱乐、体育等领域都有重要角色,涵盖贸易代理、公司代理商、情报特工、艺人经纪人等多种职业。
    • “Agent”一词具有行动和替身的含义,多数情况下指“拥有行动的替身,替代他人做某事”。
Content generated by AI large model, please carefully verify (powered by aily)

References

四种 Agent 设计范式(通俗易懂版)-- 吴恩达最新演讲

我们的研究结果表明,如果你使用GPT3.5+Zero-shot的正确率为48%,GPT4+Zero-shot的正确率为67%,但是,如果你用GPT3.5+Agentic Workflow,你会得到超越GPT4的效果!因此,Agent在构建AI应用时非常重要。(然后就到了主题)尽管很多学者、专家谈论了很多关于Agent的东西,但我今天想更具体的分享我在Agent中看到比较广泛的四种设计模式(尽管很多团队,开源项目等做了很多种多样的尝试,但我还是按我的理解划分成了四类)。Reflection和Tool Use属于比较经典且相对已经广泛使用的方式,Planning和Multi-agent属于比较新颖比较有前景的方式。第一个讲的就是Reflection(反思,类似于AI的自我纠错和迭代),举个栗子,我们让用Reflection构建好的一个AI系统写个xxx代码,然后AI会把这个代码,加上类似“检查此段代码的正确性,告诉我如何修改”的话术,再返回给AI,AI可能会给你提出其中的Bug,然后如此反复,AI自己完成了自我迭代,虽然修改后的代码质量不一定能保证,但基本上来说效果会更好。(每页PPT下方,吴恩达大佬都推荐了一些相关论文,可以去看看)如上表述的是案例是Single-agent(区别于Mutli-agent的单智能体),但其实你也可以用两个Agent,一个写代码,然后另一个来Debug👇这两个Agent可以用相同的LLM,也可以用不同的,这种Reflection的方式在很多场景都适用。接下来第二个是Tool Use(如果你经常玩GPT4或者国产的一些AI对话产品,那就不陌生了),大语言模型调用插件,极大的拓展了LLM的边界能力。

Ranger:【AI 大模型】非技术背景,一文读懂大模型(长文)

agent算是从年前到现在,比较火的一个概念了,也被很多人认为是大模型的未来的一个主要发展方向。首先我们看这个很经典的一张图看起来还是蛮复杂的,然后市面上的很多描述agent的文章写的也比较复杂,说智能体是啥智能的最小单元,相较于copilot,是可以给他设定一个目标后主动完成任务的等等。当然这些说法都没错,但是我觉得还是有些不好理解的。所以我们依然先从原理着手去理解下,agent是个什么东西。首先这张图里,中间的“智能体”,其实就是llm,或者说大模型。四个箭头,分别是我们为llm增加的四个能力。工具、记忆、行动、规划。那么这个是怎么新增的呢?目前行业里主要用到的是一个叫langchain的框架,这个框架可以简单理解为,他把llm和llm之间,以及llm和工具之间,通过代码或prompt的形式,进行了串接。这个其实也像是在rag的基础上再进了一步。因为我们知道rag其实是给了大模型一个浏览器工具来使用嘛,那agent,其实就是给了大模型更多的工具。比如像是长期记忆,其实就是给了大模型一个数据库工具让其往里记录重要信息。规划和行动,其实就是在大模型的prompt层做的些逻辑,比如让其将目标进行每一步的拆解,拆解完成后,每一步去输出不同的固定格式action指令,给到工具作为输入。当然langchain或者说agent还不止这些,也会有很多其他的代码逻辑体现在其中,不过其主要的主干逻辑,其实还是在prompt层和工具层,完成的设计。

AI-Agent系列(一):智能体起源探究

随着大航海时代及全球贸易的兴起,“Agent”的角色在商业领域变得日益重要。16至17世纪间,贸易代理和公司代理商开始在全球范围内进行商品交易,如荷兰东印度公司的代理人。18至19世纪工业革命期间,“Agent”的职能进一步拓展到保险、房地产等新兴行业。此外,在19世纪,政府及情报领域也开始广泛使用“Agent”,比如情报特工和便衣警察,在维护国家安全与社会秩序方面发挥了不可或缺的作用。现代(20世纪至21世纪):在20世纪至21世纪的现代社会中,“Agent”一词涵盖了多种职业角色,尤其在娱乐和体育行业中,它指的是艺人经纪人和运动员经理等职位。这些专业经理人负责安排试镜、进行合同谈判以及规划职业生涯,确保客户能在竞争激烈的行业中获得成功。此外,“Agent”还包括劳务代理和招聘代理(猎头)。劳务代理提供劳动力匹配服务,帮助求职者找到合适的工作,并为雇主提供所需的人才,如劳务派遣公司将临时员工派遣到需要额外支持的企业单位。而猎头则专门为公司招募高技能或高级管理职位的专业人士,通过筛选简历、安排面试并评估候选人来帮助企业找到最合适的员工。凭借深厚的行业知识与广泛的联系网络,这些猎头为企业与顶尖人才之间搭建了重要桥梁。从词源和词的历史变迁中,大家就能看到,“Agent”这个词本身就具有行动的含义,到了后期又附加了“替身”的意思。且无论哪个领域,“Agent”都多数情况下都在指:“拥有行动的替身,都是替代他人做某事“

Others are asking
什么是AI Agent,我作为程序员该学习什么?能获得额外收入
您提供的内容与“什么是 AI Agent 以及程序员学习相关内容能否获得额外收入”的问题无关。AI Agent 是指具有自主决策和行动能力的智能体,能够在特定环境中感知、学习、推理和执行任务。作为程序员,如果您想学习与 AI Agent 相关的知识,建议您掌握以下方面: 1. 机器学习和深度学习的基础知识,包括常见的算法和模型。 2. 自然语言处理技术,以便能够理解和处理与智能体交互的语言信息。 3. 强化学习,这对于训练智能体做出最优决策非常重要。 4. 编程技能,熟练掌握 Python 等编程语言。 至于能否获得额外收入,这取决于多种因素,如您所开发的 AI Agent 应用的市场需求、您的技术水平和创新能力等。如果您能够开发出具有实用价值和创新性的 AI Agent 应用,并找到合适的商业机会,是有可能获得额外收入的。
2025-02-07
请问什么是agent?
Agent(智能体)是一种能够在环境中自主感知、思考并采取行动的实体。可以把它想象成一个具有特定目标和行为能力的智能角色,能根据环境变化做出相应的决策和反应。 在不同的场景中,Agent 有不同的具体表现和应用。比如: 从产品角度来看,Agent 可以是一个历史新闻探索向导,有着知识渊博、温暖亲切、富有同情心的性格,主导新闻解析和历史背景分析,还可以为其设计背景故事来使其角色更加生动。 在结合大型语言模型(LLM)的情况下,LLM Agent 能够利用大型语言模型的自然语言处理能力,理解用户的输入,并在此基础上进行智能决策和行动。它由规划、记忆、工具和行动等部分组成。规划负责将复杂任务分解成可执行的子任务,并评估执行策略;记忆包括短期记忆和长期记忆,分别用于存储对话上下文和用户特征及业务数据;工具是感知环境、执行决策的辅助手段,如 API 调用、插件扩展等;行动则是将规划和记忆转换为具体输出的过程,包括与外部环境的互动或工具调用。 在人工智能领域,Agent 智能代理能够自动执行任务,比如搜索信息、监控系统状态或与用户交互。
2025-02-07
我想要搭建一个能够帮我阅读并总结提炼,同时能在我提出问题时,随时在我给他提供的知识库中检索的AI Agent,如何用Coze搭建?
搭建能够阅读、总结提炼并在给定知识库中检索的 AI Agent 可以使用 Coze 按照以下步骤进行: 1. 规划 制定任务的关键方法。 总结任务目标与执行形式。 将任务分解为可管理的子任务,确立逻辑顺序和依赖关系。 设计每个子任务的执行方法。 2. 实施 在 Coze 上搭建工作流框架,设定每个节点的逻辑关系。 详细配置子任务节点,并验证每个子任务的可用性。 3. 完善 整体试运行 Agent,识别功能和性能的卡点。 通过反复测试和迭代,优化至达到预期水平。 关于一些其他问题: 1. 如何判断自己的任务/Prompt 是否需要拆解为工作流? 构建稳定可用的 AI Agent 是一个需要不断调试和迭代的过程。通常先从当前性能最强的 LLM(如 ChatGPT4 和 Claude 3.5 sonnet)着手,先用单条 Prompt 或 Prompt Chain 来测试任务的执行质量和稳定性。然后,根据实际执行情况、最终投产使用的 LLM,逐步拆解子任务,降低 LLM 执行单任务的难度,直到达成工程目标。一般对于场景多样、结构复杂、对输出格式要求严格的内容,基本可以预见到需要将其拆解为工作流。此外,如果涉及生成多媒体内容或从网络自主获取额外信息等能力,必然需要通过工作流来调用相应的插件。 2. 只用了一段 Prompt 的 Agent,还算 AI Agent 吗? 算。详见
2025-02-06
如何实现稳定的ai agent
要实现稳定的 AI agent ,可以从以下几个方面考虑: 1. 提示词工程与工具调用能力的配合:设计出一套与知识图谱相结合的工具调用逻辑,稳定人设。通过缩小 max_length 防止 LLM 长篇大论,每次输入到上下文窗口中的记忆只返回最近几轮的对话,并利用查询知识图谱的信息来实现永久记忆。 2. 工具设计:将与知识图谱交互这一大的任务,细分为查询、创建、修改、删除实体或关系、获取实体的所有关系、获取所有实体名称列表等多个工具,组成一个工具包供 LLM 调用。 3. 构建数字人灵魂: 写一个像人一样的 Agent ,工程实现所需的记忆模块、工作流模块、各种工具调用模块的构建都是挑战。 解决灵魂部分如何驱动躯壳部分的问题,将灵魂部分的所有接口定义出来,躯壳部分通过 API 调用。 注意实时性,由于整个数字人的算法部分组成庞大,几乎不能实现单机部署,要解决网络耗时和模型推理耗时问题。 考虑多元跨模态,根据实际需求添加其他感官的交互。 处理拟人化场景,如插话、转移话题等情况。 4. 工作流的设计模式:可以运用吴恩达教授提出的设计模式,如 Reflection 模式,设计工作流先检索知识库的活动内容,再通过 LLM 大模型区块进行数据修正,最终输出符合意图的结果。
2025-02-06
有哪些开源或免费的AI模型管理平台,可以配置模型,管理Agent的
以下是一些开源或免费的 AI 模型管理平台及相关模型: 1. 智谱·AI: Chat 模型: ChatGLM6Bint4:ChatGLM6B 的 Int4 版本,最低只需 6GB 显存即可部署,最低只需 7GB 显存即可启动微调(、魔搭社区、始智社区、启智社区获取。 ChatGLM6Bint8:ChatGLM6B 的 Int8 版本,上下文 token 数为 2K。可在、魔搭社区、始智社区、启智社区获取。 AgentLM7B:提出了一种 AgentTuning 的方法,开源了包含 1866 个高质量交互、6 个多样化的真实场景任务的 Agent 数据集 AgentInstruct,基于上述方法和数据集,利用 Llama2 微调而成,上下文 token 数为 4K。代码链接为。 AgentLM13B:上下文 token 数为 4K,模型权重下载链接为。 AgentLM70B:上下文 token 数为 8K,模型权重下载链接为。 下载模型:智谱 AI 提供的所有开源模型均可以在以下平台进行下载:。 2. 通义千问: 本地部署 Qwen2.51M 模型:使用以下命令启动服务,根据硬件配置进行设置。参数说明: tensorparallelsize:设置为使用的 GPU 数量。7B 模型最多支持 4 个 GPU,14B 模型最多支持 8 个 GPU。 maxmodellen:定义最大输入序列长度。如果遇到内存不足问题,请减少此值。 maxnumbatchedtokens:设置 Chunked Prefill 的块大小。较小的值可以减少激活内存使用,但可能会减慢推理速度。推荐值为 131072,以获得最佳性能。 maxnumseqs:限制并发处理的序列数量。如果遇到问题,请参考相关内容。 与模型交互:可以使用以下方法与部署的模型进行交互:选项 1.使用 Curl;选项 2.使用 Python。对于更高级的使用方式,可以探索如之类的框架。QwenAgent 使模型能够读取 PDF 文件或获得更多功能。
2025-02-06
Agent搭建平台都有哪些
以下是一些常见的 Agent 搭建平台: 1. Coze:新一代一站式 AI Bot 开发平台,适用于构建各类问答 Bot,集成丰富插件工具,拓展 Bot 能力边界。 2. Microsoft 的 Copilot Studio:主要功能包括外挂数据、定义流程、调用 API 和操作,以及将 Copilot 部署到各种渠道。 3. 文心智能体:百度推出的基于文心大模型的智能体平台,支持开发者打造产品能力。 4. MindOS 的 Agent 平台:允许用户定义 Agent 的个性、动机、知识,以及访问第三方数据和服务或执行工作流。 5. 斑头雁:2B 基于企业知识库构建专属 AI Agent 的平台,适用于多种场景,提供多种成熟模板。 6. 钉钉 AI 超级助理:依托钉钉优势,在处理高频工作场景表现出色。 此外,国内外还有多个平台可以在几分钟内完成 Agent 创建,比如国内版扣子 coze.cn、海外版 Coze coze.com、百度 AppBuilder、阿里通义千问、智谱 AI 等。使用扣子 coze.cn 等平台创建智能体 Agent 的过程被创作者形象地比喻为“捏 Bot”,最简单的 Bot 往往可以在 1 分钟内捏完。 随着 AI 的发展,大家对 AI 的诉求变得具体,简单的 ChatBot 弊端凸显,基于 LLWeng 对于 Agent 的结构设计,Coze、Dify 等平台在应用探索上有进展。年初吴恩达基于 Agent 应用、场景、需求等做了 4 个分类,但这些平台都有固有局限,对于专业 IT 人士不够自由,对普通用户在复杂业务场景有诸多限制。
2025-02-06
AI智能体是什么?有什么作用?主要运用场景有哪些?
AI 智能体是一种能够自主感知和行动的系统,类似于 AI 机器人小助手。 其作用在于能够弥补大模型的不足,例如无法回答私有领域问题、无法及时获取最新信息、无法准确回答专业问题等。 主要运用场景包括: 1. 私有领域知识问答:准备好相关知识库文件,创建私有领域知识问答应用,如公司制度、人员信息等方面。 2. 个性化聊天机器人:提供长期记忆功能,保存关键历史对话信息,集成夸克搜索和图像生成等插件,提供个性化聊天体验。 3. 智能助手:引入 RAG(检索增强生成)能力、长期记忆和自定义插件等功能,帮助提升工作效率,如处理邮件、撰写周报等。 在其他领域也有重要应用,如: 1. 自动驾驶:感知周围环境,做出驾驶决策。 2. 家居自动化:根据环境和用户行为自动调节智能家居设备。 3. 游戏 AI:游戏中的对手角色和智能行为系统。 4. 金融交易:根据市场数据做出交易决策。 5. 客服聊天机器人:通过自然语言处理与用户互动,提供自动化的客户支持。 6. 机器人:各类机器人中集成的智能控制系统。 设计和实现一个智能体通常涉及定义目标、设计感知系统、定义决策机制、设计行动系统以及学习与优化等步骤。智能体在现代计算机科学和人工智能领域是一个基础且重要的概念,其技术的不断发展和应用正在改变我们的生活方式和工作模式。
2025-02-07
房地产策划可以通过AI实现有哪些使用场景
以下是房地产策划中可以通过 AI 实现的一些使用场景: 1. 房地产装修设计:像酷家乐装修设计软件,利用图像生成和机器学习技术为用户提供装修设计方案,用户可根据喜好选择和调整。 2. 虚拟布置房产:例如 Interior AI 使代理商能够虚拟布置房产。 3. 潜在客户转化:Zuma 帮助物业经理将潜在客户转化为预定的参观。 此外,AI 在活动策划中的应用也能为房地产策划提供参考,比如: 1. 活动主题及内容生成:根据房地产活动目标、参与者背景等信息,生成合适的活动主题和内容框架建议。 2. 邀请函和宣传文案生成:基于活动信息生成吸引人的邀请函和宣传文案,增强宣传效果。 3. 现场活动管理:利用计算机视觉、语音识别等辅助管理活动现场的人流、秩序等。 4. 虚拟助手:AI 对话系统作为虚拟活动助手,为参与者提供信息查询、问题咨询等服务。 5. 活动反馈分析:自动分析活动反馈(文字、语音等),总结关键观点和改进建议。 6. 活动营销优化:基于参与者行为数据,优化营销策略,实现个性化营销。
2025-02-06
AI 翻译有什么应用场景?发展前景如何
AI 翻译的应用场景广泛,包括但不限于以下方面: 1. 企业在多语言市场中的运营,便于与不同国家和地区的客户、合作伙伴进行有效的沟通和业务拓展。 2. 个人获取全球信息,打破语言障碍,更便捷地了解世界各地的知识和资讯。 3. 教育领域,国内外院校的合作教育分享更加便捷,促进知识的共享和共同学习。 4. 旅行中,帮助游客更好地理解当地的语言和文化。 5. 娱乐方面,为观众提供多语言的影视作品和娱乐内容。 AI 翻译的发展前景十分广阔: 1. 语言翻译技术经历了从传统规则翻译到深度学习翻译的逐步发展,每一次革新都显著提高了翻译的准确性和自然度。 2. 神经机器翻译(NMT)通过大规模语料库学习,能够更好地理解上下文和语境,提供更加流畅、准确的翻译。 3. 大模型技术的引入使得翻译进入一个新的阶段,超大规模预训练模型通过海量数据学习,能够精准捕捉语言的深层语义和文化背景,提供更符合语境的翻译,显著提升了翻译的准确性与流畅度。 例如,Meta AI 发布的实时人工智能语言翻译模型 Seamless,统一了之前的三个 Seamless 系列模型,可以实时翻译 100 多种语言,延迟不到 2 秒钟,还能保持说话者的情感和语气、语调等,使得翻译后的语音更加自然和真实。 此外,还有一些具体的开发案例,如用 whisper 生成原视频的英文字幕,让 GPT 结合字幕全文翻译并进行行数拆分,形成新的双语字幕文件;ChatGPT 助力数据分析等。
2025-02-06
我需要你给我生成一些提示词,我会给你我想的想法。《》以内的是想法。《我想写一篇影视解说的文案,写作的视角以我,第一人称的视角来写。想要风格偏幽默风趣一点,就像跟朋友在讲述一样,可以模仿鲁迅先生的手法。而且还想把影片的剧情内容写出来,从开篇到电影的结尾,如果有需要保留原片的地方,请把原片的画面场景以及时间段描述出来。要求这篇文案要附上我自己的内心独白,以此引人深思!请你深度思考后,在做答复!要求字数不少于5000字。》请问我该如何写提示词?请你整理好提示词后发给我
以下是为您生成的一些提示词,希望对您有所帮助: 影视解说文案提示词 1. 以第一人称幽默风趣的口吻,像与朋友讲述般,描绘影片从开篇到结尾的精彩剧情,融入自己的内心独白,模仿鲁迅先生的手法,展现独特的视角和深刻的思考。 2. 用轻松幽默的语言,以我的视角详述影片情节,穿插搞笑的评论和内心想法,借鉴鲁迅先生的讽刺技巧,使解说引人入胜。 3. 以亲切自然的叙述方式,如同与好友聊天,讲述影片故事,从开头至结束,结合鲁迅先生的文风,加入个人的情感起伏和独特见解。 DALL·E 相关提示词 1. 绘画:提及颜料种类、画布纹理和笔触形状/纹理(列表)。 2. 数字:注明使用的软件、阴影技术和多媒体方法(列表)。 3. 基于详细提示使用 DALL·E 3 生成图像,让创意鲜活起来,为提示的每个元素做出大胆有趣的选择。 4. 遵循提示指南,提出四个全新的简单概念,而非完整提示,从上次给出的建议中获取灵感。 请注意,默认方面比率为正方形(1:1),默认风格为摄影,包括相机设置、摄影类型和设备。同时,避免违反服务条款的词汇或概念,不侵犯版权,不使用暗示性或露骨的图像,强调符合 G 级评级的元素。
2025-02-06
大模型在软件开发公司(主java+vue)的应用场景有哪些
大模型在以 Java 和 Vue 技术为主的软件开发公司中,具有以下一些应用场景: 1. 代码自动生成:大模型可以根据需求描述生成 Java 或 Vue 的代码片段,提高开发效率。 2. 代码优化建议:分析现有代码,提供优化的建议和策略,提升代码质量。 3. 智能错误检测与修复:快速识别代码中的错误,并提供可能的修复方案。 4. 需求分析与理解:帮助更好地理解和梳理复杂的业务需求,转化为技术实现的思路。 5. 自动化测试用例生成:根据代码和需求生成有效的测试用例,提高测试效率和覆盖度。 6. 技术选型辅助:在面临新的项目或技术难题时,提供相关技术选型的参考和建议。
2025-02-06
deepseek的背景、能力范围和应用场景
DeepSeek 具有以下背景、能力范围和应用场景: 背景: DeepSeek 以小成本实现了媲美领先 AI 产品的性能,并在全球主要市场 App Store 登顶。 其创始人梁文锋强调团队文化与长远智能探索,引发全球 AI 热潮。 能力范围: 多模态理解:支持文本/代码/数学公式混合输入。 动态上下文:对话式连续记忆(约 4K tokens 上下文窗口)。 任务适应性:可切换创意生成/逻辑推理/数据分析模式。 系统响应机制:采用意图识别+内容生成双通道处理,自动检测 prompt 中的任务类型、输出格式、知识范围,对位置权重(开头/结尾)、符号强调敏感。 基础指令框架:包括四要素模板、格式控制语法等。 进阶控制技巧:如思维链引导、知识库调用、多模态输出等。 中文场景表现优秀,数学能力不错,编程能力逊于 GPT。 采用 GRPO 算法替代传统 PPO,提升语言评价灵活性与训练速度。 应用场景: 日常写作和表达。 数学和编程相关任务。 可基于特定领域如 2023 版中国药典进行知识调用。 能够进行图像理解和生成,如开源的多模态模型 JanusPro 具备图像识别、地标识别等多种能力。
2025-02-05
有没有实际案例
以下是一些 AI 在视频生成方面的实际案例: 在 T2V01Director 模型使用教程中,有多种运镜示例,如镜头左摇并上摇,从一只小兔子抬头向左开始,慢慢移向天空;镜头从暗色调房屋屋顶开始,上升并左摇拍摄城市天际线等。 为 AI 视频生成设计的结构化提示词模板中,包括史诗灾难场景、赛博朋克未来都市、奇幻神话场景等。例如史诗灾难场景中,提示词为燃烧的陨石群穿透血红色云层,主体是残破的自由女神像半埋于熔岩中等。 在视频模型 MiniMax 海螺 AI 的实际运用案例中,如在一场戏的分镜头拆解梳理中,有男人无奈起身开门、开门、开门走出等情节的视频生成方式和结果。还有门外两个万圣节扮相的小女孩向男人要糖、男人嫌弃地拒绝女孩要糖请求等情节的视频生成处理。
2025-02-06
请给我推荐几个带有知识库引用的dify案例
以下是使用 Dify 构建知识库的具体步骤: 1. 准备数据:收集需要纳入知识库的文本数据,包括文档、表格等格式。对数据进行清洗、分段等预处理,确保数据质量。 2. 创建数据集:在 Dify 中创建一个新的数据集,并将准备好的文档上传至该数据集。为数据集编写良好的描述,描述清楚数据集包含的内容和特点。 3. 配置索引方式:Dify 提供了三种索引方式供选择:高质量模式、经济模式和 Q&A 分段模式。根据实际需求选择合适的索引方式,如需要更高准确度可选高质量模式。 4. 集成至应用:将创建好的数据集集成到 Dify 的对话型应用中,作为应用的上下文知识库使用。在应用设置中,可以配置数据集的使用方式,如是否允许跨数据集搜索等。 5. 持续优化:收集用户反馈,对知识库内容和索引方式进行持续优化和迭代。定期更新知识库,增加新的内容以保持知识库的时效性。 以下是一些带有知识库引用的 Dify 案例:
2025-01-30
AI营销案例
以下是一些 AI 营销案例: 1. 大淘宝设计部 2023 年度 AI 设计实践: 品牌超级符号映射:根据品牌符号的模型训练和结构控制,用户输入丰富关键词可快速完成准确的超级符号主视觉,如双 11 AI 创作赢红包、双 11 联合传播猫头海报&花车大巡游、超级品类日 品牌符号系列海报等案例。 品牌 IP 形象 AI 生成:训练特定的天猫/淘宝/营销 IP 公仔模型,根据不同需求稳定输出定制化 IP 形象,如天猫 AI 玩行动 品牌联合海报、天猫双 11 出游主题喵卡、淘宝天猫一起冲亚、天猫 U 先公仔三视图生成及应用等案例。 传播&投放:包括双 11 超级发布 品牌联合海报、媒介投放开屏海报等案例。 大促营销:通过 AI 生成图像或素材,结合平面合成及修正,如淘宝天猫大促视觉、双 11 大促 横向会场版头模板化应用、天猫小黑盒 新品联名等案例。 2. AI 在活动策划中的应用: 活动主题及内容生成:根据活动目标、参与者背景等信息生成合适的活动主题和内容框架建议,例如通过对话生成模型提出活动主题和议程草案。 邀请函和宣传文案生成:基于活动信息生成吸引人的邀请函和宣传文案,如微软在 Build 大会上使用 AI 生成 8000 多份个性化的邀请函。 现场活动管理:利用计算机视觉、语音识别等辅助管理活动现场的人流、秩序等,例如基于人群密度的通道引导、实时翻译等。 虚拟助手:AI 对话系统作为虚拟活动助手,为参与者提供信息查询、问题咨询等服务,例如 Replika 提供的智能虚拟活动助手应用。 活动反馈分析:自动分析活动反馈(文字、语音等),总结关键观点和改进建议,例如飞书和钉钉的会议总结功能。 活动营销优化:基于参与者行为数据优化营销策略,实现个性化营销,例如针对目标受众的定向广告投放等。 3. 其他案例: 营销:蓝色光标 X 京东|AIGC 代言人营销新模式,OPEN AD 时代来临:在代言人项目中探索出了行业崭新的 AIGC 精细化作业模式,革新传统代言人 TVC 制作流程。 营销:定制营销报告:涵盖汇报对象身份、销售数据、财务报告、市场分析、客户反馈、营销效果评估等方面。 办公:高效做 PPT:用 ChatGPT 生成 Markdown 语法内容,再借用 MindShow 工具转换为精美的 PPT。
2025-01-21
AI 营销最佳实践或案例
以下是一些 AI 营销的最佳实践或案例: 大淘宝设计部 2023 年度 AI 设计实践: 1. 品牌超级符号映射:根据品牌符号的模型训练和结构控制,用户输入丰富关键词可快速完成准确的超级符号主视觉。案例包括双 11 AI 创作赢红包、双 11 联合传播猫头海报&花车大巡游、超级品类日 品牌符号系列海报。 2. 品牌 IP 形象 AI 生成:训练特定的天猫/淘宝/营销 IP 公仔模型,根据不同需求稳定输出定制化 IP 形象,还可形成素材库。案例有天猫 AI 玩行动 品牌联合海报、天猫双 11 出游主题喵卡、淘宝天猫一起冲亚、天猫 U 先公仔三视图生成及应用。 3. 传播&投放:案例有双 11 超级发布 品牌联合海报、媒介投放开屏海报。 4. 大促营销:通过 AI 生成图像或素材,结合平面合成及修正,确保符合品牌形象,精准表达营销活动主题,快速生成多个设计变体并迭代优化。案例包括淘宝天猫大促视觉、双 11 大促 横向会场版头模板化应用、天猫小黑盒 新品联名。 AI 在活动策划中的应用案例: 1. 活动主题及内容生成:根据活动目标、参与者背景等信息,生成合适的活动主题和内容框架建议,例如通过对话生成模型提出活动主题和议程草案。 2. 邀请函和宣传文案生成:基于活动信息生成吸引人的邀请函和宣传文案,增强宣传效果。例如微软在 Build 大会上使用 AI 生成了 8000 多份个性化的邀请函。 3. 现场活动管理:利用计算机视觉、语音识别等辅助管理活动现场的人流、秩序等。例如基于人群密度的通道引导、实时翻译等。 4. 虚拟助手:AI 对话系统作为虚拟活动助手,为参与者提供信息查询、问题咨询等服务。例如 Replika 提供了智能的虚拟活动助手应用。 5. 活动反馈分析:自动分析活动反馈(文字、语音等),总结关键观点和改进建议。例如飞书和钉钉的会议总结功能。 6. 活动营销优化:基于参与者行为数据,优化营销策略,实现个性化营销。例如针对目标受众的定向广告投放等。 AIGC 商业视频落地经验分享: 1. AIPO 校园创投活动:10 月 20 号将在全国 20 多所高校举办线下 AIPO 模拟创业者和投资人的活动,校园大使确定举办校内线下活动的报名今晚 8 点半截止。 2. AI 商业片分享:邀请自媒体博主 EM7 和南柒老师讲解如何使用 AIGC 工具完成品牌方合作,包括实战项目、合作品牌、案例区分、制作流程等,并提及不同平台发作品的区别。 3. 品牌营销与营销的概念差异:品牌营销侧重于让用户记住品牌,加深大众记忆;营销则以销售和转化为目的,更着重于产品本身。 4. AI 在品牌广告中的应用案例:如伊利的黏土风格广告,通过特定元素复原运动员形象,属于品牌广告。 5. AI 在营销广告中的应用案例:某宝好物节的广告,旨在促进消费,属于营销广告。 6. AI 视频制作的突破与挑战:路特斯的广告在时间有限的情况下仍做出尝试和突破,早期 AI 技术下的视频存在一些痛点,后续不断改进。
2025-01-20
国内优秀Agent应用案例
以下是一些国内优秀的 Agent 应用案例: 1. Coze:新一代一站式 AI Bot 开发平台,适用于构建基于 AI 模型的各类问答 Bot,集成丰富插件工具拓展 Bot 能力边界。 2. 文心智能体:百度推出的基于文心大模型的智能体平台,支持开发者根据需求打造产品能力。 3. 斑头雁:2B 基于企业知识库构建专属 AI Agent 的平台,适用于客服、营销、销售等多种场景,提供多种成熟模板,功能强大且开箱即用。 4. 钉钉 AI 超级助理:依托钉钉强大的场景和数据优势,在处理高频工作场景如销售、客服、行程安排等方面表现出色,提供更深入的环境感知和记忆功能。
2025-01-19
国内优秀智能体案例
以下是一些国内优秀智能体案例: 在车辆使用指南维度,多个大模型表现优异,达到 80 分以上,在操作指南、车辆故障诊断、维修保养等任务上具备较高交互成熟度。 在汽车场景中,部分 13 14B 中小模型超过云端闭源模型,展现出端侧模型满足用户需求的良好能力和巨大潜力。 在社交方向,有用户注册后先创建自己的智能体,让其与他人的智能体聊天,然后真人介入的有趣场景。 字节推出的“扣子”是用于开发下一代 AI 聊天机器人的构建平台。 国内存在如 Dify.AI 等智能体开发平台。
2025-01-19
李飞飞最近出的agent综述文章哪里可以看到
以下是李飞飞相关文章的获取渠道: 《》 《》
2025-01-17
最近有什么新的AI工具吗
以下是一些新的 AI 工具: 游戏方面: Unity 推出了两款 AI 工具,分别是提供新 Copliot 工具的 Unity AI 和允许在 Unity 运行时为游戏或应用程序嵌入 AI 模型的 Unity Sentis。Unity AI 可通过与 Muse Chat 聊天快速启动创建游戏项目、协助编码、创建 3D 材质和动画等内容。Unity Sentis 是第一个将 AI 模型嵌入到实时 3D 引擎中的跨平台解决方案。您可通过 https://create.unity.com/aibeta 申请加入 Muse Chat 的 Waiting list。 PPT 方面: Gamma:在线 PPT 制作网站,通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式。网址:https://gamma.app/ 美图 AI PPT:由美图秀秀开发团队推出,通过输入简单文本描述生成专业 PPT 设计,包含丰富模板库和设计元素。网址:https://www.xdesign.com/ppt/ Mindshow:AI 驱动的 PPT 辅助工具,提供智能设计功能,如自动布局、图像选择和文本优化等。网址:https://www.mindshow.fun/ 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理技术优势,提供智能文本生成、语音输入、文档格式化等功能。网址:https://zhiwen.xfyun.cn/ 商业方面: 服务小型企业的工具,如 Sameday 可接电话并预约,Truelark 可处理短信、电子邮件和聊天,Osome 可管理后台办公室,Durable 可创建完整的专业网站。 通用内容创建工具,如 Jasper、Copy 和 Writer 在小型和中型企业中已有显著用户基础。 特定类型企业的垂直化工具,如 Harvey 和 Spellbook 帮助法律团队自动化任务,Interior AI 帮助房地产代理商虚拟布置房产,Zuma 帮助物业经理将潜在客户转化为预定参观。
2025-01-09
最近国内外 有什么新出的AI产品
以下是国内外新出的一些 AI 产品: 图像类产品: 国内: 可灵:由快手团队开发,用于生成高质量的图像和视频,图像质量高,最初采用内测邀请制,现向所有用户开放,价格相对较高,重度用户年费可达几千元,平均每月使用成本在 400 到 600 元,也有临时或轻度使用的免费点数和较便宜包月选项。 通义万相:在中文理解和处理方面表现出色,可选择多种艺术和图像风格,生成图像质量高、细节丰富,操作界面简洁直观、用户友好度高,能与阿里其他产品和服务无缝整合,重点是现在免费,每天签到获取灵感值即可,但存在某些类型图像无法生成、处理非中文语言或国际化内容不够出色、处理多元文化内容可能存在偏差等局限性。 搜索类产品: 国内:大模型厂商推出的 ChatBot 产品(智谱清言、Kimi Chat、百小应、海螺 AI 等),搜索厂商或创业团队推出的 AI 搜索产品(360 AI 搜索、秘塔、博查 AI、Miku 等)。 海外:Perplexity、You、Phind 等。 中国公司和团队的出海产品:ThinkAny、GenSpark、Devv 等。 PPT 类产品: 国内:爱设计 PPT,背后有实力强大的团队,对市场需求有敏锐洞察力,把握住了 AI 与 PPT 结合的市场机遇,已确立市场领先地位,代表了当前国内 AI 辅助 PPT 制作的最高水平,能提高制作效率并保证高质量输出。
2025-01-06
最近有什么 AI 资讯,给我总结出来
以下是为您总结的近期 AI 资讯: 简报: TLDR AI: The Sequence: Deep Learning Weekly: Ben’s Bites: Last week in ai: Your guide to AI: 播客: No Priors podcast hosted by Sarah Guo and Elad Gil Robot Brains Podcast hosted by Pieter Abbeel Lex Fridman Podcast hosted by Lex Fridman The Gradient podcast hosted by Daniel Bashir Generally Intelligent hosted by Kanjun Qiu Last Week in AI 会议: 工业界:World AI Cannes Festival 其他资讯: Netflix 列出了一个年薪 90 万美元的机器学习平台产品经理的 AI 产品工作岗位: Shopify 的 AI 助手现已上线。Sidekick 是一个帮助机器人,它知道如何在 Shopify 中执行任何操作提取相关数据、操作新功能或创建报告: Artifact(Ins 创始人做的 AI 新闻浏览软件)推出了自定义内容阅读语音的功能: OpenAI、谷歌、微软和 Anthropic 组建了前沿模型论坛,主要目的是确保 AI 模型的安全发展: Open AI 悄咪咪下线了他们的 ChatGPT 生成内容的检测器: 12 月 26 日资讯: Meta:AI 建模技术 PartGen,一种从各种模态(包括文本、图像、3D 模型)进行组合/零件级 3D 生成和重建的新方法。地址: Threejs ai:生成极简 3D 场景工具,由网友@vidythatte 开发的根据文字/图片提示生成极简 3D 场景工具,输入提示文字即可迭代构建这样的场景,可以用它制作简单的故事交互应用。地址:
2025-01-03
最近有什么新的AI工具
以下是一些新的 AI 工具: 游戏方面: Unity 推出了两款 AI 工具,包括提供新 Copliot 工具,可通过与 Muse Chat 聊天快速启动创建游戏项目,如一键生成塔防类游戏基础框架、创建人物角色动作,还能协助编码和创建 3D 材质、动画等内容。Muse Chat 现已经开放 Waiting list,可通过 https://create.unity.com/aibeta 申请加入,官方提示这个暑假会进一步开放。 Unity Sentis 是第一个将 AI 模型嵌入到实时 3D 引擎中的跨平台解决方案,能在终端用户平台上增强游戏玩法和其他功能,目前还在封测阶段。 思维导图方面: GitMind:免费跨平台,支持多种模式,可通过 AI 自动生成思维导图。 ProcessOn:国内思维导图+AIGC 工具,能利用 AI 生成思维导图。 AmyMind:轻量级在线工具,无需注册登录,支持自动生成节点。 Xmind Copilot:基于 GPT 的 AI 思维导图助手,可一键拓展思路、生成文章大纲。 TreeMind:输入需求由 AI 自动完成思维导图生成。 EdrawMind:提供包括 AI 驱动的头脑风暴功能等一系列 AI 工具。 建筑设计审核规划平面图方面: HDAidMaster:云端工具,在建筑、室内和景观设计领域表现出色,搭载自主训练的建筑大模型 ArchiMaster。 Maket.ai:面向住宅行业,能根据输入自动生成户型图。 ARCHITEChTURES:AI 驱动的三维建筑设计软件,可引入标准和规范约束设计结果。 Fast AI 人工智能审图平台:形成全自动智能审图流程,能实现数据汇总与管理。 需要注意的是,以上内容由 AI 大模型生成,请仔细甄别。每个工具都有其特定的应用场景和功能,建议根据具体需求选择合适的工具。
2024-12-25
最近一周AI在B端有什么新闻吗
以下是最近一周 AI 在 B 端的部分新闻: 一位投资人分享了其用于深化人工智能/机器学习知识的工具和资源,包括简报(如 TLDR AI、The Sequence 等)、播客(如 No Priors podcast 等)、会议(如工业界 World AI Cannes Festival)。 AIGC Weekly32 提到:Netflix 列出年薪 90 万美元的机器学习平台产品经理岗位;Shopify 的 AI 助手 Sidekick 上线;Artifact 推出自定义内容阅读语音功能;OpenAI、谷歌、微软和 Anthropic 组建前沿模型论坛;OpenAI 下线 ChatGPT 生成内容的检测器。 XiaoHu.AI 日报中:Hebbia 获得近 1 亿美元 B 轮融资,其 AI 技术能一次处理多达数百万份文档,主要面向金融服务公司等专业领域;Character AI 推出与 AI 角色通电话的新功能,支持多种语言且可在通话和短信间无缝切换;微软文本转语音虚拟数字人上线,支持 GPT4o 的集成。
2024-12-24