Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

有没有针对AI工具嵌入个人工作流方方面面赋能工作的信息

Answer

AI 工作流是将 AI 工具引入到工作流程的各个环节中,以提高工作效率。

在说 AI 工作流之前,要先了解工作流的概念。工作流即工作流程,比如写公众号文章,可拆分为选题、列大纲写初稿、改稿、写标题、排版、发布等步骤,每个步骤都有明确的输入和产出,环环相扣。

搭建 AI 工作流有一套工作流:

  1. 找到一个熟悉的工作场景,如写文章、做 PPT 等。
  2. 拆解工作流程,例如写文章可拆分为选题、写稿、改稿、写标题等步骤。
  3. 针对每个步骤嵌入工具,可参考他人经验,灵活选择最优解,目的是提高工作效率,而非增加工作的含 AI 量。

搭建 AI 工作流需要三层能力:

  1. 了解各种 AI 工具,知晓其特点和用途。
  2. 学会写提示词,以便向 AI 清晰表述任务。
  3. 搭建 AI 智能体,使多个 AI 工具协同工作,自动完成任务。
Content generated by AI large model, please carefully verify (powered by aily)

References

夙愿:AI 工作流,赋能我的十倍增长

在说AI工作流之前,我们得先知道什么是工作流。工作流,顾名思义就是工作流程,把一项工作拆分成多个步骤。我就拿写公众号文章来举例,大家想想,平常你写文章都要经过哪些步骤?首先呢,得想好写啥,对吧?这就是选题。选好题之后,就可以根据选题去列大纲写个大概的内容了,这就是初稿。初稿肯定得修改打磨一下,这是改稿。改好了之后,根据我们的稿子来写一个吸引人的标题,让读者想点进来看。这样我们就有了文章内容和标题,那就可以复制到公众号平台上面去排版了,排版让读者阅读的时候看起来舒服点。最后,完成以上步骤就可以发布文章了。你看,更新一篇公众号文章,就可以拆成以上这几个固定的步骤来完成。把一项大的工作拆解多个小的步骤去完成,每个步骤都有明确的输入、产出,环环相扣,这就是工作流。而AI工作流,就是将AI工具引入到上面工作流中的各个环节里面,回到刚刚的例子。在写作的各个环节,都可以用对应的AI工具来提效。通过这个AI工作流的加持,每个步骤里你都选择了一个,最适合当前步骤的AI工具来提效,文章从选题到发布的全流程都得到了非常高的效率提升。通过局部最优解,来达到全局最优解。现在,很多人企图用一个的AI工具来解决所有问题。但其实每个工作环节都有自己的特点,一个工具难以应对所有情况。想想看,你会让一个篮球高手去游泳比赛吗?肯定不行啊。

夙愿:AI 工作流,赋能我的十倍增长

搭建AI工作流其实也有一套简单易行的工作流,我们可以从最基础的开始,一步步来。[heading3]3.2.1找到一个工作场景[content]选择一个你比较熟悉的工作场景,比如说,写文章、做PPT,随便哪个你经常做的工作都行。[heading3]3.2.2拆解工作流程[content]因为是你熟悉的工作场景,所以你肯定能把这个工作拆解成几个小步骤,如果暂时想不清楚,可以先把整个流程在脑海中或纸上过一遍。就比如刚刚说的写文章,可以拆成选题、写稿、改稿、写标题这几步。[heading3]3.2.3给每一个步骤嵌入工具[content]针对每个小步骤,想想有没有AI工具可以帮上忙,如果你想不到的话,别自己闷头去想,去找一下别人是怎么做的?我们遇到的大多数问题,别人都遇到过并很好地解决了,所以你只需要找到别人是怎么解决这个问题的就可以了。注意,要灵活选择最优解,不要为了AI而AI。通过局部最优解,来达到全局最优解。我们的目的是提高工作效率,而不是提高工作的含AI量。

夙愿:AI 工作流,赋能我的十倍增长

感谢你耐心阅读这篇略显冗长的文章。让我们简单回顾一下,首先,我们讨论了什么是AI工作流。简单来说,就是把AI工具融入到工作里的各个环节中,为我们的工作来提效。然后,我们聊到了搭建AI工作流需要的三层能力:第一层,了解各种AI工具,知道每个AI工具的特点和用途。第二层,学会写提示词,这是很关键,决定你能不能把任务给AI说清楚。第三层,搭建AI智能体,让替代人工,使用多个AI工具协同工作,自动完成任务。接下来,我让AI帮我梳理出了这套搭建AI工作流和公众号工作流的SOP:

Others are asking
推理类模型,以deepseek为代表,与此前的聊天型ai,比如chatgpt3.5,有什么差异
推理类模型如 DeepSeek 与聊天型 AI 如 ChatGPT3.5 存在以下差异: 1. 内部机制:对于大语言模型,输入的话会被表示为高维时间序列,模型根据输入求解并表示为回答。在大模型内部,是根据“最大化效用”或“最小化损失”计算,其回答具有逻辑性,像有自己的思考。 2. 多模态能力:ChatGPT3.5 是纯语言模型,新一代 GPT 将是多模态模型,能把感官数据与思维时间序列一起作为状态,并装载在人形机器人中,不仅能对话,还能根据看到、听到的事进行判断,甚至想象画面。 3. 超越人类的可能性:有人假设人按最大化“快乐函数”行动,只要“效用函数”足够复杂,AI 可完全定义人,甚至超越人类。如在“短期快乐”与“长期快乐”的取舍上,人类难以找到最优点,而 AI 可通过硬件算力和强化学习算法实现,像 AlphaGo 击败世界冠军,在复杂任务上超越人类。 4. 应用领域:文字类的总结、润色、创意是大语言模型 AI 的舒适区,如从 ChatGPT3.5 问世到 ChatGPT4 提升,再到 Claude 3.5 sonnet 在文学创作领域取得成绩,只要有足够信息输入和合理提示词引导,文案编写可水到渠成。
2025-03-18
ai作图网站复杂吗?
AI 作图网站的使用复杂程度因人而异。一些网站可能具有较为简单直观的界面和操作流程,而另一些可能相对复杂。 例如,ILLUMINARTY 网站通过对大量图片数据的抓取和分析来鉴别图片是否为 AI 生成,但在测试中可能存在误判。 同时,还有一些专门用于绘制示意图的网站,如 Creately、Whimsical 和 Miro 等。Creately 是在线绘图和协作平台,适合绘制多种图表,具有智能绘图、丰富模板库和实时协作等功能。Whimsical 专注于用户体验和快速绘图,界面直观易上手。Miro 是在线白板平台,结合 AI 功能适用于团队协作和各种示意图绘制,具有无缝协作、丰富模板和工具以及与其他项目管理工具集成等功能。使用这些网站绘制示意图的一般步骤包括选择工具、创建账户、选择模板、添加内容、协作和分享等。 对于 Tusiart 这类工具,文生图的操作流程包括确定主题、选择基础模型 Checkpoint(如麦橘、墨幽的系列模型)、选择 lora、设置 VAE(如 840000)、编写 Prompt 提示词和负向提示词 Negative Prompt(均用英文)、选择采样算法(如 DPM++2M Karras)、确定采样次数(如 30 40 次)以及设置尺寸等。
2025-03-18
ai agent和workfolw的差异
AI Agent 和 Workflow 的主要差异如下: 任务编排方式:AutoGPT 的任务由大模型自动编排,而 Workflow 中的子任务是人为编排的。 带来的优化: 流程中可加入人类 Knowhow,弥补模型知识的不足。 专家测试试跑,减少生产环境中的无效反思,提升 Agent 的表现。 引入图的概念,灵活组织节点,连接各类工具,包括套工具、套其他 Agent、写代码用硬逻辑处理、接大模型进行判断等,极大地提高了灵活性和可控性,提升了 Agent 能力的上限。 解决的问题:Agentic Workflow 可以从提升效率、提高质量、节省时间的角度思考,通过将复杂任务分解为小步骤,融入更多人类参与的规划与定义,减少对 Prompt Engineering 和模型推理能力的依赖,提高 LLM 应用面向复杂任务的性能。 涉及的概念: 记忆:分为短期记忆和长期记忆,短期记忆将上下文学习视为利用模型的短期记忆学习,长期记忆提供长期存储和召回信息的能力。 工具:学会调用外部不同类型 API 获取模型缺少的额外信息、代码执行能力、访问专有信息源等。 动作:大模型根据问句、上下文规划、各类工具决策出最终执行的动作。 人机协同关系:生成式 AI 的人机协同分为 Embedding(嵌入式)、Copilot(副驾驶)、Agent(智能代理)3 种模式,不同模式下人与 AI 的协作流程有所差异。 Embedding 模式:人类完成大多数工作。 Copilot 模式:人类和 AI 协同工作。 Agents 模式:AI 完成大多数工作。 工作流变革:使用 Multiagent Collaboration 的方法,让不同角色的 Agent 按照任务要求自主规划选择工具、流程进行协作完成任务。 信息处理逻辑:抽象化拆解大模型的底层能力,如翻译、识别、提取、格式化等,围绕“输入”“处理”“输出”“反馈”构建最底层的信息处理逻辑。 对获取信息方式的重塑:搜索引擎和基于大模型的聊天机器人在解决问题方面目标一致,ChatGPT 的发布被认为将对传统搜索引擎带来颠覆。
2025-03-18
一句话阐述ai agent的原理。
AI Agent 的原理主要包括以下几个方面: 1. 其核心通常是大型语言模型(LLM)或大模型。 2. 为 LLM 增加了工具、记忆、行动、规划这四个能力。 工具:如长期记忆,相当于给大模型一个数据库工具来记录重要信息。 记忆:提供长期记忆能力。 行动:将目标进行每一步的拆解,并输出不同的固定格式 action 指令给工具。 规划:在大模型的 prompt 层做逻辑处理,如目标拆解。 3. 目前行业里主要用到的是 langchain 框架,它通过代码或 prompt 的形式将 LLM 与 LLM 之间以及 LLM 与工具之间进行串接。 4. 心灵社会理论认为,智能是由许多简单的 Agent(分等级、分功能的计算单元)共同工作和相互作用的结果。这些 Agent 在不同层次上执行不同的功能,通过协作实现复杂的智能行为。 多重层次:从低层次的感知和反应到高层次的规划和决策,每个层次由多个 Agent 负责。 功能模块:每个 Agent 类似于功能模块,专门处理特定类型的信息或执行特定任务。 分布式智能:智能通过多个相互关联的 Agent 共同实现,提高系统的灵活性和鲁棒性。 5. AI Agent 包括 Chain(步骤,可接受输入变量并产生输出变量)、Router(通过判定让 Agent 走向不同的 Chain)、Tool(工具调用)等概念。同时,还需要 Responser Agent(主 agent,用于回复用户)、Background Agent(背景 agent,用于推进角色当前状态)、Daily Agent(每日 agent,用于生成剧本等)等不同类型的 Agent 协同工作。
2025-03-18
ai的定义
AI 是某种模仿人类思维,可以理解自然语言并输出自然语言的东西。它可以被视为一个黑箱,其生态位是一种似人而非人的存在。 AGI 通常被定义为一种能够完成任何聪明人类所能完成的智力任务的人工智能。 从技术角度来看,GenAI 是一种基于深度学习技术,利用机器学习算法从已有数据中学习并生成新的数据或内容的 AI 应用。AIGC 则指利用 GenAI 创建的内容,包括图像、视频、音频、文本和三维模型等。目前国内主要在相关法律法规框架下对 AIGC 行业进行监管。
2025-03-18
微信SVG图文 什么AI可以帮我实现
Jianhua.Art 是一个能够通过自然语言设计图文和动画的浏览器插件。它目前是阉割版本,几乎离线(除大模型调用),无数据库和用户体系,数据存本地。只要有 OpenAI 格式的大模型 key 就能免费使用,能为网页设计生成分享海报。默认模板内置粗糙的网页总结,可生成 SVG 图片,还能对生成内容进行多种操作,如修改 SVG 代码、复制为 PNG 图片或下载 SVG 图片,插入微信、微信公众号、Figma 等地方,插入 Figma 时是分层的方便编辑。作者会考虑增加 SVG 插入微信公众号等更多地方的功能,还建了反馈群,短期内免费使用,只要有 Token 就能白嫖。若想用网页内容提取功能,创建应用时打开提取开关,支持提取的变量都已列出,复制粘贴到提示词里即可。
2025-03-18
用deepseek赋能家庭教育
以下是关于使用 DeepSeek 赋能家庭教育的相关信息: 清华大学发布的《》,首先介绍了选择 AI 学习工具的方法及 DeepSeek 的多种使用入口、模式对比。接着阐述了在家庭教育中的基础聊法原则、互动策略和多种场景化聊法模版。然后通过多学科案例展示其辅助学习的方式,还涉及亲子沟通、情绪管理、职业规划等内容。最后介绍了 DeepSeek 在不同教育场景下与其他工具组合的应用范式,为家庭教育提供了全面的 AI 使用指南。 此外,还有其他相关报告,如《》
2025-03-18
一个小白,如何通过咱们这个网站来学习和应用AI,赋能工作,请给出详细的方案,
对于一个小白,通过本网站学习和应用 AI 赋能工作,可以参考以下详细方案: 一、了解 AI 基本概念 首先,建议阅读「」部分,熟悉 AI 的术语和基础概念。了解什么是人工智能,它的主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。浏览入门文章,这些文章通常会介绍 AI 的历史、当前的应用和未来的发展趋势。 二、开始 AI 学习之旅 在「」中,您将找到一系列为初学者设计的课程。这些课程将引导您了解生成式 AI 等基础知识,特别推荐李宏毅老师的课程。通过在线教育平台(如 Coursera、edX、Udacity)上的课程,您可以按照自己的节奏学习,并有机会获得证书。 三、选择感兴趣的模块深入学习 AI 领域广泛(比如图像、音乐、视频等),您可以根据自己的兴趣选择特定的模块进行深入学习。建议您一定要掌握提示词的技巧,它上手容易且很有用。 四、实践和尝试 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 五、体验 AI 产品 与现有的 AI 产品进行互动是学习 AI 的另一种有效方式。尝试使用如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。通过与这些 AI 产品的对话,您可以获得对 AI 在实际应用中表现的第一手体验,并激发您对 AI 潜力的认识。 六、在网站中引入 AI 助手 1. 创建大模型问答应用:先通过百炼创建一个大模型应用,并获取调用大模型应用 API 的相关凭证。 2. 搭建示例网站:通过函数计算,来快速搭建一个网站,模拟您的企业官网或者其他站点。 3. 引入 AI 助手:接着通过修改几行代码,实现在网站中引入一个 AI 助手。 4. 增加私有知识:最后可以通过准备一些私有知识,让 AI 助手能回答原本无法准确回答的问题,帮助您更好的应对客户咨询。 七、推荐布鲁姆分类法学习路径 应用:深入 分析:大量阅读,理解各知识之间的关系。
2025-03-16
请问是否有AI赋能企业的相关内容推荐
以下是关于 AI 赋能企业的相关内容: 企业可以涉及具身智能、3D 眼镜、AI 绘本、AI 图书、学习机、飞书的多维表格、蚂蚁的智能体、Coze 的智能体、Zeabur 等云平台、0 编码平台、大模型(如通义、智谱、kimi、deepseek 等)、编程辅助、文生图(如可灵、即梦等)、推荐咖啡奶茶等 AI 调配(需相应资质)。 企业权益包括学校大屏幕广告(时长可为 1 周或 1 个月的 PA 屏)、开幕式露出、摊位本身的宣传、其他露出(如直播等)、工作坊场(可能是 500 人中的部分人报名,深度参与其中,尽量不是卖东西,应用实操,如 AI 辅助编程,每个人做一个专属自己的一站式工作台、工具箱,针对典型的教学教研过程做尝试)、圆桌会论坛之类、真实案例收集反馈等,让大模型厂家的诉求、半透明的 chatbot 会话,有二维码引流等。 法律法规方面,《促进创新的人工智能监管方法》提到要使创新者更容易适应监管环境,如建立多监管机构的 AI 沙盒等,并要开展教育和提高意识的活动,包括为企业提供指导、提高消费者和公众的意识等。 张翼然的相关研究中提到了 AI 赋能教学的一些内容,但未直接涉及 AI 赋能企业。
2025-03-15
我是一名中职思政教师,我想开一个主题为AI赋能梦想的班会,班会内容要创新并且与计算机专业高一学生、技能强国相结合。想帮我想一个班会框架,内容具有在教室的可操作性,低成本的
以下是为您设计的一个以“AI 赋能梦想”为主题,适合中职计算机专业高一学生,在教室可操作且低成本的班会框架: 一、引入主题 1. 播放一段关于 AI 改变世界的短视频,引发学生兴趣。 2. 老师简单介绍本次班会的主题“AI 赋能梦想”以及与技能强国的联系。 二、知识讲解 1. 用 PPT 展示 AI 的基本概念和应用领域,如医疗、交通、教育等。 2. 结合计算机专业,讲解 AI 在该领域的发展前景和就业机会。 三、小组讨论 1. 分组讨论 AI 对未来职业的影响,以及如何通过学习计算机技能在 AI 时代立足。 2. 每组选派代表发言,分享讨论结果。 四、案例展示 1. 展示一些中职学生在 AI 相关领域取得成功的案例。 2. 分析他们成功的原因和所具备的技能。 五、创意设想 1. 让学生们设想自己如何利用 AI 技术实现个人梦想,写在纸条上。 2. 随机抽取学生分享他们的设想。 六、总结与展望 1. 老师总结本次班会的重点内容。 2. 鼓励学生努力学习,为技能强国贡献自己的力量,实现 AI 赋能的梦想。 希望这个班会框架能满足您的需求,祝您班会举办成功!
2025-03-13
AI赋能办公,包含AI+对话、AI+写作与PPT、图片与视频生成和数据分析,还有面向HR、行政、财务、营销等岗位的AI赋能课
以下是关于 AI 赋能办公的相关内容: GPT 使用场景: 1. 内容生成:可以生成文章、故事、诗歌、歌词等内容。 演示:https://chat.openai.com/ 、https://bard.google.com/extensions 、https://claude.ai/ 2. 聊天机器人:作为聊天机器人后端,提供自然对话体验。 演示: 3. 问答系统:为用户提供准确答案。 4. 文本摘要:生成文本的摘要或概述。 5. 机器翻译:虽非专门设计,但有不错表现。 6. 群聊总结: 7. 代码生成:GPT3 及后续版本可生成代码片段,帮助解决编程问题。 8. 教育:用于教育领域,帮助学生解答问题或提供学习材料。 9. 浏览器插件:webpilot 10. PDF 对话:演示 www.chatpdf.com PPT 相关: 1. 2. AiPPT.cn:爱设计&AiPPT.cn 是一家 AIGC 数字科技企业,致力于打造“下一代个人与组织的 Ai 工作站”。旗下产品包括 AiPPT 等超过 10 余款应用 AI 能力的内容创作工具。23 年在 Ai+办公领域推出 AiPPT.cn/AiPPT.com,帮助用户“一分钟一键生成 PPT”,是国内 AiPPT 赛道创业公司第 1 的产品,全球第 4,国内所有 AIGC 产品 PC 端 Top10。目标市场主要是市场、运营、销售、人力、财务、行政、技术、产品、总助、公务员、学生、老师等基层及中高层管理岗位人员。 3. 在众多的 PPT 工具中,AI 带来便捷高效体验。深入了解了五大 AI PPT 工具:MindShow、爱设计、闪击、Process ON、WPS AI,它们各自有鲜明特色和擅长场景。选择合适工具要根据实际需求调整,试用和体验比盲目跟风更明智。 其他: 1. 音视频提取总结:https://bibigpt.co/r/AJ 2. 播客总结:https://podwise.xyz/dashboard/trending 3. 生成脑图:https://xmind.ai/editor/
2025-03-12
我想入ai赋能科研,该如何进行?有什么软件可以利用?
如果您想将 AI 赋能科研,可以从以下几个方面入手: 1. 探索科研新境界:借助 AI 助力创新,突破传统研究框架,赋予科研无限可能。 2. 揭开 AI 神秘面纱:掌握前沿技术,提升科研效率,让研究变得更智能、更高效。 3. AI 赋能科研:从理论到实践,深入了解人工智能的无限潜力,提升科研成果。 4. 创新与效率的碰撞:探索 AI 在科研中的应用,为您打开技术与智慧的新世界。 5. 未来科研的引擎:进行 AI 技术实操,助力您迈向前沿研究的新时代。 在软件方面,以下是一些可供利用的选择: 1. 对于个人用户,小模型(1.5B/7B/8B)在个人电脑上就能运行,能听懂人话,做简单问答,也适合做翻译、总结、改写,比如学校的自动答疑机、车载语音助手。 2. 中模型(14B/32B)需要专业服务器才能运行,相当于小学霸级 AI,能写代码、解数学题、写应用文,处理复杂说明书,比如帮程序员写代码、解答物理竞赛题。 3. 超大模型(70B/671B)需要科研实验室的超级电脑,能写精彩故事、论文报告,处理海量数据,做高端研究,比如分析全球气候数据、破解基因密码。 可用的途径包括: 1. https://bot.n.cn/ 2. 腾讯元宝(手机 APP) 3. http://metaso.cn(长思考) 4. API 接入法(详见相关图示)
2025-03-11
文本嵌入模型怎么用
文本嵌入模型主要用于衡量文本字符串的相关性,常见应用场景包括搜索(结果按与查询字符串的相关性排序)、聚类(文本字符串按相似性分组)、推荐(推荐具有相关文本字符串的项目)、异常检测(识别出相关性很小的异常值)、多样性测量(分析相似性分布)、分类(文本字符串按其最相似的标签分类)。 嵌入是浮点数的向量(列表),两个向量之间的距离衡量它们的相关性,小距离表示高相关性,大距离表示低相关性。 OpenAI 提供了一个第二代嵌入模型(在模型 ID 中用 002 表示)和 16 个第一代模型(在模型 ID 中用 001 表示)。对于几乎所有用例,建议使用 textembeddingada002,它更好、更便宜、更易于使用。 要获得嵌入,需将文本字符串连同选择的嵌入模型 ID(例如,textembeddingada002)一起发送到嵌入 API 端点,响应将包含一个嵌入,您可以提取、保存和使用它。在中可查看更多 Python 代码示例。 此外,Stable Diffusion 使用 CLIP 来处理文本提示,用户输入的文本描述通过 CLIP 模型编码为一个文本嵌入,这个嵌入表示了文本的语义信息,确保模型理解用户想要生成的图像内容。CLIP 在引导图像生成、优化生成结果等方面也发挥着重要作用。
2025-03-14
嵌入式WEB翻译插件
以下是关于嵌入式 WEB 翻译插件的相关信息: SD 提示词自动翻译插件 promptallinone: 作者:白马少年 发布时间:20230529 20:00 原文网址:https://mp.weixin.qq.com/s/qIshiSRZiTiKGqDFGjD0g 在 Stable Diffusion 中输入提示词只能识别英文,秋叶整合包包含提示词联想插件。 常用翻译软件如 DeepL(网址:https://www.deepl.com/translator,可下载客户端)、网易有道翻译(可 ctrl+alt+d 快速截图翻译),但复制粘贴来回切换麻烦。 自动翻译插件 promptallinone 安装方式:在扩展面板中搜索 promptallinone 直接安装,或把下载好的插件放在“……\\sdwebuiakiv4\\extensions”路径文件夹下,安装完成后重启 webUI。 插件特点: 一排小图标,第一个可设置插件语言为简体中文。 第二个图标是设置,点开后点击第一个云朵图标可设置翻译接口,点击第一行下拉菜单可选择翻译软件。 AIGC 落地应用 Open AI Translator(强烈推荐): 推荐指数:🌟🌟🌟🌟🌟 是接入了 GPT 能力的文本翻译、总结、分析类产品,翻译功能适合浏览网页时查询个别单词、句子。 最大优势是可在脱离只提供产品内 AI 能力的场景使用,如任何 web 场景,配合 Arc Browser 而非 Chrome 使用效果更佳。 调用方式:选中页面中的文本后会悬浮该插件,点击即可翻译,速度极快,摆脱“复制打开翻译软件粘贴翻译”的流程。 可用于文本分析、分析代码,搭配 Chat GPT 使用效果好。 开发者模式下也可辅助使用。 注:安装后需获取 Open AI 的 API Key,首次打开插件设置好 Open AI Key 地址,找地方保存好 API Key 方便使用。 下载地址:
2025-02-15
可以嵌入AI玩具的硬件
以下是关于可以嵌入 AI 玩具的硬件的相关信息: 一个名为“跃然创新”的 20 人小微创业团队,将大模型装进毛绒玩具里,赋予毛绒玩具生命。其 CEO 李勇和 COO 高峰是资深的互联网+硬件从业者。 做儿童场景产品是李勇和高峰长久以来的梦想,源于对天猫精灵多数语音交互来自孩子这组数据的洞察。之前智能音箱的 AI 交互体验不够好,直到 ChatGPT 出现,他们确定将大模型和毛绒玩具结合,做一家陪伴孩子成长的 AI 毛绒玩具公司。 “情绪价值”是李勇理解儿童陪伴场景的关键词,认为 AI 毛绒玩具更具情感陪伴属性,相较于音箱、故事机、机器人、平板等,毛绒玩具更能带给孩子安全感。 明确了 AI+毛绒玩具的产品方向后,团队基于大模型做训练、引进 IP 版权、接洽供应链全速推进。未来除了联名 IP 外,也会有自己的原创 IP。 基于数百名孩子的调研结果,不同孩子使用 AI 毛绒玩具有区别,但基本都喜欢。李勇强调跟它聊得越多,它就越懂孩子、越能发现孩子的潜能。 由于毛绒玩具购买者与使用者分离,团队做了很多让家长有安全感的工作,比如家长可通过 App 查看聊天记录,危险话题会推送预警信息,还能从聊天记录了解孩子真实喜好,AI 毛绒玩具成为家长和孩子沟通的桥梁。 团队透露近期首款 AI 毛绒玩具产品会面世。
2025-01-14
Embedding 嵌入向量生成模型
Embedding(嵌入)是一个浮点数的向量(列表),两个向量之间的距离度量它们的相关性,小距离表示高相关性,大距离表示低相关性。 Embedding 是一种在机器学习和深度学习中广泛应用的技术,特别是在自然语言处理(NLP)和其他涉及高维离散数据的领域。它指将原本高维且通常离散的输入数据(如单词、短语、用户 ID、商品 ID 等)映射到一个低维连续向量空间中的过程,这些低维向量称为嵌入向量。 例如,“国王”和“王后”在嵌入向量的空间里位置挨得很近,而“苹果”与前两者差别较大,其嵌入向量位置较远。Embedding 不仅限于单词,还可扩展到句子、文档、实体或其他类型的对象。通过训练诸如 Word2Vec、GloVe 或 BERT 等模型,可从大规模文本数据中学习出这样的嵌入向量,这些嵌入向量可看作是输入数据在潜在语义空间中的表示,能改善下游任务(如文本分类、情感分析、问答系统、机器翻译等)的表现。 除文本数据外,嵌入技术还应用于社交网络分析、推荐系统、图像识别(如位置嵌入)、图神经网络(如节点嵌入)等多种场景,实现将复杂对象的有效编码和降维表示。 Embeddings 有多种分类及对应模型: 句子和文档嵌入:Doc2Vec 能为整个文档生成统一的向量表示;Average Word Embeddings 是将一段文本中所有单词的嵌入取平均作为整体的文本表示;Transformers Sentence Embeddings 如 BERT 的标记对应的向量,或者专门针对句子级别的模型如 SentenceBERT。 实体/概念嵌入:Knowledge Graph Embeddings 如 TransE、DistMult、ComplEx 等,用于将知识图谱中的实体和关系嵌入到低维向量空间中。 其他类型:图像 Embeddings 使用卷积神经网络(CNN)进行图像特征提取,得到的特征向量即为图像嵌入;音频 Embeddings 在语音识别和声纹识别中,将声音信号转化为有意义的向量表示;用户/物品 Embeddings 在推荐系统中,将用户行为或物品属性映射到低维空间以进行协同过滤或基于内容的推荐;还有图 Embeddings 用于学习图结构的表示学习方法,将图中的节点和边映射到低维向量空间中,通过 DeepWalk、Node2Vec、GraphSAGE 等算法来实现,在图分析、社交网络分析、推荐系统等领域广泛应用,用于发现社区结构、节点相似性、信息传播等图属性。 在将大型文档转换为可检索内容的过程中,嵌入向量生成这一步将文本块转换为实值向量并存储在数据库中。但检索 PDF 文档的过程充满挑战,可能出现文本提取不准确和 PDF 文档内表格行列关系混乱等问题。在检索增强生成(RAG)框架中,回答一个问题需要用户提出问询,系统从私有知识库中检索相关内容,将相关内容与用户查询合并为上下文,最后请求大语言模型生成答案,准确检索相关信息对 RAG 模型的效力至关重要。
2024-12-11
Coze中能给变量在赋值中嵌入其它变量并同时 使用公式么
在 Coze 中,变量是以 keyvalue 形式存储数据的,是 Bot 的数据记忆功能。大语言模型会根据用户输入内容进行语义匹配,为定义的变量赋值并保存值。您可以在提示词中为 Bot 声明某个变量的具体使用场景。 创建变量可在创建 Bot 的页面进行。对变量进行赋值时,首先可以在给大模型的提示词中做声明,例如:“与您的用户进行互动,并根据 user_language 变量,用他们偏好的语言在线搜索。除非另有设置,用户查询的语言应指导您的回答和搜索”。这段提示词相当于告诉了 LLM,user_language 这个变量该如何赋值以及使用。 变量创建并赋值后,如 user_language 变量,就可以在工作流中作为变量使用。这一块解释起来有些抽象,具体可以参考后面的例子,真正用一遍就懂了。 综上,在 Coze 中能给变量在赋值中嵌入其它变量并同时使用公式,但具体的实现方式和规则需要根据具体的提示词和使用场景来确定。
2024-12-11
ollama嵌入向量在模型后有什么用
嵌入向量在模型后的作用主要体现在以下方面: 1. 用于文档内容的表示和检索:将文档分成块,计算嵌入向量并存储在向量存储中,在测试时通过查询向量存储获取可能与任务相关的块,填充到提示中进行生成。 2. 提升模型的检索能力:在大语言模型应用程序中,向量存储成为检索相关上下文的主要方式,嵌入向量有助于更高效地获取相关信息。 3. 支持多语言和不同粒度的检索任务:例如像 bgem3 这样的向量模型,支持超过 100 种语言的语义表示及检索任务,能实现句子、段落、篇章、文档等不同粒度的检索。 在实际应用中,如在 LangChain 中,本地向量存储使用量较大,而在计算文本片段的嵌入时,OpenAI 占据主导地位,开源提供商如 Hugging Face 等也被较多使用。
2024-11-12