Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

如何开发一个有关“精油”的智能体

Answer

开发一个有关“精油”的智能体可以参考以下步骤:

  1. 技术实现原理:
    • 由 1 个工作流和多个数据库组成。工作流设计较简单,包括输入、对接知识库、搭载大模型和输出。数据库的收集和二次校对有一定难度,需要专业知识。为保证回答准确性,提示词约定回答只能来自知识库。
  2. 商业化场景:
    • 可替代大部分传统医药数据库商业化场景,如医药企业研发立项、科研机构临床转化评估、投资机构评估标的公司等方面的相关问题。

此外,还可以参考以下通用的智能体开发步骤:

  1. 创建大模型问答应用:
    • 通过创建百炼应用获取大模型的推理 API 服务。
    • 进入百炼控制台的“我的应用”,选择智能体应用并创建。
    • 模型选择通义千问-Plus,可设置 Prompt 引导大模型应对客户咨询。
    • 提问验证模型效果并发布。
  2. 获取调用 API 所需的凭证:
    • 在“我的应用>应用列表”中查看百炼应用 ID 并保存。
    • 在顶部导航栏右侧创建新的 API-KEY 并保存。

对于图像相关的智能体开发,如制作公司周边图片,流程分为三个部分:

  1. 获取 Logo 图片的描述:从摄影、标志设计等方面详细描述图像内容,控制在 50 字左右。
  2. 根据 Logo 图片的描述和生成意图生成图片提示词:参考示例,根据具体需求创作提示词。
  3. 将图片和提示词输入 Comfyui 工作生成。
Content generated by AI large model, please carefully verify (powered by aily)

References

生物医药小助手的诞生之旅~如果你有公众号,你也应该做一个扣子智能体

这个智能体是由1个工作流+6个数据库实现的。工作流的设计比较简单,一个input,对接知识库,然后搭载豆包function call大模型,最后是一个output。6个数据库分别是我的公众号发表过的文章+执业药师教材(做第一个知识库的时候没经验,其实应该分开成两个数据库)、执业医师讲义、药监局新药审评报告、中国医药企业融资动态、药物对外授权(BD)动态、全球药物销售额。工作流是非常简单的,相对有难度的是收集知识库的资料并根据清洗结果进行手动二次校对(需要一定专业知识)。也许有人要问,医药知识我直接问大模型不好吗?大模型的语料来源庞杂,广度一定是比智能体好很多的,但是在医疗这个严肃领域,对回答准确性的要求非常高。为了避免出现误导性的回答,我在提示词中约定了回答只能来自于知识库。也许有问题超出知识库范畴的情况,但还没发现智能体回答是医学上不严谨的现象。广or精准,在医疗领域一定是精准优先的。[heading2]商业化场景[content]基本可以理解为,这个智能体能替代大部分的传统医药数据库商业化场景。医药企业研发立项:每个医药研发项目在立项之前,都要整理作用机制、目标治疗疾病的竞争格局、主流的技术路径是什么、同技术路径其他公司研发的产品在临床试验阶段看到的安全性风险和有效性分别是怎样的,这些问题智能体都可以回答科研机构临床转化评估:大学等科研机构有将基础的医药研究课题转化为药物的孵化机制,关注的主要是科学家研究方向的临床转化潜力,这些问题智能体都可以回答投资机构评估标的公司:主要关注国外对标技术的发展情况、融资情况、临床转化的可靠性,这些问题智能体都可以回答

10分钟在网站上增加一个AI助手

首先我们可以通过创建一个百炼应用,来获取大模型的推理API服务,用于实现AI助手。[heading3]1.1创建应用[content]1.进入百炼控制台的[我的应用](https://bailian.console.aliyun.com/#/app-center),在页面右侧点击新增应用。在对话框,选择智能体应用并创建。1.2.在应用设置页面,模型选择通义千问-Plus,其他参数保持默认。3.您也可以选择输入一些Prompt,比如设置一些人设以引导大模型更好的应对客户咨询。4.1.2.在页面右侧可以提问验证模型效果。不过您会发现,目前它还无法准确回答你们公司的商品信息。点击右上角的发布,我们将在后面的步骤中去解决这一问题。3.1.[heading3]1.2获取调用API所需的凭证[content]为了在后续通过API调用大模型应用的能力,我们需要获取一个百炼应用的API-KEY和应用ID:1.在我的应用>应用列表中可以查看所有百炼应用ID。保存应用ID到本地用于后续配置。1.2.在顶部导航栏右侧,点击人型图标,点击API-KEY进入我的API-KEY页面。在页面右侧,点击创建我的API-KEY,在弹出窗口中创建一个新API-KEY。保存API-KEY到本地用于后续配置。1.

藏师傅教你用 AI 三步制作任意公司的周边图片,不用到处找样机文件

人民有信仰整了个提示词一件生成的智能体:https://www.coze.cn/s/iDec2U13/glif又一个出圈爆款玩法。用In-Context LoRA制作任何Logo的周边!!效果好到💥,样机网站有点难受了。我整理了他们这个工作流,做了几个国产AI软件的周边。整个流程分为三个部分:获取Logo图片的描述根据Logo图片的描述和生成意图生成图片提示词将图片和提示词输入Comfyui工作生成[heading2]用下面的提示词生成关于Logo图片的描述:[content]为了帮助一位视障艺术家,我们需要详细描述这幅图像的内容,包括从摄影(Photography)、标志设计(Logo Design)到较为冷门的艺术风格等各个方面。对于出现在图中的人物,虽然不能提及具体姓名,但考虑到艺术家的特殊需求,我们需要以匿名方式描述他们的主要特征(切记不要提及真实姓名)。请直接进行描述,控制在50字左右。[heading2]用LLM生成图像提示词[content]将第一步生成的提示词填入{图像描述}位置,将你想生成的周边填入{周边描述}部分。这是一个提示词示例:"The pair of images highlights a logo and its real-world use for a hi-tech farming equipment;[IMAGE1]a black background showcases a logo with a stylized,fish in magenta and cyan,titled“BLINK”in an bold font,with bubble details underneath;[IMAGE2]this logo is applied as a black and white tattoo on lower back of an inmate"我希望你参考"{图像描述}"的内容和风格特点,创作一个类似的提示放在左侧面板。然后根据"{周边描述}"的内容,设计配套的右侧面板描述,需要表达"展示同样的内容(可以是角色、标志等)"这样的意思。直接给出提示内容,无需其他说明!开始!

Others are asking
有适合拆书或者能快读读懂一本书的智能体吗
目前有一些与拆书或快速读懂一本书相关的智能体。例如,AI Agent 就是应用了大模型(LLM)能力的智能体,以解决传统写作方式中存在的问题。像 OpenAI 的 Lilian Weng 将以 LLM 为驱动的 AI Agent 形式化为特定的公式。 还有一些特定功能的智能体,比如名字写对联教学的百宝箱智能体,它有多种玩法,如根据朋友名字和祝福、幸运数字等为用户生成特殊对联,还能与用户随意聊聊对联相关内容。其设计思路包括工作流对话模式、根据用户意图进入不同流程等,功能实现上有幸运数字模块、送祝福模块和互动模块等。 另外,在 AI Agent 系列中,有对 Brain 模块的探究,包括其基本概念、核心要点、潜在能力等方面的介绍,帮助大家更全面深入地了解智能体。
2025-02-01
有没有什么做竞品调研方便的AI工具或智能体
以下是一些做竞品调研方便的 AI 工具或智能体: 1. 各类 AI 搜索引擎,如 perplexity.ai、metaso、360 搜索、ThinkAny 等,它们颠覆了传统搜索引擎,智能摘要功能可辅助快速筛选信息。 2. 多智能体 AI 搜索引擎,其方案详情包括: 第一步,根据用户任务使用搜索工具如 API WebSearchPro 快速搜索补充参考信息,参考文档:https://bigmodel.cn/dev/api/searchtool/websearchpro 。 第二步,用大模型如 GLM40520 规划和分解子任务,并转换为 JSON 格式,参考 API 文档:https://bigmodel.cn/dev/api/normalmodel/glm4 及 JSON 工具:https://bigmodel.cn/dev/howuse/jsonformat 。 第三步,用搜索智能体如智能体 id 为 659e54b1b8006379b4b2abd6 的智能助手完成子任务,其能够联网搜索、自主分析并进行多轮搜索,参考文档:https://bigmodel.cn/dev/api/qingyanassistant/assistantapi 。 第四步,总结子任务生成思维导图,可调用智能体 id 为 664e0cade018d633146de0d2 的智能体,它能将复杂概念秒变脑图,参考文档:https://bigmodel.cn/dev/api/qingyanassistant/assistantapi 。 需要注意的是,每个人的工作流都是独特的,应先了解自己的日常工作流程,再根据工作节点线索找到适合自己的工具。
2025-02-01
用智能分析 解构爆款内容
以下是关于用智能分析解构爆款内容的相关信息: AI+自媒体场景中,包括研究信息搜集、拆解爆款内容、创作剧本或脚本写作、创意营销文本素材、生成创意营销素材等方面。 研究拆解爆款内容的步骤: 第一步:建立自己的爆款库,并选择其中 1 个爆款内容。 第二步:让 ChatGPT 理解拆解的角度。 第三步:让 ChatGPT 提出内容的修改建议,并分点式给出答案。 第四步:要求 ChatGPT 以特定风格去做修改。 该场景对应的关键词库有示例内容、爆款库、内容类型、拆解角度、亮点、不足、修改建议、文案、风格、文章、脚本。 提问模板包括明确理解名词涵义、根据拆解角度分析内容、提出亮点和不足及修改建议、要求按特定风格修改等。 案例方面,包括确保 ChatGPT 理解拆解角度、输入短视频脚本让其拆解、提出修改建议并分点给出答案、要求按特定风格修改。 夙愿中的 AI 工作流提到,在 AI 辅助写作中,用 AI 拆解爆款时,要先自己跑通流程,才能有效利用 AI 提效。具体操作如用电脑微信复制文章、在 Claude3.5 中发送提示词和原文,同时要对 AI 输出的结果进行决策和结合原文思考,判断是否可用,因为 AI 有时也会胡说八道。
2025-02-01
免费生成logo的智能ai网站
以下是一些免费生成 logo 的智能 AI 网站: 1. Looka:是一个在线 Logo 设计平台,使用 AI 理解用户品牌信息和设计偏好,生成多个设计方案供选择和定制。 2. Tailor Brands:AI 驱动的品牌创建工具,通过用户回答问题生成 Logo 选项。 3. Designhill:其 Logo 制作器利用 AI 技术创建个性化 Logo,用户可选择元素和风格。 4. LogoMakr:提供简单易用的 Logo 设计工具,可利用 AI 建议的元素和颜色方案。 5. Canva:广受欢迎的在线设计工具,提供 Logo 设计模板和元素,有 AI 辅助设计建议。 6. LogoAI by Tailor Brands:Tailor Brands 推出的 AI Logo 设计工具,根据输入快速生成方案。 7. 标小智:中文 AI Logo 设计工具,利用人工智能技术帮助创建个性化 Logo。 另外,您还可以访问网站的 AI 生成 Logo 工具版块获取更多好用的工具:https://waytoagi.com/category/20 。
2025-01-31
生成logo的智能ai
以下是一些可以生成 logo 的 AI 产品: 1. Looka:在线 Logo 设计平台,使用 AI 理解用户品牌信息和设计偏好,生成多个设计方案供选择和定制。 2. Tailor Brands:AI 驱动的品牌创建工具,通过用户回答问题生成 Logo 选项。 3. Designhill:其 Logo 制作器利用 AI 技术创建个性化设计,用户可选择元素和风格。 4. LogoMakr:提供简单易用的 Logo 设计工具,可利用 AI 建议的元素和颜色方案。 5. Canva:广受欢迎的在线设计工具,提供 Logo 设计模板和元素,有 AI 辅助设计建议。 6. LogoAI by Tailor Brands:Tailor Brands 推出的 AI Logo 设计工具,根据输入快速生成方案。 7. 标小智:中文 AI Logo 设计工具,利用人工智能技术帮助创建个性化 Logo。 此外,还可以访问网站的 AI 生成 Logo 工具版块获取更多好用的工具:https://waytoagi.com/category/20 。 藏师傅教您用 AI 三步制作任意公司的周边图片,流程如下: 1. 获取 Logo 图片的描述。 2. 根据 Logo 图片的描述和生成意图生成图片提示词。 3. 将图片和提示词输入 Comfyui 工作生成。 即梦 AI 智能画布制作 Logo 的步骤: 1. 在即梦左侧点击「智能画布」,「上传图片」上传一张 logo 图,点击「图生图」输入描述词,参考程度为 55,选择「轮廓边缘」,点击立即生成。 2. 右侧图层可看到 4 张图,选择喜欢的图;若不喜欢,可用局部重绘、消除笔等功能调整,也可重新生成。
2025-01-31
可以做一个小红书私信自动回复的ai程序或者智能体吗
在理论上是可以创建一个小红书私信自动回复的 AI 程序或智能体的。但这需要一定的技术知识和开发能力。 首先,您需要确定回复的规则和逻辑,例如根据关键词、常见问题类型等来设定回复内容。 其次,选择适合的技术框架和工具,比如使用自然语言处理(NLP)技术和相关的库。 然后,进行数据收集和预处理,以训练模型能够准确理解和回复私信。 不过,需要注意的是,小红书的使用规则可能对自动回复有一定的限制和要求,您需要确保您的程序或智能体的使用符合其规定。
2025-01-30
总结一下当前AI发展现状以及指导非开发者一类的普通用户如何使用及进阶使相关工具
当前 AI 发展现状: 涵盖了不同领域的应用和发展,如电子小说行业等。 包括了智能体的 API 调用、bot 串联和网页内容推送等方面。 对于非开发者一类的普通用户使用及进阶相关工具的指导: 可以先从国内模型工具入手,这些工具不花钱。 学习从提示词开始,与模型对话时要把话说清,强调提示词在与各类模型对话中的重要性及结构化提示词的优势。 对于技术爱好者:从小项目开始,如搭建简单博客或自动化脚本;探索 AI 编程工具,如 GitHub Copilot 或 Cursor;参与 AI 社区交流经验;构建 AI 驱动的项目。 对于内容创作者:利用 AI 辅助头脑风暴;建立 AI 写作流程,从生成大纲开始;进行多语言内容探索;利用 AI 工具优化 SEO。 若想深入学习美学概念和操作可报野菩萨课程。国内模型指令遵循能力较弱时,可使用 launch BD 尝试解决。
2025-01-31
35岁java后端开发如何转型AI开发
对于 35 岁的 Java 后端开发人员转型 AI 开发,以下是一些建议: 1. 利用固定格式文档结合 AI 进行代码开发时,要强调组员的主观能动性,让他们自主设计,组长负责引导和经验分享。文档并非唯一最佳方式,可尝试用简短描述或 Prompt 辅助代码生成。在 AI 编程中,设计非常重要,模块化低耦合设计和清晰的上下文对代码生成效果尤为关键。参考链接: 2. 借助 AI 编程工具(如 Cursor),熟悉 LLM 原理,探索复杂 Prompt 和定制化规则。开展 LLM 相关的 Side Project(如翻译工具、AI 对话应用等),通过实践快速掌握技能。将 AI 当老师,边做边学,获取即时反馈,持续提升。核心建议是行动起来,找到正反馈,坚持使用 AI 辅助编程。参考链接:
2025-01-29
waytoagi知识库的对话功能是如何开发的
waytoagi 知识库的对话功能开发涉及以下方面: 1. 提示词的运用:建议从最佳实践中的收录内容开始了解,像李继刚老师的结构化提示词很有意思,使用此类提示词能让模型给出更优质、完整的答案。操作过程中有很多有趣的提示词,如“酷老师”“抬杠高手”等,可点开并复制,将其丢进大源模型对话会有不同效果。近期提示词有升级,李金刚老师将其玩到新高度,cloud 等大语言模型可直接显示编译结果内容。输入特定提示词可生成卡片,小创业项目可利用并改变提示词形成独到见解或小应用。 2. 基于飞书 aily 搭建:在飞书 5000 人大群里内置了智能机器人「waytoAGI 知识库智能问答」,它能自动问答、进行知识搜索、提供文档引用、开展互动教学、更新最新动态、促进社区互动、实现资源共享以及支持多语言问答。用户在飞书群里发起话题时即可,它会根据 waytoAGI 知识库的内容进行总结和回答。 3. 解决知识库使用问题:整个知识库内容庞大,传统搜索基于关键词及相关性存在不足,需要用更先进的办法如 RAG 技术来解决,在群中提供快速检索信息的方式,使用更加便捷。
2025-01-28
如何从零到一学习LLM上层AI应用开发
从零到一学习 LLM 上层 AI 应用开发,您可以参考以下步骤: 1. 掌握深度学习和自然语言处理基础: 学习机器学习、深度学习、神经网络等基础理论。 掌握自然语言处理基础,如词向量、序列模型、注意力机制等。 相关课程:吴恩达的深度学习课程、斯坦福 cs224n 等。 2. 理解 Transformer 和 BERT 等模型原理: 熟悉 Transformer 模型架构及自注意力机制原理。 掌握 BERT 的预训练和微调方法。 阅读相关论文,如 Attention is All You Need、BERT 论文等。 3. 学习 LLM 模型训练和微调: 进行大规模文本语料预处理。 熟悉 LLM 预训练框架,如 PyTorch、TensorFlow 等。 学会微调 LLM 模型进行特定任务迁移。 相关资源:HuggingFace 课程、论文及开源仓库等。 4. LLM 模型优化和部署: 掌握模型压缩、蒸馏、并行等优化技术。 了解模型评估和可解释性。 熟悉模型服务化、在线推理、多语言支持等。 相关资源:ONNX、TVM、BentoML 等开源工具。 5. LLM 工程实践和案例学习: 结合行业场景,进行个性化的 LLM 训练。 分析和优化具体 LLM 工程案例。 研究 LLM 新模型、新方法的最新进展。 6. 持续跟踪前沿发展动态: 关注顶会最新论文、技术博客等资源。 以下是一些相关的学习资源: 面向开发者的 LLM 入门课程: 提示工程指南: LangChain🦜️🔗中文网,跟着 LangChain 一起学 LLM/GPT 开发: LLMs 九层妖塔: 在课程方面,欢迎来到针对开发者的 AIGPT 提示工程课程。该课程将分享软件开发最佳实践的提示,涵盖常见用例,包括总结、推理、转换和扩展,并指导使用 LLM 构建一个聊天机器人。在大型语言模型或 LLM 的开发中,大体上有基础 LLM 和指令调整后的 LLM 两种类型。基础 LLM 已训练出根据文本训练数据预测下一个单词,通常在大量数据上训练,以找出接下来最有可能的单词。
2025-01-28
企业AI开发
企业 AI 开发包括以下重要内容: 企业级 AI 应用类型: 智能体应用(Assistant):基于上下文对话,自主决策并调用工具完成复杂任务的对话式 AI 应用。通过简单配置可快速上手实现基本功能,适用于客户服务、个人助理、技术支持等场景。详情参见。 工作流应用(Workflow):将复杂任务拆解为若干子任务,以提高工作流程可控性的流程式 AI 应用。用户可通过拖拽节点创建自定义任务流程,适用于 AI 翻译等场景。详情参见。 智能体编排应用:支持多智能体协作的流程式 AI 应用,能编排多个智能体的执行逻辑,适用于综合调研报告、软件开发团队等场景。详情参见。 应避免的人工智能陷阱: 不要以为 AI 可以做任何事,要考虑技术、数据和工程资源的限制,有许多 AI 做不到的事情。 不要以为只雇佣 2 3 个机器学习工程师就可以满足公司的使用场景。机器学习人才很重要,也应让工程师与业务人才交流,寻找可行、有价值的项目。 不要以为 AI 项目一次就能成功,AI 开发通常需要多次尝试。 不要期待直接使用传统的计划流程而不用改变,实际需要和 AI 团队测算时间节点、里程碑与 KPI。 不需要极其优秀的 AI 人才后才启动项目,持续构建团队,普通工程师也能提供有价值和可行的项目。 阿里云百炼: 是基于通义系列大模型和开源大模型打造的一站式大模型服务平台,提供「生成式大模型的应用编排搭建能力」和「企业大模型的全链路训练部署能力」,是企业 AI 时代的首选。 核心能力和优势包括大模型 API 服务(高可用、高性能、高性价比),提供通义闭源和开源系列大模型,以及图片、语音等多模态大模型和国内优质三方大语言模型;AI 应用搭建(可观测、可干预、可追踪),提供 RAG 智能体应用、工作流编排和智能体编排三类使用场景的应用构建能力,以及包含插件能力、运营工具箱等适配工具,实现 10 分钟拖拉拽快速搭建 AI Agent。 提供很多行业级的解决方案,如短剧剧本创作、企业线索挖掘、泛企业 VOC 挖掘等。 体验入口:https://bailian.console.aliyun.com//home (需要登陆阿里云账号,也可以使用支付宝、钉钉、手机号快速注册登陆),建议注册后先进行实名认证,以方便后续体验工作及领取免费学习云资源。
2025-01-27
Coze + 飞书 + 飞书多维表格:通过飞书机器人与 Coze 搭建的智能体进行对话,在聊天窗口中完成链接输入和阅读计划输出。由 Coze 调用大模型、插件完成内容的整理、推荐,利用飞书多维表格存储和管理稍后读数据,无需开发任何插件、APP,能实现跨平台的稍后读收集与智能阅读计划的推荐。其设计思路包括简化“收集”,实现跨平台收集和通过输入 URL 完成收集;自动化“整理入库”,自动整理关键信息并支持跨平台查看;智能“选择”推荐,根据收藏记录和用户兴趣生成阅读计划——这个方法具体如何操作?
以下是关于通过飞书机器人与 Coze 搭建的智能体进行对话,并利用飞书多维表格存储和管理稍后读数据,实现跨平台的稍后读收集与智能阅读计划推荐的具体操作方法: 前期准备: 1. 简化“收集”: 实现跨平台收集功能,支持电脑(web 端)、安卓、iOS 多端操作。 输入一个 URL 即可完成收集,借鉴微信文件传输助手的方式,通过聊天窗口完成收集输入。 2. 自动化“整理入库”: 系统在入库时自动整理每条内容的关键信息,包括标题、摘要、作者、发布平台、发布日期、收集时间和阅读状态。 阅读清单支持跨平台查看。 3. 智能“选择”推荐: 根据当前收藏记录和用户阅读兴趣进行相关性匹配,生成阅读计划。 使用飞书·稍后读助手: 1. 设置稍后读存储地址: 首次使用,访问。 点击「更多创建副本」,复制新表格的分享链接。 将新链接发送到智能体对话中。 还可以发送“查询存储位置”、“修改存储位置”来更换飞书多维表格链接,调整稍后读存储位置。 2. 收藏待阅读的页面链接: 在对话中输入需要收藏的页面链接,第一次使用会要求授权共享数据,授权通过后再次输入即可完成收藏。但目前部分页面链接可能小概率保存失败。 3. 智能推荐想看的内容: 在对话中发送“我想看 xx”、“xx 内容”,即可按个人兴趣推荐阅读计划。 至此,专属 AI 稍后读智能体大功告成,您可以尽情享受相关服务。
2025-01-27
我有一个长达2小时的youtube,它是讲马来西亚的国语。有什么AI工具帮我翻译成华语吗?
目前常见的 AI 翻译工具如谷歌翻译、百度翻译、有道翻译等都可以尝试对您的视频内容进行翻译。但需要注意的是,对于长达 2 小时的视频,直接进行整体翻译可能不太方便。您可以将视频中的音频提取出来,然后分段输入到这些翻译工具中进行翻译。
2025-02-01
我现在需要根据一系列的 yaml 和 markdown 构建一个知识库,并且需要支持 AI 问答,每次 AI 问答的结果都要保存成一个新的内容放到知识库中,请问从经济效益来看,有哪些服务可以使用?
目前从经济效益的角度来看,以下一些服务可能有助于您构建这样的知识库并支持 AI 问答以及结果保存: 1. 云服务提供商,如阿里云、腾讯云、AWS 等,它们提供可扩展的计算和存储资源,您可以根据实际需求灵活配置,避免过度投入硬件成本。 2. 开源的知识管理和问答系统框架,例如使用 Elasticsearch 结合相关插件来实现问答功能,成本相对较低,但可能需要一定的技术投入进行搭建和维护。 3. 一些专门针对知识管理和 AI 应用的 SaaS 服务,它们通常按使用量计费,初期投入较小,适合小规模应用。 需要注意的是,具体选择哪种服务取决于您的业务规模、技术能力、预算以及对性能和功能的要求。
2025-02-01
如何训练一个自己的模型用来识别不同的图片类别
训练自己的模型来识别不同的图片类别可以参考以下方法: 对于扩散模型(如 Midjourney): 强大的扩散模型训练往往消耗大量 GPU 资源,推理成本高。在有限计算资源下,可在强大预训练自动编码器的潜在空间中应用扩散模型,以在复杂度降低和细节保留间达到平衡,提高视觉保真度。引入交叉注意力层可使其成为灵活的生成器,支持多种条件输入。 Midjourney 会定期发布新模型版本以提升效率、连贯性和质量。最新的 V5 模型具有更广泛的风格范围、更高的图像质量、更出色的自然语言提示解读能力等。 用 SD 训练贴纸 LoRA 模型: 对于原始形象,可通过 MJ 关键词生成不同风格的贴图,总结其特征。注意关键词中对颜色的限制,保持正面和负面情绪数据比例平衡。若训练 25626 大小的表情包,初始素材可能够用,若训练更高像素图片,可能需进一步使用 MJ 垫图和高清扩展功能。 进行高清化时,从 256 到 1024 分辨率,输入左图并加入内容和风格描述,挑选合适的图片。 多模态模型(以 StableDiffusion 为例): 多模态模型包括文生图、图生图、图生视频、文生视频等,底层逻辑通常从生图片源头开始。 扩散模型(如 StableDiffusion 中使用的)的训练是对图片加减噪点的过程。先对海量带有标注文字描述的图片逐渐加噪点,模型学习每一步图片向量值和文字向量值的数据分布演变规律,完成训练。输入文字后,模型根据文字向量指导充满噪点的图片减噪点生成最终图片。扩散模型加减噪点方式与大脑构思图片方式类似,且多模态模型会关联文字向量值和图片像素点向量值。
2025-01-31
怎么制作一个AI agent?
制作一个 AI Agent 通常有以下几种方式和步骤: 方式: 1. Prompttuning:通过 Prompt 来构建大脑模块,但一般适合拟人化不是很重的情况,其缺点是使用的 Prompt 越长,消耗的 Token 越多,推理成本较高。 2. Finetuning:针对“有趣的灵魂”,通过微调一个定向模型来实现,能将信息直接“记忆”在 AI 的“大脑模块”中,提高信息提取效率,减少处理数据量,优化性能和成本。 3. Prompttuning + Finetuning:对于复杂情况,一般是两种方式结合。 步骤(以工作流驱动的 Agent 为例): 1. 规划: 制定任务的关键方法。 总结任务目标与执行形式。 将任务分解为可管理的子任务,确立逻辑顺序和依赖关系。 设计每个子任务的执行方法。 2. 实施: 在 Coze 上搭建工作流框架,设定每个节点的逻辑关系。 详细配置子任务节点,并验证每个子任务的可用性。 3. 完善: 整体试运行 Agent,识别功能和性能的卡点。 通过反复测试和迭代,优化至达到预期水平。
2025-01-31
零基础怎么入门AI工具,行政专员一个
对于零基础的行政专员入门 AI 工具,以下是一些建议: 1. 明确学习目标:确定您希望通过 AI 工具解决哪些行政工作中的问题或提高哪些方面的效率。 2. 学习基础知识:了解 AI 的基本概念,例如机器学习、深度学习、自然语言处理等。可以通过在线课程、科普文章和视频来学习。 3. 选择适合的工具:根据行政工作的需求,选择一些易于上手的 AI 工具,如自动化文档处理工具、智能客服工具等。 4. 参加培训课程:报名参加专门针对零基础的 AI 入门培训课程,这些课程通常会有系统的教学和实践指导。 5. 实践操作:在实际工作中尝试使用所选的 AI 工具,积累经验。 6. 加入学习社区:参与 AI 学习的社区或论坛,与其他学习者交流经验,获取更多的学习资源和建议。 7. 持续学习和更新知识:AI 领域发展迅速,要保持学习的热情,不断跟进新的技术和工具。
2025-01-30