Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

集成LLM的工具

Answer

以下是关于集成 LLM 的工具的相关内容:

一、“手臂和腿部”:赋予模型使用工具的能力

  1. 从知识挖掘转向行动导向,增加模型使用工具的能力,有望在消费者和企业领域实现一系列用例。
    • 对于消费者,LLMs 可能给出菜谱建议并订购食材,或推荐早午餐地点并预订餐桌。
    • 在企业领域,创始人可接入 LLMs 使应用程序更易用,如在 Salesforce 等应用中,用户能用自然语言更新,模型自动更改,减少维护 CRM 所需时间。
  2. LLM 虽对常见系统有复杂理解能力,但无法执行提取的信息。不过,公司在不断改善其使用工具的能力。
    • 老牌公司如必应、谷歌和初创公司如 Perplexity、You.com 推出搜索 API。
    • AI21 Labs 推出 Jurassic-X,解决独立 LLMs 缺陷。
    • OpenAI 推出 ChatGPT 插件测试版,允许与多种工具交互,在 GPT-3.5 和 GPT-4 中引入函数调用,允许开发者将 GPT 能力与外部工具链接。

二、无需微调,仅用提示词工程就能让 LLM 获得 tool calling 的功能

  1. 提示词工程主要由提示词注入和工具结果回传两部分代码组成。
  2. 提示词注入用于将工具信息及使用工具的提示词添加到系统提示中,包含 TOOL_EAXMPLE、tools_instructions、REUTRN_FORMAT 三个部分。
    • TOOL_EAXMPLE 提示 LLM 如何理解和使用工具,编写时用无关紧要工具作示例避免混淆。
    • tools_instructions 是通用工具字典转换成 LLM 可读的工具列表,可动态调整。
    • REUTRN_FORMAT 定义调用 API 格式。
  3. 工具结果回传阶段利用正则表达式抓取输出中的“tool”和“parameters”参数,对于 interpreter 工具使用另一种正则表达式提取 LLM 输出的代码,提高使用成功率。通过识别 LLM 返回的调用工具字典,提取对应值传入工具函数,将结果以 observation 角色返回给 LLM,对于不接受某些角色的 LLM 接口,可改为回传给 user 角色。通过以上提示词工程,可让无 tool calling 能力的 LLM 获得稳定的该能力。
Content generated by AI large model, please carefully verify (powered by aily)

References

生成式人工智能领域的 4 个突破点

通过从知识挖掘转向行动导向,增加手臂和腿部的能力有望在各种公司和用户类型之间实现一系列用例。对于消费者而言,LLMs可能很快就能给出菜谱建议,然后为您订购所需的食材,或者建议一个早午餐地点并为您预订餐桌。在企业领域,创始人可以通过接入LLMs使他们的应用程序更易于使用。正如Amodei所指出的:“对于从用户界面角度来说非常难以使用的功能,我们可能只需用自然语言描述即可实现复杂的操作。”例如,对于Salesforce等应用程序,LLM集成应允许用户用自然语言进行更新,并使模型自动进行这些更改,从而大大减少了维护CRM所需的时间。像Cohere和Adept这样的初创公司正在致力于将LLMs集成到这类复杂工具中。Gomez认为,虽然LLMs能够在2年内使用Excel等应用程序的可能性越来越大,但“仍然需要进行许多细化工作。我们将拥有第一代能够使用工具的模型,这将是引人注目但易碎的。最终,我们将获得梦寐以求的系统,我们可以将任何软件交给模型,并附上一些描述,例如‘这是工具的功能,这是如何使用它的’,它将能够使用它。一旦我们可以为LLMs提供特定和通用的工具,它所带来的自动化将成为我们领域的巅峰之作。”关键突破点:LLMs将能够与我们今天使用的工具进行更加有效的交互。

生成式人工智能领域的 4 个突破点

LLMs的真正威力在于使自然语言成为行动的媒介。LLMs对常见且有详细文档的系统具有复杂的理解能力,但它们无法执行从这些系统中提取的任何信息。例如,OpenAI的ChatGPT、Anthropic的Claude和Character AI的Lily可以详细描述如何预订航班,但它们本身无法原生地预订航班(尽管像ChatGPT的插件等技术进展正在推动这一边界)。Amodei表示:“这个大脑在理论上拥有所有这些知识,只是缺少从名称到按钮的映射。”他说:“连接这些电缆并不需要太多的训练。你有一个没有实体的大脑,它知道如何移动,但它还没有连接上手臂和腿部。”随着时间的推移,我们已经看到公司不断改善LLMs使用工具的能力。像必应和谷歌这样的老牌公司和Perplexity和You.com这样的初创公司推出了搜索API。AI21 Labs推出了Jurassic-X,它通过将模型与一组预定工具(包括计算器、天气API、维基百科API和数据库)结合起来,解决了独立LLMs的许多缺陷。OpenAI推出了ChatGPT的插件测试版,允许ChatGPT与Expedia、OpenTable、Wolfram、Instacart、Speak、网络浏览器和代码解释器等工具进行交互,这一突破被认为类似于苹果的“应用商店”时刻。最近,OpenAI在GPT-3.5和GPT-4中引入了函数调用,允许开发者将GPT的能力与任何外部工具进行链接。

无需微调,仅用提示词工程就能让 LLM 获得 tool calling 的功能

本文采用的提示词工程主要有两部分代码组成:提示词注入和工具结果回传。提示词注入用于将工具信息以及使用工具的提示词添加到系统提示中。工具结果回传则是解析tool calling的输出,并将工具返回的内容再次嵌入LLM。[heading2]1、提示词注入阶段[content]INSTRUCTION为最后注入到系统提示中的字符串,他又包含了TOOL_EAXMPLE、tools_instructions、REUTRN_FORMAT三个部分。TOOL_EAXMPLE用于提示LLM如何理解tool以及如何使用tool。在编写TOOL_EAXMPLE时,请注意用一些无关紧要的工具作为示例,例如本文使用的将数字加一和数字减一的工具,从而避免LLM混淆真正可以使用的工具与示例工具。tools_instructions是由目前通用的工具字典转换成LLM可读的工具列表。实际使用LLM时,可以通过输入不同的工具来动态调整tools_instructions,让LLM得知目前可用的工具有哪些以及如何使用。REUTRN_FORMAT定义了调用API的格式。[heading2]2、工具结果回传阶段[content]利用正则表达式抓取输出中的"tool"和"parameters"参数。对于interpreter工具,使用了另一种正则表达式来提取LLM输出的代码,提高LLM使用interpreter工具的成功率。本文使用代码如下:通过识别LLM返回的调用工具的字典,提取出对应的值,再传入相应的工具函数,最后将工具返回的结果以observation的角色返回给LLM。对于一些不接受observation、tool、function角色的LLM接口,可以改为回传给user角色,例如:通过以上提示词工程,可以避免微调,让完全没有tool calling能力的LLM获得稳定的tool calling能力。

Others are asking
LLM是什么?
LLM(语言逻辑模型)是 LangChain 平台与各种大模型进行交互的核心模型,是一个能够处理语言输入和输出的抽象概念,可以理解为一个黑盒。 其输入是一个字符串,表示用户的请求或问题,输出也是一个字符串,表示模型的回答或结果。LLM 能根据不同输入调用不同大模型来完成不同语言任务,如文本生成、文本理解、文本翻译等。 从大模型的整体架构来看,LLM 处于模型层,例如 GPT 就是一种常见的 LLM,一般使用 transformer 算法实现。 LLM 的工作原理是像输入法的输入联想逻辑一样,一个字一个字地推理生成内容。通过将上下文加入输入,能帮助模型理解下一个字。但存在计算时带入全量数据算力吃不消以及仅算字的概率易被不相干信息干扰的问题,词向量机制和 transformer 模型中的 attention 自注意力机制解决了这些难题。
2025-01-02
如何在本地部署LLM,然后完成某个专业或者主题的专业知识库训练
以下是在本地部署 LLM 并完成某个专业或主题的专业知识库训练的详细步骤: 1. 部署大语言模型: 下载并安装 Ollama:根据电脑系统,点击进入 https://ollama.com/download 下载,下载完成后双击打开,点击“Install”。安装完成后,将 http://127.0.0.1:11434/ 复制进浏览器,若出现相关字样则表示安装完成。 下载 qwen2:0.5b 模型:如果是 Windows 电脑,点击 win+R,输入 cmd 点击回车;如果是 Mac 电脑,按下 Command(⌘)+Space 键打开 Spotlight 搜索,输入“Terminal”或“终端”,然后从搜索结果中选择“终端”应用程序。复制相关命令行粘贴进入并回车,等待自动下载完成。 2. 安装 Docker Desktop: 点击去下载,根据系统进行选择。以 Windows 系统为例,点击 https://docs.docker.com/desktop/install/windowsinstall/ 下载,双击下载项目,点击 ok 加载文件,点击“close and restart”重启电脑。重启后,点击“Accept”,选择第二个,点击"Finish",进入 Docker Desktop。 3. 部署 FastGPT+OneAPI: 在桌面按住“shift”+鼠标右键,选择“在此处打开 Powershell 窗口”,在窗口中一行一行输入并回车。等待上方命令执行完成,下载完成之后。回到桌面,打开 FastGPT 文件夹,右键 dockercompose.yml 文件,选择打开方式为记事本打开,查找并修改相关内容后保存。回到命令行窗口中,继续输入并回车。 4. 配置 OneAPI: 在浏览器中输入:http://localhost:3001 ,进入登录页,账号 root 密码 123456 点击登录。点击【渠道】【添加新的渠道】,类型选择 Ollama,名称设为 qwen2,模型设为 qwen2:0.5b,秘钥设为 sksky,代理设为 http://host.docker.internal:11434 ,点击提交。点击【令牌】【添加新令牌】,名称随意,时间设为永不过期、额度设为无限额度,点击【提交】,点击【令牌】复制 key。 5. 配置 FastGPT: 回到 FastGPT 文件夹里,用记事本打开“dockercompose.yml”文件,查找并修改相关内容后保存。打开 config.json,根据图示修改完成,把相关数值改成 1500 左右。在命令窗口中输入:docker compose down 等待执行完成,再输入:docker compose upd 等待执行完成。在浏览器上输入:http://localhost:3000 ,账号 root 密码 1234 点击进入,设置好后点击确定。发布 API 并创建一个 key。
2025-01-02
关于LLMs文本与图像混合模态训练
以下是关于 LLMs 文本与图像混合模态训练的相关内容: 多模态大模型总结: 1. InstructBLIP 基于预训练的 BLIP2 模型进行训练,在 MM IT 期间仅更新 QFormer。通过引入指令感知的视觉特征提取和相应的指令,能够提取灵活多样的特征。 2. PandaGPT 是一种开创性的通用模型,能够理解 6 种不同模式的指令并根据指令采取行动,包括文本、图像/视频、音频、热、深度和惯性测量单位。 3. PaLIX 使用混合 VL 目标和单峰目标进行训练,包括前缀完成和屏蔽令牌完成。这种方法对于下游任务结果和在微调设置中实现帕累托前沿都是有效的。 4. VideoLLaMA 引入了多分支跨模式 PT 框架,使 LLMs 能够在与人类对话的同时处理给定视频的视觉和音频内容,使视觉与语言以及音频与语言保持一致。 5. 视频聊天 GPT 是专门为视频对话设计的模型,能够通过集成时空视觉表示来生成有关视频的讨论。 6. Shikra Chen 等人介绍了一种简单且统一的预训练 MMLLM,专为参考对话(涉及图像中区域和对象的讨论的任务)而定制,展示了值得称赞的泛化能力,可以有效处理看不见的设置。 7. DLP 提出 PFormer 来预测理想提示,并在单模态句子数据集上进行训练,展示了单模态训练增强 MM 学习的可行性。 未来发展方向: 最初,多模态融合方法常采用预训练的目标检测器,如 ViLBERT、VisualBERT 和 UnicoderVL,通过提取图像特征和执行交叉模态预训练任务,为后续的图像文本任务奠定基础。随着 ViT 的出现和普及,更多方法开始利用 ViT 作为图像编码器,强调大规模预训练,以提高模型的性能和泛化能力,例如 Flamingo。近期,向多模态 LLMs 的发展趋势是从进行预训练到向指令调整(instruction tuning)转变,例如 LLaVA 和 MiniGPT4,它们通过融合视觉和语言信息,能够更有效地完成视觉理解相关的任务,进一步提升模型对于指令的理解能力,提升零样本性能,使模型能够更好地泛化到未见过的任务和领域。 训练过程: 1. 预训练阶段:通常利用 XText 的数据集来训练输入、输出的 Projector,通过优化损失函数来实现不同模态的对齐,PEFT 有时候用于 LLM Backbone。XText 数据集包含图像文本、视频文本和音频文本,其中图像文本有两种类型:图像文本对和交错图像文本语料库。 2. 多模态微调:是对满足指令微调格式的一系列数据集对预训练好的多模态大模型进行微调。通过这种微调,MMLLM 可以遵循新的指令泛化到没有见过的任务,增强 zeroshot 的能力。MM IT 包括监督微调(SFT)和 RLHF 两部分,目的是为了使得模型符合人类的意图或者偏好,并且增强 MMLLMs 的交互能力。SFT 将 PT 阶段的数据转换为指令aware 的格式,使用 QA 任务作为例子,可采用各种模板。优化目标和预训练相同,SFT 数据可以构造为单轮的 QA 或者多轮的 QA。常用的 SFT 和 RLHF 的数据集见表 4。
2025-01-01
LLM
系统学习 LLM 开发是一个系统性的过程,涵盖以下方面: 1. 掌握深度学习和自然语言处理基础:包括机器学习、深度学习、神经网络等基础理论,以及自然语言处理中的词向量、序列模型、注意力机制等。相关课程有吴恩达的深度学习课程、斯坦福 cs224n 等。 2. 理解 Transformer 和 BERT 等模型原理:熟悉 Transformer 模型架构及自注意力机制原理,掌握 BERT 的预训练和微调方法,阅读相关论文如 Attention is All You Need、BERT 论文等。 3. 学习 LLM 模型训练和微调:进行大规模文本语料预处理,使用 LLM 预训练框架如 PyTorch、TensorFlow 等,微调 LLM 模型进行特定任务迁移。相关资源有 HuggingFace 课程、论文及开源仓库等。 4. LLM 模型优化和部署:掌握模型压缩、蒸馏、并行等优化技术,进行模型评估和可解释性研究,实现模型服务化、在线推理、多语言支持等。相关开源工具有 ONNX、TVM、BentoML 等。 5. LLM 工程实践和案例学习:结合行业场景进行个性化的 LLM 训练,分析和优化具体 LLM 工程案例,研究 LLM 新模型、新方法的最新进展。 6. 持续跟踪前沿发展动态:关注顶会最新论文、技术博客等资源。 以下是 2 月 19 日的 Xiaohu.AI 日报相关内容: 1. Large World Model探索:介绍了百万 Token 的通用世界大模型,旨在理解长视频和超长文本。LWM 在 100 万个令牌的上下文中超越 GPT4V 和 Gemini Pro 的检索精度,特色能力包括长视频理解、高精度事实检索和多格式内容生成。相关链接:https://largeworldmodel.github.io 、https://github.com/LargeWorldModel/LWM 、https://x.com/xiaohuggg/status/1759566391693504940?s=20 2. 世界上最快的大型语言模型:Mixtral 8X7B 输出速度为 500 token/s,Llama 2 7B 的速度是 750 tokens/s,速度快但准确性有待提高。相关链接:http://groq.com 、http://wow.groq.com 、https://x.com/xiaohuggg/status/1759457147962941852?s=20 3. Reddit 用户自制 GLIGEN GUI:由于缺少直观的 GUI,一个 Reddit 大佬自己动手制作了一个。用户可以自定义图像中对象的大小、位置和空间关系,强调了用户对生成图像细节的控制能力。相关链接:https://github.com/mutex/gligengui 、https://gligen.github.io 、https://x.com/xiaohuggg/status/1759431911951450437?s=20
2024-12-24
LLM 提示词怎么写
以下是关于 LLM 提示词编写的相关内容: 在“艾木:提示词编程|有必要用 Lisp 语言写提示词吗?”中,“小确幸”这段提示词用 Lisp 语言描述了一个简单工作流,包含对用户输入文本的处理和生成 SVG 卡片等步骤,内部还有一系列子步骤和 fewshot examples。但大语言模型按程序描述的逻辑运行这类复杂程序有难度。 在“走入 AI 的世界”中,提示词(Prompt)是输入给大模型的文本内容,其质量会显著影响大模型回答的质量。 在“藏师傅教你用 AI 三步制作任意公司的周边图片,不用到处找样机文件”中,介绍了用 LLM 生成图像提示词的流程,包括获取 Logo 图片的描述,根据描述和生成意图生成图片提示词,将图片和提示词输入 Comfyui 工作生成等步骤,并给出了相关示例。
2024-12-16
开源的开源的 LLM 微调推理,agent开发平台
以下是为您整理的关于开源的 LLM 微调推理、agent 开发平台的相关内容: LLM 作为 Agent 的“大脑”的特点: 1. 知识获取能力:通过预训练学习大量语言数据,掌握丰富语言信息和常识知识,能处理多种任务。 2. 指令理解:擅长解析人类语言指令,采用深度神经网络进行自然语言理解和生成,精准理解意图。 3. 泛化能力:在未见过的数据上表现良好,能利用先前知识处理新挑战,形成对语言结构的通用理解。 4. 推理和规划:能够进行逻辑推理和未来预测,分析条件制定最佳行动方案,在复杂环境中做出理性选择。 5. 交互能力:拥有强大对话能力,在多人多轮次对话中自然流畅交流,改善用户体验。 6. 自我改进:基于用户反馈和效果评估,通过调整参数、更新算法提升性能和准确性。 7. 可扩展性:可根据具体需求定制化适配,针对特定领域数据微调提高处理能力和专业化水平。 相关产品和平台: 1. ComfyUI:可在其中高效使用 LLM。 2. Vercel AI SDK 3.0:开源的工具,可将文本和图像提示转换为 React 用户界面,允许开发者创建丰富界面的聊天机器人。 3. OLMo7BInstruct:Allen AI 开源的微调模型,可通过资料了解从预训练模型到 RLHF 微调模型的所有信息并复刻微调过程。 4. Devv Agent:能提供更准确、详细的回答,底层基于 Multiagent 架构,根据需求采用不同 Agent 和语言模型。 实例探究: 1. ChemCrow:特定领域示例,通过 13 个专家设计的工具增强 LLM,完成有机合成、药物发现和材料设计等任务。 2. Boiko et al. 研究的 LLM 授权的科学发现 Agents:可处理复杂科学实验的自主设计、规划和执行,能使用多种工具。
2024-12-12
有什么好用的AI集成工具
以下是一些好用的 AI 集成工具: 画 CAD 图的工具: CADtools 12:Adobe Illustrator 插件,添加 92 个绘图和编辑工具。 Autodesk Fusion 360:集成 AI 功能的云端 3D CAD/CAM 软件。 nTopology:基于 AI 的设计软件,可创建复杂 CAD 模型。 ParaMatters CogniCAD:基于 AI 的 CAD 软件,能自动生成 3D 模型。 主流 CAD 软件的生成设计工具:如 Autodesk 系列、SolidWorks 等。 辅助写邮件的工具: Grammarly:提供语法检查、拼写纠正等功能,支持多种平台和语言。 Hemingway Editor:简化句子结构,提高可读性。 ProWritingAid:全面的语法和风格检查,提供详细写作报告。 Writesonic:基于 AI 生成各种文本,包括邮件。 Lavender:专注邮件写作优化,提供个性化建议和模板。 帮助建筑设计师审核规划平面图的工具: HDAidMaster:云端工具,在建筑、室内和景观设计领域表现出色。 Maket.ai:在户型和室内软装设计方面有探索。 ARCHITEChTURES:AI 驱动的三维建筑设计软件。 Fast AI 人工智能审图平台:实现全自动智能审图流程和数据汇总管理。 需要注意的是,每个工具都有其特定的应用场景和功能,建议根据具体需求选择合适的工具。同时,以上内容由 AI 大模型生成,请仔细甄别。
2024-12-23
如何将COZE做成智能客服集成到APP中
将 COZE 做成智能客服集成到 APP 中,可参考以下步骤: 1. 访问微信客服 https://kf.weixin.qq.com/,点击开通。 2. 勾选同意,点击下一步。 3. 按步骤填写,勾选同意,注册企业微信。 4. 注册成功后,可能会出现“企业未认证,累计仅可接待 100 位客户,认证后可提升接待上限”的提醒,个人测试无需认证,不影响使用。 5. 完成上述步骤后,开始复制粘贴操作: 点击配置>到微信客服的企业信息,复制企业 ID >到 coze 页面进行粘贴填写企业 ID,并点击下一步。 到微信客服的开发配置,找到回调配置,复制 Token、EncodingAESKey(如果为空,点击“随机获取”),到 coze 页面进行粘贴,点击下一步。 到微信客服的开发配置,配置回调地址 URL、复制 Secret 到 coze 的页面粘贴。 6. 第一次设置回调地址时,需注意目前需要企业认证才可以接入微信客服。若企业未认证,在配置回调 URL 时会报错:回调域名校验失败。之前未认证就发布过微信客服的不受影响。第一次设置成功后,后续修改在相应页面进行。 7. 到微信客服的客服账号,创建一个客服账号,复制客服账号名称,到 coze 的页面粘贴,点击保存。 8. 保存后,在 coze 发布页面的发布平台的微信客服这里,显示“已配置”,剩下的就是勾选,点击发布。
2024-12-09
国内现在有哪些集成了多个种类AI的平台
国内集成了多个种类 AI 的平台有: 1. 腾讯元宝:相对较晚推出,但凭借独特优势在市场上站稳脚跟。其最大亮点是强大的 AI 搜索功能,能访问大量微信生态系统内的私域资源,包括微信公众号的内容和腾讯内部、互联网上的其他优秀资源。还依托腾讯“混元”大语言模型生成高质量内容,是 GPT Search 的良好替代选择,尤其适合需要访问中文内容和微信生态系统信息的用户。 2. 目前有创业公司在模仿国外的模型市场模式,如 HuggingFace,但尚未有接近的成果。 此外,在健身领域有以下 AI 产品: 1. Keep:中国最大的健身平台,提供全面的健身解决方案。 2. Fiture:集硬件、丰富课程内容、明星教练和社区于一体。 3. Fitness AI:利用人工智能进行锻炼,增强力量和速度。 4. Planfit:健身房家庭训练与 AI 健身计划,AI 教练使用 800 多万条文本数据和 ChatGPT 实时提供指导。
2024-09-14
生成海报推荐的工具,能将指定的文案集成到海报中
以下是为您推荐的能将指定文案集成到海报中的工具及大致流程: 工具: 1. Canva(可画):https://www.canva.cn/ 是一个受欢迎的在线设计工具,提供大量模板和设计元素,AI 功能可协助选择颜色搭配和字体样式。 2. 稿定设计:https://www.gaoding.com/ 稿定智能设计工具采用先进人工智能技术,自动分析生成设计方案,稍作调整即可完成设计。 3. VistaCreate:https://create.vista.com/ 简单易用的设计平台,提供大量设计模板和元素,可使用 AI 工具创建个性化海报,智能建议功能可帮助找到合适设计元素。 4. Microsoft Designer:https://designer.microsoft.com/ 通过简单拖放界面可快速创建演示文稿、社交媒体帖子等视觉内容,集成丰富模板库和自动图像编辑功能。 大致流程: 1. 确定海报主题,借助 ChatGPT 等文本类 AI 工具完成文案。 2. 选择想要的风格意向,根据文案和风格灵活调整画面布局,背景不一定空白。 3. 使用无界 AI,输入关键词,生成并挑选满意的海报底图。 4. 将上述素材进行合理排版,得到成品。排版可参考 AIGC 海报成果。
2024-09-13
移动设备下,可集成到 iOS/anrdroid 的 app 中 的 tts 框架有哪些?
目前常见的可集成到 iOS 和 Android 移动设备 App 中的 TTS(TexttoSpeech,文本转语音)框架有以下几种: 1. Google TexttoSpeech:在 Android 平台上较为常用,提供了多种语言和声音选择。 2. Apple 的 Speech Synthesis:专为 iOS 开发,具有高质量的语音合成效果。 3. Microsoft Azure Cognitive Services Speech:支持多种平台,包括 iOS 和 Android,提供丰富的语音选项和功能。 但具体选择哪种框架,还需要根据您的应用需求、开发技术栈以及预算等因素来综合考虑。
2024-08-23
使用chatgpt还是集成式插件sider
ChatGPT 和集成式插件 sider 各有特点和优势。 对于 ChatGPT: 有历史老师用 GPT 给学生讲课的案例,但需注意其模拟历史的内容可能存在错误和幻觉。 插件可以解决与大型语言模型相关的多种挑战,如“幻觉”、跟上最新事件以及访问专有信息源。 目前已有 Expedia、FiscalNote、Instacart 等公司创建了各种插件,提供行程规划、数据集访问、语言学习等功能。 关于集成式插件 sider 的相关信息,上述知识库中未提及。 如果您能更明确地说明您的使用场景和需求,将有助于更准确地为您比较二者的适用性。
2024-08-16
logo生成有那些工具
以下是一些生成 logo 的工具: 1. Looka:在线 Logo 设计平台,使用 AI 理解用户品牌信息和设计偏好,生成多个设计方案供选择和定制。 2. Tailor Brands:AI 驱动的品牌创建工具,通过用户回答问题生成 Logo 选项。 3. Designhill:其 Logo 制作器使用 AI 技术创建个性化设计,用户可选择元素和风格。 4. LogoMakr:提供简单易用的 Logo 设计工具,用户可拖放设计,利用 AI 建议的元素和颜色方案。 5. Canva:广受欢迎的在线设计工具,提供 Logo 设计模板和元素,有 AI 辅助设计建议。 6. LogoAI by Tailor Brands:Tailor Brands 推出的 AI Logo 设计工具,根据用户输入快速生成方案。 7. 标小智:中文 AI Logo 设计工具,利用人工智能技术帮助创建个性化 Logo。 此外,还有以下工具: 1. ideogram:海外生图平台,对英文字母生成友好,输入支持中文。使用时可在首页信息流中找到中意款式,点进去 retry 并替换提示词中字母部分,支持主流图片比例和风格选择。 2. liblib 及 esheep 在线工作流:包括极简 Logo、毛绒风格 Logo、夏日冰冰凉风格 Logo 等。 3. LogoGPT:帮助用户从草图设计个性化标志,用户上传草图并选择风格和是否包含名称,生成符合要求的设计。
2025-01-02
我是景观设计设计师,不了解市场上的各种AI工具,请问我需要怎么系统的学习、利用AI来改进工作呢
作为景观设计师,系统学习和利用 AI 改进工作可以从以下几个方面入手: 一、了解相关 AI 工具 1. 用于绘制 CAD 图的 AI 工具 CADtools 12:Adobe Illustrator 插件,添加 92 个绘图和编辑工具。 Autodesk Fusion 360:集成 AI 功能的云端 3D CAD/CAM 软件。 nTopology:基于 AI 可创建复杂 CAD 模型。 ParaMatters CogniCAD:根据输入自动生成 3D 模型。 主流 CAD 软件的生成设计工具:根据设计目标和约束条件自动产生方案。 2. 审核规划平面图的 AI 工具 HDAidMaster:云端工具,在建筑、室内和景观设计领域表现出色。 Maket.ai:面向住宅行业,能自动生成户型图。 ARCHITEChTURES:AI 驱动的三维建筑设计软件。 Fast AI 人工智能审图平台:全自动智能审图流程,集成建筑全寿命周期信息。 二、提升自身能力 1. 设计专业方面 培养持续学习习惯,将其转化为实践能力。 提高需求理解、问题分析、审美判断和创意能力。 显性化设计思考与专业优势,提升设计质量。 2. 工具能力方面 严格评估和选型现有 AI 工具,确保标准化输出和一致性体验。 基于业务场景训练专属 AI 模型,集成 AI 能力形成新工具。 建设参数文档库,减少个人喜好的自然语言影响。 3. 工作流程方面 将 AI 融入日常设计流程,形成新的工作方式。 针对不同业务形态和需求,精细化设计流程。 探索合理的人&机结合方式,优化效率和创意品质。 4. 团队协作方面 制定并执行明确的 AI 融合策略。 保证硬件设备支持,营造创新环境。 增强对市场动态的适应能力,明确团队未来发力方向。 总之,随着技术进步,AI 在设计领域的作用将愈发重要,为您创造更多可能。但需注意,每个工具都有特定应用场景和功能,建议根据具体需求选择合适的工具。
2025-01-02
无人直播工具
以下是为您提供的关于无人直播工具的相关信息: Notebook LM 工具: 分享者:严三在读学生金僖康,是 open academic 发起人。 内容:主要分四部分,包括工具介绍、操作流程、反思收获以及类似工具对比,还做了简单自我介绍及自身学习和工作经历。 简介:2023 年 7 月已存在且改过名,背后模型支持最长 200 万 token,覆盖多国家地区(不含中国大陆),支持多种文件格式、具有播客功能等。 来源:金僖康分享了知晓该工具的途径。 使用体验:金僖康分享了自己的使用体验和最初的疑惑。 免费试用:Google Labs 旗下的 Notebook LM 工具提供免费试用。 操作演示:有相关的操作演示。 关于音乐制作方面的工具: Audition:在音频处理阶段大部分使用。 Studio One:由 PreSonus 公司开发的专业 DAW 软件,功能全面,适合编曲、录音、混音和母带处理等音乐制作流程,在本文中用于编曲、混音、母带处理等环节。 Waves XNoise:由 Waves 公司出品的降噪 VST 插件,用于降低音频中的噪声,操作简单,易于使用,在本文中用于处理一些高频背景噪音。 iZotope RX 11:专业的音频修复和降噪软件,功能强大,具备多种音频修复和编辑工具,在本文中用于处理高频杂音,检查音频质量等。 iZotope Ozone 11:专业的母带处理软件,提供全面的母带处理工具,在本文中用于最后出品前的母带处理。
2025-01-02
文本分析工具
以下是为您提供的关于文本分析工具的相关信息: 1. Claude2 中文精读: 可以处理多种类型的文本,如文章、电子邮件、会议记录等,并能消化、解释和回答相关问题,具有 10 万标记上下文窗口,能分析大量单词。 基本应用包括评估文本相似度和回答有关文本的问题。 评估文本相似度时,可通过特定提示让 Claude 判断两段文本含义是否相同。 回答有关文本的问题时,可提供会议记录并提问,让 Claude 基于记录回答。 2. LayerStyle 副本中的 TextImage: 从文字生成图片以及遮罩,支持字间距、行间距调整,横排竖排调整,可设置文字的随机变化,包括大小和位置的随机变化。 节点选项包括 size_as(输入图像或遮罩决定尺寸)、font_file(选择字体文件)、spacing(字间距)、leading(行间距)、horizontal_border(侧边边距)、vertical_border(顶部边距)、scale(文字总体大小)、variation_range(字符随机变化范围)、variation_seed(随机变化的种子)、layout(文字排版)、width(画面宽度)、height(画面高度)、text_color(文字颜色)、background_color(背景颜色)。 3. GPTs 教程及案例拆解中的精选 Top 流量 GPTs: 包括 Flow Speed Typist(文本,重写混乱内容)、AnalyzePaper(研究,分析论文)、GPT Detector(文本、效率工具,识别 AI 生成文本)、Math Solver(教育,数学求解)、editGPT(文本,校对编辑)、You Tube Summarizer(效率工具、视频,获取 YouTube 视频摘要)等,提供了分类、简介、直达链接等信息。
2025-01-01
跟股票相关的AI工具有哪些?
以下是一些与股票相关的 AI 工具: 1. 东方财富网投资分析工具:利用 AI 技术分析金融市场数据,为投资者提供投资建议和决策支持,例如根据股票的历史走势和市场趋势预测股票的未来走势。 2. 目前市场上还有一些通用的 AI 工具,如 ChatGPT 等,虽然不是专门针对股票,但可以辅助进行相关的信息收集和分析。 需要注意的是,使用这些工具时应结合自身的判断和专业知识,谨慎做出投资决策。
2025-01-01
直方图是用什么工具生成的
生成直方图的工具多种多样,以下为您列举部分常见工具: 1. Excel:在数据分析和图表制作方面广泛应用,可通过数据选择和图表功能生成直方图。 2. Python:利用相关的数据处理和绘图库,如 matplotlib、seaborn 等,通过编程实现直方图的生成。 3. R 语言:拥有丰富的绘图函数和包,可用于生成直方图。 4. MATLAB:常用于科学计算和数据可视化,能方便地创建直方图。 需要注意的是,选择工具应根据您的具体需求和使用习惯来决定。
2025-01-01