Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

利用大模型构建系统的工具

Answer

以下是关于利用大模型构建系统的工具的相关内容:

大模型的发展历程

  • 2017 年发布的 Attention Is All You Need 论文是起源。
  • 2018 年,Google 提出 BERT,其创新性地采用双向预训练并行获取上下文语义信息和掩码语言建模,开创了预训练语言表示范式,参数规模为 110M 到 340M。
  • 2018 年,OpenAI 提出 GPT,开创了仅使用自回归语言建模作为预训练目标而无需额外监督信号,展示了强大的语言生成能力,参数规模达 1750 亿。
  • 2021 年,Meta 提出 Large LAnguage Model Approach(LLAMA),这是首个开源模型,为构建更大规模、更通用的语言模型提供了系统化的方法与工具,参数规模为十亿到千亿。

Inhai:Agentic Workflow:AI 重塑了我的工作流

  • 以 Kimi Chat 为例,它利用「网页搜索」工具在互联网上检索相关内容,并基于检索结果进行总结分析,给出结论。同时,PPT 中介绍了众多不同领域类型的工具,为大模型在获取、处理、呈现信息上做额外补充。
  • Planning:Agent 通过自行规划任务执行的工作流路径,面向简单或线性流程的运行。例如,先识别男孩姿势,再使用相关模型合成女孩图像,接着使用图像理解文本模型,最后语音合成输出。
  • Multiagent Collaboration:吴恩达通过开源项目 ChatDev 举例,可让大语言模型扮演不同角色相互协作,共同开发应用或复杂程序。
  • AI Agent 基本框架:OpenAI 的研究主管 Lilian Weng 提出“Agent=LLM+规划+记忆+工具使用”的基础架构,其中大模型 LLM 扮演 Agent 的“大脑”。规划包括子目标分解、反思与改进,将大型任务分解为较小可管理的子目标处理复杂的任务,反思和改进指对过去行动进行自我批评和自我反思,从错误中学习并改进未来步骤,提高最终结果质量。记忆用于存储信息。

开发:LangChain 应用开发指南 - 大模型的知识外挂 RAG: LangChain 是专注于大模型应用开发的平台,提供一系列组件和工具构建 RAG 应用:

  • 数据加载器:从数据源加载数据并转换为文档对象,包含 page_content 和 metadata 属性。
  • 文本分割器:将文档对象分割成多个较小的文档对象,方便后续检索和生成。
  • 文本嵌入器:将文本转换为嵌入,用于衡量文本相似度实现检索。
  • 向量存储器:存储和查询嵌入,通常使用索引技术加速检索。
  • 检索器:根据文本查询返回相关文档对象,常见实现是向量存储器检索器。
  • 聊天模型:基于大模型生成输出消息。 使用 LangChain 构建 RAG 应用的一般流程如下:(具体流程未给出)
Content generated by AI large model, please carefully verify (powered by aily)

References

大模型入门指南

这一切的起源是2017年发布的Attention Is All You Need([4])论文,之后基于大量语料的预训练模型百花齐放,比如:BERT(Bidirectional Encoder Representations from Transformers):Google在2018年提出,创新性的双向预训练并行获取上下文语义信息,以及掩码语言建模(MLM)让模型更好地推断语义信息。它开创了预训练语言表示范式,对自然语言处理产生了深远影响。参数规模:110M到340MGPT(Generative Pre-trained Transformer):OpenAI在2018年提出,开创了仅使用自回归语言建模作为预训练目标而无需额外监督信号。它展示了通过无监督大规模预训练获得的语言生成能力,对研究与应用都带来重大影响。参数规模:1750亿Large LAnguage Model Approach(LLAMA):Meta在2021年提出,首个开源模型。为构建更大规模、更通用的语言模型提供了系统化的方法与工具。参数规模:十亿到千亿

Inhai: Agentic Workflow:AI 重塑了我的工作流

如果大家使用Kimi Chat来查询某个问题,你会发现它会在互联网上检索相关内容,并基于检索结果进行总结分析,最后给出结论。这其实是大模型利用「网页搜索」工具的一个典型例子,同时你也会看到PPT中介绍了非常多的不同领域类型的工具,它其实是为大模型在获取、处理、呈现信息上做额外的补充。PlanningAgent通过自行规划任务执行的工作流路径,面向于简单的或者一些线性流程的运行。比如下图中:Agent会先识别男孩的姿势,并可能找到一个姿势提取模型来识别姿势,在接下来要找到一个姿势图像模型来合成一个新的女孩图像,然后再使用图像理解文本的模型,并在最后使用语音合成输出,完成这个流程任务。Multiagent Collaboration吴恩达通过开源项目ChatDev进行举例,你可以让一个大语言模型扮演不同的角色,比如让一个Agent扮演公司CEO、产品经理、设计师、代码工程师或测试人员,这些Agent会相互协作,根据需求共同开发一个应用或者复杂程序。AI Agent基本框架OpenAI的研究主管Lilian Weng曾经写过一篇博客叫做《LLM Powered Autonomous Agents》,其中就很好的介绍了Agent的设计框架,她提出了“Agent=LLM+规划+记忆+工具使用”的基础架构,其中大模型LLM扮演了Agent的“大脑”。Planning(规划)主要包括子目标分解、反思与改进。将大型任务分解为较小可管理的子目标处理复杂的任务。而反思和改进指可以对过去的行动进行自我批评和自我反思,从错误中学习并改进未来的步骤,从而提高最终结果的质量。Memory(记忆)

开发:LangChain应用开发指南-大模型的知识外挂RAG

LangChain是一个专注于大模型应用开发的平台,它提供了一系列的组件和工具,帮助你轻松地构建RAG应用。LangChain提供了以下的组件来帮助你构建RAG应用:数据加载器(DocumentLoader):数据加载器是一个对象,可以从一个数据源加载数据,并将其转换为文档(Document)对象。一个文档对象包含两个属性:page_content(str)和metadata(dict)。page_content是文档的文本内容,metadata是文档的元数据,例如标题、作者、日期等。文本分割器(DocumentSplitter):文本分割器是一个对象,可以将一个文档对象分割成多个较小的文档对象。这样做的目的是为了方便后续的检索和生成,因为大模型的输入窗口是有限的,而且在较短的文本中更容易找到相关的信息。文本嵌入器(Embeddings):文本嵌入器是一个对象,可以将文本转换为嵌入(Embedding),即一个高维的向量。文本嵌入可以用来衡量文本之间的相似度,从而实现检索的功能。向量存储器(VectorStore):向量存储器是一个对象,可以存储和查询嵌入。向量存储器通常使用一些索引技术,例如Faiss或Annoy,来加速嵌入的检索。检索器(Retriever):检索器是一个对象,可以根据一个文本查询返回相关的文档对象。检索器的一种常见实现是向量存储器检索器(VectorStoreRetriever),它使用向量存储器的相似度搜索功能来实现检索。聊天模型(ChatModel):聊天模型是一个对象,可以根据一个输入序列生成一个输出消息。聊天模型通常基于大模型,例如GPT-3,来实现文本生成的功能。使用LangChain构建RAG应用的一般流程如下:

Others are asking
构建项目 ,如何通过ai生成可视化数据报表,设计方案
以下是一个通过 AI 生成可视化数据报表的设计方案: 1. 理解需求:明确查询要求,例如适应特定尺寸(如宽 1734px、高 1071px)的 TSX 代码,确保生成的组件符合尺寸要求,避免出现滚动条。 2. 生成静态代码:创建一个静态的 React 组件,将所有数据和组件进行硬编码。 3. 实现数据可视化:构建一个复杂的数据可视化平台,支持多种图表类型、实时数据更新、自定义仪表板和数据钻取功能。 4. 设计用户界面:为复杂的数据可视化平台编写 TSX 代码,界面包括多个图表、定制仪表板和实时数据更新,尺寸为宽 1734px 和高 1071px。 5. 定义 React 组件:定义一个用于渲染主界面的 React 组件,包括网格布局、图表组件、导航 UI 组件、按钮和输入字段等,并加入模拟实时更新和自定义仪表板的开关和切换等组件。 6. 规划 UI 结构:设计包含头部、侧边栏和主内容区的 UI 结构,主内容区展示多个图表,并考虑自定义控制。 7. 探索图标资源:从 'lucidereact' 提取图标,如主页、用户和搜索等,使界面更加直观和易用。
2025-02-27
行业大模型构建
以下是关于行业大模型构建的相关信息: 优秀模型案例介绍: SuperCLUE2.0 是通用大模型综合性测评基准 SuperCLUE1.0 的能力延展,融合行业场景属性和大模型落地特点,为行业应用及开发者构建评估框架,促进大模型供需两侧的进一步对齐。 SuperCLUE 持续构建行业测评基准,包括已发布的汽车行业测评基准,以及筹备中的金融、教育、娱乐、手机、政务、医疗等行业测评基准。 SuperCLUE 持续构建专项测评基准,已发布的有 Safety 安全测评基准、Agent 智能体测评基准,筹备中的有个性化中文测评基准、角色扮演测评基准、中文多模态测评基准、RAG 检索增强测评基准、办公场景测评基准等。 优化路径: 广义上的大模型优化包括完整训练一个大模型,但从策略上建议先从提示词工程到微调开始,因为涉及大模型训练成本极高。在分析出问题所在后,可按需选用或综合运用缺失知识用 RAG、准确度或模式遵循度不足用微调等技术进行性能优化。 国内大模型落地情况: Gartner 预测到 2028 年至少有 15%的日常工作决策将由代理型 AI(AI 智能体)自主做出。 2024 年被称为国内大模型落地元年,“百模大战”后,国内大模型行业主要玩家包括百度、阿里、字节等科技大厂和创业“AI 六小虎”。 2024 年 1 至 11 月,国内大模型中标项目数量和金额大幅增长,中标项目共 728 个,是 2023 年全年的 3.6 倍;中标金额 17.1 亿元,是 2023 年全年的 2.6 倍。中标项目数前五的行业分别是运营商、能源、教育、政务、金融。 厂商方面,百度以 40 个中标项目数、2.74 亿元的中标金额排名所有厂商之首,科大讯飞居第二。在金融行业,百度也以 14 个中标数量、3734.4 万元中标金额排名第一,科大讯飞居第二。
2025-02-27
如何用AI构建政务模型
以下是关于如何用 AI 构建政务模型的相关信息: 行业、学术界、研究组织和全球合作伙伴正在寻找解决基础模型监管相关挑战的方法。例如,基础模型的开发者正在探索将对齐理论嵌入模型的方式,政府需要与 AI 研究社区密切合作,利用研究见解并完善监管框架。 英国致力于提升在基础模型方面的能力。基础模型是一种新兴的通用 AI 类型,训练数据量大,能适应多种任务,其快速发展给政府监管带来新挑战。 需建立一个中央职能,支持单个监管机构的视野扫描活动,以实现可适应、协作和值得信赖的监管机制。该职能有助于建立一个能适应新兴趋势、召集合作伙伴共同识别趋势,并确保监管框架能应对新兴趋势的监管制度。 要确保与国际监管框架的互操作性,包括监测英国原则与国际监管方法、保证和/或风险管理以及技术标准之间的一致性,支持跨境协调与合作。此职能对于实现促进创新的监管制度至关重要,能确保英国创新者可进行国际交易,英国公司能吸引海外投资。
2025-02-27
知识图谱构建
知识图谱是一种揭示实体之间关系的语义网络,能够对现实世界的事物及其相互关系进行形式化描述。它于 2012 年 5 月 17 日由 Google 正式提出,初衷是提高搜索引擎能力,增强用户搜索质量和体验,实现从网页链接到概念链接的转变,支持按主题检索和语义检索。 知识图谱构建的关键技术包括: 1. 知识抽取:通过自动化技术抽取可用的知识单元,如实体抽取(命名实体识别)、关系抽取(提取实体间关联关系)、属性抽取(采集特定实体的属性信息)。 2. 知识表示:包括属性图、三元组等。 3. 知识融合:在同一框架规范下进行异构数据整合、消歧、加工、推理验证、更新等,包括实体对齐(消除实体冲突等不一致性问题)、知识加工(统一管理知识)、本体构建(明确定义概念联系)、质量评估(计算知识置信度)、知识更新(迭代扩展知识)。 4. 知识推理:在已有知识库基础上挖掘隐含知识。 在 LLM 落地思考方面,NLP 与知识图谱是主要的落地类型,但存在一些问题。如实现某个 NLP 任务时,需要大量人工标注和长时间训练,交付后较难新增意图和泛化任务,有时使用句式规则方式更好维护更新;构建知识图谱复杂,需与行业专家深度讨论,预见企业长远业务发展制定 schema,周期长且易与业务错位。而 LLM 出现后对 NLP、NLG、KG 有较大提升,带来更好更多的落地可能。 在以问题驱动的 AI+内容创作中,随着学习深入,可使用大模型帮助构建和扩展知识图谱。
2025-02-27
Agent如何构建
以下是一些常见的 Agent 构建平台: 1. Coze:新一代一站式 AI Bot 开发平台,适用于构建基于 AI 模型的各类问答 Bot,集成丰富插件工具,能拓展 Bot 能力边界。 2. Microsoft 的 Copilot Studio:主要功能包括外挂数据、定义流程、调用 API 和操作,以及将 Copilot 部署到各种渠道。 3. 文心智能体:百度推出的基于文心大模型的智能体平台,支持开发者根据需求打造产品能力。 4. MindOS 的 Agent 平台:允许用户定义 Agent 的个性、动机、知识,以及访问第三方数据和服务或执行工作流。 5. 斑头雁:2B 基于企业知识库构建专属 AI Agent 的平台,适用于客服、营销、销售等场景,提供多种成熟模板,功能强大且开箱即用。 6. 钉钉 AI 超级助理:依托钉钉强大的场景和数据优势,提供更深入的环境感知和记忆功能,在处理高频工作场景如销售、客服、行程安排等方面表现出色。 搭建工作流驱动的 Agent 通常可分为以下 3 个步骤: 1. 规划: 制定任务的关键方法。 总结任务目标与执行形式。 将任务分解为可管理的子任务,确立逻辑顺序和依赖关系。 设计每个子任务的执行方法。 2. 实施: 在 Coze 上搭建工作流框架,设定每个节点的逻辑关系。 详细配置子任务节点,并验证每个子任务的可用性。 3. 完善: 整体试运行 Agent,识别功能和性能的卡点。 通过反复测试和迭代,优化至达到预期水平。
2025-02-25
如何构建一个算命的智能体
构建一个智能体通常包括以下步骤: 1. 输入人设等信息:创建智能体时,需要明确其设定和相关信息。 2. 配置工作流:放上创建的工作流,并进行相应配置。 3. 工具使用:工具使用或函数调用是从 RAG 到主动行为的第一步,如网页浏览、代码解释和授权认证等工具已出现,使 LLMs 能够与外部交互和执行操作。 4. 确定智能体结构:按照业务逻辑组织智能体结构,例如在品牌卖点提炼中,要确定以品牌卖点提炼六步法为核心的流程,并加入相关分析助手。 5. 搭建完整智能体:包括品牌卖点定义与分类助手、品牌卖点提炼六步法、STP 市场分析助手、用户画像分析助手、触点收集助手等,同时还可能涉及 KANO 助手、营销六层转化漏斗分析、超级转化率六要素等未在结构中体现但有效的分析工具。 需要注意的是,构建智能体时,对于工作流中涉及个人 token 的部分,不能直接发布,可将其作为输入由用户自行购买和输入后再发布。
2025-02-24
deepseek 的提示词应该怎么写?和以往的大语言模型的提示词有什么不同?
DeepSeek 的提示词具有以下特点: 1. 语气上还原帝王语气,不过分用力,使用相对古典但兼顾可读性的文字,避免傻气的表达。 2. 对历史细节熟悉,这可能与支持“深度探索”和“联网搜索”同时开启有关,能准确还原如“太极宫”“甘露殿”“掖庭局”“观音婢”“宫门鱼符”等唐初的历史称谓。 3. 输出极其具体且充满惊人细节,行文的隐喻拿捏到位,如“狼毫蘸墨时发现指尖残留着未洗净的血痂”“史官们此刻定在掖庭局争吵。该用‘诛’还是‘戮’,‘迫’还是‘承’。‘只是这次,他不敢触碰我甲胄上元吉的掌印’”等句子,虽未直接写“愧疚与野心,挣扎与抱负”,但句句体现。 与以往大语言模型的提示词的不同在于:以往模型可能在语气、历史细节和具体细节的处理上不如 DeepSeek 出色。
2025-02-28
AI大模型本地化部署的逻辑是什么?输入的数据不会外泄吗?
AI 大模型本地化部署的逻辑主要包括以下步骤: 1. 选择合适的部署方式,如本地环境部署、云计算平台部署、分布式部署、模型压缩和量化、公共云服务商部署等,要根据自身的资源、安全和性能需求来决定。 2. 准备训练所需的数据和计算资源,确保有足够的训练数据覆盖目标应用场景,并准备足够的计算资源,如 GPU 服务器或云计算资源。 3. 选择合适的预训练模型作为基础,可以使用开源的预训练模型如 BERT、GPT 等,也可以自行训练一个基础模型。 4. 针对目标任务进行模型微调训练,根据具体应用场景对预训练模型进行微调训练,并优化模型结构和训练过程以提高性能。 5. 部署和调试模型,将训练好的模型部署到生产环境,并对部署的模型进行在线调试和性能优化。 6. 注意安全性和隐私保护,大模型涉及大量数据和隐私信息,需要重视安全性和合规性。 关于输入数据是否会外泄,这取决于本地化部署的安全性措施和配置。如果采取了严格的安全措施,如数据加密、访问控制、网络隔离等,输入的数据外泄的风险可以大大降低。但如果安全措施不到位,就存在数据外泄的可能。例如,赞成把一个训练好就不动的模型部署在端侧(如手机或家庭计算中心),记录所有知识和记忆的相关数据就不会跑到云端,能更好地保障数据安全。
2025-02-28
大模型研究 报告
以下是为您提供的关于大模型研究的相关信息: 1. 1 月 25 日的 XiaoHu.AI 日报中提到: 有 26 种多模态大模型研究报告,全面分析了市面上的 26 种多模态大语言模型,涵盖模型架构、训练流程设计,每种模型具有独特设计和功能。相关链接:https://arxiv.org/abs/2401.13601 、https://x.com/xiaohuggg/status/1750400886676070495?s=20 研究了使用红外线激光攻击自动驾驶车辆,针对摄像头系统尤其是识别道路标志的部分,攻击成功率高达 100%。相关链接:https://x.com/xiaohuggg/status/1750391646121017610?s=20 ChatGPT 新增小功能,包括自动展开代码输出、批量移动对话历史记录到存档,设置路径为设置>General。相关链接:https://x.com/xiaohuggg/status/1750367771446345834?s=20 哈佛大学 CS50x 2024 课程是计算机科学和编程入门课程,面向各类学生,重点包括问题解决、计算思维、编程语言等,讲师为 David J.Malan,可通过 edX 平台注册和完成课程。相关链接:https://cs50.harvard.edu/x/2024/ 、https://x.com/xiaohuggg/status/1750331575081026039?s=20 Poe 聊天机器人推广活动,创建并分享聊天机器人,每带来一个订阅者奖励 50 美金。相关链接:https://x.com/xiaohuggg/status/1750173470946988230?s=20 Lumiere 视频生成技术是 Google Research 开发的文本到视频模型,具有创新的空间时间 UNet 架构,能一次性生成完整视频,确保连贯和逼真,支持多种视频生成和编辑功能。相关链接:https://lumierevideo.github.io 、https://x.com/xiaohuggg/status/175014 2. 《质朴发言:视觉语言理解模型的当前技术边界与未来应用想象|Z 研究第 2 期》中指出: 近期生成式 AI 领域的浪潮催化了多模态模型的探索,研究人员不断尝试使用更多模态数据的编码,以训练出能够理解和处理多种类型数据的模型。 本份研究报告集中讨论了基于 Transformer 架构的视觉语言模型,优化了从视觉输入到语言输出的转换过程。报告范围专注于视觉和语言之间的交互,不考虑单纯的视觉到视觉的计算机视觉任务。 报告包括视觉分析技术(Transformer 视觉模型优点和局限)、图像语言模型、视频语言模型、LLM 多模态 Agent、应用场景(多模态内容理解与处理、智能交互与自动化、具身智能、未来发展趋势(2024?)、视频生成模型 mapping)、未来发展方向(技术路径而言:利用预训练 LLMs 进行指令调整;应用场景而言:赋予机器理解多模态的能力)、References、附录等内容。原文链接:https://mp.weixin.qq.com/s/dYLqW8dNOcQw59UtQwXNgA
2025-02-28
aI 智能体和大模型的区别是什么
AI 智能体和大模型的区别主要体现在以下几个方面: 1. 概念和定位:智能体简单理解就是 AI 机器人小助手,参照移动互联网,类似 APP 应用的概念。大模型是一种技术。 2. 服务对象:大模型是技术,面向用户提供服务的是基于大模型的产品,如智能体。 3. 功能特点:大模型具有强大的语言理解和生成能力,但存在局限性,如无法回答私有领域问题、无法及时获取最新信息、无法准确回答专业问题等。智能体通过集成特定的外部能力,能够弥补大模型的不足,例如实时信息获取、回答私有领域问题等。 4. 应用场景:智能体在 C 端有社交方向,用户注册后捏自己的 Agent 并让其与他人的 Agent 聊天;在 B 端可以帮助商家搭建 Agent。大模型适用于通用的语言处理任务。 5. 开发方式:有专门的智能体开发平台,如字节扣子、腾讯元器等。
2025-02-28
扣子和大模型的区别是什么
扣子是一个 AI 聊天机器人构建平台,如字节推出的 Coze 的国内版“扣子”,主要用于开发下一代 AI 聊天机器人。它具有强大的知识库功能,能帮助上传和存储知识内容,并提供多种查找知识的方法,解决大模型可能出现的幻觉或某些专业领域知识不足的问题。 而 AI 大模型是一种技术,面向用户提供服务的是基于大模型开发的产品。例如,智能体可以被视为基于大模型开发的应用。 在实际应用中,扣子这样的平台能让开发者更便捷地构建和优化智能体,以满足不同场景和用户的需求。
2025-02-28
本地部署的AI模型如何制作智能体
以下是关于本地部署的 AI 模型制作智能体的相关信息: 阿里云百炼满血版 DeepSeek: 1. 开通满血版 R1 模型:在模型广场找到 DeepSeekR1 并进行授权。每个人会免费获得 100 万额度,过期未用则浪费。此模型由阿里云自主部署,并做了推理优化,性能强于多数本地部署版本。 2. 应用开发:新增模板,可从模板学习应用搭建。 3. 联网搜索:配置简单方便,结合 Deepseekr1 更强大,如搜索天气时会多方验证。 4. 新鲜的动态 few shot:可用于对模型某些表现不佳、易出幻觉的任务通过 prompt training 强行修正。 5. 工作流:用工作流让不同模型在同一任务创作。 行业变革中的智能体相关: Anthropic 的 Claude 3 拥有三个版本,最大规模的 Opus 适合复杂推理与自动化任务计划,其次的 Sonnet 适合个人助理及内容快速分析,如智能体任务,最快最便宜的 Haiku 可执行快速翻译、客服对话等任务。Meta、微软、Google、Apple 等均有可适配到移动终端上运行的开源模型。边缘算力竞争中,Apple、Google、高通等在终端占有量和芯片方面具有优势,PC 级别终端因智能集成复兴,未来可能有家用和办公用“智能体”终端诞生,Tesla EV 也在相关量级之上。 自制软件和赤脚开发者中的智能体相关: 大型语言模型可表现为智能体,能制定计划和决策以实现设定目标,可访问外部工具、数据库长期记忆等,并模仿逻辑思维模式。语言模型和智能体已部署到帮助专业开发人员的工具中,如 GitHub Copilot、Cursor 和 Replit,能读写代码、调试、创建文档和编写测试,使用此类工具可提高开发人员完成任务的速度。
2025-02-27
你是AI专家,如何更好地使用AI工具?
以下是关于如何更好地使用 AI 工具的一些建议: 理解工具: AI Agent 有效使用工具的前提是全面了解其应用场景和调用方法。利用 LLM 的 zeroshot learning 和 fewshot learning 能力,AI Agent 可以通过描述工具功能和参数的 zeroshot demonstration 或提供特定工具使用场景和相应方法演示的少量提示来获取工具知识。这与人类通过查阅工具手册或观察他人使用工具进行学习的方法类似。在面对复杂任务时,应先将其分解为子任务,然后有效地组织和协调,这依赖于 LLM 的推理和规划能力以及对工具的理解。 使用工具: AI Agent 学习使用工具的方法主要包括从 demonstration 中学习和从 reward 中学习(清华有一篇从训练数据中学习的文章)。这包括模仿人类专家的行为,了解其行为后果,并根据从环境和人类获得的反馈做出调整。环境反馈包括行动是否成功完成任务的结果反馈和捕捉行动引起的环境状态变化的中间反馈;人类反馈包括显性评价和隐性行为,如点击链接。 具身智能: 在追求人工通用智能(AGI)的过程中,具身 Agent 正成为核心的研究范式,强调将智能系统与物理世界紧密结合。其设计灵感来自人类智能的发展,认为智能更多地来自与周遭环境的持续互动和反馈。与传统的深度学习模型相比,LLMbased Agent 能够主动感知和理解所在的物理环境并与之互动,利用内部丰富的知识库进行决策并产生行动改变环境,这被称为“具身行动”。 此外,在生成 PPT 方面,市面上有多种受欢迎的 AI 工具,如 MindShow、爱设计、闪击、Process ON、WPS AI 等。每款工具都有独特优势,能帮助您快速、高效地完成 PPT 设计。
2025-02-28
找到全部前端质量相关的AI网站或工具
以下是一些与前端质量相关的 AI 网站或工具: 1. Wix ADI(Artificial Design Intelligence) 网址:https://www.wix.com/ 特点:基于用户提供的信息自动生成定制化网站,提供多个设计选项和布局,集成了 SEO 工具和分析功能。 2. Bookmark 网址:https://www.bookmark.com/ 特点:AIDA 通过询问用户几个简单问题快速生成网站,提供直观的拖放编辑器,包括多种行业模板和自动化营销工具。 3. Firedrop 网址:https://firedrop.ai/ 特点:Sacha 是其 AI 设计助手,可根据用户指示创建和修改网站设计,提供实时编辑和预览功能,包含多种现代设计风格和自定义选项。 4. The Grid 网址:https://thegrid.io/ 特点:Molly 是其 AI 设计助手,可自动调整网站设计和布局,基于内容和用户互动进行优化,支持多种内容类型。 5. Zyro 网址:https://zyro.com/ 特点:使用 AI 生成网站内容,包括文本、图像和布局建议,提供 AI 驱动的品牌和标志生成器,包含 SEO 和营销工具。 6. 10Web 网址:https://10web.io/ 特点:基于 AI 的 WordPress 网站构建工具,可自动生成网站布局和设计,提供一键迁移功能,集成 AI 驱动 SEO 分析和优化工具。 7. Jimdo Dolphin 网址:https://www.jimdo.com/ 特点:Dolphin 是 Jimdo 的 AI 网站构建器,通过询问用户问题定制网站,提供自动生成的内容和图像,包含电子商务功能。 8. Site123 网址:https://www.site123.com/ 特点:简单易用,适合初学者,提供多种设计模板和布局,包括内置的 SEO 和分析工具。
2025-02-28
我要做表格数据分析,哪个AI工具最好?
以下是一些适用于表格数据分析的 AI 工具: 1. Excel Labs:这是一个 Excel 插件,新增了生成式 AI 功能,基于 OpenAI 技术,可在 Excel 中利用 AI 进行数据分析和决策支持。 2. Microsoft 365 Copilot:微软推出的 AI 工具,整合了多种办公软件,通过聊天形式,用户告知需求后,Copilot 会自动完成任务,包括数据分析和格式创建等。 3. Formula Bot:提供数据分析聊天机器人和公式生成器两大功能,用户可通过自然语言交互式地进行数据分析和生成 Excel 公式。 4. Numerous:支持 Excel 和 Google Sheets 的 AI 插件,除公式生成外,还能根据提示生成相关文本内容、执行情感分析、语言翻译等任务。 此外,还有一些专门的数据分析工具,如: 1. Kalodata:专注于数据分析。网址:kalodata.com 2. Text2SQL:将英文转换为 SQL 查询。链接:https://toolske.com/text2sql/?ref=theresanaiforthat 3. ai2sql:高效且无错误的 SQL 构建器。链接:https://www.ai2sql.io/ 4. EverSQL:从 SQL 查询翻译英文文本。链接:https://www.eversql.com/sqltotext/ 5. SupaSQL:从 NLP 生成 SQL 查询。链接:https://supasql.com/ 6. SQLgenius:使用自然语言的 SQL 查询生成器。链接:https://sqlgenius.app/ 7. SQL Chat:与数据库进行自然语言聊天的 SQL 客户端。链接:https://www.sqlchat.ai/ 8. SQL Ease:从自然语言输入生成 SQL 查询。链接:https://sqlease.buildnship.in/ 9. Talktotables:翻译和查询数据库。链接:https://talktotables.com/ 随着技术的不断发展,未来可能会有更多更好的工具出现,您可以根据自己的需求和使用习惯进行选择。请注意,内容由 AI 大模型生成,请仔细甄别。
2025-02-28
一共收录了多少ai工具
以下是为您整理的一些 AI 工具: 1. 创作方面: AI 研究工具:Claude、ChatGPT、Bing Chat、Perplexity 图片处理:DallE、Leonardo、BlueWillow、Midjourney 版权写作:Rytr、Copy AI、Wordtune、Writesonic 设计:Canva、Clipdrop、Designify、Microsoft Designer 网站搭建:10Web、Framer、Hostinger、Landingsite 视频处理:Klap、Opus、Invideo、Heygen 音频处理:Murf、LovoAI、Resemble、Eleven Labs SEO 优化:Alli AI、BlogSEO、Seona AI、Clearscope Logo 设计:Looka、LogoAI、Brandmark、Logomaster 聊天机器人:Droxy、Chatbase、Voiceflow、Chatsimple 自动化工具:Make、Zapier、Bardeen、Postman 市场营销 2. GitHubDaily 开源项目列表中的 AI 工具: :一个可以让您同时与多个 AI 机器人实时聊天的开源工具,支持 ChatGPT、Bing Chat、bard、Alpaca、Vincuna、Claude、ChatGLM、MOSS、iFlytek Spark、ERNIE 等主流 AI 聊天机器人。 :整理了一些 ChatGPT 以及 AI 相关的生产力工具。 :该工具直接在命令行中集成了 ChatGPT,通过它,可以帮助您快速编写 shell 命令、代码片段编写、Git 提交信息、文档、注释等内容。 :集成了飞书+GPT3.5+Dall·E+Whisper 等 API,支持语音对话、角色扮演、多话题讨论、图片创作、表格分析、文档导出等功能。 :它可以提取 PDF 文件中的内容,并将内容交给 ChatGPT 进行分析。待解析完成之后,您便可以跟它进行一对一对话交流,就好像它是一个完全理解内容的人一样。 :一款基于 AI 驱动的、跨时代代码编辑器,将为开发者带来前所未有的编程体验。 :一个可以让您快速尝试各种 ChatGPT 应用的开源项目,借助这个项目,您还能在几秒钟内创建属于自己的应用。 3. 电商方面: 电商 AI 工具库基础版(作者:清酒):收集了十几款电商领域能用得上的 AI 工具,结合场景特别直观;按照电商的角色进行了区分,无论您是买家、卖家、渠道还是生产者,都能找到合适的 AI 工具;不仅有产品形态,还有非常具体的使用描述。
2025-02-28
有没有关于金融交易的ai工具
以下是一些关于金融交易的 AI 工具: 1. Composer(免费可用):可以用 AI 构建、回测和执行交易算法,在无代码拖放编辑器中进行定制,无需编码技能。 2. 摩根大通公司的人工智能驱动模型:旨在破译央行的信息传递并发现潜在的交易信号。 3. Stripe Agent Toolkit:让 AI 代理具备自动支付等财务能力,支持嵌入支付和财务服务功能,AI 可以实现自动购物、订票、开票等金融交易。
2025-02-28
我想找一款网页视频字幕提取的ia工具
以下为您推荐几款网页视频字幕提取的工具: 1. Reccloud:免费的在线 AI 字幕生成工具,可直接上传视频进行精准识别,能对识别的字幕进行翻译,自动生成双语字幕。已处理 1.2 亿+视频,识别准确率接近 100%。 2. 绘影字幕:一站式专业视频自动字幕编辑器,提供简单、准确、快速的字幕制作和翻译服务,支持 95 种语言,准确率高达 98%,还能自定义视频字幕样式,包括字体、颜色、大小、位置等。 3. Arctime:可对视频语音自动识别并转换为字幕,支持自动打轴,支持 Windows 和 Linux 等主流平台,支持 SRT 和 ASS 等字幕功能。 4. 网易见外:国内知名语音平台,支持视频智能字幕功能,转换正确率较高,支持音频转写功能。 以上工具各有特点,您可根据自身需求选择最适合的视频自动字幕工具。请注意,内容由 AI 大模型生成,请仔细甄别。
2025-02-28
我想利用ai写一篇本科毕业论文,我该怎样使用?或者说有什么对ai的指令吗?
利用 AI 写本科毕业论文时,以下是一些相关的信息和示例供您参考: 有示例表明,如果向 LLM 提供关于个人背景的信息和指令,比如“根据以下关于我的信息,写一篇四段的大学申请论文:我来自西班牙巴塞罗那。尽管我的童年经历了一些创伤性事件,比如我 6 岁时父亲去世,但我仍然认为我有一个相当快乐的童年。在我的童年时期,我经常换学校,从公立学校到非常宗教的私立学校。我做过的最‘异国情调’的事情之一是在爱达荷州的双子瀑布与我的大家庭一起度过六年级。我很早就开始工作了。我的第一份工作是 13 岁时的英语老师。在那之后,以及在我的学习过程中,我做过老师、服务员,甚至建筑工人。”,LLM 可以为您生成论文。但需要注意的是,这并非提倡这种方式是道德的使用方式。 在教育领域也有相关例子,比如一位历史老师让 GPT 参与教学。通过不同的提示方式,GPT4 能产生差异较大的结果。例如,让 ChatGPT 扮演“一个经过训练、熟悉获奖研究生和本科生论文的高级语言模型”,并要求其从自我反思和大纲开始,生成的内容质量会更好。但随着学生在优化提示方面变得更擅长,在家完成写作作业时作弊会变得更容易。不过,让 LLM 进行角色扮演也使其成为有趣的教育工具,特别是作为历史模拟器。 需要强调的是,使用 AI 辅助撰写论文时,不能完全依赖其生成的内容,应遵守学术道德和规范,确保论文的原创性和学术诚信。
2025-02-28
在汉语言文学师范领域中是否存在具有商业价值的问题,利用 AI 技术进行市场调研和分析,探索可能的创业方向
在汉语言文学师范领域,利用 AI 技术进行市场调研和分析是有可能发现具有商业价值的问题和创业方向的。 首先,通过对教育市场的大数据分析,AI 可以帮助了解汉语言文学师范专业的就业趋势和需求变化,例如特定地区对该专业教师的需求增长情况,或者新兴教育模式对该专业人才培养的新要求。 其次,利用自然语言处理技术,分析学生和家长对汉语言文学师范教育的反馈和期望,从而发现潜在的教育服务需求,比如个性化的辅导课程、线上教学平台的优化等。 再者,借助 AI 预测模型,可以评估汉语言文学师范相关教材和教育资源的市场需求,为开发创新的教育产品提供依据。 总之,结合 AI 技术,在汉语言文学师范领域进行深入的市场调研和分析,有机会挖掘出具有商业潜力的问题和创业方向。
2025-02-27
如何利用ai提高学习能力
利用 AI 提高学习能力可以从以下方面入手: 英语学习: 1. 智能辅助工具:如 Grammarly 可进行英语写作和语法纠错,改进表达和写作能力。 2. 语音识别和发音练习:使用 Call Annie 进行口语练习和发音纠正,获取实时反馈和建议。 3. 自适应学习平台:Duolingo 能利用 AI 技术量身定制学习计划,提供个性化内容和练习。 4. 智能导师和对话机器人:ChatGPT 可用于英语会话练习和对话模拟,提高交流能力和语感。 数学学习: 1. 自适应学习系统:Khan Academy 结合 AI 技术提供个性化学习路径和练习题,精准推荐。 2. 智能题库和作业辅助:Photomath 通过图像识别和数学推理技术提供问题解答和解题步骤。 3. 虚拟教学助手:Socratic 利用 AI 技术解答数学问题、提供教学视频和答疑服务。 4. 交互式学习平台:参与 Wolfram Alpha 的学习课程和实践项目,利用 AI 技术进行数学建模和问题求解。 学习一门外语的通用方法: 1. 设定目标:明确学习目标和时间表,分阶段完成任务。 2. 多样化练习:结合听、说、读、写多种方式全面提升语言技能。 3. 模拟真实环境:多与母语者交流,或用 AI 对话助手模拟真实对话场景。 4. 定期复习:使用 AI 工具的复习功能,根据记忆曲线定期复习已学内容巩固记忆。 在医疗保健领域,鉴于人工智能依赖的神经网络基础,专家 AI 可能通过元学习更快地获得知识,并带着人类一同进步。AI 的特性使我们能将其一部分一部分地拆解研究,构建系统深入探索其内部工作机制,创造学习的飞轮,最终可能成为下一代专家(无论是人类还是 AI)的教师。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-02-26
如何最大程度的利用自己的PPT,然后使用AI 来优化它?
以下是最大程度利用自己的 PPT 并使用 AI 来优化的方法: 1. AI 生成 PPT 的主要思路: 以爱设计为例,导入大纲到工具生成 PPT。其他工具操作方式大同小异,都是基于 Markdown 语法的内容来完成 PPT 的生成。具体步骤可移步到 MindShow、闪击、爱设计等章节。 优化整体结构,按照公司要求自行优化字体、图片等元素。针对下载后的 PPT,可以删改内容以达到心理预期。 2. 参考案例:卓 sir 利用 AI 完成 PPT 作业,虽然探索写 prompt 花了不少时间,但最终成功完成,包括大纲内容、排版、动画等,感觉良好。 3. 好用的 AI PPT 工具: Gamma:在线 PPT 制作网站,通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式。https://gamma.app/ 美图 AI PPT:由美图秀秀开发团队推出,输入简单文本描述生成专业 PPT 设计,包含丰富模板库和设计元素。https://www.xdesign.com/ppt/ Mindshow:AI 驱动的 PPT 辅助工具,提供自动布局、图像选择和文本优化等智能设计功能。https://www.mindshow.fun/ 讯飞智文:科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理技术优势,提供智能文本生成、语音输入、文档格式化等功能。https://zhiwen.xfyun.cn/
2025-02-26
如何利用ai获取股票财经信息
以下是利用 AI 获取股票财经信息的一些方法: 1. 使用 Coze bot:在金融投资领域,Coze bot 可以从多个金融资讯平台抓取数据,生成分析报告,并将其推送到用户常用的交流平台,如企业微信群或飞书文档。能够实时跟踪市场动向,捕捉投资机会,自动生成财务报告,节省人力成本,方便团队协作。 2. 本地部署资讯问答机器人:以 A 股行情问答为例,构建本地私有化部署的 Bot,当提出诸如“XX 股票今天表现怎么样?”“复盘今天的家电板块”等问题时,它能从海量市场数据中找到有价值的信息,进行整合与分析,并提供个性化回复。 3. 利用相关 APP:如东方财富 APP 中的一些功能利用 AI 分析金融市场数据,为投资者和金融机构提供风险评估和投资建议。
2025-02-25
怎么利用ai拆书变成游戏
利用 AI 拆书变成游戏可以参考以下内容: 1. 游戏版本迭代: 本地文件上传:游戏主页含三个文件可直接下载压缩包,能上传本地文件,有加载进度。 版本记录与回退:更新版本后可不断迭代,每个版本有记录,迭代 18 次达到现有程度,若要查看某个版本可点击进入,其中有一个操作是询问群里大佬才知道的。 2. 使用 AI 拆分 HTML 文件、文本编辑器操作及打开游戏相关操作: 让 AI 拆分 html 文件,拆分是为了复杂游戏或稳定性、方便后续修改。 推荐使用文本编辑器,可显示保存格式、推送至托管平台。 讲述了创建不同格式文件、保存及命名的方法,以及打开游戏需要创建分支的操作。 3. 游戏制作中加载时间、分享、修改及桌面端使用的相关经验: 教程未提及加载需时,分享链接前要等待半分钟左右。 可先发布让朋友测试链接和图片显示情况再修改,修改方式包括网页端操作及通过下载桌面端(提供了官方软件链接且适用于 Windows 和苹果电脑)关联文本编辑器进行编辑保存推送等内容。 4. 游戏文件的修改与分享: 游戏拆分原因:复杂游戏或因稳定性需拆分,方便后续修改,修改主要集中在 js 格式文件,其他文件改动少。 文件修改保存:使用文本编辑器修改游戏文件,如 html、CSS、js 格式,可在本地保存,推荐开源免费的文本编辑器,能推送到 GitHub 等平台。 文件上传分享:创建分支获取链接分享游戏,可在网页端或桌面端编辑修改并保存推送,国内也有类似仓库可用。 5. 游戏优化细节: 优化了小游戏的界面、玩法,如猪的形象、跳跃功能、道具设置等。 介绍了通过 PS 获取色值来修改游戏代码中颜色的方法。 6. 声音设置问题:存在飞书直播共享声音大小的调整问题。 7. AI 工具比较:对比了不同 AI 工具在代码优化方面的特点,如 V0DEV 更聪明,Poe 可切换模型但传图有问题。 8. 代码编辑困难:对于没有代码基础的人,即使有注释也难以理解和修改代码。 9. 文件保存格式:说明了保存游戏相关文件为 CSS 和 JS 格式的操作。 10. 游戏开发与修改的过程分享: 文件存放要求:三个重要文件需在一个文件夹,本地内置图像、音乐等也需在同一文件夹。 游戏功能优化:增加关卡、调整金币获取和技能点花费、解决游戏中的 Bug 等。 游戏平台上传:研究将游戏发布到 4399 开放平台,需注册、实名制,审核较严格。 代码修改方式:可让 AI 写代码,直接复制整段现成代码不易出错,修改后保存并重新打开。 游戏素材获取:官网可免费下载游戏素材,也可淘宝购买抠好的素材。 此外,AIGC 第二阶段将是生成式 AI 为底层创作引擎提供动力。走垂直路径的公司最初的范围会很窄,这种关注可以采取针对特定游戏类型(由特定的创作者子集提供服务)的专门构建的一组创作功能的形式。
2025-02-24