Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

哪种AI更擅长数学模型搭建与计算

Answer

以下几种 AI 在数学模型搭建与计算方面表现较为出色:

  1. Llama 3.1:是迄今为止最大版本,在推理、数学、多语言和长上下文任务中能够与 GPT-4 相抗衡。
  2. AlphaGeometry:在奥林匹克级几何问题基准测试中表现出色,解决了 30 题中的 25 题,接近人类国际数学奥林匹克金牌得主的表现。
  3. 由 DeepSeek、零一万物、知谱 AI 和阿里巴巴开发的中国模型:在 LMSYS 排行榜上取得了优异的成绩,尤其在数学和编程方面表现尤为出色,且中国模型更能优先考虑计算效率。
  4. MathGLM 系列模型:
    • MathGLM-2B:在训练数据充足的情况下,能够准确地执行多位算术运算,准确率几乎可以达到 100%,结果显著超越 GPT-4。
    • MathGLM-Large:采用不同变体作为骨干来训练,赋予其基本的语言理解能力,使其能够有效理解数学应用题中包含的语言信息。

大型语言模型处理数学计算的一些解决办法包括:

  1. 引入编程插件:将数学问题转化为编程问题,并引入编程插件来处理。
  2. 教会模型数学法则:教导语言模型数学计算的规则。
  3. 标准化自然数加法计算 prompt 模板:创建标准模板,使语言模型按预定义规则和步骤执行加法计算。
  4. 结合图像模型:对于涉及空间概念的数学问题,结合图像模型辅助处理。
  5. 提供充足的语料和样本:为语言模型提供充足的数学计算样本和语料,让模型从中学习并改进数学计算能力。
Content generated by AI large model, please carefully verify (powered by aily)

References

2024人工智能报告|一文迅速了解今年的AI界都发生了什么?

Llama 3.1是迄今为止最大版本,其在推理、数学、多语言和长上下文任务中能够与GPT-4相抗衡。这标志首次开放模型缩小与专有前沿的差距。上图为人们关于Llama 3.1 405B与GPT,Claude的评估,win:胜Tie:平Loss:输借助AlphaGeometry,符号推理引擎得以拯救谷歌DeepMind与纽约大学团队使用符号引擎生成了数百万条合成定理和证明,利用这些数据从零开始训练了一个语言模型。AlphaGeometry在语言模型提出新构造,与符号引擎执行推理交替进行,直至找到解决方案。令人印象深刻的是,AlphaGeometry在奥林匹克级几何问题基准测试中解决了30题中的25题,接近人类国际数学奥林匹克金牌得主的表现。第二好的AI表现仅得10分。它还展示了泛化能力——例如,发现2004年国际数学奥林匹克问题中的一个具体细节对于证明并非必要“尽管受到制裁,中国LLMs在排行榜上风头正劲”由DeepSeek、零一万物、知谱AI和阿里巴巴开发的模型在LMSYS排行榜上取得了优异的成绩,尤其在数学和编程方面表现尤为出色。中国的最强模型与美国生产的第二强前沿模型竞争,同时在某些子任务上挑战了SOTA。中国模型更能优先考虑计算效率,以弥补GPU访问的限制,并学会比美国同行更有效地利用资源。中国模型各有优势。例如,DeepSeek在推理过程中通过多头隐式注意力减少内存需求,并且改进了MoE架构。同时,零一万物更加关注数据集的建设而不是建筑创新。由于在像Common Crawl这样的流行存储库中相对缺乏数据,因此它更加关注建立强大的中文数据集来弥补不足。

问:大模型对于数学计算的一些解决办法

大型语言模型在处理数学计算时,尤其是复杂的数学问题时,可能会遇到一些困难。以下是一些解决办法,以帮助大型语言模型更好地处理数学计算:1.引入编程插件:一种解决方案是将数学问题转化为编程问题,并引入编程插件来处理。通过编写代码来执行数学计算,然后将结果返回给语言模型,以获取正确答案。2.教会模型数学法则:类似于小学生学习加法法则的方式,可以教导语言模型数学计算的规则。通过定义数学计算的规则和步骤,让语言模型学习如何正确执行数学运算。3.标准化自然数加法计算prompt模板:创建一个标准的自然数加法计算prompt模板,使语言模型能够按照预定义的规则和步骤来执行加法计算。这种方法可以帮助模型更好地理解和解决数学问题。4.结合图像模型:对于涉及空间概念的数学问题,可以结合图像模型来辅助处理。图像模型可以帮助模型更好地理解几何问题,并提供更准确的答案。5.提供充足的语料和样本:为语言模型提供充足的数学计算样本和语料,让模型能够从中学习并改进数学计算能力。通过更多的训练和数据,模型可以提高对数学问题的理解和处理能力。通过以上方法,大型语言模型可以更好地处理数学计算,并提供更准确的答案。这些方法可以帮助克服语言模型在数学问题上的一些局限性,提高其数学计算能力。内容由AI大模型生成,请仔细甄别

智谱·AI 开源模型列表

以下模型,以便用户使用我们多元化的产品。|模型|介绍|代码链接|模型下载||-|-|-|-||WebGLM-10B|利用百亿参数通用语言模型(GLM)提供高效、经济的网络增强型问题解答系统。它旨在通过将网络搜索和检索功能集成到预训练的语言模型中,改进现实世界的应用部署。|[WebGLM](https://github.com/THUDM/WebGLM)|[Huggingface](https://huggingface.co/THUDM/WebGLM)||WebGLM-2B|||[Huggingface](https://huggingface.co/THUDM/WebGLM-2B)||MathGLM-2B|在训练数据充足的情况下,20亿参数的MathGLM模型能够准确地执行多位算术运算,准确率几乎可以达到100%,其结果显著超越最强大语言模型GPT-4在相同测试数据上18.84%的准确率。|[MathGLM](https://github.com/THUDM/MathGLM)|[THU-Cloud](https://cloud.tsinghua.edu.cn/d/cf429216289948d889a6/)||MathGLM-500M|||[THU-Cloud](https://cloud.tsinghua.edu.cn/d/c80046ec7e234be4831b/)||MathGLM-100M|||[THU-Cloud](https://cloud.tsinghua.edu.cn/d/a6ca369a212c4df08359/)||MathGLM-10M|||[THU-Cloud](https://cloud.tsinghua.edu.cn/d/16a914d6db2a4b8f80f5/)||MathGLM-Large|采用GLM的不同变体作为骨干来训练MathGLM,包括具有335M参数的GLM-large和GLM-10B。此外,还使用ChatGLM-6B和ChatGLM2-6B作为基座模型来训练MathGLM。这些骨干模型赋予MathGLM基本的语言理解能力,使其能够有效理解数学应用题中包含的语言信息。||[THU-Cloud](https://cloud.tsinghua.edu.cn/d/3d138deaf93441b196fb/)|

Others are asking
请问有那款ai是能通过Lisp 语言实现一些输出操作的呢?
以下是一些能够通过 Lisp 语言实现输出操作的 AI 示例: 在“AI‘词生卡’的蝴蝶效应:从文字到视觉盛宴跨界蝶变”中提到,古早的 Lisp 语言在 Claude3.5 强大的理解力和绘图支持下焕发了新生,制造了新卡。 在“艾木:提示词编程|有必要用 Lisp 语言写提示词吗?”中,将提示词用 Lisp 语言编写后丢给 Claude,例如输入文本,Claude 大概率会直接输出 SVG 代码。但对于复杂的函数调用,大语言模型处理起来较困难。
2025-01-23
请问 有哪几款ai是可以使用claude语言的呢?
Claude 是由 Anthropic 公司开发的 AI 助手。目前,Claude 本身就是一款独立的 AI,不存在其他可以使用 Claude 语言的 AI。 要注册 Claude.ai,您可以按照以下步骤进行: 1. 访问 Claude 的官方网站。 2. 点击注册或登录界面中的“Sign Up”或“Continue with email”选项。 3. 填写您的邮箱地址并设置密码,然后提交表单。 4. 系统会向您的邮箱发送一封验证邮件,您需要打开邮件并使用其中的验证码来完成邮箱验证。 如果在注册过程中遇到需要海外手机号接收验证码的问题,以下是一些可能的解决方案: 1. 使用虚拟海外号服务,如 SMSActivate、SMSPool 等,购买一个海外虚拟手机号来接收 Claude 的验证码。 2. 借助第三方服务网站如 uiuihao.com 完成注册您的 Claude 账号。 3. 如果您有海外朋友,可以请他们帮忙接收验证码,并将验证码告诉您。 完成注册后,如果您希望升级到 Claude Pro 版本以获取更强大的功能和更高的 API 调用限额,您需要填写支付信息并选择一个合适的订阅计划。值得注意的是,订阅 Claude Pro 可能需要使用海外支付方式。 请注意,Claude.ai 目前处于公开测试阶段,未付费用户使用平台可能会受到一些限制。如果您在注册过程中遇到任何问题,可以参考其他用户分享的详细注册教程和解决策略。
2025-01-23
ai在线课程
以下是为您提供的关于 AI 在线课程的相关信息: 新手学习 AI 的步骤: 1. 了解 AI 基本概念:建议阅读「」部分,熟悉 AI 的术语和基础概念,包括主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。同时浏览入门文章,了解 AI 的历史、当前应用和未来发展趋势。 2. 开始 AI 学习之旅:在「」中,能找到为初学者设计的课程,特别推荐李宏毅老师的课程。您还可以通过在线教育平台(如 Coursera、edX、Udacity)按照自己的节奏学习,并可能获得证书。 3. 选择感兴趣的模块深入学习:AI 领域广泛,比如图像、音乐、视频等,您可根据兴趣选择特定模块深入学习,同时掌握提示词技巧。 4. 实践和尝试:理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。知识库中有很多实践后的作品和文章分享。 5. 体验 AI 产品:与如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人互动,了解其工作原理和交互方式。 推荐的“野菩萨”AI 课程: 1. 预习周课程:包括 AI 绘画电脑配置要求、高效 AIGC 创意者的数字人工具包、SD 插件安装方法、画静为动的 AIGC 视频制作讲解等。 2. 基础操作课:涵盖 AI 绘画通识课、AI 摄影虚拟的真实、AI 电影 穿越的大门等内容。 3. 核心范式课程:涉及词汇的纸牌屋、核心范式应用、控制随机性等方面。 4. SD WebUi 体系课程:包括 SD 基础部署、SD 文生图、图生图、局部重绘等。 5. ChatGPT 体系课程:有 ChatGPT 基础、核心 文风、格式、思维模型等内容。 6. ComfyUI 与 AI 动画课程:包含部署和基本概念、基础工作流搭建、动画工作流搭建等。 7. 应对 SORA 的视听语言课程:涉及通识 欢迎参加电影的葬礼、影像赏析、基础戏剧影视文学等。 免费获取课程的机会:参与 video battle,获胜者可获得课程。冠军奖励 4980 课程一份,亚军奖励 3980 课程一份,季军奖励 1980 课程一份,入围奖励 598 野神殿门票一张。 “通往 AGI 之路知识库”中的课程: 1. 推荐 B 站 up 主 Nally 的课程,免费且每节 15 分钟。 2. 二十四节气相关教程和关键词已开源,可直接复制使用。 3. 14、15 号左右白马老师和麦菊老师将带大家用 AI 做生图、毛毡字、光影字、机甲字等。16 号晚上中老师将带大家动手操作炼丹。 希望以上信息对您有所帮助,祝您在 AI 学习的道路上不断进步!
2025-01-23
怎么用AI提高团队工作效率,贸易类
以下是一些利用 AI 提高贸易类团队工作效率的方法: 1. 利用 AI“词生卡”技术:将抽象的文字描述转化为直观的逻辑图表和流程图,帮助团队更好地理解和执行复杂任务。团队成员可以通过“词生卡”方式自定义活动海报、商务名片、简历,也可以用于日报、月报等介绍工作进度,实现文图双输出,提高信息传导效率,并为创新思维提供新工具。 2. 参考哈佛商学院的研究:在工作中使用 AI 可以带来工作效率的显著改善。使用 AI 的被测试者比未使用者平均多完成 12.2%的任务,完成速度提高 25.1%,结果质量提高 40%。同时要注意,类似 GPT4 这样的模型有能力边界,过于依赖可能适得其反。能力较弱的被测试者提升较大,高级人才和低级人才的差距会被拉平。 3. 采用合适的协作方式:如“半人马”模式,强调人与 AI 紧密结合但各司其职,人类主导流程,根据任务性质调配资源;“机械人”模式,人与 AI 高度融合,在细节上循环迭代优化,最终实现人机一体化。 总之,合理利用 AI 技术和选择合适的协作方式,能够有效提高贸易类团队的工作效率。
2025-01-23
langchain开发手册
LangChain 是专注于大模型应用开发的平台,提供一系列组件和工具助您轻松构建 RAG 应用。 组件包括: 1. 数据加载器(DocumentLoader):能从数据源加载数据并转为文档对象,文档包含 page_content(文本内容)和 metadata(元数据如标题、作者、日期等)。 2. 文本分割器(DocumentSplitter):将文档分割成多个小文档,方便后续检索和生成,因大模型输入窗口有限,短文本更易找相关信息。 3. 文本嵌入器(Embeddings):将文本转为高维向量的嵌入,用于衡量文本相似度以实现检索功能。 4. 向量存储器(VectorStore):存储和查询嵌入,常使用 Faiss 或 Annoy 等索引技术加速检索。 5. 检索器(Retriever):根据文本查询返回相关文档对象,常见实现是向量存储器检索器,利用向量存储器相似度搜索功能检索。 6. 聊天模型(ChatModel):基于大模型如 GPT3 实现文本生成,根据输入序列生成输出消息。 使用 LangChain 构建 RAG 应用的一般流程: 1. 加载数据:根据数据源类型选择合适的数据加载器,如网页可用 WebBaseLoader。 2. 分割文档:根据文本特点选择合适的文本分割器,如博客文章可用 RecursiveCharacterTextSplitter。 3. 转换和存储嵌入:选择合适的文本嵌入器和向量存储器,如 OpenAI 的嵌入模型和 Chroma 的向量存储器。 4. 创建检索器:使用向量存储器检索器,传递向量存储器和文本嵌入器对象创建。 5. 创建聊天模型:根据性能和成本选择,如 OpenAI 的 GPT3 模型。 以下是使用 LangChain 构建 RAG 应用的示例代码。
2025-01-23
给我写一段AI产品经理板块的介绍,一小段话,用于在公司内部的科技论坛上
在公司内部的科技论坛上,为您介绍 AI 产品经理板块: AI 产品经理可大致分为三个层级: 1. 入门级:能通过 WaytoAGI 等开源网站或课程了解 AI 概念,使用 AI 产品并动手实践应用搭建。 2. 研究级:有技术研究和商业化研究两条路径,能根据需求场景选择解决方案,或利用 Hugging face 等工具验证想法。 3. 落地应用级:有成功落地应用案例并产生商业化价值。 传统互联网 PM 也有类似的三个层级: 1. 负责功能模块与执行细节。 2. 负责整体系统与产品架构。 3. 熟悉行业竞争格局与商业运营策略。 对 AI 产品经理的要求是懂得技术框架,关注场景、痛点和价值。同时,为您列举一些岗位技能要求,如本科及以上学历,计算机科学等相关专业背景,熟悉多种 AI 工具的使用及原理,具备创新思维等。我们身边也有相关案例,如枫 share、行远等都是从事相关工作的产品经理。
2025-01-23
我想用AI软件生产年终总结报告,请问用哪种软件合适
以下是一些适合用于生成年终总结报告的 AI 软件及相关资源: 1. Claude Artifacts:文章《年底了,惊艳一次,用 Claude Artifacts 生成年终总结,简洁明快还能无限复用》介绍了其生成年终总结的特点,如简洁明快、可无限复用。通过编辑和实时预览功能,能一次性创建模板并不断修改使用,且改进后产出更稳定,简化创作过程。 2. 您还可以参考以下报告和文章获取更多信息: 《》 《》 《》 《》 生成式 AI 季度数据报告 2024 月 1 3 月 《》 《》
2025-01-20
哪种AI写讲稿好用
以下是为您推荐的一些好用的 AI 写作工具: 1. 对于写讲稿: Gamma:在线 PPT 制作网站,可通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式。网址:https://gamma.app/ 美图 AI PPT:由知名图像编辑软件“美图秀秀”的开发团队推出,通过输入简单文本描述生成专业 PPT 设计,有丰富模板库和设计元素。网址:https://www.xdesign.com/ppt/ Mindshow:AI 驱动的 PPT 辅助工具,提供智能设计功能,如自动布局、图像选择和文本优化等。网址:https://www.mindshow.fun/ 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理技术优势,提供智能文本生成、语音输入、文档格式化等功能。网址:https://zhiwen.xfyun.cn/ 2. 对于新闻写作: Copy.ai:功能强大的 AI 写作助手,提供丰富新闻写作模板和功能,可快速生成新闻标题、摘要、正文等内容。 Writesonic:专注写作的 AI 工具,提供新闻稿件生成、标题生成、摘要提取等功能,智能算法可根据信息生成高质量新闻内容。 Jasper AI:人工智能写作助手,虽主打博客和营销文案,也可用于生成新闻类内容,写作质量较高,支持多种语言。 需要注意的是,这些工具都具有智能化的算法和丰富的模板库,可以帮助您快速生成高质量的内容,但内容由 AI 大模型生成,请仔细甄别。同时,如果担心 AI 对孩子思考力产生负面影响,应正确引导使用,如将封闭性问题改为开放性问题,让孩子与 AI 共同完成任务并提交相关记录等。
2024-11-25
runway具体属于哪种赛道,怎么描述它
Runway 属于 AI 视频领域。它是一款最先推出模型的 AI 视频产品,目前仍维持着领先地位,并在不断快速迭代。 其产品定位更偏向影视、艺术表达,具有以下特点和优势: 1. 擅长真实系、风景、空间视频生成,对二次元场景支持不佳。 2. 支持绿幕场景生成、视频绿幕抠像等,方便影视制作和后期处理。 3. 7 月更新的 Gen3 支持 Alpha Turbo(更快速)和 Alpha(更强表现力)两种模式,增强了对复杂提示词描述的理解和对图像运动元素的识别,能够实现富有想象力的过渡和场景中元素的精确关键帧。还支持设置图片作为动画首帧/尾帧,但目前不支持笔刷等高级调节能力。单次生成视频时长最长可达 10 秒,可延长到 40 秒。 4. Gen3 Alpha Turbo 支持竖屏尺寸视频生成、加大力度发力视频到视频(风格转绘)能力,并表示即将推出更多控制能力。 Runway 由一家总部位于旧金山的 AI 创业公司制作,年初在互联网爆火。2023 年初推出的 Gen2 代表了当前 AI 视频领域最前沿的模型,能够通过文字、图片等方式生成 4 秒左右的视频。致力于专业视频剪辑领域的 AI 体验,同时也在扩展图片 AI 领域的能力。目前支持在网页、iOS 访问,网页端有 125 积分的免费试用额度(可生成约 105 秒视频),iOS 有 200 多,两端额度不同步。 相关链接: 1. 查看 Runway 目前支持的场景和视频案例:https://runwayml.com/product/usecases 2. Gen1 能力介绍:https://research.runwayml.com/gen1 3. Gen1 参数设置:https://help.runwayml.com/hc/enus/articles/15161225169171 4. 学习 Gen1 详细设置方式的视频:https://youtu.be/I4OeYcYf0Sc 5. 官方网站:https://runwayml.com/
2024-10-12
普通人用哪种AI就可以?主要是问些问题
对于普通人来说,以下几种 AI 可供选择: 1. 像 Pi 这样注重对话体验、情商较高的 AI,能提供心理疏导、学习建议等方面的交流。 2. 在医疗领域,AI 初诊可以作为基础普惠医疗的选项,例如一些能够辅助诊断的 AI 应用。 3. 目前在多模态大爆发的趋势下,一些能处理文字、声音和视觉等多种信息的 AI 也具有一定的实用性。 但需要注意的是,不同的 AI 应用在功能和适用场景上有所差异,您可以根据自己的具体需求和使用习惯进行选择。
2024-10-06
新手小白,如何从0开始搭建AI Agent
对于新手小白从 0 开始搭建 AI Agent,以下是一些建议: 1. 规划阶段: 制定任务的关键方法,总结任务目标与执行形式。 将任务分解为可管理的子任务,确立逻辑顺序和依赖关系。 设计每个子任务的执行方法。 2. 实施阶段: 在 Coze 上搭建工作流框架,设定每个节点的逻辑关系。 详细配置子任务节点,并验证每个子任务的可用性。 3. 完善阶段: 整体试运行 Agent,识别功能和性能的卡点。 通过反复测试和迭代,优化至达到预期水平。 此外,还需要了解一些关于 AI Agent 的基本概念: AI Agent 是基于大型语言模型(LLM)和其他技术实现的智能实体,其核心功能在于自主理解、规划决策、执行复杂任务。 AI Agent 包括 Chain(通常一个 AI Agent 可能由多个 Chain 组成,一个 Chain 视作是一个步骤,可以接受一些输入变量,产生一些输出变量,大部分的 Chain 是大语言模型完成的 LLM Chain)、Router(可以使用一些判定,甚至可以用 LLM 来判定,然后让 Agent 走向不同的 Chain)、Tool(Agent 上可以进行的一次工具调用,例如对互联网的一次搜索,对数据库的一次检索)。 常见的 AI Agent 有 Responser Agent(主 agent,用于回复用户)、Background Agent(背景 agent,用于推进角色当前状态)、Daily Agent(每日 agent,用于生成剧本,配套的图片,以及每日朋友圈)。这些 Agent 每隔一段时间运行一次(默认 3 分钟),会分析期间的历史对话,变更人物关系、反感度等,抽简对话内容,提取人物和用户的信息成为“增长的记忆体”,按照时间推进人物剧本,有概率主动聊天(与亲密度正相关,跳过夜间时间)。
2025-01-23
我想学习智能体搭建
以下是关于智能体搭建的相关知识: 智谱 BigModel 共学营第二期:把你的微信变成超级 AI 助理 1. 注册智谱 Tokens 智谱 AI 开放平台:https://bigmodel.cn/ 新注册用户,注册即送 2000 万 Tokens 充值/购买多种模型的低价福利资源包 直接充值现金,所有模型可适用:https://open.bigmodel.cn/finance/pay 语言资源包:免费 GLM4Flash 语言模型/ 多模态资源包: 多模态资源包: 所有资源包购买地址:https://bigmodel.cn/finance/resourcepack 共学营报名赠送资源包 2. 先去【财务台】左侧的【资源包管理】看看自己的资源包,本次项目会使用到的有 GLM4、GLM4VPlus、CogVideoX、CogView3Plus 模型。 3. 进入智能体中心我的智能体,开始创建智能体。此流程会手把手进行编辑,完成一个简单智能体的搭建,此智能体完成以下功能: 小众打卡地——优秀创作者奖 1. 智能体基本信息 名称:小众打卡地 链接:https://tbox.alipay.com/pro/share/202412APCyNn00194489?platform=WebService 2. 基本功能介绍:小众打卡地推荐,输入一个旅游目的地地点城市,给您推荐 3 个小众打卡地小红书类文案,适合分享或旅游参考,还有精美的旅行地配图。 3. 智能体核心价值 为用户发掘非大众化的特色景点,避开人流 提供个性化的旅行建议,并且有目的地的图片参考 帮助用户快速获取高质量的旅行参考信息 提供小红书文案,也适合发小红书 4. 智能体效果 输入一个目的地后,等待一小段时间,即可获得带图文案。从手机支付宝小程序更加方便,可以一键复制后获取。 5. 智能体搭建思路重点 录入了小红书的相关文案参考知识库 通过文本模型组成搜索词进行搜索,从搜索到的所有网页链接中,通过代码节点提取相关的 url 用代码节点滤除需要安全认证的网站,包括挑选一些非周边城市攻略推荐,并且尽量检查“小众”或“冷门” 通过 url 网页正文后,提取相关的小众地点输出,同时通过代码进行打卡点的字符串输出用于后续节点运用 根据需要搜索的小众旅行地进行图片搜索。此处代码节点随机提取一条图片的 url,注意此处在调试过程中发现有些图片搜索后的 url 打卡图片会失效,代码节点将部分失效的网站进行了过滤 最后的文案输出,非常适合小红书文案和旅行发布参考 智能体在品牌卖点提炼中的应用 1. 确定智能体的结构 按照市场营销的逻辑组织智能体的结构。 2. 搭建完整智能体 以品牌卖点提炼六步法为核心的流程,将其他的分析助手加入工作流中,包括: 品牌卖点定义与分类助手 品牌卖点提炼六步法 STP 市场分析助手 用户画像分析助手 触点收集助手 同时还包括一些结构中没有体现,但是在后续的品牌卖点应用过程中有效的分析工具: 用户需求分析的 KANO 助手 营销六层转化漏斗分析 超级转化率六要素
2025-01-22
如何搭建定制知识库
以下是关于如何搭建定制知识库的相关内容: 要搭建基于 GPT API 的定制化知识库,需要给 GPT 输入定制化的知识。但 GPT3.5(即当前免费版的 ChatGPT)一次交互支持的 Token 数量有限,约 4096 个,相当于 3000 个单词或 2300 个汉字,容量对于多数领域知识不够。为处理大量领域知识,OpenAI 提供了 embedding API 解决方案,可参考 OpenAI embedding documents。 embeddings 是浮点数字的向量(列表),两个向量之间的距离衡量它们的关联性,小距离表示高关联度,大距离表示低关联度。向量是用一串数字表示大小和方向的量,在计算机科学和数据科学中通常用列表表示。向量之间的距离是度量相似性的方法,常见的如欧几里得距离。在 OpenAI 词嵌入中,靠近的向量词语在语义上相似。 LlamaIndex 是更高一层 LangChain 的抽象,之前叫 GPT Index。之前的文章中的例子使用了 LlamaIndex 包,它简化了 LangChain 对文本分割和查询的接口,并提供了更丰富的 Data Connector。LlamaIndex 只针对 GPT Model 做 Index,而 LangChain 可对接多个 LLMs,可扩展性更强。参考 https://gptindex.readthedocs.io/en/latest/ 在基于大模型+知识库的 Code Review 实践中,对于自定义知识库飞书文档(自定义),没有格式要求,能看懂正确代码即可。可直接使用 LangChain 提供的文档加载类,对有权限的飞书文档进行获取,使用 CharacterTextSplitter/RecursiveCharacterTextSplitter 将文本分割成固定长度的块(chunks),方法有两个主要参数:chunk_size 控制每个块的长度,如设置为 1024,则每个块包含 1024 个字符;chunk_overlap 控制相邻两个块之间的重叠长度,如设置为 128,则每个块会与相邻块重叠 128 个字符。 因为大模型有足够多的数据,想让大模型按要求执行就需要用到“Prompt 提示词”。 最近各家大厂接连放大招,AI 技术和应用突飞猛进,GPT4 接口已支持最大 32K 输入,AI 的开发和使用门槛会越来越低。垂直领域知识库的搭建和优化可能更多是业务问题,而非技术问题。
2025-01-22
如何搭建私人知识库
搭建私人知识库可以参考以下方法: 1. 基于 GPT 搭建: 给 GPT 输入(投喂)定制化的知识,但 GPT3.5(即当前免费版的 ChatGPT)一次交互(输入和输出)只支持最高 4096 个 Token,约等于 3000 个单词或 2300 个汉字,容量对于绝大多数领域知识不够。 OpenAI 提供了 embedding API 解决方案,embeddings 是一个浮点数字的向量(列表),两个向量之间的距离衡量它们的关联性,小距离表示高关联度,大距离表示低关联度。 将大文本拆分成若干个小文本块(chunk),通过 embeddings API 将小文本块转换成 embeddings 向量,在一个地方(向量储存库)中保存这些 embeddings 向量和文本块,当用户提出问题时,将问题先通过 embeddings API 转换成问题向量,然后与向量储存库的所有文本块向量比对,查找距离最小的几个向量,把这几个向量对应的文本块提取出来,与原有问题组合成为新的 prompt(问题/提示词),发送给 GPT API。 2. 本地部署大模型搭建: 利用大模型的能力搭建知识库本身就是一个 RAG 技术的应用,在进行本地知识库的搭建实操之前,需要先对 RAG 有大概的了解。 RAG 的应用包括文档加载(从多种不同来源加载文档,LangChain 提供了 100 多种不同的文档加载器)、文本分割(把 Documents 切分为指定大小的块)、存储(将切分好的文档块进行嵌入转换成向量的形式,并将 Embedding 后的向量数据存储到向量数据库)、检索(通过某种检索算法找到与输入问题相似的嵌入片)、Output(把问题以及检索出来的嵌入片一起提交给 LLM,LLM 会通过问题和检索出来的提示一起来生成更加合理的答案)。 文本加载器就是将用户提供的文本加载到内存中,便于进行后续的处理。
2025-01-22
扣子应用搭建示例
以下是关于扣子应用搭建的相关内容: 白嫖 Groq 平台算力的落地应用: 通过扣子工作流,用代码模块进行 HTTP 访问,实现 0 token 脱离扣子模型来使用 Groq 作为 LLM,可参考梦飞大佬教程将扣子接入微信机器人(有微信封号风险)。 由于 Groq 的 API 与 OpenAI 的 API 几乎兼容,可以适配到任何 APP 产品填 APIKEY 调用的场景,以沉浸式翻译为例。 接入手机类 APP,比如通过快捷方式接入 Siri。 接入扣子工作流:搭建细节可移步 WaytoAGI 自学。建立工作流只需一个代码节点,需配置代码节点的输入引用、输出等。可建立 Bot 调用工作流,但建议不发布,以免代理流量被他人使用。 在扣子调用已有的 API 制作插件: Body:用于传递请求主体部分,GET 方法中通常不用于传递参数。 Path:用于定义请求路径部分,GET 方法中可传递参数,常编码为 URL 一部分。 Query:用于定义请求查询部分,是 GET 方法中常用的参数传递方式。 Header:用于定义 HTTP 请求头信息部分,GET 方法中通常不用于传递参数。配置输出参数,填对后可点击自动解析,调试与校验工具是否能正常运行。 搭建邮票收藏馆应用: 业务背景与逻辑梳理:源于客户需求,功能包括生成邮票、收藏邮票、收藏列表、查看藏品详情,规划了生成和查看两个页面。 页面设计: 第一页:导航栏有应用名称、查看收藏入口、用户头像;陈列展示生成的图片;生成和收藏部分可输入关键字生成并收藏。 第二页:收藏列表会加载用户所有收藏,数量超 100 需优化加翻页;收藏详情可查看大图、关键字、收藏时间。
2025-01-21
搜索模型搭建
以下是关于搜索模型搭建的相关知识: 嵌入(Embeddings): 概述:第一代模型(以001结尾的模型)都使用 GPT3 分词器,最大输入为 2046 个分词。第一代嵌入由五个不同的模型系列生成,针对三个不同任务进行调整,包括文本搜索、文本相似性和代码搜索。搜索模型成对出现,有用于短查询和长文档的。不同系列包括多种质量和速度不同的型号,如 Davinci 能力最强但更慢更贵,Ada 能力最差但速度快成本低。 相似性嵌入:最擅长捕捉文本片段之间语义相似性,如 textsimilaritybabbage001、textsimilaritycurie001、textsimilaritydavinci001。 文本搜索嵌入:有助于衡量长文档与短搜索查询的相关性,使用两种模型,分别用于嵌入搜索查询和要排名的文档,如 textsearchadaquery001 等。 代码搜索嵌入:与搜索嵌入类似,有两种类型,分别用于嵌入自然语言搜索查询和要检索的代码片段,如 codesearchadatext001 等。对于001 文本嵌入,建议将输入中的换行符替换为单个空格。 部署大语言模型: 下载并安装 Ollama:根据电脑系统,从 https://ollama.com/download 下载,双击打开点击“Install”,安装完成后将下方地址复制进浏览器中,若出现相关字样表示安装完成,即 http://127.0.0.1:11434/ 。 下载 qwen2:0.5b 模型:Windows 电脑按 win+R 输入 cmd 回车,Mac 电脑按下 Command(⌘)+Space 键打开 Spotlight 搜索输入“Terminal”或“终端”选择“终端”应用程序,复制相关命令行粘贴回车等待完成。 检索原理: 信息筛选与确认:对检索器提供的信息进行评估,筛选出最相关和最可信的内容,涉及对信息来源、时效性和相关性的验证。 消除冗余:识别和去除多个文档或数据源中的重复信息。 关系映射:分析不同信息片段之间的逻辑和事实关系,如因果、对比、顺序等。 上下文构建:将筛选和结构化的信息组织成连贯的上下文环境,包括排序、归类和整合。 语义融合:合并意义相近但表达不同的信息片段。 预备生成阶段:整合好的上下文信息被编码成适合生成器处理的格式。 大模型生成回答:全新的上下文传递给大语言模型,大语言模型根据提供的信息回答问题。
2025-01-19