Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

ai大模型有哪些常用参数

Answer

以下是关于 AI 大模型常用参数的相关内容:

  1. 架构方面:
    • Encoder-only:适用于自然语言理解任务,如分类和情感分析,代表模型是 BERT。
    • Encoder-decoder:结合 Transformer 架构的 encoder 和 decoder 来理解和生成内容,用例包括翻译和摘要,代表是谷歌的 T5。
    • Decoder-only:更擅长自然语言生成任务,众多 AI 助手采用此结构,如 ChatGPT。
  2. 规模方面:
    • 预训练数据量大,往往来自互联网上的论文、代码、公开网页等,一般用 TB 级别数据进行预训练。
    • 参数众多,如 Open 在 2020 年发布的 GPT-3 就已达到 170B 的参数。参数指的是神经网络的输入权重和输出阈值的总和。假定一个神经元有 9 个输入权重和 1 个输出阈值,就有 10 个参数。当有 100 亿个这样的神经元时,就形成千亿级参数的大模型。
  3. 模型部署方面:
    • 在 LLM 中,Token 是输入的基本单元。由于大模型参数多,如 GPT-2 有 1.5B 参数,每个参数用 float32 表示需 6GB 内存,更先进的模型如 LLAMA 有 65B 参数则需 260G 内存(还不考虑词汇表)。因此实际部署时会进行模型压缩。
    • 在训练 LLM 中,CPU 与内存之间的传输速度往往是系统瓶颈,核心数反而不是大问题,减小内存使用是首要优化点。使用内存占用更小的数据类型是直接方式,如 16 位浮点数可将内存使用减倍。目前有几种相互竞争的 16 位标准,英伟达在其最新一代硬件中引入了对 bfloat16 的支持。
Content generated by AI large model, please carefully verify (powered by aily)

References

从 0 到 1 了解大模型安全,看这篇就够了

encoder-only:这些模型通常适用于可以自然语言理解任务,例如分类和情感分析.最知名的代表模型是BERTencoder-decoder:此类模型同时结合了Transformer架构的encoder和decoder来理解和生成内容。该架构的一些用例包括翻译和摘要。encoder-decoder的代表是google的T5decoder-only:此类模型更擅长自然语言生成任务。典型使用包括故事写作和博客生成。这也是我们现在所熟知的众多AI助手的结构我们目前耳熟能详的AI助手基本都来自左侧的灰色分支,当然也包括ChatGPT。这些架构都是根据谷歌2017年发布的论文“attention is all you need”中提出的transformer衍生而来的,在transformer中,包括Encoder,Decoder两个结构目前的大型语言模型就是右侧只使用Decoder的Decoder-only架构的模型大模型又大在哪呢?第一,大模型的预训练数据非常大,这些数据往往来自于互联网上,包括论文,代码,以及可进行爬取的公开网页等等,一般来说,现在最先进的大模型一般都是用TB级别的数据进行预训练。第二,参数非常多,Open在2020年发布的GPT-3就已经达到170B的参数在GPT3中,模型可以根据用户输入的任务描述,或给出详细的例子,完成任务但这与我们熟知的ChatGPT仍然有着很大的差距,使用ChatGPT只需要像和人类一样对话,就可以完成任务。除了形式上的不同之外,还有一个更加重要的差距,那就是安全性上的差别。

人人都能搞定的大模型原理 - 神经网络

了解感知器和单神经元的原理是为了后续更好的了解“基于深度神经网络机器学习”的基础。我们经常所听到的大模型有几百亿几千亿的参数,这里的参数其实就是神经网络的输入权重和输出阈值的总和。我们假定一个神经元有9个输入权重,和1个输出阈值,那么就可以说该神经元有10个参数。当我们有100亿个这样的神经元时,此时就可以说我们的神经网络模型有1000亿个参数,也就是所谓的千亿级参数的大模型。是不是贼啦简单?原来各种官方一直提到的百亿,千亿参数的大模型,原来是这个意思呢。此处我们再做一点小小的延伸~我们上述所提到的感知机(单神经元),通过一定的学习算法,可以将这个单神经元具备一定简单的智能效果,比如识别单个数字。那么你想象一下,我们单个神经元通过一定的学习算法,可以出现简单的智能效果,此时如果有100亿个神经元呢?100亿个神经元合在一起所具备的智能效果,这将是一个多么强智能的效果存在。每个神经元都只需要记住自己的一点点规则,可以具备识别出一个非常小的一个能力,此时将这个神经元的数量扩大到100亿,1000亿,这就会出现我们现在所经常听到的群体智能,即智能涌现!“智能涌现”在自然界非常典型的案例就是蚂蚁,单只蚂蚁是非常简单的智能生物,但是一旦当一群蚂蚁聚集的时候,就会建造出非常复杂的蚁巢结构。(感兴趣的可以自行搜下)而我们人脑呢?根据科学的统计是人脑中约有1000亿个神经元,这些庞大的神经元构成了非常复杂的神经网络,这也是人脑智能的基础。所以知道为什么有时候明明也没运动,但是上班一天还是要吃很多食物了吗?因为你庞大神经元的运转也是需要消耗能量的呀。AI消耗电力补充能量,而我们消耗食物来补充能量(奇奇怪怪的知识又增加了🤔)

大模型入门指南

在LLM中,Token是输入的基本单元由于在大模型的参数非常多,比如在GPT-2中,有1.5B参数,每个参数用float32表示,那么需要的内存大小为4 bytes*1,500,000,000=6GB,更先进的模型如LLAMA有65B参数,那么需要的内存就需要260G,这还是在不考虑词汇表的情况下。因此在进行模型实际部署时,会进行模型的压缩。而且,在训练LLM中,CPU与内存之间的传输速度往往是系统的瓶颈,核心数反而不是大问题,因此减小内存使用是首要优化点。使用内存占用更小的数据类型是一种直接的方式,比如16位的浮点数就可以直接将内存使用减倍。目前有几种相互竞争的16位标准,但英伟达在其最新一代硬件中引入了对bfloat16的支持,|Format|Significand|Exponent||-|-|-||bfloat16|8 bits|8 bits||float16|11 bits|5 bits||float32|24 bits|8 bits|

Others are asking
现在有哪些AI绘画平台
以下是一些常见的 AI 绘画平台: 1. MewXAI:这是一款强大且新手友好、操作简单的 AI 绘画创作平台。其功能包括 MX 绘画、MX Cute、MJ 绘画、边缘检测、室内设计、姿态检测、AI 艺术二维码、AI 艺术字等。访问地址:https://www.mewxai.cn/ 2. StableStudio:Stability AI 开源的 AI 图像生成平台。 3. Roop:一键实现 AI 换脸,仅需一张换脸图像,无需数据集,无需训练,自带敏感图像检测功能。 4. pixian.ai:能够利用 AI 一键移除各种图像背景,并支持在线调整图片分辨率、背景颜色等。 5. Inpaint Anything:一个 AI 图像编辑工具,支持一键擦除、替换图像中的指定物品,通过提示词来自动更换背景图。 6. Segment Anything:一个图像分割模型,可自动分割图片或视频中的所有物品,一键完成自动分割,并支持零样本转移到其他分割任务。 7. Docker:支持一键从图片中解析出 Prompt 描述,并能够基于描述进行扩展,以便二次图片生成。 8. Plask.ai:一个 AI 工具,可以通过 3D 建模,直接生成模特效果图。 9. Recraft AI:是 AI 平面设计工具,用户可以使用其生成和编辑插画,海报,产品周边等,提供多种样式的可选风格,对所有用户每日都有免费的试用点数,并允许对生成的图像进行商业使用。访问地址:https://www.recraft.ai/ 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-03-03
现在有哪些ai平台?
以下是一些常见的 AI 平台: 图虫网:AI 摄影作品销售平台,利用图像识别、数据分析技术,为摄影爱好者提供作品销售渠道。 网易云音乐音乐人平台:AI 音乐作品发布平台,运用音频处理、数据分析技术,为音乐创作者提供作品发布等服务。 好好住 APP:AI 家居用品推荐平台,通过数据分析、自然语言处理技术,根据用户需求推荐家居用品。 东方财富网投资分析工具:AI 金融投资分析平台,借助数据分析、机器学习技术,分析金融市场并提供投资建议。 此外,在 ProductHunt 2023 年度最佳产品榜单中的 AI 产品有: Dora AI:用一次 prompt 生成网站,支持文字转网站、生成式 3D 互动、高级 AI 动画。 Bard(免费):谷歌推出的官方 ChatGPT 竞争者,由谷歌的对话应用语言模型(LaMDA)提供支持。 Chat.DID(免费):有史以来首个允许人们以人类方式与 AI 进行视频聊天的 APP。 Pika(免费):AI 视频平台,能将创意转化为动态视频。 对于希望自行部署 AIGC 服务的用户,以下云服务平台可供选择: AWS(亚马逊云服务):提供多种 AI 服务,资源丰富、灵活性强,但费用相对较高,适合需求复杂、要求高可用的企业用户。 Google Cloud Platform:推出 Vertex AI 和多款预训练模型供使用,支持多种编程语言和框架,具有领先的计算机视觉和语音识别能力。 Microsoft Azure:Azure 机器学习服务涵盖多种 AI 工作负载,与微软其他产品融合度高,提供硬件加速等优化方案。 Huawei Cloud:提供 ModelArts 等 AI 开发和推理平台,融合 Ascend AI 处理器实现硬件加速,针对本地化部署和行业应用进行了优化。 阿里云:提供 PAI 和机器学习平台等 AI 产品,支持主流深度学习框架部署,与阿里云其他产品生态集成度高。部署 AIGC 服务通常需要大量算力和存储资源,利用云平台是便捷的选择。建议先评估实际业务场景和需求,再对比不同供应商的产品特性和价格,以选择最合适的部署方案。
2025-03-03
用AI生成角色原画的现状
目前,用 AI 生成角色原画既有优势也存在一些问题。 优势方面: Niji·journey 5 作为表现优异的在线二次元角色设计 AI,能在各种类型的二次元设计中发挥重要作用。 对于游戏中的角色设计,AI 设计可以提供参考和辅助。 问题方面: Niji·journey 5 存在对流行二次元风格的偏好、风格相对固定以及版权风险等局限性。 AI 设计生成的角色往往需要进一步修饰和调整以符合游戏整体风格和要求,不能完全掌握角色设计的细节和规律。 AI 绘画生成的设计可能存在版权问题。 未来展望: Niji 有望通过改进算法和扩大数据样本来源,提升角色设计的创新性和独特性,满足不同用户和项目的需求。 随着技术进步,Midjourney 等 AI 不断升级,使用 AI 辅助游戏美术设计师工作将成为趋势。但美术设计师需不断学习新技能和知识,拓展多领域知识,以应对未来变化和挑战。游戏美术中各职业分类的界限可能会越来越模糊。
2025-03-03
我应该如何自学ai
以下是关于自学 AI 的一些建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 6. 对于中学生自学 AI 的建议: 从编程语言入手学习,如 Python、JavaScript 等,学习编程语法、数据结构、算法等基础知识。 尝试使用 AI 工具和平台,如 ChatGPT、Midjourney 等,探索面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 学习 AI 基础知识,包括基本概念、发展历程、主要技术如机器学习、深度学习等,以及在教育、医疗、金融等领域的应用案例。 参与 AI 相关的实践项目,参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动,尝试利用 AI 技术解决生活中的实际问题。 关注 AI 发展的前沿动态,关注权威媒体和学者,思考 AI 技术对未来社会的影响。 7. 使用 AI 来做事: 利用人工智能帮助教育和自学学习,可以要求人工智能解释概念并获得结果。但因为人工智能可能会产生幻觉,所以对于关键数据要根据其他来源仔细检查。
2025-03-03
让AI帮我写一篇论文的文献综述,怎么命令
利用 AI 写一篇论文的文献综述可以参考以下步骤: 1. 确定课题主题:明确研究兴趣和目标,选择具有研究价值和创新性的主题。 2. 收集背景资料:使用学术搜索引擎和文献管理软件等 AI 工具搜集相关研究文献和资料。 3. 分析和总结信息:借助 AI 文本分析工具提取收集资料中的关键信息和主要观点。 4. 生成大纲:利用 AI 写作助手生成包括引言、文献综述、方法论、结果和讨论等部分的大纲。 5. 撰写文献综述:使用 AI 工具辅助撰写,确保内容准确完整。 6. 构建方法论:根据研究需求,参考 AI 建议的方法和技术设计研究方法。 7. 数据分析:若课题涉及数据,使用 AI 数据分析工具处理和解释。 8. 撰写和编辑:依靠 AI 写作工具撰写各部分,并检查语法和风格。 9. 生成参考文献:通过 AI 文献管理工具生成正确格式的参考文献。 10. 审阅和修改:利用 AI 审阅工具检查课题的逻辑性和一致性,根据反馈修改。 11. 提交前的检查:使用 AI 抄袭检测工具确保课题的原创性,并做最后的格式调整。 需要注意的是,AI 工具只是辅助,不能完全替代研究者的专业判断和创造性思维。在使用时应保持批判性思维,确保研究质量和学术诚信。
2025-03-03
用ai帮助聊天
以下是关于用 AI 帮助聊天的相关内容: Cursor 官方: Chat 聊天:允许您与看到您的代码库的 AI 交谈。聊天室始终可以看到您当前的文件和光标,您可以向它询问诸如“这里有 bug 吗”等问题。您可以使用⌘+Shift+L 或“@”将特定代码块添加到上下文中,也可以使用⌘+Enter 与整个代码库聊天。 代码库答案:使用@Codebase 或⌘Enter 询问有关您的代码库的问题,Cursor 会搜索您的代码库以查找与您的查询相关的代码。 引用您的代码:带有@符号的参考代码可用作 AI 的上下文,只需键入@即可查看文件夹中所有文件和代码符号的列表。 使用图像:点击聊天下方的图片按钮,或将图片拖到输入框中,将视觉上下文包含在聊天中。 学习笔记:Generative AI for Everyone 吴恩达: 阅读方面:可以让 LLM 检查文本错误、总结长句。客服人员针对每一位用户传递大量信息时,可内置 LLM 快速总结信息提供给决策管理层,使用 LLM 进行语义分析,将邮箱、客户留言等外部信息传递给相关部门。构建处理信息的 LLM 模型时,要设置好提示词,持续优化。 聊天方面:聊天机器人可用于做旅游计划、职业咨询、做饭建议等,不仅能生成文本,还能产生进一步行动,如处理文本后发送订单信息等。建立聊天机器人的流程为:开始于内部聊天机器人,确保良好表现并避免问题;设置人为参与链路;确保安全后,让机器人对接用户。 大语言模型行与不行:能做类似于应届生能做的事;不可做的包括时间限制(如 GPT3 只有 2022 年 1 月前的数据)、会出现幻觉、接受有限的 prompt、输出有限制、不可以很好处理结构化数据、可能输出有害的信息。 @Chat:此功能目前仅适用于 Cmd K。您可以在 Cmd K 中使用@Chat 将当前聊天消息添加为上下文,当您与希望应用于编辑或生成代码的 AI 进行对话时很有用。
2025-03-03
大模型中的参数是什么
大模型中的参数主要指模型中的权重(weight)与偏置(bias)。例如,GPT3 拥有 1750 亿参数,其中权重数量达到了这一量级,而词汇表 token 数只有 5 万左右。在 LLM 中,由于模型参数非常多,如 GPT2 有 1.5B 参数,每个参数用 float32 表示,所需内存大小为 4 bytes1,500,000,000 = 6GB,更先进的模型如 LLAMA 有 65B 参数,所需内存就需要 260G(这还是在不考虑词汇表的情况下)。因此在进行模型实际部署时,会进行模型的压缩。
2025-03-03
炼丹需要了解的参数
炼丹需要了解的参数主要包括以下方面: 1. 学习步数:指 AI 对每张图片的学习次数。二次元图片的 repeat 一般在 10 15,写实人物图片的 repeat 一般在 30 50,真实世界的景观场景可能要达到 100。repeat 值越高,AI 对图片的理解越好,但图片精细度越高,学习步数也要越高。 2. 循环次数:AI 将所有图片按照学习步数学习一轮即为一次循环,循环次数指将这个过程重复的遍数。一般数值在 10 20 之间,次数并非越多越好,过多可能导致过拟合,即训练结果过于僵化。 3. 训练总步数:通过图片张数×学习步数×循环次数计算得出。例如 5 张图片,学习步数 50,循环次数 10,训练总步数为 2500 步。
2025-02-21
大模型相关术语中,参数和Token分别指什么?
在大模型相关术语中: 参数:主要指模型中的权重(weight)与偏置(bias),大模型的“大”通常体现在用于表达 token 之间关系的参数数量众多,例如 GPT3 拥有 1750 亿参数,其中权重数量达到了这一量级。 Token:大模型有着自己的语言体系,Token 是其语言体系中的最小单元。人类语言发送给大模型时,会先被转换为大模型的语言,这种转换的基本单位就是 Token。不同厂商的大模型对 Token 的定义可能不同,以中文为例,通常 1 Token 约等于 1 2 个汉字。大模型的收费计算方法以及对输入输出长度的限制,通常都是以 Token 为单位计量的。Token 可以代表单个字符、单词、子单词,甚至更大的语言单位,具体取决于所使用的分词方法(Tokenization),在将输入进行分词时,会对其进行数字化,形成一个词汇表。
2025-02-13
我的工作需要根据元数据表在本地查询大量数据,并把匹配的数据参数复制到元数据表,有没有智能体可以做这个工作
智能体可以帮助您完成根据元数据表在本地查询大量数据,并把匹配的数据参数复制到元数据表的工作。 智能体可以根据其复杂性和功能分为以下几种类型: 1. 简单反应型智能体:根据当前的感知输入直接采取行动,不维护内部状态,也不考虑历史信息。例如温控器,它根据温度传感器的输入直接打开或关闭加热器。 2. 基于模型的智能体:维护内部状态,对当前和历史感知输入进行建模,能够推理未来的状态变化,并根据推理结果采取行动。比如自动驾驶汽车,它不仅感知当前环境,还维护和更新周围环境的模型。 3. 目标导向型智能体:除了感知和行动外,还具有明确的目标,能够根据目标评估不同的行动方案,并选择最优的行动。例如机器人导航系统,它有明确的目的地,并计划路线以避免障碍。 4. 效用型智能体:不仅有目标,还能量化不同状态的效用值,选择效用最大化的行动,评估行动的优劣,权衡利弊。比如金融交易智能体,根据不同市场条件选择最优的交易策略。 5. 学习型智能体:能够通过与环境的交互不断改进其性能,学习模型、行为策略以及目标函数。例如强化学习智能体,通过与环境互动不断学习最优策略。 在实际应用中,多智能体 AI 搜索引擎的方案如下: 1. 第一步,快速搜索补充参考信息:根据用户的任务,使用搜索工具补充更多的信息,例如使用工具 API WebSearchPro。 2. 第二步,用模型规划和分解子任务:使用大模型把用户问题拆分成若干子搜索任务,并转换为 JSON 格式。 3. 第三步,用搜索智能体完成子任务:AI 搜索智能体具备联网搜索的能力,还能够自主分析并进行多轮搜索任务。 4. 第四步,总结子任务生成思维导图:智能体能调用各种插件,如思维导图、流程图、PPT 工具等。 此外,生物医药小助手智能体是由 1 个工作流和 6 个数据库实现的。工作流相对简单,而数据库包括公众号文章、执业药师教材、执业医师讲义、药监局新药审评报告、中国医药企业融资动态、药物对外授权动态、全球药物销售额等。在医疗领域,为保证回答的准确性,提示词约定回答只能来自于知识库。其商业化场景包括医药企业研发立项、科研机构临床转化评估、投资机构评估标的公司等。
2025-02-07
如果让提示词变成模板, 每次输入需要的参数就好。
要将提示词变成模板,每次输入需要的参数即可。以下是一些相关的方法和要点: 在 Stable Diffusion 中,下次作图时先选择模板,点击倒数第二个按钮可快速输入标准提示词。描述逻辑通常包括人物及主体特征(如服饰、发型发色、五官、表情、动作)、场景特征(室内室外、大场景、小细节)、环境光照(白天黑夜、特定时段、光、天空)、画幅视角(距离、人物比例、观察视角、镜头类型)、画质(高画质、高分辨率)、画风(插画、二次元、写实)等,通过这些详细提示词能更精确控制绘图。新手可借助功能型辅助网站书写提示词,如 http://www.atoolbox.net/ (通过选项卡快速填写关键词信息)、https://ai.dawnmark.cn/ (每种参数有缩略图参考),还可去 C 站(https://civitai.com/)抄作业,复制每张图的详细参数粘贴到正向提示词栏,注意图像作者使用的大模型和 LORA,也可选取部分好的描述词使用。 简单的提示词模板最终目标是把需求说清楚,如 GPTs 提示词模板:Act like a 输入最终结果),并给出了示例。 提示词母体系列(2)中,在掌握人物设计整体框架后编写提示词,可借鉴替换方式替换模板。模板构成包括:先看约束部分,规则放顶部加强约束,底部也有相应约束,整个约束包裹具体提示词以提示模型专注性;模板结构有基本信息(姓名、性别、年龄、职业)、外貌特征、背景和经历、性格和价值观、爱好特长和语言风格、人际关系和社交活动、未来规划和目标。
2025-01-28
Roo Code 的API Provider 参数哪里设置
要设置 Roo Code 的 API Provider 参数,您可以按照以下步骤进行操作: 1. 首先,进入 deepseek 的官网(https://www.deepseek.com/)。 2. 进入右上角的 API 开放平台。早期 deepseek 是有赠送额度,如果没有赠送的余额,可以选择去充值,支持美元和人民币两种结算方式,以及各种个性化的充值方式,并创建一个 API key。注意,API key 只会出现一次,请及时保存下来。 3. 接下来,以 cursor 作为代码编辑器为例,下载安装 cursor(https://www.cursor.com/),在插件页面搜索并安装 Roocline。安装完后,打开三角箭头,就可以看到 RooCline,选中 RooCline,并点击齿轮,进入设置。 4. 依次设置配置基本参数: API Provider:选择 DeepSeek。 API Key:填入已创建的 key。 模型:选择 DeepSeekreasoner。 5. 进行语言偏好设置。 6. 小贴士:记得把 HighRisk 选项都打开,这样 AI 才能帮您自动生成文件。最后做完所有不要忘记点击 Done 保存修改。在聊天框输入产品需求,输入需求后点击这个 blingbling 的星星,优化提示词。最终,在 deepseekr1 的加持下基本上是一遍过,各种特效效果交互逻辑也都正确。画面也算优雅,交互效果也不错,是您想要的。
2025-01-26
大模型中的权重与偏置是什么
在大模型中,权重(weight)和偏置(bias)是非常重要的概念。 大模型的“大”主要体现在用于表达 token 之间关系的参数众多,其中就包括权重和偏置。例如 GPT3 拥有 1750 亿参数,其中权重数量达到了这一量级,而词汇表 token 数只有 5 万左右。 以 Transform 为代表的大模型采用自注意力(Selfattention)机制来学习不同 token 之间的依赖关系,生成高质量 embedding。 在感知机学习算法中,感知机的输出和人类标记的正确答案进行比较,如果答案错误,权重和阈值会发生变化。每个权重的变化量取决于与其相关的输入值。对于每个权重 wj:wj←wj+ηxj,其中 t 表示正确的输出(1 或 0);对于给定的输入,y 是感知机的实际输出;xj 是与权重 wj 有关的输入;η是由程序员给出的学习速率。阈值通过创建一个附加的输入 x0 合并得到,x0 为常数 1,其相对应的权重 w0=threshold(阈值)。只有在输入与权重的乘积,即输入向量与权重向量之间的点积大于或等于 0 时,感知机才会被触发。 在某些案例中,比如判断数字大小的问题中,不同概念的权重不同,会影响模型的判断结果。例如 9.11 作为日期“概念”的权重可能比它是个数字“概念”的权重大。
2025-03-03
推理行大模型对于RAG的准确性提升,带来哪些改变
推理行大模型对 RAG 准确性提升带来了以下改变: 1. 当辅以能有效提取文档中结构化信息并整合为提示词的 PDF 解析器时,大语言模型能作出更准确的响应,提高了提供给模型的数据质量和相关性,从而提升模型输出质量。 2. 大模型应用领域常用的 RAG 方法,能让模型用自定义数据生成结果,处理无尽私有数据,将模型当成高效推理机器。但 RAG 存在一些常见误区: 随意输入任何文档不一定能得到准确回答,RAG 流程中的多个环节都会影响最终质量。 RAG 虽能减少幻觉,但不能完全消除,只要有大模型参与就可能产生幻觉。 RAG 仍消耗大模型的 Token,最终需大模型处理检索结果生成通顺回答。 未来,将研究分享更多基于深度学习的文档解析方法,以更全面理解 RAG 质量和文档解析质量的关系。同时,前沿模型研发团队力争做到吞吐量、速度和准确度的最佳平衡。
2025-03-03
怎么利用大模型训练自己的机器人
利用大模型训练自己的机器人可以参考以下内容: OpenAI 通用人工智能(AGI)的计划显示,在互联网上所有的图像和视频数据上训练一个与人类大脑大小相当的 AI 模型,将足以处理复杂的机器人学任务。常识推理隐藏在视频和文本数据中,专注于文本的 GPT4 在常识推理上表现出色。Google 最近的例子展示了机器人学能力可从大型视觉/语言模型中学习,在语言和视觉训练基础上,只需最少的机器人学数据,视觉和文本任务的知识就能转移到机器人学任务上。特斯拉训练的“Optimus”通过人类示范学习抓取物体,若人类示范是先进机器人学性能所需的一切,在互联网上所有视频上训练的大模型肯定能实现惊人的机器人学性能。 梦飞提供了在自己的电脑上部署 COW 微信机器人项目的教程,程序在本地运行,若关掉窗口进程结束,想持续使用需保持窗口打开和运行。以 Windows10 系统为例,注册大模型可参考百炼首页:https://bailian.console.aliyun.com/ ,需更改"model"和添加"dashscope_api_key",获取 key 可参考视频教程。 张梦飞提供了从 LLM 大语言模型、知识库到微信机器人的全本地部署教程,部署大语言模型包括下载并安装 Ollama,根据电脑系统下载:https://ollama.com/download ,安装完成后将下方地址复制进浏览器中确认安装完成:http://127.0.0.1:11434/ 。下载 qwen2:0.5b 模型,Windows 电脑按 win+R 输入 cmd 回车,Mac 电脑通过 Command(⌘)+Space 键打开 Spotlight 搜索输入“Terminal”或“终端”,复制命令行粘贴回车等待下载完成。
2025-03-03
帮我找出现在成熟的人工智能大模型,列举他们的功能,附上打开链接
以下是一些成熟的人工智能大模型及其功能和链接: 百度(文心一言):https://wenxin.baidu.com 。 抖音(云雀大模型):https://www.doubao.com 。 智谱 AI(GLM 大模型):https://chatglm.cn 。 中科院(紫东太初大模型):https://xihe.mindspore.cn 。 百川智能(百川大模型):https://www.baichuanai.com/ 。 商汤(日日新大模型):https://www.sensetime.com/ 。 MiniMax(ABAB 大模型):https://api.minimax.chat 。 上海人工智能实验室(书生通用大模型):https://internai.org.cn 。 在这些大模型中: 能生成 Markdown 格式的:智谱清言、商量 Sensechat、MiniMax 。 目前不能进行自然语言交流的:昇思、书生 。 受限制使用:MiniMax(无法对生成的文本进行复制输出,且只有 15 元的预充值额度进行体验,完成企业认证后可以进行充值) 。 特色功能:昇思——生图,MiniMax——语音合成 。 此外,还有其他一些大模型: OpenAI 系统:包括 3.5 和 4.0 版本,一个新的变种使用插件连接到互联网和其他应用程序。Code Interpreter 是一个非常强大的 ChatGPT 版本,可以运行 Python 程序。如果未为 OpenAI 付费,只能使用 3.5 。除了插件变种和一个暂时停用的带有浏览功能的 GPT4 版本之外,这些模型都没有连接到互联网。微软的 Bing 使用 4 和 3.5 的混合,通常是 GPT4 家族中首个推出新功能的模型,例如可以创建和查看图像,且可以在网页浏览器中阅读文档,并连接到互联网。 谷歌:一直在测试自己的人工智能 Bard,由各种基础模型驱动,最近是一个名叫 PaLM 2 的模型。 Anthropic:发布了 Claude 2,其最值得注意的是有一个非常大的上下文窗口,本质上是 LLM 的记忆。Claude 几乎可以保存一整本书或许多 PDF,与其他大型语言模型相比,它不太可能恶意行事。
2025-03-03
flux模型放在那个文件夹
FLUX 模型的放置位置如下: FLUX.1等版本的模型应放在 ComfyUI/models/unet/文件夹中。如果爆显存了,“UNET 加载器”节点中的 weight_dtype 可以控制模型中权重使用的数据类型,设置为 fp8 可降低显存使用量,但可能会稍降质量,默认的 weight_type 显存使用较大。 t5xxl_fp16.safetensors 和 clip_l.safetensors 应放在 ComfyUI/models/clip/文件夹里面。可以使用 t5xxl_fp8_e4m3fn.safetensors 来降低内存使用率,若有超过 32GB 内存,建议使用 fp16。 下载的 Vae 模型应放入 ComfyUI/models/vae 文件夹。 同时,以下模型也有对应的放置位置: flux1dev.safetensors 放在 ComfyUI/models/unet/目录下。 t5xxl_fp16.safetensors 和 clip_l.safetensors 放在 ComfyUI/models/clip/目录下。 ae.safetensors 放在 ComfyUI/models/vae/目录下。 flux1dev.safetensors 是底模,ae.safetensors 是 VAE,clip_l.safetensors 和 t5xxl_fp16.safetensors 是关于文字语言编码。
2025-03-03
请向中老年人自媒体博主推荐常用有效、简单便捷的几个AI工具
以下是为中老年人自媒体博主推荐的常用有效、简单便捷的 AI 工具: 1. 创作方面: AI 研究工具:Claude、ChatGPT、Bing Chat、Perplexity。 图片处理:DallE、Leonardo、BlueWillow、Midjourney。 版权写作:Rytr、Copy AI、Wordtune、Writesonic。 设计:Canva、Clipdrop、Designify、Microsoft Designer。 网站搭建:10Web、Framer、Hostinger、Landingsite。 视频处理:Klap、Opus、Invideo、Heygen。 音频处理:Murf、LovoAI、Resemble、Eleven Labs。 SEO 优化:Alli AI、BlogSEO、Seona AI、Clearscope。 Logo 设计:Looka、LogoAI、Brandmark、Logomaster。 聊天机器人:Droxy、Chatbase、Voiceflow、Chatsimple。 自动化工具:Make、Zapier、Bardeen、Postman。 市场营销:相关工具未明确提及。 2. 数字人工具: 开源且适合小白用户,特点是一键安装包,无需配置环境,简单易用。功能包括生成数字人视频,支持语音合成和声音克隆,操作界面中英文可选。系统兼容 Windows、Linux、macOS,模型支持 MuseTalk(文本到语音)、CosyVoice(语音克隆)。使用步骤为下载 8G+3G 语音模型包,启动模型即可。GitHub 链接: 。 3. 视频生成工具: Google Veo 2,生成的视频接近真实,几乎难以分辨,适合创作和内容制作。相关链接:
2025-02-25
常用的提示词框架有哪些?
常用的提示词框架有以下几种: 1. CRISPE(Capacity and Role,Insight,Statement,Personality,Experiment) 2. BROKE(Background,Role,Objectives,Key Results,Evolve) 3. ICIP 框架:包括指令(Instruction,必须)、背景信息(Context,选填)、输入数据(Input Data,选填)和输出指示器(Output Indicator,选填) 4. 情境
2025-02-24
常用的AI助手
以下是一些常用的 AI 助手: 辅助编程的 AI 产品: GitHub Copilot:由 GitHub 联合 OpenAI 和微软 Azure 团队推出,支持多种语言和 IDE,能快速提供代码建议。 通义灵码:阿里巴巴团队推出,提供多种编程相关能力。 CodeWhisperer:亚马逊 AWS 团队推出,由机器学习技术驱动,实时提供代码建议。 CodeGeeX:智谱 AI 推出的开源免费 AI 编程助手,基于 130 亿参数的预训练大模型。 Cody:Sourcegraph 推出的 AI 代码编写助手,借助强大的代码语义索引和分析能力。 CodeFuse:蚂蚁集团支付宝团队推出的免费 AI 代码助手。 Codeium:由 AI 驱动的编程助手工具,提高编程效率和准确性。 更多辅助编程 AI 产品,可查看:https://www.waytoagi.com/category/65 。每个工具功能和适用场景不同,可根据需求选择。 营销领域的 AI 产品: Synthesia:允许创建 AI 生成的高质量视频,包括数字人视频,多种定价计划。 HeyGen:基于云的 AI 视频制作平台,可生成数字人视频。 Jasper AI:人工智能写作助手,用于生成营销文案等。 Copy.ai:AI 营销文案生成工具,有免费和付费计划。 Writesonic:AI 写作助手,专注营销内容创作。 更多营销产品可查看:https://www.waytoagi.com/sites?tag=8 。这些工具能帮助营销人员高效创作,根据需求选择。 AI 与宠物结合的方式: AI 宠物助手:基于自然语言处理和计算机视觉,帮助主人照顾宠物,如识别情绪、提供饮食建议、监测健康状况。 AI 宠物互动玩具:利用 AI 技术开发智能互动玩具,增强宠物娱乐体验。 AI 宠物图像生成:使用生成式 AI 模型生成宠物形象图像,定制个性化形象。 AI 宠物医疗诊断:利用计算机视觉和机器学习技术开发辅助诊断系统,提供初步诊断建议。 AI 宠物行为分析:基于传感器数据和计算机视觉分析行为模式,帮助主人了解宠物需求和习性。 学习路径建议:掌握基础的机器学习、计算机视觉、自然语言处理等 AI 技术;了解宠物行为学、宠物医疗等相关知识;关注业内先进案例;尝试开发原型并迭代优化。AI+宠物是新兴赛道,充满想象空间,可开发出有趣有用的应用。
2025-02-17
目前有哪些常用的AI
目前常用的 AI 包括以下方面: 应用场景: 医疗保健:医学影像分析辅助诊断疾病、加速药物研发、提供个性化医疗方案、控制手术机器人提高手术精度和安全性。 金融服务:风控和反欺诈、信用评估辅助贷款决策、投资分析、提供 24/7 客户服务并回答常见问题。 零售和电子商务:产品推荐、改善搜索结果和提供个性化购物体验、动态定价、提供聊天机器人服务。 制造业:预测机器故障进行维护、检测产品缺陷提高质量、优化供应链、控制工业机器人提高生产效率。 交通运输:尚未详细列举。 图生图产品: Artguru AI Art Generator:在线平台,生成逼真图像,为设计师提供灵感。 Retrato:将图片转换为非凡肖像,有 500 多种风格选择,适合制作个性头像。 Stable Diffusion Reimagine:通过稳定扩散算法生成精细、具细节的全新视觉作品。 Barbie Selfie Generator:将上传照片转换为芭比风格。 Excel 相关的 AI: Excel Labs:Excel 插件,新增生成式 AI 功能,基于 OpenAI 技术进行数据分析和决策支持。 Microsoft 365 Copilot:整合 Word、Excel 等办公软件,通过聊天形式完成任务。 Formula Bot:提供数据分析聊天机器人和公式生成器功能。 Numerous AI:支持 Excel 和 Google Sheets,能生成文本内容、执行情感分析、语言翻译等。
2025-02-17
ai换脸 常用工具
以下是一些常用的 AI 换脸工具及相关操作方法: 1. facefusion 工具: 云服务解决方案: 选择 AutoDL 平台(官网:https://www.autodl.com/home ),注册后在算力市场中选择能接受价格且 GPU 配置较高的算力服务器。 在算法社区查找 facefusion 镜像,点击右侧合适的镜像(左侧的可能有问题)。 点击右下角的创建实例按钮,创建并启动实例(即启动一台服务器)。 点击快捷工具中顶部的 JupyterLab 打开工具,通过终端输入以下命令: 查看文件列表:输入“ls”并按回车,显示当前位置所在目录下的文件列表。 进入 facefusion 目录:输入“cd facefusion”并按回车,进入程序目录。 启动 facefusion:输入“python./run.pyexecutionproviders cuda cpu”(注意后面的参数“executionproviders cuda cpu”非常重要,如果不加“cuda”,默认不使用 GPU 能力,推理将非常慢)。 当出现提示信息时,说明启动成功。 打开 facefusion 软件,返回实例列表,点击自定义服务按钮,会打开新的浏览器窗口,通过 web 浏览器访问 facefusion 提供的 UI 界面,上传准备好的图片、视频,在右侧可看到预览效果,点击下方的开始按钮执行换脸处理。 本机解决方案: 该软件需要 python 环境及安装视频解码器等多个依赖软件,需要一定编程知识,可参考网站 https://docs.facefusion.io/ 进行本地安装。 由于 facefusion 的运行推理计算速度非常依赖 GPU,若本地计算机没有 GPU 或 GPU 显存较小,执行速度将会非常缓慢。 2. 开源地址:https://github.com/facefusion/facefusion
2025-02-16
请问抖音中的小说短视频通常用什么软件来做
抖音中的小说短视频通常可以使用以下软件和流程来制作: 制作流程: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 工具与网址: 1. Stable Diffusion(SD):一种 AI 图像生成模型,可以基于文本描述生成图像。网址: 2. Midjourney(MJ):另一个 AI 图像生成工具,适用于创建小说中的场景和角色图像。网址: 3. Adobe Firefly:Adobe 的 AI 创意工具,可以生成图像和设计模板。网址: 4. Pika AI:文本生成视频的 AI 工具,适合动画制作。网址: 5. Clipfly:一站式 AI 视频生成和剪辑平台。网址: 6. VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能。网址: 7. 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具。网址: 8. 故事 AI 绘图:小说转视频的 AI 工具。网址: 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。
2025-02-09