直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

GPT4现在参数量多大

回答

GPT-4 的参数规模约为 1.8 万亿。此前传言称,一个 GB200 NVL72 机柜可以训练 27 万亿参数的模型,相当于能训练近 15 个参数规模为 1.8 万亿的 GPT-4 模型。另有网友戏称,“老黄确认 GPT-4 是 1.8 万亿参数”。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

老黄祭出新核弹B200!30倍H100单机可训15个GPT-4模型,AI迎新摩尔时代

当然,有了Blackwell超级芯片,当然还会有Blackwell组成的DGX超算。这样,公司就会大量购入这些GPU,并将它们封装在更大的设计中。GB200 NVL72是将36个Grace CPU和72个Blackwell GPU集成到一个液冷机柜中,可实现总计720 petaflops的AI训练性能,或是1,440 petaflops(1.4 exaflops)的推理性能。它内部共有5000条独立电缆,长度近两英里。它的背面效果如下图所示。机柜中的每个机架包含两个GB200芯片,或两个NVLink交换机。一共有18个GB200芯片托盘,9个NVLink交换机托盘有。老黄现场表示,「一个GB200 NVL72机柜可以训练27万亿参数的模型」。此前传言称,GPT-4的参数规模达1.8万亿,相当于能训练近15个这样的模型。与H100相比,对于大模型推理工作负载,GB200超级芯片提供高达30倍的性能提升。那么,由8个系统组合在一起的就是DGX GB200。总共有288个Grace CPU、576个Blackwell GPU、240 TB内存和11.5 exaflop FP4计算。这一系统可以扩展到数万个GB200超级芯片,通过Quantum-X800 InfiniBand(最多144个连接)或Spectrum-X800ethernet(最多64个连接)与800Gbps网络连接在一起。配备DGX GB200系统的全新DGX SuperPod采用统一的计算架构。除了第五代NVIDIA NVLink,该架构还包括NVIDIA Bluefield-3 DPU,并将支持Quantum-X800 InfiniBand网络。

老黄祭出新核弹B200!30倍H100单机可训15个GPT-4模型,AI迎新摩尔时代

网友们纷纷惊叹,Blackwell再一次改变了摩尔定律。英伟达高级科学家Jim Fan表示:Blackwell,城里的新野兽。DGX Grace-Blackwell GB200:单机架计算能力超过1 Exaflop。-从这个角度来看:老黄交付给OpenAI的第一台DGX是0.17 Petaflops。- GPT-4-1.8T参数在2000张Blackwell上可在90天内完成训练。新摩尔定律诞生了。贾扬清回忆道,「我记得在Meta,当我们在一小时内(2017年)训练ImageNet时,总计算量约为1exaflop。这意味着有了新的DGX,理论上你可以在一秒钟内训练ImageNet」。还有网友表示,「这简直就是野兽,比H100强太多」。另有网友戏称,「老黄确认GPT-4是1.8万亿参数」。所以,GB200的成本是多少呢?英伟达目前并没有公布。此前据分析师估计,英伟达基于Hopper的H100芯片,每颗的成本在25,000美元到40,000美元之间,整个系统的成本高达200,000美元。而GB200的成本,只可能更高。

老黄祭出新核弹B200!30倍H100单机可训15个GPT-4模型,AI迎新摩尔时代

凭借H100成为全球市值第三大公司的英伟达,今天再次推出了性能野兽——Blackwell B200 GPU和GB200「超级芯片」。它以著名数学家David Blackwell(1919-2010)命名。他一生中对博弈论、概率论做出了重要的贡献。老黄表示,「30年来,我们一直在追求加速计算,目标是实现深度学习和AI等变革性突破。生成式AI已然成为我们这个时代的标志性技术,而Blackwell将是推动这场新工业革命的引擎」。「我们认为这是个完美的博弈概率」。全新B200 GPU拥有2080亿个晶体管,采用台积电4NP工艺节点,提供高达20 petaflops FP4的算力。与H100相比,B200的晶体管数量是其(800亿)2倍多。而单个H100最多提供4 petaflops算力,直接实现了5倍性能提升。而GB200是将2个Blackwell GPU和1个Grace CPU结合在一起,能够为LLM推理工作负载提供30倍性能,同时还可以大大提高效率。值得一提的是,与H100相比,它的成本和能耗「最多可降低25倍」。过去,训练一个1.8万亿参数的模型,需要8000个Hopper GPU和15MW的电力。如今,2000个Blackwell GPU就能完成这项工作,耗电量仅为4MW。在GPT-3(1750亿参数)大模型基准测试中,GB200的性能是H100的7倍,训练速度是H100的4倍。GB200由2个GPU、1个CPU、一个主板组成全新芯片其中一个关键改进是,采用了第二代Transformer引擎。对每个神经元使用4位(20 petaflops FP4)而不是8位,直接将算力、带宽和模型参数规模提高了一倍。

其他人在问
GPT4o能免费用几次
ChatGPT 4o 可以免费体验,但免费体验次数很有限。截至 2024 年 5 月 13 日,Plus 用户在 GPT4o 上每 3 小时最多发送 80 条消息。免费套餐的用户将默认使用 GPT4o,且使用 GPT4o 发送的消息数量受到限制,具体数量会根据当前的使用情况和需求而有所不同。当不可用时,免费层用户将切换回 GPT3.5。
2024-10-26
chatgpt4o免费的模型和付费的模型有什么区别
ChatGPT 免费的模型(如 GPT3.5)和付费的模型(如 GPT4o 的 PLUS 套餐)主要有以下区别: 1. 知识更新时间:ChatGPT 3.5 的知识更新到 2022 年 1 月,ChatGPT 4o 的知识更新到 2023 年 10 月,而 ChatGPT 4 更新到 2023 年 12 月。 2. 智能程度:GPT3.5 的智能程度明显低于 GPT4o。 3. 功能:GPT3.5 无法使用 DALL.E3(AI 画图功能)、GPTs 商店和高级数据分析等插件。 4. 费用:想要使用更多功能更智能的 GPT4o 需要升级到 PLUS 套餐,收费标准是 20 美金一个月。GPT4 还有团队版企业版,费用更贵,一般推荐使用 PLUS 套餐即可。 此外,ChatGPT 4o 发布后,虽称可免费体验,但免费体验次数很有限。
2024-10-26
GPT4自主学习
GPT4 具有一定的自主学习能力: Ilya Sutskever 在 5 年前分享过名为 Selfplay 的概念,即两个 AI 在虚拟环境中相互博弈,通过 RL 最终实现学习能力。在 ChatGPT Code Interpreter 环境下,用户使用自然语言 Prompt 转为 code,Code Interpreter 反馈出错信息,GPT 会根据错误信息再次调整 code 直至成功运行,完成指令。基于这样的技术框架,GPT 通过 prompt to code 实现语义理解、语音转换、视觉分析、图像生成、API 调度等一系列 Action,用户甚至可以自定义 AR 的交互方式。 在报告《GPT4 通用人工智能的火花》中,测试了该模型在计划和解决问题方面的能力,以及通过玩各种游戏和与工具互动来快速学习和从经验中学习的能力。特别是,GPT4 能够使用工具(包括自身),这对构建真实世界应用程序非常重要。 在编程方面,要求 GPT4 和 ChatGPT 编写自定义优化器模块,虽然两个模型都生成了语法有效的代码,但只有 GPT4 的响应在很大程度上与指令匹配。
2024-10-19
chatgpt4.0.1有什么新功能,比chatgpt4先进在哪些方面
ChatGPT 4.0.1 相较于 ChatGPT 4 具有以下新功能和先进之处: 1. 大大减少了幻觉,在内部对抗性设计的事实性评估中得分更高,比最新的 GPT3.5 高 19 个百分点。 2. 在遵循用户意图的能力方面有很大改进,在 70.2%的提示中,产生的响应比 GPT3.5 更受欢迎。 3. 在各种语言中的表现更优,包括低资源语言。 4. 知识更新方面,ChatGPT 4.0.1 知识更新到 2023 年 12 月,而 ChatGPT 4o 的知识更新到 2023 年 10 月。 需要注意的是,尽管 ChatGPT 4.0.1 有这些优势,但它仍存在与早期 GPT 模型类似的局限性,如对事实产生“幻觉”和出现推理错误等,在使用其输出时应谨慎。
2024-09-14
如何连接GPT4o
以下是连接 GPT4o 的方法: 1. 对于 ChatGPT Mac 客户端: 下载地址:persistent.oaistatic.com/sidekick/public/ChatGPT_Desktop_public_latest.dmg 使用 Proxyman、Charles 或您喜欢的网络代理来进行以下操作(需要有 ChatGPT 付费账号,以及网络技术基础):以 ProxyMan 为例 登录一次以触发 API 调用 对 ChatGPT 的 App 启用 SSL 代理(需要配置好 ProxyMan 证书) 再登录一次以触发 API 调用 然后右键点击 ab.chatgpt.com/v1/initialize 选择本地映射,并将所有的 false 替换为 true 再尝试一次,您就应该能顺利登录了。 详细版图文教程: 2. 对于安卓系统: 先在 Google play 中的【支付和订阅】【支付方式】中绑定好银行卡 然后在区 chatgpt 里订阅 Plus,操作如下截图 完成后即可开始使用 ChatGPT 4o
2024-08-18
gpt4o mini有关的文档
以下是关于 GPT4o mini 的相关文档信息: Open AI 发布了 GPT4o mini 模型。其 MMLU 得分为 82%,碾压其他同级别小模型。价格较低,为 0.15 美元/100 万 token 输入和 0.6 美元/100 万 token 输出,比 GPT3.5 Turbo 便宜超过 60%。具有 128k 的大上下文窗口,非常适合 RAG。GPT4o mini 在 API 中支持文本和图片,未来将支持文本、图像、视频和音频输入和输出。GPT4o mini 接替 3.5 成为 ChatGPT 中的免费模型,目前还不支持多模态,而且 4o mini 的 API 一旦涉及到图片 Token 数量也会大增。
2024-08-17
现在AI开展到了什么水平?国内外AI发展差距有多大?
目前,AI 在多个领域取得了显著进展。在 2024 年内,图片和超短视频的精细操控能力将得到提升,包括表情、细致动作和视频文字匹配等方面。生成式短视频将具备一定操控能力,风格化和动漫风将最先成熟,真人风格稍晚。AI 音频能力也将有长足进展,带感情的 AI 配音基本成熟。“全真 AI 颜值网红”将出现,可以稳定输出视频并进行直播带货。游戏 AI NPC 将有里程碑式进展,带来新的游戏生产方式。AI 男/女朋友聊天将基本成熟,在记忆方面有明显突破,能够较好模拟人的感情,产品将加入视频和音频,粘性提升并开始出圈。实时生成的内容将开始在社交媒体内容和广告中出现。AI Agent 将有明确进展,办公场景中的“AI 助手”将开始有良好使用体验。AI 的商业模式也将开始有明确用例,如数据合成、工程平台和模型安全等。可穿戴全天候 AI 硬件将层出不穷,但大多数可能不会成功。中国 AI 有望达到或超过 GPT4 水平,美国可能会出现 GPT5,世界上可能会出现“主权 AI”。华为昇腾生态将开始形成,国内推理芯片将开始国产替代。然而,AI 造成的 DeepFake、诈骗和网络攻击等问题也将开始进入公众视野,并引发担忧。AI 立法和伦理讨论仍然大规模落后于技术进展。 从全球范围来看,美国和中国在 AI 领域处于领先地位。根据《全球人工智能指数》,美国以 100 分的绝对优势稳坐第一位,中国以近 62 分的得分位居第二。在创新、投资等主要指标中,中美差距也较为明显。不过,随着技术的不断发展,其他国家也在加大对 AI 的投入和研究,未来的发展格局仍存在变数。
2024-06-24
ai能生成多大尺寸的图?大型线下营销活动海报需要打印,ai出的图精度够吗?
AI 可以生成多种尺寸的图片,具体尺寸取决于你的需求和 AI 工具的能力。无界 AI 已将尺寸与用途标注在选项中,使用时根据需要选择即可。 对于大型线下营销活动海报的打印,AI 生成的图片精度可能不够。虽然 AI 可以生成高分辨率的图片,但它们可能无法满足大型海报所需的打印质量。在这种情况下,建议你使用专业的设计软件或请设计师制作高质量的海报。
2024-05-23
llama.cpp处理过的模型可以有多大程度的提升
在计算机科学领域,特别是在机器学习和人工智能方面,性能的提升可以有多种方式。对于 llama.cpp处理过的模型,可能的提升可以包括但不限于以下几个方面: 1. 模型精度提升:通过改进模型结构、调整超参数、增加训练数据量等方式,可以提高模型的预测准确性和泛化能力。这样的提升可以使得模型在实际应用中取得更好的效果。 2. 模型速度提升:通过优化模型的计算效率、减少模型的复杂度、使用更高效的算法等方式,可以提高模型的推理速度和训练速度。这样的提升可以使得模型在实时应用和大规模数据处理中更具竞争力。 3. 模型规模提升:通过增加模型的容量、引入更多的特征或上下文信息、使用集成学习等方式,可以提升模型的表达能力和适应性,使得模型可以处理更复杂的任务和更丰富的数据。 4. 模型可解释性提升:通过改进模型的可解释性、增加模型的解释性特征、使用可解释的模型结构等方式,可以提高模型对决策过程的透明度和可理解性,增强模型在实际应用中的可信度和可接受性。 5. 模型稳定性提升:通过改进模型的鲁棒性、增加模型的泛化能力、引入鲁棒的训练和评估方法等方式,可以提高模型在不同数据分布和环境条件下的稳定性和可靠性,减少模型在实际应用中出现的意外情况和错误。 这些提升可以单独或者组合起来实现,取决于具体的应用场景、数据特征、任务要求和资源限制等因素。通过不断改进和优化,llama.cpp处理过的模型可以在性能上取得更大程度的提升,从而更好地满足实际需求。
2024-04-18
现在都有什么类型的AI
目前常见的 AI 类型包括: 1. 聊天机器人(Chatbots):具备基本对话能力,主要依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。 2. 推理者(Reasoners):具备人类推理水平,能解决复杂问题,如 ChatGPT,可根据上下文和文件提供详细分析和意见。 3. 智能体(Agents):不仅具备推理能力,还能执行全自动化业务,但目前许多产品执行任务后仍需人类参与。 4. 创新者(Innovators):能够协助人类完成新发明,如谷歌 DeepMind 的 AlphaFold 模型,可预测蛋白质结构,加速科学研究和新药发现。 5. 组织(Organizations):最高级别的 AI,能够自动执行组织的全部业务流程,如规划、执行、反馈、迭代、资源分配和管理等。 在不同行业中也有多种应用,以汽车行业为例: 1. 自动驾驶技术:利用 AI 进行图像识别、传感器数据分析和决策制定,实现自主导航和驾驶,如特斯拉、Waymo 和 Cruise 等公司都在开发和测试。 2. 车辆安全系统:用于增强车辆安全性能,如自动紧急制动、车道保持辅助和盲点检测系统。 3. 个性化用户体验:根据驾驶员偏好和习惯调整车辆设置,如座椅位置、音乐选择和导航系统。 4. 预测性维护:通过分析车辆实时数据预测潜在故障和维护需求,减少停机时间和维修成本。 5. 生产自动化:在汽车制造中用于自动化生产线,提高生产效率和质量控制。 6. 销售和市场分析:分析市场趋势、消费者行为和销售数据,制定营销策略和优化产品定价。 7. 电动化和能源管理:在电动汽车的电池管理和充电策略中发挥作用,提高能源效率和延长电池寿命。 8. 共享出行服务:优化路线规划、调度车辆和定价策略,提高服务效率和用户满意度。 9. 语音助手和车载娱乐:如 Amazon Alexa Auto 和 Google Assistant,允许驾驶员通过语音控制车辆功能、获取信息和娱乐内容。 10. 车辆远程监控和诊断:远程监控车辆状态,提供实时诊断和支持。 此外,在学习笔记“AI for everyone 吴恩达”中提到: AI 分为 ANI(弱人工智能)和 AGI(通用人工智能),ANI 得到巨大发展但 AGI 尚未取得巨大进展。ANI 只可做一件事,如智能音箱、网站搜索、自动驾驶、工厂与农场的应用等。机器学习中有监督学习,从输入到输出。近期监督学习快速发展得益于数据增长、神经网络规模发展以及算力提升。数据集是数据的集合,通常以表格形式出现,每一列代表特定变量,每一行对应某一成员的数据集问题。获取数据的方法包括手动标注、观察行为、网络下载。使用数据时,可将数据展示或提供给 AI 团队,数据分为结构化数据(可放在巨大表格中)和非结构化数据(如图片、视频、文本,机器处理较难),同时要注意处理不正确和缺少的数据。
2024-11-04
现在通过AIGC赚钱容易么
通过 AIGC 赚钱并非易事,以下是一些相关情况: AIGC 艺术家土豆人 tudou_man 认为,做有美感、有创意的 AI 作品能实现价值增值,但要注意定价和建立体系。当前制片公司竞争激烈,技术普及可能导致甲方也能掌握相关技能,广告公司角色面临挑战。对于 AIGC 作品的版权问题,要有职业素养,从源头使用正版账号,或找专业团队训练模型。 自媒体人通过 AIGC 赚钱的方式包括:参加中视频计划获取流量收益,如尺寸为 19201080 的原创横屏视频(时长≥1 分钟),可享受西瓜视频、抖音、今日头条的流量分成,但要通过西瓜后台发布视频并同步到抖音才有抖音的收益;进行知识付费,课程价格从 198 元到 598 元不等;接受平台约稿,如重大事件科技、体育事件等,价格视平台而定;与平台签约,如成为 B 站签约 UP 主,每月有固定费用,但具体价格因合约档位而异。 金沙江创投主管合伙人朱啸虎表示,任何公司都应拥抱 AIGC 以降本增效,如用 AIGC 训练的机器人取代回答员工福利问题的人力,在游戏图片生成等方面也能立竿见影地实现降本增效。
2024-11-02
你是一名课程开发专家,现在要以“AI技术在课程设计中在应用“现金箱管理”,课程对象是银行柜员,时长2小时。
对于“AI 技术在课程设计中应用于‘现金箱管理’,课程对象是银行柜员,时长 2 小时”的需求,目前暂时没有相关的具体内容。但可以考虑以下课程设计思路: 首先,在课程开始的前 30 分钟,介绍 AI 技术的基本概念和在金融领域的应用概况,引出其在现金箱管理中的潜在作用。 接下来的 40 分钟,详细讲解 AI 技术如何优化现金箱管理的流程,例如通过智能监控系统实现对现金箱的实时监控和风险预警。 然后用 30 分钟进行案例分析,展示实际应用中 AI 技术成功提升现金箱管理效率和安全性的案例。 最后 20 分钟,组织学员进行小组讨论和交流,让他们分享自己对 AI 技术应用于现金箱管理的理解和想法,并进行总结和答疑。
2024-11-02
你是一名课程开发专家,现在要以“AI技术在课程设计中的应用“为题展开培训,课程对象是企业内部培训师,时长1天。 课程要解决以下问题: 1.用AI工具做需求数据统计 2.用AI工具设计课程题目 3.用AI工具设计课程大纲。4.用AI工具制作PPT5.用AI工具画配图。 要求如下: 1.需要到三级大纲。 2、结构完整。 格式如下: 一、(一级大纲) 1、(二级大纲) 1.1(三级大纲)
一、AI 技术在课程设计中的应用 1、AI 工具与需求数据统计 1.1 Chat Excel 处理数据 1.2 让 AI 辅助编写苹果系统右键“快速操作”实现一键视频压缩、加速 1.5x 1.3 让 AI 辅助编写苹果“自动操作”实现批量统计学生作业字数 2、AI 工具与课程题目设计 3、AI 工具与课程大纲设计 4、AI 工具与 PPT 制作 5、AI 工具与配图绘制 二、生成式人工智能在教学中的应用 1、生成式人工智能的基本原理 1.1 文生文 1.2 文生图 1.3 文生音频 1.4 文生视频 2、生成式人工智能的最少必要知识 2.1 生成式 AI 原理 2.2 能力范围 2.3 性能参数 3、人工智能的学习方式 3.1 监督学习 3.2 无监督学习 3.3 强化学习 4、生成式人工智能的应用案例 4.1 根据消费者购买行为偏好分组 4.2 手机相册里的人脸识别分类 4.3 根据房屋特征面积预测价格 4.4 垃圾短信检测分类 4.5 汽车自动驾驶或路径规划导航 4.6 高级游戏人机对弈 5、AI 与教育的关系 5.1 AI 辅助教师的一天 5.2 各大模型之间的使用差异 5.3 教师使用 AI 小技巧
2024-10-28
你是一名课程开发专家,现在要以“AI技术在课程设计中的应用“为题展开培训,课程对象是企业内部培训师,时长1天。 课程要解决以下问题: 1.用AI工具做需求数据统计 2.用AI工具设计课程题目 3.用AI工具设计课程大纲。4.用AI工具制作PPT5.用AI工具画配图。 要求如下: 需要到三级大纲。 2、结构完整。 格式如下: 一级大纲) 二级大纲) (三级大纲)
以下是以“AI 技术在课程设计中的应用”为题,为企业内部培训师设计的一天培训课程大纲: 一级大纲) AI 技术在课程设计中的应用概述 二级大纲) AI 技术的基本概念与分类 三级大纲) 监督学习 三级大纲) 无监督学习 三级大纲) 强化学习 三级大纲) 生成式 AI 二级大纲) AI 技术的应用领域与案例 三级大纲) 根据消费者购买行为偏好分组 三级大纲) 手机相册里的人脸识别分类 三级大纲) 根据房屋特征面积预测价格 三级大纲) 垃圾短信检测分类 三级大纲) 汽车自动驾驶或路径规划导航 三级大纲) 高级游戏人机对弈 一级大纲) AI 工具在课程设计中的具体应用 二级大纲) 用 AI 工具做需求数据统计 三级大纲) Chat Excel 处理 Excel 数据 三级大纲) 让 AI 辅助编写苹果系统右键“快速操作”实现一键视频压缩、加速 1.5x 三级大纲) 让 AI 辅助编写苹果“自动操作”实现批量统计学生作业字数 二级大纲) 用 AI 工具设计课程题目 三级大纲) 基于数据分析生成题目 三级大纲) 利用自然语言处理优化题目表述 二级大纲) 用 AI 工具设计课程大纲 三级大纲) 依据需求分析生成大纲框架 三级大纲) 完善大纲细节与逻辑 二级大纲) 用 AI 工具制作 PPT 三级大纲) 内容排版与布局设计 三级大纲) 图表与图片的生成与插入 二级大纲) 用 AI 工具画配图 三级大纲) 选择合适的 AI 绘画工具 三级大纲) 明确配图需求与风格 一级大纲) 相关法规与注意事项 二级大纲) 国家互联网信息办公室等七部门的相关规定 三级大纲) 《生成式人工智能服务管理暂行办法》的解读 一级大纲) 总结与交流 二级大纲) 课程设计实践经验分享 二级大纲) 问题答疑与交流互动
2024-10-28
你是一名课程开发专家,现在要以“AI技术在课程设计中的应用“为题展开培训,课程对象是企业内部培训师,时长1天。 课程要解决以下问题: 1.用AI工具做需求数据统计 2.用AI工具设计课程题目 3.用AI工具设计课程大纲。4.用AI工具制作PPT5.用AI工具画配图。 要求如下: 需要到三级大纲。 2、结构完整。 格式如下: 一级大纲) 二级大纲) (三级大纲)
一级大纲) AI 技术在课程设计中的应用 二级大纲) 用 AI 工具做需求数据统计 利用 Chat Excel 处理 Excel 数据,如批量统计学生作业字数 二级大纲) 用 AI 工具设计课程题目 无 二级大纲) 用 AI 工具设计课程大纲 无 二级大纲) 用 AI 工具制作 PPT 无 二级大纲) 用 AI 工具画配图 无 二级大纲) 生成式人工智能的相关知识 生成式人工智能的基本原理、能力范围、性能参数 二级大纲) 人工智能的学习方式 监督学习、无监督学习、强化学习 二级大纲) AI 的应用场景 根据消费者购买行为偏好分组、手机相册里的人脸识别分类、根据房屋特征面积预测价格、垃圾短信检测分类、汽车自动驾驶或路径规划导航、高级游戏人机对弈
2024-10-28