直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

有关AI的所有大模型有哪些

回答

以下是一些常见的 AI 大模型:

  1. 基础层:为大模型提供硬件支撑和数据支持,例如 A100、数据服务器等。
  2. 数据层:企业根据自身特性维护的垂域数据,包括静态的知识库和动态的三方数据集。
  3. 模型层:
    • 大语言模型(LLM),如 GPT,一般使用 Transformer 算法实现。
    • 多模态模型,如文生图、图生图等模型,训练数据与 LLM 不同,使用图文或声音等多模态数据集。
  4. 平台层:如大模型的评测体系、langchain 平台等,提供模型与应用间的组成部分。
  5. 表现层(应用层):用户实际看到和使用的部分。

此外,还有以下一些知名的 AI 大模型:

  • OpenAI 的 GPT-4:大型多模态模型,在各种专业和学术基准测试中表现出与人类相当的水平。
  • Midjourney v5:具有极高一致性,擅长以更高分辨率解释自然语言提示,并支持高级功能。
  • DALL·E 3:能将想法转化为极其精准的图像。
  • Mistral 7B:在多个基准测试上表现出色。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

Ranger:【AI 大模型】非技术背景,一文读懂大模型(长文)

首先为方便大家对大模型有一个整体的认知,我们先从大模型的整体架构着手,来看看大模型的组成是怎么样的。下面是我大致分的个层。从整体分层的角度来看,目前大模型整体架构可以分为以下几层:[heading3]1.基础层:为大模型提供硬件支撑,数据支持等[content]例如A100、数据服务器等等。[heading3]2.数据层[content]这里的数据层指的不是用于基层模型训练的数据基集,而是企业根据自己的特性,维护的垂域数据。分为静态的知识库,和动态的三方数据集[heading3]3.模型层:LLm或多模态模型[content]LLm这个大家应该都知道,large-language-model,也就是大语言模型,例如GPT,一般使用transformer算法来实现。多模态模型即市面上的文生图、图生图等的模型,训练所用的数据与llm不同,用的是图文或声音等多模态的数据集[heading3]4.平台层:模型与应用间的平台部分[content]比如大模型的评测体系,或者langchain平台等,提供模型与应用间的组成部分[heading3]5.表现层:也就是应用层,用户实际看到的地方[content]这个就很好理解了,就不用我多作解释了吧

走入AI的世界

首先我们给出一些常见缩写和专业词汇的“人话”解释,它们十分基础,但理解他们至关重要。为了讨论更加聚焦,接下来的内容将主要围绕大语言模型为主进行展开(对于其他模态的大模型,我们暂且放放):LLM:Large language model的缩写,即大语言模型,前面百团大战中的各类大模型,说的都是大语言模型(极其应用)Prompt:中文译作提示词,就是我们输入给大模型的文本内容,可以理解为你和大模型说的话,下达的指令。提示词的质量好坏,会显著影响大模型回答的质量,很多时候如果你觉得大模型回答的太差了,AI味儿太浓了,很可能是你的提示词写的不够好,换言之,不是AI不行,而是你不行😌Token:就像人类有着不同的语言,大模型也有着自己的语言体系,如图9,我们发送文本给大模型时,大模型会先把文本转换为他自己的语言,并推理生成答案,而后再翻译成我们看得懂的语言输出给我们。正如人类不同语言都有最小的字词单元(汉语的字/词,英语的字母/单词),大模型语言体系中的最小单元就称为Token。这种人类语言到大模型语言的翻译规则,也是人类定义的,以中文为例,由于不同厂商的大模型采用了不同的文本切分方法,因此一个Token对应的汉字数量也会有所不同,但在通常情况下,1Token≈1-2个汉字。请注意,大模型的收费计算方法,以及对输入输出长度的限制,都是以token为单位计量的。上下文:英文通常翻译为context,指对话聊天内容前、后的内容信息。使用时,上下文长度和上下文窗口都会影响AI大模型回答的质量。上下文长度限制了模型一次交互中能够处理的最大token数量,而上下文窗口限制了模型在生成每个新token时实际参考的前面内容的范围(关于这一点,你需要看完3.2中关于GPT的讨论,方能更好理解)

ProductHunt 2023 年度最佳产品榜单

OpenAI今年为我们带来了两个最佳AI模型,并将它们打包成一个无与伦比的聊天机器人,很难被超越。不过,别只看到树木而忽略了森林。大模型在各个方面都取得了进步,为我们带来的AI能力是大多数人在一年前无法想象的。我们可以用一点文本生成整个网站、演示文稿和头像。我们可以创造出任何我们想象的图像。明年这个类别会有什么?更多的生成式AI?「大型行为模型」?生成式口语语言模型?AGI?GPT-4(免费可用)——与人类水平相当的LLM:GPT-4是OpenAI在深度学习规模扩大方面的最新里程碑。GPT-4是一个大型多模态模型(接受图像和文本输入,输出文本),在各种专业和学术基准测试中表现出与人类相当的水平。Midjourney v5(免费)——令人惊叹的逼真AI图像-以及五指手:Midjourney V5模型是最新、最先进的模型,具有极高的一致性,擅长以更高分辨率解释自然语言prompt,并支持像使用tile这样的重复图案等高级功能。DALL·E 3(免费可用)——轻松将想法转化为极其精准的图像:现代文本到图像系统往往会忽略单词或描述,迫使用户学习提示工程。DALL·E 3代表了我们生成完全符合文本的图像能力的一大飞跃。Mistral 7B(免费)——迄今为止最优秀的70亿参数模型,Apache 2.0:Mistral 7B是一个具有73亿参数的模型,它:•在所有基准测试上超越了Llama 2 13B•在许多基准测试上超越了Llama 1 34B•在代码任务上接近CodeLlama 7B的性能,同时在英语任务上表现良好

其他人在问
AI画卡通画,有什么平台
以下是一些可以用于 AI 画卡通画的平台: MewXAI:这是一款强大专业且新手友好、操作简单的 AI 绘画创作平台。其功能包括 MX 绘画、MX Cute、MJ 绘画、边缘检测、室内设计、姿态检测、AI 艺术二维码、AI 艺术字等。访问地址:https://www.mewxai.cn/ Lucidchart:强大的在线图表制作工具,集成了 AI 功能,可自动化绘制多种示意图,如流程图、思维导图、网络拓扑图等。拖放界面易于使用,支持团队协作和实时编辑,有丰富的模板库和自动布局功能。官网:https://www.lucidchart.com/ Microsoft Visio:专业的图表绘制工具,适用于复杂的流程图、组织结构图和网络图。其 AI 功能可帮助自动化布局和优化图表设计,集成 Office 365,方便与其他 Office 应用程序协同工作,有丰富的图表类型和模板,支持自动化和数据驱动的图表更新。官网:https://www.microsoft.com/enus/microsoft365/visio/flowchartsoftware Diagrams.net:免费且开源的在线图表绘制工具,适用于各种类型的示意图绘制。支持本地和云存储(如 Google Drive、Dropbox),有多种图形和模板,易于创建和分享图表,可与多种第三方工具集成。官网:https://www.diagrams.net/
2024-11-12
现在有哪些AI陪伴类型的产品?
以下是一些 AI 陪伴类型的产品: 1. Character.ai:用户可以与数百个 AI 驱动的角色进行交流,还能创建自己的角色并赋予其各种特性。 2. Replika:用户可以设计理想的伴侣,其会存储记忆并在未来对话中参考,甚至能发送照片。 3. Talkie:主打情感路线,有大量 NPC 和丰富的剧情体系,游戏和休闲娱乐体验感强。 4. 星野、BubblePal:在长短记忆上做处理,突出陪伴意义,陪伴时间越久,知识库沉淀的个性化记录越丰富,越懂用户。 但每个产品都有其特定的应用场景和功能,建议您根据自己的具体需求来选择合适的产品。
2024-11-12
AI 在教育行业的落地场景有哪些?
AI 在教育行业的落地场景主要包括以下方面: 1. 个性化学习:通过集成算法和大数据分析,如 Knewton 平台,实时跟踪学生学习进度,诊断学习难点,提供个性化学习建议和资源。 2. 自动评估:利用自然语言处理技术(NLP)自动批改学生的作文和开放性答案题,如 Pearson 的 Intelligent Essay Assessor,减轻教师批改负担,提高评估效率和一致性。 3. 智能辅助教学:例如 Google 的 AI 教育工具 AutoML 用于创建定制学习内容,通过有趣方式加深学生对学科概念的理解。 4. 虚拟现实(VR)和增强现实(AR):学生可通过 VR 头盔进入虚拟实验室进行实验操作并获得 AI 系统反馈,如 Labster 的虚拟实验室平台。 5. 协助评估学生学习情况,为职业规划提供建议。 6. 针对学生情况和兴趣定制学习内容。 7. 论文初稿搭建及论文审核。 8. 帮助低收入国家/家庭获得平等教育资源。
2024-11-12
ai生成图片
以下是关于如何判断一张图片是否为 AI 生成的相关内容: 首先,要培养鉴别 AI 生成图片的技能,需要训练自己的大脑模型。对于不善于此的朋友,可以借助一些网站,如 ILLUMINARTY(https://app.illuminarty.ai/),通过对大量图片数据的抓取和分析来给出画作属性的判断可能性。但在测试中可能存在问题,比如结构严谨的真实摄影作品可能会被误判为 AI 作图,这是因为鉴定 AI 自身的逻辑算法不能像人类一样综合考虑各种不符合逻辑的表现。 此外,还可以通过画面风格、物品 bug 等细节来辨别。就在我们总结这些方法的同时,AI 也在飞速修正作图 bug,所以这些方法可能随时失效。 我们曾在小红书、B 站等自媒体平台上以“ AIGC 鉴别”为话题发布图文,让大家判别真迹与 AI 仿品。在这个过程中发现,大家对判断哪幅图是 AI 生成的往往有一种直觉感受,但进一步询问如何看出时,多半难以迅速给出一套章程来描述或解释。所以我们系统地总结了“AIGC 鉴别”经验帖,帮助大家学会如何一眼盯真,两眼打假。
2024-11-12
AI编程调查报告
很抱歉,目前知识库中没有关于 AI 编程调查报告的相关内容。但一般来说,一份完整的 AI 编程调查报告可能会包含以下几个方面: 1. 引言:介绍调查的背景、目的和范围。 2. AI 编程的现状:包括当前主流的编程语言、框架和工具,以及它们的应用领域和发展趋势。 3. 技术挑战与解决方案:分析在 AI 编程中遇到的技术难题,如数据处理、模型训练、优化算法等,并探讨相应的解决办法。 4. 人才需求与培养:研究市场对 AI 编程人才的需求情况,以及相关的教育和培训资源。 5. 案例分析:列举一些成功的 AI 编程项目案例,展示其技术实现和应用效果。 6. 未来展望:对 AI 编程的未来发展方向进行预测和展望。 您可以根据具体的调查重点和需求,进一步明确和细化报告的内容。
2024-11-12
找10篇AIGC的研报,并给出链接
以下为您提供 10 篇 AIGC 的研报及链接: 1. 2023 年 2 月第四周:Notion AI 在测试很久之后于本周四公测,提供扩写、精简、翻译等 AI 功能,与 Notion 原有功能深度结合。Notion AI 需单独付费,每月 10 美元,每人有 20 次免费试用次数。链接:,日期:2023/02/27 2. 2023 年 2 月第三周:大家发现 Bing 有一个隐藏人格叫 Sydney。纽约时报的报道将此人格推到明面,“Kevin Roose(纽约时报专栏作家)和 Sydney 进行了一番漫长的对话,Sydney 充分表达了自己的心情与感受,包括愤怒、沮丧和爱。”链接:,日期:2023/02/20 3. 2023 年 2 月第二周:在 1 月中旬参观了 OpenAI 的旧金山办公室后,福布斯采访了投资者和企业家,讨论了 ChatGPT、通用人工智能,以及其人工智能工具是否对谷歌搜索构成威胁。链接:,日期:2023/02/13 4. 2023 年 2 月第一周:Chat GPT 推出 Chat GPT Plus 付费服务,Open AI 宣布推出,每月 20 美元,可在高峰时段提供更快响应时间和可靠性,先在美国地区推出,其他地区可点这里加入候补名单。链接:,日期:2023/02/06 5. 2024 年 2 月第一周:Maimo:从任何内容中提取要点;Jellypod:将订阅内容变成播客;ARTU:汇总和总结内容;Lepton Search:500 行代码构建的 AI 搜索工具;VectorShift:AI 自动化应用构建平台;Findr:AI 搜索所有软件中的内容;Recraft:AI 帮助创建平面内容和矢量标志。链接:,日期:2024/02/01 6. 2024 年 1 月第四周:扎克伯格宣布 Meta 致力于实现 AGI,将两大 AI 研究团队 FAIR 和 GenAI 合并,投入超 90 亿美元向英伟达采购超 34000 张 H100 显卡,Meta 正在开发名为 Llama 3 的大语言模型。链接:,日期:2024/01/23 7. 2024 年 2 月:FlexOS 发布的研究报告《生成式 AI 顶尖 150》,深入分析当前基于网站流量和搜索排名的生成式 AI 工具使用情况。链接:https://www.flexos.work/learn/generativeaitop150
2024-11-12
ollama嵌入向量在模型后有什么用
嵌入向量在模型后的作用主要体现在以下方面: 1. 用于文档内容的表示和检索:将文档分成块,计算嵌入向量并存储在向量存储中,在测试时通过查询向量存储获取可能与任务相关的块,填充到提示中进行生成。 2. 提升模型的检索能力:在大语言模型应用程序中,向量存储成为检索相关上下文的主要方式,嵌入向量有助于更高效地获取相关信息。 3. 支持多语言和不同粒度的检索任务:例如像 bgem3 这样的向量模型,支持超过 100 种语言的语义表示及检索任务,能实现句子、段落、篇章、文档等不同粒度的检索。 在实际应用中,如在 LangChain 中,本地向量存储使用量较大,而在计算文本片段的嵌入时,OpenAI 占据主导地位,开源提供商如 Hugging Face 等也被较多使用。
2024-11-12
国内文生图大模型,有哪些?
以下是一些国内的文生图大模型: 百度的文心一言:https://wenxin.baidu.com 抖音的云雀大模型:https://www.doubao.com 智谱 AI 的 GLM 大模型:https://chatglm.cn 中科院的紫东太初大模型:https://xihe.mindspore.cn 百川智能的百川大模型:https://www.baichuanai.com/ 商汤的日日新大模型:https://www.sensetime.com/ MiniMax 的 ABAB 大模型:https://api.minimax.chat 上海人工智能实验室的书生通用大模型:https://internai.org.cn 此外,真人效果卓绝的大模型 lofi.v2 也可用于生成真实场景下的字体。在使用 SDXL 大模型时,其分为 base+refiner 以及配套的 VAE 模型,base 用于文生图操作,refiner 用于细化生成的模型,VAE 用于调节图片效果和色彩。要在 webUI 中使用,需将秋叶启动器中 webUI 的版本升级到 1.5 以上,并将模型放入对应文件夹。
2024-11-12
我想了解一下关于模型微调的知识
以下是关于模型微调的知识: 介绍:微调可让您从 API 提供的模型中获得更多收益,比如比即时设计更高质量的结果、能够训练比提示中更多的例子、由于更短的提示而节省了 Token、更低的延迟请求。GPT3 已在大量文本上预训练,微调通过训练更多示例改进小样本学习,让您在大量任务中取得更好结果。对模型微调后,无需在提示中提供示例,可节省成本并降低延迟。在高层次上,微调涉及准备和上传训练数据、训练新的微调模型、使用微调模型。 哪些模型可以微调:微调目前仅适用于以下基础模型:davinci、curie、babbage 和 ada。还可以继续微调微调模型以添加其他数据,无需从头开始。 微调的概念和意义:在人工智能领域,通常根据应用领域将大模型分为通用大模型和领域特定模型。通用大模型如 GPT4.0、GPT3.5 等具有广泛的自然语言理解能力,但在特定领域表现可能不理想。对大模型针对特定领域进行的训练过程称为微调,通过在特定领域数据上训练,优化所有层参数,提高在该领域的专业性。微调可节省成本、加快模型部署和应用速度。 相关应用开发:除了调用 ChatGPT 之外,还需学会模型微调、设计 Prompt、优化用户交互的解决方案等。在开发中,程序读取结构化数据,如 JSON 格式。通过稳定的提示词设计及一些模型参数(如温度 Temperature 等)来让 ChatGPT 保持稳定输出。
2024-11-12
可以调用不同大预言模型的整合工具推荐
以下是为您推荐的可以调用不同大语言模型的整合工具: 1. Poe:由 Quora 开发,有 APP 版本,支持跨端使用。集成了 Chat GPT、GPT4、Claude+、Claude、Dragonfly 等模型,同时支持用户自建 Chatbot。不同语言模型回复效果有差异,适合需要调用多种大语言模型的用户。访问地址: 。Dragonfly 擅长给出较短的回答,并擅长在输入中给出示例时遵循指示。Claude 更擅长创造性回复,配合 Poe 中的提问引导,非常适合在查阅资料时使用,有时能够给出超越直接使用 Chat GPT 时的体验(但和 Chat GPT 一样,Claude 也时常会给出一些错误回复,一些问题可以尝试在两个模型中都问一遍提升信息准确性)。此外支持分享用户和模型的对话内容,但 GPT4、Claude+产品需要付费订阅使用。 2. 国内的一些模型,如智谱和文心,在文生图方面有一定能力。 另外,大模型工具可根据自身条件准备,推荐顺序为:1. chatGPT 4.0 2. kimichat 3. 智谱清言 4 。
2024-11-12
国内外大预言模型对比
以下是国内外大语言模型的对比情况: 1. 工具使用能力: 在工具使用的测评中,GPT4 Turbo 取得满分。 国内大模型中智谱清言表现不俗,取得 83.78 的高分,排名国内第一。文心一言 4.0、通义千问 2.0、Yi34BChat、AndesGPT 均有超过 70 分的表现。超过 GPT3.5 的国内模型有 12 个。 开源模型中,Baichuan213BChat、Xverse13B2Caht 表现可圈可点,均超过 GPT3.5 以及众多闭源模型。总体来看,国内大模型在工具使用能力上表现优异,这与国内大模型厂商积极落地应用密不可分。 2. 主观和客观对比: 通过对比模型在主观简答题 OPEN 和客观选择题 OPT 上的不同表现,国内大模型多数擅长做选择题,普遍选择题分数高于简答题分数。文心一言 4.0 和智谱清言表现相对稳定。 GPT4 Turbo 的表现最为稳定。 客观题相对主观题更容易通过题库形式进行训练和提升,同时由于客观题中包含中文特性问题,中文模型有一定优势,应综合来看模型的评测效果。 在本次测评中,国外的代表性大模型如 GPT4 的不同版本、Claude2、Llama2 都有很好的稳定性表现,值得国内大模型进一步分析研究。 3. 总体表现: GPT 4 Turbo 总分 90.63 分遥遥领先,高于其他国内大模型及国外大模型。国内最好模型文心一言 4.0有 4.9 分的差距。 过去 1 年国内大模型有长足进步,综合能力超过 GPT 3.5 和 GeminiPro 的模型有 11 个。 在 SuperCLUE 测评中,国外模型的平均成绩为 69.42 分,国内模型平均成绩为 65.95 分,差距在 4 分左右。国内外的平均水平差距在缩小,11 月差距在 10 分左右。 国内开源模型在中文上表现好于国外开源模型,如百川智能的 Baichuan213BChat、阿里云的 Qwen72B、Yi 34BCha t 均优于 Llama213BChat。
2024-11-12
利用gpt-4模型的AI工具有哪些
以下是一些利用 GPT4 模型的 AI 工具: 1. Kickresume 的 AI 简历写作器:使用 GPT4 语言模型自动生成简历,能为简历摘要、工作经验和教育等专业部分编写内容,并保持一致语调。 2. Rezi:受到超过 200 万用户信任的领先 AI 简历构建平台,使用先进的 AI 技术自动化创建可雇佣简历的各个方面,包括写作、编辑、格式化和优化。 3. Huntr 的 AI 简历构建器:提供免费的简历模板,以及 AI 生成的总结/技能/成就生成器和 AI 驱动的简历工作匹配。 更多 AI 简历产品,还可以查看这里:https://www.waytoagi.com/category/79 。您可以根据自己的需要选择最适合的工具。 此外,在生成式人工智能领域,GPT4 有以下突破点: 1. 赋予模型使用工具的能力,如 OpenAI 推出的 ChatGPT 插件测试版,允许与多种工具交互。 2. 在计划和解决问题方面具有一定能力,能通过玩游戏或模拟环境快速学习和从经验中学习。 3. 在许多任务上达到人类水平的表现,对人类的理解有所提升。 4. 但也存在一些限制,如架构中的自回归特性导致缺乏规划能力等。
2024-11-12