直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

大模型赛道盘点

回答

以下是对大模型赛道的盘点:

  1. Compass Arena 是由上海人工智能实验室和魔搭社区联合推出的大模型测评平台,集齐了国内主流的 20 多款大模型,包括阿里通义千问、百度文心一言、腾讯混元、讯飞星火、字节跳动豆包、智谱 AI、百川智能、零一万物、月之暗面等,用户可在平台选择大模型两两“对战”,实名或匿名对战皆可。在 Qwen 系列中,Qwen2 性能优越,所有尺寸的模型都使用了 GQA 以带来推理加速和显存占用降低的优势,针对小模型使用了 tie embedding 的方法让输入和输出层共享参数。所有预训练模型在 32K tokens 数据上训练,在 128K tokens 时仍有不错表现,指令微调模型还需进行长序列理解实验。
  2. 伯克利的团队管理着聊天机器人竞技场,根据 ELO 评级对不同语言模型进行排名,计算方式与国际象棋相似。顶部是专有封闭模型,如 OpenAI 的 GPT 系列和 Anthropic 的 Claude 系列,下方是开放权重的模型,如 Meta 的 Llama2 系列,底部有 Zephyr 7b Beta 等。
  3. 有观点认为大模型应用是除内容、电商、o2o、工具之外的第五条赛道,但当前其是否够资格有待商榷。许多产品同学未真正意识到大模型带来的变革,思路和视角仍停留在传统互联网商业模式上。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

Qwen 2开源了 模型性能超越目前所有开源模型和国内闭源模型

Compass Arena是由上海人工智能实验室和魔搭社区联合推出的大模型测评平台,集齐了国内主流的20多款大模型,包括阿里通义千问、百度文心一言、腾讯混元、讯飞星火、字节跳动豆包、智谱AI、百川智能、零一万物、月之暗面等等,用户可在平台选择大模型的两两“对战”,实名或匿名对战皆可。三、Qwen2为什么能有如此优越的性能?通义千问技术博客披露,在Qwen1.5系列中,只有32B和110B的模型使用了GQA。这一次,所有尺寸的模型都使用了GQA,以便让用户体验到GQA带来的推理加速和显存占用降低的优势。针对小模型,由于embedding参数量较大,研发团队使用了tie embedding的方法让输入和输出层共享参数,增加非embedding参数的占比。上下文长度方面,所有的预训练模型均在32K tokens的数据上进行训练,研发团队发现其在128K tokens时依然能在PPL评测中取得不错的表现。然而,对指令微调模型而言,除PPL评测之外还需要进行[大海捞针](https://github.com/gkamradt/LLMTest_NeedleInAHaystack)等长序列理解实验。在使用YARN这类方法时,Qwen2-7B-Instruct和Qwen2-72B-Instruct均实现了长达128K tokens上下文长度的支持。

文章:Andrej Karpathy 亲授:大语言模型入门

好的,最后,我想向你展示当前领先的大型语言模型的排行榜。例如,这就是聊天机器人竞技场。它由伯克利的一个团队管理。他们在这里所做的是根据ELO评级对不同的语言模型进行排名。计算ELO的方式与国际象棋中的计算方式非常相似。所以不同的棋手互相对弈。根据彼此的胜率,你可以计算他们的ELO分数。你可以使用语言模型做完全相同的事情。所以你可以访问这个网站,输入一些问题,你会得到两个模型的响应,你不知道它们是由什么模型生成的,然后你选择获胜者。然后根据谁赢谁输,你就可以计算出ELO分数。所以越高越好。所以你在这里看到的是,拥挤在顶部的是专有模型。这些是封闭模型,你无法访问权重,它们通常位于网络界面后面。这是OpenAI的GPT系列,以及Anthropic的Claude系列。还有其他公司的一些其他系列。所以这些是目前表现最好的模型。然后就在其下方,你将开始看到一些开放权重的模型。因此,这些权重是可用的,人们对它们有更多了解,通常有相关论文可用。例如,Meta的Llama2系列就是这种情况。或者在底部,你可以看到Zephyr 7b Beta,它基于法国另一家初创公司的Mistral系列。

Ranger:【AI 大模型】非技术背景,一文读懂大模型(长文)

变革归变革,那么作为产品人,我们该怎么去把ai这个能力用起来呢?我认为转变自己的“传统”产品设计思路和视角,是最关键的一步。其实我前段时间我在一个仅面向产品经理的公众号中,读到一篇对大模型发展未来表达看法的文章。文章的开篇,就表达了认为大模型应用是在内容、电商、o2o、工具之外的第五条赛道,且当前是否够资格成为“第五条赛道”都有待商榷。在该文章的评论区下,我建议作者先去了解下大模型的基础原理以及当前的技术发展状况。当时之所以这样说,只是因为我觉得许多产品同学实际上并未真正意识到这次大模型所带来的变革,所以他们的思路和视角,依然停留在传统互联网商业模式上,仍然认为此次的变革只是在传统的基础之上做更新。但上面我们也说了,这次的ai变革是从互联网最底层的if-else逻辑开始的,而那些传统互联网的商业模式,只是基于传统的互联网技术架构和用户需求综合出来的产物。

其他人在问
runway具体属于哪种赛道,怎么描述它
Runway 属于 AI 视频领域。它是一款最先推出模型的 AI 视频产品,目前仍维持着领先地位,并在不断快速迭代。 其产品定位更偏向影视、艺术表达,具有以下特点和优势: 1. 擅长真实系、风景、空间视频生成,对二次元场景支持不佳。 2. 支持绿幕场景生成、视频绿幕抠像等,方便影视制作和后期处理。 3. 7 月更新的 Gen3 支持 Alpha Turbo(更快速)和 Alpha(更强表现力)两种模式,增强了对复杂提示词描述的理解和对图像运动元素的识别,能够实现富有想象力的过渡和场景中元素的精确关键帧。还支持设置图片作为动画首帧/尾帧,但目前不支持笔刷等高级调节能力。单次生成视频时长最长可达 10 秒,可延长到 40 秒。 4. Gen3 Alpha Turbo 支持竖屏尺寸视频生成、加大力度发力视频到视频(风格转绘)能力,并表示即将推出更多控制能力。 Runway 由一家总部位于旧金山的 AI 创业公司制作,年初在互联网爆火。2023 年初推出的 Gen2 代表了当前 AI 视频领域最前沿的模型,能够通过文字、图片等方式生成 4 秒左右的视频。致力于专业视频剪辑领域的 AI 体验,同时也在扩展图片 AI 领域的能力。目前支持在网页、iOS 访问,网页端有 125 积分的免费试用额度(可生成约 105 秒视频),iOS 有 200 多,两端额度不同步。 相关链接: 1. 查看 Runway 目前支持的场景和视频案例:https://runwayml.com/product/usecases 2. Gen1 能力介绍:https://research.runwayml.com/gen1 3. Gen1 参数设置:https://help.runwayml.com/hc/enus/articles/15161225169171 4. 学习 Gen1 详细设置方式的视频:https://youtu.be/I4OeYcYf0Sc 5. 官方网站:https://runwayml.com/
2024-10-12
ai+赛道盘点
以下是一些 AI 相关的赛道盘点: AI 与宠物结合:这是一个充满想象空间的新兴赛道,可基于 AI 技术和宠物行业需求开发各种有趣有用的应用。 Agent 相关比赛赛道: 图文创作赛道:包括 AI 自动编写文章并选择或生成相应图片、图像标注、图文匹配等。 实用工具赛道:涵盖数据可视化、设计辅助(如生成 LOGO、海报设计)、自动化排版、图文识别等。 互动创意赛道:例如新闻和社交媒体方面,AI 对大量信息进行自动编辑和汇总生成有趣的图文摘要;艺术创作领域,辅助绘画、音乐创作、文学创作等,鼓励探索 AI 与艺术结合的新模式。
2024-08-26
AI+宠物赛道的一些例子和学习map
根据提供的搜索结果,我总结了以下关于 AI+宠物赛道的一些例子和学习路径: 1. AI 宠物助手 基于自然语言处理和计算机视觉的 AI 宠物助手,可以帮助主人更好地照顾宠物 例如自动识别宠物情绪、提供饮食建议、监测宠物健康状况等 2. AI 宠物互动玩具 利用 AI 技术开发的智能互动玩具,可以增强宠物的娱乐体验 例如会自主移动并引起宠物注意的智能玩具、会发出声音和互动的智能宠物玩具等 3. AI 宠物图像生成 使用生成式 AI 模型,可以根据文字描述生成各种宠物形象的图像 这可以帮助宠物主人定制个性化的宠物形象 4. AI 宠物医疗诊断 利用计算机视觉和机器学习技术,可以开发 AI 辅助的宠物医疗诊断系统 通过分析宠物的症状图像和病历数据,提供初步诊断建议 5. AI 宠物行为分析 基于传感器数据和计算机视觉,可以利用 AI 技术分析宠物的行为模式 帮助主人更好地了解宠物的需求和习性 学习路径建议: 1. 掌握基础的机器学习、计算机视觉、自然语言处理等 AI 技术 2. 了解宠物行为学、宠物医疗等相关领域知识 3. 关注业内先进的 AI+宠物应用案例,学习其技术实现 4. 尝试开发简单的 AI 宠物应用原型,并不断迭代优化 总的来说,AI+宠物是一个充满想象空间的新兴赛道,结合 AI 技术和宠物行业需求,可以开发出各种有趣有用的应用。
2024-04-23
Ai+宗教佛学自媒体,用mj生成图片加runway动起来在配合剪映制作成视频,最后配上符合佛学的宁静音乐。用它制作视频,上传到各大平台,分析此赛道并复现
这个赛道结合了多种技术和内容,需要进行以下步骤来实现: 1. 准备素材: 收集宗教佛学相关的图片、视频素材,以及符合佛学理念的宁静音乐。这些素材可以来自于网络上的免费资源或者自己制作,确保版权合法。 2. 使用 MJ 生成图片: 利用 Midjourney(MJ)生成符合宗教佛学主题的图片。可以在 MJ 平台上选择合适的模板和风格,生成高质量的图片素材。 3. 使用 Runway 生成动画: 使用 Runway 将生成的图片转换为动态效果。Runway 是一个 AI 动画生成工具,可以为静态图片添加生动的动画效果,增强视觉效果。 4. 使用剪映制作视频: 将生成的动态图片和视频素材导入到剪映等视频编辑软件中,进行剪辑和编辑。根据需要调整剪辑顺序、添加过渡效果、字幕等,制作成符合宗教佛学主题的视频内容。 5. 配音乐: 在视频编辑过程中,将符合佛学理念的宁静音乐添加到视频中。选择合适的音乐可以增强视频的氛围和情感,让观众更好地沉浸其中。 6. 导出和上传: 完成视频编辑后,将视频导出为常见的视频格式,如MP4等。然后上传到各大视频平台,如YouTube、抖音、Bilibili等,分享给目标受众。 7. 分析和优化: 视频上传后,关注观看量、点赞数、评论等指标,分析观众反馈和视频效果。根据分析结果,优化视频内容和推广策略,提升视频的影响力和曝光度。 以上就是实现该赛道的步骤,需要整合利用 MJ、Runway、剪映等工具和平台,以及宗教佛学素材和宁静音乐,制作出符合佛学理念的高质量视频内容,并通过上传到各大平台进行推广和分享。
2024-04-20
24年AI大事件盘点
以下是 2024 年 AI 大事件的盘点: 10 月: 9 月 27 日:Reecho 睿声●三只羊录音事件涉及 AI 公司出面回应。 9 月 28 日:TeleAI●正式开源 TeleChat2115B。 10 月 1 日:快手●可灵 AI 全面开放 API,OpenAI DevDay。 10 月 2 日:Black Forest Labs●发布 FLUX1.1,苹果●推出多模态大模型 MM1.5。 10 月 3 日:OpenAI●发布 ChatGPT Canvas。 10 月 8 日:2024 年诺贝尔物理学奖。 10 月 9 日:2024 年诺贝尔化学奖。 10 月 10 日:字节●发布首款 AI 智能体耳机 Ola Friend,Vivo●增加蓝心端侧大模型 3B,谷歌●图像生成模型 Imagen 3 开放使用,智源●BGE 登顶 Hugging Face 月榜,State of AI 2024 报告发布。 10 月 11 日:智谱●GLM4Flash 与「沉浸式翻译」合作,北大&北邮&快手●开源高清视频生成模型 Pyramid Flow。 10 月 12 日:OpenAI●开源多智能体协作框架 Swarm,深势科技●完成数亿元人民币新一轮融资,苹果●质疑当前 LLM 缺乏真正的逻辑推理能力。 10 月 14 日。 11 月: 11 月 1 日:《》来自南乔,10 月 AI 行业大事件盘点包括多家公司的重要发布和创新,如 OpenAI 推出多项新功能,字节发布 AI 智能体耳机,以及各大模型的开源。趋势方面,强化学习被认为是推动 AGI 发展的关键技术,原生多模态模型逐渐成为研究热点。新兴应用如 AI 音乐创作、翻译和智能助手等受到关注,整体呈现出技术与应用的快速发展态势。 11 月 1 日:《》来自歸藏,10 月份美国 AI 聊天机器人市场报告显示,ChatGPT 仍是市场领导者,但份额逐渐下降。谷歌和微软在争夺第二的位置,Perplexity 和 ClaudeAI 则实现高速增长,正在从 ChatGPT 和 Gemini 手中蚕食市场份额。总体来看,专业 AI 工具的增长势头强劲,而初创公司的用户获取相对缓慢。 11 月 1 日:《》比尔・盖茨在采访中讨论了人工智能的革命性影响,认为 AI 将使每个人都能成为“超级个体”,改变人机交互方式。他强调 AI 将显著降低白领工作的成本,并逐渐影响蓝领市场。盖茨还提到他对全球健康和气候问题的关注,认为技术创新速度超出预期,未来 20 年将是充满希望的时期。他同时探讨了可再生能源的发展,尤其是核能和太阳能的潜力。 在 2024 年,AI 商业界还发生了以下事件: 全球芯片出口管制下,中国仍成重要市场。美国商务部长吉娜·雷蒙多警告英伟达:“如果你围绕中国特定的需求重新设计芯片,我将在第二天控制它。”据悉,中国在美芯片制造商中所占的份额正在减少。据英伟达称,它从代表 NVIDIA 数据中心业务的 20%下降到“中个位数”。尽管中国实验室在进口硬件方面受到限制,但其当地分支机构目前没有控制权。字节跳动通过美国的甲骨文租用 NVIDIA H100 访问权限,而阿里巴巴和腾讯则与 NVIDIA 就在美国建立自己的数据中心进行谈判。与此同时,谷歌和微软直接向中国大型企业推销他们的云服务。 模型变得更便宜了。以前认为提供强大模型的成本过高,但现在提供这些模型的推断成本正在下降。OpenAI 更达到 100 倍下降!Google Gemini 生产了一种具有很强竞争力的定价系列!Gemini 1.5 Pro 和 1.5 Flash 的价格在推出后几个月内下降了 64%86%,而性能强劲,例如 Flash8B 比 1.5 Flash 贵 50%,但在许多基准测试中表现相当。注意:价格适用于<128K 令牌提示和输出。检索日期为 2024 年 10 月 4 日。考虑到计算成本很高,模型构建者越来越依赖与大型科技公司建立合作伙伴关系。反垄断监管机构担心这将进一步巩固现有公司的地位。
2024-12-15
如何利用AGI创建3D打印的模型
利用 AGI 创建 3D 打印模型的方法如下: 1. 将孩子的画转换为 3D 模型: 使用 AutoDL 部署 Wonder3D:https://qa3dhma45mc.feishu.cn/wiki/Pzwvwibcpiki2YkXepaco8Tinzg (较难) 使用 AutoDL 部署 TripoSR:https://qa3dhma45mc.feishu.cn/wiki/Ax1IwzWG6iDNMEkkaW3cAFzInWe (小白一学就会) 具体实物(如鸟/玩偶/汽车)的 3D 转换效果最佳,wonder3D 能智能去除背景(若效果不佳,需手动扣除背景) 对于一些非现实类玩偶类作品,wonder3D 识别效果不佳时,可先使用 StableDiffusion 将平面图转换为伪 3D 效果图再生成模型。以 usagi 为例,先通过 SD 生成 3D 的 usagi,再将 usagi 输入 wonder3D。 2. 生成特定模型,如创建一个乐高 logo 的 STL 文件: 设计乐高 logo:使用矢量图形编辑软件(如 Adobe Illustrator 或 Inkscape)创建或获取矢量格式的乐高 logo,确保符合标准。 导入 3D 建模软件:将矢量 logo 导入到 3D 建模软件(如 Blender、Fusion 360 或 Tinkercad)中。 创建 3D 模型:在 3D 建模软件中根据矢量图形创建 3D 模型,调整尺寸和厚度以适合打印。 导出 STL 文件:将完成的 3D 模型导出为 STL 文件格式。 以下是在 Blender 中使用 Python 脚本创建简单 3D 文本作为乐高 logo 并导出为 STL 文件的步骤: 打开 Blender,切换到“脚本编辑器”界面。 输入脚本,点击“运行脚本”按钮,Blender 将创建 3D 文本对象并导出为 STL 文件。 检查生成的 STL 文件,可根据需要调整脚本中的参数(如字体、位置、挤压深度等)以获得满意的乐高 logo 3D 模型。 此外,还有一些其他动态: 阿里妈妈发布了:https://huggingface.co/alimamacreative/FLUX.1TurboAlpha ,演示图片质量损失小,比 FLUX schell 本身好很多。 拓竹旗下 3D 打印社区 Make World 发布 AI:https://bambulab.com/zh/signin ,3D 生成模型找到落地和变现路径。 上海国投公司搞了一个:https://www.ithome.com/0/801/764.htm ,基金规模 100 亿元,首期 30 亿元,并与稀宇科技(MiniMax)、阶跃星辰签署战略合作协议。 智谱的:https://kimi.moonshot.cn/ 都推出基于深度思考 COT 的 AI 搜索。 字节跳动发布:https://mp.weixin.qq.com/s/GwhoQ2JCMQwtLN6rsrJQw ,支持随时唤起豆包交流和辅助。 :https://x.com/krea_ai/status/1844369566237184198 ,集成了海螺、Luma、Runway 和可灵四家最好的视频生成模型。 :https://klingai.kuaishou.com/ ,现在可以直接输入文本指定对应声音朗读,然后再对口型。
2024-12-20
如何通过提示词提高模型数据对比和筛选能力
以下是一些通过提示词提高模型数据对比和筛选能力的方法: 1. 选择自定义提示词或预定义话题,在网站上使用如 Llama3.1 8B Instruct 模型时,输入对话内容等待内容生成,若右边分析未刷新可在相关按钮间切换。由于归因聚类使用大模型,需稍作等待,最终结果可能因模型使用的温度等因素而不同。 2. 在写提示词时不能依赖直觉和偷懒,要实话实说,补充详细信息以避免模型在边缘情况上犯错,这样也能提高数据质量。 3. 在分类问题中,提示中的每个输入应分类到预定义类别之一。在提示末尾使用分隔符如“\n\n\n\n”,选择映射到单个 token 的类,推理时指定 max_tokens=1,确保提示加完成不超过 2048 个 token,每班至少有 100 个例子,可指定 logprobs=5 获得类日志概率,用于微调的数据集应在结构和任务类型上与模型使用的数据集相似。例如在确保网站广告文字正确的案例中,可微调分类器,使用合适的分隔符和模型。
2024-12-20
通过提示词可以提高模型的数学计算能力吗
通过提示词可以在一定程度上提高模型的数学计算能力。例如 PoT 技术,它是思维链技术的衍生,适用于数值推理任务,会引导模型生成一系列代码,再通过代码解释器工具进行运算,这种方式能显著提升模型在数学问题求解上的表现。PoT 作为 CoT 的衍生技术,遵循零样本和少样本的学习范式,零样本 PoT 与 CoT 方法相似,不需要大量样本即可进行有效推理,少样本 PoT 也通过较少样本优化模型表现。但需要注意的是,大模型在解决数学问题时可能存在不够可靠的情况。
2024-12-20
哪一个开源大语言模型对中文支持比较好?
以下是一些对中文支持较好的开源大语言模型: 1. OpenChineseLLaMA: 地址: 简介:基于 LLaMA7B 经过中文数据集增量预训练产生的中文大语言模型基座,对比原版 LLaMA,该模型在中文理解能力和生成能力方面均获得较大提升,在众多下游任务中均取得了突出的成绩。 2. BELLE: 地址: 简介:开源了基于 BLOOMZ 和 LLaMA 优化后的一系列模型,同时包括训练数据、相关模型、训练代码、应用场景等,也会持续评估不同训练数据、训练算法等对模型表现的影响。 3. Panda: 地址: 简介:开源了基于 LLaMA7B,13B,33B,65B 进行中文领域上的持续预训练的语言模型,使用了接近 15M 条数据进行二次预训练。 4. Llama2Chinese13bChat: 地址: 5. Gemma7bit: 地址: 此外,AndesGPT 在语言理解与抽取、角色扮演能力上排名国内前一,在代码、生成与创作、上下文对话能力上排名国内前三,各项能力较为均衡,聚焦在移动设备端的应用。Baichuan213BChat 是百川智能自主训练的开源大语言模型,是中文开源模型的主导力量。
2024-12-20
说明jetson orin nano可以使用什么模型?Grok-1模型可以吗?
目前没有关于 Jetson Orin Nano 是否可以使用 Grok1 模型的明确信息。但一般来说,Jetson Orin Nano 可以支持多种常见的深度学习模型,如基于 TensorFlow、PyTorch 框架开发的模型等。具体能够使用哪些模型,还需要考虑模型的计算需求、内存占用以及 Jetson Orin Nano 的硬件配置和性能限制等因素。
2024-12-20
怎么用已经公布的源代码,自己拥有一个私人ai。详细步骤,并且列出硬件设施,说明jetson orin nano可以使用什么模型?
目前已公布的源代码种类繁多,要利用其拥有一个私人 AI 并非简单直接的过程,且需要一定的技术知识和经验。 一般来说,以下是大致的步骤: 1. 选择合适的源代码:根据您的需求和技术能力,从众多已公布的源代码中选择适合的项目。 2. 环境搭建:安装所需的开发工具、编程语言和相关依赖库。 3. 数据准备:收集和整理适合训练和优化模型的数据。 4. 代码理解与修改:深入理解所选源代码的结构和逻辑,根据您的需求进行必要的修改和优化。 5. 训练模型:使用准备好的数据对模型进行训练。 6. 评估与优化:对训练好的模型进行评估,根据评估结果进行进一步的优化。 关于硬件设施,Jetson Orin Nano 是一款性能不错的嵌入式计算设备。它可以支持多种模型,例如常见的深度学习模型如卷积神经网络(CNN)、循环神经网络(RNN)等。但具体能使用哪些模型,还取决于模型的规模、计算需求以及您对性能和资源的要求。
2024-12-20