Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

大模型生态

Answer

以下是关于大模型生态的相关信息:

  • Qwen 系列开源模型表现出色,是国内唯一出现在 OpenAI 视野里、能参与国际竞争的国产大模型。其在相关榜单中多次上榜,得分不断提高,累计下载量突破 1600 万,国内外有大量开发者基于其开发模型和应用,尤其在企业级领域。通义大模型证明了开源开放的力量。
  • AI 大模型是全球数字技术体系的竞争,包括芯片、云计算、闭源模型、开源模型、开源生态等。基础大模型决定产业智能化的天花板等,开源生态在竞争中至关重要。
  • 在 10-0 基础训练大模型中,Lora 生图环节有诸多设置,如模型强度调节、添加 lora 文件、输入正向提示词、选择生成图片数量和尺寸、调整采样器和调度器等。设置完成后点击开始生成,若对生成结果满意可复制随机种子用于下次近似生成,也可进行高清修复和放大。今日作业要求按照比赛要求收集主题素材并训练提交 lora 模型与案例图像。
  • 奇绩创坛潜空间分享会中,杨植麟提到大模型公司倾向面向生产力场景,目前业界卡在数据方面,应用公司在非生产力场景投入产出比更高,大模型开发者生态差是因为不具备高替换成本和规模效应等条件,做事应遵循寻找梯度最大方向并优化的原则。
Content generated by AI large model, please carefully verify (powered by aily)

References

Qwen 2开源了 模型性能超越目前所有开源模型和国内闭源模型

可以说,Qwen是国内唯一出现在OpenAI视野里,可以参与国际竞争的国产大模型。不久前,OpenAI创始人奥特曼在X上转发了一条OpenAI研究员公布的消息,GPT-4o在测试阶段登上了Chatbot Arena(LMSys Arena)榜首位置,这个榜单是OpenAI唯一认可证明其地位的榜单,而Qwen是其中唯一上榜的国内模型。早些时候,有人做了个LMSys榜单一年动态变化视频。过去一年内,国产大模型只有Qwen多次冲进这份榜单,最早出现的是通义千问14B开源视频Qwen-14B,后来是Qwen系列的72B、110B以及通义千问闭源模型Qwen-Max,得分一个比一次高,LMSys也曾官方发推认证通义千问开源模型的实力。在顶尖模型公司的竞争中,目前为止中国模型只有通义千问真正入局,能与头部厂商一较高下。开发者用脚投票的结果,显示了Qwen系列的受欢迎程度。目前为止,Qwen系列开源模型的累计下载量突破了1600万,国内外有海量开发者都基于Qwen开发了自己的模型和应用,尤其是企业级的模型和应用。Qwen的很多忠实拥趸是海外开发者,他们时常在社交平台发表“我们为什么没有这种模型”的溢美之词(配图详见附件)。可以说,通义大模型用行动证明了开源开放的力量。七、为什么大模型的生态建设如此重要?AI大模型是全球数字技术体系的竞争,这个体系包括芯片、云计算、闭源模型、开源模型、开源生态等等。中国信息化百人会执委、阿里云副总裁安筱鹏指出,全球AI大模型竞争的制高点是AI基础大模型,因为基础大模型决定了产业智能化的天花板,商业闭环的可能性,应用生态的繁荣以及产业竞争的格局。与此同时,开源生态在整个技术体系的竞争中也有着至关重要的作用。

10-0基础训练大模型

上图中,点击预览模型中间的生图会自动跳转到这个页面模型上的数字代表模型强度,可以调节大小,正常默认为0.8,建议在0.6-1.0之间调节当然,你也可以自己添加lora文件点击后会显示你训练过的所有lora的所有轮次VAE不需要替换正向提示词输入你写的提示词可以选择基于这个提示词一次性生成几张图选择生成图片的尺寸,横板、竖版、正方形采样器和调度器新手小白可以默认这个不换迭代步数可以按照需求在20-30之间调整CFG可以按照需求在3.5-7.5之间调整随机种子-1代表随机生成图所有设置都好了以后,点击开始生态,生成的图会显示在右侧如果有哪次生成结果你觉得很不错,想要微调或者高分辨率修复,可以点开那张图往下滑,划到随机种子,复制下来粘贴到i机种子这里,这样下次生成的图就会和这次的结果近似如果确认了一张很合适的种子和参数,想要搞清放大则点开高清修复,可以选择你想放大的倍数新手小白可以就默认这个算法迭代步数也是建议在20-30之间重回幅度根据需求调整,正常来说在0.3-0.7之间调整[heading1]今日作业[content]按照比赛要求,收集六个主题中一个主题的素材并且训练出lora模型后提交lora模型与案例图像提交链接:https://waytoagi.feishu.cn/share/base/form/shrcnpJAtTjID7cIcNsWB79XMEd

奇绩创坛潜空间分享会

1.大模型公司究竟会做什么?Kimi一直想做SuperApp,原因是模型迭代需要在智力密度最高的场景内获取数据。因此面向生产力的场景,特别是知识密度高的,比如编程,高等教育等场景。因此小公司如果在模型公司的轨道上,更容易失去价值。1.目前业界卡在哪里?数据,数据,数据。scalinglaw发展到现在目前已经用掉了绝大部分文本数据,要想模型再获得指数型的提升,必须解决下面两个问题中的一个:合成数据视频数据理解注意这里说的视频数据不是简单的多模态对齐,因为对齐训练出来的模型只会做pairing。1.应用公司能做什么方向?在目前模型智能的前提下,相比生产价值模型更能提供情绪价值。说白了,模型现在还不是人,但大概学会了说人话。结合1来看,生产力场景既容易被大厂碾压又很难提供足够的价值,所以现在对小公司来说,做非生产力场景的投入产出比更高。同时小公司也能把更多精力放在体验上而非推理能力上。1.大模型开发者生态为什么差?开发者生态建立在某个技术有很高的替换成本,比如IOS开发。在此基础上开发者可以形成规模效应,但目前大模型生态不具备这两个条件。1.做事情的原则?这点是我自己的观察,植麟多次提到了“梯度”,并且应用在研发,产品,管理上。用模型训练的思维对公司和产品进行迭代。这个我也很赞同,好的产品和企业都是长出来的不是造出来的,是在得到新的数据的前提下迭代出来的而不是提前精密设计好的。寻找梯度最大的方向并向其优化,才能保证迭代速度。(来自小红书的分享)

Others are asking
如何打造自己的AI办公生态
要打造自己的 AI 办公生态,可参考以下步骤: 1. 确定功能范围: 支持用户发送“关键字”,自助获取您分享的“AI 相关资料链接”。 能够回答 AI 相关知识,优先以“您的知识库”中的内容进行回答,若知识库信息不足则调用 AI 大模型回复,并在答案末尾加上“更多 AI 相关信息,请链接作者:jinxia1859”。 “AI 前线”能发布在您的微信公众号上,作为“微信客服助手”。 2. 准备相关内容: 根据 Bot 的目的、核心能力,编写 prompt 提示词。 整理“关键字”与“AI 相关资料链接”的对应关系,可用 word、txt、excel 等整理。 创建自己的【知识库】,用来回答 AI 相关知识。 创建一个【工作流】,控制 AI 按照要求处理信息。 准备好自己的微信公众号,以便发布机器人。 3. 设计“AI 前线”Bot 详细步骤: 展示“AI 前线”Bot 的【最终效果】界面。 编写【prompt】提示词,设定 Bot 的身份和目标。 创建【知识库】,整理“关键字”与“AI 相关资料链接”的对应关系,并将信息存储起来。创建知识库路径为:个人空间知识库创建知识库。本次使用【本地文档】,注意知识库的内容切分粒度,可在内容中加上特殊分割符“”,分段标识符号选择“自定义”,内容填“”。 创建【工作流】,告诉 AI 机器人应按什么流程处理信息。创建工作流路径:个人空间工作流创建工作流。工作流设计好后,先点击右上角“试运行”,测试无误后点击发布。若任务和逻辑复杂,可结合左边“节点”工具实现,如调用大模型、数据库、代码等处理。但工作流不必复杂,能实现目的即可,所以在设计 Bot 前“确定目的”和“确定功能范围”很重要。
2025-01-11
aigc的当前生态
AIGC 的当前生态主要包括以下方面: 1. 概述:GenAI(生成式 AI)能够从已有数据中学习并生成新的数据或内容,利用 GenAI 创建的内容即 AIGC。作为强大的技术,能赋能诸多领域,但存在合规风险,我国对 AIGC 的监管框架由多部法律和规定构成。 2. 分类:AIGC 主要分为语言文本生成、图像生成和音视频生成。语言文本生成利用多种模型,如 GPT4 和 GeminiUltra;图像生成依赖多种技术,代表项目有 Stable Diffusion 和 StyleGAN 2;音视频生成利用多种模型,代表项目有 Sora 和 WaveNet。 3. 应用领域:AIGC 可应用于音乐生成、游戏开发、医疗保健等领域,在游戏开发和制作的整个生命周期的多个阶段都有应用,例如用文本生成平面图像,像 Midjourney、Stable Diffusion 和 DallE 2 等工具可将文本描述生成高质量二维图像。 4. 产品原型设计工具:目前有 UIzard、Figma、Sketch 等基于 AIGC 的工具可用于产品原型设计,其 AI 功能包括自动生成设计元素、提供设计建议、优化用户界面布局等。随着技术发展,未来可能会有更多专门针对产品原型设计的 AIGC 工具出现。
2024-12-13
AI生态图
AI 生态图主要包括以下内容: 关于 AI 产业的产业链结构,大致可分为上游的基础设施层(数据与算力)、中游的技术层(模型与算法)、下游的应用层(应用与分发)。 基础设施层布局投入确定性强,但资金投入巨大,入行资源门槛高,未来国内可能更多由“国家队”负责,普通人可考虑“合作生态”切入机会。 技术层处于技术爆炸时刻,迭代速度快,小规模团队需慎重考虑技术迭代风险,基础通用大模型非巨无霸公司不建议考虑。 应用层是广阔蓝海,当前从业者增加但成熟应用产品不多,“杀手级”应用稀少,普通个体和小团队推荐重点布局,有超级机会和巨大发展空间。 对于 AI 产业上中下游重点关注的企业(或产品),作者做了大量信息收集和汇总工作并绘制了相关图谱,但未避免广告嫌疑不展开详细说明,推荐搜索不了解的公司/平台(或产品)了解。 在游戏领域,生成式 AI 有影响,如从文本提示生成 2D 图像的工具 Midjourney、Stable Diffusion 和 DallE 2 等,已应用于游戏开发和制作的多个阶段,Midjourney 容易上手且图像生成速度快。
2024-11-28
AI生态图
AI 生态图主要包括以下内容: 1. AI 产业的产业链结构大致分为上游的基础设施层(数据与算力)、中游的技术层(模型与算法)、下游的应用层(应用与分发)。 基础设施层布局投入确定性强,但资金投入大,入行资源门槛高,未来国内可能更多由“国家队”负责,普通人可考虑“合作生态”切入机会。 技术层处于技术爆炸期,迭代速度快,小规模团队需慎重考虑技术迭代风险,基础通用大模型非巨无霸公司不建议考虑。 应用层是广阔蓝海,当前从业者增加但成熟应用产品不多,“杀手级”应用稀少,普通个体和小团队推荐重点布局,有超级机会和巨大发展空间。 2. 关于 AI 产业上中下游重点关注的企业(或产品),作者做了大量信息收集和汇总工作并绘制了图,但未避免广告嫌疑不展开详细说明,建议搜索不了解的公司/平台(或产品)了解。 3. 在游戏领域,生成式 AI 有影响,如从文本提示生成 2D 图像是广泛应用领域之一,像 Midjourney、Stable Diffusion 和 DallE 2 等工具可用于游戏开发和制作的多个阶段,Midjourney 容易上手,图像生成速度快。
2024-11-28
请你以大疆产品为例,谈一谈未来大疆是否应该发展二手机的生态?如果你是二手业务的负责人,你会如何做?
大疆作为一家知名的科技公司,其产品在市场上具有较高的声誉和用户满意度。关于未来大疆是否应该发展二手机生态,这需要综合多方面因素来考虑。 从市场需求角度来看,随着消费者对性价比的追求以及环保意识的增强,二手机市场存在一定的潜力。然而,大疆产品通常以其先进的技术和高品质著称,二手机可能会面临技术更新换代快、维修保障等问题。 如果我是二手业务的负责人,首先会进行充分的市场调研,了解消费者对于大疆二手机的需求、价格预期以及关注点。建立严格的二手产品检测和评估标准,确保二手大疆产品的质量和性能符合一定的标准。同时,提供完善的售后服务和维修支持,让消费者购买二手产品无后顾之忧。还会制定合理的价格策略,既要保证有一定的利润空间,又要具有市场竞争力。此外,加强与大疆官方的合作,获取更多的技术支持和资源,共同推动二手机生态的发展。
2024-08-11
Dify怎么对接微信生态
在 Dify 的官网,我为你找到了一篇手把手教你如何将 Dify 应用接入微信生态的教程: 1. 创建聊天助手应用:在 Dify 平台创建基础编排聊天助手应用,获取 API 密钥和 API 服务器地址。 2. 下载 Dify on WeChat 项目:下载并安装依赖。 3. 填写配置文件:在项目根目录创建 config.json 文件,填写 API 密钥和服务器地址。 4. 把基础编排聊天助手接入微信:快速启动测试,扫码登录,进行对话测试,可以选择源码部署或 Docker 部署。 5. 把工作流编排聊天助手接入微信:创建知识库,导入知识库文件,创建工作流编排聊天助手应用,设置知识检索节点和 LLM 节点,发布更新并访问 API。 6. 把 Agent 应用接入微信:创建 Agent 应用,设置对话模型和添加工具,生成 API 密钥,填写配置文件,启动程序并进行测试。 更多内容请访问原文:
2024-04-15
有哪些能够本地部署的AI视频生成模型
以下是一些能够本地部署的 AI 视频生成模型: 1. Stable Video Diffusion 模型: 准备工作:手动下载相关内容,分别放到指定路径。 模型选择:点击下拉箭头选择不同模型版本,勾选 load Model。 视频创作:支持图生视频,图片来源可选择 Midjourney、Stable Diffusion 等生成的图片,上传到 SVD 进行视频生成,可调节左侧参数控制效果。 保存路径:生成的视频在 outputs 下。 2. LTXVideo 模型: 基于 2B 参数 DiT,能够以 768x512 分辨率生成 24 FPS 的视频,速度比观看还快。 专为 RTX 4090 等 GPU 优化,使用 bfloat16 精度,实现高效内存使用且不影响质量。 ComfyUI 现已支持该模型,用户只需下载模型文件并获取工作流即可在本地运行。 3. Sora 模型: 功能:文生视频、图生视频、视频生视频,支持多种视频定制选项,如分辨率、视频长度和视频风格;具有故事板功能,允许用户通过时间线指导视频中的多个动作;提供混音和编辑功能,包括视频混音、延伸和剪辑、创建循环视频等;还有混合功能,可将两个视频场景合并成一个新的场景。 费用和订阅套餐:对于拥有 OpenAI Plus 或 Pro 账户的用户,使用包含在现有订阅中。OpenAI Plus 订阅每月 50 次视频生成次数,OpenAI Pro 订阅无限次慢速队列生成,500 次正常速度的视频生成次数。用户可根据需要选择更高分辨率的视频生成,但可能会减少每月使用次数。发布初期,某些地区(如欧洲和英国)可能会有延迟。
2025-01-21
国内文生图模型
以下是关于国内文生图模型的相关信息: Recraft 模型:用 8 个月自研模型,包含处理数据的模型、标注工作、训练 OCR 模型、新构建的数据集等。Recraft 生成带有长文本图像的流程图解,但存在生成默认是外国面孔而非亚洲面孔且生成的亚洲人不太自然的情况,可能与数据集有关。只有少数公司真正从头训练模型,创建自己的模型困难且成本高,需要超强团队和资金。 模型能力方面: 文本编码器的能力是文生图模型语义理解能力的关键。一开始大部分模型使用 CLIP 作为文本编码器,但存在一些问题。新的模型纷纷优化文本编码器能力,如引入更大更强的 T5XXL 或结合多个特征,但开源模型在中文生图方面能力一般。 腾讯开源的 HunyuanDiT 是较可用的中文生图模型,但仍存在优化空间。 Kolors 是最近开源的给力文生图模型,改进全面,技术实力强。
2025-01-21
吴恩达大模型教程
以下是一些与吴恩达大模型相关的教程和资源: 面向开发者的 LLM 入门课程: 地址: 简介:一个中文版的大模型入门教程,围绕吴恩达老师的大模型系列课程展开,包括吴恩达《ChatGPT Prompt Engineering for Developers》课程中文版等。 提示工程指南: 地址: 简介:基于对大语言模型的兴趣编写的全新提示工程指南,介绍了相关论文研究等。 LangChain🦜️🔗中文网,跟着 LangChain 一起学 LLM/GPT 开发: 地址: 简介:由两位 LLM 创业者维护的 Langchain 中文文档。 LLM 九层妖塔: 地址: 简介:包含 ChatGLM 等实战与经验。 目录:吴恩达讲 Prompt https://github.com/zard1152/deepLearningAI/wiki Coze 复刻:吴恩达开源的 AI 翻译项目 复刻步骤:包括配置反思优化的提示词、结合反思优化建议再次翻译、选择输出方式等。 大语言模型分为基础 LLM 和指令微调 LLM 两类。基础 LLM 经过训练可根据文本预测下一个词,指令微调 LLM 经过训练能遵循指令,为让系统更有帮助并遵循指令,通常会使用人类反馈强化学习(RLHF)技术优化。提示的关键原则包括尽可能保证下达的指令“清晰、没有歧义”,给大模型思考的时间以及足够的时间去完成任务。
2025-01-21
有哪个大模型工具可以提供“word文本转excel表格”功能
以下是一些可以将 word 文本转 excel 表格的大模型相关方法: 1. Markdown 格式输出 Markdown 编辑器 Excel:将大模型的输出结果复制到 Markdown 编辑器(如 Typora),然后再直接复制到 Excel,就可以得到直接可用的数据文档。 2. Markdown 格式输出 Excel 数据分组:把大模型的输出直接复制到 Excel,一般使用 Excel 的数据分列功能,用“|”作为分隔符号处理数据。 3. Markdown 格式输出 Excel 数据分组:要求大模型把输出转换成 CSV 格式,然后把结果复制到 txt 文档,另存为成 csv 文件(注意:txt 另存为时,文件后缀名更改为.csv,编码选择 ANSI)。
2025-01-21
有哪个大模型工具可以提供“word技术规范书转功能清单”功能
目前尚未有确切的大模型工具专门提供“word 技术规范书转功能清单”的功能。但一些通用的自然语言处理工具和办公软件的插件可能会对您有所帮助,例如一些基于云服务的办公自动化工具,不过其效果可能因具体的文档内容和格式而有所差异。
2025-01-21
集文档管理、AI写作、资料搜索的AI大模型推荐
以下为您推荐一些集文档管理、AI 写作、资料搜索功能于一体的 AI 大模型: 1. RAG: 工作原理:就像超级智能的图书馆员,包括检索(从庞大知识库中找相关信息)、增强(筛选优化信息)、生成(整合信息给出连贯回答)。 优点:成本效益高、灵活性强、可扩展性好。 缺点:回答准确性相对不够。 相关网站:Metaso.cn(学术、研究)、So.360.com(生活、便捷)、Devv.ai(程序员、开发者)、Perplexity(付费、高质量)、Bing.com(通用)、Google.com(全球、精准)。 内幕:平均调用 9 次大语言模型,网络爬虫预先建立数据库,用便宜但推理弱的模型(免费版)。 2. 对于律师工作: AI 大模型擅长:信息检索与整理、模式识别与预测、自动化文档处理、多任务处理能力。 AI 大模型不擅长:法律解释与推理、理解道德和情感、创新或个性化的服务。 律师擅长:法律专业知识、沟通与谈判。 3. 沉浸式翻译:主打所有网页双语翻译、PDF 文档对照阅读,新功能可一键开启网页中 Youtube 视频的双语字幕。插件安装地址:https://immersivetranslate.com/ 4. Kimi:由月之暗面科技有限公司开发,最大特点是超长文本(支持最多 20 万字的输入和输出)处理和基于文件、链接内容对话的能力,能阅读并理解多种格式文件内容为用户提供回复。
2025-01-21