Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

ai绘画中的模型是什么意思

Answer

在 AI 绘画中,模型具有以下含义和特点:

  1. 大模型如同主菜或主食,是生成图片的基础框架,决定了图片的基本风格和内容。
  2. 小模型(Lora)如同佐料或调料包,能够帮助快速实现特定风格或角色的绘制,比如改变人物形象、画风,添加模型中原本没有的元素,如绘制特定的国内节日元素。
  3. 模型的选择与搭配很重要,大模型和 Lora 要基于同一个基础模型才能搭配使用,以生成各种风格的图片。
  4. 常用的模型网站有:Civitai|Stable Diffusion models,embeddings,hypernetworks and moreModels-Hugging FaceSD-WebUI 资源站元素法典 AI 模型收集站-AI 绘图指南 wiki(aiguidebook.top)AI 绘画模型博物馆(subrecovery.top)
  5. 下载模型后需要将之放置在指定的目录下,不同类型的模型放置位置不同。例如,大模型(Ckpt)放入 models\Stable-diffusion;VAE 模型放置在 models\Stable-diffusion 或 models\VAE 目录,然后在 webui 的设置栏目选择;Lora/LoHA/LoCon 模型放入 extensions\sd-webui-additional-networks\models\lora,也可以在 models/Lora 目录;Embedding 模型放入 embeddings 目录。模型的类型可以通过Stable Diffusion 法术解析检测。
Content generated by AI large model, please carefully verify (powered by aily)

References

06-从0学生图

[heading2]总结关于AI绘图模型的介绍与应用大模型与小模型(Lora)的关系:大模型如同主菜或主食,小模型(Lora)如同佐料或调料包,Lora能帮助快速实现特定风格或角色的绘制。Lora的作用:可改变人物形象、画风,添加模型中原本没有的元素,如绘制特定的国内节日元素。模型的选择与搭配:大模型和Lora要基于同一个基础模型才能搭配使用,以生成各种风格的图片。提示词相关功能:可以用中文写提示词,系统有翻译和扩写功能,能优化提示词。图片高清修复:文生图尺寸较小较模糊,可选择图片进行高清修复。SD软件的图片处理方法图片放大的流程:先画小图,再等比例放大并高分辨率修复。放大时要选择合适的修复方式和重绘幅度,重绘幅度越高,图片越偏离原图但越精致。图片风格转换的操作:在图生图中放入图片,选择想要转换的风格的大模型,调整尺寸,根据需求设置重绘幅度和提示词。线条控制的方法:在文生图中使用添加control Lite功能,选择姿态等控制选项,生成图片,还可通过插件修复脸部。

SD新手:入门图文教程

模型能够有效地控制生成的画风和内容。常用的模型网站有:[Civitai|Stable Diffusion models,embeddings,hypernetworks and more](https://link.zhihu.com/?target=https%3A//civitai.com/)>[Models-Hugging Face](https://link.zhihu.com/?target=https%3A//huggingface.co/models)>[SD-WebUI资源站](https://link.zhihu.com/?target=https%3A//www.123114514.xyz/models/ckpt)>[元素法典AI模型收集站-AI绘图指南wiki(aiguidebook.top)](https://link.zhihu.com/?target=https%3A//aiguidebook.top/index.php/model/)>[AI绘画模型博物馆(subrecovery.top)](https://link.zhihu.com/?target=https%3A//aimodel.subrecovery.top/)[heading3]模型安装[content]下载模型后需要将之放置在指定的目录下,请注意,不同类型的模型应该拖放到不同的目录下。模型的类型可以通过[Stable Diffusion法术解析](https://link.zhihu.com/?target=https%3A//spell.novelai.dev/)检测。大模型(Ckpt):放入models\Stable-diffusionVAE模型:一些大模型需要配合vae使用,对应的vae同样放置在models\Stable-diffusion或models\VAE目录,然后在webui的设置栏目选择。Lora/LoHA/LoCon模型:放入extensions\sd-webui-additional-networks\models\lora,也可以在models/Lora目录Embedding模型:放入embeddings目录

问:mewxai是什么?

MewXAI是一款强大专业而新手友好、操作十分简单的AI绘画创作平台,为你的创作和想象力而生。访问地址:https://www.mewxai.cn/[heading2]功能介绍:[content]MX绘画:MX绘画,拥有众多超火模型,上百种风格,只需一句话即可让文字变为艺术画作,让你的想象变为现实。支持文生图、图生图,可玩性极强。MX Cute:MX Cute是MewXAI团队自研的可爱风动漫大模型,融合了想象力和逻辑性,呈现出优秀的图片质感,在某些风格场景下可以媲美当下最火的NJ-V5模型。MJ绘画:MJ绘画创意度和想象力极高,无论是摄影照片、海报、logo设计、3d模型、表情包制作等,都不在话下。边缘检测:可以对草图进行上色,让您的线稿/草图一键变为现实,且有多种渲染风格可供挑选,创意无限。室内设计:上传空间图,通过分析图片的线条结构和几何形状,即可一键完成多种不同风格的室内/建筑设计。为空间设计师提供灵感,节约时间。姿态检测:通过姿态识别实现对人物动作的精准控制,不仅可以生成单人的姿势,还可以生成多人的姿势,实现对AI画图的完美控制。AI艺术二维码:利用人工智能,在几秒内创建令人惊叹的下一代艺术二维码,从此告别单调的黑白二维码,留下令人深刻的印象。AI艺术字:AI最新玩法,把光影文字、隐藏文字、艺术字融入你的艺术作品,美观且实用。内容由AI大模型生成,请仔细甄别。

Others are asking
有哪些好用的ai可视化工具
以下是一些好用的 AI 可视化工具: 1. Lucidchart:流行的在线绘图工具,支持多种图表创建,包括逻辑视图、功能视图和部署视图,用户可通过拖放界面轻松创建架构图。 2. Visual Paradigm:全面的 UML 工具,提供创建各种架构视图的功能,如逻辑视图(类图、组件图)、功能视图(用例图)和部署视图(部署图)。 3. ArchiMate:开源的建模语言,专门用于企业架构,支持逻辑视图的创建,可与 Archi 工具配合使用,该工具提供图形化界面创建模型。 4. Enterprise Architect:强大的建模、设计和生成代码的工具,支持创建多种架构视图,包括逻辑、功能和部署视图。 5. Microsoft Visio:广泛使用的图表和矢量图形应用程序,提供丰富模板用于创建逻辑视图、功能视图和部署视图等。 6. draw.io(现称为 diagrams.net):免费的在线图表软件,允许创建各种类型的图表,包括软件架构图,支持创建逻辑视图和部署视图等。 7. PlantUML:文本到 UML 的转换工具,通过编写描述性文本自动生成序列图、用例图、类图等,帮助创建逻辑视图。 8. Gliffy:基于云的绘图工具,提供创建各种架构图的功能,包括逻辑视图和部署视图。 9. Archi:免费的开源工具,用于创建 ArchiMate 和 TOGAF 模型,支持逻辑视图的创建。 10. Rational Rose:IBM 的 UML 工具,支持创建多种视图,包括逻辑视图和部署视图。 此外,Google DeepMind 发布了一套可视化工具,可用于了解语言模型的内部工作原理,提取有意义的特征,揭示语言模型内部的激活状态。详细原理解释:https://xiaohu.ai/p/12186 链接:https://x.com/imxiaohu/status/1818825233778061560 。
2025-02-22
AI文档
以下是为您整理的关于 AI 文档的相关内容: 如何使用 AI 来做事: 越来越强大的人工智能系统正快速发布,如 Claude 2、Open AI 的 Code Interpreter 等,但似乎没有实验室提供用户文档,用户指南多来自 Twitter 影响者。 作者基于经验为学生和感兴趣的读者准备入门指南,侧重于如何选择正确工具做事,提前阅读相关任务类型可能有帮助。 Cursor 进阶: 模块结构上的使用,目的是让 AI 输出更多理解信息,使用后 AI 回复会随机带图便于查阅。 意在以各种形式提升 AI 对所做事情的理解,方便用户理解以持续控制 AI 产出。 有更新提示词限制 AI 产出的情况。 建议配置各种文档,如初始化文档、目录文档、关联模块文档、全局文档等。 AI 文章排版工具: 主要用于自动化和优化文档布局和格式,处理学术论文和专业文档时很有用。 一些流行的工具包括:Grammarly(提供排版功能改进风格)、QuillBot(改进文本清晰度和流畅性)、Latex(学术论文排版常用,有 AI 辅助编辑器和插件)、PandaDoc(文档自动化平台)、Wordtune(重新表述和改进文本)、Overleaf(在线 Latex 编辑器)。 选择合适工具取决于具体需求,如文档类型、出版标准和个人偏好。学术论文常用 Latex 和 Overleaf,一般文章和商业文档可用 Grammarly 和 PandaDoc 等。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-02-22
用AI建立本地的知识库,推荐哪些?
以下是为您推荐的用 AI 建立本地知识库的方法和相关软件: 1. AnythingLLM: 包含了所有 Open WebUI 的能力,并额外支持选择文本嵌入模型和向量数据库。 安装地址:https://useanything.com/download 。 安装完成后进入配置页面,主要分为三步:选择大模型、选择文本嵌入模型、选择向量数据库。 构建本地知识库时,有 Workspace 的概念,可创建独有的 Workspace 与其他项目数据隔离。首先创建工作空间,然后上传文档并在工作空间中进行文本嵌入,接着选择对话模式(包括 Chat 模式和 Query 模式),最后进行测试对话。 2. Obsidian 加 Cursor: 可利用 Obsidian 的浏览器剪藏插件和 AI 插件,但配置复杂,可能存在恶性 Bug 。 可以用 Cursor 等 AI IDE 解决问题,主要有三类作用:帮助用模糊问题检索笔记库;基于笔记库进行研究,结合多个笔记软件给出建议;生成和修改笔记,如生成整个笔记文件或修改笔记文案。 希望以上内容对您有所帮助。
2025-02-22
有没有专业分析和修改简历的AI
以下是一些专业分析和修改简历的 AI 工具: 1. Kickresume 的 AI 简历写作器:使用 OpenAI 的 GPT4 语言模型自动生成简历,能为简历摘要、工作经验和教育等专业部分编写内容,并保持一致语调。 2. Rezi:受到超过 200 万用户信任的领先 AI 简历构建平台,使用先进的 AI 技术自动化创建可雇佣简历的每个方面,包括写作、编辑、格式化和优化。 3. Huntr 的 AI 简历构建器:提供免费的简历模板,以及 AI 生成的总结/技能/成就生成器和 AI 驱动的简历工作匹配。 此外,还有超级简历优化助手,能帮助用户优化简历提高求职成功率。您还可以查看这里获取更多 AI 简历产品:https://www.waytoagi.com/category/79 。 希望这些信息对您有所帮助,您可以根据自己的需要选择最适合您的工具。
2025-02-22
我是高中历史老师,我想知道用什么AI模型可以“将自己的PPT变成一篇论文”
目前在将 PPT 转换为论文方面,GPT 模型可能会有所帮助。例如,在“教育:一个历史老师用 GPT 给学生讲课”的案例中,学生利用 GPT 相关功能进行模拟体验,并根据要求撰写论文,包括分析模拟的准确性、进行事实核查等。 另外,Claude 模型也能在相关工作中发挥作用。比如可以帮助快速寻找符合条件的论文、提取精炼论文中的信息,甚至找到适合的 PPT 制作工具并指导使用。 此外,一些神经网络大模型通过预测下一个字的方式生成文字,这种方式具有一定的创意性,且可拓展到图像、声音等领域。但需要注意的是,AI 的预测不一定保证完全正确。
2025-02-22
AI案例
以下是一些 AI 在不同领域的应用案例: 活动策划方面: 1. 活动主题及内容生成:根据活动目标、参与者背景等信息,AI 可以生成合适的活动主题和内容框架建议,例如通过对话生成模型提出活动主题和议程草案。 2. 邀请函和宣传文案生成:AI 可以基于活动信息生成吸引人的邀请函和宣传文案,增强宣传效果。例如微软在 Build 大会上,使用 AI 生成了 8000 多份个性化的邀请函。 3. 现场活动管理:利用计算机视觉、语音识别等,AI 可以辅助管理活动现场的人流、秩序等。例如基于人群密度的通道引导、实时翻译等。 4. 虚拟助手:AI 对话系统可以作为虚拟活动助手,为参与者提供信息查询、问题咨询等服务。例如,Replika 提供了智能的虚拟活动助手应用。 5. 活动反馈分析:AI 可以自动分析活动反馈(文字、语音等),总结关键观点和改进建议。例如飞书和钉钉的会议总结功能。 6. 活动营销优化:基于参与者行为数据,AI 可以优化营销策略,实现个性化营销。例如,针对目标受众的定向广告投放等。 其他领域: 1. 客户服务聊天机器人中的自然语言处理:具有适应性,能根据大量数据集训练对实时客户消息做出响应,并可能随着系统学习而增加个性化;具有自主性,基于客户文本输入生成类似人类的输出,回答查询、帮助客户查找产品和服务或发送有针对性的更新,操作时几乎不需要人工监督或干预。但可能存在无意包含不准确或误导信息等监管问题。 2. 医疗保健分诊系统的自动化:具有适应性,能根据医疗数据集、患者记录和实时健康数据分析预测患者病情;具有自主性,为医疗专业人员或直接为患者生成有关患者症状可能原因的信息,并推荐潜在的干预措施和治疗方法。 扣子案例: 1. 2. 3. 4. 5. 6. 7. 8. 9.
2025-02-22
ai绘画
AI 绘画具有多方面的特点和影响: 1. 与艺术界的双向影响: 改变传统艺术面貌:从生成艺术作品到辅助艺术创作,影响创作方式、审美观念和市场需求。 技术进步:从早期机械臂机器人到当前大语言模型,在创作质量和速度上取得突破,推动传统艺术数字化和普及化。 引发讨论和争议:人们对 AI 创作的艺术品接受程度与人类作品大致相同,但不太愿意将其视为艺术家;艺术家态度复杂,有期待也有担忧;带来从业者职业安全焦虑和“侵权”反对之声,挑战现有法律和伦理框架。 提供新可能性:帮助艺术家探索新表达方式、提高制作效率、降低成本,促进艺术与观众互动,提供个性化体验。 2. 关键词指南: 公式:主题+环境+气氛+灯光+色彩+构图+风格参考。 比如:将喜欢的艺术家、灯光、颜色等风格放到相应的关键词里。 3. 艺术与科技的融合: 呈现奇妙景象:将艺术与先进技术完美结合,引领艺术界走向未来。 探索之旅:利用机器学习和深度学习模拟创作过程,生成令人惊叹的作品,为艺术家提供新工具和观众带来新体验。 打破局限:不再局限于传统手工绘画技巧,通过技术手段开拓新领域,为艺术家提供灵感,为缺乏绘画技巧的人提供创作机会,使艺术更民主化和包容。
2025-02-21
AI绘画
AI 绘画对艺术界具有复杂且双面的影响: 积极方面: 改变传统艺术面貌,从生成艺术作品到辅助艺术创作。 技术进步使创作质量和速度取得突破,推动传统艺术数字化和普及化。 为艺术家提供新工具和可能性,帮助探索新创意表达方式,提高制作效率,降低制作成本。 促进艺术与观众互动,提供个性化和互动的艺术体验。 存在的问题: 人们对 AI 创作的艺术品和人类创作的艺术品接受程度相同,但不太愿意将 AI 视为艺术家,其在表达情感和创造性意图方面存在局限性。 引发艺术家对版权、原创性和伦理问题的担忧。 带来文化创意领域从业者职业安全的焦虑和“侵权”嫌疑的反对之声,挑战现有法律和伦理框架。 AI 绘画的关键词指南: 公式:主题+环境(背景、周围)+气氛(烈日下、雾蒙蒙、恐怖的、风暴席卷的)+灯光(顶光、雾气光、漫反射的、强对比的)+色彩(低饱和度、颜色鲜艳的、花里胡哨的、强反射的主色调、某种颜色是 accent color)+构图(黄金分割、三分法的、电影镜头、广角、鸟瞰图)+风格参考(超清细节的、照片级别的、写实的、抽象的、2D/3D、4k8k、数字雕刻、概念艺术、水墨、水彩、海报、某个软件、某个游戏、艺术家、艺术平台) 比如:找自己喜欢的艺术家风格放入风格参考关键词,喜欢的灯光风格放入灯光关键词,喜欢的颜色和调色板风格放入色彩关键词。 艺术与科技的融合: 呈现奇妙景象,AI 绘画将艺术与先进技术完美结合,引领艺术界走向未来。 利用机器学习和深度学习模拟人类创作过程,生成令人惊叹的作品,为艺术家提供新工具和全新体验。 打破传统手工绘画技巧局限,通过编程、算法和数据分析开拓新创作领域,使艺术更民主化和包容。
2025-02-19
AI 绘画提示词
以下是一些 AI 绘画常用的提示词: 画面构图方面: 人物拍摄:Chest Shot、headshot 爆头。 视角:Wideangle view 广角镜头、CloseUp的横截面图、cinematic shot 电影镜头。 相机相关:canon 5d,1fujifilm xt100,Sony alpha 相机型号焦段光圈。 其他:scenery shot 风景照、bokeh 背景虚化、foreground 前景、background 背景、Detail Shot。 画面氛围和情绪方面:moody 暗黑的、happy 鲜艳的,浅色的、dark 黑暗的、epic detail 超细节的、Brutal 残酷的,破碎的、dramatic contrast 强烈对比的、hopeful 充满希望的、anxious 焦虑的、depressed 沮丧、elated 高兴地、upset 难过的、fearful 令人恐惧的、hateful 令人憎恨的、happy 高兴、excited 兴奋、angry 生气、afraid 害怕。
2025-02-18
AI绘画课程
以下为您推荐的 AI 绘画课程: 【野菩萨】课程: 预习周课程:包括 AI 绘画电脑配置要求、高效 AIGC 创意者的数字人工具包、SD 插件安装方法、画静为动的 AIGC 视频制作讲解等。 基础操作课:涵盖 AI 绘画通识课、AI 摄影虚拟的真实、AI 电影 穿越的大门等内容。 核心范式课程:涉及词汇的纸牌屋、核心范式应用、控制随机性等方面。 SD WebUi 体系课程:包括 SD 基础部署、SD 文生图、图生图、局部重绘等。 ChatGPT 体系课程:有 ChatGPT 基础、核心 文风、格式、思维模型等内容。 ComfyUI 与 AI 动画课程:包含部署和基本概念、基础工作流搭建、动画工作流搭建等。 应对 SORA 的视听语言课程:涉及通识 欢迎参加电影的葬礼、影像赏析、基础戏剧影视文学等。 免费课程机会:参与 video battle,获胜者可获得课程奖励,包括冠军 4980 课程一份、亚军 3980 课程一份、季军 1980 课程一份,入围奖励 598 野神殿门票一张。 扫码添加菩萨老师助理,了解更多课程信息。 【Stable Diffusion 零基础入门宝典】课程: 作者从事平面设计行业,基于对 Stable Diffusion 的学习和研究,开发了这套课程。 课程初衷是为刚入门或想了解 SD 的小伙伴做全面梳理,因为新人面对众多内容往往不知所措。 课程特色暂未提及。 SD 新手视频教程: 章节教学视频: 第一节课:AI 绘画原理与基础界面 第二节课:20 分钟搞懂 Prompt 与参数设置,你的 AI 绘画“咒语”学明白了吗? 第三节课:打破次元壁!用 AI“重绘”照片和 CG 第四节课:AI 绘画模型,“画风”自由切换 第五节课:提高 AI 绘画分辨率的方式 第六节课:LoRa|Hypernetwork 概念简析 第七节课:定向修手修脸,手把手教你玩转局部重绘! 第八节课:提示词补全翻译反推,“终极”放大脚本与细节优化插件 第九节课:LoRA 从原理到实践 第十节课:零基础掌握 ControlNet!
2025-02-17
你的知识库架构是怎样的,普通人如何迅速找到目标靶向,比如我想学ai绘画
以下是关于您想学习 AI 绘画的相关内容: 1. 知识库提到明天银海老师将详细讲解 AI agent,同时表示知识库内容丰富,您可挑选感兴趣的部分学习,比如较轻松的 AI 绘画等。 2. 强调 AI 绘画是视觉基础,还介绍了针对 AI 绘画学社做的关键词词库精选活动。 3. 讲述了 AI 绘画中的 stable diffusion 扩散模型的运作方式,是通过加噪和去噪,随机生成种子来形成最终图像,还提到生成式 AI 做高清放大可增加细节的原理。 您可以根据以上信息,逐步深入了解 AI 绘画的相关知识。
2025-02-15
Ai绘画,两个月入门
以下是为您提供的 AI 绘画两个月入门的相关内容: 首先,了解一下 AI 绘画的逻辑。就像您学习画画临摹梵高的作品一样,AI 绘画也是通过学习大量的美术风格作品来生成类似风格的作品。例如 Stable Diffusion ,您花四十年学习的梵高风格相当于它的大模型——Checkpoint 。人们将成千上万种美术风格作品训练成模型放入 AI 中,您想画出满意的作品,首先要选对合适的大模型。大模型可以在 C 站(https://civitai.com/)下载,但需要科学上网。 有位叫二师兄的人在二月接触到 AI 绘画,三月啃完 SD 的所有教程并开始炼丹,四月探讨 AI 变现途径,五月因工作变动但仍坚持学习,加入 Prompt battle 社群学习 Midjourney 。 另外,有人分享自己的经历,22 年 12 月学习 AI 绘画,直到最近因公司业务需求重新捡起,短时间内出过上千张图支持多个业务团队。如果想让人主动学习 AI ,有效的方式是让其看到 AI 能高效完成手头工作。生成式 AI 目前还在早期阶段,为其找高价值应用场景或许能持续一二十年,行业龙头可能是最大受益者之一。
2025-02-12
美国有哪些语言模型
美国的语言模型主要有 OpenAI 的 GPT4 、谷歌 DeepMind 与纽约大学团队开发的语言模型、谷歌的 LaMDA 等。其中,Llama 3.1 是较大的版本,在推理、数学、多语言和长上下文任务中能与 GPT4 相抗衡。此外,还包括被评估的如 GPT3 、PaLM 等语言模型。
2025-02-22
学习AI大模型
以下是关于学习 AI 大模型的相关知识: 1. 概念 生成式 AI 生成的内容称为 AIGC。 2. 概念与关系 AI 即人工智能。 机器学习是电脑找规律学习,包括监督学习、无监督学习、强化学习。 监督学习:使用有标签的训练数据,算法目标是学习输入和输出之间的映射关系,包括分类和回归。 无监督学习:学习的数据没有标签,算法自主发现规律,经典任务如聚类,例如让模型将一堆新闻文章根据主题或内容特征分成相似特征的组。 强化学习:从反馈中学习,以最大化奖励或最小化损失,类似训小狗。 深度学习是一种参照人脑有神经网络和神经元(因有很多层所以叫深度)的方法,神经网络可用于监督学习、无监督学习、强化学习。 生成式 AI 可以生成文本、图片、音频、视频等内容形式。 LLM 是大语言模型,对于生成式 AI,生成图像的扩散模型不是大语言模型;对于大语言模型,生成只是其中一个处理任务,如谷歌的 BERT 模型可用于语义理解(不擅长文本生成),像上下文理解、情感分析、文本分类。 3. 技术里程碑 2017 年 6 月,谷歌团队发表论文《Attention is All You Need》,首次提出 Transformer 模型,它完全基于自注意力机制(SelfAttention)处理序列数据,不依赖于循环神经网络(RNN)或卷积神经网络(CNN)。
2025-02-22
适合当作搜索引擎的大模型是什么?
以下是一些适合当作搜索引擎的大模型: Perplexity.ai:本质是个可联网的搜索引擎,完全免费,支持网页版、APP(目前支持 iOS,安卓即将推出)、Chrome 插件。网页版能力全面,能够根据提问从互联网上搜寻信息并给出总结后的答案。很多 Chat GPT 中调用插件才能解决的事情(联网查询、旅行、住宿、商品推荐)靠 Perplexity 就可以解决了。能给出信息来源网址,根据搜索内容给出继续对话的问题建议。支持筛选 Academic(包含不同领域的学术研究论文)、Wolfram|Alpha(包含数学、科学、经济学、语言学、工程学、社会科学、文化等领域的知识库)、Wikipedia(维基百科)、Youtube、Reddit(娱乐、社交和新闻网站)、News 进行搜索。访问地址: 。但要注意不要在开着浏览器翻译能力的同时使用,很可能会报错。另外,不使用 Copilot 能力的效果比较灾难,无法给出具体的酒店建议,只是列举了几个可以查酒店的渠道。
2025-02-22
2024 年值得关注的中文大模型全景图
2024 年,AI 大模型在生产和生活中落地速度迅猛,被称为国内大模型落地元年。以下是一些值得关注的情况: 国内大模型行业形成了以百度、阿里、字节等科技大厂和创业“AI 六小虎”为主要玩家的竞争格局。 2024 年 1 至 11 月,国内大模型中标项目数量和金额大幅增长,中标项目共 728 个,是 2023 年全年的 3.6 倍;中标金额 17.1 亿元,是 2023 年全年的 2.6 倍。中标项目数前五的行业分别是运营商、能源、教育、政务、金融。 厂商方面,百度以 40 个中标项目数、2.74 亿元的中标金额排名所有厂商之首,科大讯飞居第二。 在金融行业,百度以 14 个中标数量、3734.4 万元中标金额排名第一;科大讯飞居第二。 在智能终端行业,超半数手机厂商都在使用文心大模型,包括三星、荣耀、vivo、OPPO、小米等主流手机品牌;上汽大众、吉利汽车、蔚来汽车、长安汽车等十余家车企已接入百度文心大模型。 百度表现突出,截至 11 月,其文心大模型日均调用量超过 15 亿次,千帆平台帮助客户精调了 3.3 万个模型、开发了 77 万个企业应用。今年三季度财报披露,百度智能云营收达 49 亿元,同比增长 11%。 2024 年 9 月 AI 行业大事记: 9 月 12 日:李继刚再现神级 Prompt,玩法持续翻新;Mistral 发布首个多模态模型 Pixtral 12B。 9 月 13 日:商汤 Vimi 相机开放微博小程序;元象开源中国最大 MoE 大模型 XVERSEMoEA36B;OpenAI 发布 o1 模型。 9 月 14 日:人工智能生成合成内容标识办法;Jina AI 发布 ReaderLM、Jina Embeddings V3。 9 月 18 日:DeepSeek 发文庆祝登上 LMSYS 榜单国产第一,几小时后 Qwen 新模型表示不服。 9 月 19 日:云栖大会;通义万相 AI 生视频上线;快手可灵 1.5 模型新增运动笔刷能力。 9 月 20 日:腾讯元器智能体对外发布;秘塔科技产品经理 JD 走红 AI 圈;阶跃跃问接入 Step2 万亿参数 MoE 语言大模型。 9 月 21 日:大模型测试基准研究组正式成立。 9 月 23 日:钉钉 365 会员上线。 9 月 24 日:讯飞星火 API 全新升级;豆包大模型全系列发布&更新。 9 月 25 日:Vidu API 正式开放,加速企业级视频创作;OpenAI 发布高级语音功能;西湖心辰开源 WestlakeOmni。 大模型进入产业落地后,除了大模型本身能力质量要过硬外,落地应用所需要的全栈技术能力、工程化配套工具等对落地效果有直接影响。企业想要真正将大模型在自身场景落地,需要具备构建算力、数据治理、模型训练、场景落实、应用搭建、持续运营、安全合规等整套能力,大模型的竞争正在加速成为体系化之战。
2025-02-21
怎样操作来源模型
以下是关于操作来源模型的相关内容: 对于某些模型,如 Llama3.1 8B Instruct,操作方式如下: 1. 选择自定义提示词(也可选择预定义的话题,即黑色按钮,黑色按钮会有新手使用指引)。然后左边会出现熟悉的 chat 界面。 2. 输入对话内容,等待左右两边的内容生成。若右边的分析未刷新,在相关按钮间切换。 3. Activation Mode 可获得整段的推理判断;Attribution Mode 需选中一个 token,它会分析对应的最大关联内容。 对于 ComfyUI 玩 SDXL 的模型,操作要点包括: 1. 添加噪波:disable,运行后操作:fixed,步数:30,开始降噪步数:20,结束降噪步数:30,返回噪波:disable。 2. 若将 refiner 的模型连上提示词导致第一个 base 模型的链接断开,可通过加入新节点(右键点击【新建节点】【实用工具】【Primitive 元节点】),在文本节点上单击右键选择【转换文本为输入】,将元节点与文本节点相连接,复制出正负提示词节点分别给 base 模型和 refiner 模型,再将 base 模型的一套输出给第一个采样器节点,refiner 模型的一套输出给第二个采样器节点,使两个模型同时起作用。 对于 Tusiart 模型: 1. 首页包括模型、帖子、排行榜,可查看大手子炼成的模型、图片,不同模型有 checkpoint 和 lora 等标签,还有 XL 标签属于 SDXL 新模型,点击可看模型详细信息及返图区。 2. 基础模型(checkpoint)是生图必需的,任何生图操作必须选定,lora 是低阶自适应模型,可有可无,但对细节控制有价值。 3. ControlNet 可控制图片中特定图像,VAE 类似于滤镜可调整生图饱和度,选择 840000 即可。 4. Prompt 提示词是想要 AI 生成的内容,负向提示词 Negative Prompt 是想要 AI 避免产生的内容。
2025-02-21
AGI 是什么意思
AGI 即通用人工智能(Artificial General Intelligence),指的是一种能够完成任何聪明人类所能完成的智力任务的人工智能系统。能够像人类一样思考、学习和执行多种任务,在许多领域内以人类水平应对日益复杂的问题。例如,像 GPT3 及其半步后继者 GPT3.5 在某种程度上是朝着 AGI 迈出的巨大一步。OpenAI 致力于实现 AGI 并使其造福全人类。
2025-02-21
市面上还有阿里百炼平台类似的竞品吗? 我的意思是工作流
市面上与阿里百炼平台类似的工作流竞品有以下几种: 1. 智谱 GLM4V:通用视觉类大模型,拍立得最早使用的模型,接口响应速度快,指令灵活性差一些,一个接口支持图片/视频/文本,视频和图片类型不能同时输入,调用成本为 0.05 元/千 tokens,可参考。 2. 阶跃星辰:通用视觉类大模型,响应速度快,支持视频理解,输入成本为 0.005~0.015/千 tokens,输出成本为 0.02~0.07/千 tokens,可参考。 3. 百度 PaddlePaddle:OCR 垂直小模型,文本识别能力补齐增强,私有化部署服务费,API 调用在 0.05~0.1/次,开源地址为。
2025-02-21
API是什么意思
API(Application Programming Interface,应用程序编程接口)就像是一个信差。它接受一端的请求,将您想要做的事情告知对应的系统,然后把返回的信息传递回给您。 例如在 GPT 中,通过预先配置的 Action 里的 TMDB API 可以获取电影相关的专有信息。当您询问某部电影的相关内容时,GPT 会识别您的意图,按照 Prompt 进行任务,使用 Action 去相应的数据库寻找相关数据,如取出 backdrop_path 作为主视觉图,然后处理剧情数据、生成背景知识,最后使用 webpilot 搜索评价并返回整理后的数据。 配置一个 Action 时,需要考虑 Schema(相当于操作手册,告诉 GPT 可以去哪、干什么、需要准备什么)、Available actions(可用行动,对应 operationId、get、path)、Authentication(认证,类似于身份证)、Privacy policy(隐私政策)。 Action 的工作流大致为:首先思考想要做什么样的 GPT 以及是否需要外部数据;然后去寻找所需的外部数据的 API 文档,或者自行开发 API,寻找可用的 Action;最后基于 API 文档编写 Action 里的 Schema 和 Prompt(处理取回信息的方式)。 如果对 Action 感兴趣,可以从系统学习 API 知识、在网上寻找可用的 API 练习、发掘 GPT Action 更多潜力等方向继续深入。
2025-02-20
AGI是什么意思
AGI 即通用人工智能(Artificial General Intelligence),指的是一种能够完成任何聪明人类所能完成的智力任务的人工智能系统。能够像人类一样思考、学习和执行多种任务,在许多领域内以人类水平应对日益复杂的问题。例如,计划在 2027 年发布的 Q2025(GPT8)将实现完全的 AGI。GPT3 及其半步后继者 GPT3.5 在某种程度上是朝着 AGI 迈出的巨大一步。OpenAI 致力于 AGI 的研发,其开发的 ChatGPT 就是相关成果之一。我们的使命是确保 AGI 造福全人类,它可以被视为人类进步脚手架上的另一个工具,可能带来治愈所有疾病、有更多时间与家人共享、充分发挥创造潜力等美好前景。
2025-02-19
提示词框架是什么意思
提示词框架是为构建有效提示词提供的一种高度概括和结构化的方法,可看作是构建提示词的方法论或“元结构”。 目前,提示词工程师已发展出多种提示词框架,例如: ICIP 框架:包括指令(Instruction,必须)、背景信息(Context,选填)、输入数据(Input Data,选填)和输出指示器(Output Indicator,选填)四个部分。 BROKE 框架:着重于背景(Background)、角色定义(Role)、目标设定(Objectives)、关键成果展示(Key Result)以及持续的试验与优化(Evolve)五个方面。 CRISPE 框架:分为上下文(Context)、角色(Role)、说明(Instruction)、主题(Subject)、预设(Preset)和例外(Exception)六个部分。 此外,还有一些标识符和属性词用于标识标题、变量、控制内容层级和标识语义结构。结构化提示词框架在行业内应用广泛且成熟度较高,您可以在很多平台看到优秀的案例。如果您对结构化提示词的理论感兴趣,还可以阅读李继刚和云中江树的相关详细理论原文。
2025-02-19
AGI是什么意思
AGI 指通用人工智能。在公众传播层面,部分人觉得大语言模型(LLM)具有 AGI 潜力,LeCun 反对。通用人工智能被定义为一种能够完成任何聪明人类所能完成的智力任务的人工智能。 例如,OpenAI 原计划在 2027 年发布的 Q2025(GPT8)将实现完全的 AGI,但由于埃隆·马斯克的诉讼而被推迟。GPT3 及其半步后继者 GPT3.5 在某种程度上是朝着 AGI 迈出的巨大一步,而早期的模型则不具备这样的能力。
2025-02-19