Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

图说AI大模型?

Answer

以下是关于 AI 大模型的相关内容:

一、大模型的整体架构

  1. 基础层:为大模型提供硬件支撑和数据支持,例如 A100、数据服务器等。
  2. 数据层:包括静态的知识库和动态的三方数据集,这里的数据层并非用于基层模型训练的数据基集,而是企业根据自身特性维护的垂域数据。
  3. 模型层:包括 LLm(大语言模型,例如 GPT,一般使用 transformer 算法实现)或多模态模型(如市面上的文生图、图生图等模型,训练所用数据与 llm 不同,为图文或声音等多模态的数据集)。
  4. 平台层:例如大模型的评测体系或 langchain 平台等,是模型与应用间的组成部分。
  5. 表现层:也就是应用层,是用户实际看到的地方。

二、再补充一些概念 - AI Agent Agent 是从年前到现在比较火的概念,被很多人认为是大模型的未来主要发展方向。中间的“智能体”其实就是 llm 或大模型,四个箭头分别是为 llm 增加的工具、记忆、行动、规划四个能力。目前行业里主要用到的是 langchain 框架,它把 llm 之间以及 llm 和工具之间通过代码或 prompt 的形式进行串接。

三、必须理解的核心概念

  1. 泛化能力:指模型在未曾见过的数据上表现良好的能力,用大白话讲就是“举一反三”的能力,人类泛化能力很强,无需见过世界上每一只猫就能认识猫的概念。
  2. 多模态:指多数据类型交互,能提供更接近人类感知的场景,大模型对应的模态有文本、图像、音频、视频等。
  3. 对齐能力:指与人类价值观与利益目标保持一致的能力。但目前阶段,有很多提示词注入的方法能绕过各种限制,这也开辟了大模型领域黑白对抗的新战场。
Content generated by AI large model, please carefully verify (powered by aily)

References

Ranger:【AI 大模型】非技术背景,一文读懂大模型(长文)

首先为方便大家对大模型有一个整体的认知,我们先从大模型的整体架构着手,来看看大模型的组成是怎么样的。下面是我大致分的个层。从整体分层的角度来看,目前大模型整体架构可以分为以下几层:[heading3]1.基础层:为大模型提供硬件支撑,数据支持等[content]例如A100、数据服务器等等。[heading3]2.数据层[content]这里的数据层指的不是用于基层模型训练的数据基集,而是企业根据自己的特性,维护的垂域数据。分为静态的知识库,和动态的三方数据集[heading3]3.模型层:LLm或多模态模型[content]LLm这个大家应该都知道,large-language-model,也就是大语言模型,例如GPT,一般使用transformer算法来实现。多模态模型即市面上的文生图、图生图等的模型,训练所用的数据与llm不同,用的是图文或声音等多模态的数据集[heading3]4.平台层:模型与应用间的平台部分[content]比如大模型的评测体系,或者langchain平台等,提供模型与应用间的组成部分[heading3]5.表现层:也就是应用层,用户实际看到的地方[content]这个就很好理解了,就不用我多作解释了吧

Ranger:【AI 大模型】非技术背景,一文读懂大模型(长文)

agent算是从年前到现在,比较火的一个概念了,也被很多人认为是大模型的未来的一个主要发展方向。首先我们看这个很经典的一张图看起来还是蛮复杂的,然后市面上的很多描述agent的文章写的也比较复杂,说智能体是啥智能的最小单元,相较于copilot,是可以给他设定一个目标后主动完成任务的等等。当然这些说法都没错,但是我觉得还是有些不好理解的。所以我们依然先从原理着手去理解下,agent是个什么东西。首先这张图里,中间的“智能体”,其实就是llm,或者说大模型。四个箭头,分别是我们为llm增加的四个能力。工具、记忆、行动、规划。那么这个是怎么新增的呢?目前行业里主要用到的是一个叫langchain的框架,这个框架可以简单理解为,他把llm和llm之间,以及llm和工具之间,通过代码或prompt的形式,进行了串接。这个其实也像是在rag的基础上再进了一步。因为我们知道rag其实是给了大模型一个浏览器工具来使用嘛,那agent,其实就是给了大模型更多的工具。比如像是长期记忆,其实就是给了大模型一个数据库工具让其往里记录重要信息。规划和行动,其实就是在大模型的prompt层做的些逻辑,比如让其将目标进行每一步的拆解,拆解完成后,每一步去输出不同的固定格式action指令,给到工具作为输入。当然langchain或者说agent还不止这些,也会有很多其他的代码逻辑体现在其中,不过其主要的主干逻辑,其实还是在prompt层和工具层,完成的设计。

走入AI的世界

图9大模型核心基础概念泛化能力:不用人话说是“指模型在未曾见过的数据上表现良好的能力”,用大白话讲就是“举一反三”的能力,人类就是泛化能力很强的物种,我们不需要见过这个世界上的每一只猫,就能认识猫这个概念。多模态:指多数据类型交互,从而能够提供更接近人类感知的场景。正如人有眼、耳、鼻、舌、身、意等多个模态,大模型对应的模态是文本、图像、音频、视频……对齐能力:指与人类价值观与利益目标保持一致的能力。大模型相比我们普通人类个体是“无所不知”的,但他并不会把他知道的都告诉你,例如你问chatGPT如何制造炸弹,他虽然知道,但并不会告诉你具体步骤和配方,这是因为chatGPT做了很好的对齐工程,但目前阶段,有很多提示词注入的方法,也能绕过各种限制,这也开辟了大模型领域黑白对抗的新战场(事实上,人类自身就不是一个价值观对齐的物种,同一件事在一些群体眼中稀松平常,但在另一些群体眼中十恶不赦,因此“和谁对齐”确实是一个灵魂问题)。图10大模型核心基础概念

Others are asking
AI课程
以下是为您提供的关于 AI 课程的相关信息: 麻省理工学院(MIT)为 8 18 岁孩子推出了免费的 AI 课程 Day of AI,该课程席卷全球,来自 110 多个国家的 50 万名学生都在使用。但此课程资源主要面向家长和老师群体,大孩子可自学,小孩子可能需要家长辅助。同时,MIT 作为世界级学府肩负社会责任,用技术实现教育平等。国内有机构将其免费课程下载后开卖录播课收费。 对于新手学习 AI,首先要了解 AI 基本概念,建议阅读“从这里启程”部分熟悉术语和基础概念,浏览入门文章。然后开始学习之旅,在“入门:AI 学习路径”中可找到为初学者设计的课程,推荐李宏毅老师的课程,还可通过在线教育平台按自己节奏学习。选择感兴趣的模块深入学习,比如掌握提示词技巧。学习后要实践,在知识库有实践作品和文章分享。同时,体验如 ChatGPT 等 AI 产品。 如果让我推荐一门 AI 课,【野菩萨的 AIGC 资深课】由工信部下属单位人民邮电出版社开设,是市面上值得推荐的课程之一,技术更新快,涵盖 AI 绘画、视听语言和 ChatGPT 等知识,无论初学者还是进阶者都适用。
2025-04-08
ai制作网站免费的
以下是一些关于免费的 AI 制作网站的信息: 1. 选择合适的 AI 网站制作工具时,需要考虑以下因素: 目标和需求:明确网站的目标(如个人博客、商业网站、在线商店)和功能需求。 预算:部分工具提供免费计划或试用版,但高级功能可能需付费订阅。 易用性:选择符合自身技术水平,能轻松使用和管理的工具。 自定义选项:检查工具是否提供足够的自定义选项,满足设计和功能需求。 支持和资源:查看是否有充足的客户支持和学习资源(如教程、社区论坛)以解决问题。 2. 麻省理工(MIT)为 8 18 岁孩子推出了免费的 AI 课程 Day of AI,该课程包含在 MIT 的 RAISE 项目中。其课程资源面向家长、老师群体,大孩子可自学,小孩子可能需要家长辅助。 3. ProductHunt 2023 年度最佳产品榜单中的 AI 产品: Dora AI:通过一个 prompt,借助 AI 3D 动画生成强大网站,支持文字转网站、生成式 3D 互动、高级 AI 动画。 Bard(免费):谷歌推出的官方 ChatGPT 竞争者。 Chat.DID(免费):首个允许人们以人类方式与 AI 进行视频聊天的 APP,处于测试阶段。 Pika(免费):能将创意转化为动态视频的概念 视频平台。
2025-04-08
ai制作网站
以下是一些制作网站的 AI 工具: 1. Wix ADI(Artificial Design Intelligence) 网址:https://www.wix.com/ 特点:基于用户提供的信息自动生成定制化网站,提供多个设计选项和布局,集成了 SEO 工具和分析功能。 2. Bookmark 网址:https://www.bookmark.com/ 特点:AIDA 通过询问用户几个简单问题快速生成网站,提供直观的拖放编辑器,包括多种行业模板和自动化营销工具。 3. Firedrop 网址:https://firedrop.ai/ 特点:Sacha 是其 AI 设计助手,可根据用户指示创建和修改网站设计,提供实时编辑和预览功能,包含多种现代设计风格和自定义选项。 4. The Grid 网址:https://thegrid.io/ 特点:Molly 是其 AI 设计助手,可自动调整网站设计和布局,基于内容和用户互动进行优化,支持多种内容类型。 5. Zyro 网址:https://zyro.com/ 特点:使用 AI 生成网站内容,包括文本、图像和布局建议,提供 AI 驱动的品牌和标志生成器,包含 SEO 和营销工具。 6. 10Web 网址:https://10web.io/ 特点:基于 AI 的 WordPress 网站构建工具,可自动生成网站布局和设计,提供一键迁移功能,集成 AI 驱动的 SEO 分析和优化工具。 7. Jimdo Dolphin 网址:https://www.jimdo.com/ 特点:Dolphin 是 Jimdo 的 AI 网站构建器,通过询问用户问题定制网站,提供自动生成的内容和图像,包含电子商务功能。 8. Site123 网址:https://www.site123.com/ 特点:简单易用,适合初学者,提供多种设计模板和布局,包括内置的 SEO 和分析工具。 选择合适的 AI 网站制作工具时,您可以考虑以下因素: 1. 目标和需求:确定网站目标(如个人博客、商业网站、在线商店)和功能需求。 2. 预算:有些工具提供免费计划或试用版,但高级功能可能需要付费订阅。 3. 易用性:选择符合您技术水平的工具,确保能轻松使用和管理网站。 4. 自定义选项:检查工具是否提供足够的自定义选项,以满足设计和功能需求。 5. 支持和资源:查看是否有足够的客户支持和学习资源(如教程、社区论坛),帮助解决问题。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-04-08
AI的发展史
AI(人工智能)的发展历程如下: 1. 起源阶段: 1943 年,心理学家麦卡洛克和数学家皮特斯提出机器的神经元模型,为后续的神经网络奠定基础。 1950 年,计算机先驱图灵最早提出图灵测试,作为判别机器是否具备智能的标准。 1956 年,在美国达特茅斯学院召开的会议上,人工智能一词被正式提出,并作为一门学科确立下来。 2. 发展阶段: 早期阶段(1950s 1960s):包括专家系统、博弈论、机器学习初步理论。 知识驱动时期(1970s 1980s):有专家系统、知识表示、自动推理。 统计学习时期(1990s 2000s):出现机器学习算法如决策树、支持向量机、贝叶斯方法等。 深度学习时期(2010s 至今):深度神经网络、卷积神经网络、循环神经网络等得到发展。 3. 前沿技术点: 大模型:如 GPT、PaLM 等。 多模态 AI:包括视觉 语言模型(CLIP、Stable Diffusion)、多模态融合。 自监督学习:自监督预训练、对比学习、掩码语言模型等。 小样本学习:元学习、一次学习、提示学习等。 可解释 AI:模型可解释性、因果推理、符号推理等。 机器人学:强化学习、运动规划、人机交互等。 量子 AI:量子机器学习、量子神经网络等。 AI 芯片和硬件加速。 在过去的几十年里,AI 的发展起起落落,经历了多次热度的起伏。如今,生成式 AI 等新技术的出现引发了新的关注和探索。
2025-04-08
AI音频使用了哪些技术
以下是一些关于 AI 音频所使用技术的介绍: 声音检测方面: :通过更强的听觉感知创造卓越的人类体验。 :先进的声音识别解决方案,能够分类如尖叫、枪声、咳嗽和哭泣等声音。 :下一代声音 AI 平台,能够像人类一样理解任何声音。 :语音控制的家庭自动化系统。 :世界上首个智能家居听觉系统。 :可用于从音频源中提取隐藏数据的 AI 模型。 :无需键盘、按钮或触摸屏,无缝融合物理世界和数据世界。 :为手机、VR/AR 头戴设备、智能手表、扬声器和笔记本电脑提供上下文感知。 :智能音频穿戴设备。 :将声音转化为信息。 :使用先进的深度学习技术进行声音事件检测和上下文识别,为世界上的每一个声音赋予意义。 音乐方面: :免费的 DAW,提供高质量的人声、鼓点、旋律、贝斯分离、全能音频分离、编辑和人声/乐器转 MIDI 功能。 :AI 音频处理。 :在音乐/视频流媒体和虚拟/增强现实中重新定义音频体验。 :为音乐行业提供按需创建音轨的平台。 :为娱乐行业提供音频分离解决方案,释放经典内容的全部潜力。 :在几秒钟内将任何歌曲的人声和音乐分离。 :基于世界排名第一的 AI 技术的高质量音轨分离。 :使用强大的 AI 算法免费将歌曲中的人声与音乐分离。 :使用 HiFi AI 分离歌曲中的人声、鼓点、贝斯和其他乐器。 :为 DJ 歌手提供的在线 AI 人声移除器。 :人声移除和在线卡拉 OK。 :使用多种不同算法(Demucs、MDX、UVR 等)免费分离歌曲。 语音合成(TTS)方面: :为所有人提供开放的语音技术。 :基于 AI 的语音引擎能够模仿人类语音的情感和韵律。 :基于 NLP 的最先进文本和音频编辑平台,内置数百种 AI 声音。 :使用突触技术和脑机接口将想象的声音转化为合成 MIDI 乐器的脑控仪器。 :为出版商和创作者开发最具吸引力的 AI 语音软件。 :Wondercraft 使用户能够使用文本转语音技术生成播客。 :基于生成机器学习模型构建内容创作的未来。 :从网页仪表板或 VST 插件生成录音室质量的 AI 声音并训练 AI 语音模型。 :演员优先、数字双重声音由最新的 AI 技术驱动,确保高效、真实和符合伦理。
2025-04-08
吉卜力风格的生成是哪个ai
以下 AI 工具可以生成吉卜力风格的图像: Midjourney:仿照 GPTs 里的 MJ prompt 改了一版提示词,可以用在 coze 或者其他国内的 agent 里。不是很挑模型,基本上都可以用。方便的地方在于如果提示词懒得写全,可以让 agent 直接帮助补全润色,黏贴就可以。例如生成一个巨大鲸鱼头部的特写,鲸鱼的眼睛显示疲惫的神情,一个小女孩站在鲸鱼的旁边抚摸鲸鱼的脸,小女孩占画面比例很小,体现鲸鱼的巨大,吉卜力工作室风格的提示词为:A closeup of a huge whale's head with its tired eyes. A little girl in red dress stands beside the whale, gently touching its face. The girl takes up a small portion of the frame, emphasizing the whale's enormity. Created Using: soft colors, gentle lighting, wideangle lens, Ghibli Studio style ar 16:9 style raw niji 6(画面需要改成了 niji) Sora:生成过左半部分为超现实主义风格,细腻刻画皮肤纹理与光影变化,右半部分为吉卜力动画风格,柔和笔触呈现幻想世界魅力的震撼图像。
2025-04-08
你有看图说话功能么
以下是为您提供的关于看图说话相关的内容: 像高手一样编写 GPT 中,顶部有和 GPT 使用搜索和画图一样的小图示“Talk to”。 实战教程:使用 Sadtalker 让照片说话。利用开源程序让照片说话唱歌,达到基本唇形同步。可独立使用或作为插件放入 stablediffusion。提供了整合包及相关视频教程和下载链接,具体步骤包括点我启动、选择下载图标、启动应用、选择 sadtalker 同步器、导入图片和声音等。 照片数字人工作流及语音合成(TTS)API 出门问问 Mobvoi 中,ComfyUI 全球领导力峰会搭建数字人 workflow(照片数字人驱动),仅需上传一张照片,输入一段文字或上传一段音频,就可以生成短视频让“照片开口说话”,并提供了不同风格的照片驱动效果展示及相关工作流作者和创意策划信息。
2024-12-15
我想要系统学习ai大模型应用开发,能帮我制定一个系统学习路线吗?
以下是一个系统学习 AI 大模型应用开发的学习路线: 1. 掌握深度学习和自然语言处理基础: 学习机器学习、深度学习、神经网络等基础理论。 掌握自然语言处理基础,如词向量、序列模型、注意力机制等。 相关课程:吴恩达的深度学习课程、斯坦福 cs224n 等。 2. 理解 Transformer 和 BERT 等模型原理: 熟悉 Transformer 模型架构及自注意力机制原理。 掌握 BERT 的预训练和微调方法。 研读相关论文,如 Attention is All You Need、BERT 论文等。 3. 学习 LLM 模型训练和微调: 进行大规模文本语料预处理。 熟悉 LLM 预训练框架,如 PyTorch、TensorFlow 等。 微调 LLM 模型进行特定任务迁移。 相关资源:HuggingFace 课程、论文及开源仓库等。 4. LLM 模型优化和部署: 掌握模型压缩、蒸馏、并行等优化技术。 进行模型评估和可解释性研究。 实现模型服务化、在线推理、多语言支持等。 相关资源:ONNX、TVM、BentoML 等开源工具。 5. LLM 工程实践和案例学习: 结合行业场景,进行个性化的 LLM 训练。 分析和优化具体 LLM 工程案例。 研究 LLM 新模型、新方法的最新进展。 6. 持续跟踪前沿发展动态: 关注顶会最新论文、技术博客等资源。 7. 参与相关社区交流和项目实践: 总的来说,AI 大模型应用开发是一个多学科、系统性的领域,需要深入的理论学习和工程实践经验相结合。除了学习基础知识,熟练使用开源框架工具也很关键。保持对前沿动态的跟踪,并实际参与相关项目是获得真知灼见的最佳途径。 此外,以下是一个利用 AI+SMART 安排学习计划的案例: 学习目标与个人或职业发展目标的关系:平时工作中需要经常阅读英文文档。另外,有朋友和客户是英文母语者,想要和他们沟通更加顺畅。其次,希望未来有机会进入大型外企工作。 具体学习内容:首先是词汇需要提高,其次听力、口语、阅读和写作这些方面都进行全面提高。 量化学习进度和成功:以考取雅思 8.0,且可以和朋友或客户流利的交谈为目标。 时间框架:半年内。 现实可行性:目前雅思 6.5,每天可以投入 2 小时。周末可以更多。有访问网络课程的条件,也可以购买书籍或其他学习材料。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-04-08
有哪些支持超长上下文的大模型
以下是一些支持超长上下文的大模型: Scout:支持 1000 万上下文,适合处理超长文本和复杂推理任务。 Maverick:具有 100 万上下文,长记忆优势适配多场景替代 RAG。 Behemoth:2 万亿参数级别的大模型在训,已超越 GPT4.5 在 STEM 表现。 Claude2100k 模型的上下文上限是 100k Tokens,即 100000 个 token。 ChatGPT16k 模型的上下文上限是 16k Tokens,即 16000 个 token。 ChatGPT432k 模型的上下文上限是 32k Tokens,即 32000 个 token。 需要注意的是,token 限制同时对一次性输入和一次对话的总体上下文长度生效。例如,一次性输入不能超过规定的 token 数量,而且随着对话的进行,当达到上限时,会遗忘最前面的对话内容。
2025-04-08
你都融合了哪些大语言模型?
以下是一些融合的大语言模型: 1. LuotuoChineseLLM: 地址: 简介:囊括一系列中文大语言模型开源项目,包含基于已有开源模型(ChatGLM、MOSS、LLaMA)进行二次微调的语言模型、指令微调数据集等。 2. Linly: 地址: 简介:提供中文对话模型 LinlyChatFlow、中文基础模型 LinlyChineseLLaMA 及其训练数据。中文基础模型以 LLaMA 为底座,利用中文和中英平行增量预训练。项目汇总了目前公开的多语言指令数据,对中文模型进行了大规模指令跟随训练,实现了 LinlyChatFlow 对话模型。 3. ChatYuan: 地址: 简介:元语智能发布的一系列支持中英双语的功能型对话语言大模型,在微调数据、人类反馈强化学习、思维链等方面进行了优化。 4. ChatRWKV: 地址: 简介:开源了一系列基于 RWKV 架构的 Chat 模型(包括英文和中文),发布了包括 Raven,NovelChnEng,NovelCh 与 NovelChnEngChnPro 等模型,可以直接闲聊及进行诗歌、小说等创作,包括 7B 和 14B 等规模的模型。 此外,还有以下相关信息: 1. 本地部署资讯问答机器人: Ollama 支持多种大型语言模型,包括通义千问、Llama 2、Mistral 和 Gemma 等,可用于不同应用场景。 Ollama 易于使用,适用于 macOS、Windows 和 Linux 系统,同时支持 cpu 和 gpu。 Ollama 提供模型库,用户可从中下载不同模型,有不同参数和大小以满足需求和硬件条件,可通过 https://ollama.com/library 查找。 用户可通过简单步骤自定义模型,如修改温度参数调整创造性和连贯性,或设置特定系统消息。 Ollama 提供 REST API 用于运行和管理模型,以及与其他应用程序的集成选项。 Ollama 社区贡献丰富,包括多种集成插件和界面,如 Web 和桌面应用、Telegram 机器人、Obsidian 插件等。 2. AIGC 落地应用大全中的案例: Poe(强烈推荐): 推荐指数:🌟🌟🌟🌟🌟 由 Quora 开发,有 APP 版本,支持跨端使用。 集成了 Chat GPT、GPT4、Claude+、Claude、Dragonfly 等模型,同时支持用户自建 Chatbot。 不同语言模型回复效果有差异,适合需要调用多种大语言模型的用户。 Dragonfly 擅长给出较短回答,并擅长在输入中给出示例时遵循指示。 Claude 更擅长创造性回复,配合 Poe 中的提问引导,非常适合在查阅资料时使用,有时能够给出超越直接使用 Chat GPT 时的体验(但和 Chat GPT 一样,Claude 也时常会给出一些错误回复,一些问题可在两个模型中都问一遍提升信息准确性)。 此外支持分享用户和模型的对话内容。但 GPT4、Claude+产品需要付费订阅使用。 访问地址: Poe 中的提问引导真的能够启发到用户。 支持 Explore Chatbot,但丰富度不如后续要介绍的 Character。 midjourney prompt 扩写 Chatbot 能力很惊人。
2025-04-08
你好,你是基于哪个大语言模型的人工智能?
我并非基于某个特定的大语言模型。AI 领域中的语言模型众多,例如 GPT3 等。大语言模型通常是使用深度学习和神经网络创建的,基于人类训练数据来理解单词、代码语法等。像生成式 AI 可以生成文本、图片、音频、视频等内容形式,其中包括大语言模型。2017 年 6 月,谷歌团队发表的论文《Attention is All You Need》首次提出了 Transformer 模型,它基于自注意力机制处理序列数据,不依赖于循环神经网络或卷积神经网络。
2025-04-08
开源flux模型如何快速使用
以下是关于开源 Flux 模型快速使用的方法: 1. 模型的下载: 如果因为环境问题,可以在网盘中下载。 siglipso400mpatch14384(视觉模型):siglip 由 Google 开发的视觉特征提取模型,负责理解和编码图像内容。工作流程包括接收输入图像、分析图像的视觉内容并将这些视觉信息编码成一组特征向量。打开 ComfyUI\models\clip,在地址栏输入 CMD 回车,打开命令行,输入下面的命令拉取模型(也可以在网盘里下载)。 image_adapter.pt(适配器):连接视觉模型和语言模型,优化数据转换。工作流程包括接收来自视觉模型的特征向量、转换和调整这些特征,使其适合语言模型处理。通过 https://huggingface.co/spaces/fancyfeast/joycaptionprealpha/tree/main/wpkklhc6 下载,放到 models 的 Joy_caption 文件夹里,如果该文件夹不存在,就新建一个。 MetaLlama3.18Bbnb4bit(语言模型):大型语言模型,负责生成文本描述。工作流程包括接收经过适配器处理的特征、基于这些特征生成相应的文本描述、应用语言知识来确保描述的连贯性和准确性。打开 ComfyUI\models\LLM,地址栏输入 CMD 回车,在命令行里面输入下面命令。 2. 下载地址: ae.safetensors 和 flux1dev.safetensors 下载地址:https://huggingface.co/blackforestlabs/FLUX.1dev/tree/main 。 准备了夸克和百度的网盘链接,方便部分同学下载: flux 相关模型(体积较大)的夸克网盘链接:https://pan.quark.cn/s/b5e01255608b 。 flux 相关模型(体积较大)的百度网盘链接:https://pan.baidu.com/s/1mCucHrsfRo5SttW03ei0g?pwd=ub9h 提取码:ub9h 。 如果 GPU 性能不足、显存不够,底模可以使用 fp8 的量化版模型,速度会快很多,下载地址:https://huggingface.co/Kijai/fluxfp8/tree/main 。 3. 工作流下载: 最后我们再下载 dev 的工作流: 。或者下面官方原版的图片链接,图片导入 comfyUI 就是工作流:https://comfyanonymous.github.io/ComfyUI_examples/flux/flux_dev_example.png 。我们打开 ComfyUI,把工作流或图片拖拽到 ComfyUI 里。
2025-04-08
大模型应用开发岗位需要掌握什么
大模型应用开发岗位通常需要掌握以下内容: 1. 编程思维和 Python 基础。 2. 认识大模型 Embedding 技术,包括理论知识和代码实战。 3. 在构建模型应用方面: 根据项目需求选择合适的开发框架。 了解业务背后的深层次需求,设定流程环节以确保模型能解决实际问题。 在每个环节精心设计提示词,引导模型提供准确有用的回复。 确保应用在提供服务时遵守安全和伦理标准。 通过不断测试和迭代优化模型性能和用户体验。 成功部署应用后持续维护和更新以适应需求变化。 4. 提示词的精细设计和调试,因为其直接影响模型的输出质量和应用效果。 5. 对于智能体构建,了解动态推理智能体情感设定,以制作更有情商的智能体。
2025-04-08