Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

midjourney绘制原理是什么

Answer

Midjourney 的绘制原理包括以下方面:

  1. 多人群像 Z 轴空间内容输出(7 步):
    • 第一步:模拟场景,优先生成“构图”为主的画面,因为 Midjourney 的出图原理具有随机性,过多内容在一张图时难以控制效果,尤其是侧身角度过去的透视视角图。
    • 第二步:抓取关键要素“风格参考图”,图片能让 Midjourney 更好地理解(读取)空间关系。若没有现成的图,可通过巧思处理。
    • 第三步:回到 Midjourney 进行垫图(即梦出的图作为 sref,原始侧身照作为 cref)+ prompt 抽图。
    • 第四步:对生成的图进行重绘和精修,如调整站姿、面部等。
  2. 以图绘图功能:先选一张满意的图片,在 Discord 社区的 Midjourney 服务器上传,获取图片链接,然后结合 prompt 提示词发送给 Midjourney,它会根据需求生成特定图片。

此外,目前市面上主流的 AI 绘图软件有 Stable Diffusion 和 Midjourney。Stable Diffusion 开源免费、可本地化部署、创作自由度高,但对电脑配置尤其是显卡有要求;Midjourney 操作简单方便、创作内容丰富,但需要科学上网且付费。

Content generated by AI large model, please carefully verify (powered by aily)

References

Midjourney群像人物一致性保持及空间深度控制

Step 1:模拟场景:小伙伴画了一张抽象化的参考图用以理解画面的空间关系,在此基础上出图,一步到位非常难,因为对于当下的Midjourney来说,出图原理决定了随机性,如果给过多内容在一张图的时候,难以控制效果,尤其是侧身角度过去的透视视角图,所以构思的时候第一步要优先生成“构图”为主的画面,在此基础上进行细化修改。Step 2:这时候需要倒退回第一个教程抓取关键要素- “风格参考图”,比起文字,图片会让Midjourney能理解(读取)到空间关系。基于没有现成的图,于是我动了些巧思-把那张抽象的手稿丢给了即梦,让即梦按照手稿出图(选择-景深参考)。Step 3:回到Midjourney -垫图(即梦出的图作为sref,原始侧身照作为cref)+ prompt开始抽图。Step 4:第三步生成的图效果已经有90%,但是站姿不合常理(没有真的侧身站立)。因此决定重绘面部及侧身幅度,在重绘多轮后得到了下图,但人物面部过于2d,所以需要继续精修。

个性:给自己做一个卡通头像

之前我制作了一篇视频,教大家怎么从零开始使用Midjourney并通过简单的提示词来生成图片。今天教点高级的知识,利用Midjourney的以图绘图功能来生成属于你的迪斯尼卡通风格的头像。这就是我使用我的照片为底图生成的迪斯尼风格的头像。如果你还没有Midjourney账号,或者还不懂基础操作,可以看我之前的教程。[AI绘画工具Midjourney新手注册、绘画指令教程|看这一篇就够了](https://www.youtube.com/watch?v=VBlU2UYYUHw)要生成一张Disney风格的头像,我们先选一张你比较满意的图片,在Discord社区的Midjourney服务器聊天栏点击+,然后点击上传文件,选取图片,然后在聊天框发送。(记得这里一定要点击回车或发送按钮)然后图片会上传到服务器并生成一张唯一的链接,我们点击图片,然后点击在浏览器中打开,然后可以看到浏览器上方有一个链接,这个链接就是这张图片的链接,我们复制下来。我们可以使用这个链接加prompt提示词来发送给Midjourney,Midjourney会根据我们的需求来生成特定的图片,这就是Midjourney的以图绘图。

【SD】软件原理傻瓜级理解

目前市面上主流的AI绘图软件有两个:Stable Diffusion和Midjourney。Stable Diffusion的优势在于开源免费、可以本地化部署、创作自由度很高,缺点是需要比较好的电脑配置,尤其是显卡;Midjourney的优势是操作简单方便,创作内容相当丰富,但是需要科学上网并且付费,目前的使用费大概在每月200多元左右。如果可以融入工作流,这个月费也不算高,毕竟它带来的效率是惊人的,当然前期想要了解玩一玩的,可以试试Stable Diffusion,关于具体的安装方法可以去看看B站的【秋葉aaaki】这个Up主的视频。很多还没有接触过AI绘画的朋友会觉得这个东西很神秘,哪怕装好了软件也会看着一堆英文和参数而一头雾水。今天我就用最傻瓜的方式来讲述一下Stable Diffusion的工作原理和基本功能。

Others are asking
给我5个midjourney确保场景一致性的Sample提示词
以下是 5 个 Midjourney 确保场景一致性的 Sample 提示词: 1. Scifi movie scene. In the silverwhite space environment, from the overtheshoulder lens on the right side of the man with short hair and navy blue jumpsuit, a transparent virtual screen appeared on the wall in front of him. Behind there is the silhouette of another female employee with long blue hair, operating another screen. Rendered in a C4D style inspired by Unreal Engine, with high resolution and rich detail. sref url cref url ar 16:9 style raw sw 30 cw 100 2. In a magical forest, a fairy with colorful wings is sitting on a huge mushroom. The sunlight filters through the leaves, creating dappled patterns on the ground. cref https://my.image.host/fairy.jpg s 800 3. On a sandy beach at sunset, a couple is walking hand in hand, leaving footprints in the sand. The ocean waves crash gently in the background. cref https://my.image.host/couple.jpg ar 9:16 4. In a medieval castle courtyard, a knight in shining armor is training with a sword. The flags are fluttering in the wind. cref https://my.image.host/knight.jpg s 700 5. At a busy city street corner, a street musician is playing a guitar, surrounded by a crowd of people. The buildings are towering in the background. cref https://my.image.host/musician.jpg ar 4:3
2025-02-14
MidJourney
以下是关于 Midjourney 的相关信息: 隐私政策: 适用于 Midjourney,Inc.、Midjourney.com 网站和 Midjourney 图像生成平台的服务。 个人数据指与个人相关、可用于识别个人身份的任何信息。 适用性包括通过服务、训练算法、网站及第三方来源收集的数据,但不适用于 Midjourney 员工等的个人数据。 可能会更新政策,用户应定期查看,不接受更改应停止互动。 定义了“您”和“使用数据”等概念。 收集的数据类型包括个人数据。 图像提示: 可将图像 URL 添加到提示中,通过/imagine 输入,可拖入或粘贴图片链接。 使用 Midjourney Bot 私信上传图像可防止被其他用户看到,除非用户有隐身模式,否则图像提示在网站上可见。 给出了起始图像、中途模型版本 4 和 5 等的例子,以及纵横比提示。 社区准则: Midjourney 是默认开放的社区。 要友善尊重彼此和员工,禁止不尊重、攻击性或辱骂性内容,禁止成人和血腥内容。 未经许可不得公开转发他人创作,分享时要小心。 违反规则可能导致服务被禁止,规则适用于所有内容。
2025-02-13
Midjourney怎么用
以下是关于 Midjourney 的使用方法: 使用 Vary Region 编辑器选择并重新生成放大图像的特定部分: 1. 生成图像:使用命令 /imagine 创建图像。 2. 升级图像:使用 U 按钮放大所选图像。 3. 选择不同区域:点击🖌️Vary按钮,打开编辑界面。 选择编辑器左下角的手绘或矩形选择工具。 选择要重新生成的图像区域。注意选择的大小会影响结果,更大的选择会为 Midjourney 机器人提供更多空间生成新的创意细节,较小的选择则导致更小、更微妙的变化。无法编辑现有选择,但可以使用右上角的撤消按钮撤消多个步骤。 4. 提交您的工作:单击 Submit→按钮将请求发送到 Midjourney Bot。 5. 查看结果:Midjourney 机器人将处理作业并在选择的区域内生成新的变化图像网格。 喂图: 意义:从第一张起,可反复上传优化图片,来达到自己想要的图片。 喂图过程: 1. 上传单张或者一组(4 到 5 张,目前没有限制多少张,但一般 4 张刚刚好,太多会给 AI 带来困扰)到 Midjourney 输入框里,上传有两种方法: 点击输入框前方的加号上传。 鼠标选择图片或一组拖到软件里,回车,点击上传后的图片,在左下角“在浏览器打开链接“打开后复制浏览器上的链接,返回主界面,在输入框里“/imagine:粘贴刚才复制的链接+您所描述的关键词。 常见问题: 1. 小白新手找不到输入框频道。 答:找到 Midjourney 白色图标,点击进去,找带数字结尾的频道,或者在自己社区里添加 Midjourney 机器人。 Seed 种子: Midjourney 机器人使用种子号来创建视觉噪声场(例如电视静电),作为生成初始图像网格的起点。seed 接受 0–4294967295 的整数。seed 值仅影响初始图像网格。使用不同模型版本的相同 seed 值,生成的图像效果不同。 种子参数: 如果未指定种子,Midjourney 将使用随机生成的种子编号,每次使用提示时都会生成多种选项。 查找工作的种子号: 1. 通过对作业使用✉️信封表情符号进行反应。 2. 使用 Show 命令恢复旧作业,复制作业 ID 并使用/show<Job ID>命令来恢复作业,然后使用✉️信封表情符号对新生成的作业做出反应。 更改种子数量:添加seed<value>到提示的末尾。
2025-02-12
midjourney
以下是关于 Midjourney 的相关信息: 隐私政策: 适用于 Midjourney,Inc.、Midjourney.com 网站和 Midjourney 图像生成平台的服务。 个人数据指与个人相关、可用于识别个人身份的信息。 适用性包括通过服务、训练机器学习算法、网站及第三方来源收集的数据,但不适用于 Midjourney 员工等的个人数据。 可能会更新政策,用户应定期查看,不接受更改应停止互动。 定义了“您”和“使用数据”等概念。 收集的数据类型包括个人数据。 图像提示: 可将图像 URL 添加到提示中,通过/imagine 输入,可拖入或粘贴图片链接。 使用 Midjourney Bot 在私信中上传图像可防止被其他用户看到,除非用户有隐身模式,否则图像提示在网站上可见。 给出了起始图像、中途模型版本 4 和 5 等的例子,以及纵横比提示。 社区准则: Midjourney 是默认开放的社区。 要友善尊重彼此和员工,禁止不尊重、攻击性或辱骂性内容,禁止成人和血腥内容。 未经许可不得公开转发他人创作,分享时要小心。 违反规则可能导致服务被禁止,规则适用于所有内容。
2025-02-08
如何访问midjourney社区
要访问 Midjourney 社区,您可以按照以下步骤进行: 1. 拥有一个 Discord 账号:如果没有,可参考进行验证。 2. 订阅 Midjourney 计划:访问了解有关定价和各层可用功能的信息。 3. 加入 Midjourney 服务器: 打开 Discord 并找到左侧边栏上的服务器列表。 按服务器列表底部的“+”按钮。 在弹出窗口中,单击“Join a Server”按钮。 粘贴或输入以下 URL:。 4. 转到任何“General”或“Newbie”频道:加入 Midjourney 服务器后,您会在侧边栏中看到列出的几个频道。 此外,您的 Midjourney 订阅使您可以访问 Niji 社区。要为 Niji 模型版本创建风格调谐器或代码,请加入并以与 Midjourney Bot 交互的方式与 Niji 机器人交互。
2025-01-14
midjourney 教程
以下是关于 Midjourney 的一些教程: 1. 利用一致性 MJ 出海马体写真: 超低学习成本,会用任意手机修图软件即可。 得益于 cref,能迅速达成角色一致性目的,无需 Lora。cref 代表 character reference(角色参考),cw 代表 character weight(参考权重),默认为 100,会参考角色的人脸和服装特点。若只想关注人脸,可调低到 0。 风格复制和服装替换,用提示词(prompt)和 sref,默认值 100,越高越接近参考图像的风格。 用 /describe 指令反推海马体的提示词,配合 sref复制图像风格。回车前检查提示词,避免出现和 sref 风格差异过大的 prompt,也可增加有用的 prompt。 对最满意的图进行 Upscale,解决“形似而神不似”的问题,即 MJ 直出和原人物在五官等地方的细微差距。 2. 线稿上色 Midjourney + Stable Diffusion: 用 Midjourney 生成线稿,PS 修正错误,再用 ControlNet 控制,Stable Diffusion 上色,多套 AI 组合提高出图质量和效率。 例如生成可爱猫卡通 IP 角色的线稿,mj 关键词:Black and white line drawing illustration of a cute cat cartoon IP character,black line sketch,wearing a fortune hat,wearing a collar around the neck,Carrying a huge bag containing scrolls and ingots,matching rope and straps at his wrists,Chinese element style,popular toys,blind box toys,Disney style,white backgroundniji 5style expressive。 3. 小白 30min 加入离谱村: 选工具,如 SD 或 Midjourney。 抄 prompt,从教程和导航中找喜欢的风格,摘取提示词。 找 ChatGPT 改写提示词。 把提示词喂给 Midjourney 机器人,初学者可多按 VU 让其自由修改,先弄出满意的图,如 V1V4 基于某图修改出 4 张,U1U4 选定某图细节调整。
2025-01-08
请问想根据旅游日记绘制黑白线条的插画如何通过AI实现
要根据旅游日记绘制黑白线条的插画,可以通过以下步骤利用 AI 实现: 1. 利用 Midjourney 生成线稿:使用关键词如“Black and white line drawing illustration of your travel diary scene, black line sketch, , Chinese element style, popular toys, blind box toys, Disney style, white background niji 5 style expressive”。 2. 对生成的线稿在 PS 中手动重绘错误的地方。比如有些图出来没有阴影容易飘,可以自己画一个出来。 3. 利用 Stable Diffusion 上色:使用 Controlnet 控制上色效果。 4. 对于着色画,了解其特点和艺术效果,包括色彩的丰富性、情感表达、细节和纹理的突出以及创意发挥等方面。 5. 在编写 AI 绘画的关键词时,遵循基础描述、风格指定、色彩要求和细节强调的结构思路。例如:基础描述为“a beautiful and memorable scene from your travel diary”,风格指定为“line art”,色彩要求为“black and white color matching”,细节强调为“changes in line thickness”。 6. 尝试进阶玩法,如用 MJ 的 Retexture 功能或即梦参考功能,通过写提示词或垫图功能给着色画上色。
2025-02-10
有没有好的ai工具,可以根据excel的数据,根据我的要求绘制图标
以下是一些可以根据 Excel 数据并按照您的要求绘制图标的 AI 工具: 1. Lucidchart: 简介:强大的在线图表制作工具,集成了 AI 功能,可绘制多种示意图,包括流程图、思维导图、网络拓扑图等。 功能:拖放界面,易于使用;支持团队协作和实时编辑;丰富的模板库和自动布局功能。 官网:https://www.lucidchart.com/ 2. Microsoft Visio: 简介:专业的图表绘制工具,适用于复杂的流程图、组织结构图和网络图,AI 功能可帮助自动化布局和优化图表设计。 功能:集成 Office 365,方便与其他 Office 应用程序协同工作;丰富的图表类型和模板;支持自动化和数据驱动的图表更新。 官网:https://www.microsoft.com/enus/microsoft365/visio/flowchartsoftware 3. Diagrams.net: 简介:免费且开源的在线图表绘制工具,适用于各种类型的示意图绘制。 功能:支持本地和云存储(如 Google Drive、Dropbox);多种图形和模板,易于创建和分享图表;可与多种第三方工具集成。 官网:https://www.diagrams.net/ 假设您需要创建一个项目管理流程图,可以按照以下步骤使用 Lucidchart: 1. 注册并登录:https://www.lucidchart.com/ 2. 选择模板:在模板库中搜索“项目管理流程图”。 3. 编辑图表:根据您的项目需求添加和编辑图形和流程步骤。 4. 优化布局:利用 AI 自动布局功能,优化图表的外观。 5. 保存和分享:保存图表并与团队成员分享,或导出为 PDF、PNG 等格式。 此外,以下工具可以用于画逻辑视图、功能视图、部署视图: 1. Lucidchart:流行的在线绘图工具,支持多种视图创建,用户可使用拖放界面轻松创建架构图。 2. Visual Paradigm:全面的 UML 工具,提供创建各种架构视图的功能。 3. ArchiMate:开源建模语言,与 Archi 工具一起使用可创建逻辑视图。 4. Enterprise Architect:强大的建模、设计和生成代码工具,支持多种视图创建。 5. Microsoft Visio:广泛使用的图表和矢量图形应用程序,提供丰富模板。 6. draw.io(现在称为 diagrams.net):免费的在线图表软件,允许创建各种类型图表。 7. PlantUML:文本到 UML 的转换工具,可通过编写描述性文本生成视图。 8. Gliffy:基于云的绘图工具,提供创建各种架构图的功能。 9. Archi:免费开源工具,用于创建 ArchiMate 和 TOGAF 模型,支持逻辑视图创建。 10. Rational Rose:IBM 的 UML 工具,支持创建多种视图。
2024-12-18
我想将一个图片的格式色调,复制到另一张图片,不改变图片绘制内容,应该用什么
以下是一些可用于将一张图片的格式色调复制到另一张图片而不改变绘制内容的方法和工具: 1. ComfyUI_LayerStyle 插件: 添加 节点,可自动调整图片色调。 将 LUT 应用到图像: 支持.cube 格式的 LUT 文件。 节点选项包括 LUT 选择、色彩空间选择等。 自动调整图片的亮度、对比度和白平衡,可手动调整强度及各通道参数。 改变图像的色温、色彩平衡、色阶和 Gamma 值等。 2. 其他可能的方法: 某些专业的图像处理软件,如 Adobe Photoshop 等,可能具有相应的功能来实现色调复制。 您可以根据具体需求和使用习惯选择适合的方法和工具。
2024-12-09
如何绘制3D图片
绘制 3D 图片主要有以下两种方式: 1. 文生 3D 模型: 在「Create」界面底部的输入框中输入提示词(不支持中文)。不会写提示词的伙伴,可点击输入框左侧的</>按钮随机生成并自动填入。 填写好提示词后,点击右侧的「Create」生成 3D 模型,每次会生成 4 个基础模型。若不满意,可点击最下方白色的「Retry」按钮重新生成 4 个基础模型。 若有满意的模型,点击单个模型下方黄色的「Refine」精修此模型。在「My Models」中可查看精修进度,一般 5 分钟左右完成。 2. 图生 3D 模型: 点击输入框右侧的图标,上传图片来生成 3D 模型。 图生 3D 一次只会生成一个基础模型,同样支持「Retry」重生成和「Refine」精修。 以下是一些图片生成 3D 建模工具: 1. Tripo AI:VAST 发布的在线 3D 建模平台,能利用文本或图像在几秒钟内生成高质量且可立即使用的 3D 模型,基于数十亿参数级别的 3D 大模型,实现快速的 2D 到 3D 转换,并提供 AI 驱动的精准度和细节。 2. Meshy:功能全面,不仅支持文本生成 3D,还支持图片生成 3D 以及 AI 材质生成。用户可通过上传图片并描述需要的材质和风格生成高质量 3D 模型。 3. CSM AI:支持从视频和图像创建 3D 模型,Realtime Sketch to 3D 功能支持通过手绘草图实时设计 3D 形象,再转换为 3D 模型。 4. Sudo AI:支持通过文本和图像生成 3D 模型,特别适用于游戏领域的模型生成。用户可上传图片或输入文本提示词来生成 3D 模型。 5. VoxCraft:由生数科技推出的免费 3D 模型生成工具,能将图像或文本快速转换成 3D 模型,并提供图像到 3D、文本到 3D 和文本到纹理等多种功能。 这些工具通常具有用户友好的界面,允许用户通过简单操作生成 3D 模型,无需专业的 3D 建模技能,可广泛应用于游戏开发、动画制作、3D 打印、视觉艺术等领域。但请注意,内容由 AI 大模型生成,请仔细甄别。
2024-12-04
怎么用AI绘制一个我指定的动漫人物原型的各类图片,例如日漫《好想告诉你》中的黒沼爽子
要使用 AI 绘制指定的动漫人物原型,如日漫《好想告诉你》中的黑沼爽子,您可以按照以下步骤进行: 1. 选择合适的 AI 绘画工具:目前有许多在线的 AI 绘画平台和软件可供选择,例如 DALL·E2、StableDiffusion 等。 2. 明确描述特征:在输入描述时,尽可能详细地描述黑沼爽子的外貌特征,包括发型(如黑色的长直发)、眼睛(如大而明亮的眼睛)、服装(如校服的款式和颜色)、表情(如羞涩的微笑)等。 3. 参考相关图片:如果可能,找到黑沼爽子的官方图片或其他粉丝绘制的作品,作为参考提供给 AI 绘画工具,以帮助其更好地理解您的需求。 4. 不断调整和优化:根据生成的初步结果,对描述进行调整和优化,例如修改某些特征的描述、增加更多细节等,以获得更符合您期望的图片。 需要注意的是,AI 绘画的结果可能会受到多种因素的影响,不一定能完全符合您的预期,但通过不断尝试和优化,您有机会获得较为满意的作品。
2024-10-17
是否有可以输入图片输出重新绘制的流程图的AI工具
以下是一些可以输入图片输出重新绘制的流程图的 AI 工具: 1. Lucidchart: 简介:强大的在线图表制作工具,集成了 AI 功能,可自动化绘制多种示意图。 功能:拖放界面,易于使用;支持团队协作和实时编辑;丰富的模板库和自动布局功能。 官网:https://www.lucidchart.com/ 2. Creately: 简介:在线绘图和协作平台,利用 AI 功能简化图表创建过程,适合绘制多种图表。 功能:智能绘图功能,可自动连接和排列图形;丰富的模板库和预定义形状;实时协作功能。 官网:https://creately.com/ 3. Whimsical: 简介:专注于用户体验和快速绘图的工具,适合创建多种示意图。 功能:直观的用户界面,易于上手;支持拖放操作,快速绘制和修改图表;提供多种协作功能。 官网:https://whimsical.com/ 4. Miro: 简介:在线白板平台,结合 AI 功能,适用于团队协作和各种示意图绘制。 功能:无缝协作,支持远程团队实时编辑;丰富的图表模板和工具;支持与其他项目管理工具集成。 官网:https://miro.com/ 5. Microsoft Visio: 简介:专业的图表绘制工具,适用于复杂的流程图等。AI 功能可帮助自动化布局和优化图表设计。 功能:集成 Office 365,方便与其他 Office 应用程序协同工作;丰富的图表类型和模板;支持自动化和数据驱动的图表更新。 官网:https://www.microsoft.com/enus/microsoft365/visio/flowchartsoftware 6. Diagrams.net: 简介:免费且开源的在线图表绘制工具,适用于各种类型的示意图绘制。 功能:支持本地和云存储(如 Google Drive、Dropbox);多种图形和模板,易于创建和分享图表;可与多种第三方工具集成。 官网:https://www.diagrams.net/ 使用这些 AI 工具绘制示意图的一般步骤如下: 1. 选择工具:根据具体需求选择合适的 AI 绘图工具。 2. 创建账户:注册并登录该平台。 3. 选择模板:利用平台提供的模板库,选择适合需求的模板。 4. 添加内容:根据需求添加并编辑图形和文字,利用 AI 自动布局功能优化图表布局。 5. 协作和分享:若需要团队协作,可邀请团队成员一起编辑。完成后导出并分享图表。
2024-10-07
我是一个有23年软件系统开发和设计经验的架构师,但是对AI还没有系统化了解过,请问我该如何开始?如何在短时间内掌握AI的使用、原理以及二次开发?
以下是为您提供的在短时间内系统化学习 AI 的建议: 一、了解 AI 基本概念 首先,建议阅读「」部分,熟悉 AI 的术语和基础概念。了解什么是人工智能,它的主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。同时,浏览入门文章,这些文章通常会介绍 AI 的历史、当前的应用和未来的发展趋势。 二、开始 AI 学习之旅 在「」中,您将找到一系列为初学者设计的课程。这些课程将引导您了解生成式 AI 等基础知识,特别推荐李宏毅老师的课程。您还可以通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 三、选择感兴趣的模块深入学习 AI 领域广泛(比如图像、音乐、视频等),您可以根据自己的兴趣选择特定的模块进行深入学习。我建议您一定要掌握提示词的技巧,它上手容易且很有用。 四、实践和尝试 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 五、体验 AI 产品 与现有的 AI 产品进行互动是学习 AI 的另一种有效方式。尝试使用如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。通过与这些 AI 产品的对话,您可以获得对 AI 在实际应用中表现的第一手体验,并激发您对 AI 潜力的认识。 如果希望继续精进,对于 AI,可以尝试了解以下内容作为基础: 1. AI 背景知识 (1)基础理论:了解人工智能、机器学习、深度学习的定义及其之间的关系。 (2)历史发展:简要回顾 AI 的发展历程和重要里程碑。 2. 数学基础 (1)统计学基础:熟悉均值、中位数、方差等统计概念。 (2)线性代数:了解向量、矩阵等线性代数基本概念。 (3)概率论:基础的概率论知识,如条件概率、贝叶斯定理。 3. 算法和模型 (1)监督学习:了解常用算法,如线性回归、决策树、支持向量机(SVM)。 (2)无监督学习:熟悉聚类、降维等算法。 (3)强化学习:简介强化学习的基本概念。 4. 评估和调优 (1)性能评估:了解如何评估模型性能,包括交叉验证、精确度、召回率等。 (2)模型调优:学习如何使用网格搜索等技术优化模型参数。 5. 神经网络基础 (1)网络结构:理解神经网络的基本结构,包括前馈网络、卷积神经网络(CNN)、循环神经网络(RNN)。 (2)激活函数:了解常用的激活函数,如 ReLU、Sigmoid、Tanh。 此外,以证件照为例,Code AI 应用开发教学中,智能体开发从最初的 chatbot 只有对话框,到有了更多交互方式,因用户需求扣子推出了 AI 应用,其低代码或零代码的工作流等场景做得较好。但 AI CODING 虽强,目前适用于小场景和产品的第一个版本,复杂应用可能导致需求理解错误从而使产品出错。在创建 AI 应用时,要学习操作界面、业务逻辑和用户界面,包括布局、搭建工作流、用户界面及调试发布,重点熟悉桌面网页版的用户界面。
2025-02-17
大模型的基本原理
大模型的基本原理如下: 1. 模仿人类大脑结构,表现出人的特征,应对大模型回答不及预期的解决之道与人与人交流沟通的技巧相似。 2. GPT 全称是生成式预训练转换器模型(Generative Pretrained Transformer): 生成式(Generative):大模型根据已有的输入为基础,不断计算生成下一个字词(token),逐字完成回答。例如,从提示词“How”开始,依次推理计算出“are”“you”等,直到计算出下一个词是的概率最大时结束输出。 3. 通俗来讲,大模型通过输入大量语料来让计算机获得类似人类的“思考”能力,能够进行文本生成、推理问答、对话、文档摘要等工作。其训练和使用过程可类比为上学参加工作: 找学校:训练大模型需要大量计算,GPU 更合适,只有购买得起大量 GPU 的才有资本训练。 确定教材:大模型需要大量数据,几千亿序列(Token)的输入基本是标配。 找老师:用合适算法讲述“书本”内容,让大模型更好理解 Token 之间的关系。 就业指导:为让大模型更好胜任某一行业,需要进行微调(fine tuning)指导。 搬砖:就业指导完成后进行推导(infer),如进行翻译、问答等。 4. 在 LLM 中,Token 被视为模型处理和生成的文本单位,可代表单个字符、单词、子单词等,在将输入进行分词时会对其进行数字化,形成词汇表。 5. 相关技术名词及关系: AI 即人工智能。 机器学习包括监督学习、无监督学习、强化学习,监督学习有标签,无监督学习无标签自主发现规律,强化学习从反馈里学习。 深度学习参照人脑有神经网络和神经元,神经网络可用于多种学习方式。 生成式 AI 可生成多种内容形式,LLM 是大语言模型,生成只是大语言模型的一个处理任务。 6. 技术里程碑:2017 年 6 月,谷歌团队发表论文《Attention is All You Need》,首次提出 Transformer 模型,基于自注意力机制处理序列数据,不依赖 RNN 或 CNN。
2025-02-17
ai修图的原理
AI 修图的原理主要包括以下几个方面: 1. 对于 Stable Diffusion 这类软件,其工作原理类似于学习画画。就像学习梵高的风格,需要大量临摹,而 AI 则通过对成千上万美术风格作品的学习形成大模型,如 Checkpoint。用户要想获得满意的作品,需选择合适的大模型。大模型可在 C 站下载,但需科学上网。 2. ComfyUI 是一个开源的用于生成 AI 图像的图形用户界面,主要基于 Stable Diffusion 等扩散模型。其原理包括 Pixel Space(像素空间)和 Latent Space(潜在空间)。像素空间对应输入图像或随机噪声图像,最终生成的图像也会转换回像素空间。许多操作在潜在空间进行,如通过 KSampler 节点执行采样过程,可通过节点调整潜在空间的操作,如噪声添加、去噪步数等。 3. 扩散过程是从噪声生成图像的过程,通过调度器控制,如 Normal、Karras 等,可选择不同调度器控制在潜在空间中处理噪声及逐步去噪回归到最终图像。时间步数也会影响图像生成的精细度和质量。 在实际的 AI 修图过程中,还涉及到提示词编写、对输出图片的二次和多次微调、确定情绪和风格等锚点再发散联想等操作,以获得更符合需求的修图效果。
2025-02-13
agi的方法原理
OpenAI 能够跑通所有 AGI 技术栈的方法原理主要基于以下几个方面: 1. 方法论明确:有着清晰的逻辑结构和明确的推论,甚至可以用公理化的方式描述。 公理 1:The bitter lesson。长期来看,AI 领域所有的奇技淫巧都比不过强大的算力夹持的通用的 AI 算法,强大的算力加持的通用的 AI 算法才是 AGI 路径的正道。 公理 2:Scaling Law。一旦选择了良好且通用的数据表示、标注和算法,就能找到一套通用规律,保证数据越多、模型越大、效果越好,甚至能在训练模型之前预知效果。 公理 3:Emerging properties。这是一条检验公理,用于判断 scaling law 带来的是质变而非量变,即随着 scaling law 的进行,模型会突然稳定掌握之前不能掌握的能力。 2. 具体实践: 在 GPT 中,良好且通用的数据表示是 tokenizer 带来的 embedding,数据标注是文本清理和去重的一套方法,算法是大家熟知的 transformers + autoregressive loss。 在 Sora 中,良好且通用的数据表示是 video compress network 带来的 visual patch,数据标注是 OpenAI 自己的标注器给视频的详细描述,算法是大家熟知的 transformers + diffusion。 3. 数据和任务: 大量数据从世界本身获取,世界产生的数据是 AGI 需要的数据的最小集合,OpenAI 未来会执着于持续获得或者构造数据。 要最有效地利用数据,需要做生成模型,能够模拟和生成整个世界,OpenAI 未来还会在更多的模态和数据上去做生成模型。 通用模型也是 OpenAI 追求的方向。
2025-02-12
deepseek技术原理
DeepSeek 技术原理包括以下方面: 核心原理认知: AI 特性定位:支持文本/代码/数学公式混合输入,具有动态上下文(约 4K tokens 上下文窗口)和任务适应性(可切换创意生成/逻辑推理/数据分析模式)。 系统响应机制:采用意图识别+内容生成双通道理,自动检测 prompt 中的任务类型、输出格式、知识范围,对位置权重(开头/结尾)、符号强调敏感。 基础指令框架: 可以套用框架指令,如四要素模板。 格式控制语法包括强制结构(使用```包裹格式要求)、占位符标记(用{{}}标注需填充内容)、优先级符号(>表示关键要求,!表示禁止项)。 进阶控制技巧: 思维链引导:分步标记法,如请逐步思考:1.问题分析→2.方案设计→3.风险评估;苏格拉底式追问,即在得出最终结论前,请先列举三个可能存在的认知偏差。 知识库调用:领域限定指令,如基于 2023 版中国药典,说明头孢类药物的配伍禁忌;文献引用模式,如以 Nature 2022 年发表的论文为参考,解释 CRISPRCas9 最新突破。 多模态输出。 此外,1 月 30 日社区动态速览中提到了 DeepSeek 相关的基本术语,阐述其省钱原因,包括高效硬件使用、创新训练方法、高效模型压缩、避免无效尝试等,还提及成本对比及创新蒸馏技术。接着从核心思想、技术实现方式(知识表示、温度调节)、训练过程(基本流程、关键点)、DeepSeek 的创新及有效性原因(信息压缩、概率分布学习、泛化能力)等方面详细讲述了蒸馏工作原理。1 月 26 日社区动态速览中提到 Deepseek 提示词框架的四大模块:任务目的(Purpose)、计划规则(Planning Rules)、格式规则(Format Rules)、输出说明(Output)。
2025-02-11
请简单解释或者举例DeepSeek与ChatGPT的区别,原理
DeepSeek 与 ChatGPT 的区别主要体现在以下方面: 1. 在 App Store 排名上,DeepSeek R1 冲到了美国区 App Store 第一名,超越了 ChatGPT。 2. 口碑与技术实力方面,DeepSeek 没有市场部和市场投放,完全依靠技术实力和口碑获得用户认可。 3. 性能与成本方面,DeepSeek R1 的效果比肩顶尖闭源模型 o1,但价格仅为 o1 的 27 分之一。 4. 开源与创新方面,DeepSeek R1 开源让行业认知整体拉齐,得到全世界尊重和喜爱。 5. 训练方式上,DeepSeek R1 的创新模型 R1 Zero 跳过了监督微调(SFT)阶段,直接采用强化学习(RL)进行训练。 6. 在回答用户问题时,DeepSeek R1 会先进行“自问自答”式的推理思考,模拟人类的深度思考,以提升最终回答的质量,而 ChatGPT 可能没有这种特定的机制。 原理方面:DeepSeek R1 与 ChatGPT 同属于基于强化学习 RL 的推理模型,但在具体的训练和推理过程中可能存在差异。例如,DeepSeek R1 在训练时可能有独特的方法和策略,使其在性能和表现上与 ChatGPT 有所不同。
2025-02-11