Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

和manus差不多的软件

Answer

以下是与 Manus 模式类似的软件:

  1. Same.dev:像素级 UI 还原,自动生成对应代码,云端运行,支持自定义编码,但免费额度使用快,需输入 API,目前网站被标记危险。相关链接:http://Same.devhttps://xiaohu.ai/c/ai-23cc23/same-dev-ui-205a3fdd-9e9b-4754-afd7-f88d92fede1ahttps://x.com/imxiaohu/status/1900085131467194708
  2. Genspark Super Agent:作为世界上首个 Mixture-of-Agents 系统,集多种功能于一体,能自动完成复杂任务。在 GAIA 基准测试的三个级别中得分均高于 Manus,具有近乎即时的结果、执行过程中错误和幻觉显著减少、让用户掌控一切并能指导和优化输出等优势。它是世界上第一个 Mixture-of-Agents 系统,利用最佳模型、工具和数据集来执行不同的任务,比如基础智能体的对话、图片、视频生成以及翻译。
Content generated by AI large model, please carefully verify (powered by aily)

References

XiaoHu.AI日报

像素级UI还原,自动生成对应代码云端运行,模式类似Manus,支持自定义编码免费额度使用快,需输入API;目前网站被标记危险⚠️?[http://Same.dev](http://Same.dev)?[https://xiaohu.ai/c/ai-23cc23/same-dev-ui-205a3fdd-9e9b-4754-afd7-f88d92fede1a](https://xiaohu.ai/c/ai-23cc23/same-dev-ui-205a3fdd-9e9b-4754-afd7-f88d92fede1a)?[https://x.com/imxiaohu/status/1900085131467194708](https://x.com/imxiaohu/status/1900085131467194708)4⃣️?️Gemini 2.0 Flash图像生成功能正式上线!聊天即可PS图片、局部编辑不破坏整体支持文本渲染,轻松做广告海报说一句“50% OFF+商品图”,高质量海报立马生成?[https://www.xiaohu.ai/c/xiaohu-ai/gemini-2-0-flash](https://www.xiaohu.ai/c/xiaohu-ai/gemini-2-0-flash)?[https://x.com/imxiaohu/status/1899996898259554379](https://x.com/imxiaohu/status/1899996898259554379)5⃣️?Google DeepMind发布新一代通用机器人AI:Gemini Robotics

XiaoHu.AI日报

像素级UI还原,自动生成对应代码云端运行,模式类似Manus,支持自定义编码免费额度使用快,需输入API;目前网站被标记危险⚠️?[http://Same.dev](http://Same.dev)?[https://xiaohu.ai/c/ai-23cc23/same-dev-ui-205a3fdd-9e9b-4754-afd7-f88d92fede1a](https://xiaohu.ai/c/ai-23cc23/same-dev-ui-205a3fdd-9e9b-4754-afd7-f88d92fede1a)?[https://x.com/imxiaohu/status/1900085131467194708](https://x.com/imxiaohu/status/1900085131467194708)4⃣️?️Gemini 2.0 Flash图像生成功能正式上线!聊天即可PS图片、局部编辑不破坏整体支持文本渲染,轻松做广告海报说一句“50% OFF+商品图”,高质量海报立马生成?[https://www.xiaohu.ai/c/xiaohu-ai/gemini-2-0-flash](https://www.xiaohu.ai/c/xiaohu-ai/gemini-2-0-flash)?[https://x.com/imxiaohu/status/1899996898259554379](https://x.com/imxiaohu/status/1899996898259554379)5⃣️?Google DeepMind发布新一代通用机器人AI:Gemini Robotics

Genspark Super Agent,比Manus快速更可靠的通用智能体

作为世界上首个Mixture-of-Agents系统,该平台集AI聊天机器人、AI Image Studio、AI深度研究、AI事实核查等多种功能于一体,能够自动完成复杂任务,为用户提供全方位的智能辅助。最新的Genspark Super Agent是一款多合一的Super Agent,自动使用各种工具为您的日常任务提供服务。为什么快速且可靠?他是一个快速且可靠的通用AI智能体快:近乎即时的结果(可与常规搜索/聊天相媲美)可靠:执行过程中的错误和幻觉显着减少导向:让您掌控一切,让您能够指导和优化输出,直到它们完全符合您的要求。从图中可以看到,Genspark Super Agent在GAIA基准测试中的表现:Level 1:Genspark的得分为87.8%,比manus.ai的86.5%和OpenAI Deep Research的74.3%都要高,同时也超过了之前的SOTA(State of the Art,即最佳水平)67.9%。Level 2:Genspark的得分为72.7%,同样领先于manus.ai的70.1%和OpenAI Deep Research的69.1%,以及之前的SOTA 67.4%。Level 3:Genspark的得分为58.8%,高于manus.ai的57.7%和OpenAI Deep Research的47.6%,也超过了之前的SOTA 42.3%。Genspark在所有三个级别的测试中都取得了最高的得分,显示出其在多轮对话和复杂任务处理上的优势。表明Genspark在处理真实世界语言场景时,能够更准确地反映用户与AI助手进行互动对话的需求。为什么效果更好?世界上第一个Mixture-of-Agents系统,利用最佳模型、工具和数据集来执行不同的任务比如基础智能体:对话、图片、视频生成以及翻译。

Others are asking
OpenManus
以下是关于 OpenManus 的相关信息: 比赛说明: 赛道一 OpenManus 效果 规则:自由修改代码,复现 Manus 原版某一方面的效果,可参考 12 个精选 Case。可以选择优化某类任务下执行的效果、优化前端页面或复刻宣传效果等,方向不限。 规模:队伍规模在 1 3 人之间。 评判:由组委会评委与大众人气投票热度评分,比例 8:2。 奖项:一、二、三等奖。 赛道二 OpenManus 创意 规则:自由修改代码,通过任何手段或工具,使用 OpenManus 得到有趣效果,完成有趣任务。 规模:队伍规模在 1 3 人之间。 评选规则:由组委会评委与大众人气投票热度评分,比例 2:8。 奖项:一、二等奖。 时间表: 线上启动:2025 年 3 月 21 日,线上启动会。 报名时间:3 月 20 日 3 月 28 日。 比赛阶段:3 月 21 日 4 月 3 日。 提交截止:4 月 3 日 23:59。 人气评审阶段:4 月 4 日 4 月 8 日 23:59,作品线上展示,大众投票。 结果公布&颁奖:4 月 10 日。 趋势研究: Manus 注重实用性和用户体验,目前虽为内测阶段但已计划开源部分模型以构建生态影响力。受其启发,开源社区涌现了如 OpenManus、OWL 等快速复刻的项目。多智能体的协作机制成为业界热点,通过让不同专长的 Agent 各司其职、相互通信,一个 AI 系统可以具备更大的灵活性和扩展性。例如,复杂业务流程中的不同环节可由不同 Agent 完成,再由调度 Agent 统筹协调。这种架构在一定程度上模拟了人类团队协作的问题求解方式,被认为是迈向更通用智能的重要路径。Anthropic 也在其 Agent 研发中引入类似理念,区分“Workflow”(固定流程)和“Agent”(自主决策流程)的概念,指出当任务复杂度和不确定性较高时,应让 LLM 自行规划调用工具,而非预设流水线。总之,多 Agent 系统通过模块化分工+自主协调,提升了大型任务的可管理性和成功率,已成为 2025 年 Agent 系统设计的主流思路之一。 开发进展: 距离 OpenManus 开源第一天已过去 12 天,收获了大量关注和 37k stars。在此期间不断完善和优化,包括修复已知 bug、兼容不同 LLM 调用方式、优化基础 Manus 的各类工具等,现已迭代完成基础稳定版的开发,并举办了 OpenManus Hackathon 比赛,邀请充满好奇心的小伙伴参加,展示创造力和想象力。
2025-04-11
genspark怎么样?和cursor、manus等相比如何?
Genspark 是一款功能强大的通用智能体,具有以下特点和优势: 1. 功能集成:集 AI 聊天、图片工作室、视频生成、深度研究等多种功能于一体。 2. 任务处理能力:能够自动完成复杂任务,如自主规划、深入研究、预定外部服务、进行数据搜索和事实核查等。 3. 工具和数据集:世界上首个 MixtureofAgents 系统,利用最佳模型、工具和数据集来执行不同任务。 4. 性能表现:在 GAIA 基准测试的三个级别(Level 1、Level 2、Level 3)中得分均最高,显示出在多轮对话和复杂任务处理上的优势,能更准确地反映用户与 AI 助手互动对话的需求。 5. 速度和可靠性:近乎即时的结果,执行过程中的错误和幻觉显著减少,让用户能够掌控和优化输出。 与 Manus 相比,Genspark 更加快速和可靠,表现更为成熟与稳定。 您可以通过 https://www.genspark.ai/ 直接使用,不过注意第一个问题可以稍微思考下再提问,因为可能提一个问题之后就要收费啦。其两位创始人是明星创业者,联合创始人景鲲之前是小度科技的 CEO,联合创始人兼 CTO 朱凯华则是小度科技的 CTO。相关媒体报道可参考: 1. 特工宇宙:超越 Manus?华人创业产品 Genspark 推出通用 Agent(附实测效果) https://mp.weixin.qq.com/s/S2NCd3ySZyaRtjwC6BSG6Q 2. MAX:用过最新的 Genspark 后,我已经准备去摆摊了。 https://mp.weixin.qq.com/s/mK1Y7kmIqW56FkrJd64Vtw
2025-04-09
如何综合运用插件、工作流、知识库,搭建满足各种需求的智能体,尤其是调用多个智能体,组成像Manus这样的工具?
要综合运用插件、工作流、知识库搭建满足各种需求的智能体,尤其是调用多个智能体组成类似 Manus 的工具,需要了解以下内容: 插件:插件如同一个工具箱,里面可放置一个或多个工具,称为 API。扣子平台有多种类型的插件,如看新闻、规划旅行、提高办公效率、理解图片内容的 API 及能处理多种任务的模型。若平台现有插件不符合需求,还可自行制作添加所需 API。 工作流:工作流类似可视化拼图游戏,可将插件、大语言模型、代码块等功能组合,创建复杂稳定的业务流程。工作流由多个节点组成,开始和结束节点有特殊作用,不同节点可能需要不同信息,包括引用前面节点信息或自行设定信息。 知识库:可上传私有文件作为回答参考。 智能体:智能体是对自定义操作的封装,用于解决特定场景问题。以 ChatGPT 的 GPTs 为例,包括描述作用和回复格式的提示词、作为回答参考的知识库、请求第三方 API 获取实时数据的外挂 API 以及个性化配置等。 例如,在“竖起耳朵听”的智能体中添加了插件和工作流的相关设置。创建智能体时,输入人设等信息,并配置工作流。但需注意,如工作流中使用的插件 api_token 为个人 token 时,不能直接发布,可将其作为工作流开始的输入,由用户购买后输入使用再发布。 此外,在 AI 搜索中,可预置 after_answer 钩子,将请求大模型的上下文和回答发给第三方插件整理成文章或思维导图等格式同步到第三方笔记软件。全流程中有很多节点可做 Hook 埋点,多个插件构成可插拔架构,常用功能可抽离成标准插件用于主流程或辅助流程,还可自定义智能体 Agent 等。
2025-03-29
ManusAI核心技术解读
Manus AI 的核心技术包括以下几个方面: 1. 代理功能:能够自动完成任务并交付完整结果。最终交付的结果形式多样,如文档、交互网页、播客、视频、图表等,使用户能更直观地获取信息。 2. 充分利用 AI 能力:不仅进行推理和任务规划,还结合代码能力生成最终结果。 3. 云端自动运行:AI 在云端电脑上完成包括数据收集、内容撰写、代码生成等任务。其体验特点是任务运行时间较长,但最终交付的结果超出预期。 您可以通过以下链接获取更多详细信息: 体验报告:
2025-03-22
对manus启发最大的论文
以下是对 Manus 启发较大的两篇论文: 1. 《MCP 协议详解:复刻 Manus 全靠它,为什么说 MCP 是 Agent 进化的一大步?》(https://waytoagi.feishu.cn/wiki/RwIBwXlkUiSHKzk3p9UciZ8vnOf?useEs6=0&from=wiki):该论文聚焦于智能体技术的最新风口,深入剖析了 MCP 协议如何重构 AI 与工具、数据交互的方式,使 AI 真正“动起来”。通过一次搭建、无限扩展的设计理念,极大简化了 AI 助手与外部系统的对接流程,为 AI 生态搭建出高效、安全、灵活的通用接口。 2. 《屏蔽噪音,Manus 给我的 3 个启发》(https://mp.weixin.qq.com/s/s_ccBArUBKepgRNkewhx7Q):本文探讨了 AI 产品 Manus 给产品经理的三大启发,包括展示过程、允许干预,确保用户理解 AI 的操作与结果;信任机器,减少人为干预,让 AI 自行探索与生成任务;关注用户体验,特别是付费用户对效果的期待。
2025-03-21
简述manus的原理
Manus 是一款由中国团队研发的全球首款通用型 AI 代理工具,于 2025 年 3 月 5 日正式发布。 其原理包括以下方面: 1. 技术架构: 基于多智能体(Multiple Agent)架构,运行在独立的虚拟机中。 核心功能由多个独立模型共同完成,分别专注于不同的任务或领域,如自然语言处理、数据分析、推理等。 关键组件包括虚拟机、计算资源、生成物、内置多个 agents 等。 采用“少结构,多智能体”的设计哲学,在数据质量高、模型强大、架构灵活的情况下,自然涌现 AI 的能力。 2. 工作流程: 意图识别:从用户输入中提取关键词和任务类型,引导用户补充信息以明确需求。 任务初始化:创建任务文件夹并启动隔离环境(Docker 容器),为任务执行提供独立的运行空间。 步骤规划:利用推理模型将任务拆解为具体步骤,将步骤信息写入 todo.md 文件进行跟踪。 任务执行:通过 function call 调度专用智能体执行具体任务,各智能体将执行结果写入任务文件夹,主线程负责更新任务状态并调度下一步骤。 归纳整理:汇总所有执行结果并针对用户需求整理输出,提供任务产物(文档/代码/图片等)供用户浏览或下载,收集用户反馈。 3. 专用智能体设计: Search Agent:调用搜索 API 获取结果列表,使用无头浏览器模拟网页浏览行为,结合多模态模型提取有效信息,通过点击和滚动操作获取更多内容。 Code/DataAnalysis Agent:根据需求创建并执行代码,保存执行结果,提供预览功能。 Manus 还存在一些改进空间,如使用 DAG 替代线性任务依赖关系、引入自动化测试智能体进行质量控制、实现用户介入与自动执行的混合模式。在技术评估方面,工程实现完善,交互体验优于同类产品,但技术壁垒不高,主要依赖模型能力,Token 消耗较高,成本问题需要解决,任务准确性和用户满意度有待更多案例验证。 当前的 Manus 约等于 AI 操纵着一个没有图形界面的 Linux 虚拟机和浏览器,能感知电脑环境,执行各类操作,如跑各种 linux 下的指令、库、程序(cd、ls 指令、python 等),访问各种网页、获取一些 API 接口的数据,但因无图形界面,无法运行图形程序。访问网页时,阻挠人类使用的各种要素也会打扰到 Manus。Manus 提供了用户可视的命令行视窗、浏览器、vscode 两种选项,方便查看运行指令、接管网页和修改文件。用户还可给 Manus 上传文件,未来也可能对接私有 API。
2025-03-19
人工智能软件现在有哪些
以下是一些常见的人工智能软件: 1. 在自然语言处理和神经科学应用方面,大型语言模型取得了进展,拥有更先进的工具用于解码大脑状态和分析复杂脑部活动。 2. 在艺术创作领域,有涉及知识产权保护的相关软件,如软件工程师在设计时应确保生成内容合法合规、注重用户知识产权保护等。创作者使用此类软件时,应了解自身权利并做好保护。 3. 在线 TTS 工具方面,如 Eleven Labs(https://elevenlabs.io/)、Speechify(https://speechify.com/)、Azure AI Speech Studio(https://speech.microsoft.com/portal)、Voicemaker(https://voicemaker.in/)等。这些工具可将文本转换为语音,具有不同的特点和适用场景。但请注意,相关内容由 AI 大模型生成,请仔细甄别。
2025-04-15
AI办公相关的课程、软件教学
以下是为您提供的 AI 办公相关的课程和软件教学资源: 1. 90 分钟从 0 开始打造您的第一个 Coze 应用: 课程包含从零开始的应用界面教学,涉及过年相关应用。 介绍了当前承接的业务,包括辅导、培训、定制及企业 AI 落地等。 提到 11 月底应用推出背后的情况,包括社区对 AI 应用的呼声和功能需求挖掘。 2. AI 视频的软件教程: 涵盖了众多工具,如剪映、Dreamina、Pika、StableVideo、Pixverse、morphstudio、Runway Gen3、Adobe Firefly 以及清影等。 3. 张翼然:用 AI 为教师减负(3H).pdf: 包括教师的 AI 减负指南,生成式人工智能在教学中的应用。 介绍了教师使用 AI 的小技巧,如提示词设计公式之——RTFC。 涉及使用 AI 生成图片的方法与注意事项,AI 自动生成 PPT 功能。 展示了通过小程序实现文字与声音、视频的转化,自定义数字人形象进行教学。 展示了便捷的课堂教学工具与 Ai 课件制作,探讨了 A 生成视频与手工制作视频的教学效果差异。 强调了教育资源与版权问题,教师能力重塑,极简思维的教育应用,生成式 AI 教学策略。 包括 AI 技术助力教育管理和辅助教学实践,如班级与学校管理中的行政职日流程简化、听课记录自动化等。
2025-04-12
grok API能用在什么软件上
Grok API 可以用在以下软件上: 1. 扣子工作流:可以用代码模块进行 HTTP 访问,实现 0 token 脱离扣子模型来使用 Groq 作为 LLM,还能参考相关教程将扣子接入微信机器人,但有微信封号风险。 2. 沉浸式翻译:由于 Groq 的 API 与 OpenAI 的 API 几乎兼容,可以适配到任何 APP 产品可以用来填 APIKEY 调用的场景,比如沉浸式翻译这个网页翻译工具。 3. 手机类 APP:比如通过快捷方式接入 Siri。 此外,xAI 发布的 Grok 3 API 提供了多个模型版本,如 grok3beta、mini、fast 等,满足不同场景需求,上下文窗口达 131K,支持图像输入输出,但当前不支持联网或实时访问外部网页与数据。
2025-04-12
人脸识别软件
以下是为您整合的关于人脸识别软件的相关信息: 在“【已结束】AI 创客松 参与同学自我介绍和分类”中,Dylan 擅长人脸识别算法和动作捕捉产品。 在“SmartBotX 模块化桌面机器人——说明文档”中,桌面客户端提供面部识别或跟踪功能的展示,可能用于安全监控、用户识别或交互式体验。 在“14、LayerStyle 副本”中,使用 YoloV8 模型可以检测人脸、手部 box 区域或者人物分割,支持输出所选择数量的通道。同时,Mediapipe 模型可以检测人脸五官,分割左右眉、眼睛、嘴唇和牙齿。
2025-04-12
文章配图的智能体或者软件
以下是为您整理的关于文章配图的智能体或软件的相关内容: 在《智变时代/全面理解机器智能与生成式 AI 加速的新工业革命》中提到,智能时代,智能应用会从有形界面消失,变成无所不在的助理或智能体,辅助甚至直接完成任务。文中还配有图 2.10:智能代理将改变企业组织架构。 在《XAIR:AI 智能体平台对决:腾讯元器与字节扣子的创新之路》中,个人实操案例部分提到为本篇文章配图的相关情况,但生成结果显示问题描述不够清楚。之后换提示词“那你给我生成搞笑图片吧,让人一看就有继续看下去的动力那种,需要一张公众号封面和一张配图”,得到了相应结果。同样的提示词,元器某应用也有生成。此外,文中还提到在搭建 bot 过程中存在工作流未成功触发导致访谈记录未成功存储入库的问题。
2025-04-11
应用到律师软件的AI能力
以下是应用到律师软件的 AI 能力相关内容: 律师在工作中的优势包括: 1. 在沟通和谈判中能够与客户方、相对方、其他机构建立信任、表达观点、促成交易等。 2. 能够针对新兴行业或监管空白提出合规建议,如为新技术制定合法性指导。 3. 作为专业人士,在紧急情况下能做出专业判断,提供及时的法律建议和解决方案。 律师不擅长的方面有: 1. 处理大量信息和数据,在需要处理大量文本和数据的情况下,人工效率非常有限,如大量文件调查中的数据提取和整理。 2. 处理细节,可能难以记住各类案件中的所有事实和细节,尤其是在复杂案件中。 3. 精力与情绪,在处理复杂案件时,可能会面临情绪、精力、时间等带来的压力,从而影响专业判断。 基于以上,律师和 AI 的协同并非简单相加,而是一种借助互相优势、相互加持的关系。律师在运用大模型这一强大工具时,最关键的任务是根据不同的法律业务场景,精准地提出问题、指令(Prompt),以引导 AI 发挥其最大的效用。 在处理信息检索与整理任务时,律师可以指导 AI 精确抓取相关法律法规、先例判决等关键信息,能够迅速获得案件准备所需的素材,花更多的时间进行法律分析。当需要自动化处理文档时,律师可以指导 AI 生成和修改标准化合同。 在法律领域,生成式 AI 具有文本总结方面的能力。通过使用大模型,律师可以快速总结法律研究报告、实务文章、法学论文以及法律法规,帮助他们更高效地获取核心内容和深度见解。 对于如何认识 AI,作为不具备理工科背景的文科生,可以把 AI 当成一个黑箱,只需要知道它是某种模仿人类思维可以理解自然语言并输出自然语言的东西。驱动 AI 工具和传统道教的驱神役鬼拘灵遣将有奇妙的相似之处,都是通过特定的文字、仪轨程式来引用已有资源,驱使某种可以一定方式/程度理解人类文字的异类达成自己预设的效果,且皆需要面对工具可能突破界限(发疯)的情况。当想让 AI 实现愿望时,基于它的“非人”一面,需要尽可能通过语言文字(足够清晰的指令)压缩它的自由度,不仅要清晰告诉它需要干什么、边界在哪里、目标是什么、实现路径方法是哪一条,最好还直接给到它所需的正确的知识。
2025-04-10
和ima.copilot功能差不多的产品
以下是一些和 ima.copilot 功能差不多的产品: 飞桨 PaddlePaddle:代码助手,网址为 paddlepaddle.org.cn。 百度橙篇:写作软件,网址为 cp.baidu.com。 BigModel:开发工具,网址为 open.bigmodel.cn。 万兴 PDF:研究工具,网址为 pdf.wondershare.cn。 百川智能:聊天机器人,网址为 baichuanai.com。 360 智脑:聊天机器人,网址为 ai.360.com。 GitMind 思乎:思维导图,网址为 gitmind.cn。 阿里通义听悟:效率工具,网址为 tingwu.aliyun.com。
2025-03-06
目前哪些免费AI可以和Claude 2差不多
目前与 Claude 2 性能相近的免费 AI 有 Bing。GPT4 是功能最强的人工智能写作工具,但未付费只能使用 3.5 版本。微软的 Bing 使用 4 和 3.5 的混合,功能强大且能连接到互联网。谷歌的 Bard 表现令人失望,Anthropic 发布的 Claude 2 值得注意的是有非常大的上下文窗口,在处理文档和数据方面表现出色,特别是处理 PDF 文本。但需要注意的是,这些系统仍会产生幻觉,若要确保准确性,需检查其结果。
2025-01-16
有和mj差不多的网站吗
以下是一些和 Midjourney 类似的网站: 1. Stable Diffusion:是一种可根据文本生成图像的人工智能程序。 2. DALL·E2:能够根据输入的描述生成逼真的图像。 Midjourney 是一个由同名研究实验室开发的人工智能程序,可根据文本生成图像,于 2022 年 7 月 12 日进入公开测试阶段,用户可透过 Discord 的机器人指令进行操作创作图像作品。通过 Discord 的社区属性,它具有更轻量的产品形态、更简单的生图方式,且图片质量很高。MJ 具备更简单的交互,更直观的生成、放大、保留、分享功能,如果愿意购买更高级的服务,甚至可以享受更快速、更强大的增值服务。 Midjourney 官网现已向生成 100 张以上图片的用户开放了使用权限,登录 MJ 官网,左侧为各种页面入口,顶部是生成入口(prompt 框)和搜索框。在社区作品、创作(Create)以及组织(Organize)页面中,可随时使用 prompt 框和搜索框,方便查找参考和进行创作,无需频繁切换页面。还可以通过点击 prompt 框最右侧的图标来设置常用参数的默认值,包括画面比例和个性化模型开关。在官网上使用图片参考也变得简单直观,只需要点击 prompt 框最左侧的图片按钮,或直接拖入图片即可,并且官网会记录所有使用过的图片,方便调用或删除。当鼠标悬停在图片上时,会看到 3 个小图标,从左到右分别是角色参考、风格参考、整图参考,点击相应的图标即可,如需多种参考逻辑可按住 shift 键点选多个图标。创作页面最大亮点是 prompt 的复用,可以直接点击画面描述或复制描述词到 prompt 框中,也可以直接点击下方横列菜单里的按钮,将包括参考图在内的完整 prompt 替换当前的 prompt。点击图片则会进入单图调整模式,在 discord 中常用的操作指令都被集中在了右下角的按键中,并且上线了全新的 Editor 编辑器功能。 另外,MJ 官网更新了,刷图超过 1000 张的就可以用 alpha 版本了。可以不用在 discord 服务器生图了,官网操作更方便,很多参数直接可以控制。前几天还是需要 10000 张才可以,门槛降低了,过两天估计可以全量开放了。在官网上可以看各种排行榜和厉害的作品,右键也新增了很多功能,不错的作品也容易被发现,还有提示词可以直接复制。
2024-11-14