Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

core案例拆解教程

Answer

以下为为您提供的几个案例拆解教程:

Coze 应用实战指南 - 吐槽心灵鸡汤

  • 核心功能说明:一个允许用户输入心灵鸡汤类内容,AI 生成对应的反心灵鸡汤,并展示在前端页面的应用。
  • 核心操作流程拆解:
    1. 用户在页面输入指定文本。
    2. 用户在页面点击【开喝】按钮。
    3. Coze 后台调用工作流生成对应内容。
    4. 工作流生成的内容展示在前端界面内。
  • 核心前端设计拆解:
    1. 用户界面提供一个元素 A(Coze 中称作组件),让用户输入内容。
    2. 用户界面提供一个按钮 A,让用户点击后调用工作流。
    3. 用户界面提供一个元素 B,向用户展示工作流的结果。
  • 核心业务逻辑拆解:
    1. 读取元素 A 的用户输入。
    2. 将用户输入传递给 AI 大模型。
    3. AI 大模型按照提示词设定生成指定内容。
    4. 在元素 B 展示 AI 大模型生成的内容。基于上述业务逻辑,只需要设计一个简单的工作流即可,该工作流由【开始】节点(用户输入)、【大模型】节点(AI 生成内容)、【结束】节点构成(内容输出)。

Pika 新功能“Pikadditions” - 厕所开门见猴

  • 原视频:人物推开厕所门→空马桶镜头。
  • 角色图片:一张猴子坐在马桶上的图片。
  • 提示词:“When the door opens in the video,we see a monkey with reading glasses sitting in the toilet reading a book.”
  • 拆解逻辑:
    1. 时间触发:When the door opens→绑定视频动态事件(门开合过程)。
    2. 空间绑定:sitting in the toilet→将猴子坐标锁定在马桶实体上。
    3. 行为设计:reading a book→赋予角色符合场景逻辑的行为(厕所常见活动)。
    4. 细节强化:with reading glasses→用视觉符号增强角色合理性(模仿人类行为)。

首尾帧循环视频制作 - 宇航员案例

  1. MJ 生成宇航员近照。
  2. 截取头盔中反射的宇航员作为第 3 步垫图和 sref 使用。
  3. 生成与头盔中宇航员接近的半身像。
  4. 打开即梦,选择使用尾帧。重点:一般情况可以不选择运镜控制,但这张图需要选择变焦推进,控制镜头推进到头盔里,不然 AI 会自己选择更容易实现的后拉运镜。
  5. 得到。
  6. 同样的做法得到尾帧回到首帧的视频,再用剪映拼接一下两段视频即可得到在他人与自己中无限轮回(有时候起始或结束有停顿,保证整条视频衔接流畅可以掐掉)。
Content generated by AI large model, please carefully verify (powered by aily)

References

健健: Coze应用实战指南 -- 吐槽心灵鸡汤

[coze应用案例视频.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/N0mmbMJ28oUzIPxZriMcddRrnHb?allow_redirect=1)案例核心功能说明一个吐槽心灵鸡汤的应用,允许用户输入心灵鸡汤类内容,ai生成对应的反心灵鸡汤,并展示在前端页面。案例应用体验地址https://www.coze.cn/s/iDGHwn8t/[heading2]核心操作流程拆解[content]1、用户在页面输入指定文本2、用户在页面点击【开喝】按钮3、Coze后台调用工作流生成对应内容4、工作流生成的内容展示在前端界面内[heading2]核心前端设计拆解[content]1、用户界面提供一个元素A(Coze中称作组件),让用户输入内容2、用户界面提供一个按钮A,让用户点击后调用工作流3、用户界面提供一个元素B,向用户展示工作流的结果上述三个元素(组件)是实现用户交互和结果展现的核心[heading2]核心业务逻辑拆解[content]1、读取元素A的用户输入2、将用户输入传递给ai大模型3、ai大模型按照提示词设定生成指定内容4、在元素B展示ai大模型生成的内容基于上述业务逻辑,只需要设计一个简单的工作流即可。该工作流由【开始】节点(用户输入)、【大模型】节点(ai生成内容)、【结束】节点构成(内容输出)。

🌟 Pika来整活了,新功能「Pikadditions」一键让虚拟主角「活」进你的视频!

接下来我把文章开头官方提供的案例模版拆解下,可以帮助你更好的理解如何用提示词实现「角色融入场景」效果原视频:人物推开厕所门→空马桶镜头角色图片:一张猴子坐在马桶上的图片提示词:“When the door opens in the video,we see a monkey with reading glasses sitting in the toilet reading a book.”🔍拆解逻辑:|要素|解析||-|-||时间触发|When the door opens→绑定视频动态事件(门开合过程)||空间绑定|sitting in the toilet→将猴子坐标锁定在马桶实体上||行为设计|reading a book→赋予角色符合场景逻辑的行为(厕所常见活动)||细节强化|with reading glasses→用视觉符号增强角色合理性(模仿人类行为)|🚀现在就动手!快速开启你的第一个Pikadditions作品吧!

首尾帧循环视频制作

1、MJ生成宇航员近照2、截取头盔中反射的宇航员作为第3步垫图和sref使用3、生成与头盔中宇航员接近的半身像4、打开即梦,选择使用尾帧重点!:一般情况可以不选择运镜控制,但这张图需要选择变焦推进,控制镜头推进到头盔里,不然AI会自己选择更容易实现的后拉运镜5、得到[imageinput_镜头推近到头盔里反射的宇航员_2024-07-11 22_27_28(1).mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/YG93bjVzVoYNgUxjS1Vc9rofnKe?allow_redirect=1)6、同样的做法得到尾帧回到首帧的视频,再用剪映拼接一下两段视频即可得到在他人与自己中无限轮回(有时候起始或结束有停顿,保证整条视频衔接流畅可以掐掉)[宇航员啊.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/Wn1WbriYgoUFffxGuNMcXtIzndh?allow_redirect=1)本期活动参赛作品:[挑战报名表](https://waytoagi.feishu.cn/wiki/PNQrwruv7iOMgykstRNcaE88nKf)

Others are asking
RuntimeError: Couldn't clone Stable Diffusion. Command: "git" clone --config core.filemode=false "https://github.com/Stability-AI/stablediffusion.git" "/Users/lichenhui/stable-diffusion-webui/repositories/stable-diffusion-stability-ai" Error code: 12
以下是关于您遇到的“RuntimeError: Couldn't clone Stable Diffusion”错误的分析和解决建议: 这个错误通常表示在克隆 Stable Diffusion 时出现问题。可能的原因包括: 1. 库的某些文件或依赖项已更改或已移除,导致无法找到所需的提交。 2. Git 存储库的状态不正确。 3. 网络连接存在问题。 解决方法如下: 1. 尝试清除本地库并重新克隆 Stable Diffusion,然后再次运行代码。 2. 运行以下命令来检查网络连接:ping files.pythonhosted.org
2025-02-12
f1 score的定义
F1 值是一种综合考虑准确率和召回率的平衡指标。准确率是指正确预测的样本数占总样本数的比例;召回率是指真正例被正确预测出来的比例。F1 值通过结合准确率和召回率来更全面地评估模型的性能。
2024-12-27
【深度拆解】ChatGPT-4o背后的技术革新:从语言模型到多模态跨越
ChatGPT4o 背后的技术革新具有重要意义。人类的感知多样,仅靠语言描述世界远远不够,多模态理解非常有用,能更全面学习世界、理解人类需求等。2023 年 9 月 GPT4v 发布,将大语言模型竞赛带入多模态模型时代,如 ChatGPT 能看图说话、画图,Google 的 Gemini 支持多种模态,但 OpenAI 常抢先发布。今年 5 月 OpenAI 发布 GPT4o,向智能体方向迈进,其是之前技术的集大成者,通过端到端神经网络混合训练视觉、语音和文本数据,平均音频输入反应时间为 300 毫秒,能感悟人类表达的情绪等。OpenAI 未公开 GPT4o 技术细节,唯一线索来自内部炼丹师的博客 AudioLM。此外,GPT4 是 OpenAI 的多模态工具,在编程任务中表现出色,ChatGPT 是用户友好界面,可与高级语言模型交互。2024 年 5 月 14 日 OpenAI 发布 GPT4o,效率高、价格降低、延迟缩短。9 月 16 日 OpenAI 推出 o1 系列模型,在复杂任务中表现优异,o1mini 适合编码任务,两个模型已在 ChatGPT 中提供,有免费或收费版本。
2025-03-09
02-21 | 哪吒爆款AI视频制作拆解
以下是对哪吒爆款 AI 视频制作拆解的相关内容: 视频创作流程: 包括脚本制作、图片生成、视频生成和视频剪辑,使用的工具分别为豆包、利不利不、可灵和海螺、剪映。 爆火原因分析: 1. 爆款 IP 带来热度和流量,如哪吒。 2. 反差作用,如神话人物与现代生活的反差,好玩有趣吸引停留。 3. 共鸣作用,如职业选择大众化、接地气且贴合角色形象性格并有槽点,引发讨论和分享。 主要角色职业设定: 根据哪吒、敖丙、敖光、敖润、申公豹、太乙真人、吴亮先尊等角色的性格和形象特点,为其设定了快递小哥、咖啡店员、水产店老板等贴合又有槽点的职业。 视频传播情况: 新华社官媒编辑索要并传播了有趣且火的哪吒相关视频。 相关案例特点: 列举了宠物走秀、打工猫等案例,指出其具有反差、萌系、贴近生活等特点。 短视频创作要点: 形式在短视频中可稍大于内容,如开花、冰冻、毛茸茸等风格,但要成热门爆款需内容大于形式,具备反差、共鸣等,且热门爆款有难度,小爆款也不错。 哪吒主题 VB 先导片制作: 周四定方案,周六、周天制作,周天晚上上线。未看片子不耽误制作,用可灵多图参考生成角色、道具等,用集梦生成场景等,还可用可灵 AI 换装设定角色服装。 利用多图生成 AI 视频的创作实践: 1. 哪吒角色创作:通过提供多张零碎照片,参考牙齿等细节,设定现代版哪吒形象,考虑其走位和行为进行场面调度。 2. 成年哪吒合成:将哪吒的头颅与他人身子结合,先给手部特写再揭示人物,提示词思路技巧需统一。 3. 申公豹角色处理:与哪吒类似的处理方式,先交代环境,再展现人物动作。 4. 其他角色创作:包括敖丙、大厨、美丽姑娘、土拨鼠、石姬娘娘等角色,根据不同需求设定形象和动作。 工具特点对比: 可灵能满足需求但生成时间长,微度 AI 生成速度快但结果有区别。 会议主题:0221|哪吒爆款 AI 视频制作拆解 会议时间:2 月 21 号(周五)19:58 22:21(GMT+08) 主讲老师:@小龙问路、@子豪插画
2025-03-07
拆解agent
AI Agent 的拆解是指如果单次请求不能很好地遵循并完成所有事情,就将其拆分为一步一步的子任务。比如用户表达目标后,让大模型根据目标拆分出逐步的子任务,再通过工程方式循环请求子任务(可能会插入新任务),直至所有子任务完成。例如去年的 AutoGPT 就是这种方式(Planning and excute),但它只是学术界的探索,难以落地,除了一些 demo 产品,只在实在智能的 RPA 上见过。难以落地的原因有很多,如计划赶不上变化,提前规划的任务难以保证正确执行;大模型并非全知全能,规划的任务不一定正确;工程化执行时,循环的进入和退出时机也是问题。后来大家都在解决这些问题,思路和解法不同,比如 OpenAI 搞 Tools,FastGPT 搞可视化的 workflow 编排,大家逐渐意识到 workflow 是短期最优解,于是纷纷开始做。 判断自己的任务/Prompt 是否需要拆解为工作流,构建稳定可用的 AI Agent 是不断调试和迭代的过程,通常从性能最强的 LLM 着手,先用单条 Prompt 或 Prompt Chain 测试任务执行质量和稳定性,再根据实际情况和最终使用的 LLM 逐步拆解子任务。一般对于场景多样、结构复杂、输出格式要求严格的内容,基本可预见需要拆解为工作流。此外,鉴于 LLM 只能处理文本输入输出,涉及多媒体内容生成或从网络自主获取额外信息等能力时,必然需要通过工作流调用相应插件。只用一段 Prompt 的 Agent 也算 AI Agent。
2025-01-05
有没有能分析拆解腾讯视频的AI工具?
目前有使用 Gemini 1.5 Pro 来分析和拆解腾讯视频的工具。以下是一些相关信息: 大家可以放自己的案例,本文档可编辑。 郑跃葵:拿个库布里克的电影来分析,连大师手法都学会了。 大峰 AI 绘画:太酷啦又多了一个 AI 视频创作助手。 Jones:b 站大学复习有救了。 对!:拉片太方便了。 Shock:而且可以干掉人工标注了,安徽那边数据标注众包要失业了。 清慎:1. 影视二创长剪短,一键生成小帅、小美、大壮、丧彪的故事;2. 警察叔叔查监控,一句话找出监控中的可疑现象;3. 替代 Opus 等长剪短工具。 测试者阿强:好用,准确度很高,把前几天用 AI 做的功夫熊猫之离谱村版丢进去分析,效果很好。拆解作品。 测试者张余和 Ling、洋洋也有拆解结果,Gemini 1.5 Pro 给出了全文。 您可以尝试使用 Gemini 1.5 Pro 来满足您对腾讯视频的分析拆解需求。
2024-12-11
将活动主题拆解为大量结构化提示词,用于文生视频
以下是将活动主题拆解为大量结构化提示词用于文生视频的相关内容: 技巧 1:提示词的结构 当提示词有清晰的结构时,提示效果最有效。可使用简单公式:。 例如:无结构提示词“小男孩喝咖啡”,有结构的提示词“摄影机平移(镜头移动),一个小男孩坐在公园的长椅上(主体描述),手里拿着一杯热气腾腾的咖啡(主体动作)。他穿着一件蓝色的衬衫,看起来很愉快(主体细节描述),背景是绿树成荫的公园,阳光透过树叶洒在男孩身上(所处环境描述)”。 技巧 2:提示词的优化 有三个原则: 1. 强调关键信息:在提示的不同部分重复或强化关键词有助于提高输出的一致性。 2. 聚焦出现内容:尽量让提示集中在场景中应该出现的内容上。 3. 规避负面效果:在提示词中写明不需要的效果。 写提示词时,首先要明确场景中的人物和冲突,其次是对场景进行详细描述,包括地点、人物形象、任务动作等细节,使用生动的动词营造动态和戏剧化氛围,第三要加强镜头语言,如推、拉、摇、移、升、降等,每种镜头运动都有其特定作用和效果。 PixelDance V1.4 提示词指南 图生视频的基础提示词结构为:主体+运动。当主体有突出特征时可加上,需基于输入图片内容写,明确写出主体及想做的动作或运镜,提示词不要与图片内容/基础参数存在事实矛盾。
2024-12-09
拆解 通往AGI之路 知识付费运营体系
通往 AGI 之路的知识付费运营体系可以从以下几个方面来拆解: 1. 课程特点: 【野菩萨的 AIGC 资深课】由工信部下属单位【人民邮电出版社】开设,是全网技术更新最快的课程之一。 课程内容涵盖 AI 绘画、视听语言和 ChatGPT 等多个体系的知识,能满足不同阶段学习者的需求。 2. 付费与开源的比较: 开源社区资源丰富,适合自律的自主学习者。 知识付费课程提供系统结构、专业指导、针对性计划和互动反馈,是高效的学习途径。 3. 社区需求: 新同学加入时,对适合小白新手入门的课程有需求,相比啃知识库的图文,更愿意接受老师手把手的教学。 4. 个人经历:创建者在希望快速入门 AI 绘画时,投入金钱学习了许多付费的 AI 课程,并最终选择了野菩萨的课程。 通往 AGI 之路本身不仅是开源的 AI 知识库,还是连接 AI 学习者、实践者、创新者的社区,具有以下特点: 1. 共同建设:由一群热爱 AI 的专家和爱好者共同贡献并整合各种 AI 资源。 2. 丰富内容:提供一系列开箱即用的工具,文生图、文生视频、文生语音等详尽的教程。 3. 紧跟前沿:追踪 AI 领域最新的进展,时刻更新。 4. 活动多样:包括东京的 confii 生态大会、AI 文旅视频、娃卡奖、李普村共创故事、AI 春晚等社区共创项目,以及 AIPO 活动、共学活动等。 5. 扶持与奖励:在小红书发布活动内容带特定标签有流量扶持,设有最佳创业奖和最佳投资奖等。
2024-11-25
知识库接入deepseek教程
以下是关于知识库接入 DeepSeek 的相关教程链接: 此外,还有以下相关内容可能对您有帮助: 中包含大模型及知识库使用讲解与问题解答。 中有工作流创建、模型能力及相关问题探讨。 涉及通义千问相关应用及明天课程安排交流。
2025-03-12
Coze 智能体 教程 初学者 3个月内的内容
以下是为初学者提供的 Coze 智能体相关教程,预计在 3 个月内可以完成学习: 1. 页面布局: 常见的左右、上下布局及嵌套方法,包括如何设置容器实现左右布局、调整大小分割等,强调外层高度设置的重要性。 溢出处理方式及内边距影响,建议初学者用固定宽高布局。 换行布局及元素分布设置,用于图片排版。 证件照应用搭建过程及布局设置,如创建应用、清理页面,设置第一个 div 容器,证件照基础界面为上下布局,分标题、示例、操作展示三块,需拖三个容器,顶部高度大概 100。 2. 证件照应用的用户界面搭建与业务逻辑构建: 用户界面搭建,包括各部分尺寸、布局、组件设置,如文本、图片、表单等。 业务逻辑搭建,创建工作流,添加图片理解、图像生成、智能换脸等插件,设置参数、提示词,并告知文档地址在社区智能体 1.3 共学里。 3. 工作流与代码(重度用户): 对于轻度用户,不需要工作流;对于重度用户,可参考官方文档:https://www.coze.cn/docs/guides/welcome 。 工作流的优势,如解决速度慢和可能出错的问题。 介绍主工作流和 AI Project 工作流,以及中间用到的 python 代码和结合工作流修改的「人设与回复逻辑」。 4. 基础通识课: 在 cos 主页有新手教程文档,可据此构建智能体。 工作流偏向节点调用,可通过 prompt 构建提示词并优化。 能调用多种插件,可添加图像流、触发器和知识库,知识库可上传多种格式内容及在线链接以沉淀知识。 Nimbus 介绍智能交互相关内容,包括有趣的智能体、插件商城、扣子案例、模型社区并答疑。 AI 编程课前准备及相关工具、账号注册说明,如注册阿里云账号、安装无影、注册 GitHub 账号等。
2025-03-12
aigc 教程
以下为您提供一些 AIGC 教程相关的内容: 1. 2024 AIGC 营销视频生态创新大赛: 10 月 19 日:EM7,南柒() 10 月 23 日:从构思到可视化——AI 脚本与分镜创作(),嘉宾为娜乌斯嘉,是 AI 绘画知名 UP 主、全网粉丝 20w、国内首批 AIGC 应用研究先驱者、模型师、comfyUI 工程师、动画艺术和心理学双硕士。 11 月 01 日:AIGC 制作商业片进阶教程( 11 月 7 日:AIGC 电影化叙事实战教程,嘉宾为 Joey,是莫奈丽莎工作室主理人、上影全球 AI 电影马拉松大赛最佳叙事奖导演、可灵星芒 AIGC 短剧获奖导演、资深创意广告人。 总奖金池百万元,机会就在眼前,准备好您的创意来瓜分百万奖池。 2. AIGC 电影化叙事实战教程: 第三部分:AIGC 电影化的快速技巧 分镜头脚本制作 GPTs:以 2024 AIGC 营销视频生态创新大赛的冰工厂赛道为例。 生图及生视频提示词制作 GPTs 音乐提示词制作 GPTs:参考 prompt 为请帮我制作一首短剧结尾部分转折的纯音乐背景音乐,内容是孙悟空中了圈套,被带上闪电禁锢,落入陷阱,坠入悬崖失去踪迹,希望风格新颖,带有电影感,时长 30s。参考给到的 prompt:Experimental oriental electronica, Intense suspense, Background music, BPM65, Thunderous crashes, Rapid descending synths。调整歌曲快慢技巧:修改 BPM,值越高节奏越快。 3. 上海国际 AIGC 大赛第三名—《嘉定汇龙》复盘: 由咖菲猫咪和三思完成。三思是中国做 stable diffusion 艺术字的高手,具体教程可在 WaytoAGI 查看。核心是让 AI 根据提供的框架生成对应的艺术形态,根据地名特色产业,找寻或炼制 lora,有的用即梦的通用模型生成。 用一镜到底完成全片内容和思想的浓缩,通过空中俯拍嘉定的古老街景呈现历史厚重感,转向现代都市繁荣景象,以 AI 生成的未来场景结尾。 音乐选择为开头增色,从古风音乐到现代电子乐的转换与画面切换契合。 开场部分结合应用了 comfyui 转绘、steerablemotion、runway 文生视频、图生视频等多种 AI 技术,最后通过合成剪辑拼合。 多人在线工作流:十个人的小组,素未谋面却要完成高度协同工作。
2025-03-11
我想制作AI数字人,如何去寻找相关资料和教程
以下是寻找制作 AI 数字人相关资料和教程的途径: 1. 在线文档和公众号:可以查看。 2. B 站:在 B 站搜索相关视频教程。 3. 具体操作方法: 在剪映中,右侧窗口顶部打开“数字人”选项,选取免费且适合的数字人形象,如“婉婉青春”。选择数字人形象时,软件会播放其声音,可判断是否需要,点击右下角“添加数字人”将其添加到当前视频。剪映会根据提供的内容生成对应音视频并添加到轨道中,左下角会提示渲染完成时间,可点击预览查看效果。 为让视频更美观,可增加背景图片。删除先前导入的文本内容,点击左上角“媒体”菜单并“导入”按钮选择本地图片上传,将图片添加到视频轨道上,可通过拖拽轨道右侧竖线使其与视频对齐。 此外,还有一些开源的算法代码仓库可供参考: 1. ASR 语音识别: openai 的 whisper:https://github.com/openai/whisper wenet:https://github.com/wenete2e/wenet speech_recognition:https://github.com/Uberi/speech_recognition 2. AI Agent: 大模型包括 ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等。 Agent 部分可使用 LangChain 的模块去做自定义,包含了 Agent 实现的几个组件 3. TTS: 微软的 edgetts:https://github.com/rany2/edgetts,只能使用里面预设的人物声音,目前接口免费。 VITS:https://github.com/jaywalnut310/vits,还有很多分支版本。 sovitssvc:https://github.com/svcdevelopteam/sovitssvc,专注到唱歌方面。 除了算法,人物建模模型可以通过手动建模实现,但这种简单的构建方式还存在一些问题,如如何生成指定人物的声音、TTS 生成的音频如何精确驱动数字人口型以及做出相应动作、数字人如何使用知识库做出某个领域的专业性回答等。
2025-03-11
用trae写小程序的使用教程
以下是使用 Trae 写小程序的完整教程: 1. 基础操作 右下角选中“DeepSeekR1”,这是关键的基础步骤。 让 AI 设计小游戏,记得说“用 HTML 来实现”,这样无需额外配置环境,生成的网页小游戏可随时随地打开使用。 AI 完成小游戏后,点击代码框右上角的应用。在存放网页的文件夹中找到并打开即可使用。 2. 功能优化 若想给小游戏增加倒计时系统,告诉 AI 让其修改。若第一次修改有误,把错误告诉它并可尝试切换到 deepseekV3 等其他模型。 对于生成效果不太对的情况,如图片重叠,把结果贴给 AI 并描述错误现象和期望表现,让其迭代修改。 3. 后续步骤 完成功能修改后,可进行保存功能的开发。 调整细节,对于一些复杂问题,可能需要多次与 AI 沟通修改。 另外,公众号回复“字幕图片”,可获取源代码。将其保存成.html 文件,在浏览器打开就能使用。您还可以参考 https://openprocessing.org/ 中的创意,复制代码到 Trae 中用 AI 对话优化。
2025-03-11
stable diffusion安装教程
以下是超详细的 Stable Diffusion 安装教程: 一、查看电脑配置是否支持 如果您的电脑是 AMD 或者 Intel,可能不太支持 SD,网上的安装教程也较麻烦。您可以查看专用 GPU 内存: 1. 4GB:说明电脑勉强可以跑动 SD,出图时间较长。 2. 6GB:出一张图的时间是 20 50 秒,SD 的大部分功能都可以使用。 3. 8GB:5 20 秒可以出一张图,基本上 SD 的所有功能都对您开放。 以上操作是用于查看 Windows 系统的,至于 Mac 系统,可以查看以下视频并按照视频一键安装:https://www.bilibili.com/video/BV1Kh4y1W7Vg/?spm_id_from=333.788&vd_source=6f836e2ab17b1bdb4fc5ea98f38df761 二、安装 SD 本地部署 1. 电脑配置能支持 SD 运行的情况下,我们使用 B 站秋叶分享的整合包。整合包链接:https://pan.baidu.com/s/1hY8CKbYRAj9RrFGmswdNiA?pwd=caru ,提取码:caru 。 2. 具体安装方法: 打开链接,下载《1.整合包安装》,存放到电脑本地。 打开保存到电脑里的文件夹。 打开文件夹《1.秋叶整合包主包》,鼠标右击文件,点击“解压文件”。 选择解压到 D 盘或者 E 盘,避免 C 盘被占满,点击确定。 解压完成后,来到第二个文件夹,双击里面的文件,点击安装。 打开刚刚解压保存的 SD 的根目录,找到启动器,鼠标右击启动器,点击“发送到”,选择桌面快捷方式,方便下次直接在桌面双击进入。 双击启动器,等待更新,接着点击左边第二个“高级选项”,在显存优化里,根据自己电脑的显存选择(即上面查看的专用 GPU 内存)。 回到第一个一键启动,点击右下角的一键启动。如果出现报错,可以回到最开始的界面,在左边点击“疑难解答”,再点击右边的“开始扫描”,最后点击“修复”按钮。 三、安装超清无损放大器 StableSR 安装方式有两种: 1. 在扩展面板中搜索 StableSR,可以直接安装。 2. 将下载好的插件,放在路径文件夹“……\\sdwebuiakiv4\\extensions”下。安装完成后,重启 webUI,就可以在脚本里面找到这个放大器。
2025-03-11
提供给我一个agent落地的具体案例
以下为您提供几个 Agent 落地的具体案例: 彬子基于 ComfyUI 做油管封面 Agent:彬子是 ComfyUI 新人,之前更多使用 Coze 做 Agent 并调用其图像流完成绘图功能,还在 Glif 上做若干 Bot 以插件调用 API 方式完成绘图功能调用。Glif 提供的云端 ComfyUI 带来更多图像玩法,Coze 的工作流和 ComfyUI 的图像流代表了 Agent 内部两个子领域领先水平,但大多数同学专注一个领域精进,只要从擅长阵地多迈出一步,就能更好把控 Agent 中各种节点的设计和运用。 有用 Agent 产品开发:目前仍没有 Killer App 出现和 Agent 产品落地,原因一是 Agent 不靠谱,二是 Agent 开发者不靠谱。Agent 能力受 Tools 能力影响,如订机票需携程的 API 接入能力,要让模型更准确选择 Tools 及生成 api args,将非通识业务知识设计好让 Agent 直接用是当前接近“人工”智能且高性价比的方式。 【智谱 AutoGLM】:经过深度测试,AutoGLM 让开发者看到了 AI Agent 真正落地的希望。它解决了之前开发类似功能时的 API 对接难、多模态识别差、操作不精准等问题,借助 RPA 思路通过模拟人类操作实现跨应用控制。其场景理解能力出色,能根据用户意图选择合适应用场景,但仍存在语音识别偏差、复杂界面操作稳定性差、只支持安卓等问题。智谱团队选择几个高频场景深耕细作,证明了产品价值,未来发展空间大。
2025-03-12
目前AI在HR领域的应用真实案例
以下是 AI 在 HR 领域的一些应用真实案例: 1. 在招聘初期,AI 可用于职位描述生成、简历分析、面试题设计。 2. 在员工绩效评估方面,AI 能够分析员工工作表现,识别绩效趋势和提升点,为管理层提供数据支持的绩效反馈。 3. 对于员工培训与发展,AI 也能发挥作用。 例如,在智能人力资源方面,目前主要利用模型进行简历初筛、JD 自动生成、数据分析等工作。还有像 Deepseek“4+1”黄金提问法中的人力资源场景,如作为 IT 企业 HR,目标是 6 个月内培养 10 名全栈工程师,能独立负责项目。需要设计阶段性培训方案,并提出了具体的要求,用培训体系文档格式输出,包含能力评估标准。
2025-03-10
目前AI在HR领域的应用真实案例
以下是一些 AI 在 HR 领域的应用真实案例: 1. 在招聘初期,AI 可用于职位描述生成、简历分析、面试题设计等方面。 2. 在员工绩效评估中,AI 能够分析员工工作表现,识别绩效趋势和提升点,为管理层提供数据支持的绩效反馈。 3. 在员工培训与发展环节,AI 也能发挥作用。 4. 例如,在企业人事招聘中,可利用 RPA 和 AI 组合,让机器人分析简历并设定 AI 判断标准,帮助 HR 节省大量时间,且使用结果可控、有商业价值且覆盖面更广。 5. 还有如 Deepseek“4+1”黄金提问法中的人力资源场景,通过明确具体且可衡量的目标,如“作为 IT 企业 HR,目标是 6 个月内培养 10 名全栈工程师,能独立负责项目。需要设计阶段性培训方案,要求:1)月度能力达标率>90% 2)项目实战占比>60% 3)导师配比 1:2 4)人均培训成本控制在 3 万内”,用培训体系文档格式输出,包含能力评估标准,从而让 AI 更好地理解需求,提高工作效率。
2025-03-10
有没有自动生成思维导图的案例
以下是一些自动生成思维导图的案例: 案例一:熊猫 Jay 的“文章转思维导图小助手” 主要功能:根据文章内容或在线文档路径,自动生成文章要点的思维导图。 生成思维导图的 Action API 来自 Gapier,但获取在线文档的文本信息需配置 Webpilot 以获取更完整文本。 配置 Webpilot 的步骤: 去除新建 GPT 时默认勾选的 Web Browsing,避免冲突。 输入并点击 Import 导入配置信息。 输入配置隐私策略地址。 案例二:危柯宇的“读书会活动 AI 赋能” 日常活动文案输出(读书社活动,AI 复核型玩法“高阶”,依托传音智库+飞书妙记+在线思维导图 Markmap) 方法一:一键知识图谱 用 kimichat 让 AI 拆解书籍的三级章节并按照 markdown 产出内容,Prompt 示例:帮我拆解《爱的五种语言》,生成全书内容的思维导图,要求每个章节后面有三级展开,下一级是主要知识点,下下一级是知识点的论述。访问地址: 复制 AI 内容粘贴到在线思维导图 Markmap 中,一键生成思维导图,还可自定义微调内容,并免费导出图片。访问地址: 方法二:推导知识图谱(可参考相关 prompt 自己构建) 案例三:熊猫 Jay 的“代码生成思维导图助手” 根据代码自动整理成思维导图,目的是将复杂代码清晰呈现,方便查看。 GPTs 地址:
2025-03-09
AI客服案例
以下是为您整理的一些 AI 客服相关案例: 扣子案例合集:包括保姆级教程教您用扣子搭建免费好用的“图片转表格”AI 客服(附实操过程+效果)、前端智能化中扣子能做的事、如何用扣子搭建“赛事活动 AI 客服”机器人等。 SOP + AI 案例:X 公司客服团队引入 SOP 和 AI 助手后,工作效率显著提升。引入 SOP 前工作流程混乱,引入后标准化操作提高了效率,进一步引入 AI 助手实现自动化,如自动回复常见问题、处理简单请求等,最终工作效率提升 30%以上,客户满意度提高。 阿里云百炼案例:订票平台需具备结构清晰、全面的 FAQ 库,可基于用户信息提前呈现可能问题及解答,并动态更新。还提到可通过百炼的 Assistant API 构建 MultiAgent 架构的大模型应用实现智能导购。此外,企业可通过内部规章制度等文档构建知识库,借助 RAG 智能体实现内部知识问答功能,该功能已灰度上线,需提供 UID 并通过白名单开启。
2025-03-07
AI办公提效案例
以下是一些 AI 办公提效的案例: 案例二:【调研达人秘籍】 效益:通过清晰的 AI 工作流,能在短时间内完成深度调研,为决策提供有力支持。 AI 赋能调研工作流: 启动智库引擎:问 AI 怎么理解问题。 搭建信息骨架:问 AI 怎么汇报内容。 精准信息挖掘:问“秘塔 AI”定向搜索。 信息融合与分析:问“Kimichat”综合分析。 汇报成果精炼:整合分析结果,制作报告,分享实用调研工具。详情可查看链接:https://m.okjike.com/originalPosts/65 案例六:【AI 听播客音频,获取信息提速 20 倍】 操作步骤: 点开小宇宙播客分享链接。 打开微信通义听悟小程序。 可以直接在通义听悟看概括总结(2h 播客可以在 4min 左右分析完);也可一键转录解析导出 txt 文字版,丢到 kimi 自定义分析;(kimi 也可以读取播客链接进行音频解析,但是目前好像无法进行逐字稿)。视频解说看这里,播客速读 ai 工作流.mp4 可通过链接下载:https://bytedance.feishu.cn/space/api/box/stream/download/all/HXDcb9dNHoJH0bxeK9ecPEA6nYd?allow_redirect=1 案例:最近被《》种草,5h 时长的播客,用上述工作流 15min 内搞定所有精华信息,提效 20 倍。 宝玉日报 2 月 23 日: 管理经验加持 AI 应用:沟通明确,善于提供上下文,让 AI 更有效地执行任务;明晰 AI 能力边界,善于合理授权并监督检查;擅长任务拆解和整合,提升 AI 协作效率。详情链接:https://x.com/dotey/status/1893538744671641649 医保严禁 AI 自动开处方:DeepSeek、Grok 等 AI 工具看病仅需几十秒,引发关注。湖南省医保局正式表态,明确禁止使用人工智能生成医疗处方。详情链接:https://x.com/dotey/status/1893533370535051528 Coinbase 全面推动 AI 应用:所有工程师均使用 Cursor AI 工具进行编程,显著提高效率。AI 技术广泛应用于欺诈预防、客户支持、风险评分、设计等领域。下一步将实现从 Jira 或 Linear 工单到 PR 代码的 AI 自动生成,助力需求自动化落地。微信全文链接:https://mp.weixin.qq.com/s/dXodWGaPQgcOoMqwi7U_lQ ;详情链接:https://x.com/dotey/status/1893071537835557363
2025-03-07