Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

如果要用AI重绘一张已有的图片,给怎么做

Answer

要用 AI 重绘一张已有的图片,可以按照以下步骤进行:

  1. 将照片放入后期处理中,使用 GFPGAN 算法使人脸变清晰。您可以参考文章——【Stable Diffusion】图片高清化+面部修复+一键抠图,一些你不知道的事儿。此步骤可重绘五官,但头发、衣服等元素可能无法变清晰。
  2. 将图片发送到图生图中,打开 stableSR 脚本,放大两倍。这个放大插件是所有插件中对原图还原最精准、重绘效果最好的。不知道的朋友可以参考文章——【Stable Diffusion】超清无损放大器 StableSR
  3. 切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可以不写,以免对原图产生干扰。

此外,局部重绘的操作如下:

  1. 使用大模型“lofi”绘制人物形象,在提示词中加入相关标准化提示词和负面 Embedding 以修复细节问题。
  2. 将图片发送到图生图,点击“局部重绘”,用画笔将需要调整的部分涂上作为蒙版。
  3. 在正向提示词里添加相应描述和权重,比如(closed eyes:1.2),适当增加重绘幅度并生成。
  4. 还可以进入涂鸦重绘,用颜色画笔画任意想添加的东西。

在高清修复方面:

  1. 文生图高清修复的原理是命令 AI 按照原来的内容重新画一幅,新生成的绘图和原图在细节上会有不同。若想更接近原图,可适当降低重绘幅度,比如 0.2 - 0.3。
  2. 当抽到喜欢的图后,可用随机种子固定图片进行高清修复。由于高清修复渲染耗时较长,一般建议先采用低分辨率抽卡刷图。
  3. 第二种放大方式是使用图生图的脚本功能,将文生图发送到图生图,点击脚本选择 SD 放大,重绘幅度设置 0.3,放大倍率为 2,图块重叠像素设置为 64。
Content generated by AI large model, please carefully verify (powered by aily)

References

【SD】用AI给老照片上色,岁月不改它模样

将照片放入到后期处理中,使用GFPGAN算法将人脸变清晰,不知道这个功能的可以参考我这篇文章——[【Stable Diffusion】图片高清化+面部修复+一键抠图,一些你不知道的事儿](http://mp.weixin.qq.com/s?__biz=MzkzMzIwMDgxMQ==&mid=2247487422&idx=1&sn=9cdf7ef37c2acb3c0fc3328d0ba8af74&chksm=c251597af526d06c921ea6728cb2a32bdf1d5f699e19d6ba13b849994e4d01af8a5144132aad&scene=21#wechat_redirect)。这个步骤,可以将我们的五官进行重绘,但是却没有办法将照片中的头发、衣服等其他元素变清晰。所以,接下来我将图片再发送到图生图当中,打开stableSR脚本,放大两倍。这个放大插件是所有插件中对原图还原最精准的,也是重绘效果最好的,不知道的朋友可以参考我的这篇文章——[【Stable Diffusion】超清无损放大器StableSR](http://mp.weixin.qq.com/s?__biz=MzkzMzIwMDgxMQ==&mid=2247487403&idx=1&sn=cbb96534fa6f58c37cf9fc64bc7ade0c&chksm=c251596ff526d0792b4bba0e21b69427b23e780824bdc75b22f1073e8bad6f61f30199fc8344&scene=21#wechat_redirect)。切换到sd2.1的模型进行修复,vae选择vqgan,提示词可以什么都不写,以免对原图产生干扰。

【SD】玩转局部重绘,哪里不行点哪里

作者:白马少年介绍:SD实践派,出品精细教程发布时间:2023-05-06 20:00原文网址:https://mp.weixin.qq.com/s/tUHt53XeA1IQUf9aic2msQ如果说对比目前的Midjourney和Stable Diffusion,能否让AI能根据我们的意愿进行调整就是一个很大的区别。就这一点来看,Stable Diffusion拥有了更大的自由度和更稳定的可控性。今天,我们再更深入地了解一下图生图中的“局部重绘”。首先,使用大模型“lofi”绘制一个人物形象。前几期我们都是使用的卡通模型,这一次使用的这款是一个写实类模型,可以看到人物非常逼真,丝毫不亚于相机所拍的照片。在提示词中加入了关于相机的一些标准化提示词——佳能EOS R6拍摄,135mm,1/1250,f/2.8,ISO 400。然后还使用了一个负面Embedding——NG_DeepNegative_V1_75T,这个Embedding是专门用来修复写实人物的手部、姿态等细节问题的。接下来,我们把这张图发送到图生图,点击“局部重绘”。比如,我们可以试着让人物闭上眼睛。可以先用画笔将人物需要调整的部分涂上,这个区域又可以称为蒙版。接下来,在正向提示词里面添加(closed eyes:1.2),括号和数字都是增加权重用的,告诉AI我们需要一双闭上的眼睛。可以适当增加一些重绘幅度,点击生成,闭上眼睛的样子就改好了。它的原理就是将蒙住的部分重新画,你也可以将没有蒙住的部分重新画,比如你可以把人物蒙住之后,重画她的背景。更进阶的用法,我们可以进入涂鸦重绘,用颜色画笔画任意你想添加的东西,比如在她的头顶加上一朵小黄花。

【SD】如何画出商用级别的高清大图

我们看一下高清修复下的这张画,文生图高清修复的原理其实是命令AI按照原来的内容重新画一幅,所以新生成的绘图和原来的绘图在细节上会不太一样。如果想要更接近之前的绘图,可以适当降低重绘幅度。我们来对比一下修复前后的区别,这次使用的重绘幅度为0.7,所以可以看到帽子和耳机都有了变化,想要保留原来的细节,可以尝试0.2-0.3。我们再使用重绘幅度为0.3绘制一下,可以看到服饰细节就比较接近了,但是由于重绘幅度低,手部就出现了问题。这种情况,就要通过反复抽卡,图生图局部重绘,或者生成多张图片后进ps合成等办法去解决。由于高清修复的渲染耗时比较长,所以我们一般建议先采用低分辨率进行抽卡刷图,当抽到自己比较喜欢的图之后,再使用随机种子来固定图片进行高清修复。二、SD放大第二种方式是使用图生图的脚本功能,当我们使用文生图画好一张图之后,可以将它发送到图生图。点击下面的脚本,选择使用SD放大。重绘幅度设置0.3,放大倍率为2,图块重叠的像素设置为64。这张图原本的尺寸为512x768,此时需要加上重叠像素的64,就变成了576x832。可以看到,这次的Stable Diffusion是将这张图均匀地切成了四块,然后分别渲染,最终拼接成一整张图,这种方式需要让我们重绘幅度保持在比较低的数值,不然这新生成的四张图中可能会出现新的人物。

Others are asking
局部重绘
局部重绘是指针对图像或画面中的特定局部区域进行重新绘制、修改或调整,而不影响整体画面的其他部分。 使用局部重绘的方法如下: 1. 进入操作界面,滑动鼠标到图像区域后,可以选择智能选区与手动选区两种使用方法。 智能选区: 选中选区:滑动鼠标到图像区域,会自动框选图像区域,点击鼠标左键即可锁定。 增加选区:左键点击其他未选中区域,即可增加选区。 删除选区:选中后+键盘 dell 按键可以删除选区。智能选区中紫色区域即为重绘部分。 手动选区: 画笔工具:对图像涂抹进行选区。 橡皮工具:擦除不想要修改的区域。 索套选区:可以用它圈出任意形状的区域。 方框选区:方形选区。 2. 局部重绘成功后: 调整选区:返回选择选区界面,进行再一次调整。 保存图像:下载最终图像。 分享图像:生成图像分享链接。 信息查看:查看图像重绘信息,可将信息发送到生成器当中。 保留这张图:将图像保存到无限画布中。 对比:对比重绘前后的图像。 在顶部导航栏中: 退出:不保存最终图像,回到无限画布中。 新图:更换重绘的原图。 操作步骤为:选区>定义重绘内容>调整重绘幅度>点击重绘按钮>保存这张图。
2025-01-23
能到达图片重绘效果的软件
以下是一些能够实现图片重绘效果的软件及相关信息: Stable Diffusion: 将照片放入后期处理中,使用 GFPGAN 算法使人脸变清晰。可参考文章。 将图片发送到图生图中,打开 stableSR 脚本,放大两倍。此放大插件是所有插件中对原图还原最精准、重绘效果最好的。可参考文章。切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可以不写以免对原图产生干扰。 Midjourney: 最新编辑器更新,可上传图片重新绘制。允许从计算机上传图像,然后扩展、裁剪、重绘、添加或修改场景中的元素。还推出了“图像重纹理化模式”,会估算场景的形状,然后重新应用纹理,使得所有光照、材质和表面都发生变化。所有图像编辑操作都可以通过文本提示和区域选择来控制。编辑器兼容模型个性化、风格参考、角色参考和图像提示功能。 常见问题:如果提出极其不合适的请求,或者要求修改一个非常小的区域,可能无法得到预期的结果;如果在场景中放了一个很小的头部并要求进行外绘,生成的身体可能会太大(所以请将头部放大一些)。 重纹理化:是一种通过使用另一张图像来引导图像结构或构图的方法。从构图引导图像开始(在全功能编辑器中上传或链接的基础或母图像),然后使用提示词和参数来添加所需的细节。 右侧显示的缩略图:显示器右侧的缩略图显示的是最近几次编辑会话的记录。左边稍大一点的缩略图是上传或链接的图像。其他四张缩略图是子图像,展示了 Midjourney 根据提示生成的四种不同表达方式。 按钮:用于查看更多相关内容。 使用规则:由于这些功能非常新,Midjourney 希望给社区和人工审核团队一个缓慢适应的时间,因此在第一个发布阶段,将这些功能开放给以下社区群体:已生成至少 10,000 张图像的用户,年度会员可用;过去 12 个月内一直是月度订阅用户的用户(MJ 尝试做得更细致一些,但数据库处理起来有些复杂,抱歉!)
2024-12-05
识别图片中的形状和文字元素并在PPT中重绘图像的AI工具
以下为您推荐一些能够识别图片中的形状和文字元素并在 PPT 中重绘图像的 AI 工具: 1. Gamma:这是一个在线 PPT 制作网站,允许用户通过输入文本和想法提示快速生成幻灯片。它支持嵌入多媒体格式,如 GIF 和视频,以增强演示文稿的吸引力。网址:https://gamma.app/ 2. 美图 AI PPT:由知名图像编辑软件“美图秀秀”的开发团队推出。用户通过输入简单的文本描述来生成专业的 PPT 设计,包含丰富的模板库和设计元素,可根据需求选择不同风格和主题的模板,适用于多种场合。网址:https://www.xdesign.com/ppt/ 3. Mindshow:一款 AI 驱动的 PPT 辅助工具,提供一系列智能设计功能,如自动布局、图像选择和文本优化等,简化设计流程,还可能包括互动元素和动画效果。网址:https://www.mindshow.fun/ 另外,如果您想从游戏截图升级到 KV 品质,正式绘画目前有图生图和 controlnet 两种出图方式。但如果底图质量不够,想要 AI 更自由发挥,除了调高重绘幅度,还可以在 controlnet 上有更多探索。输入正负 TAG,设置好图片尺寸、迭代步数、采样器、重绘幅度后,等待图片生成。controlnet 包含的功能很多且在不断更新,如需更多了解可跳转 B 站深度学习:https://www.bilibili.com/video/BV1Ds4y1e7ZB/?spm_id_from=333.337.searchcard.all.click
2024-08-29
我做了一个视频,背景是实拍的城市照片,角色是一个卡通角色,通过即梦让照片上的卡通角色动起来后,发现卡通角色的脸跟手臂动作都糊了。 我现在有什么办法优化,对卡通角色五官重绘更清晰的情况下,还保留现实的照片背景。(用sd重绘的话是不是就丢失了)
以下是一些可能有助于您优化视频的建议: 1. 对于您提到的卡通角色动作模糊的问题,可以尝试使用 Dreamina 工具,并将运动速度设为慢速,同时在 Prompt 里写轻微的动作描述,可能会有不错的效果。 2. 由于 Dreamina 工具存在只有 8 帧和 720P 的限制,您可以使用 Topaz Video AI 将其增强到 24 帧和 4K。在 B 站搜索“Topaz Video AI 4.2.1”关键词能找到相关教程。增强完成后,再放到剪映里裁成 21:9 的比例。 3. 对于卡通角色五官不清晰的情况,如果 AI 工具无法处理,可能需要使用传统的 AE 软件自己制作,比如普通的下沉位移动画。 需要注意的是,在某些情况下,如人物在水中下沉时,AI 视频可能会出现脸糊的情况,这种情况可能需要传统手段来解决。
2024-08-25
我创作了一个AI视频,背景是实拍的城市照片,角色是一个卡通角色,通过即梦让照片上的卡通角色动起来后,发现卡通角色的脸跟手臂动作糊了,我期望通过comfy对其重绘,能解决保留现实背景,卡通角色五官重绘更清晰吗?
在处理您提到的这种情况时,有以下一些建议和方法: 1. Dreamina 对 Prompt 的语义理解较好,您可以将运动速度设为慢速,并在 Prompt 里写轻微的相关描述,可能会有不错的效果。但需要注意的是,Dreamina 存在只有 8 帧和 720P 的限制,对比 Runway 的 24 帧和 4K 有差距。所以需要使用 Topaz Video AI 去增强到 24 帧和 4K,您可以在 B 站通过“Topaz Video AI 4.2.1”这个关键词搜索教程进行学习。增强完以后,再扔到剪映里裁成 21:9。 2. 对于人物在水中下沉等情况导致的脸糊问题,很多时候 AI 搞不定,可能需要使用传统 AE 自己制作普通的下沉位移动画。 不过,需要说明的是,在一些复杂的场景和动作中,AI 可能仍然存在一定的局限性,需要综合多种工具和方法来达到理想的效果。
2024-08-25
视频局部重绘
以下是关于视频局部重绘的相关信息: Haiper 工具: 能进行视频重绘,包括轻松修改颜色、纹理和元素以改变原视频的视觉内容。 局部重绘可通过点选方式选中需重绘区域,再输入替换内容提示词,但大量背景重绘效果一般,视频易崩。 文生视频支持选择风格、秒数(2s 和 4s)、种子值等。 网址:https://haiper.ai/ 文生视频不同风格展示可参考: 图生视频只能写提示词、秒数(2s 和 4s)、种子值。 【SD】工具: 原理是将蒙住的部分重新画,也可将未蒙住的部分重新画,比如蒙住人物重画其背景。 更进阶的用法是进入涂鸦重绘,用颜色画笔画任意想添加的东西,如在头顶加小黄花。 可添加关键词生成相应内容。 如需扩展背景,可在图生图中选择“缩放后填充空白”,重绘幅度 0.5,并增加宽度。 随着重绘幅度增大,人物细节可能改变,若想只改背景不改人物,可借助 PS 制作精确蒙版,进入“上传重绘蒙版”界面,上面放置需重绘的图像,下面放置 PS 中制作好的蒙版。 Video Battle AI 视频挑战: 本次大赛主题为首尾帧要求:视频首、尾、首的方式制作。 方法 1 为【MJ 出图+AI 视频软件】,使用 Midjourney 垫图➕描述出图,再去视频工具中转成视频。可下载项里的深度图,打开 MJ 官网上传深度图。Midjourney 官网:https://www.midjourney.com/ 。局部重绘有难度,最终方式为分开画再合成。
2024-08-15
AI文章提示词怎么反推反问
以下是关于 AI 文章提示词反推反问的相关内容: 对于 Midjourney 提示词的解析,其 AI 以半抽象方式处理整体概念,具体性是获得理想结果的关键。可从简单提示或参数修改开始,逐步调整。方法流程包括: 1. 初始提示:如“Prompt:A banana is floating in the airv 6.1 提示:一个香蕉漂浮在空中v 6.1”,查看生成结果,若不理想可进一步优化。 2. 优化描述:例如“Prompt:Banana shaped hologram of molten liquid metal,floating in air,isolated on a lilac background,minimalist design,vector illustration,high resolution photographyv 6.1 提示:香蕉形态的液态金属全息图,漂浮在空气中,在淡紫色背景上,极简设计,矢量插图,高分辨率摄影v 6.1”。 3. 添加调节参数命令。 对于 DeepSeek 深度推理,可借助 AI 分析好文章,如: 1. 找出喜欢的文章投喂给 deepseek R1,然后进行多次询问,如从写作角度、读者角度分析,指出缺点和提升空间,对作者进行侧写等。 在提示词技巧方面,包括: 1. 教训:要求讨论从特定情况中得到的教训,如“分享一个关于企业失败的案例,并从中提炼出的教训。” 2. 观点:要求 AI 考虑多种观点或意见,如“分析支持和反对核能发展的观点。” 3. 常见问题解答:要求 AI 生成常见问题解答(FAQs)列表,如“请提供一份关于瑜伽初学者的常见问题解答列表。” 4. 背景:提供背景信息、数据或上下文以便生成准确内容,如“请结合当前全球碳排放数据谈论气候变化的影响。” 5. 目标:说明回应的目标或目的,如“编写一篇旨在说服读者加入环保运动的文章。” 6. 受众:指定定制内容的目标受众,如“请为初中生编写一篇关于节水的文章。” 7. 范围:界定主题的范围,如“请仅关注瑜伽在减压方面的好处。” 8. 扮演角色:表明要采用的角色或观点,如“从一个科学家的角度阐述太阳能的优点。” 9. 示例:提供所需风格、结构或内容的示例,如“请参考《纽约时报》的文章风格撰写一篇关于自然保护的报道。” 10. 案例研究:要求参考相关案例研究或现实世界示例,如“在关于可持续发展的文章中,介绍一些成功的企业案例。”
2025-02-07
AIGC是什么
AIGC 即 AI generated content,又称为生成式 AI,是一种利用人工智能技术生成各种类型内容的应用方式。 它能够通过机器学习和深度学习算法,根据输入的数据和指令生成符合特定要求的内容,例如 AI 文本续写、文字转图像的 AI 图、AI 主持人等。 AIGC 的应用领域广泛,包括但不限于以下方面: 1. 文字生成:使用大型语言模型(如 GPT 系列模型)生成文章、故事、对话等内容。 2. 图像生成:使用 Stable Diffusion、DALLE 等模型生成艺术作品、照片等。 3. 视频生成:使用 Runway、KLING 等模型生成动画、短视频等。 AIGC 主要分为语言文本生成、图像生成和音视频生成。语言文本生成利用马尔科夫链、RNN、LSTMs 和 Transformer 等模型生成文本,如 GPT4 和 Gemini Ultra。图像生成依赖于 GANs、VAEs 和 Stable Diffusion 等技术,应用于数据增强和艺术创作,代表项目有 Stable Diffusion 和 StyleGAN 2。音视频生成利用扩散模型、GANs 和 Video Diffusion 等,广泛应用于娱乐和语音生成,代表项目有 Sora 和 WaveNet。此外,AIGC 还可应用于音乐生成、游戏开发和医疗保健等领域。 AIGC 作为一种强大的技术,在赋能诸多领域的同时,也存在多重潜在的合规风险。目前,我国对 AIGC 的监管框架由《网络安全法》《数据安全法》及《个人信息保护法》构成,并与《互联网信息服务算法推荐管理规定》、《互联网信息服务深度合成管理规定》、《生成式人工智能服务管理暂行办法》、《科技伦理审查办法(试行)》等形成了共同监管的形势。 AIGC 与 UGC(普通用户生产)、PGC(专业用户生产)都是内容生成的不同方式,主要区别在于内容的创作者和生成方式。UGC 由用户生成内容,优势在于内容丰富多样,能反映用户真实想法和创意,适用于社交媒体、社区论坛等互动性强的平台。PGC 由专业人士或机构生成内容,优势在于内容质量高、专业性强,适用于新闻媒体、专业网站等需要高质量内容的平台。
2025-02-07
Deep seek如何实现电气化的AI制作。
DeepSeek 在实现电气化的 AI 制作方面具有以下特点和优势: 1. 在编码任务中表现出色,推出了 deepseekcoderv2,组合了速度、轻便性和准确性。 2. 是唯一支持联网搜索的推理模型。 3. 具有强大的推理能力,参数少,训练开销与使用费用小,开源且免费。 4. 由没有海外经历甚至没有资深从业经验的本土团队开发完成。 5. HiDeepSeek 工具能让 DeepSeek 像人类交流时那样,在给出答案的同时展示思考过程,使其回答更可信,帮助发现可能存在的误解或偏差。 如果您想进一步了解 DeepSeek 的相关内容,您可以通过以下方式: 1. 直接访问相关网页链接马上用起来,也有移动 APP。 2. 使劲用,疯狂用,尝试用它基本取代传统搜索。 3. 去看看别人是怎么用的,去试试其他大模型,了解 AI 擅长什么,不擅长什么,如何调教,然后继续解锁与迭代属于自己的用法与更多工具。
2025-02-07
怎样把AI与CAD结合?
将 AI 与 CAD 结合可以参考以下几个方面: 1. 学术研究: 搜索相关学术论文,了解 AI 在 CAD 领域的应用和研究成果。可通过 Google Scholar、IEEE Xplore、ScienceDirect 等学术数据库进行搜索。 2. 专业书籍: 查找与 AI 在 CAD 领域相关的专业书籍,了解其应用和案例。 3. 在线学习资源: 参加 Coursera、edX、Udacity 等平台上的 AI 和 CAD 相关课程。 在 YouTube 等视频平台上查找教程和演示视频,了解 AI 在 CAD 设计中的应用。 4. 技术交流: 加入相关的技术论坛和社区,如 Stack Overflow、Reddit 的 r/AI 和 r/CAD 等,与专业人士交流学习。 关注 AI 和 CAD 相关的博客和新闻网站,了解最新技术动态和应用案例。 5. 开源项目和代码库: 探索 GitHub 等开源平台上的 AI 和 CAD 相关项目,例如 OpenAI 的 GPT3、AutoGPT 等 AI 模型在 CAD 设计中的应用。 6. 企业案例研究: 研究 Autodesk、Siemens 等公司在 AI 在 CAD 设计中的应用案例,了解实际项目中的应用和效果。 一些可以用来画 CAD 图的 AI 工具包括: 1. CADtools 12:Adobe Illustrator 插件,为 AI 添加 92 个绘图和编辑工具。 2. Autodesk Fusion 360:集成了 AI 功能的云端 3D CAD/CAM 软件。 3. nTopology:基于 AI 的设计软件,可创建复杂 CAD 模型。 4. ParaMatters CogniCAD:基于 AI 的 CAD 软件,能根据输入自动生成 3D 模型。 5. 主流 CAD 软件中的生成设计工具:如 Autodesk 系列、SolidWorks 等,可根据设计目标和约束条件自动产生多种方案。 此外,TexttoCAD 可以通过文本 Prompt 生成 CAD 模型,其 UI 开源,但模型需付费。官网:
2025-02-07
ai学习
以下是新手学习 AI 的方法和建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,如图像、音乐、视频等,可根据兴趣选择特定模块深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解其工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 对于中学生学习 AI,建议如下: 1. 从编程语言入手学习: 可以从 Python、JavaScript 等编程语言开始,学习编程语法、数据结构、算法等基础知识,为后续的 AI 学习打下基础。 2. 尝试使用 AI 工具和平台: 可以使用 ChatGPT、Midjourney 等 AI 生成工具,体验 AI 的应用场景。 探索一些面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识: 了解 AI 的基本概念、发展历程、主要技术如机器学习、深度学习等。 学习 AI 在教育、医疗、金融等领域的应用案例。 4. 参与 AI 相关的实践项目: 参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动。 尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 5. 关注 AI 发展的前沿动态: 关注 AI 领域的权威媒体和学者,了解 AI 技术的最新进展。 思考 AI 技术对未来社会的影响,培养对 AI 的思考和判断能力。 记住,学习 AI 是一个长期的过程,需要耐心和持续的努力。不要害怕犯错,每个挑战都是成长的机会。随着时间的推移,您将逐渐建立起自己的 AI 知识体系,并能够在这一领域取得成就。完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。
2025-02-07
AI大模型应用面试题
以下是一些与 AI 大模型应用相关的面试题: 在游戏行业,大模型不仅能降低成本,还能打造创新玩法,如网易的《逆水寒》在美术开发、NPC 与玩家交互等方面的应用。请问您对这种应用的看法和理解? 在人力资源管理领域,AI 覆盖了从招聘到员工绩效评估等各个环节。请谈谈您对这种应用的认识以及其可能带来的影响。 在基础办公提效方面,如 PPT、Excel 等,AI 能从单个任务到角色协同显著提高工作效率。您认为这种提高在实际工作中的具体表现和重要性如何? 对于健身行业中的 AI 减重顾问,既能解决售前客服问题,又能进行健康监护,您如何看待这种应用的前景和挑战? 如何在 10 分钟内在网站上增加一个 AI 助手?比如创建大模型问答应用,包括获取大模型的推理 API 服务等步骤。 作为 AIGC 产品经理,在大模型方面,如对算法的熟悉程度、了解的大模型及其评价、快速体验各种模型的方法、大模型应用落地中注入领域知识的方式、大模型应用的评测、保证大模型价值观无害、对 PE 的理解及相关案例、对大模型微调及 RAG 的理解和优势、用大模型解决传统模型无法解决的业务问题、大模型面临的新安全危险及解决方法、幻觉的产生及解决手段等方面,您有怎样的见解和经验?
2025-02-07
为什么要用智能体 提示词和提问题什么区别
智能体的使用具有重要意义,写好提示词是创建智能体的第一步。设计提示词有多种原则和模型,如 CRISPE 框架,其中包括能力与角色(CR)、洞察(I)、陈述(S)、个性(P)、实验(E)等方面,明确希望 AI 扮演的角色、具备的背景信息、要做的事、回答风格以及提供多个答案等。FewShot COT 模型通过加入示例能有更好效果,可提供 1 到多个样本;ZeroShot COT 模型则不增加示例样本。TOT 模型先分步骤,每个步骤产生多个结果并选择,再进行下一步。SelfConsistent COT 模型则注重一个问题的多种解法。 从使用角度看,提示词可分为任务型和拟人化型。任务型提示词高度专业化、流程清晰,遵循严格工作逻辑,专注完成特定任务或解决问题;拟人化提示词模拟人类交互方式,用于陪伴聊天等,需要更细致全面的设计以呈现丰富个性和背景。 在生成式人工智能模型中,提示词是用户输入用于引导模型产生期望输出的文本,可简单可复杂,包含指令、问题、输入数据和示例等,为得到期望回应,通常必须包含指令或问题,其他元素可选。在 LLM 中,基本提示词可直接提问或提供特定任务指令,高级提示词则有更复杂结构,如思维链提示词引导模型逻辑推理得出答案。 提示词和提问题的区别在于,提示词不仅包含问题,还可能包含指令、输入数据和示例等,以更全面地引导模型产生期望的输出。而提问题相对较为简单直接,侧重于获取答案。
2025-02-07
cursorrules是个什么东西,为什么在做cursor需要用到它?
.cursorrules 是 Cursor 中的一个特殊文件,需放在打开文件夹的根目录。它具有以下重要作用: 1. 改变 Cursor 对于后台 LLM 的 prompt:文件中的所有内容都会作为 prompt 的一部分发给后端的 AI,如 GPT 或 Claude,为定制化带来极大灵活性。例如,可以把计划的内容放在这个文件里,让 Cursor 在对话时获取最新版计划,还能在文件中给予更详细的指令。 2. 实现闭环:Cursor 会自动读取该文件内容了解最新动态,经过思考后将更新后的进度和下一步计划写回文件。 3. 支持更多工具的使用:由于可以通过.cursorrules 直接控制给 Cursor 的 prompt,且 Cursor 有运行命令的能力,可事先在文件中向它介绍工具用法,使其学会使用工具完成任务。例如,对于网页浏览和搜索工具,可在文件中进行相关设置和说明。 4. 规范代码生成:就像给助手的“整理指南”,提前把编码规则、项目结构、注意事项写在这个文件里,AI 会自动按照要求写代码,避免生成混乱的代码。
2025-02-06
制作ai视频都需要用到哪些工具
制作 AI 视频通常需要用到以下工具: 1. Stable Diffusion(SD):一种 AI 图像生成模型,可基于文本描述生成图像。网址:https://github.com/StabilityAI 2. Midjourney(MJ):适用于创建小说中的场景和角色图像的 AI 图像生成工具。网址:https://www.midjourney.com 3. Adobe Firefly:Adobe 的 AI 创意工具,能生成图像和设计模板。网址:https://www.adobe.com/products/firefly.html 4. Pika AI:文本生成视频的 AI 工具,适合动画制作。网址:https://pika.art/waitlist 5. Clipfly:一站式 AI 视频生成和剪辑平台。网址:https://www.aihub.cn/tools/video/clipfly/ 6. VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能。网址:https://www.veed.io/zhCN/tools/aivideo 7. 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具。网址:https://tiger.easyartx.com/landing 8. 故事 AI 绘图:小说转视频的 AI 工具。网址:https://www.aihub.cn/tools/video/gushiai/ 此外,制作 AI 视频还需要考虑故事的来源和剧本写作。故事来源可以是原创(如个人或周围人的经历、梦境、想象的故事等),也可以是改编(如经典 IP、名著、新闻、二创等)。剧本写作方面,虽然有一定门槛,但可以从自身或朋友的经历改编入手,多与他人讨论并不断实践总结。在生成视频画面时,可能需要大量抽卡来获取合适的画面。比如在科幻片、战争片、奇幻片等不同类型的视频中,通过不同的工具生成相应的画面。
2025-01-21
ai虚拟人物和真实视频融合需要用到哪些工具
AI 虚拟人物和真实视频融合可能会用到以下工具: 1. HeyGen:这是一个 AI 驱动的平台,能创建逼真的数字人脸和角色,使用深度学习算法生成高质量肖像和角色模型,适用于游戏、电影和虚拟现实等。 2. Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:提供 AI 拟真人视频产品服务和开发,只需上传人像照片和输入内容,平台的 AI 语音机器人会自动转换成语音并合成逼真的会开口说话的视频。 此外,还有 Pika、Pixverse、Runway、SVD 等工具。Pika 对奇幻感强的画面把控较好,但真实环境画面易糊,新的唇形同步功能需抽卡;Pixverse 在高清化方面有优势,对特定物体移动的画面友好,但生成视频有帧率问题;Runway 在真实影像质感方面表现最佳,但爱变色且光影不稳定;SVD 整体表现略差,仅在风景片测试中表现较好。在实际使用中,可根据不同工具对画面的处理能力进行组合使用。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。请注意,这些工具的具体功能和可用性可能会变化,使用时请遵守相关条款和政策,并注意版权和伦理责任。
2025-01-21
ai现在主要用于哪个方面
人工智能(AI)目前已广泛应用于多个领域,主要包括以下方面: 1. 医疗保健: 医学影像分析,辅助诊断疾病。 药物研发,加速研发过程。 个性化医疗,提供个性化治疗方案。 机器人辅助手术,提高手术精度和安全性。 2. 金融服务: 风控和反欺诈,降低金融机构风险。 信用评估,辅助贷款决策。 投资分析,帮助投资者做出明智决策。 客户服务,提供 24/7 服务。 3. 零售和电子商务: 产品推荐,根据客户数据推荐感兴趣的产品。 搜索和个性化,改善搜索结果和购物体验。 动态定价,根据市场需求调整价格。 聊天机器人,回答客户问题。 4. 制造业: 预测性维护,避免机器故障停机。 质量控制,检测产品缺陷。 供应链管理,优化供应链提高效率。 机器人自动化,提高生产效率。 5. 交通运输: 自动驾驶技术,实现自主导航驾驶。 车辆安全系统,预防事故。 个性化用户体验,根据偏好调整车辆设置。 预测性维护,减少停机和维修成本。 生产自动化,提高制造效率和质量。 销售和市场分析,制定营销策略。 电动化和能源管理,优化电池使用和充电策略。 共享出行服务,提高服务效率和满意度。 语音助手和车载娱乐,方便控制和获取信息。 车辆远程监控和诊断,及时了解车辆状况。
2025-01-19
AI信息交流教程 主要用于论文写作 资料查找
很抱歉,目前知识库中没有关于“AI 信息交流教程用于论文写作和资料查找”的相关内容。但一般来说,在进行论文写作和资料查找时,您可以从以下几个方面入手: 1. 明确研究主题和问题:确定您想要探讨的 AI 领域的具体方向和关键问题。 2. 选择合适的数据库和搜索引擎:例如学术数据库(如 Web of Science、Scopus 等)、专业的 AI 研究网站等。 3. 制定有效的检索策略:使用准确的关键词、布尔运算符等提高检索的准确性。 4. 评估资料的可靠性和相关性:注意来源的权威性、出版日期等。 5. 学会引用和整理资料:遵循学术规范,正确引用和整理所找到的资料。 希望以上建议对您有所帮助。
2025-01-05
图片转3D
以下是一些可用于图片转 3D 的工具及相关操作方法: 1. 工具: Tripo AI:VAST 发布的在线 3D 建模平台,能利用文本或图像在几秒钟内生成高质量且可立即使用的 3D 模型,基于数十亿参数级别的 3D 大模型,实现快速的 2D 到 3D 转换,并提供 AI 驱动的精准度和细节。 Meshy:功能全面,支持文本生成 3D、图片生成 3D 以及 AI 材质生成,用户可通过上传图片并描述材质和风格生成高质量 3D 模型。 CSM AI:支持从视频和图像创建 3D 模型,其 Realtime Sketch to 3D 功能支持通过手绘草图实时设计 3D 形象再转换为 3D 模型。 Sudo AI:支持通过文本和图像生成 3D 模型,特别适用于游戏领域的模型生成,用户可上传图片或输入文本提示词来生成 3D 模型。 VoxCraft:由生数科技推出的免费 3D 模型生成工具,能将图像或文本快速转换成 3D 模型,并提供图像到 3D、文本到 3D 和文本到纹理等多种功能。 2. 操作示例: 从设计稿到 3D 效果图:在平面设计稿转 3D 阶段,可直接用 AI(如 MJ 或国产 AI 即梦等)生成角色。在即梦图片生成界面中导入参考图,参考选项为参考轮廓边缘,生图模型选择图片 2.0,输入提示词,生成图片。提示词如:可爱的拟人小鹿角色,米白色鹿角,戴着时尚耳机,穿着红色唐装,衣服中国圆环纹理,喜气洋洋,充满春节过年的氛围。迪士尼皮克斯工作室风格的肖像摄影,色调柔和,模型展示有精细的光泽,白色干净背景,3D 渲染,柔焦 C4D 渲染风格,Blender,知识产权风格,最佳画质,8K,超级详细,简洁,可爱。 3. 相关工具链接: 即梦:https://jimeng.jianying.com/aitool/image/generate Recraft: https://www.recraft.ai/ 图像压缩:https://imageresizer.com/zh/%E5%9B%BE%E5%83%8F%E5%8E%8B%E7%BC%A9 这些工具通常具有用户友好的界面,允许用户通过简单操作生成 3D 模型,无需专业 3D 建模技能,可广泛应用于游戏开发、动画制作、3D 打印、视觉艺术等领域。
2025-02-07
生成图片
以下是关于生成图片的相关内容: ComfyUI Flux 与 runway 制作绘画视频: 提示词告诉 flux 生成一张技术草图,如 CAD。 在 runway 里面,使用提示词从空白页面开始逐行创建,并把生成的图片作为尾帧。 使用 flux 的 controlNet 为草图上色,depth 固定,Union 版本不建议权重调太高和结束时间太长。 分享了一个好玩的 how2draw Flux lora 展示绘画过程。 tune 风格(调音)修改器·语雀: 复制风格调谐器生成的代码,可使用 Parameter 添加到提示中。 回到不和谐,使用 /imagine 命令并将复制的提示和参数粘贴到 prompt 字段中生成图像。 可使用其他 Midjourney 工具如 Upscale、Pan、ZoomOut、Remix 或 VaryRegion 进一步增强图像。 SD 入门教程: 单张或几张调试参数时建议选择前面几种预览图设置,可看到生成过程中图片效果,感觉不对直接中断生成。 批量几百张生成时建议选最后那种速度最快的设置,因为不需要看预览图。 右键可进入无限跑图模式,有插件可解决无限跑图参数无法修改的痛点,如 https://github.com/ArtVentureX/sdwebuiagentscheduler ,方便上班族设置多组参数。
2025-02-07
上传图片,通过AI生成提示词
以下是一些关于上传图片通过 AI 生成提示词的信息: Freepik 推出了 Reimagine AI 工具,用户上传图片可自动生成提示词,无需输入文字,能实时提供无限滚动结果展示,边操作边生成图像,还可通过调整提示词实时修改图片细节,支持多种风格切换。相关链接:https://freepik.com/pikaso/reimagine 、https://x.com/imxiaohu/status/1770437135738581414?s=20 StreamMultiDiffusion 项目亮相,使用区域文本提示实时生成图像,有交互式操作体验,每个提示控制一个区域,实现精准图像生成,被描述为“真正的神笔马良”。相关链接:https://arxiv.org/abs/2403.09055 、https://github.com/ironjr/StreamMultiDiffusion?tab=readmeovfile 、https://huggingface.co/spaces/ironjr/SemanticPalette 、https://x.com/imxiaohu/status/1770371036967850439?s=20 对于“城市狂想”的图片制作,有提供猫叔写的提示词示例,如远景、三分法构图等不同风格的描述,并生成了多组提示词。以悠船为例,进入页面点击开始想象按钮,粘贴提示词即可。 希望这些信息对您有所帮助。
2025-02-07
能直接输出图片的AI网站
以下是一些能直接输出图片的 AI 网站: 1. Artguru AI Art Generator:在线平台,生成逼真图像,给设计师提供灵感,丰富创作过程。 2. Retrato:AI 工具,将图片转换为非凡肖像,拥有 500 多种风格选择,适合制作个性头像。 3. Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具有细节的全新视觉作品。 4. Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计的 AI 工具,将上传的照片转换为芭比风格,效果超级好。 5. 无界 AI:一款可以在线 AI 生成图片的网站(类似 SD Online 一键出图版),网址为 https://www.wujieai.cc/ (新用户扫码注册可领取积分)。 此外,还有用于鉴别图片是否为 AI 生成的网站,如 ILLUMINARTY(https://app.illuminarty.ai/)。但需注意,AI 鉴别仍存在一些局限性。
2025-02-07
我想要搭建一个可以视频和图片识别宠物猫品种和品相的智能体
以下是为您提供的关于搭建可以视频和图片识别宠物猫品种和品相的智能体的相关信息: 目前有一种技术叫 PixelLLM,它是由 Google 开发的新型视觉语言模型。其完善后在弱视(眼疾)用户方面会有较好的应用场景。这个模型不仅能够对图片进行详细描述,还能精确指出图片中每个词汇对应的具体位置。例如,若图片中有一只猫和一只狗,PixelLLM 不仅能识别出“猫”和“狗”,还能指出它们在图片中的具体位置。这种能力使得模型在处理需要图像和文字紧密结合的任务时表现出色,比如在一张图片中找到特定的物体或区域,并对其进行描述。 主要特点包括: 1. 像素级词汇对齐:不仅能告知图片里有什么,还能准确指出这些东西在图片的具体位置。 2. 多种功能:具备多种处理图像和文字结合任务的能力。 您可以考虑基于类似的技术来搭建您所需的智能体。
2025-02-06
我想生成小红书图片和文案
以下是关于生成小红书图片和文案的相关内容: 画小二的 Coze 工作流之抖音热门视频转小红书图文详细配置: 工作流目的:将今日抖音热门视频转化为小红书的图文,输入任何行业的关键词讲视频内容转化为图文内容。 体验测试:今日抖音热门视频转小红书文案的扣子地址为 https://www.coze.cn/store/bot/7360309310729240611?bot_id=true ,2024 年 5 月 6 日晚在官方小哥哥的协助下,Bug 已修复。 测试截图。 教学视频。 工作流 Flowchart 图。 工作流结构图。 详细参数配置包括: 整体结构图。 开始模块参数配置。 Get_Video 模块参数配置。 LinkReaderPlugin 模块参数配置。 标题大模型参数配置:作为小红书爆款写作专家,需产出 3 个标题(含适当的 emoji 表情),遵循二极管标题法等规则。 内容大模型参数配置:作为小红书爆款写作专家,产出 1 篇正文(每段含适当 emoji 表情,文末有合适 tag 标签),遵循多种写作技能,文章 200 字左右。 图片 Prompt 大模型参数配置:作为绘图 Prompt 大师,将输入内容转成 AI 更容易理解的绘画 Prompt。 文生图 ImageToolPro 参数配置:在插件中搜索插件名称 Byteartist。 输出结果参数配置。 课程:如何做一门课程: 提问模板(6 个): 第一步,做课程的市场调研: 列举 10 个在中国比较受欢迎的在线网络课程的教学平台。 列举 10 个在 XXX 在线教育平台,有哪些受欢迎的、销量高的课程。 从这些销量高的课程里面,筛选出与社交媒体营销(XXX 主题)紧密相关的课程。 第二步,根据大的方向,再进行细化,选择主攻的细分领域:作为社交媒体营销(XXX 子主题)专家,设计关于社交媒体营销(XXX 子主题)的课程,选择更细化的主题。 第三步:根据细分领域的主题,生成课程大纲:根据主题设计包含课程名称、课程亮点、课程目标用户、课程章节、课程推广渠道的在线课程大纲。 第四步:针对课程大纲里面的单独小节进行提问,让 Chatgpt 总结并生成对应主题的章节内容。先针对某一个小节进行全方位提问,如写课程脚本、详细解释主题、提供案例等。
2025-02-06