直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

好用的智能扩图,改变图片比例

回答

以下为您介绍一些关于智能扩图和改变图片比例的方法:

  1. 在 Midjourney 中:
    • 不同模型有不同侧重点,如 niji 针对动漫,--v 5 对摄影类质量高,可查看官网介绍https://docs.midjourney.com/docs/model-versions
    • 设置图片比例可使用--ar 1:1,也可改成其他支持的比例。
    • 还有一些不常用设置,如--creative 更适合脑暴和创意设计,--chaos 100 或--c 100 指生成图的视觉风格,取值范围 0-100 之间,默认值 0,--stylize 1000 或--s 1000 数字越大生成图片越有艺术感,v 5 版本取值范围不同。
  2. Coze “图像流”:
    • 适合用于构图不对想改变构图的图片。
    • 节点参数是往 4 个方向扩图,只能选择扩或者不扩,不能选择扩多少像素。
    • 试用效果方面,如文生图生成方图后向左扩图会有新构图的长图效果;左边和上面同时扩图效果也不错;实景照片扩图时,扩图部位尽可能简单,不容易出现崩坏,加提示词建议简单,不建议画人之类,崩坏结果可能惨不忍睹。
  3. 【SD】ControlNet:
    • 以某张图为例讲解,先导入图生图界面。
    • 根据情况选择大模型,卡通类一般选“revAnimated”,真实类选“Realistic Vision”,效果不好可尝试其他模型。
    • 图生图重要参数包括“缩放模式”选“缩放后填充空白”,尺寸根据扩充方向调整,单批数量按需填写,“重绘幅度”加大到“0.8”以上。
    • ControlNet 设置方面,升级到最新版本,导入图片,启用插件,“控制类型”选“局部重绘”,预处理器选“inpaint_only+lama”,控制模式选“更倾向 Controlnet”,缩放模式选“缩放后填充空白”,还可增加“reference_only”通道巩固扩图风格。
    • 可通过反推提示词增加文本控制,新生成部分和原图可能有色差,需调整参数修正。
    • 记住工作流,替换图片改尺寸即可快速扩图。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

如何让生成的图片更加可控?

不是越高的版本就一定越好,其实每个不同模型的侧重点会有所不同,比如-- niji就是专门针对动漫的模型,--v 5生成的图对摄影类的质量很高。具体的详细内容,可以看看官网介绍[https://docs.midjourney.com/docs/model-versions](https://link.uisdc.com/?redirect=https%3A%2F%2Fdocs.midjourney.com%2Fdocs%2Fmodel-versions)6.设置图片比例--ar 1:1这样就设置了1:1的比例,你也可以改成其他支持的比例。7.还有一些不是很常用的设置--creative更适合做脑暴和创意设计,做出来的图脑洞更大,更有创意性--chaos 100或--c 100指的是生成图的视觉风格,数值越大,这一组的风格差异就越大。取值范围在0-100之间,默认值是0。--stylize 1000或--s 1000,数字越大,生成的图片就越有艺术感。取值范围不同版本也不同,v 5版本的范围是0-1000

基础教程: Coze “图像流” 抢先体验

这个节点适合用于构图不太对想改变构图的图片。[heading3]节点参数[content]参数分别是往4个方向扩图,只能选择扩或者不扩,不能选择扩多少像素。[heading3]试用效果[content]我们先来文生图,生成一个方图,然后向左扩图,效果如下,变成了一个新构图的长图,效果不错。再来左边和上面同时扩图,效果也不错。来个实景照片试试,比如下图虽然很美,方形构图可能不讨喜,我们来把它变成长图。实景图扩图效果粗看,尤其是天上的云很震撼,细看有些复杂的画面,完全经不起推敲💡小技巧:扩图的部位尽可能的简单,不容易出现崩坏。要加提示词的话也一样,建议加些简单的,不建议画人之类的,崩坏结果惨不忍睹举个例子,以下这个图,最简单的部位就是路面,扩图就扩路面,对于构图也加深了道路的引导线,效果还行。向下扩图后的效果,还行。

【SD】最强控制插件ControlNet(8)创成式填充

我们用这张图作为例子来讲解一下,首先将它导入到图生图界面。根据情况选择大模型,一般卡通类的选择“revAnimated”,真实类的选择“Realistic Vision”,但是也不一定,如果效果不好,可以尝试一下其他的模型。图生图中比较重要的参数,一个是“缩放模式”,选择“缩放后填充空白”;然后是尺寸,如果是横向扩充就增加宽度,如果是纵向扩充就增加高度;单批数量可以根据需求填写,增加抽卡概率;最后尽量将“重绘幅度”加大到“0.8”以上,让AI充分发挥想象。接下来是controlnet的设置,升级到最新的controlnet版本,将图片导入进来。启用插件,“控制类型”选择“局部重绘”,也就是我们之前讲到过的inpaint预处理器,然后在预处理器的下拉菜单中选择“inpaint_only+lama”,这是一个新增的预处理器,专门用于扩图。另外,控制模式选择“更倾向Controlnet”,缩放模式选择“缩放后填充空白”。为了让出图更加统一,甚至还可以再增加一个reference _only的通道,来进一步巩固扩图的风格。设置好之后,点击生成,等待结果,选择一张满意的即可。我们再试验一张图,将这张图放进图生图中。有时为了更好地控制出图,我们还可以通过反推提示词的方式,增加一些文本进行控制。这样生成的图也会受到提示词的影响,可以看出图形部分的衔接还是很自然的,但是不是每一次效果都能非常好,新生成的部分和原图可能会存在色差,需要通过调整各项参数来修正。从网上找一张建筑图,使用真实系模型来扩展一下,其他参数不变,仅需要调整尺寸,并将图片分别放入“图生图”和“controlnet”中。点击生成图片就扩展好了,只要记住这个工作流,扩图还是很快的,只要替换图片改尺寸就可以了。

其他人在问
扩图的ai工具
以下是一些常见的扩图 AI 工具: 视频放大: https://www.topazlabs.com/topazvideoai 【超级会员 V6】通过百度网盘分享的文件:Topaz 全家桶... 链接:https://pan.baidu.com/s/1bL4tGfl2nD6leugFh4jg9Q?pwd=16d1 提取码:16d1 复制这段内容打开「百度网盘 APP 即可获取」 Kraken.io:主要用于图像压缩,但也提供免费的图像放大功能,能保证图像细节清晰度。 图片放大: 本地工具放大:https://www.upscayl.org/download SD 放大:扩散模型可以增加更多细节 开源工作流: stability.ai 的 https://clipdrop.co/tools 画质增强 magnific 遥遥领先:https://magnific.ai/ Krea:https://www.krea.ai/apps/image/enhancer Image Upscaler:https://imageupscaler.com/ 佐糖:https://picwish.cn/photoenhancerapi?apptype=apsbdapi&bd_vid=8091972682159211710 腾讯 ARC:https://arc.tencent.com/zh/aidemos/humansegmentation?ref=88sheji.cn 腾讯开源的模型,能恢复老照片: https://github.com/TencentARC/GFPGAN 在线测试地址:https://replicate.com/tencentarc/gfpgan 美图老照片修复:https://www.xdesign.com/quality/?channel=sllbd90&bd_vid=11711254260543749686 Imglarger:https://imglarger.com/ Let's Enhance:https://letsenhance.io/ Waifu2x: http://waifu2x.udp.jp/ 能够提供图片的放大和降噪功能,使用深度学习技术提高图像质量,保留细节和纹理,简单易用且效果好。 Bigjpg:http://bigjpg.com/,是强大的图像分辨率增强工具,使用神经网络算法加大图像尺寸,提高图像质量,处理速度快。 Topaz Gigapixel AI:https://www.topazlabs.com/gigapixelai discord:https://discord.gg/m5wPDgkaWP GIGAGAN:https://mingukkang.github.io/GigaGAN/ Topaz Photo AI:https://www.topazlabs.com/ 此外,Deep Art Effects 是一款强大的艺术效果编辑器,通过 AI 技术能够将图像放大并赋予艺术效果,支持多种滤镜和风格,让图像更独特。RealESRGAN 是基于 RealESRGAN 的图像超分辨率增强模型,具有可选的人脸修复和可调节的放大倍数,能将低分辨率图像转换为高分辨率图像,使用深度学习模型训练,恢复更多细节和清晰度,可通过 API 在 Replicate 上运行,但用几次要收费。
2024-10-24
ai扩图工具
以下是一些常见的 AI 扩图工具: 图片放大工具: 本地工具放大:https://www.upscayl.org/download SD 放大:扩散模型可以增加更多细节 开源工作流: 开源工作流: stability.ai 的 https://clipdrop.co/tools 画质增强 magnific 遥遥领先:https://magnific.ai/ Krea https://www.krea.ai/apps/image/enhancer Image Upscaler:https://imageupscaler.com/ 佐糖:https://picwish.cn/photoenhancerapi?apptype=apsbdapi&bd_vid=8091972682159211710 腾讯 ARC https://arc.tencent.com/zh/aidemos/humansegmentation?ref=88sheji.cn 腾讯开源的模型,能恢复老照片:https://github.com/TencentARC/GFPGAN 在线测试地址:https://replicate.com/tencentarc/gfpgan 美图老照片修复:https://www.xdesign.com/quality/?channel=sllbd90&bd_vid=11711254260543749686 Imglarger:https://imglarger.com/ Let's Enhance:https://letsenhance.io/ Waifu2x:http://waifu2x.udp.jp/ 视频放大工具: https://www.topazlabs.com/topazvideoai 【超级会员 V6】通过百度网盘分享的文件:Topaz 全家桶... 链接:https://pan.baidu.com/s/1bL4tGfl2nD6leugFh4jg9Q?pwd=16d1 提取码:16d1 Kraken.io:主要用于图像压缩,但也提供了一个免费的图像放大功能。不仅能够放大图像,还能保证图像的细节清晰度。 Deep Art Effects:是一款强大的艺术效果编辑器,通过 AI 技术能够将图像放大并赋予艺术效果。它支持多种滤镜和风格,让您的图像更加独特。 RealESRGAN https://replicate.com/nightmareai/realesrgan (这个用几次要收费) 以下是一些可以绘制逻辑视图、功能视图、部署视图的工具: Lucidchart:流行的在线绘图工具,支持多种图表创建,包括逻辑视图、功能视图和部署视图,用户可使用拖放界面轻松创建架构图。 Visual Paradigm:全面的 UML 工具,提供创建各种架构视图的功能,包括逻辑视图(类图、组件图)、功能视图(用例图)和部署视图(部署图)。 ArchiMate:开源的建模语言,专门用于企业架构,支持逻辑视图的创建,可与 Archi 工具一起使用,该工具提供图形化界面创建 ArchiMate 模型。 Enterprise Architect:强大的建模、设计和生成代码的工具,支持创建多种架构视图,包括逻辑、功能和部署视图。 Microsoft Visio:广泛使用的图表和矢量图形应用程序,提供丰富模板用于创建逻辑视图、功能视图和部署视图等。 draw.io(现在称为 diagrams.net):免费的在线图表软件,允许用户创建各种类型的图表,包括软件架构图,支持创建逻辑视图和部署视图等。 PlantUML:文本到 UML 的转换工具,可通过编写描述性文本来自动生成序列图、用例图、类图等,帮助创建逻辑视图。 Gliffy:基于云的绘图工具,提供创建各种架构图的功能,包括逻辑视图和部署视图。 Archi:免费的开源工具,用于创建 ArchiMate 和 TOGAF 模型,支持逻辑视图的创建。 Rational Rose:IBM 的 UML 工具,支持创建多种视图,包括逻辑视图和部署视图。
2024-10-22
AI扩图
以下是关于 AI 扩图的相关信息: 本地工具放大:https://www.upscayl.org/download SD 放大:扩散模型可以增加更多细节 开源工作流: stability.ai 的:https://clipdrop.co/tools 画质增强 magnific 遥遥领先:https://magnific.ai/ Krea:https://www.krea.ai/apps/image/enhancer Image Upscaler:https://imageupscaler.com/ 佐糖:https://picwish.cn/photoenhancerapi?apptype=apsbdapi&bd_vid=8091972682159211710 腾讯 ARC:https://arc.tencent.com/zh/aidemos/humansegmentation?ref=88sheji.cn 腾讯开源的模型,能恢复老照片:https://github.com/TencentARC/GFPGAN 在线测试地址:https://replicate.com/tencentarc/gfpgan 美图老照片修复:https://www.xdesign.com/quality/?channel=sllbd90&bd_vid=11711254260543749686 Imglarger:https://imglarger.com/ Let's Enhance:https://letsenhance.io/ Waifu2x:http://waifu2x.udp.jp/ 以下是 AI 绘画常用的画面构图提示词: 曼茶罗构图 超广角 极端特写 微距拍摄 广阔的视野 半身像 侧面 对称的身体 对称的脸 广角 鸟瞰/俯视 俯视图 正视图 对称 居中构图 对称构图 三分法构图 S 型构图 对角线构图 水平构图 卫星视图 倾斜移位 以下是拜登签署的 AI 行政命令(2023.10.30)的相关内容: 通过国家 AI 研究资源的试点,促进美国各地的 AI 研究,为 AI 研究人员和学生提供关键的 AI 资源和数据,并扩大对医疗保健和气候变化等重要领域的 AI 研究资助。 通过为小型开发商和企业家提供技术援助和资源,帮助小企业将 AI 突破商业化,并鼓励联邦贸易委员会行使其权力,促进公平、开放和竞争的 AI 生态系统。 通过现代化和简化签证标准、面试和审查,利用现有权力扩大在关键领域具有专业知识的高技能移民和非移民在美国学习、停留和工作的能力。 推进美国在国外的领导地位 AI 的挑战和机遇是全球性的。拜登 哈里斯政府将继续与其他国家合作,支持在全球范围内安全、可靠和值得信赖地部署和使用 AI。为此,总统指示采取以下行动: 扩大双边、多边和多利益相关者的合作,以在 AI 方面进行合作。国务院将与商务部合作,领导建立强大的国际框架,以利用 AI 的好处并管理其风险并确保安全。此外,本周,副总统哈里斯将在英国首相里希·苏纳克主持的 AI 安全峰会上发表讲话。 与国际伙伴和标准组织加快重要 AI 标准的开发和实施,确保技术安全、可靠、值得信赖和可互操作。 在国外促进 AI 的安全、负责和权利肯定的开发和部署,以解决全球挑战,例如推进可持续发展和减轻对关键基础设施的危险。 确保政府负责任和有效地使用 AI
2024-10-17
我想要一个可以智能扩图的ai软件
以下为您推荐几款可以智能扩图的 AI 软件: 1. Coze “图像流”:这个节点适合用于构图不太对想改变构图的图片。例如,我们可以先文生图生成一个方图,然后向左、向左上或向下扩图。但需要注意的是,扩图的部位尽可能简单,比如路面,不容易出现崩坏。如果要加提示词,建议加些简单的,不建议画人之类的,否则崩坏结果可能惨不忍睹。 2. PS beta:拥有很强的图片理解力,在擦除和扩图方面表现出色,不需要填入任何关键词,指哪打哪。对于多手指、缺手指或手废了等情况都有相应的处理方法。 3. Magnific AI:其相关模型下载、Replicate 接口、原贴地址等信息如下: Replicate 接口:https://replicate.com/philipp1337x/multidiffusionupscaler 原贴地址: 更多放大工具和方法您还可以参考:
2024-09-25
ai扩图
以下是关于 AI 扩图的相关信息: 本地工具放大:https://www.upscayl.org/download SD 放大:扩散模型可以增加更多细节 开源工作流: stability.ai 的:https://clipdrop.co/tools 画质增强: https://magnific.ai/ https://www.krea.ai/apps/image/enhancer https://imageupscaler.com/ https://picwish.cn/photoenhancerapi?apptype=apsbdapi&bd_vid=8091972682159211710 腾讯 ARC:https://arc.tencent.com/zh/aidemos/humansegmentation?ref=88sheji.cn 腾讯开源的模型,能恢复老照片: https://github.com/TencentARC/GFPGAN 在线测试地址:https://replicate.com/tencentarc/gfpgan 美图老照片修复:https://www.xdesign.com/quality/?channel=sllbd90&bd_vid=11711254260543749686 https://imglarger.com/ https://letsenhance.io/ http://waifu2x.udp.jp/ 关于 AI 图像中的“diffusion”(扩散): 在 AI 图像生成中,“diffusion”通常指的是一类生成模型,称为扩散模型(Diffusion Models)。这类模型通过逐步引入噪声到数据中,并训练网络学习逆向过程来生成数据。扩散模型在图像生成领域中应用广泛,特别是在文本到图像的生成任务中表现出色。 扩散模型的工作原理可以概括为以下几个步骤: 1. 正向扩散过程:向图像逐渐添加高斯噪声,直到图像完全无法识别,这个过程可以被形式化为顺序扩散马尔可夫链。 2. 潜空间表示:将图像压缩到低维的潜在空间(Latent Space)中,以减少计算量和提高生成速度。 3. 学习逆向过程:训练一个神经网络来预测每一步中噪声的分布,并逐步去除噪声,从而恢复出清晰的图像。 4. 文本到图像的生成:结合文本编码器和图像解码器,根据文本描述生成相应的图像。 扩散模型的关键优势在于其生成高质量的图像的能力,以及相比其他生成模型(如 GANs)在计算效率和稳定性上的优势。Stable Diffusion 等模型就是基于扩散模型的文本到图像生成工具,它们能够根据文本提示生成逼真的图像。
2024-08-14
ai扩图
以下是关于 AI 扩图的相关信息: 本地工具放大:https://www.upscayl.org/download SD 放大:扩散模型可以增加更多细节 开源工作流: stability.ai 的:https://clipdrop.co/tools 画质增强: https://magnific.ai/ https://www.krea.ai/apps/image/enhancer https://imageupscaler.com/ https://picwish.cn/photoenhancerapi?apptype=apsbdapi&bd_vid=8091972682159211710 腾讯 ARC:https://arc.tencent.com/zh/aidemos/humansegmentation?ref=88sheji.cn 腾讯开源的模型,能恢复老照片: https://github.com/TencentARC/GFPGAN 在线测试地址:https://replicate.com/tencentarc/gfpgan 美图老照片修复:https://www.xdesign.com/quality/?channel=sllbd90&bd_vid=11711254260543749686 Imglarger:https://imglarger.com/ Let's Enhance:https://letsenhance.io/ Waifu2x:http://waifu2x.udp.jp/ ,Waifu2x 能够提供图片的放大和降噪功能,通过使用深度学习技术可以提高图像的质量,同时保留细节和纹理。它简单易用且效果非常好。 关于 AI 图像中的“diffusion”(扩散): 在 AI 图像生成中,“diffusion”(扩散)通常指的是一类生成模型,称为扩散模型(Diffusion Models)。这类模型通过逐步引入噪声到数据中,并训练网络学习逆向过程来生成数据。扩散模型在图像生成领域中应用广泛,特别是在文本到图像的生成任务中表现出色。 扩散模型的工作原理可以概括为以下几个步骤: 1. 正向扩散过程:向图像逐渐添加高斯噪声,直到图像完全无法识别,这个过程可以被形式化为顺序扩散马尔可夫链。 2. 潜空间表示:将图像压缩到低维的潜在空间(Latent Space)中,以减少计算量和提高生成速度。 3. 学习逆向过程:训练一个神经网络来预测每一步中噪声的分布,并逐步去除噪声,从而恢复出清晰的图像。 4. 文本到图像的生成:结合文本编码器和图像解码器,根据文本描述生成相应的图像。 扩散模型的关键优势在于其生成高质量的图像的能力,以及相比其他生成模型(如 GANs)在计算效率和稳定性上的优势。Stable Diffusion 等模型就是基于扩散模型的文本到图像生成工具,它们能够根据文本提示生成逼真的图像。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-08-07
我想请教一些问题 1:目前有哪些AI教育类产品 2:目前有哪些AI辅助学习类产品 3:有哪些AI辅助学习的好用的方法
以下是关于您所提出问题的回答: 目前的 AI 教育类产品和 AI 辅助学习类产品有: 语言学习方面:Speak、Quazel、Lingostar 等是由 AI 驱动的语言老师,能够实时交流并给予发音或措辞反馈;Grammarly 可进行英语写作和语法纠错。 数学学习方面:Photomath、Mathly 可指导学生解决数学问题;Khan Academy 有自适应学习系统。 综合学习方面:Duolingo 是自适应学习平台,能为用户提供个性化学习内容和练习。 AI 辅助学习的好用方法包括: 英语学习:利用智能辅助工具如 Grammarly 改进写作和语法;通过语音识别应用如 Call Annie 练习口语和纠正发音;使用自适应学习平台如 Duolingo 获得个性化学习计划;借助智能对话机器人如 ChatGPT 进行会话练习。 数学学习:运用自适应学习系统如 Khan Academy 获取精准推荐;使用智能题库和作业辅助工具如 Photomath 获得问题解答和解题步骤;借助虚拟教学助手如 Socratic 解答问题、观看教学视频和获得答疑服务;参与交互式学习平台如 Wolfram Alpha 进行数学建模和问题求解。
2024-11-12
好用的图片无损高清放大
以下是关于图片无损高清放大的相关内容: 图像修复放大的流程分为三部分: 1. 图像输入:添加 Load Image 节点加载图像,不建议上传大分辨率图片,因其处理时间长。 2. 图像高清修复:使用 Iceclear/StableSR 等模型进行高清修复并 2 倍放大,提示词应包含想要达到的目的内容,如正向:(masterpiece),(best quality),(realistic),(very clear),反向:3d,cartoon,anime,sketches,(worst quality),(low quality)等。全程采取两次高清修复,第一次修复原始图像分辨率并放大。 3. 图像高清放大:针对第一次放大修复后的图像进行二次修复,用 realisticVision 底膜,使用提示词反推 node 对图像进行画面提示词提取,搭配 tile ControlNet 提升画面细节感,用合适的高清放大模型进行二次放大。 【SD】超清无损放大器 StableSR: 作者为白马少年,发布于 2023 年 6 月 10 日 20:01,原文网址:https://mp.weixin.qq.com/s/J0HIF2U1siAen6FWNA67A 。 之前讲过在 Stable Diffusion 中绘制高清大图的方式,主要用到“脚本”和“后期处理”,其中脚本以“Ultimate SD upscale”为主,会改变原图细节;“后期处理”是 Stable Diffusion 自带的扩图功能,适用于所有图片,可按原图内容扩图,但无法还原原图不清晰的地方。 今天讲的 StableSR 可算作“后期处理”的上位替代品,能在尽可能保留原图的情况下更精致地还原原图。安装方式:在扩展面板中搜索 StableSR 直接安装,或将下载好的插件放在“……\\sdwebuiakiv4\\extensions”文件夹下,安装完成后重启 webUI 即可在脚本中找到。 修复需使用 StabilityAI 官方的 Stable Diffusion V2.1 512 EMA 模型,放入 stablediffusionwebui/models/StableDiffusion/文件夹;StableSR 模块(约 400M 大小)放入 stablediffusionwebui/extensions/sdwebuistablesr/models/文件夹;VQVAE(约 750MB 大小)放在 stablediffusionwebui/models/VAE 中。 测试:用一张网上找的分辨率为 512x768 的神仙姐姐照片,“Ultimate SD upscale”脚本放大哪怕重绘幅度只开到 0.1,人物细节有变化但磨皮严重,重绘幅度开到 0.4 则变化很大;“后期处理”放大 3 倍,眼神变锐利但头发仍模糊;StableSR 放大时,先调整大模型和 VAE,打开脚本下拉选择“StableSR”,模型选择对应模型,放大倍数为 3,勾选“pure noise”。
2024-11-12
AI数字人工具,哪个好用?
以下是一些好用的 AI 数字人工具: 1. HeyGen:AI 驱动的平台,能创建逼真的数字人脸和角色,使用深度学习算法生成高质量肖像和角色模型,适用于游戏、电影和虚拟现实等应用。 2. Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:提供 AI 拟真人视频产品服务和开发,上传人像照片和输入内容,平台的 AI 语音机器人能自动转换成语音并合成逼真的会开口说话的视频。 此外,还有以下相关工具: 1. MakeACharacter:一键生成 3D 数字人,可自定义面部特征,生成逼真 3D 角色,基于真实人类扫描数据,使用 Unreal Engine 渲染,支持中英文提示,兼容多个行业应用。 2. Rodin Gen1:拥有 1.5B 参数,可实现 3Dto3D 生成,生成 3D 模型及物理基础渲染材质,支持 3D LoRA 技术。 在算法方面,开源代码仓库有: 1. ASR 语音识别:openai 的 whisper(https://github.com/openai/whisper)、wenet(https://github.com/wenete2e/wenet)、speech_recognition(https://github.com/Uberi/speech_recognition)。 2. AI Agent:大模型包括 ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等。Agent 部分可使用 LangChain 的模块自定义(https://www.langchain.com/)。 3. TTS:微软的 edgetts(https://github.com/rany2/edgetts),只能使用预设人物声音,目前接口免费;VITS(https://github.com/jaywalnut310/vits)及其分支版本;sovitssvc(https://github.com/svcdevelopteam/sovitssvc),专注于唱歌。 请注意,这些工具的具体功能和可用性可能会随时间和技术发展而变化。在使用时,请确保遵守相关使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42
2024-11-11
有没有国内网络能打开的免费好用的美术类AI工具?
以下为您推荐国内网络能打开的免费好用的美术类 AI 工具: 1. 扣子 + ByteArtist 网址:https://www.coze.cn/home 优点:不需要翻墙,无收费,可以直接生成 注册:手机号、抖音号或飞书号 操作步骤:需要在 coze 的 bot 里面添加绘图插件 时间:5min 2. 无界 AI 网址:https://www.wujieai.cc/ 优点:国内网络即可稳定使用,有免费出图点数,支持中文关键词输入,无需额外下载风格模型,可直接取用 希望这些工具能满足您的需求。
2024-11-11
国内免费的好用的AI有哪些
以下是一些国内免费且好用的 AI 产品: 1. Kimi 智能助手:是一个有着超大“内存”的智能助手,可以一口气读完二十万字的小说,还会上网冲浪,由 Moonshot AI 出品。不用科学上网、不用付费、支持实时联网,是国内最早支持 20 万字无损上下文的 AI,也是目前对长文理解做得最好的 AI 产品。能一次搜索几十个数据来源,无广告,能定向指定搜索源(如小红书、学术搜索)。PC 端:https://kimi.moonshot.cn/?utm_campaign=TR_LgLmkEor&utm_content=&utm_medium=%E7%BD%91%E7%AB%99&utm_source=CH_tpOYmtV1&utm_term= ;移动端 Android/ios:https://kimi.volctrack.com/a/E3w3Q1xa 。 2. 文心一言:百度出品的 AI 对话产品,定位是智能伙伴,能写文案、想点子,又能陪你聊天、答疑解惑。 3. 通义千问:由阿里云开发的聊天机器人,能够与人交互、回答问题及协作创作。 4. 可灵:由快手团队开发的 AI 应用,主要用于生成高质量的图像和视频,生成的图像质量非常高。最初采用内测邀请制,现在已向所有用户开放使用。但价格相对较高,对于重度用户,最高档的年费可能达到几千元人民币,若临时或轻度使用,有每日免费点数和 60 多元单月的最便宜包月选项。 5. 通义万相:作为国产 AI 工具,在中文理解和处理方面表现出色,用户可从多种艺术风格和图像风格中选择,生成的图像质量较高、细节丰富,操作界面简洁直观、用户友好度高,且能与阿里其他产品和服务无缝整合。重点是现在免费,每天签到获取灵感值即可。但为符合国内监管要求,某些类型的图像可能无法生成,在处理非中文语言或国际化内容方面可能不如一些国际 AI 图像生成工具出色,处理多元文化内容时可能存在偏差。 内容由 AI 大模型生成,请仔细甄别。
2024-11-10
有哪些好用的excel數據分析AI
以下是一些好用的 Excel 数据分析 AI 工具: 1. Excel Labs:这是一个 Excel 插件,基于 OpenAI 技术,新增了生成式 AI 功能,允许用户在 Excel 中利用 AI 进行数据分析和决策支持。 2. Microsoft 365 Copilot:微软推出的 AI 工具,整合了多种办公软件,用户通过聊天形式告知需求,Copilot 会自动完成如数据分析等任务。 3. Formula Bot:提供数据分析聊天机器人和公式生成器两大功能,用户可通过自然语言交互进行数据分析和生成 Excel 公式。 4. Numerous AI:支持 Excel 和 Google Sheets 的 AI 插件,能生成公式、相关文本内容、执行情感分析、语言翻译等任务。 此外,用 ChatGPT 做数据分析时,可利用以下工具: 1. Excel:写公式算进阶用法,还可写 Excel 宏,ChatGPT 能根据需求和描述写出可用的 Excel 宏。 2. Python:有很多强大的数据分析库,如 pandas、numpy 等,绘图库有 seaborn、plotly、matplotlib 等。 以下是一些推荐的 text2sql 相关的 AI 工具及其链接: 1. Text2SQL 将英文转换为 SQL 查询。 链接:https://toolske.com/text2sql/?ref=theresanaiforthat 2. ai2sql 高效且无错误的 SQL 构建器。 链接:https://www.ai2sql.io/ 3. EverSQL 从 SQL 查询翻译英文文本。 链接:https://www.eversql.com/sqltotext/ 4. SupaSQL 从 NLP 生成 SQL 查询。 链接:https://supasql.com/ 5. SQLgenius 使用自然语言的 SQL 查询生成器。 链接:https://sqlgenius.app/ 6. SQL Chat 与数据库进行自然语言聊天的 SQL 客户端。 链接:https://www.sqlchat.ai/ 7. SQL Ease 从自然语言输入生成 SQL 查询。 链接:https://sqlease.buildnship.in/ 8. Talktotables 翻译和查询数据库。 链接:https://talktotables.com/ 建议查看以下几个知名的 text2sql 项目: 1. SQLNet 一个使用深度学习方法解决 text2sql 任务的项目。 2. Seq2SQL 一个将自然语言转换为 SQL 查询的序列到序列模型。 3. Spider 一个大规模的 text2sql 数据集及其相关的挑战。 内容由 AI 大模型生成,请仔细甄别。
2024-11-07
城市智能停车服务系统建设方案
很抱歉,目前知识库中没有关于城市智能停车服务系统建设方案的相关内容。但一般来说,建设城市智能停车服务系统可以从以下几个方面考虑: 1. 需求分析:了解城市的停车需求、现有停车设施状况以及存在的问题。 2. 技术选型:选择适合的传感器、通信技术、数据库管理系统等。 3. 系统设计:包括车位监测与管理、用户端应用设计、后台管理系统等。 4. 数据采集与处理:准确采集车位使用情况等数据,并进行有效的处理和分析。 5. 支付与计费系统:提供便捷的支付方式,并制定合理的计费规则。 6. 与其他系统的集成:如交通管理系统、城市规划系统等。 7. 安全与隐私保护:确保系统的安全性和用户数据的隐私。 8. 维护与升级:定期对系统进行维护和升级,以适应不断变化的需求。 以上只是一个初步的框架,具体的建设方案需要根据城市的实际情况进行详细的规划和设计。
2024-11-12
智能体
智能体(Agent)在人工智能和计算机科学领域是一个重要概念,指能够感知环境并采取行动以实现特定目标的实体,可以是软件程序或硬件设备。 智能体的定义: 智能体是自主系统,通过感知环境(通常借助传感器)并采取行动(通常通过执行器)来达成目标。在 LLM 支持的自主 Agent 系统中,LLM 充当 Agents 的大脑,并包含以下关键组成部分: 规划 子目标和分解:将大型任务分解为更小、可管理的子目标,以有效处理复杂任务。 反思和完善:对过去行为进行自我批评和反思,从错误中吸取教训,完善未来步骤,提高最终结果质量。 记忆 短期记忆:利用模型的短期记忆进行上下文学习。 长期记忆:通过外部向量存储和快速检索实现长时间保留和回忆(无限)信息。 工具使用:学习调用外部 API 获取模型权重中缺失的额外信息,包括当前信息、代码执行能力、对专有信息源的访问等。 智能体的类型: 智能体可根据复杂性和功能分为以下几种类型: 简单反应型智能体(Reactive Agents):根据当前感知输入直接行动,不维护内部状态,不考虑历史信息。例如温控器,根据温度传感器输入直接控制加热器。 基于模型的智能体(Modelbased Agents):维护内部状态,对当前和历史感知输入建模,能推理未来状态变化并据此行动。例如自动驾驶汽车,不仅感知当前环境,还维护和更新周围环境模型。 目标导向型智能体(Goalbased Agents):具有明确目标,能根据目标评估不同行动方案并选择最优行动。例如机器人导航系统,有明确目的地并规划路线以避障。 效用型智能体(Utilitybased Agents):不仅有目标,还能量化不同状态的效用值,选择效用最大化的行动,评估行动优劣并权衡利弊。例如金融交易智能体,根据市场条件选择最优交易策略。 学习型智能体(Learning Agents):能通过与环境交互不断改进性能,学习模型、行为策略以及目标函数。例如强化学习智能体,通过与环境互动不断学习最优策略。 此外,智能体还应用于情绪主题角色扮演小游戏,来源于 Cathy 教练和 Leah 老师的情绪力手册,帮助家长和孩子从源头了解、分辨、分析、处理和控制情绪,包含需求分析、分步实现需求、提示词编写测试、GPTs 使用链接和总结等内容。
2024-11-12
智能体如何拥有唱歌功能
要让智能体拥有唱歌功能,需要从多个方面进行设计和构建: 1. 基础信息设定:包括智能体的姓名、性别、年龄和职业等,为后续功能设计提供基础。 2. 背景和经历考量:这些因素与基础信息相互影响,决定了智能体的基本特征,例如一个有特定背景和经历的智能体可能对唱歌有独特的喜好和追求。 3. 兴趣爱好规划:如果设定智能体特别喜欢唱歌,这可能会影响其长期规划,比如梦想成为专业歌手。 4. 性格和价值观塑造:这两者会影响智能体在唱歌方面的表现和追求,以及与唱歌相关的人际关系和社交行为。 此外,在技术实现上,需要强大的语音合成和音乐生成技术支持,以模拟真实的唱歌效果。同时,还需要不断优化和训练,以提高唱歌功能的质量和表现力。
2024-11-12
AI agent和智能体有什么区别
AI agent 和智能体在以下方面存在区别: 1. 概念侧重点:AI agent 更强调作为数字人的大脑,拥有记忆模块等,以实现更真实的交互;智能体则被视为智能的最小单元,是可以设定目标后主动完成任务的。 2. 能力构成:AI agent 主要通过接入大语言模型,并结合工具、记忆、行动、规划等能力来发挥作用;智能体不仅具备推理能力,还能执行全自动化业务,但目前许多相关产品仍需人类参与。 3. 实现方式:AI agent 目前行业里主要通过如 langchain 框架,在 prompt 层和工具层完成设计,将大模型与工具进行串接;智能体在实现上可能涉及更多复杂的技术和逻辑。
2024-11-12
有没有能够按照给定的文件出考试题的智能体或者网站或者AI
以下是一些能够按照给定文件出考试题的智能体、网站或 AI 相关的信息: 很多 AI 网站都可以创建“智能体”,您可以为其提供配置信息(提示词)、知识库、能力配置等,让它们为您工作,例如出试题。 像 Perplexity 这样的平台,具有付费、高质量的特点。 利用 Kimi.ai 也可以实现用 AI 出测验题,提升的办法如出 20 道,挑几道出来改改,或者让 AI 根据量规自动评分。 在使用这些工具时,想让 AI 做好,首先您得会做,比如把大模型当作大学生或“实习生”,需要您指明方向,拆解任务,教其一步一步操作,像导演一样编排具体流程,检查结果,修改流程,反复迭代。提示语的核心是逻辑,要将复杂任务拆分成科学合理的步骤,并且让前面每一步的结果都成为后面步骤的基础。 另外,对于 GPT 类的工具,您可以预先把咒语(prompts)写好,像编程一样把要求 AI 操作的步骤写得非常详细,以后每次拿过来直接就用。建议找个空闲日,将自己的日常工作列出来,寻找哪些工作部分可以被 AI 加速,哪些工作基本上是固定输入输出的,并尝试把这些工作场景写成“智能体”,不断迭代优化。
2024-11-11
搭建个人知识库,请推荐的免费人工智能软件
以下为您推荐一些可用于搭建个人知识库的免费人工智能软件: 1. AnythingLLM:包含所有 Open WebUI 的能力,额外支持选择文本嵌入模型和向量数据库。安装地址:https://useanything.com/download 。安装完成后需进行配置,主要分为三步:选择大模型、选择文本嵌入模型、选择向量数据库。在 AnythingLLM 中可创建独有的 Workspace 与其他项目数据隔离,包括创建工作空间、上传文档并进行文本嵌入、选择对话模式(Chat 模式会综合给出答案,Query 模式仅依靠文档数据给出答案),配置完成后可进行测试对话。 2. Coze 或 FastGPT 等工具可搭建知识库,但当下其 RAG 能力仅对问答场景友好,复杂企业级知识库场景可能需要专业团队,收费几万到几十万不等。若想使用专门搭建个人知识库的软件,可参考文章 ,忽略本地部署大模型环节,直接看其中推荐的软件。 此外,还有一些相关工具和方法: 用通义听悟整理录音笔记:https://tingwu.aliyun.com 用 React 实现选中即解释 定义提示语提取有用信息:https://memo.ac/zh/ 开源免费屏幕录制工具 OBS,下载地址:https://obsproject.com/ Mac 用 Downie,Windows 推荐 IDM 淘宝数码荔枝店购买 用 losslessCut 快速切块:https://github.com/mifi/losslesscut 希望这些信息对您有所帮助。
2024-11-11
ai生成图片
以下是关于如何判断一张图片是否为 AI 生成的相关内容: 首先,要培养鉴别 AI 生成图片的技能,需要训练自己的大脑模型。对于不善于此的朋友,可以借助一些网站,如 ILLUMINARTY(https://app.illuminarty.ai/),通过对大量图片数据的抓取和分析来给出画作属性的判断可能性。但在测试中可能存在问题,比如结构严谨的真实摄影作品可能会被误判为 AI 作图,这是因为鉴定 AI 自身的逻辑算法不能像人类一样综合考虑各种不符合逻辑的表现。 此外,还可以通过画面风格、物品 bug 等细节来辨别。就在我们总结这些方法的同时,AI 也在飞速修正作图 bug,所以这些方法可能随时失效。 我们曾在小红书、B 站等自媒体平台上以“ AIGC 鉴别”为话题发布图文,让大家判别真迹与 AI 仿品。在这个过程中发现,大家对判断哪幅图是 AI 生成的往往有一种直觉感受,但进一步询问如何看出时,多半难以迅速给出一套章程来描述或解释。所以我们系统地总结了“AIGC 鉴别”经验帖,帮助大家学会如何一眼盯真,两眼打假。
2024-11-12
幻海映月字体设计文字生成图片
以下是关于幻海映月字体设计文字生成图片的相关内容: Ideogram 2.0 工具教程: 1. 生成图像设置:将魔法提示设置为“关闭”,使用模型 v2.0。 2. 字体版权问题:Ideogram 的 AI 在生成图像时并非使用真实字体,而是通过学习大量文字图像及其外观和风格来生成类似特定风格或字体的文字。 3. 字体生成错误处理: 多次重新生成提示,看是否得到想要的文本。 使用编辑器修改文本、添加或删除部分,然后重新混合图像。 将较长、较复杂的单词更改为较短的同义词。 上传包含所需文本的图像,作为重新混合创建图像的起点和合成源。 4. 版本选择:使用 0.2 或 1.0 版本可能会更稳定。
2024-11-11
有什么特别好的AI识别图片的大模型API
以下是一些关于 AI 识别图片的大模型 API 相关的信息: 学习笔记《【这就是 ChatGPT】了解原理让大语言模型 AI 成为你的打工人》中提到,对于识别印刷体图片,会先将图片变成黑白、调整大小为固定尺寸,然后与数据库中的内容进行对比得出结论。但这种基于规则的方法存在多种局限,而神经网络专门处理未知规则的情况,在图片识别中具有优势。 搭建 OneAPI 可以汇聚整合多种大模型接口,方便后续更换使用各种大模型。 0 基础手搓的“AI 拍立得”概念旨在简化操作流程,提升效率。用户可以选择拍摄场景类型并立即拍照,AI 会自动识别和分析照片中的内容信息,依据预设场景规则迅速生成符合情境的反馈。其实现场景包括图片转成文本和图片转绘图片等。例如,图片转成文本时,大模型会根据选择的场景生成与内容相关的文字描述或解说文本。
2024-11-11
我希望用即梦来生成一张图片,我想要实现的效果是:空中有悬浮的大理石加金子材质的悬浮台。请协助我生成提示词
以下是为您生成的使用即梦生成空中悬浮的大理石加金子材质悬浮台图片的提示词相关步骤: 1. 工具选择:即梦、可灵、Runway、Suno、剪映。 即梦:是最简单易用的图片重绘工具,云端访问且无需付费。 可灵:具有极强的运动笔刷控制力。 Runway:能很好地实现泼墨和画面上色。 Suno:可尝试新的使用视频制作歌曲的效果。 2. 即梦使用步骤: 使用即梦的图片生成功能,上传同一张图片 2 次,一次选择边缘轮廓,一次选择人物姿势(或者单独使用边缘轮廓也可以)。 在此场景下,不要添加景深,否则会出现“文物感”效果,而非所需的写实风。 可稍微提升精细度,由于原图是竖版,选择竖版切割,所得图片更适合用作首尾帧。 3. Runway 提示词:Static shot:colorful paint splashed onto canvas,transforming into a vibrant,lifelike display 4. 可灵提示词:一个帅气地老头从鹿背上跳下来,释放法术,漂浮在空中,非常自信,非常帅气。鹿向左走出了画面(鹿没有走出画面,但漂浮效果不错,决定不再抽卡,保留这个版本)。 希望这些信息对您有所帮助。
2024-11-10
用AI怎么制作美女图片
以下是关于用 AI 制作美女图片以及判断图片是否为 AI 生成的相关内容: 用 AI 制作美女图片: 使用 AI 工具绘制好看的人像需要弥补相关知识。例如,麦橘的工作流包括使用聚片等工具进行微调,出图时要进行选择,且要有后期修图的思路。关键是要在脑海中形成对人体结构和妆容效果的概念,追求极致效果需要在细节处进行细化。此外,麦乐园举办了 AI 人像设计比赛,旨在发掘大家在 AI 人像方面的技能,并为优秀者提供机会。 判断一张图片是否 AI 生成: 1. 依赖艺术知识储备:对于名画,如果熟悉其风格、画质与笔触的表现力,能调用基础知识储备做出判断。 2. 细节决定成败:单纯判断一幅作品是否出自 AI 算法时,往往是“细节决定成败”。比如,在某些 AI 生成的图片中,人物主体的肢体可能存在异常,或者在特定风格的图片中,如穆夏的作品,真迹才能表现出严谨连续的背景花纹和顺次排列的底纹文字信息。 3. 参考著名画家的风格:列宾、穆夏等艺术史上著名画家的作品风格鲜明突出,很适合用作 AI 生图的风格参考。例如,基于列宾的真迹“伏尔加河上的纤夫”,让 AI 生成了相关仿画;挑选穆夏的代表作生成了多幅仿画。
2024-11-10