直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

有没有什么AI工具可以帮助照片调整统一风格呢

回答

以下是一些可以帮助照片调整统一风格的 AI 工具:

  1. Stable Diffusion:可以通过 cutoff 插件来控制颜色,做到颜色与内容的统一。不了解这款插件的朋友可以参照文章——【Stable Diffusion】告别提示词颜色污染!Cutoff 插件
  2. Midjourney v6 版本:提供“风格一致性”的功能,用户给 mj 输入一幅图像,mj 根据这幅图像的风格进行创作,比如素描风、油画风等。(此处指路MJ 关键词库魔法咒语
  3. PASD 图像处理工具:开源,可实现图像超分辨率和个性化风格化,能用于图像修复、风格转换和上色,适用于旧照片恢复、艺术风格创作等。其链接为:https://github.com/yangxy/PASD
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

【SD】用AI给老照片上色,岁月不改它模样

为了做到颜色与内容的统一,我启用了之前讲到过的一款cutoff插件来进行控制,依次按顺序设置好颜色提示词,不了解这款插件的朋友可以参照我这篇文章——[【Stable Diffusion】告别提示词颜色污染!Cutoff插件](http://mp.weixin.qq.com/s?__biz=MzkzMzIwMDgxMQ==&mid=2247487436&idx=1&sn=dba5cf7a170223deda6a706fa2e14f6b&chksm=c2515908f526d01eae402083a7f93e4c5c7dca057693a25847bb8e97929c875617777cbb9721&scene=21#wechat_redirect)。终于得到了一张配色正确的照片,但是还没有完,由于以前的照片像素比较低,接下来我准备将它变得更高清一点。

MJ应用篇 用sref/cref定制你的专属ai写真

Midjourney v6版本提供“风格一致性”的功能,换句话说就是:用户给mj输入一幅图像,mj根据这幅图像的风格进行创作,比如素描风啦、油画风啦等等(此处指路[MJ关键词库魔法咒语](https://qa3dhma45mc.feishu.cn/wiki/TgSrwwey6ipqxJkoaO3cnlIDn0f))

XiaoHu.AI日报

🔔 Xiaohu.AI日报「12月26日」 ✨✨✨✨✨✨✨✨1⃣️📚 ComfyUI教程知识库:为学习ComfyUI提供全面资源。包含丰富的教程和指南。https://comflowy.com/zh-CN🔗 https://x.com/xiaohuggg/status/1739571475085193432?s=202⃣️🔍微软PromptBench工具库:专为评估大型语言模型设计。提供创建提示、进行数据集和模型加载、对抗性提示攻击等工具。支持研究人员全面分析和评估LLMs。🔗 https://x.com/xiaohuggg/status/1739565076447891784?s=203⃣️🖼️ PASD图像处理工具:开源,实现图像超分辨率和个性化风格化。可用于图像修复、风格转换和上色。适用于旧照片恢复、艺术风格创作等。🔗 https://github.com/yangxy/PASD🔗 https://x.com/xiaohuggg/status/1739516745982062732?s=204⃣️🤖 @tsarnick开发的机器人Rob:结合了GPT-4V,通过镜子测试。包含Raspberry Pi、电池、伺服电机等。通过OpenAI API响应问题,并利用摄像头“看”周围世界。

其他人在问
制作图片的AI工具,名字好像叫comfyUI
ComfyUI 是一个基于节点流程式的 stable diffusion AI 绘图工具 WebUI。 其优势包括: 1. 对显存要求相对较低,启动和出图速度快。 2. 生成自由度更高。 3. 可以和 webui 共享环境和模型。 4. 能搭建自己的工作流程,可导出并分享,报错时能清晰定位错误。 5. 生成的图片拖进后会还原整个工作流程,模型也会选择好。 劣势在于: 1. 操作门槛高,需要清晰的逻辑。 2. 生态不如 webui 丰富,但有针对其开发的有趣插件。 您可以从 github 上下载作者部署好环境和依赖的整合包,按照官方文档安装,官方链接为:https://github.com/comfyanonymous/ComfyUI 。 此外,有人认为如果 contornet 让 AI 绘画从玩具变成工具,那 ComfyUI 就是制作工具的工具。同时,藏师傅介绍了用 ComfyUI 三步制作任意公司周边图片的流程,整个流程分为获取 Logo 图片的描述、根据描述和生成意图生成图片提示词、将图片和提示词输入 ComfyUI 工作生成。
2024-11-23
最新的AI资讯
以下是为您提供的最新 AI 资讯: 新手学习 AI 方面:AI 是快速发展的领域,新的研究成果和技术不断涌现。您可以关注 AI 领域的新闻、博客、论坛和社交媒体,保持对最新发展的了解。考虑加入 AI 相关的社群和组织,参加研讨会、工作坊和会议,与其他 AI 爱好者和专业人士交流。 AIGC Weekly 32 方面: Netflix 列出了一个年薪 90 万美元的机器学习平台产品经理的 AI 产品工作岗位: Shopify 的 AI 助手现已上线。Sidekick 是一个帮助机器人,它知道如何在 Shopify 中执行任何操作提取相关数据、操作新功能或创建报告: Artifact(Ins 创始人做的 AI 新闻浏览软件)推出了自定义内容阅读语音的功能: OpenAI、谷歌、微软和 Anthropic 组建了前沿模型论坛,主要目的是确保 AI 模型的安全发展: Open AI 悄咪咪下线了他们的 ChatGPT 生成内容的检测器: 2024 人工智能报告方面: 全球芯片出口管制下,中国仍成重要市场。美国商务部长吉娜·雷蒙多警告英伟达,中国在美芯片制造商中所占的份额正在减少。字节跳动通过美国的甲骨文租用 NVIDIA H100 访问权限,而阿里巴巴和腾讯则与 NVIDIA 就在美国建立自己的数据中心进行谈判。与此同时,谷歌和微软直接向中国大型企业推销他们的云服务。 模型变得更便宜了。以前认为提供强大模型的成本过高,但现在提供这些模型的推断成本正在下降。OpenAI 更达到 100 倍下降!Google Gemini 生产了一种具有很强竞争力的定价系列!Gemini 1.5 Pro 和 1.5 Flash 的价格在推出后几个月内下降了 64%86%,而性能强劲,例如 Flash8B 比 1.5 Flash 贵 50%,但在许多基准测试中表现相当。注意:价格适用于<128K 令牌提示和输出。检索日期为 2024 年 10 月 4 日。考虑到计算成本很高,模型构建者越来越依赖与大型科技公司建立合作伙伴关系。反垄断监管机构担心这将进一步巩固现有公司的地位。
2024-11-23
那个文生视频或图生视频的AI可以生成融合变化的效果
以下是关于文生视频或图生视频的 AI 生成融合变化效果的相关信息: 在人工智能技术迅速发展的当下,AI“词生卡”技术兴起,它将文字描述转化为视觉图像,重塑了创意产业格局。AI 的多模态输出能力已基本成型,包括文生文、文生图、文生码、文生视频、图生视频等,但大多在某个维度能力强,跨界融合还不够。 从生成方式分类,AI 视频生成包含: 1. 文生视频、图生视频,如 Runway、Pika labs、SD + Deforum、SD + Infinite zoom、SD + AnimateDiff、Warpfusion、Stability Animation 等。 一些热门产品如 Luma AI,其 Dream Machine 目前支持 txt2vid 文生视频和 img2vid 图生视频两种能力,8 月底最新发布的 Dream Machine 1.5 增强了提示词理解能力和视频生成能力。Luma AI 的 img2vid 生成效果在多方面表现出色,如生成时长较长、运动幅度大、能产生相机多角度位移、运动过程一致性保持较好、分辨率高且有效改善模糊感等。
2024-11-23
怎么用ai制作由人变成动物的视频
以下是使用 AI 制作由人变成动物视频的方法: 一、创建视频内容 1. 准备内容 先准备一段视频中播放的内容文字,可以是产品介绍、课程讲解、游戏攻略等任何您希望推广让大家了解的文字。 您也可以利用 AI 来生成这段文字。 2. 制作视频 使用剪映 App 对视频进行简单处理。电脑端打开剪映 App,点击“开始创作”。 选择顶部工具栏中的“文本”,点击默认文本右下角的“+”号,为视频添加一个文字内容的轨道。 在界面右侧将准备好的文字内容替换默认文本内容。 二、生成数字人 1. 生成数字人 在剪映右侧窗口顶部,打开“数字人”选项,选取一位免费且适合的数字人形象,如“婉婉青春”。 选择数字人形象时,软件会播放其声音,可判断是否需要,点击右下角“添加数字人”,软件会根据提供的内容生成对应音视频并添加到当前视频轨道中。 左下角会提示渲染完成时间,完成后可点击预览按钮查看效果。 2. 增加背景图片 删除先前导入的文本内容。 点击左上角“媒体”菜单,点击“导入”按钮,选择本地一张图片上传。 点击图片右下角的加号将图片添加到视频轨道上(会覆盖数字人)。 点击轨道最右侧的竖线,向右拖拽直到视频最后,使图片在整个视频播放时都显示。 选中背景图片所在轨道,拖动图片的角将其放大到适合尺寸,并将数字人拖动到合适位置。 此外,如果您想创作一个生物融合成新物种的视频,例如猪和老鹰融合成一个新的物种,以 GPT4 为例的制作教程如下: 1. 故事情节的构思 构思一个吸引人的故事情节,比如新物种的起源故事,结合猪和老鹰的特点以及这种融合带来的独特能力和挑战,考虑添加神秘或奇幻元素增强阴暗风格。 2. 视觉效果的设计 使用 3D 建模和特效技术创造出既霸气又具有阴暗风格的新物种形象,高质量的视觉效果和流畅的动画能吸引更多观众并提高视频的分享率。 3. 音乐和声音设计 配置适当的背景音乐和声效,以增强视频的氛围,选择能激起观众情绪的音乐和声音效果,让视频更加引人入胜。 4. 社交媒体互动
2024-11-23
AI分镜
以下是关于《李清照》AI 视频创作的分镜内容: |分镜|子分镜|分镜主视觉|配音|角色|配音|画面| |||||||| |8|0801<br>0802|嗯~谁在叫我<br>小姑娘,你从哪里来?你叫什么名字呀?|王维||| |9|0901 疑惑<br>0902 诗文|疑惑自言自语<br>疑惑的表情<br>看到明月松间照,清泉石上流惊喜|我叫什么名字呢?(疑惑)<br>哦~(惊讶)<br>李清照吟诵:明月松间照,清泉石上流。|少年李清照|| |10|1001 惊喜<br>1002 照清高亮|李清照灵机一动<br>墙上诗:明月松间照,清泉石上流。照和清高亮显示|背景音效:灵机一动|||| |11|11 得意|李清照脸部特写,惊喜表情|我叫李清照(高兴)|少年李清照|| |12|12 王维沉思|王维沉思|李清照~李清照,好名字、好名字|王维|| |13|13 夜景|明月下溪水潺潺|王维吟诵:明月松间照,清泉石上流。|王维|| |20|20|画面穿越到当代写字楼办公室|忙乱和电话铃声|背景声|| |21|21|面对电脑的李清照一脸茫然|||| |22|22|旁边两个同事聊天|你们打算什么时间要孩子?<br>要孩子,要什么孩子,我们是丁克家庭。|同事甲<br>同事乙|| |23|23|李清照满脑子疑惑,丁克是什么意思|疑问背景音|背景声|| |24|24|李清照查询丁克的意思,发现是不要孩子的家庭。|||| |25|25|旁边两个同事聊天|那你不打算结婚吗?<br>我才 30 岁,结哪门子婚,我的环游世界梦想还没有实现呢|同事甲<br>同事乙|| |26|26|李清照满脑子疑惑,为什么可以不结婚?怎么生活?|疑问背景音|背景声|| |27|27|李清照开始查阅资料|清照~清照~你不下班吗?<br>哦哦~我查点资料|同事甲<br>李清照|| |1||远景一个古装小女孩草丛中嬉戏|背景音乐:小女孩嬉戏声|||| |2|0201 欢快<br>0202 疑惑|李清照与蝴蝶对话:远景、特写|蝴蝶:你叫什么名字呀?(欢快)<br>李清照:嗯~嗯~我叫什么名字呢?(疑惑)|蝴蝶<br>少年李清照|| |3|0202 放大|李清照特写|||| |4|04 穿越唐代|李清照满是疑惑|画外音:这是什么地方?(疑惑)|少年李清照|| |5|《辋川别业》建筑|写有《辋川别业》的古代建筑|辋川别业、辋川别业,难到这是王维的住处!(恍然大悟)|少年李清照|| |6|06|《维摩诘诗集》特写|真的是王维(高兴)|少年李清照|| |7|07|李清照高兴奔向王维|王伯伯~王伯伯~(高兴)|少年李清照||
2024-11-23
学习AI
以下是针对新手学习 AI 的建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,可根据自己的兴趣选择特定模块深入学习。 掌握提示词的技巧,其上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库中有很多大家实践后的作品、文章分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解其工作原理和交互方式。 对于中学生学习 AI,建议如下: 1. 从编程语言入手学习: 从 Python、JavaScript 等编程语言开始,学习编程语法、数据结构、算法等基础知识。 2. 尝试使用 AI 工具和平台: 使用 ChatGPT、Midjourney 等 AI 生成工具,体验 AI 的应用场景。 探索面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识: 了解 AI 的基本概念、发展历程、主要技术如机器学习、深度学习等。 学习 AI 在教育、医疗、金融等领域的应用案例。 4. 参与 AI 相关的实践项目: 参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动。 尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 5. 关注 AI 发展的前沿动态: 关注 AI 领域的权威媒体和学者,了解 AI 技术的最新进展。 思考 AI 技术对未来社会的影响,培养对 AI 的思考和判断能力。 记住,学习 AI 是一个长期的过程,需要耐心和持续的努力。不要害怕犯错,每个挑战都是成长的机会。完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。
2024-11-23
可以根据照片生成人物的AI软件
以下是一些可以根据照片生成人物的 AI 软件: PhotoMaker:可以根据文字描述生成人物照片,能混合不同人物特征创造新形象,还能改变照片中人物的性别、年龄。访问链接:https://photomaker.github.io ,https://x.com/xiaohuggg/status/1746861045027869072?s=20 HeyGen:通过上传照片或文字提示,即可生成个性化 AI 数字形象视频。支持自定义肢体动作、服装、背景、年龄、性别等特征。仅需 1 分钟即可生成包含脚本、声音和情感表达的数字人视频。访问链接:https://x.com/imxiaohu/status/1852317866038809035
2024-11-22
可以根据照片,生成漫画人物的AI软件
以下是一些可以根据照片生成漫画人物的 AI 软件和相关信息: HeyGen 推出了基于照片生成数字人的新功能,您可以上传照片或输入文字提示来生成个性化的 AI 数字人形象。能选择性别、年龄、种族,定制肢体动作、服装、姿势和背景,支持脚本编辑,提供多种声音和情感表达,一分钟即可生成视频。详情链接: 在使用过程中,如果生成了自己比较满意的图,一定要记得存起来。下次想要同种类型的就可以直接拿来喂图,效果要比重新找的好很多。
2024-11-22
什么工具/模型/API 可以根据宠物照片生成数字宠物 可以有简单的活动。
以下是一个可以根据宠物照片生成数字宠物并具有简单活动的工具/模型/API: 出门问问 Mobvoi 的照片数字人工作流及语音合成(TTS)API。 出门问问是一家以生成式 AI 和语音交互为核心的人工智能公司,为全球多个国家提供面向创作者的 AIGC 工具、AI 政企服务,以及 AI 智能硬件。致力于打造国际领先的通用大模型,通过 AI 技术、产品及商业化三位一体发展,致力成为全球 AI CoPilot 的引领者。 在 ComfyUI 全球领导力峰会上,特意搭建了数字人 workflow(照片数字人驱动),仅需上传一张照片,输入一段文字或者上传一段音频,就可以生成短视频让“照片开口说话”。本次活动特意提供了免费 api 额度及操作指南给大家进行体验。以下是一些不同风格的照片驱动效果展示:
2024-11-16
有可以更具提供的文本和照片生成视频的AI吗?
以下是一些可以根据提供的文本和照片生成视频的 AI 工具: 1. Pika:一款出色的文本生成视频 AI 工具,擅长动画制作并支持视频编辑。目前内测免费,其生成服务托管在 Discord 中。操作步骤包括加入 Pika Labs 的 Discord 频道,在“generate”子区输入指令生成或上传本地图片生成视频,对不满意的效果可再次生成优化。 2. SVD:如果熟悉 Stable Diffusion,可以安装这款最新的插件,在图片基础上直接生成视频,它是由 Stability AI 开源的 video model。 3. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需要收费。 4. Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 5. Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 更多的文生视频的网站可以查看:https://www.waytoagi.com/category/38 。 内容由 AI 大模型生成,请仔细甄别。
2024-11-11
照片生成卡通画
以下是关于照片生成卡通画的相关内容: 1. 个性卡通头像生成: 复杂提示词:如“Disney boy,Low saturation Pixar Super details,clay,anime waifu,looking at viewer,nighly detailedreflections transparent iridescent colors.lonctransparent iridescent RGB hair,art by Serafleurfrom artstation,white background,divine cinematic edgelighting,soft focus.bokeh,chiaroscuro 8K,bestquality.ultradetailultra detail.3d,c4d.blender,OCrenderer.cinematic lighting,ultra HD3D renderino iw 1.5 s 500 v 5”。 不同照片生成:可更换新照片使用上述提示词重新生成。 其他调整:若不喜欢 Disney 风格,可将提示词中的“Disney”换成“Pixar”;若为女孩,可将“boy”换成“girl”。每次生成 4 张图片,满意可点击下方的 U1~U4 生成大图,对风格满意但需调整可点击 V1~V4 进行修改。 2. 【SD】简笔水彩风格插画生成: 大模型:“Flat2D Animerge”,适合生成卡通动漫图片,官方建议 CFG 值在 5 或 6(使用动态阈值修复可拉到 11)。 Lora:“Chinese painting style”可增加中国画水彩风格效果,权重设置为 0.4;“Crayon drawing”可添加简单线条和小孩子笔触,权重设置为 0.8。 操作步骤:将图片丢到标签器中反推关键词,发送到“文生图”;在正向提示词末尾添加上述 lora;设置好尺寸,重绘幅度开 0.5 让 AI 更自由发挥,想接近原图可降低数值;将图放入 controlnet 中,选择 tile 模型,权重为 0.5,控制模式选择“更注重提示词”。 3. 进阶使用技巧总结: 通用人物模版:想用真人照片生成卡通头像,可用「真人照片」+「照片描述」+「方法 1 的关键词」处理。若生成满意的图要记得保存,下次同种类型可直接喂图,效果更好。
2024-11-07
照片修复
以下是关于照片修复的相关知识: 图像高清修复与无损放大的流程通常分为三部分: 图像输入:添加 Load Image 节点加载图像,不建议上传大分辨率图片,因其处理时间长。 图像高清修复:使用 Iceclear/StableSR 等模型进行高清修复并 2 倍放大,搭配 Stable SR Upscaler 模型和合适的提示词,如正向:(masterpiece),(best quality),(realistic),(very clear),反向:3d,cartoon,anime,sketches,(worst quality),(low quality)等。 图像高清放大:用 realisticVision 底膜进行二次修复,使用提示词反推 node 提取画面提示词,搭配 tile ControlNet 提升细节感,再用合适的高清放大模型二次放大。 用 AI 给老照片上色: 启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染功能,在显存不够时将图片放大。 可在 PS 里调整角度和裁切照片,然后上色。对于复杂照片,可放弃人物服装颜色指定,只给场景方向,加入第二个 controlnet 控制颜色,如使用 t2ia_color 模型,关键词如蓝天、绿树、灰石砖。 将照片放入后期处理,使用 GFPGAN 算法清晰人脸,五官重绘后,再将图片发送到图生图中,打开 stableSR 脚本放大两倍,切换到 sd2.1 模型修复,vae 选择 vqgan,可不写提示词以免干扰原图。
2024-11-06
如何搭建利用产品原图和模特模板生成商业图的工作流 或者有没有这类ai 应用
以下是关于利用产品原图和模特模板生成商业图的工作流及相关 AI 应用的信息: 美国独立站搭建工作流中,有给模特戴上珠宝饰品的应用。 大淘宝设计部在主题活动页面、超级品类日传播拍摄创意、产品营销视觉、定制模特生成、产品场景生成等方面应用了 AI。例如,七夕主题活动页面通过 AI 生成不受外部拍摄条件限制的素材;在 UI 设计场景中,利用 SD 中 controlnet 生成指定范围内的 ICON、界面皮肤等;通过对 AI 大模型的训练和应用,提升合成模特的真实性和美感,提供定制化线上真人模特体验,如 AI 试衣间、AI 写真等;还能根据商品图和用户自定义输入生成多张场景效果,无需 3D 模型、显卡渲染和线下拍摄。
2024-11-22
有没有免费的好用的ai
以下为一些免费且好用的 AI 工具: 获取信息和学习东西:最佳免费选项为必应(https://www.bing.com/search?q=Bing+AI&showconv=1&FORM=hpcodx)。对于儿童,来自可汗学院的 Khanmigo(https://www.khanacademy.org/khanlabs)提供由 GPT4 驱动的良好的人工智能驱动辅导。 写东西:最佳免费选项为 Bing(https://www.bing.com/search?q=Bing+AI&showconv=1&FORM=hpcodx)和 Claude 2(https://claude.ai/)。 在写代码方面的免费替代品有: Tabnine(https://tabnine.com/):AI assistant that speeds up delivery and keeps your code safe Codeium(https://codeium.com/):Free AI Code Completion & Chat Amazon CodeWhisperer(https://aws.amazon.com/codewhisperer/):Build applications faster and more securely with your AI coding companion SourceGraph Cody(https://cody.sourcegraph.com/):The AI that knows your entire codebase Tabby(https://tabby.dev/):Opensource, selfhosted AI coding assitant fauxpilot/fauxpilot(https://github.com/fauxpilot/fauxpilot):An opensource alternative to GitHub Copilot server 需要注意的是,虽然 ChatGPT 功能强大,但它是收费的且不面向中国。此外,虽然 ChatGPT 的开发者 OpenAI 并不像其名字那样开放,其源码与模型数据不对外开放,但 Meta 在 2023 年 2 月开源了 LLaMA 1,并在 7 月发布了进阶的 Llama 2 且允许商用。
2024-11-21
有没有把外国PPT翻译为中文的工具
以下为您介绍将外国 PPT 翻译为中文的工具及相关方法: 有一种自动 PPT 翻译脚本,其开发过程如下: 1. 前期准备: 翻译需要外接 API,推荐讯飞大模型,新账户免费送 200 万 tokens,有效期 3 个月。 进入 https://xinghuo.xfyun.cn/ ,首页选择 API 接入,然后点服务管理进入控制台。 创建一个新项目,比如“PPT 翻译”,以避免 API 泄露。 点进去,找到左边机器翻译的模型,按提示领取 200 万 tokens 的礼包,然后在主控台看到对应的 id、apikey、api secret 和接入路径。 2. 导入依赖: 大部分依赖是常用的,只有一个 ppt 可能需要装,运行 CMD 输入 pip install pythonpptx,如果还缺的可以按提示安装。 3. 初始化 API 相关信息和文件路径: 先设置对应的 api 信息,其他模型可以对应做替换。 4. 读取并提取 PPT 文本: 根据讯飞的 API 文档配置做请求指令,确保 API 可以正确调用。打印响应数据设置方便监测脚本执行动态,如果碰到报错可以随时做优化。 5. 翻译脚本: 目前只设置了文本翻译,未对表格元素处理,排除了所有 shape,如果要加入表格翻译,可以定义 shape = table 来定义表格,然后翻译表格里的 cell 实现。 接收路径已调好,如果用其他的 API,要在 translated_text = get_result 后面替换成自己的地址。 语言选择,原文件是中文用'cn'表示,英文文档改成‘en’,其他语种对应。 此外,还有 Claude 官方文档提示词工程最佳实践@未来力场编译版(中英对照),源地址 https://docs.anthropic.com/claude/docs ,扫码关注未来力场:AIGC 最佳实践中文互联网搬运工。
2024-11-21
有没有推荐的AI图片生成软件
以下为您推荐一些 AI 图片生成相关的软件: 1. 海报生成工具: Canva(可画):https://www.canva.cn/ ,是一个受欢迎的在线设计工具,提供大量模板和设计元素,AI 功能可辅助选色和字体样式,通过简单拖放操作创建海报。 稿定设计:https://www.gaoding.com/ ,智能设计工具,采用先进人工智能技术,自动分析生成设计方案,稍作调整即可完成设计。 VistaCreate:https://create.vista.com/ ,简单易用的设计平台,提供大量设计模板和元素,可用 AI 工具创建个性化海报,智能建议功能可助用户找合适元素。 Microsoft Designer:https://designer.microsoft.com/ ,通过简单拖放界面,能快速创建演示文稿、社交媒体帖子等视觉内容,集成丰富模板库和自动图像编辑功能。 2. 图生图产品: Artguru AI Art Generator:在线平台,生成逼真图像,为设计师提供灵感,丰富创作过程。 Retrato:AI 工具,将图片转换为非凡肖像,有 500 多种风格选择,适合制作个性头像。 Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具细节的全新视觉作品。 Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计的 AI 工具,将上传照片转换为芭比风格,效果好。 3. 图片生成 3D 建模工具: Tripo AI:VAST 发布的在线 3D 建模平台,能利用文本或图像在几秒钟内生成高质量且可立即使用的 3D 模型,基于数十亿参数级别的 3D 大模型,实现快速 2D 到 3D 转换,提供 AI 驱动的精准度和细节。 Meshy:功能全面,支持文本生成 3D、图片生成 3D 以及 AI 材质生成,用户上传图片并描述材质和风格可生成高质量 3D 模型。 CSM AI:Common Sense Machines 支持从视频和图像创建 3D 模型,Realtime Sketch to 3D 功能支持通过手绘草图实时设计 3D 形象再转换为 3D 模型。 Sudo AI:支持通过文本和图像生成 3D 模型,适用于游戏领域模型生成,用户上传图片或输入文本提示词生成 3D 模型。 VoxCraft:生数科技推出的免费 3D 模型生成工具,能将图像或文本快速转换成 3D 模型,提供图像到 3D、文本到 3D 和文本到纹理等多种功能。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-11-20
有没有放一个ppt文档转化成文字的AI软件
目前有一些可以将 PPT 文档转化为文字的方法和相关的 AI 工具: 在将 PPT 转化为网站的尝试中,当遇到困惑时,如组织线下沙龙内容的两页并进行切换没有思路,可选择放手让 AI 给出建议。 市场上好用的 AI 辅助的 PPT 工具包括: Gamma:在线 PPT 制作网站,通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式。网址:https://gamma.app/ 美图 AI PPT:由美图秀秀开发团队推出,通过输入简单文本描述生成专业 PPT 设计,有丰富模板库和设计元素。网址:https://www.xdesign.com/ppt/ Mindshow:AI 驱动的 PPT 辅助工具,提供自动布局、图像选择和文本优化等智能设计功能。网址:https://www.mindshow.fun/ 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理技术优势,提供智能文本生成、语音输入、文档格式化等功能。网址:https://zhiwen.xfyun.cn/
2024-11-19
有没有语音交互领域的AI Agent的好的思路
以下是关于语音交互领域的 AI Agent 的一些思路: 1. 构建像人一样的 Agent:实现所需的记忆模块、工作流模块和各种工具调用模块,这在工程上具有一定挑战。 2. 驱动躯壳的实现:定义灵魂部分的接口,躯壳部分通过 API 调用,如 HTTP、webSocket 等。要处理好包含情绪的语音表达以及躯壳的口型、表情、动作和语音的同步及匹配,目前主流方案只能做到预设一些表情动作,再做一些逻辑判断来播放预设,语音驱动口型相对成熟但闭源。 3. 保证实时性:由于算法部分组成庞大,几乎不能单机部署,特别是大模型部分,会涉及网络耗时和模型推理耗时,低延时是亟需解决的问题。 4. 实现多元跨模态:不仅要有语音交互,还可根据实际需求加入其他感官,如通过添加摄像头数据获取视觉信息并进行图像解析。 5. 处理拟人化场景:正常与人交流时会有插话、转移话题等情况,需要通过工程手段丝滑处理。 此外,像 AutoGLM 这样的产品,通过模拟人类操作来实现跨应用的控制,展现出了一定的智能理解能力,如能根据用户意图选择合适的应用场景。但仍存在语音识别偏差、操作稳定性需提升、支持平台有限等问题,未来随着多模态理解能力和操作精准度的提高,发展空间较大。
2024-11-19
推荐下可以把youtube 视频内容转成文字的工具
以下是一些可以将 YouTube 视频内容转成文字的工具: 1. YouTube Summary with ChatGPT:这是一个插件,能帮助获取 YouTube 视频的语音转文字内容,并复制到 ChatGPT 中转化为摘要文章。来源: 2. Captiwiz:不仅能将音频转录成文本,还能为视频添加字幕、音乐和动态表情符号等。来源: 3. Scribe:可以将 YouTube 视频转换为文章,不是单纯的语音转字幕,而是重新用文章形式组织语言并排版。来源: 此外,虽然 ChatGPT 本身无法直接总结 YouTube 视频,但有些免费服务可以帮助转录或下载视频的自动生成字幕,然后保存这些文字让 ChatGPT 帮忙转化为简洁要点。
2024-11-23
有什么 ai 辅助打工人学习的工具推荐
以下是为打工人推荐的一些 AI 辅助学习工具: 英语学习工具: 1. Speak:这是一款 AI 英语学习 APP,利用先进的 AI 语言学习技术,提供全面实时反馈,支持随时随地练习口语,且 OpenAI 曾投资该公司。 2. Duolingo:提供游戏化学习平台,通过 AI 辅助教学,帮助学习新词汇和短语,其口语练习功能有助于练习发音和口语表达。 3. Call Annie:在发音过程中能根据发言调整表情和动作,让人感觉如同与真人对话,可随时通过视频或语音进行英语对话。 英语和数学通用学习方法: 1. 利用智能辅助工具,如英语写作助手 Grammarly 进行写作和语法纠错。 2. 借助语音识别应用,如 Call Annie 进行口语练习和发音纠正。 3. 使用自适应学习平台,如 Duolingo 为您量身定制学习计划。 4. 运用智能导师和对话机器人,如 ChatGPT 进行会话练习和对话模拟。 数学学习工具: 1. 自适应学习系统,如 Khan Academy,结合 AI 技术提供个性化学习路径和练习题。 2. 智能题库和作业辅助工具,如 Photomath,通过图像识别和数学推理技术提供数学问题解答和解题步骤。 3. 虚拟教学助手,如 Socratic,利用 AI 技术解答数学问题、提供教学视频和答疑服务。 4. 参与交互式学习平台,如 Wolfram Alpha 的数学学习课程和实践项目,利用 AI 技术进行数学建模和问题求解。 内容仿写工具: 1. 秘塔写作猫:https://xiezuocat.com/ ,是 AI 写作伴侣,能推敲用语、斟酌文法、改写文风,实时同步翻译,支持全文改写、一键修改、实时纠错并给出修改建议,智能分析文章属性并打分。 2. 笔灵 AI 写作:https://ibiling.cn/ ,是智能写作助手,支持多种文体写作,能一键改写/续写/扩写,智能锤炼打磨文字。 3. 腾讯 Effidit 写作:https://effidit.qq.com/ ,由腾讯 AI Lab 开发,能提升写作者的写作效率和创作体验。 更多 AI 写作类工具可以查看:https://www.waytoagi.com/sites/category/2 。请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-11-23
请问现在好用的AI图片生产工具有哪些,对人物一致性要求高
以下是一些好用的 AI 图片生产工具,且对人物一致性要求较高: 1. Artguru AI Art Generator:是一个在线平台,能够生成逼真图像,为设计师提供灵感,丰富创作过程。 2. Retrato:这是一款 AI 工具,可将图片转换为非凡肖像,拥有 500 多种风格选择,适合制作个性头像。 3. Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具有细节的全新视觉作品。 4. Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计的 AI 工具,能将上传的照片转换为芭比风格,效果出色。 在使用 AI 生图时,若要保证人物和场景的一致性,有两个取巧的方式:一是像生成动物,动物会比较容易保持一致性;二是特定的名人或有特殊属性的人物。 另外,目前市面上的 AI 工具分为线上和线下本地部署两种。线上的优势是出图速度快,不依赖本地显卡配置,无需下载大型模型,还能参考其他创作者的作品,但出图分辨率有限。线下部署的优势是可以添加插件,出图质量高,但对电脑配置要求高,使用时可能导致电脑宕机。可以充分发挥线上和线下平台的优势,线上用于找参考、测试模型,线下作为主要出图工具。
2024-11-23
国内的,AI学习类关于阅读和听力提升的应用(具备AI能力的应用)或者工具有哪些?
目前国内具备 AI 能力、有助于提升阅读和听力的应用和工具相对较多。例如,流利说英语在听力和口语训练方面表现出色,它能通过 AI 技术为用户提供个性化的学习方案和精准的发音纠正。还有百词斩,其在单词记忆和阅读拓展方面有独特的功能,利用 AI 算法推荐适合用户水平的阅读材料。此外,网易有道词典也具备一定的 AI 辅助功能,能帮助用户提升听力理解和阅读能力。
2024-11-23
AI学习类关于阅读和听力提升的应用或者工具有哪些?
以下是一些有助于提升阅读和听力的 AI 学习应用或工具: 英语学习方面: 1. 智能辅助工具:如 Grammarly,可进行英语写作和语法纠错,改进英语表达和写作能力。 2. 语音识别和发音练习:例如 Call Annie,用于口语练习和发音纠正,提供实时反馈和建议。 3. 自适应学习平台:像 Duolingo,利用 AI 技术为您量身定制学习计划,提供个性化学习内容和练习。 4. 智能导师和对话机器人:比如 ChatGPT,可进行英语会话练习和对话模拟,提高交流能力和语感。 数学学习方面: 1. 自适应学习系统:如 Khan Academy,结合 AI 技术提供个性化数学学习路径和练习题,精准推荐。 2. 智能题库和作业辅助:例如 Photomath,通过图像识别和数学推理技术提供数学问题解答和解题步骤。 3. 虚拟教学助手:如 Socratic,利用 AI 技术解答数学问题、提供教学视频和答疑服务。 4. 交互式学习平台:如 Wolfram Alpha,参与数学学习课程和实践项目,进行数学建模和问题求解。 此外,在教育领域,还有一些其他的应用: 1. 语言学习:Speak、Quazel、Lingostar 等,提供实时交流和发音反馈。 2. 数学指导:Photomath、Mathly 帮助学生解决数学问题。 3. 历史学习:PeopleAI、Historical Figures 通过模拟与杰出人物聊天教授历史。 4. 写作辅助:Grammarly、Orchard、Lex 帮助学生克服写作难题,提升写作水平。 5. 内容处理:Tome、Beautiful.ai 协助创建演示文稿。 需要注意的是,内容由 AI 大模型生成,请仔细甄别。
2024-11-23