Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

用 ai 整理图片

Answer

以下是关于用 AI 整理图片的相关内容:

在图像生成与优化方面:

  • 初步生成:使用 DALL-E 3 和 Midjourney(MJ)进行初步图像生成。DALL-E 3 凭借强大的文本识别能力快速生成符合意图的画面,MJ 则通过垫图功能(--Sref 和--iw 组合)确保图像风格一致。
  • 图像优化:对于 DALL-E 3 和 MJ 跑不出来的图,使用 Stable Diffusion(SD)进行图像的细节处理,尤其是局部重绘,例如调整人物的手部细节。通过 magnific.ai 工具对图像进行超分处理,提高画质。

在关键词方面:

  • 主题描述:图片内容分为二维插画和三维立体两种表现形式。描述场景、物体或人物时,应清晰准确,对于场景中的人物最好独立描述。
  • 设计风格:可通过找风格类关键词参考或垫图/喂图,让 AI 生成特定风格的图片。材质相关的关键词有很多门道,需要针对某一种风格单独进行“咒语测试”。

在老照片处理方面:

  • 将照片放入后期处理,使用 GFPGAN 算法使人脸变清晰,但无法使头发、衣服等元素变清晰。
  • 接着将图片发送到图生图中,打开 stableSR 脚本放大两倍,切换到 sd2.1 模型进行修复,vae 选择 vqgan,提示词可不写以免干扰原图。
Content generated by AI large model, please carefully verify (powered by aily)

References

上海国际AIGC大赛第三名—《嘉定汇龙》复盘

我们从一开始就意识到了这一点,就坚持无论如何要把在线文档整理好。小田参与过多个打比赛的项目小组,所以他对在线文档的理解和整理是大厂级别的。在这篇在线文档中,大家就能看到我们整个项目多人、多环节推进的过程:大家可以看到,从1)分镜头的脚本;2)文生图;3)图片的筛选;4)图生视频);5)视频的筛选;6)视频超分到4K每一步都井井有条,如果这些都是靠口喷(大厂里把只动嘴的沟通叫做口喷),是难以为继的。甚至可以说这份在线文档的推进,是我们项目大家伙劲往一处使的根基。并且我们每个小伙伴都非常专业,根据文本来理解画面,用AI跑图。十个人的手跑出的不同的图,最后能够做到画风相对一致、运镜符合科学规律,是并不容易的。5、AIGC跑图的硬功夫在《嘉定汇龙》的制作过程中,我们充分利用了AIGC技术,从图像生成到视频制作,都实现了前所未有的效率和质量。[heading3]图像生成与优化[content]初步生成:我们使用DALL-E 3和Midjourney(MJ)进行初步图像生成。DALL-E 3以其强大的文本识别能力帮助我们快速生成符合意图的画面,而MJ则通过垫图功能(--Sref和--iw组合)确保图像的风格一致。图像优化:D3和MJ跑不出来的图,我们用Stable Diffusion(SD)用于图像的细节处理,尤其是局部重绘,例如调整人物的手部细节。通过magnific.ai工具对图像进行超分处理,进一步提高画质。

进阶技巧和关键词大全总结

这个周末尝试了很多种风格的AI出图,一般图片内容我们会分为二维插画以及三维立体两种主要表现形式。为了生成自己想要的图,上面说的3个结构确实可以帮我们大致输出想要的图片:1.1.主题描述:可以描述一个场景和故事以及其组成的元素、一个物体或者人物的细节、搭配。比如一个动物园,里面有老虎、狮子、长颈鹿、大树、围栏等等或者一个小女在森林里搭帐篷,她穿着红色的裙子以及戴着白色的帽子,但是有时候AI不一定能识别每一个描述的元素,如果要描述一个场景中的人物,大家记得进行独立描述,不要用一长串文字去表达,AI会识别不到,比如一个穿着红色盔甲的男孩站在山顶,那么我们最好把他拆分以下:一个男孩、穿着红色盔甲、站在山顶,这样会更加接近我们想要的场景。但是一个大场景中有多个角色的细节就不太容易通过关键词去生成了。1.2.设计风格:设计风格其实很多设计师没有办法直接表达出来,所以我们在这个步骤会去找一些风格类的关键词参考或者是你找到一张想要的风格的图片,放进去,这种我们就称之为垫图/喂图,让AI根据我们给出的图片风格,结合我们的主题描述生成该风格的图片。还有我研究了一下玻璃、透明塑料、霓虹色彩以及一些透明、反射等材质的关键词,比如你想让一个物体表面透明,但是不要把物体里面的机械结构体现出来,可能需要加一些[设计师](https://www.uisdc.com/tag/%e8%ae%be%e8%ae%a1%e5%b8%88)风格,单纯的控制材质很难达到要求,因为系统判断你表面透明了肯定能看到里面的结构,但是有了结构的话物体就会很复杂,不高级。所以这里面关键词的道道非常多,目前也只能通过大家针对某一种风格单独去进行“咒语测试”。未加风格只描述材质

【SD】用AI给老照片上色,岁月不改它模样

将照片放入到后期处理中,使用GFPGAN算法将人脸变清晰,不知道这个功能的可以参考我这篇文章——[【Stable Diffusion】图片高清化+面部修复+一键抠图,一些你不知道的事儿](http://mp.weixin.qq.com/s?__biz=MzkzMzIwMDgxMQ==&mid=2247487422&idx=1&sn=9cdf7ef37c2acb3c0fc3328d0ba8af74&chksm=c251597af526d06c921ea6728cb2a32bdf1d5f699e19d6ba13b849994e4d01af8a5144132aad&scene=21#wechat_redirect)。这个步骤,可以将我们的五官进行重绘,但是却没有办法将照片中的头发、衣服等其他元素变清晰。所以,接下来我将图片再发送到图生图当中,打开stableSR脚本,放大两倍。这个放大插件是所有插件中对原图还原最精准的,也是重绘效果最好的,不知道的朋友可以参考我的这篇文章——[【Stable Diffusion】超清无损放大器StableSR](http://mp.weixin.qq.com/s?__biz=MzkzMzIwMDgxMQ==&mid=2247487403&idx=1&sn=cbb96534fa6f58c37cf9fc64bc7ade0c&chksm=c251596ff526d0792b4bba0e21b69427b23e780824bdc75b22f1073e8bad6f61f30199fc8344&scene=21#wechat_redirect)。切换到sd2.1的模型进行修复,vae选择vqgan,提示词可以什么都不写,以免对原图产生干扰。

Others are asking
审查施工图用哪个AI
以下是一些能够帮助审查施工图的 AI 工具: 1. HDAidMaster:这是一款云端工具,在建筑设计、室内设计和景观设计领域表现出色,搭载了自主训练的建筑大模型 ArchiMaster,软件的 UI 和设计成果颜值在线。 2. Maket.ai:主要面向住宅行业,在户型设计和室内软装设计方面有探索,设计师输入需求后能自动生成户型图。 3. ARCHITEChTURES:AI 驱动的三维建筑设计软件,在住宅设计早期阶段可引入标准和规范约束设计结果,保证合规性。 4. Fast AI 人工智能审图平台:形成全自动智能审图流程,能自动导入设计图、进行区域划分和构件识别等,还能将建筑全寿命周期内的信息集成管理。 但每个工具都有特定的应用场景和功能,建议您根据自身具体需求选择合适的工具。
2025-03-17
ToB行业有什么关于AI Agent的应用场景
在 ToB 行业,AI Agent 有以下应用场景: 1. 人力资源领域:如 Brix 面向北美和欧洲企业,提供全球雇佣的 AI 驱动解决方案。通过 Hiring Agent,触达全球约 2000 万以上的人才,自动完成候选人筛选、简历分析和面试流程,帮助企业快速组建高效团队。通过 Working Agent 支持远程团队的智能化管理,为企业构建 100 至 500 人规模的全球化组织提供一站式解决方案。 2. 餐饮营销领域:时来智能通过自研的 AI Agent 以及强化学习等技术,为线下餐饮服务门店提供全自动管理私域流量营销运营的解决方案。基于垂直场景数据训练的 AI 营销模型可以针对不同消费者实时生成并推送个性化的营销折扣方案,从而在优化营销成本的同时显著提升营销转化效果,能帮助门店提升 50%100%的营销转化效果,以及相应提升平均 1520%的营业额。 3. 销售和供应链管理:嵌入企业流程,提升整体运营效率。 此外,AI Agent 具有以下特点: 1. 个性化:随着用户的使用越来越了解用户习惯和想法,从而作出喜好预测。例如 Dot App 在对话中了解用户喜好,随后为用户推荐新的咖啡店。 2. 自主完成任务:如 Auto GPT,用户输入一个目标后,可自主执行任务、递归地开发和调试代码。 3. 多 Agent 协作:例如斯坦福大学的 SmallVille(小镇)项目,25 个人工智能体居住在一个沙盒虚拟城镇中通过复杂的社交互动来执行他们的日常生活;Fixie AI 在收到用户请求后启动多个负责不同模块的 Agent 进行数据查询和传递,最终生成邮件内容给客户回复。 以下是一些 Agent 构建平台: 1. Coze:新一代的一站式 AI Bot 开发平台,适用于构建基于 AI 模型的各类问答 Bot,集成丰富插件工具拓展 Bot 能力边界。 2. Microsoft 的 Copilot Studio:主要功能包括外挂数据、定义流程、调用 API 和操作,以及将 Copilot 部署到各种渠道。 3. 文心智能体:百度推出的基于文心大模型的智能体(Agent)平台,支持开发者根据自身需求打造大模型时代的产品能力。 4. MindOS 的 Agent 平台:允许用户定义 Agent 的个性、动机、知识,以及访问第三方数据和服务或执行设计良好的工作流。 5. 斑头雁:2B 基于企业知识库构建专属 AI Agent 的平台,适用于客服、营销、销售等多种场景,提供多种成熟模板,功能强大且开箱即用。 6. 钉钉 AI 超级助理:依托于钉钉强大的场景和数据优势,提供更深入的环境感知和记忆功能,在处理高频工作场景如销售、客服、行程安排等方面表现出色。
2025-03-17
好用的AI搜索产品
以下是一些好用的 AI 搜索产品: 1. 秘塔 AI 搜索:由秘塔科技开发,具有多模式搜索、无广告干扰、结构化展示和信息聚合等功能,能提升用户搜索效率和体验。 2. Perplexity:聊天机器人式搜索引擎,允许用自然语言提问,使用生成式 AI 技术收集信息并给出答案,能自动拆分复杂问题进行多次搜索并整合结果,还能提供信息来源。 3. 360AI 搜索:360 公司推出,通过 AI 分析问题生成清晰有理答案,支持增强模式和智能排序。 4. 天工 AI 搜索:昆仑万维推出,采用生成式搜索技术,支持自然语言交互和深度追问,未来将支持多模态搜索。 5. Flowith:创新的 AI 交互式搜索和对话工具,基于节点式交互方式,支持多种 AI 模型和图像生成技术,有插件系统和社区功能。 6. Devv:面向程序员的 AI 搜索引擎,专注于提供编程、软件开发和人工智能等领域的专业建议和指导。 7. Phind:专为开发者设计,利用大型语言模型提供相关搜索结果和动态答案,擅长处理编程和技术问题。 8. MetaSo:针对中国用户的 AI 搜索产品,提供问题答案、大纲、思维导图、时间线和信息来源,目前仅支持中文,准确性良好。
2025-03-17
国产编码类AI
以下是一些国产的编码类 AI 产品: 1. GitHub Copilot:由 GitHub 联合 OpenAI 和微软 Azure 团队推出,支持多种语言和 IDE,能为程序员快速提供代码建议,提高编程效率。 2. 通义灵码:阿里巴巴团队推出,基于通义大模型,具备行级/函数级实时续写、自然语言生成代码等多种能力。 3. CodeWhisperer:亚马逊 AWS 团队推出,由机器学习技术驱动,为开发人员实时提供代码建议。 4. CodeGeeX:智谱 AI 推出的开源免费编程助手,基于 130 亿参数的预训练大模型,可提升开发效率。 5. Cody:代码搜索平台 Sourcegraph 推出,借助强大的代码语义索引和分析能力,了解开发者的整个代码库。 6. CodeFuse:蚂蚁集团支付宝团队为国内开发者提供的免费 AI 代码助手,基于自研基础大模型微调。 7. Codeium:由 AI 驱动的编程助手工具,通过提供代码建议等帮助软件开发人员提高效率和准确性。 此外,字节最新发布的 AI 编程工具 Trae 的 Windows 版也已发布,具有以下特点: 1. 全中文界面,跨平台支持,包括 Windows 和 MacOS 系统,操作界面简洁直观,易于上手。 2. 内置 Claude3.5 和 GPT4o 两大顶尖 AI 模型,完全免费且不限使用次数。 3. 零门槛智能开发,不懂编程也能通过中文对话让 AI 生成所需代码,并自动识别和解决代码错误。 字节的 Trae 目前处于公测阶段,完全免费。它同时支持豆包 1.5 Pro 和 Deepseek R1、V3 等模型。虽然在处理复杂业务时可能不如 Cursor,但为不懂技术的人提供了新选择,有望实现一人搞定业务、产品、设计、开发、运维等全流程。 更多辅助编程 AI 产品,还可以查看这里:https://www.waytoagi.com/category/65 。每个工具的功能和适用场景可能不同,您可以根据自身需求选择最适合的工具。
2025-03-16
如何学习AI
以下是新手学习 AI 的方法: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,如图像、音乐、视频等,可根据兴趣选择特定模块深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解其工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 对于中学生学习 AI,建议如下: 1. 从编程语言入手学习: 可以从 Python、JavaScript 等编程语言开始学习,学习编程语法、数据结构、算法等基础知识,为后续的 AI 学习打下基础。 2. 尝试使用 AI 工具和平台: 可以使用 ChatGPT、Midjourney 等 AI 生成工具,体验 AI 的应用场景。 探索一些面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识: 了解 AI 的基本概念、发展历程、主要技术如机器学习、深度学习等。 学习 AI 在教育、医疗、金融等领域的应用案例。 4. 参与 AI 相关的实践项目: 参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动。 尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 5. 关注 AI 发展的前沿动态: 关注 AI 领域的权威媒体和学者,了解 AI 技术的最新进展。 思考 AI 技术对未来社会的影响,培养对 AI 的思考和判断能力。 记住,学习 AI 是一个长期的过程,需要耐心和持续的努力。不要害怕犯错,每个挑战都是成长的机会。随着时间的推移,您将逐渐建立起自己的 AI 知识体系,并能够在这一领域取得自己的成就。完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。
2025-03-16
做ai音乐的经验和软件
以下是关于做 AI 音乐的经验和软件的相关内容: 经验方面: 1. 具备一定的 AI 音乐创作经验,如在 UDIO 和 SUNO 上制作过音乐。 2. 熟悉提示词(Prompt)的应用,了解如何使用 Prompt 进行创作。 3. 了解音乐编曲和结构,对编曲、歌曲结构有一定了解。 4. 掌握数字音频工作站(DAW)软件,如 Audition、Studio One 等。 5. 拥有对音乐的热爱,保持对音乐创作的热情和兴趣。 6. 在创建 AI 生成曲子的过程中,注意风格和语言的选择,以确保生成的曲子符合自己的需求。 7. 投喂给 AI 的旋律应保持清晰,避免复杂的节奏构架和变化,以提高 AI 的辨识度和创作效果。 软件方面: 1. 明天学习需要下载 flow 水果软件,可以在淘宝上购买并请人帮忙安装。 2. 可以使用 PS 里的工具进行抠图操作。 3. 利用分离人声的 AI 软件,能够将人声从背景音乐中分离出来。 4. 微软 AI 语音:制作使用了微软声音库制作旁白,语音库支持 147 种语言,还有定制声音。
2025-03-16
你可以生成图片吗
以下是关于生成图片的相关信息: Sora 是一种可作为世界模拟器的视频生成模型,能够通过在具有一个帧的时间范围的空间网格中排列高斯噪声的分块来生成图像,可生成不同大小的图像,分辨率高达 2048x2048。 ComfyUI Flux 与 runway 结合可以制作绘画视频,包括生成图片(通过提示词让 flux 生成技术草图、CAD 等)、绘制视频(在 runway 中使用提示词从空白页面开始逐行创建,并把生成的图片作为尾帧)、草图上色(使用 flux 的 controlNet,depth 固定,Union 版本不建议权重调太高)、生成上色后的视频等。 LayerStyle 副本中的 LayerUtility 中的 TextImage 可以从文字生成图片以及遮罩,支持字间距、行间距调整,横排竖排调整,可设置文字的随机变化,包括大小和位置的随机变化。节点选项包括 size_as、font_file、spacing、leading、horizontal_border、vertical_border、scale、variation_range、variation_seed、layout、width、height、text_color、background_color 等。
2025-03-16
我要翻译一张图片内的文字
以下是一些可能有助于您翻译图片内文字的信息: MangaimageTranslator:这是一个具有高效 OCR 和 AI 翻译技术的工具,支持多语言,能够对去文字区域修复上色,重新渲染文本。相关链接:https://github.com/zyddnys/mangaimagetranslator 、https://touhou.ai/imgtrans/ 。
2025-03-15
如何用AI修过曝的图片
以下是一些用 AI 修复过曝图片的方法和相关工具: 1. 使用 MutiDiffusion 插件:不开放大倍数,仅使用分块渲染功能,可在显存不够时放大图片。 2. 辅助工具: 视频放大:https://www.topazlabs.com/topazvideoai 百度网盘分享的 Topaz 全家桶:链接:https://pan.baidu.com/s/1bL4tGfl2nD6leugFh4jg9Q?pwd=16d1 提取码:16d1 Kraken.io:主要用于图像压缩,也提供免费图像放大功能,能保证图像细节清晰度。 Deep Art Effects:强大的艺术效果编辑器,通过 AI 技术放大图像并赋予艺术效果,支持多种滤镜和风格。 RealESRGAN:基于 RealESRGAN 的图像超分辨率增强模型,具有可选的人脸修复和可调节的放大倍数,但使用几次要收费。 Photoshop Generative AI 功能:主要工具包括 Remove tool、Clone brush、Generative fill 以及 Neural filters。 SD 图生图,重绘幅度小一点。 3. 【SD】超清无损放大器 StableSR: 修复需使用 StabilityAI 官方的 Stable Diffusion V2.1 512 EMA 模型,放入 stablediffusionwebui/models/StableDiffusion/文件夹中。 StableSR 模块(约 400M 大小)放入 stablediffusionwebui/extensions/sdwebuistablesr/models/文件夹中。 VQVAE(约 750MB 大小)放在 stablediffusionwebui/models/VAE 中。 在处理过曝图片时,可根据具体情况选择合适的方法和工具。例如,对于复杂的照片,可先在 PS 里进行角度调整和照片裁切,然后使用上述工具和方法进行处理。对于场景方向的指定,可给简单的关键词让 AI 自行决定,避免过多颜色提示词导致画面污染。
2025-03-15
帮我生成一张黑洞吞噬星系的图片
很抱歉,目前无法直接为您生成黑洞吞噬星系的图片。但为您提供以下相关信息: Genie 模型可以为您展示一系列关于宇宙的内容,比如黑洞是怎样吞噬光线的。通过与 Genie 模型的互动,您能感受到宇宙的广阔和神秘,激发对天文学和物理学的兴趣。 有研究利用计算机视觉模型拼凑出了 5500 万光年外的首张黑洞图像,结合了来自世界各地八台望远镜的图像。 如果您想要获得黑洞吞噬星系的图片,建议您通过以下方式: 1. 使用专业的图像设计软件,如 Adobe Photoshop 等,自己创作。 2. 在一些提供图片素材的网站上搜索,如 Unsplash、Pexels 等。
2025-03-13
生成图片的大模型
以下是关于生成图片的大模型的相关信息: SDXL 模型: 是 Stable Diffusion 开发公司最新发布的图像生成大模型。 以往使用的模型多在 sd1.5 官方模型上衍生微调,而 sdxl1.0 版本的官方大模型有极强升级。 base 模型参数数量为 35 亿,refiner 模型参数数量达 66 亿。 由 base 基础模型和 refiner 优化模型构成,可在 base 模型基础上用优化模型绘画,更有针对性优化出图质量。 优势: 审美偏好有很大提升,出图效果直逼 midjourney。 体积和分辨率更大,base+refiner 容量达 13G,基于 10241024 图片训练,可直接生成 1000 分辨率以上图片,细节和绘画质量惊人。 可图大模型: 由快手可图团队开发,基于潜在扩散的大规模文本到图像生成模型。 在数十亿图文对下训练,在视觉质量、复杂语义理解、文字生成(中英文字符)等方面有巨大优势,支持中英双语,在中文特色内容理解方面更具竞争力。更多信息可查看技术报告。 SD 模型入门: 主模型后缀一般为.ckpt 或者.safetensors,体积在 2G 7G 之间。 管理模型需进入 WebUl 目录下的 models/Stablediffusion 目录。 在使用 WebUI 时左上角切换的就是主模型。
2025-03-13
AI赋能办公,包含AI+对话、AI+写作与PPT、图片与视频生成和数据分析,还有面向HR、行政、财务、营销等岗位的AI赋能课
以下是关于 AI 赋能办公的相关内容: GPT 使用场景: 1. 内容生成:可以生成文章、故事、诗歌、歌词等内容。 演示:https://chat.openai.com/ 、https://bard.google.com/extensions 、https://claude.ai/ 2. 聊天机器人:作为聊天机器人后端,提供自然对话体验。 演示: 3. 问答系统:为用户提供准确答案。 4. 文本摘要:生成文本的摘要或概述。 5. 机器翻译:虽非专门设计,但有不错表现。 6. 群聊总结: 7. 代码生成:GPT3 及后续版本可生成代码片段,帮助解决编程问题。 8. 教育:用于教育领域,帮助学生解答问题或提供学习材料。 9. 浏览器插件:webpilot 10. PDF 对话:演示 www.chatpdf.com PPT 相关: 1. 2. AiPPT.cn:爱设计&AiPPT.cn 是一家 AIGC 数字科技企业,致力于打造“下一代个人与组织的 Ai 工作站”。旗下产品包括 AiPPT 等超过 10 余款应用 AI 能力的内容创作工具。23 年在 Ai+办公领域推出 AiPPT.cn/AiPPT.com,帮助用户“一分钟一键生成 PPT”,是国内 AiPPT 赛道创业公司第 1 的产品,全球第 4,国内所有 AIGC 产品 PC 端 Top10。目标市场主要是市场、运营、销售、人力、财务、行政、技术、产品、总助、公务员、学生、老师等基层及中高层管理岗位人员。 3. 在众多的 PPT 工具中,AI 带来便捷高效体验。深入了解了五大 AI PPT 工具:MindShow、爱设计、闪击、Process ON、WPS AI,它们各自有鲜明特色和擅长场景。选择合适工具要根据实际需求调整,试用和体验比盲目跟风更明智。 其他: 1. 音视频提取总结:https://bibigpt.co/r/AJ 2. 播客总结:https://podwise.xyz/dashboard/trending 3. 生成脑图:https://xmind.ai/editor/
2025-03-12
上手coze的路径,整理一个教程的列表
以下是上手 Coze 的路径及相关教程列表: 1. 历史活动教程: 5 月 7 号():大聪明分享|主题:Agent 的前世今生,每个分享人分享最初是怎么接触 Coze 的,以及现在用 Coze 做什么。流程安排:20:00@🌈AJ 主持开场,20:00 21:00 大聪明分享,21:00 21:30 关于 Coze 随便聊聊。 5 月 8 号():大圣分享|主题:我眼中的 AI Agent 以及通过搭建知识库实例入门 Coze。流程安排:20:00 21:20 大圣分享。 5 月 9 号():艾木分享|主题:Agent 系统的核心构成:Workflow 和 Multiagent Flow(以“Dr.Know”和“卧底”为例,线上答疑。流程安排:20:00 21:00 艾木分享,21:00 21:30 线上答疑。 5 月 10 号():罗文分享|主题:一个方法解锁 COEZ 所有插件的用法+如何自动化解锁每天抓取 X 内容+改写+发布到飞书。流程安排:20:00 21:00 罗文分享。 5 月 11 号():Itao 分享|主题:和 AI 成为搭子,线上答疑。流程安排:20:00 21:00:itao 分享,21:00 21:30 线上答疑。 2. 基础教程: 3. 大圣的胎教级教程中的 Coze 概述: 字节的官方解释:Coze 是新一代一站式 AI Bot 开发平台。无论是否有编程基础,都可以在 Coze 平台上快速搭建基于 AI 模型的各类问答 Bot,从解决简单的问答到处理复杂逻辑的对话。并且,可以将搭建的 Bot 发布到各类社交平台和通讯软件上,与这些平台/软件上的用户互动。 个人认为:Coze 是字节针对 AI Agent 这一领域的初代产品,在 Coze 中将 AI Agent 称之为 Bot。 字节针对 Coze 这个产品部署了两个站点,分别是国内版和海外版。 国内版: 网址:https://www.coze.cn 官方文档教程:https://www.coze.cn/docs/guides/welcome 大模型:使用的是字节自研的云雀大模型,国内网络即可以正常访问。 海外版: 网址:https://www.coze.com 官方文档教程:https://www.coze.com/docs/guides/welcome 大模型:GPT4、GPT3.5 等大模型(可以在这里白嫖 ChatGPT4,具体参考文档:),访问需要突破网络限制的工具,参考文档:https://www.coze.com/docs/zh_cn/welcome.html AI Agent 的开发流程:Bot 的开发和调试页面布局主要分为提示词和人设的区块、Bot 的技能组件、插件、工作流、Bot 的记忆组件、知识库、变量、数据库、长记忆、文件盒子、一些先进的配置、触发器(例如定时发送早报)、开场白(用户和 Bot 初次对话时,Bot 的招呼话语)、自动建议(每当和 Bot 一轮对话完成后,Bot 给出的问题建议)、声音(和 Bot 对话时,Bot 读对话内容的音色)。
2025-03-16
请帮我整理关于AI最新进展和应用的介绍内容
以下是关于 AI 最新进展和应用的介绍: 医疗领域: ChatGPT 和 Google Bard 等技术极大加速了医疗健康生物制药的研究。AI 在抗癌、抗衰老、早期疾病防治等方面发挥着重要作用。 提前三年诊断胰腺癌。 两名高中生与医疗技术公司合作发现与胶质母细胞瘤相关的新靶基因。 帮助抗衰老,筛查超过 80 万种化合物发现高效药物候选物。 用于寻找阿尔兹海默症的治疗方法。 帮助早期诊断帕金森。 法律法规方面: AI 在许多领域已经取得重大进展和效率提升,如交通监控、银行账户欺诈检测、工业大规模安全关键实践等。 AI 具有巨大的潜力来改变社会和经济,可能产生与电力或互联网相当的影响。 大型语言模型等技术进步带来了变革性的发展机会。 基础通识课方面: 流式训练方式提升了训练速度和质量,基于 Transformer 模型进行流匹配优于扩大模型。 有多种 AI 生成工具,如能创作音乐的 so no 音频生成工具、创建个人 AI 智能体的豆包、生成播客的 Notebook LN。 端侧大模型能部署在手机端等设备,通过压缩解决存储和性能问题。 AI 工程平台对模型和应用有要求,如 define 平台,coach 平台有新版本模板和众多插件工具,还有工作流。 有魔搭社区等为大模型提供服务的平台。 预告了 AI 建站,需安装基础软件帮助文科生和无基础人员建站。
2025-03-15
会议录音文本整理提示词
以下是关于会议录音文本整理提示词的相关内容: 单人发言版:基于李继刚老师的“通知消息整理助手”修改了一份“文字排版大师”的 Prompt,重点 Prompt 语句已标出。 多人发言版:将提示词和文字原文发送给 GPT,GPT 开始整理文字,等待输出完毕后复制粘贴到文本编辑器中,整理并删掉无关内容,使用替换法替换掉双星号。 Claude 官方提示词(中文版含 API Prompt): 会议记录员:将会议浓缩成简明摘要,包括讨论主题、重点内容、行动事项。 俗语解码员:解释常见俗语谚语的意思和来历。 代码优化师:优化 Python 代码性能的建议。 文本补全(Text completion): 提示词(Prompt)设计: 基础知识:模型可完成多种任务,创建提示需明确描述需求,遵循展示和告诉、提供高质量数据、检查设置三个基本准则。 故障排除:若 API 无法正常工作,可检查是否清楚生成的预期结果、是否提供足够示例、示例是否有错误、是否正确使用温度和 top_p。
2025-03-14
整理word格式的ai
很抱歉,您提供的内容中没有关于“整理 word 格式的 AI”的有效信息,无法为您提供准确的回答。您能否再详细描述一下您的需求,比如是要将 AI 相关的内容整理成 word 格式,还是对已有的 word 格式的 AI 文档进行某种处理?
2025-03-14
微信聊天记录整理助手
以下是关于微信群聊总结 AI 助手(JS and Electron ver)的详细介绍: 脚本版本运行: 会弹出二维码,使用微信扫码登录,登录成功后程序持续抓取群聊记录,保存在本地文件中,位置在 data/日期文件夹/群名.txt,不会上传到第三方。 手动运行总结程序,在每天结束时对某个群的内容进行总结,命令为:npm run summarize./data/20230823/xxx.txt 总结语音生成的配置。 项目介绍: 这是基于微信机器人的微信群聊总结助手,能自动收集群聊记录并用 AI 总结发送到指定群聊。 是较简单能实现完整功能的项目,用 JS 简单封装。 每次执行 summarize 命令会生成三个总结文件。 提示:使用本项目登录微信可能存在封号风险,请慎重使用并遵守相关平台规则。 下载与支持: 本项目由免费白嫖 GPT 的智囊 AI技术支持。 自己跑不起来但需要群聊总结的同学,可加机器人微信号:aoao_eth,把机器人拉进群里。 新版本:桌面应用: 可使用桌面版,一键监控、总结、发送,也可用脚本版手动运行监控和总结。 下载后直接打开配置 app key 即可运行监控和总结,一键总结,一键发送到群内。 如需要 windows 版本,可自己构建或者直接代码运行,代码在 app 文件夹中,欢迎构建成功的同学提供 windows 安装包。 截图展示的功能: 每日群聊监控和数据统计(界面实时更新) 一键总结,一键查看总结结果,一键发送到群聊 聊天记录实时查看,直接发送内容到群聊 随时更新的配置,可配置截取的文本长度和结尾词等 机器人状态监控,账号切换 正常运行界面,点击对话可看到实时对话和记录,同时可直接输入内容对话 微信登录界面
2025-03-12
我想学习Ai绘画,请帮我整理一个学习计划。
以下是为您整理的 AI 绘画学习计划: 一、基础学习阶段(12 个月) 1. 第一个月 了解 AI 绘画的基本原理和常用工具,如 StableDiffusion(SD)、Midjourney 等。 学习相关的理论知识,可参考《生成式 AI 导论 2024》李宏毅、Introduction to Image Generation Google AI 课程等。 2. 第二个月 深入学习所选工具的教程,掌握基本操作和功能。 尝试使用不同的提示词进行简单的绘画创作。 二、实践练习阶段(23 个月) 1. 第三个月 针对不同的主题,如人脸、画风、风景、景观、建筑等进行炼丹练习。 注意提高图片数据集的质量,以获得更好的效果。 2. 第四个月 与小伙伴探讨 AI 绘画的变现途径,尝试参与相关项目。 练习绘本风格的绘画。 3. 第五个月 即使在没有硬件支持的情况下,继续学习和巩固知识。 加入相关社群,如 Prompt battle 社群,学习新的技巧和经验。 三、巩固提升阶段(长期) 1. 不断优化提示词,提高绘画的质量和创意。 2. 定期评估学习成果,总结经验教训,调整学习方向。 需要注意的是,学习 AI 绘画需要耐心和持续的实践,祝您学习顺利!
2025-03-07