Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

用 ai 整理图片

Answer

以下是关于用 AI 整理图片的相关内容:

在图像生成与优化方面:

  • 初步生成:使用 DALL-E 3 和 Midjourney(MJ)进行初步图像生成。DALL-E 3 凭借强大的文本识别能力快速生成符合意图的画面,MJ 则通过垫图功能(--Sref 和--iw 组合)确保图像风格一致。
  • 图像优化:对于 DALL-E 3 和 MJ 跑不出来的图,使用 Stable Diffusion(SD)进行图像的细节处理,尤其是局部重绘,例如调整人物的手部细节。通过 magnific.ai 工具对图像进行超分处理,提高画质。

在关键词方面:

  • 主题描述:图片内容分为二维插画和三维立体两种表现形式。描述场景、物体或人物时,应清晰准确,对于场景中的人物最好独立描述。
  • 设计风格:可通过找风格类关键词参考或垫图/喂图,让 AI 生成特定风格的图片。材质相关的关键词有很多门道,需要针对某一种风格单独进行“咒语测试”。

在老照片处理方面:

  • 将照片放入后期处理,使用 GFPGAN 算法使人脸变清晰,但无法使头发、衣服等元素变清晰。
  • 接着将图片发送到图生图中,打开 stableSR 脚本放大两倍,切换到 sd2.1 模型进行修复,vae 选择 vqgan,提示词可不写以免干扰原图。
Content generated by AI large model, please carefully verify (powered by aily)

References

上海国际AIGC大赛第三名—《嘉定汇龙》复盘

我们从一开始就意识到了这一点,就坚持无论如何要把在线文档整理好。小田参与过多个打比赛的项目小组,所以他对在线文档的理解和整理是大厂级别的。在这篇在线文档中,大家就能看到我们整个项目多人、多环节推进的过程:大家可以看到,从1)分镜头的脚本;2)文生图;3)图片的筛选;4)图生视频);5)视频的筛选;6)视频超分到4K每一步都井井有条,如果这些都是靠口喷(大厂里把只动嘴的沟通叫做口喷),是难以为继的。甚至可以说这份在线文档的推进,是我们项目大家伙劲往一处使的根基。并且我们每个小伙伴都非常专业,根据文本来理解画面,用AI跑图。十个人的手跑出的不同的图,最后能够做到画风相对一致、运镜符合科学规律,是并不容易的。5、AIGC跑图的硬功夫在《嘉定汇龙》的制作过程中,我们充分利用了AIGC技术,从图像生成到视频制作,都实现了前所未有的效率和质量。[heading3]图像生成与优化[content]初步生成:我们使用DALL-E 3和Midjourney(MJ)进行初步图像生成。DALL-E 3以其强大的文本识别能力帮助我们快速生成符合意图的画面,而MJ则通过垫图功能(--Sref和--iw组合)确保图像的风格一致。图像优化:D3和MJ跑不出来的图,我们用Stable Diffusion(SD)用于图像的细节处理,尤其是局部重绘,例如调整人物的手部细节。通过magnific.ai工具对图像进行超分处理,进一步提高画质。

进阶技巧和关键词大全总结

这个周末尝试了很多种风格的AI出图,一般图片内容我们会分为二维插画以及三维立体两种主要表现形式。为了生成自己想要的图,上面说的3个结构确实可以帮我们大致输出想要的图片:1.1.主题描述:可以描述一个场景和故事以及其组成的元素、一个物体或者人物的细节、搭配。比如一个动物园,里面有老虎、狮子、长颈鹿、大树、围栏等等或者一个小女在森林里搭帐篷,她穿着红色的裙子以及戴着白色的帽子,但是有时候AI不一定能识别每一个描述的元素,如果要描述一个场景中的人物,大家记得进行独立描述,不要用一长串文字去表达,AI会识别不到,比如一个穿着红色盔甲的男孩站在山顶,那么我们最好把他拆分以下:一个男孩、穿着红色盔甲、站在山顶,这样会更加接近我们想要的场景。但是一个大场景中有多个角色的细节就不太容易通过关键词去生成了。1.2.设计风格:设计风格其实很多设计师没有办法直接表达出来,所以我们在这个步骤会去找一些风格类的关键词参考或者是你找到一张想要的风格的图片,放进去,这种我们就称之为垫图/喂图,让AI根据我们给出的图片风格,结合我们的主题描述生成该风格的图片。还有我研究了一下玻璃、透明塑料、霓虹色彩以及一些透明、反射等材质的关键词,比如你想让一个物体表面透明,但是不要把物体里面的机械结构体现出来,可能需要加一些[设计师](https://www.uisdc.com/tag/%e8%ae%be%e8%ae%a1%e5%b8%88)风格,单纯的控制材质很难达到要求,因为系统判断你表面透明了肯定能看到里面的结构,但是有了结构的话物体就会很复杂,不高级。所以这里面关键词的道道非常多,目前也只能通过大家针对某一种风格单独去进行“咒语测试”。未加风格只描述材质

【SD】用AI给老照片上色,岁月不改它模样

将照片放入到后期处理中,使用GFPGAN算法将人脸变清晰,不知道这个功能的可以参考我这篇文章——[【Stable Diffusion】图片高清化+面部修复+一键抠图,一些你不知道的事儿](http://mp.weixin.qq.com/s?__biz=MzkzMzIwMDgxMQ==&mid=2247487422&idx=1&sn=9cdf7ef37c2acb3c0fc3328d0ba8af74&chksm=c251597af526d06c921ea6728cb2a32bdf1d5f699e19d6ba13b849994e4d01af8a5144132aad&scene=21#wechat_redirect)。这个步骤,可以将我们的五官进行重绘,但是却没有办法将照片中的头发、衣服等其他元素变清晰。所以,接下来我将图片再发送到图生图当中,打开stableSR脚本,放大两倍。这个放大插件是所有插件中对原图还原最精准的,也是重绘效果最好的,不知道的朋友可以参考我的这篇文章——[【Stable Diffusion】超清无损放大器StableSR](http://mp.weixin.qq.com/s?__biz=MzkzMzIwMDgxMQ==&mid=2247487403&idx=1&sn=cbb96534fa6f58c37cf9fc64bc7ade0c&chksm=c251596ff526d0792b4bba0e21b69427b23e780824bdc75b22f1073e8bad6f61f30199fc8344&scene=21#wechat_redirect)。切换到sd2.1的模型进行修复,vae选择vqgan,提示词可以什么都不写,以免对原图产生干扰。

Others are asking
如何学习AI
以下是新手学习 AI 的方法: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,如图像、音乐、视频等,可根据兴趣选择特定模块深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解其工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 对于中学生学习 AI,建议如下: 1. 从编程语言入手学习: 可以从 Python、JavaScript 等编程语言开始学习,学习编程语法、数据结构、算法等基础知识,为后续的 AI 学习打下基础。 2. 尝试使用 AI 工具和平台: 可以使用 ChatGPT、Midjourney 等 AI 生成工具,体验 AI 的应用场景。 探索一些面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识: 了解 AI 的基本概念、发展历程、主要技术如机器学习、深度学习等。 学习 AI 在教育、医疗、金融等领域的应用案例。 4. 参与 AI 相关的实践项目: 参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动。 尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 5. 关注 AI 发展的前沿动态: 关注 AI 领域的权威媒体和学者,了解 AI 技术的最新进展。 思考 AI 技术对未来社会的影响,培养对 AI 的思考和判断能力。 记住,学习 AI 是一个长期的过程,需要耐心和持续的努力。不要害怕犯错,每个挑战都是成长的机会。随着时间的推移,您将逐渐建立起自己的 AI 知识体系,并能够在这一领域取得自己的成就。完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。
2025-03-16
做ai音乐的经验和软件
以下是关于做 AI 音乐的经验和软件的相关内容: 经验方面: 1. 具备一定的 AI 音乐创作经验,如在 UDIO 和 SUNO 上制作过音乐。 2. 熟悉提示词(Prompt)的应用,了解如何使用 Prompt 进行创作。 3. 了解音乐编曲和结构,对编曲、歌曲结构有一定了解。 4. 掌握数字音频工作站(DAW)软件,如 Audition、Studio One 等。 5. 拥有对音乐的热爱,保持对音乐创作的热情和兴趣。 6. 在创建 AI 生成曲子的过程中,注意风格和语言的选择,以确保生成的曲子符合自己的需求。 7. 投喂给 AI 的旋律应保持清晰,避免复杂的节奏构架和变化,以提高 AI 的辨识度和创作效果。 软件方面: 1. 明天学习需要下载 flow 水果软件,可以在淘宝上购买并请人帮忙安装。 2. 可以使用 PS 里的工具进行抠图操作。 3. 利用分离人声的 AI 软件,能够将人声从背景音乐中分离出来。 4. 微软 AI 语音:制作使用了微软声音库制作旁白,语音库支持 147 种语言,还有定制声音。
2025-03-16
ai行业在公开场合比较活跃的大佬有哪些? 他们的相关发言视频有哪些? 这些发言的切片比较合适的tag是?
在 AI 行业公开场合比较活跃的大佬包括谷歌相关研究人员(提出思维链等)。相关发言视频如林粒粒呀的科普视频、安克创新 CEO 阳萌的访谈视频等。发言切片合适的 tag 可能包括“AI 技术原理”“AI 未来发展”“AI 框架”等。但需要注意的是,目前提供的内容中未明确提及更多活跃大佬及其具体发言视频的详细信息。
2025-03-16
请推荐最新的AI相关进展新闻
以下是一些最新的 AI 相关进展新闻: 在医疗领域: ChatGPT 和 Google Bard 等技术极大加速了医疗健康生物制药的研究,AI 在抗癌、抗衰老、早期疾病防治等方面发挥着重要作用。例如,AI 提前三年诊断胰腺癌;两名高中生与医疗技术公司合作发现与胶质母细胞瘤相关的新靶基因;AI 帮助抗衰老,筛查出高效的药物候选物;利用 AI 寻找阿尔兹海默症的治疗方法;使用神经网络分析患者体液中的生物标志物以早期诊断帕金森。 在技术应用方面: AI Agent 的突破让行业看到更多可能性,如机器人获得自主行动能力。AI 编程工具的进展预示着人机协作模式的变革。 2024 年 AI 关键进展时间线包括:2 月 OpenAI 发布视频生成模型 Sora;3 月 Suno 发布 V3 版本;4 月 Meta 发布高性能开源大模型 Llama3;5 月 GPT4 发布等。 赛博月刊显示,AI 音频公司在效果和延迟方面取得突破,3D 世界生成领域处于初级阶段但有望在明年取得巨大进步,AI 应用的更新集中在搜索、知识库、编程等领域,越来越多应用公司受到资本青睐。
2025-03-16
哪些AI工具可以分析链接里的内容
以下是一些可以分析链接里内容的 AI 工具: AI Share Card:这是一款 AI 浏览器插件,能够一键解析各类网页内容,生成推荐文案,把分享链接转换为精美的二维码分享卡,让网页链接分享看起来更高级。适用于图文内容、专栏转发与推广、剧集分享、产品官网推广、商品分享等。 Text2SQL 相关工具: Text2SQL:将英文转换为 SQL 查询。链接:https://toolske.com/text2sql/?ref=theresanaiforthat ai2sql:高效且无错误的 SQL 构建器。链接:https://www.ai2sql.io/ EverSQL:从 SQL 查询翻译英文文本。链接:https://www.eversql.com/sqltotext/ SupaSQL:从 NLP 生成 SQL 查询。链接:https://supasql.com/ SQLgenius:使用自然语言的 SQL 查询生成器。链接:https://sqlgenius.app/ SQL Chat:与数据库进行自然语言聊天的 SQL 客户端。链接:https://www.sqlchat.ai/ SQL Ease:从自然语言输入生成 SQL 查询。链接:https://sqlease.buildnship.in/ Talktotables:翻译和查询数据库。链接:https://talktotables.com/ 此外,还有一些知名的 text2sql 项目,如 SQLNet、Seq2SQL、Spider 等。
2025-03-16
现在有哪些类型的AI智能工具,每个类型分别有哪些主流产品,他们分别有什么优势
以下是一些常见类型的 AI 智能工具、主流产品及其优势: 1. 辅助编程工具: GitHub Copilot:由 GitHub 联合 OpenAI 和微软 Azure 团队推出,支持多种语言和 IDE,能快速提供代码建议,助开发者更快、更少地编写代码。 通义灵码:阿里巴巴推出,提供行级/函数级实时续写、自然语言生成代码等多种能力。 CodeWhisperer:亚马逊 AWS 团队推出,由机器学习技术驱动,为开发人员实时提供代码建议。 CodeGeeX:智谱 AI 推出的开源免费工具,基于 130 亿参数的预训练大模型,可快速生成代码提升效率。 Cody:Sourcegraph 推出,借助强大的代码语义索引和分析能力,了解开发者的整个代码库。 CodeFuse:蚂蚁集团支付宝团队推出的免费代码助手,基于自研基础大模型微调。 Codeium:通过提供代码建议等帮助软件开发人员提高编程效率和准确性。 更多辅助编程 AI 产品,可查看:https://www.waytoagi.com/category/65 。 2. 图生图工具: Artguru AI Art Generator:在线平台,生成逼真图像,为设计师提供灵感。 Retrato:将图片转换为非凡肖像,有 500 多种风格选择,适合制作个性头像。 Stable Diffusion Reimagine:通过稳定扩散算法生成精细、具细节的全新视觉作品。 Barbie Selfie Generator:将上传照片转换为芭比风格,效果好。 这些工具通过组合技术生成创意且质量不错的相似图像,但存在性能不稳定、生成内容不当等局限。 3. PPT 制作工具: Gamma:在线网站,通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式。https://gamma.app/ 美图 AI PPT:由美图秀秀团队推出,通过输入简单文本描述生成专业 PPT 设计,包含丰富模板库和设计元素。https://www.xdesign.com/ppt/ Mindshow:提供自动布局、图像选择和文本优化等智能设计功能。https://www.mindshow.fun/ 讯飞智文:科大讯飞推出,利用语音识别和自然语言处理技术优势,提供智能文本生成等功能。https://zhiwen.xfyun.cn/
2025-03-16
你可以生成图片吗
以下是关于生成图片的相关信息: Sora 是一种可作为世界模拟器的视频生成模型,能够通过在具有一个帧的时间范围的空间网格中排列高斯噪声的分块来生成图像,可生成不同大小的图像,分辨率高达 2048x2048。 ComfyUI Flux 与 runway 结合可以制作绘画视频,包括生成图片(通过提示词让 flux 生成技术草图、CAD 等)、绘制视频(在 runway 中使用提示词从空白页面开始逐行创建,并把生成的图片作为尾帧)、草图上色(使用 flux 的 controlNet,depth 固定,Union 版本不建议权重调太高)、生成上色后的视频等。 LayerStyle 副本中的 LayerUtility 中的 TextImage 可以从文字生成图片以及遮罩,支持字间距、行间距调整,横排竖排调整,可设置文字的随机变化,包括大小和位置的随机变化。节点选项包括 size_as、font_file、spacing、leading、horizontal_border、vertical_border、scale、variation_range、variation_seed、layout、width、height、text_color、background_color 等。
2025-03-16
我要翻译一张图片内的文字
以下是一些可能有助于您翻译图片内文字的信息: MangaimageTranslator:这是一个具有高效 OCR 和 AI 翻译技术的工具,支持多语言,能够对去文字区域修复上色,重新渲染文本。相关链接:https://github.com/zyddnys/mangaimagetranslator 、https://touhou.ai/imgtrans/ 。
2025-03-15
如何用AI修过曝的图片
以下是一些用 AI 修复过曝图片的方法和相关工具: 1. 使用 MutiDiffusion 插件:不开放大倍数,仅使用分块渲染功能,可在显存不够时放大图片。 2. 辅助工具: 视频放大:https://www.topazlabs.com/topazvideoai 百度网盘分享的 Topaz 全家桶:链接:https://pan.baidu.com/s/1bL4tGfl2nD6leugFh4jg9Q?pwd=16d1 提取码:16d1 Kraken.io:主要用于图像压缩,也提供免费图像放大功能,能保证图像细节清晰度。 Deep Art Effects:强大的艺术效果编辑器,通过 AI 技术放大图像并赋予艺术效果,支持多种滤镜和风格。 RealESRGAN:基于 RealESRGAN 的图像超分辨率增强模型,具有可选的人脸修复和可调节的放大倍数,但使用几次要收费。 Photoshop Generative AI 功能:主要工具包括 Remove tool、Clone brush、Generative fill 以及 Neural filters。 SD 图生图,重绘幅度小一点。 3. 【SD】超清无损放大器 StableSR: 修复需使用 StabilityAI 官方的 Stable Diffusion V2.1 512 EMA 模型,放入 stablediffusionwebui/models/StableDiffusion/文件夹中。 StableSR 模块(约 400M 大小)放入 stablediffusionwebui/extensions/sdwebuistablesr/models/文件夹中。 VQVAE(约 750MB 大小)放在 stablediffusionwebui/models/VAE 中。 在处理过曝图片时,可根据具体情况选择合适的方法和工具。例如,对于复杂的照片,可先在 PS 里进行角度调整和照片裁切,然后使用上述工具和方法进行处理。对于场景方向的指定,可给简单的关键词让 AI 自行决定,避免过多颜色提示词导致画面污染。
2025-03-15
帮我生成一张黑洞吞噬星系的图片
很抱歉,目前无法直接为您生成黑洞吞噬星系的图片。但为您提供以下相关信息: Genie 模型可以为您展示一系列关于宇宙的内容,比如黑洞是怎样吞噬光线的。通过与 Genie 模型的互动,您能感受到宇宙的广阔和神秘,激发对天文学和物理学的兴趣。 有研究利用计算机视觉模型拼凑出了 5500 万光年外的首张黑洞图像,结合了来自世界各地八台望远镜的图像。 如果您想要获得黑洞吞噬星系的图片,建议您通过以下方式: 1. 使用专业的图像设计软件,如 Adobe Photoshop 等,自己创作。 2. 在一些提供图片素材的网站上搜索,如 Unsplash、Pexels 等。
2025-03-13
生成图片的大模型
以下是关于生成图片的大模型的相关信息: SDXL 模型: 是 Stable Diffusion 开发公司最新发布的图像生成大模型。 以往使用的模型多在 sd1.5 官方模型上衍生微调,而 sdxl1.0 版本的官方大模型有极强升级。 base 模型参数数量为 35 亿,refiner 模型参数数量达 66 亿。 由 base 基础模型和 refiner 优化模型构成,可在 base 模型基础上用优化模型绘画,更有针对性优化出图质量。 优势: 审美偏好有很大提升,出图效果直逼 midjourney。 体积和分辨率更大,base+refiner 容量达 13G,基于 10241024 图片训练,可直接生成 1000 分辨率以上图片,细节和绘画质量惊人。 可图大模型: 由快手可图团队开发,基于潜在扩散的大规模文本到图像生成模型。 在数十亿图文对下训练,在视觉质量、复杂语义理解、文字生成(中英文字符)等方面有巨大优势,支持中英双语,在中文特色内容理解方面更具竞争力。更多信息可查看技术报告。 SD 模型入门: 主模型后缀一般为.ckpt 或者.safetensors,体积在 2G 7G 之间。 管理模型需进入 WebUl 目录下的 models/Stablediffusion 目录。 在使用 WebUI 时左上角切换的就是主模型。
2025-03-13
AI赋能办公,包含AI+对话、AI+写作与PPT、图片与视频生成和数据分析,还有面向HR、行政、财务、营销等岗位的AI赋能课
以下是关于 AI 赋能办公的相关内容: GPT 使用场景: 1. 内容生成:可以生成文章、故事、诗歌、歌词等内容。 演示:https://chat.openai.com/ 、https://bard.google.com/extensions 、https://claude.ai/ 2. 聊天机器人:作为聊天机器人后端,提供自然对话体验。 演示: 3. 问答系统:为用户提供准确答案。 4. 文本摘要:生成文本的摘要或概述。 5. 机器翻译:虽非专门设计,但有不错表现。 6. 群聊总结: 7. 代码生成:GPT3 及后续版本可生成代码片段,帮助解决编程问题。 8. 教育:用于教育领域,帮助学生解答问题或提供学习材料。 9. 浏览器插件:webpilot 10. PDF 对话:演示 www.chatpdf.com PPT 相关: 1. 2. AiPPT.cn:爱设计&AiPPT.cn 是一家 AIGC 数字科技企业,致力于打造“下一代个人与组织的 Ai 工作站”。旗下产品包括 AiPPT 等超过 10 余款应用 AI 能力的内容创作工具。23 年在 Ai+办公领域推出 AiPPT.cn/AiPPT.com,帮助用户“一分钟一键生成 PPT”,是国内 AiPPT 赛道创业公司第 1 的产品,全球第 4,国内所有 AIGC 产品 PC 端 Top10。目标市场主要是市场、运营、销售、人力、财务、行政、技术、产品、总助、公务员、学生、老师等基层及中高层管理岗位人员。 3. 在众多的 PPT 工具中,AI 带来便捷高效体验。深入了解了五大 AI PPT 工具:MindShow、爱设计、闪击、Process ON、WPS AI,它们各自有鲜明特色和擅长场景。选择合适工具要根据实际需求调整,试用和体验比盲目跟风更明智。 其他: 1. 音视频提取总结:https://bibigpt.co/r/AJ 2. 播客总结:https://podwise.xyz/dashboard/trending 3. 生成脑图:https://xmind.ai/editor/
2025-03-12
上手coze的路径,整理一个教程的列表
以下是上手 Coze 的路径及相关教程列表: 1. 历史活动教程: 5 月 7 号():大聪明分享|主题:Agent 的前世今生,每个分享人分享最初是怎么接触 Coze 的,以及现在用 Coze 做什么。流程安排:20:00@🌈AJ 主持开场,20:00 21:00 大聪明分享,21:00 21:30 关于 Coze 随便聊聊。 5 月 8 号():大圣分享|主题:我眼中的 AI Agent 以及通过搭建知识库实例入门 Coze。流程安排:20:00 21:20 大圣分享。 5 月 9 号():艾木分享|主题:Agent 系统的核心构成:Workflow 和 Multiagent Flow(以“Dr.Know”和“卧底”为例,线上答疑。流程安排:20:00 21:00 艾木分享,21:00 21:30 线上答疑。 5 月 10 号():罗文分享|主题:一个方法解锁 COEZ 所有插件的用法+如何自动化解锁每天抓取 X 内容+改写+发布到飞书。流程安排:20:00 21:00 罗文分享。 5 月 11 号():Itao 分享|主题:和 AI 成为搭子,线上答疑。流程安排:20:00 21:00:itao 分享,21:00 21:30 线上答疑。 2. 基础教程: 3. 大圣的胎教级教程中的 Coze 概述: 字节的官方解释:Coze 是新一代一站式 AI Bot 开发平台。无论是否有编程基础,都可以在 Coze 平台上快速搭建基于 AI 模型的各类问答 Bot,从解决简单的问答到处理复杂逻辑的对话。并且,可以将搭建的 Bot 发布到各类社交平台和通讯软件上,与这些平台/软件上的用户互动。 个人认为:Coze 是字节针对 AI Agent 这一领域的初代产品,在 Coze 中将 AI Agent 称之为 Bot。 字节针对 Coze 这个产品部署了两个站点,分别是国内版和海外版。 国内版: 网址:https://www.coze.cn 官方文档教程:https://www.coze.cn/docs/guides/welcome 大模型:使用的是字节自研的云雀大模型,国内网络即可以正常访问。 海外版: 网址:https://www.coze.com 官方文档教程:https://www.coze.com/docs/guides/welcome 大模型:GPT4、GPT3.5 等大模型(可以在这里白嫖 ChatGPT4,具体参考文档:),访问需要突破网络限制的工具,参考文档:https://www.coze.com/docs/zh_cn/welcome.html AI Agent 的开发流程:Bot 的开发和调试页面布局主要分为提示词和人设的区块、Bot 的技能组件、插件、工作流、Bot 的记忆组件、知识库、变量、数据库、长记忆、文件盒子、一些先进的配置、触发器(例如定时发送早报)、开场白(用户和 Bot 初次对话时,Bot 的招呼话语)、自动建议(每当和 Bot 一轮对话完成后,Bot 给出的问题建议)、声音(和 Bot 对话时,Bot 读对话内容的音色)。
2025-03-16
请帮我整理关于AI最新进展和应用的介绍内容
以下是关于 AI 最新进展和应用的介绍: 医疗领域: ChatGPT 和 Google Bard 等技术极大加速了医疗健康生物制药的研究。AI 在抗癌、抗衰老、早期疾病防治等方面发挥着重要作用。 提前三年诊断胰腺癌。 两名高中生与医疗技术公司合作发现与胶质母细胞瘤相关的新靶基因。 帮助抗衰老,筛查超过 80 万种化合物发现高效药物候选物。 用于寻找阿尔兹海默症的治疗方法。 帮助早期诊断帕金森。 法律法规方面: AI 在许多领域已经取得重大进展和效率提升,如交通监控、银行账户欺诈检测、工业大规模安全关键实践等。 AI 具有巨大的潜力来改变社会和经济,可能产生与电力或互联网相当的影响。 大型语言模型等技术进步带来了变革性的发展机会。 基础通识课方面: 流式训练方式提升了训练速度和质量,基于 Transformer 模型进行流匹配优于扩大模型。 有多种 AI 生成工具,如能创作音乐的 so no 音频生成工具、创建个人 AI 智能体的豆包、生成播客的 Notebook LN。 端侧大模型能部署在手机端等设备,通过压缩解决存储和性能问题。 AI 工程平台对模型和应用有要求,如 define 平台,coach 平台有新版本模板和众多插件工具,还有工作流。 有魔搭社区等为大模型提供服务的平台。 预告了 AI 建站,需安装基础软件帮助文科生和无基础人员建站。
2025-03-15
会议录音文本整理提示词
以下是关于会议录音文本整理提示词的相关内容: 单人发言版:基于李继刚老师的“通知消息整理助手”修改了一份“文字排版大师”的 Prompt,重点 Prompt 语句已标出。 多人发言版:将提示词和文字原文发送给 GPT,GPT 开始整理文字,等待输出完毕后复制粘贴到文本编辑器中,整理并删掉无关内容,使用替换法替换掉双星号。 Claude 官方提示词(中文版含 API Prompt): 会议记录员:将会议浓缩成简明摘要,包括讨论主题、重点内容、行动事项。 俗语解码员:解释常见俗语谚语的意思和来历。 代码优化师:优化 Python 代码性能的建议。 文本补全(Text completion): 提示词(Prompt)设计: 基础知识:模型可完成多种任务,创建提示需明确描述需求,遵循展示和告诉、提供高质量数据、检查设置三个基本准则。 故障排除:若 API 无法正常工作,可检查是否清楚生成的预期结果、是否提供足够示例、示例是否有错误、是否正确使用温度和 top_p。
2025-03-14
整理word格式的ai
很抱歉,您提供的内容中没有关于“整理 word 格式的 AI”的有效信息,无法为您提供准确的回答。您能否再详细描述一下您的需求,比如是要将 AI 相关的内容整理成 word 格式,还是对已有的 word 格式的 AI 文档进行某种处理?
2025-03-14
微信聊天记录整理助手
以下是关于微信群聊总结 AI 助手(JS and Electron ver)的详细介绍: 脚本版本运行: 会弹出二维码,使用微信扫码登录,登录成功后程序持续抓取群聊记录,保存在本地文件中,位置在 data/日期文件夹/群名.txt,不会上传到第三方。 手动运行总结程序,在每天结束时对某个群的内容进行总结,命令为:npm run summarize./data/20230823/xxx.txt 总结语音生成的配置。 项目介绍: 这是基于微信机器人的微信群聊总结助手,能自动收集群聊记录并用 AI 总结发送到指定群聊。 是较简单能实现完整功能的项目,用 JS 简单封装。 每次执行 summarize 命令会生成三个总结文件。 提示:使用本项目登录微信可能存在封号风险,请慎重使用并遵守相关平台规则。 下载与支持: 本项目由免费白嫖 GPT 的智囊 AI技术支持。 自己跑不起来但需要群聊总结的同学,可加机器人微信号:aoao_eth,把机器人拉进群里。 新版本:桌面应用: 可使用桌面版,一键监控、总结、发送,也可用脚本版手动运行监控和总结。 下载后直接打开配置 app key 即可运行监控和总结,一键总结,一键发送到群内。 如需要 windows 版本,可自己构建或者直接代码运行,代码在 app 文件夹中,欢迎构建成功的同学提供 windows 安装包。 截图展示的功能: 每日群聊监控和数据统计(界面实时更新) 一键总结,一键查看总结结果,一键发送到群聊 聊天记录实时查看,直接发送内容到群聊 随时更新的配置,可配置截取的文本长度和结尾词等 机器人状态监控,账号切换 正常运行界面,点击对话可看到实时对话和记录,同时可直接输入内容对话 微信登录界面
2025-03-12
我想学习Ai绘画,请帮我整理一个学习计划。
以下是为您整理的 AI 绘画学习计划: 一、基础学习阶段(12 个月) 1. 第一个月 了解 AI 绘画的基本原理和常用工具,如 StableDiffusion(SD)、Midjourney 等。 学习相关的理论知识,可参考《生成式 AI 导论 2024》李宏毅、Introduction to Image Generation Google AI 课程等。 2. 第二个月 深入学习所选工具的教程,掌握基本操作和功能。 尝试使用不同的提示词进行简单的绘画创作。 二、实践练习阶段(23 个月) 1. 第三个月 针对不同的主题,如人脸、画风、风景、景观、建筑等进行炼丹练习。 注意提高图片数据集的质量,以获得更好的效果。 2. 第四个月 与小伙伴探讨 AI 绘画的变现途径,尝试参与相关项目。 练习绘本风格的绘画。 3. 第五个月 即使在没有硬件支持的情况下,继续学习和巩固知识。 加入相关社群,如 Prompt battle 社群,学习新的技巧和经验。 三、巩固提升阶段(长期) 1. 不断优化提示词,提高绘画的质量和创意。 2. 定期评估学习成果,总结经验教训,调整学习方向。 需要注意的是,学习 AI 绘画需要耐心和持续的实践,祝您学习顺利!
2025-03-07