Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

用50个字概括AI如何修图&绘画

Answer

AI 修图与绘画可通过设定关键词,如主题、环境、气氛等描绘画面,利用其可控与不可控特点,选择擅长和理解的内容创作。

Content generated by AI large model, please carefully verify (powered by aily)

References

AI绘画:关键词指南

主题(加下面的)+环境(背景,周围)+气氛(烈日下,雾蒙蒙,恐怖的,风暴席卷的)+灯光(顶光,雾气光,漫反射的,强对比的)+色彩(低饱和度,颜色鲜艳的,花里胡哨的,强反射的主色调,某种颜色是是accent color)+构图(黄金分割,三分法的,电影镜头,广角,鸟瞰图)+风格参考(超清细节的,照片级别的,写实的,抽象的,2D/3D,4k8k,数字雕刻,概念艺术,水墨,水彩,海报,某个软件,某个游戏,艺术家,艺术平台)[heading4]比如[content]去找自己的喜欢的艺术家风格,放到风格参考的关键词里面去找自己的喜欢的灯光风格,放到灯光的关键词里面去找自己的喜欢的颜色和调色板风格,放到色彩的关键词里

AI艺术的预言 | 菩萨把掌抵在了你的背上

可以从语言学(Linguistics)的角度来研究我们常说提示像“咒语”-高注册(Register)语言应用和自然语言有众多的差异性(Differentiation)比如强目的性(Intentionality),强精确性(Precision)强变异性(Variability),强符号性(Symbolism)探索本能(Exploratory Nature)肢体驱动的画笔,是物理材料之笔语言驱动的画笔,是概念的画笔概念的画笔,描绘观念的织体(Texture)我们掌握着这支笔的雏形创作AI绘画与AI影像但是,这只是握笔的练习,不是创作因为我们没有找到这支笔合适的画布架上绘画已死,电影已死观念,只是偶尔会寄生在它们的残躯上当然,很多人还在膜拜着它们的残躯那么,AI艺术的本体形态是什么AI生成式空间计算(Generative Al Spatial Computing)绘画是有缺损的复现电影是第三者的旁观影像始终是透过一扇窗在观察另一个世界而这扇窗,这面墙,即将被打破很快AI艺术的卢米埃尔(frères Lumière)时刻就会隆隆驶来生成式空间计算的使命是创造生命体验我无法用言语还原这种奇观,只能尽力神说,要有光,你便有了光要有鱼绕着我,你便被鱼围绕要有人类的历史如瀑布下坠般沐浴自己历史就会沐浴你

晨然:万字复盘我的AI作品《Devices》| 解析AI创作中的变与不变

本片核心就是研究,怎么利用AI的可控,和AI的不可控。AI最擅长的就是乱画(不是),所以我很想让它画一下泼墨风格的背景,利用线条和曲线的灵动感。AI不擅长的就是可控的人像,要让它稳定的画一个人物,单帧的不可控性就有20%,动画就更加不可控…最后就会变成调参工程。所以我选择Devices,尤其是常见的物体,不要选择它不理解的物体。这样提示词也可以很简单。

Others are asking
请给出10个 有关 AI 的概念的 知识点 并用150字 进行介绍
以下是 10 个有关 AI 的概念知识点及介绍: 1. 人工智能(AI):目标是让机器展现智慧,是一个广泛的领域。 2. 生成式人工智能(GenAI):旨在让机器产生复杂有结构的内容。 3. 机器学习:使机器能自动从资料中找到公式的手段。 4. 深度学习:基于类神经网络,具有大量参数的更强大手段。 5. 大语言模型(LLMs):具有大量参数的深度学习模型。 6. ChatGPT:基于大型语言模型的对话机器人,能根据输入生成文本回复。 7. AIGC:利用人工智能技术生成包括文本、图像等多种内容的新型生产方式。 8. 统计学基础:包含均值、中位数、方差等统计概念,是 AI 的重要基础。 9. 监督学习:如线性回归、决策树等常用算法。 10. 无监督学习:如聚类、降维等算法。
2025-02-08
我需要你给我生成一些提示词,我会给你我想的想法。《》以内的是想法。《我想写一篇影视解说的文案,写作的视角以我,第一人称的视角来写。想要风格偏幽默风趣一点,就像跟朋友在讲述一样,可以模仿鲁迅先生的手法。而且还想把影片的剧情内容写出来,从开篇到电影的结尾,如果有需要保留原片的地方,请把原片的画面场景以及时间段描述出来。要求这篇文案要附上我自己的内心独白,以此引人深思!请你深度思考后,在做答复!要求字数不少于5000字。》请问我该如何写提示词?请你整理好提示词后发给我
以下是为您生成的一些提示词,希望对您有所帮助: 影视解说文案提示词 1. 以第一人称幽默风趣的口吻,像与朋友讲述般,描绘影片从开篇到结尾的精彩剧情,融入自己的内心独白,模仿鲁迅先生的手法,展现独特的视角和深刻的思考。 2. 用轻松幽默的语言,以我的视角详述影片情节,穿插搞笑的评论和内心想法,借鉴鲁迅先生的讽刺技巧,使解说引人入胜。 3. 以亲切自然的叙述方式,如同与好友聊天,讲述影片故事,从开头至结束,结合鲁迅先生的文风,加入个人的情感起伏和独特见解。 DALL·E 相关提示词 1. 绘画:提及颜料种类、画布纹理和笔触形状/纹理(列表)。 2. 数字:注明使用的软件、阴影技术和多媒体方法(列表)。 3. 基于详细提示使用 DALL·E 3 生成图像,让创意鲜活起来,为提示的每个元素做出大胆有趣的选择。 4. 遵循提示指南,提出四个全新的简单概念,而非完整提示,从上次给出的建议中获取灵感。 请注意,默认方面比率为正方形(1:1),默认风格为摄影,包括相机设置、摄影类型和设备。同时,避免违反服务条款的词汇或概念,不侵犯版权,不使用暗示性或露骨的图像,强调符合 G 级评级的元素。
2025-02-06
如何用AI一天赚50元
以下是一些利用 AI 一天赚 50 元的方法: 1. 开发如“航天小飞侠”这样的 AI 助理模型,为用户解答特定领域的问题,并设置抽奖环节增加体验感。 2. 用 AI 做手机壁纸,通过小红书等平台进行销售,例如 6 元一张,一天卖出一定数量。 3. 利用 AI 进行调酒,根据用户的 MBTI 和星座生成专属鸡尾酒配方,并现场调制销售。 4. 运用以下 AI 工具创作并变现: 研究工具:Claude、ChatGPT、Bing Chat、Perplexity 等。 图片处理:DallE、Leonardo、BlueWillow、Midjourney 等。 版权写作:Rytr、Copy AI、Wordtune、Writesonic 等。 设计:Canva、Clipdrop、Designify、Microsoft Designer 等。 网站搭建:10Web、Framer、Hostinger、Landingsite 等。 视频处理:Klap、Opus、Invideo、Heygen 等。 音频处理:Murf、LovoAI、Resemble、Eleven Labs 等。 SEO 优化:Alli AI、BlogSEO、Seona AI、Clearscope 等。 Logo 设计:Looka、LogoAI、Brandmark、Logomaster 等。 聊天机器人:Droxy、Chatbase、Voiceflow、Chatsimple 等。 自动化工具:Make、Zapier、Bardeen、Postman 等。
2024-12-25
怎么能让AI生成5000字以上的小说或论文?
以下是让 AI 生成 5000 字以上小说或论文的一些方法和经验: 1. 丰富细化:先让 AI 写故事概要和角色背景介绍,并基于此按自己的审美略做修改。使用让 AI 以表格形式输出细节描述的技巧,这样有打破叙事习惯、便于局部调整、确保内容具体等好处。 2. 串联成文:把生成的表格依次复制粘贴,让 AI 照着写文章,过程中可能需要您给点建议。 3. 注意要求:比如某些小说大赛要求最终作品必须是 AI 直接输出的,不能有任何改动,且有字数限制。 4. 标题选择和评估:当文章接近目标字数时,与 AI 讨论标题选项并做整体评估,修改语法错误和表达不一致的地方。 例如,在将 1000 字的文章扩展到 5000 字的过程中,通过与 AI 持续互动,不仅能节省时间,还能提升文章的深度和广度。但也要认识到,人类创作者在利用 AI 工具时,要保持创造力和批判性思维。
2024-12-10
NVIDIA Graphics Device with CUDA capability sm_120 is not compatible with the current PyTorch installation. The current PyTorch install supports CUDA capabilities sm_37 sm_50 sm_60 sm_61 sm_70 sm_75 sm_80 sm_86 sm_90 compute_37. If you want to use th
您好,出现“NVIDIA Graphics Device with CUDA capability sm_120 is not compatible with the current PyTorch installation. The current PyTorch install supports CUDA capabilities sm_37 sm_50 sm_60 sm_61 sm_70 sm_75 sm_80 sm_86 sm_90 compute_37.”这种情况,意味着您所使用的 NVIDIA 显卡的 CUDA 计算能力(sm_120)与当前安装的 PyTorch 版本不兼容。当前安装的 PyTorch 支持的 CUDA 计算能力为 sm_37 至 sm_90 以及 compute_37 。您可能需要重新安装与您显卡 CUDA 计算能力相匹配的 PyTorch 版本,或者升级您的显卡驱动程序来解决此兼容性问题。
2024-11-30
用50个字概括AI如何会议记录&摘要
AI 进行会议记录和摘要可涵盖会议主题、人员、议题等要素,借助相关工具和工作流,如飞书妙记、Kimichat 等,按流程生成和完善。
2024-11-13
零基础学习ai
以下是为零基础学习 AI 提供的建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,可根据自己的兴趣选择特定模块深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 知识库提供了很多实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解其工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 此外,还有一个案例供您参考:二师兄来自上海,是典型的 80 后,房地产行业从业二十年,计算机零基础。2024 年 2 月,他在七彩虹的售后群中,因老哥分享用 AI 绘画的心得,要了 SD 秋叶安装包,下载了教学视频,迈出了 AI 学习的第一步。之后他不断学习和实践,如在 3 月啃完 SD 的所有教程并开始炼丹,4 月与小伙伴探讨 AI 变现途径,5 月加入 Prompt battle 社群,开始 Midjourney 的学习。
2025-02-18
AI数据分析
以下是关于 AI 数据分析的相关内容: ChatGPT 助力数据分析: 本文重点介绍了 AI 与数据分析结合的应用,通过实际案例与相关技巧,描述了 ChatGPT 如何助力数据分析。 实现了两种方式支持多维数据分析: SQL 分析:分析平台自身使用情况,输入一句话可分析用户配置图表相关数据。用户描述想分析的内容,后台连接 DB,附带表结构信息让 AI 输出 SQL 语句,校验为 SELECT 类型后执行返回结果数据,再传给 GPT 分析,最后输出分析结论和建议并返回前端页面渲染图表。 个性化分析:平台支持上传数据,可提供数据信息辅助分析,前端解析文件后传给 GPT 分析,后续步骤与 SQL 分析一致。 分析完成后展示结果数据的图表和分析结论,图表支持折线图和柱状图可随意切换。 生成式 AI 季度数据报告 2024 月 1 3 月: 作者包括郎瀚威 Will、张蔚 WeitoAGI、江志桐 Clara 等。 报告涵盖总体流量概览、分类榜单、文字相关(个人生产力、营销、教育、社交)、创意相关(图像、视频)、音频大类、代码大类、Agent、B2B 垂类等方面。 涉及数据准备、分类标准图谱准备、赛道分析、竞争分析等内容。
2025-02-18
找一个能够生成音乐的AI。我给一个曲名(比如《生日快乐歌》),他就能给我生成不同风格的音乐供我下载。
以下为您推荐能够根据给定曲名生成不同风格音乐并供下载的 AI 工具: 1. Suno AI: 地址:https://www.suno.ai/ 简介:被誉为音乐界的 ChatGPT,能够根据简单提示创造出从歌词到人声和配器的完整音乐作品。 账号要求:需要拥有 Discord、谷歌或微软中的至少一个账号,并确保网络环境稳定。 订阅信息: 免费用户每天 50 积分,每首歌消耗 5 积分,每天可创作 10 首歌曲,每次点击生成两首歌曲。 Pro 用户每月 2500 点数(大约 500 首歌),按月每月 10 美元,按年每月 8 美元,每年 96 美元。 Premier 用户每月 10000 点数(大约 2000 首歌),按月每月 30 美元,按年每月 24 美元,每年 288 美元。 操作模式: 默认模式:包括关闭个性化、歌曲描述、乐器开关、模型选择 v3 等设置。 个性化模式:开启个性化定制,可填写歌词、曲风、标题等。 生成歌词:可使用大模型如 Kimi、GPT、文心一言等生成。 开始生成:填写好所需内容后点击 Create,等待 2 3 分钟即可。 下载:生成后可下载。 2. Udio:由前 Google DeepMind 工程师开发,通过文本提示快速生成符合用户音乐风格喜好的高质量音乐作品。地址:https://www.udio.com/ 3. YuE:支持从歌词生成 5 分钟高质量音乐(含人声与伴奏),多语言支持(中、英、日、韩),覆盖多种音乐风格与专业声乐技术。详细介绍:https://www.xiaohu.ai/c/xiaohuai/yue5
2025-02-18
什么是aigc
AIGC(人工智能生成内容)是一种利用人工智能技术生成各种类型内容的应用方式。它能够通过机器学习和深度学习算法,根据输入的数据和指令生成符合特定要求的内容,在内容创作、广告、媒体等领域有着广泛的应用。 具体来说,AIGC 包括以下方面: 1. 文字生成:使用大型语言模型(如 GPT 系列模型)生成文章、故事、对话等内容。 2. 图像生成:使用 Stable Diffusion、DALLE 等模型生成艺术作品、照片等。 3. 视频生成:使用 Runway、KLING 等模型生成动画、短视频等。 AIGC 作为一种强大的技术,能赋能诸多领域,但也存在多重潜在的合规风险。目前,我国对 AIGC 的监管框架由《网络安全法》《数据安全法》及《个人信息保护法》构成,并与《互联网信息服务算法推荐管理规定》、《互联网信息服务深度合成管理规定》、《生成式人工智能服务管理暂行办法》、《科技伦理审查办法(试行)》等形成了共同监管的形势。 AIGC 主要分为语言文本生成、图像生成和音视频生成。语言文本生成利用马尔科夫链、RNN、LSTMs 和 Transformer 等模型生成文本,如 GPT4 和 Gemini Ultra。图像生成依赖于 GANs、VAEs 和 Stable Diffusion 等技术,应用于数据增强和艺术创作,代表项目有 Stable Diffusion 和 StyleGAN 2。音视频生成利用扩散模型、GANs 和 Video Diffusion 等,广泛应用于娱乐和语音生成,代表项目有 Sora 和 WaveNet。此外,AIGC 还可应用于音乐生成、游戏开发和医疗保健等领域,展现出广泛的应用前景。 例如 AI 文本续写,文字转图像的 AI 图、AI 主持人等,都属于 AIGC 的应用。类似的名词缩写还有 UGC(普通用户生产),PGC(专业用户生产)等。能进行 AIGC 的产品项目也很多,能进行 AIGC 的媒介也很多,包括且不限于: 1. 语言文字类:OpenAI 的 GPT,Google 的 Bard,百度的文心一言,还有一种国内大佬下场要做的的 LLM 都是语言类的。 2. 语音声音类:Google 的 WaveNet,微软的 Deep Nerual Network,百度的 DeepSpeech 等,还有合成 AI 孙燕姿大火的开源模型 Sovits。 3. 图片美术类:早期有 GEN 等图片识别/生成技术,去年大热的扩散模型又带火了我们比较熟悉的、生成质量无敌的 Midjourney,先驱者谷歌的 Disco Diffusion,一直在排队测试的 OpenAI 的 Dalle·2,以及 stability ai 和 runaway 共同推出的 Stable Diffusion。
2025-02-18
多维表格AI接入分享课程有回放么
多维表格 AI 接入分享课程有回放。例如,在“1204|微信超级 AI 知识助手教学(上)—智谱共学营智能纪要”中提到直播有回放。在“飞书多维表格 AI 共学解锁更强大的豆包 2024 年 12 月 21 日”中,王大仙表示分享有回放,可顺着搭建流程使用。
2025-02-18
我的毕业论文是AIGC的陶寺遗址空间可视分析技术研究,请问有何思路
对于您的毕业论文主题“AIGC 的陶寺遗址空间可视分析技术研究”,以下是一些可能的思路供您参考: 首先,深入了解陶寺遗址的相关背景和特点,包括其历史、文化、地理等方面的信息,这将为后续的分析提供基础。 其次,研究 AIGC 技术在空间可视分析方面的应用现状和前沿成果,了解相关的算法、模型和工具。 然后,考虑如何收集和整理陶寺遗址的空间数据,例如通过实地测量、卫星图像、考古记录等方式获取数据,并对数据进行预处理和清洗。 接着,运用合适的 AIGC 技术和算法,对陶寺遗址的空间数据进行可视化呈现,例如创建三维模型、绘制地图、生成动态图像等,以直观展示遗址的空间特征和关系。 在可视化的基础上,进行深入的分析,例如探究遗址的布局规律、空间结构、功能分区等,挖掘潜在的历史和文化信息。 最后,对研究结果进行评估和验证,确保其准确性和可靠性,并提出进一步的改进和优化方向。 希望这些思路能对您有所帮助,祝您顺利完成毕业论文!
2025-02-18
ai修图的原理
AI 修图的原理主要包括以下几个方面: 1. 对于 Stable Diffusion 这类软件,其工作原理类似于学习画画。就像学习梵高的风格,需要大量临摹,而 AI 则通过对成千上万美术风格作品的学习形成大模型,如 Checkpoint。用户要想获得满意的作品,需选择合适的大模型。大模型可在 C 站下载,但需科学上网。 2. ComfyUI 是一个开源的用于生成 AI 图像的图形用户界面,主要基于 Stable Diffusion 等扩散模型。其原理包括 Pixel Space(像素空间)和 Latent Space(潜在空间)。像素空间对应输入图像或随机噪声图像,最终生成的图像也会转换回像素空间。许多操作在潜在空间进行,如通过 KSampler 节点执行采样过程,可通过节点调整潜在空间的操作,如噪声添加、去噪步数等。 3. 扩散过程是从噪声生成图像的过程,通过调度器控制,如 Normal、Karras 等,可选择不同调度器控制在潜在空间中处理噪声及逐步去噪回归到最终图像。时间步数也会影响图像生成的精细度和质量。 在实际的 AI 修图过程中,还涉及到提示词编写、对输出图片的二次和多次微调、确定情绪和风格等锚点再发散联想等操作,以获得更符合需求的修图效果。
2025-02-13
修图ai是哪个
以下是一些常见的修图 AI 工具: 1. Niji·journey 5:在二次元绘画领域表现出色,能够生成令人惊叹的二次元风格角色。 2. 无界 AI:国内网络可稳定使用,有免费出图点数,支持中文关键词输入,无需额外下载风格模型,可直接取用。 如果您想了解更多关于这些工具的详细信息或使用方法,可以进一步向我提问。
2024-12-25
产品修图ai
生成式 AI 在多个领域都有应用,包括为游戏创建 2D 艺术、纹理、3D 模型和协助关卡设计,在营销中有望取代库存艺术、产品摄影和插图,在网页设计、室内设计和景观设计中也已得到应用。在电子商务领域,像 Flair、Booth 和 Bloom 等工具帮助品牌创建引人注目的产品照片,AdCreative、Pencil 可以制作用于电子邮件或社交媒体的营销材料,Frase 或 Writesonic 可以编写经过 SEO 优化的产品描述。未来用户有望仅通过描述期望的审美并点击按钮,就能创建一个完整的电商商店及用于市场营销的材料。 目前 AI 修图新应用存在一些问题,如与移动互联网时代的“美图秀秀”相比缺乏颠覆性创新,而“美图秀秀”等主流修图产品也在积极引入 AI 功能,新应用很难脱颖而出。妙鸭是一个特例,凭借独特的产品功能和用户体验收获大量用户关注和使用,其“先试用后付费”策略和 9.9 元定价有吸引力,且背靠互联网大厂有资源优势,但市场空间和后续发展潜力仍需观察。 在当前阶段,传统移动互联网时代 APP 的免费吸引用户再通过广告等方式实现间接收入的模式或许不再适用于 AI 应用,ToC 创业公司在产品发布早期阶段需做好向用户收费的准备。
2024-12-24
国内有没有智能修图的软件
国内有一些智能修图的软件,例如: 美图秀秀 Meitu:图像编辑软件,在国内有一定的用户基础。 AI 抠图 pixian.ai:专注于图像编辑。 佐糖:用于图像编辑。 此外,还有彩云(通用写作)、360 苏打办公(生产力)、火山翻译(翻译)、360 快剪辑(视频编辑)、昇思 MindSpore(开发者工具)、通义听悟(转录)、图怪兽(资源)、文心一格(图像生成)、美趣 AI(图片生成)、创客贴 AI(平面设计)、图趣 AI(图片生成)、Molica AI(图片生成)等软件也具备相关功能。
2024-12-02
免费的AI修图
以下为一些免费的 AI 修图工具及相关信息: 扣子 + ByteArtist: 网址:https://www.coze.cn/home 优点:不需要翻墙,无收费,可以直接生成。 注册:手机号、抖音号或飞书号。 操作步骤:需要在 coze 的 bot 里面添加绘图插件。 时间:5min。 Midjourney: 网址:https://www.midjourney.com/explore?tab=random 优点:图片和描述相关性更大,风格更加显著。 限制:需要翻墙,需要 gmail 注册,不免费,在 discord 上代理使用。 时间:30 60min。 价格:8$一个月/ 200 张图。 以下是用 AI 快速做一张满意海报的相关内容: 工具:无界 AI 网址:https://www.wujieai.cc/ 优势:国内网络即可稳定使用,有免费出图点数,支持中文关键词输入,无需额外下载风格模型,可直接取用。 模型:皮克斯卡通 关键词类别:场景(如向日葵花田、面包店等)、氛围(如温馨、温暖等)、人物(如父亲和女儿、父亲和儿子)、造型(如发型、发色、服饰、配饰)、情绪(如笑得很开心、大笑、对视等)、道具(如童话书等)、构图(如半身、中景等)、画面(如色彩明艳)。 关于 AI 线上绘画,主流工具如 midjourney(MJ)付费成本较高,stable diffusion(SD)硬件门槛不低,但有像吐司(https://tusiart.com/images/635511733697550450?post_id=635512498197535244&source_id=nzywoVHilkK7o_cqaH31xAh)、哩布(https://www.liblib.ai/)这样的免费在线 SD 工具网站。本教程适用于入门玩家,计划让读者半小时就能自由上手创作绘图。如果有疑问,可通过评论区、微信(designurlife1st,记得备注来意:ai 绘图交流)联系作者。教程内容会持续更新。
2024-11-21
AI修图软件
以下是为您整理的关于 AI 修图软件和相关工具的信息: AI 修图软件: HDAidMaster:云端工具,在建筑设计、室内设计和景观设计领域表现出色,搭载自主训练的建筑大模型 ArchiMaster,软件 UI 和设计成果颜值高。 Maket.ai:主要面向住宅行业,在户型设计和室内软装设计方面有探索,能根据输入需求自动生成户型图。 ARCHITEChTURES:AI 驱动的三维建筑设计软件,在住宅设计早期可引入标准和规范约束设计结果。 Fast AI 人工智能审图平台:形成全自动智能审图流程,能将建筑全寿命周期内的信息集成管理。 AI 去水印工具: AVAide Watermark Remover:在线工具,支持多种图片格式,操作简单,可去除多种元素。 Vmake:可上传最多 10 张图片,快速去除水印,适合社交媒体图片分享。 AI 改图神器:提供智能图片修复去水印功能,支持多种上传方式,操作方便。 用 AI 快速做一张满意的海报: 可以使用无界 AI,网址为 https://www.wujieai.cc/ 。其做图逻辑类似于 SD,优势在于国内网络稳定使用、有免费出图点数、支持中文关键词输入、无需额外下载风格模型可直接取用。使用模型如皮克斯卡通,案例应用场景为朋友圈 po 图,画幅比例选择 1:1。关键词类别包括场景、氛围、人物、造型、情绪、道具、构图、画面、特殊等方面。
2024-11-08
概括论文主要内容
以下是对这三篇论文的主要内容概括: 《20240301:1bit LLMs》 作者:Shuming Ma 等 核心观点:提出新的 1bit LLM 变体 BitNet b1.58,在保持与全精度 Transformer LLM 相同性能的同时,显著降低延迟、内存、吞吐量和能源消耗。 亮点:定义新的训练高性能且成本效益的 LLM 的缩放法则和方法,开启为 1bit LLMs 设计特定硬件的新计算范式。 核心贡献:在 3B 模型大小时,与 FP16 LLM 基线在困惑度和端任务性能方面匹配,同时在内存、延迟和能源消耗方面有显著提升。 动机:解决随着 LLMs 规模和能力快速增长带来的部署挑战和环境经济影响。 《20240227:ScreenAI》 作者:Gilles Baechler 等 核心观点:介绍专门用于理解和处理用户界面和信息图表的视图语言模型 ScreenAI。 亮点:通过结合 PaLI 架构和 pix2struct 的灵活拼贴策略,以及在独特的数据集混合上进行训练,实现了在 UI 和信息图表理解任务上的新最佳性能。 核心贡献:在只有 50 亿参数的情况下,在多个基于 UI 和信息图表的任务上取得新的最佳性能,在其他任务上也表现出色。 动机:解决 UI 和信息图表的复杂性,应对其对单一模型理解、推理和交互提出的挑战。 《20240305:Claude 3》 作者:Anthropic 核心观点:介绍 Anthropic 开发的 Claude 3 模型家族,包括 Opus、Sonnet 和 Haiku,在多模态输入、推理、数学和编码方面表现出色,并分析了安全性和社会影响。 亮点:在多个基准测试中取得最先进的结果,非英语语言流畅度提高,适合全球受众;Claude 3 Opus 在推理、数学和编码方面设定新标准,Haiku 是最快速且成本最低的模型,具备视觉能力。 核心贡献:通过多模态输入能力和工具使用提供丰富上下文和扩展用例。 动机:致力于开发安全、负责任的 AI 系统,支持企业自动化任务、生成收入、进行复杂的财务预测和加速研发。
2025-01-19
简要概括《奇点临近》这本书的内容
《奇点临近》是雷·库兹韦尔的新作,书中描述了宇宙与人类发展的六个阶段。预言未来几十年内技术将迅速提升,改变人类生活,比如通过脑机接口等技术,人类能提升认知能力、逆转衰老、实现数字永生。但这些技术也带来潜在风险,如 AI 失控和基因编辑滥用。库兹韦尔的预见为我们描绘了一个激动人心又充满挑战的未来。
2024-12-18
文心一言的开发公司是谁,功能特点,优势性和局限性请帮我简要概括
文心一言是由百度开发的全新一代知识增强大语言模型。 功能特点: 在计算、逻辑推理、生成与创作、传统安全这 4 大基础能力上排名国内第一。 在代码、知识与百科、语言理解与抽取、工具使用能力上排名国内前三。 各项能力表现均衡且大部分能力水平较高。 能力栈广泛,可应用场景较多,重点推荐在查询搜索知识应用、任务拆解规划 Agent、文案写作以及代码编写及纠错等方面的应用,在逻辑推理方面表现不俗,可关注在科学研究、教育、工业方面的落地能力。 优势: 能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。 局限性: 从某些测试和感觉来看,其能力水平可能在 GPT3 的阶段,输出内容的可靠性与 ChatGPT 相比还有差距。
2024-11-22
用20个字概括AI会议记录&摘要
AI 会议记录与摘要涵盖多场景多领域内容
2024-11-13
用20个字概括AI文档撰写和ppt制作
AI 文档撰写和 PPT 制作涵盖多种工具与应用场景,如 Gamma、美图 AI PPT 等,可辅助教学等工作。
2024-11-13