直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

带有文字的AI绘画

回答

以下是关于带有文字的 AI 绘画的相关内容:

方法一

  • 先在 PS 中做一张任意文字的图片,黑底白字,文字可做任意变形处理,完成之后适当虚化,让边缘不至于很生硬。
  • 将图片放入 ControlNet 中,预处理器选择 inpaint_global_harmonious 全局重绘,模型选择 lightingBasedPicture。
  • 控制权重设置为 0.7,介入时机为 0.2,终止时机为 0.6。这些参数主要控制文字在画面中的显眼程度,要让文字可以被识别,但是又不能太明显,融合得还要自然,这需要反复调试。
  • 大模型使用 majicmixRealistic,提示词为“1girl,sitting by the window,meditation,soft light,light and shadow,close-up,portrait”,设定好尺寸就可以开始刷图。

方法二

  • 将中文字做成白底黑字,存成图片样式。
  • 使用文生图的方式,使用大模型真实系,如 realisticVisionV20_v20.safetensors[e6415c4892]ControlNet 预设置。
  • 输入关键词,如奶油的英文单词“Cream + Cake”(加强质感),反关键词“Easynegative”(负能量),反复刷机,得到满意的效果即可。
  • 同理可输出 C4D 模型,可自由贴图材质效果,如“3d,blender,oc rendering”。
  • 如果希望有景深效果,也可以打开 depth(增加阴影和质感)。
  • 打开高清修复,分辨率联系 1024 以上,步数:29 - 60。

此外,还有从语言学角度对 AI 艺术的一些探讨,如提示词像“咒语”,具有强目的性、强精确性、强变异性、强符号性和探索本能等特点。AI 艺术的未来可能是生成式空间计算,其使命是创造生命体验。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

【SD】隐藏在光里的秘密,AI造字光与影的艺术~

[title]【SD】隐藏在光里的秘密,AI造字光与影的艺术~作者:白马少年介绍:SD实践派,出品精细教程发布时间:2023-07-27 20:03原文网址:https://mp.weixin.qq.com/s/sA1TBkwQxfIb4V7lrpPOoA一张图,正常看是非常美的画面,缩小了看,就能看到画面中隐隐约约透出的几个文字,虽然经不起细细地推敲,但这恰恰就是AI绘画所独有的浪漫。今天我们就来了解一下,这种隐藏在画里的“藏头诗”该怎么做。先在ps中做一张任意文字的图片,黑底白字,文字可做任意变形处理,完成之后适当虚化,让边缘不至于很生硬。将图片放入controlnet中,预处理器选择inpaint_global_harmonious全局重绘,模型选择lightingBasedPicture。控制权重我设置为0.7,介入时机为0.2,终止时机为0.6。这些参数主要控制的是文字在画面中的显眼程度,要让文字可以被识别,但是又不能太明显,融合的还要自然,这就需要反复去调试了。这里用到的一个controlnet的新模型lightingBasedPicture,是一个可以控制画面当中光影关系的模型,使用它你可以按照自己的想法控制画面当中光源的位置和形状。大模型使用majicmixRealistic,提示词为——1girl,sitting by the window,meditation,soft light,light and shadow,close-up,portrait,设定好尺寸就可以开始刷图了。给大家看一些测试过程中的图片,比如这张我调高了controlnet的权重为0.8,这个时候文字就不是光了,而变成了人物服装的一部分。再看这张,画面的感觉挺好的,但是文字的光感不强,比较难以识别。

教程:SD 做中文文字-持续更新中

Nenly同学的视频教程来了:【“牛逼”的教程来了!一次学会AI二维码+艺术字+光影光效+创意Logo生成,绝对是B站最详细的Stable Diffusion特效设计流程教学!AI绘画进阶应用-哔哩哔哩】https://b23.tv/c33gTIQ还有个群友根据下面的教程自己做了个视频教程非常详细1.将中文字做成白底黑字,存成图片样式2.使用文生图的方式,使用大模型真实系,作者用的realisticVisionV20_v20.safetensors[e6415c4892]ControlNet预设置3.输入关键词,如奶油的英文单词,Cream + Cake(加强质感),反关键词:Easynegative(负能量),反复刷机,得到满意的效果即可。4.同理可输出C4D模型,可自由贴图材质效果,3d,blender,oc rendering5.如果希望有景深效果,也可以打开depth(增加阴影和质感)6.打开高清修复,分辨率联系1024以上,步数:29-60本来想方一个b站视频,但是没有按照上面的实测,等看完之后再推荐当然https://firefly.adobe.com/也可以,但是sd感觉可操控性更强,尤其是中文字体

AI艺术的预言 | 菩萨把掌抵在了你的背上

[title]AI艺术的预言|菩萨把掌抵在了你的背上可以从语言学(Linguistics)的角度来研究我们常说提示像“咒语”-高注册(Register)语言应用和自然语言有众多的差异性(Differentiation)比如强目的性(Intentionality),强精确性(Precision)强变异性(Variability),强符号性(Symbolism)探索本能(Exploratory Nature)肢体驱动的画笔,是物理材料之笔语言驱动的画笔,是概念的画笔概念的画笔,描绘观念的织体(Texture)我们掌握着这支笔的雏形创作AI绘画与AI影像但是,这只是握笔的练习,不是创作因为我们没有找到这支笔合适的画布架上绘画已死,电影已死观念,只是偶尔会寄生在它们的残躯上当然,很多人还在膜拜着它们的残躯那么,AI艺术的本体形态是什么AI生成式空间计算(Generative Al Spatial Computing)绘画是有缺损的复现电影是第三者的旁观影像始终是透过一扇窗在观察另一个世界而这扇窗,这面墙,即将被打破很快AI艺术的卢米埃尔(frères Lumière)时刻就会隆隆驶来生成式空间计算的使命是创造生命体验我无法用言语还原这种奇观,只能尽力神说,要有光,你便有了光要有鱼绕着我,你便被鱼围绕要有人类的历史如瀑布下坠般沐浴自己历史就会沐浴你

其他人在问
怎么学习AI
以下是关于新手学习 AI 的建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,可根据自己的兴趣选择特定模块深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解其工作原理和交互方式。 对于中学生学习 AI,建议如下: 1. 从编程语言入手学习: 从 Python、JavaScript 等编程语言开始,学习编程语法、数据结构、算法等基础知识,为后续的 AI 学习打下基础。 2. 尝试使用 AI 工具和平台: 使用 ChatGPT、Midjourney 等 AI 生成工具,体验 AI 的应用场景。 探索面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识: 了解 AI 的基本概念、发展历程、主要技术如机器学习、深度学习等。 学习 AI 在教育、医疗、金融等领域的应用案例。 4. 参与 AI 相关的实践项目: 参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动。 尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 5. 关注 AI 发展的前沿动态: 关注 AI 领域的权威媒体和学者,了解 AI 技术的最新进展。 思考 AI 技术对未来社会的影响,培养对 AI 的思考和判断能力。 记住,学习 AI 是一个长期的过程,需要耐心和持续的努力。不要害怕犯错,每个挑战都是成长的机会。随着时间的推移,您将逐渐建立起自己的 AI 知识体系,并能够在这一领域取得成就。完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。
2024-11-14
推荐几个出海产品,关于AI伴侣和日记管理等服务产品,不限于app
以下是为您推荐的出海产品,包括 AI 伴侣和日记管理等服务产品: 1. AI Diary:这是一款智能日记应用(https://aidiary.io/),采用人工智能技术,能进行真实对话、情绪和写作分析,为用户生成日记摘要和人工智能生成诗歌,为用户提供更深入的反思和个人成长体验。 2. Descript:这是一个多功能工具(https://www.descript.com),可帮助用户进行写作、录制、转录、编辑、协作和分享视频和播客,具有高精度和速度的转录和更正工具,能快速创建社交媒体平台所需的视频剪辑和字幕等。 3. ResearchAIde:这是一个论文分析工具(https://www.researchaide.org),适用于学生、研究人员和商业专业人士,能快速高效地从研究论文中提取并综合相关信息,还可在一个地方整理研究并轻松浏览多篇论文,提供强大的数据提取能力。 4. AI hits:这是一个 AI 生成的音乐排行榜(https://aihits.co/),包含各种由不同 AI 平台和创作者制作的 TikTok 病毒热门歌曲、翻唱、混音和合作作品。 5. Audio Pen:这是一款语音笔记应用(https://audiopen.ai/),可以记录和总结用户想法,适合喜欢通过说话思考的用户,不仅能录下声音,还能转成文字并进行摘要整理。
2024-11-14
自学AI
以下是关于自学 AI 的一些建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,您将找到一系列为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,您可以根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 此外,您还可以参考心威的学习笔记,比如: 学习笔记:AI for everyone 吴恩达,视频课程:https://waytoagi.feishu.cn/record/MpYtrApUXegqJ0cF4N7cXbuVnXd 学习笔记:Generative AI for Everyone 吴恩达,视频课程:https://waytoagi.feishu.cn/record/ZoOvrMmF4e11Egc5HkxcMWLKnVc
2024-11-14
你觉得ai+健康 会如何发展 ,优势和挑战分别是什么
AI 在健康领域的发展具有巨大潜力,同时也面临着一些优势和挑战。 优势方面: 有助于推进医疗保健中负责任地使用 AI,促进开发价格合理且能拯救生命的药物。 能够为教育者提供支持,例如在学校中提供个性化辅导,从而变革教育模式。 挑战方面: 存在工作场所监视、偏见和岗位替代等风险,可能影响劳动者权益。 可能会出现对劳动者补偿不足、不公平评估工作申请以及妨碍劳动者组织的情况。 对于医疗保健中 AI 应用的安全性需要建立相应的程序来接收和处理相关报告,并采取补救措施。 总之,AI 在健康领域的发展前景广阔,但需要妥善应对潜在的挑战,以实现其最大的价值和效益。
2024-11-14
给我推荐一款免费的数字人AI软件
以下为您推荐几款免费的数字人 AI 软件: HEYGEN: 优点:人物灵活,五官自然,视频生成很快。 缺点:中文的人声选择较少。 使用方法: 1. 点击网址注册后,进入数字人制作,选择 Photo Avatar 上传自己的照片。 2. 上传后效果如图所示,My Avatar 处显示上传的照片。 3. 点开大图后,点击 Create with AI Studio,进入数字人制作。 4. 写上视频文案并选择配音音色,也可以自行上传音频。 5. 最后点击 Submit,就可以得到一段数字人视频。 DID: 优点:制作简单,人物灵活。 缺点:为了防止侵权,免费版下载后有水印。 使用方法: 1. 点击上面的网址,点击右上角的 Create vedio。 2. 选择人物形象,您可以点击 ADD 添加您的照片,或者使用 DID 给出的人物形象。 3. 配音时,您可以选择提供文字选择音色,或者直接上传一段音频。 4. 最后,点击 Generate vedio 就可以生成一段视频。 5. 打开自己生成的视频,可以下载或者直接分享给朋友。 KreadoAI: 优点:免费(对于普通娱乐玩家很重要),功能齐全。 缺点:音色很 AI。 使用方法: 1. 点击上面的网址,注册后获得 120 免费 k 币,这里选择“照片数字人口播”的功能。 2. 点击开始创作,选择自定义照片。 3. 配音时,您可以选择提供文字选择音色,或者直接上传一段音频。 4. 打开绿幕按钮,点击背景,可以添加背景图。 5. 最后,点击生成视频。 此外,还有以下相关的数字人 AI 软件及信息: 网站名:Runway,网址:https://runwayml.com,有网页有 app 方便。 网站名:haiper,网址:https://app.haiper.ai/,免费。 网站名:SVD,网址:https://stablevideo.com/,有免费额度,对于景观更好用。 网站名:Pika,网址:https://pika.art/,收费 https://discord.gg/pika,可控性强,可以对嘴型,可配音。 网站名:PixVerse,网址:https://pixverse.ai/,免费,人少不怎么排队,还有换脸功能。 网站名:Dreamina,网址:https://dreamina.jianying.com/,剪映旗下,生成 3 秒,动作幅度有很大升级,最新 S 模型,P 模型。 网站名:Morph Studio,网址:https://app.morphstudio.com/,还在内测。 网站名:Heygen,网址:https://www.heygen.com/,数字人/对口型。 网站名:Kaiber,网址:https://kaiber.ai/。 网站名:Moonvalley,网址:https://moonvalley.ai/。 网站名:Mootion,网址:https://discord.gg/AapmuVJqxx,3d 人物动作转视频。 网站名:美图旗下,网址:https://www.miraclevision.com/。 网站名:Neverends,网址:https://neverends.life/create,2 次免费体验,操作傻瓜。 网站名:SD,Animatediff SVD deforum,免费,自己部署。 网站名:Leiapix,网址:https://www.leiapix.com/,免费,可以把一张照片转动态。 网站名:Krea,网址:https://www.krea.ai/,12 月 13 日免费公测了。 关于剪映数字人的“私有化”,您可以参考以下步骤: 1. 第一步打开谷歌浏览器,点击链接 https://github.com/facefusion/facefusioncolab 并点击 open colab 就进到程序主要运行界面。在右上角点击“代码执行程序”选择“全部运行”就行,无需安装,无需付费。点击红框对应的 URL 就会打开操作界面。 2. 第二步,点击“source”上传自己的照片和“target”上传之前的剪映数字人视频,保持默认参数,点击“START”就能生成。 3. 第三步:等着自己专属的数字人视频出炉。 有关数字人使用上的问题,欢迎在底部评论区留言,一起交流。同时如果对数字人课程感兴趣的话,欢迎查看通往 AGI 之路 X AI 沃茨的《克隆你自己》课程。在线观看第一节:https://www.bilibili.com/video/BV1yw411E7Rt/?spm_id_from=333.999.0.0 。
2024-11-14
请给我推荐一个AIPPT工具
以下为您推荐一些 AI PPT 工具: Gamma:在文本多级排列方面有一定优势。 AiPPT:便于摒弃呆板单调的表现形式,可一键切换多元模版。 iSlide:能辅助完成 PPT 制作。 创客贴:有助于提升制作效果。 WPS:也是常用的工具之一。 熟练使用这些工具,有助于提高效率,具体的呈现效果您可以根据自己的需求和操作来决定。
2024-11-14
用50个字概括AI如何修图&绘画
AI 修图与绘画可通过设定关键词,如主题、环境、气氛等描绘画面,利用其可控与不可控特点,选择擅长和理解的内容创作。
2024-11-13
帮我看看,把同化的图片用ai绘画二次生成会自己的图片,来售卖这样的想法怎么样
将通过同化的图片用 AI 绘画二次生成的图片进行售卖这种想法是不可取的,并且可能涉及到法律风险和道德问题。 从法律角度来看,同化的图片可能存在版权归属问题,如果未经授权对其进行二次创作并售卖,可能会侵犯原作者的知识产权。 从道德层面上讲,这种行为也不符合诚实和公平的原则。 在 AI 绘画领域,应当尊重原创和知识产权,通过合法合规的方式进行创作和商业活动。
2024-11-13
像midjournal这样的国内外AI绘画社区
以下是为您介绍的像 Midjourney 这样的国内外 AI 绘画社区相关内容: Midjourney 是 AI 绘图领域家喻户晓的产品。其优点在于模型强大,能生成高质量图像,且支持充分的个性化设置。但使用过程不太便捷,需要通过 Discord 应用加入其频道或创建自己的频道并邀请 Midjourney 机器人才能生成图片。从学习难度来看,它的学习曲线较陡峭,在用户体验和易用性方面有待改进。 在“学社说明”中提到,大家一起收集和测试 AI 绘画提示词中的核心关键词,让新手规避无效探索,为相关从业人员节省时间。招募有 Midjourney 账号且喜欢 AI 绘画的人员,扫飞书二维码进群。根据关键词做创意,收录不错的作品。 在“AI 线上绘画教程”中提到,工作中需要大量图片时,AI 生图是高效的解决办法。主流的 Midjourney 付费成本高,Stable Diffusion 硬件门槛不低,但有像这样的免费在线 SD 工具网站。本教程旨在让入门玩家在半个小时内自由上手创作绘图。
2024-11-12
stable diffusion 绘画
以下是关于 Stable Diffusion 绘画的相关内容: 如果您是运营网店的女装店主,在没有资金请模特的情况下,可以用 Stable Diffusion 来制作商品展示图。具体步骤如下: 1. 真人穿衣服拍照,并获取具有真实质感的照片。若身材方面有问题,可借助美图秀秀或 PS 处理。 2. 选好底模,一定要是 realistic 的、真人照片风格的底模,如 majicmixRealistic_v7。 3. 进行换头操作,根据不同平台需求更换,如面向海外市场换白女头,面向中老妇女换妈妈头。 4. 在图生图下的局部重绘选项卡下涂抹自己替换的部分,并设置好 prompts 和 parameters,如“breathtaking cinematic photo, masterpiece, best quality, , blonde hair, silver necklace, carrying a white bag, standing, full body, detailed face, big eyes, detailed hands”。 关于 Stable Diffusion 的工作原理,就像学习画画临摹梵高的作品一样。您花四十年学习的梵高风格相当于 Stable Diffusion 的大模型——Checkpoint。人们将成千上万美术风格的作品练成模型放入 AI 中,AI 就能依照模型画出类似风格的作品。要画出符合心意的作品,首先要选对合适的大模型。大模型可在 C 站(https://civitai.com/)下载,但需要科学上网。有真实系的(Chillmixout)、二次元的(anything)、游戏 CG 风(ReV Animated)等。 用 Stable Diffusion 时,可以把自己想象成画家。在起笔前要确定照片风格,如二次元动漫、三次元现实照片或盲盒模型。确定风格后切换大模型,不同模型代表不同照片风格,即 SD 界面左上角的“Stable Diffusion 模型”。若想生成真人 AI 小姐姐,可选用 chilloutmix 的大模型。关于模型的获取和存放位置,后续会详细介绍。
2024-11-08
目前有哪些开源绘画模型
目前常见的开源绘画模型有: Stable Diffusion:生态最完整,能够加载的框架有 ComfyUI 框架、SD.Next 框架、Stable Diffusion WebUI 框架、diffusers 框架。 MidJourney:模型风格包罗万象,操作简洁,极富美感和艺术感。 Dall·E3(ChatGPT):具有惊人的语义理解能力,可像甲方一样连续修改。 Fooocus:优化程度高,操作简便,类似本地化 mj。 ComfyUI:门槛高,定制化强。 HunYuanDiT:国内第一个开源绘图模型。 SDXL:开源时间为 2023.7。 SD3:开源时间为 2024.6。 KOLORS:开源时间为 2024.7,目前生图质量最高,有相关的教学视频,如“Kolors 中文生图绘画模型开源,快手接连放出高质量开源项目,是否会成为中国的 StabilityAI”等。 Flux:开源时间为 2024.8。
2024-11-07
如何用两张照片,合成一张绘画效果的图
以下是将两张照片合成为一张绘画效果的图的步骤: 1. 利用 Dalle3 绘图,根据以下提示词分别把高中和大学时期的内容绘制成两幅四格漫画: 高中:中午,急急忙忙跑到食堂,排长队买饭。 大学:中午,懒洋洋在宿舍点外卖,直接送到宿舍楼下。 2. 利用 Python 进行图片处理: 统一设置:使用上传的字体,字体颜色黑色。 首先: 在每张图片的上面创建一个空白的白色背景区域(从原图片进行延长,而不是遮盖原图),用来放置文字(高中的图片写上“高中”,大学的图片写上“大学”)。 文字的字体大小设置成 65px,居中显示。 然后: 在图片下方创建一个空白的白色背景区域(从原图片进行延长,而不是遮盖原图),用来放置文字(高中的图片写上),如果句子过长,要注意换行显示。 文字的字体大小设置成 45px,居中显示。 最后把两张图片拼成一张图,高中的图片在左,大学的图片在右。两张图中间放置 50px 的空白区域。 另外,还有一些相关的知识供您参考: Double Exposure 是一种视觉艺术风格,将两个或多个照片合成到一起,创建出具有艺术效果的图像,灵感来自于传统的双重曝光摄影技术。最佳提示词:Double Exposure。 在 Stable Diffusion 中,可以使用【X/Y/Z plot】脚本来做参数对比,例如将 X 轴设置为提示词相关性,取值范围是 1 30。通过对比找到合适的参数,如提示词相关性在 6 11 中间为最佳。还可以使用绘图功能进行局部修改,如增加红色眼镜、去掉衣服上的图案、更换头部或帽子等部分。
2024-11-04
带有文字的AI图片,简单生成
以下是关于简单生成带有文字的 AI 图片的相关内容: 1. 需求分析: 之前的内容无法直接生成对应图片,需用稿定设计等工具处理。此次借助图像流带来一键生成的扣子 Bot。 工作流程包括:用户输入关键词,大模型制作四个金句,根据金句生成画面描述,结合描述和关键词用扣子官方插件生成图片,再用图像流将金句和图片结合。 2. 进阶技巧和关键词: 图片内容分为二维插画和三维立体两种表现形式。 主题描述时,场景和人物等元素要独立清晰描述,避免长串文字导致 AI 识别困难。 设计风格可参考风格类关键词或垫图/喂图,材质关键词的运用有很多门道,需针对特定风格进行“咒语测试”。 3. 增强版 Bot 的场景: 图片理解与生成:在对话框输入诉求可生成相应图片,背后是文本到图片等格式内容的映射关系。 PPT 一键生成:根据上下文输入诉求可生成幻灯片内容和相关模板选择。 PDF 智能制作:根据诉求生成相应可选模板。 系统架构论文一键创作:附注有经过锤炼提取升华而来的提示词中文版和英文版。
2024-10-07
AI 大模型命名 带有-instruct的含义
AI 大模型中带有“instruct”通常与指令微调相关。在大模型的训练过程中,指令微调是其中一个重要阶段。此阶段模型被训练以理解并执行具体指令,例如翻译文本等,从而能够回答问题。指令微调阶段输入的内容通常包括三个部分,如“Instruct:请你翻译下面这段话”“Input:一段英文”“Output:一段中文”。通过指令微调,模型能够更好地按照人类的期望和具体要求进行输出。
2024-09-19
ai可以生成带有剧情的长时期吗
AI 可以生成带有剧情的内容。例如,使用 Pika、Pixverse、Runway、SVD 等工具,可以生成科幻片、战争片、奇幻片等不同类型的视频,包括太空舰队交战、士兵在战壕中准备迎击等场景。同时,还可以为故事加上奇幻元素来弥补平淡的问题。 在 2024 年内,AI 在图片和超短视频的精细操控、生成式短视频、AI 音频、“全真 AI 颜值网红”、游戏 AI NPC、AI 男/女朋友聊天、实时生成内容在社交媒体和广告中的应用、AI Agent、AI 的商业模式、可穿戴全天候 AI 硬件、中国 AI 发展、AI 造成的问题以及相关立法伦理讨论等方面都有不同程度的进展和预期。 到 2025 2027 年,AI 3D 技术和物理规则有望成熟,达到正常人无法区别 AI 生成还是实景拍摄的程度。
2024-09-04
AI 大模型名称中带有instruct是什么意思
在 AI 术语中,名称中带有“instruct”通常具有特定的含义。 以“InstructGPT”为例,它更善于遵循人类的指示,这在 AI 中被称为“对齐(Alignment)”。通过这种方式,可以让模型的输出更加安全,减少错误、幻觉和攻击性语言。这意味着模型能够更好地理解和响应人类的需求,除非被特别要求,否则不会产生不良的输出。 在大语言模型的训练中,“instruct”也出现在指令微调阶段。在这个阶段,模型被训练以理解并执行具体指令,例如翻译文本等,从而能够回答问题。此时输入的内容通常包括“instruct”部分,明确指示模型需要执行的任务。 总之,“instruct”在 AI 大模型中往往与遵循人类指示、进行特定任务的训练和执行相关,旨在使模型的输出更符合人类的期望和要求。
2024-07-26
语音转文字的工具
以下是一些语音转文字的工具: 1. 飞书妙记:https://www.feishu.cn/product/minutes ,是飞书的办公套件之一。 2. 通义听悟:https://tingwu.aliyun.com/home ,阿里推出的 AI 会议转录工具。 3. 讯飞听见:https://www.iflyrec.com/ ,讯飞旗下智慧办公服务平台。 4. Otter AI:https://otter.ai/ ,用于转录采访和会议纪要。 此外,还有 OpenAI 的 wishper,相关链接为: 1. https://huggingface.co/openai/whisperlargev2 2. https://huggingface.co/spaces/sanchitgandhi/whisperjax 。这个项目在 JAX 上运行,后端支持 TPU v48。与 A100 GPU 上的 PyTorch 相比,它要快 70 多倍,是目前最快的 Whisper API。 更多会议记录工具请访问网站:https://waytoagi.com/sites/category/29 。需要注意的是,大部分免费工具都有使用的时间限制,超过一定的免费时间后可能需要付费。同时,在使用时请仔细甄别内容。
2024-11-14
文字生图最好的平台是什么
目前文字生图较好的平台有以下几种: 1. Pika:是一款出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。 2. SVD:如果熟悉 Stable Diffusion,可以直接安装这款最新的插件,在图片基础上直接生成视频。这是由 Stability AI 开源的 video model。 3. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需要注意其是收费的。 4. Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 5. Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 另外,更多的相关网站可以查看: 。内容由 AI 大模型生成,请仔细甄别。
2024-11-14
我给出一段文字,要AI唱出来的工具有吗
以下是一些可以将文字唱出来的 AI 工具: 1. Udio:由前 Google DeepMind 工程师开发,通过文本提示快速生成符合用户音乐风格喜好的高质量音乐作品。网址:https://www.udio.com/ 2. Suno AI:是一款革命性的人工智能音乐生成工具。 网址:https://suno.com/create 优点:回答问题更准确、上下文的衔接更好。 限制:需要翻墙,需要邮箱注册。 时间:10 分钟。 价格:每日有免费额度 10 首歌。 Custom Mode:开启为自己有歌词,关闭则给你随机生成歌词,只要填描述。 Lyrics:直接填歌词即可,可以用熟悉的、喜欢的歌曲原词先感受一下产品功能,会有对比性。 Instrumental:不要歌词、直接出纯音乐的曲子。 Style of Music:写 Prompt 的地方,1 句简短的自然语言描述即可,注意最多 100 字符。 内容由 AI 大模型生成,请仔细甄别。
2024-11-13
幻海映月字体设计文字生成图片
以下是关于幻海映月字体设计文字生成图片的相关内容: Ideogram 2.0 工具教程: 1. 生成图像设置:将魔法提示设置为“关闭”,使用模型 v2.0。 2. 字体版权问题:Ideogram 的 AI 在生成图像时并非使用真实字体,而是通过学习大量文字图像及其外观和风格来生成类似特定风格或字体的文字。 3. 字体生成错误处理: 多次重新生成提示,看是否得到想要的文本。 使用编辑器修改文本、添加或删除部分,然后重新混合图像。 将较长、较复杂的单词更改为较短的同义词。 上传包含所需文本的图像,作为重新混合创建图像的起点和合成源。 4. 版本选择:使用 0.2 或 1.0 版本可能会更稳定。
2024-11-11
用Coze创建AI,能够通过文字生成图片或者视频或者动画或者渲染效果
以下是使用 Coze 创建 AI 的相关信息: 1. 注册 Coze 账号: 访问 Coze 官网,快速注册,开启智能之旅。 Coze 中文名扣子,字节跳动出品。 中文版:https://www.coze.cn/(支持大模型:kimi、云雀)——本次教程使用中文版 Coze。 英文版:https://coze.com/(支持大模型:chatgpt4)。 产品定位:新一代 AI 原生应用开发服务平台,Nextgeneration AI chatbot building platform。 2. 创建机器人: 登录 Coze,可使用抖音或手机号登陆,登陆后选择“创建 Bot”,然后起一个响亮的名字。 工作空间选“个人空间”即可。 小技巧:“图标”AI 可以自动生成,先在“Bot 名称”那里用文字描述想要的图标,图标生成满意后,再把“Bot 名称”改为简洁版名称。 3. 制定任务的关键方法: 在开始设计和开发任何 AI Agent 之前,最关键的第一步是明确定义期望 AI 最终输出的结果。这包括详细描述期望获得的输出内容,如输出是文本、图像、音频还是其他形式的数据,输出的具体格式和结构是什么,确定输出内容的质量标准。 预估任务的可行性。 确定任务的执行形式。以 LearnAndRecord 的一篇文章为例,拆解其结构,基于此进行微调优化。值得注意的是,Coze 支持 Markdown 格式输出 AI 生成的内容,Markdown 作为轻量级文本标记语言,能够有效展示文本、图片、URL 链接和表格等多种内容形式。参照精读结构,评估任务的可行性,生成结果包括文字、图片(思维导图)、音频(原文音频)三类输出格式,前两者可直接用 Markdown 输出/嵌入,音频则需通过 URL 链接跳转外部网页收听。最后结合使用习惯,期望在输入一篇英文原文时,AI Agent 能够按模板要求,直接输出精读结果。
2024-11-09
哪些AI能够根据一段文字自动配图
以下是一些能够根据一段文字自动配图的 AI 工具和方法: 可以让 AI 分析文章内容,给出配图建议和关键词,然后利用这些信息在免费图库中快速找到合适的无版权图片。 有的网站,如 tome、gamma,配图是由 GenAI 根据页面内容生成的。 剪映具有图文成片功能,只需提供文案,就能自动配图配音。
2024-11-08