直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

哪个ai软件可以让一个人的形象或者动物,自由地走起来

回答

有几个AI工具可以将人或动物的形象制作成动画,让它们自由地行走:

  1. GenMo:GenMo是一个基于生成模型的AI动画工具,它可以自动生成各种动画效果,包括人物动作等。用户可以使用GenMo来丰富动画作品,让人物或动物形象动起来。

  2. MagicAnimate:MagicAnimate使用视频扩散模型和外观编码器进行时间建模和身份保持,支持长视频动画。用户可以使用这个工具将静态人物图片变成逼真动画,包括行走的动作。

  3. Runway Motion Brush:Runway是一个创意工具平台,提供视频编辑、图像生成、人工智能训练等功能。它的Motion Brush动态笔刷工具可以让用户创建动态效果,可能适用于制作行走动画。

这些工具各有特点,用户可以根据自己的需求和喜好选择合适的AI动画软件来制作人物或动物行走的动画。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

其他人在问
你知道哪些好用又免费的AI写作
以下为您推荐一些好用又免费的 AI 写作工具: Bing(https://www.bing.com/search?q=Bing+AI&showconv=1&FORM=hpcodx) Claude 2(https://claude.ai/) 常用于营销领域的 AI 工具: Synthesia:允许用户创建由 AI 生成的高质量视频,包括数字人视频。提供多种定价计划,从免费到商业级不等,可用于制作营销视频、产品演示等。 HeyGen:基于云的 AI 视频制作平台,用户可从 100 多个 AI 头像库中选择,并通过输入文本生成数字人视频。适合制作营销视频和虚拟主持人等。 Jasper AI:人工智能写作助手,可用于生成营销文案、博客内容、电子邮件等。提供多种语气和风格选择,写作质量较高。 Copy.ai:AI 营销文案生成工具,可快速生成广告文案、社交媒体帖子、电子邮件等营销内容。有免费和付费两种计划。 Writesonic:AI 写作助手,专注于营销内容创作,如博客文章、产品描述、视频脚本等。提供多种语气和行业定制选项。 好用的 AI 新闻写作工具: Copy.ai:功能强大的 AI 写作助手,提供丰富的新闻写作模板和功能。可快速生成新闻标题、摘要、正文等内容,节省写作时间并提高效率。 Writesonic:专注于写作的 AI 工具,提供新闻稿件生成、标题生成、摘要提取等功能。智能算法可根据用户提供信息快速生成高质量新闻内容,适合新闻写作和编辑人员使用。 Jasper AI:虽然主打博客和营销文案,但也可用于生成新闻类内容。写作质量较高,支持多种语言。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-11-07
给我提供一些,AIGC变现的文章
以下为您提供一些与 AIGC 变现相关的文章: :文中指出随着游戏中生成式人工智能革命的进展,将重塑用户生成内容,创造任何人都能构建游戏的世界,使游戏创作民主化,扩大游戏市场。 :深入探讨了 Transformer 神经网络架构,还提到了王凯大佬的小报童 AI 项目商业解析,主要研究可变现的 AI 项目。 小红书博主方面,如徐若木、李大强、Ai HFBY 等,您可以通过以下链接了解他们的相关内容: 等
2024-11-06
ai提示词是什么
AI 提示词本质上是对模型进行“编程”,通常通过提供一些指令或几个示例来完成。与大多数为单个任务设计的 NLP 服务不同,例如情绪分类或命名实体识别,补全(Completions)和聊天补全(Chat Completions)几乎可用于任何任务,包括内容或代码生成、摘要、扩展、对话、创意写作、风格转换等。 我们的模型通过将文本分解为标记(Token)来理解和处理文本。Token 可以是单词,也可以是字符块。例如,单词“hamburger”被分解成标记“ham”、“bur”和“ger”,而很短且常见的单词像“pear”是一个 Token。在给定的 API 请求中处理的 Token 数量取决于输入和输出长度。作为一个粗略的经验法则,对于英文文本,1 个 Token 大约相当于 4 个字符或 0.75 个单词。 此外,在舞蹈音乐领域也有相关的 AI 提示词示例,如“Punchy 4/4 beats,electro bass,catchy synths,pop vocals,bright pads,clubready mixes,energetic drops”,其中“Punchy 4/4 beats”指节奏感强的四四拍鼓点,“Electro bass”指电子低音,“Catchy synths”指易于记住的合成器旋律或音效,“Pop vocals”指流行音乐风格的主唱,“Bright pads”指明亮的和弦音效,“Clubready mixes”指适合在夜店播放的混音,“Energetic drops”指高潮部分。还有“Chaotic synths”指混乱的合成器音效,“Avantgarde dance”指前卫的舞曲风格,“Disruptive rhythms”指破坏性的节奏等。每个提示都精心制作,以有效地封装各种舞蹈音乐流派的具体特点和大气质量,同时确保适应不同的聆听环境。
2024-11-06
ai的底层逻辑
AI 的底层逻辑主要涉及以下几个方面: 1. 大模型的底层原理: 大语言模型依靠概率计算逐字接龙的方式工作,平时看到的逐字输出并非特效,而是其真实的工作方式。 大模型参数规模的增加,如从 GPT1 的 1.5 亿到 GPT3.5 的 1750 亿,实现了量变到质变的突破,从而“涌现”出智能。这种“涌现”结构在人类的进化和个体学习成长中也存在。 预训练是大模型获取知识的方式,其需要大量时间和算力资源。在没有外部帮助的情况下,大模型的知识信息可能不完备且滞后。 GPT 是生成式预训练转换器模型(Generative Pretrained Transformer),生成式指大模型根据已有输入不断计算生成下一个字词,直至计算出概率最大时结束输出。 2. 必须理解的核心概念: LLM 是 Large language model 的缩写,即大语言模型。 Prompt 是提示词,即输入给大模型的文本内容,其质量会显著影响回答质量。 Token 是大模型语言体系中的最小单元,不同厂商对中文的切分方法不同,通常 1Token≈12 个汉字,大模型的收费和输入输出长度限制以 token 为单位。 上下文指对话聊天内容的前后信息,其长度和窗口会影响大模型回答质量。
2024-11-06
有哪些可以克隆声音,制作 AI 歌手的工具
以下是一些可以克隆声音、制作 AI 歌手的工具: VoiceSwap 推出的 StemSwap 工具,基于浏览器,可将混音曲目分成四部分,隔离人声并转换为其他歌手的声音,用户能从授权歌手名单中选择新声音并下载完整混音或各个音轨。链接:https://www.voiceswap.ai/ 人工智能音频初创公司,如: :将书面内容转化为引人入胜的音频并实现无缝分发。 :提供专业音频、语音、声音和音乐的扩展服务。 Sonantic(被 Spotify 收购):提供完全表达的 AI 生成语音,带来逼真表演。 :利用合成媒体生成和检测带来无限可能。 :一键使内容多语言化,触及更多人群。 :生成听起来真实的 AI 声音。 :为游戏、电影和元宇宙提供 AI 语音演员。 :为内容创作者提供语音克隆服务。 :超逼真的文本转语音引擎。 :使用单一 AI 驱动的 API 进行音频转录和理解。 :提供听起来像真人的新声音。 :从真实人的声音创建逼真的合成语音的文本转语音技术。 :生成听起来完全像您的音频内容。 此外,深度伪造技术(deepfakes)是一种利用 AI 程序和深度学习算法实现音视频模拟和伪造的技术,投入深度学习的内容库越大,合成的视音频真实性越高。粉丝们还会通过 Stems 音轨分离工具将人声与原始歌曲分离,再使用 DiffSVC 等人声转换模型将人声转换成另一位明星的风格,然后将新的人声轨道与原始作品重新拼接在一起实现 AI 翻唱。
2024-11-06
怎么用AI软件将word文档自动 转换成PPT
以下是使用 AI 软件将 Word 文档自动转换成 PPT 的几种方法: 1. 闪击 网址:国内网站,不需要魔法。地址:https://ppt.isheji.com/?code=ysslhaqllp&as=invite 选择模版 输入大纲和要点:由于闪击的语法和准备的大纲内容有一些偏差,可以参考下官方使用指南:https://zhuanlan.zhihu.com/p/607583650 ,将之前准备的大纲转换成适配闪击的语法。 生成 PPT:点击文本转 PPT,并在提示框中选择确定。 在线编辑 导出:导出有一些限制,PPT 需要会员才能导出。 2. 爱设计 网址:国内网站,不需要魔法。输入地址:https://ppt.isheji.com/?code=ysslhaqllp&as=invite ,进行注册和登录。 输入大纲和要点:确定操作方式,目前该工具提供两种方式,包括导入大纲和要点,以及输入主题自动生成大纲和要求。 选择模版并生成 PPT:点击生成 PPT,应用模版。 导出 3. MindShow 网址:国内网站,不需要魔法。地址:https://www.mindshow.fun//home 输入大纲和要点:确定操作方式,目前该工具同样提供两种方式,包括导入大纲和要点和输入主题自动生成大纲和要求。 选择模版并生成 PPT 导出 4. Process ON 网址:https://www.processon.com/ 输入大纲和要点:确定操作方式,目前该工具同样提供两种方式,包括导入大纲和要点和输入主题自动生成大纲和要求。 选择模版并生成 PPT:点击下载,选择导入格式为 PPT 文件,选择模版,再点击下载。如果喜欢用 Process ON 的小伙伴,没有会员,可以某宝买个一天会员。
2024-11-06
最好用的数字人软件
以下是一些常用的数字人软件: 1. HeyGen:这是一个 AI 驱动的平台,能创建逼真的数字人脸和角色。使用深度学习算法生成高质量肖像和角色模型,适用于游戏、电影和虚拟现实等。优点是人物灵活、五官自然、视频生成快;缺点是中文人声选择较少。使用方法:点击网址注册后,进入数字人制作,选择 Photo Avatar 上传自己的照片,上传后效果在 My Avatar 处显示,点开大图后,点击 Create with AI Studio 进入制作,写上视频文案并选择配音音色,也可自行上传音频,最后点击 Submit 得到数字人视频。 2. Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:提供 AI 拟真人视频产品服务和开发,只需上传人像照片和输入内容,平台的 AI 语音机器人会自动转换成语音并合成逼真的说话视频。优点是制作简单、人物灵活;缺点是免费版下载后有水印。使用方法:点击网址,点击右上角的 Create vedio,选择人物形象,可添加自己照片或使用给出的形象,配音时可选择提供文字选择音色或直接上传音频,最后点击 Generate vedio 生成视频,打开可下载或分享。 4. KreadoAI:优点是免费、功能齐全;缺点是音色较 AI。使用方法:点击网址注册后获得 120 免费 k 币,选择“照片数字人口播”功能,点击开始创作并选择自定义照片,配音时可选择提供文字选择音色或直接上传音频,打开绿幕按钮可添加背景图,最后点击生成视频。 此外,剪映数字人也可通过 AI 换脸软件实现“私有化”。具体步骤: 1. 打开谷歌浏览器,点击链接 https://github.com/facefusion/facefusioncolab 并点击 open colab 进到程序主要运行界面,在右上角点击“代码执行程序”选择“全部运行”,无需安装和付费。点击红框对应的 URL 打开操作界面。 2. 点击“source”上传自己的照片和“target”上传之前的剪映数字人视频,保持默认参数,点击“START”生成。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。请注意,这些工具的具体功能和可用性可能会变化。在使用时,请遵守相关使用条款和隐私政策,并注意生成内容的版权和伦理责任。
2024-11-06
什么ai软件可以将pdf转为ppt免费
以下是一些可以将 PDF 转为 PPT 的免费 AI 软件或工具: 1. DeepL(网站):,点击页面「翻译文件」按钮,上传 PDF、Word 或 PowerPoint 文件即可。 2. 沉浸式翻译(浏览器插件):,安装插件后,点击插件底部「更多」按钮,选择「制作双语 BPUB 电子书」、「翻译本地 PDF 文件」、「翻译 THML / TXT 文件」、「翻译本地字幕文件」。 3. Calibre(电子书管理应用):,下载并安装 calibre,并安装翻译插件「Ebook Translator」。 4. 谷歌翻译(网页):,使用工具把 PDF 转成 Word,再点击谷歌翻译「Document」按钮,上传 Word 文档。 5. 百度翻译(网页):,点击导航栏「文件翻译」,上传 PDF、Word、Excel、PPT、TXT 等格式的文件,支持选择领域和导出格式(不过进阶功能基本都需要付费了)。 6. 彩云小译(App):下载后点击「文档翻译」,可以直接导入 PDF、DOC、DOCX、PPT、PPTX、TXT、epub、srt 等格式的文档并开始翻译(不过有免费次数限制且进阶功能需要付费)。 7. 微信读书(App):下载 App 后将 PDF 文档添加到书架,打开并点击页面上方「切换成电子书」,轻触屏幕唤出翻译按钮。 另外,歌者 PPT 也是一款相关工具,它是一款永久免费的智能 PPT 生成工具,具有话题生成、资料转换(支持多种文件格式转 PPT)、多语言支持、海量模板和案例库、在线编辑和分享、增值服务(自定义模板、字体、动效等)等功能。其优势在于免费使用、智能易用、海量案例、资料转 PPT 专业、AI 翻译等,特别适合不太擅长制作 PPT 或者时间紧张的人群。
2024-11-05
文字转视频软件
以下是一些文字转视频的软件和相关信息: 1. Pika:一款出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。 2. SVD:如果熟悉 Stable Diffusion,可以安装这款最新的插件,在图片基础上直接生成视频,它是由 Stability AI 开源的 video model。 3. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需要收费。 4. Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 5. Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 更多的文字转视频的网站可以查看:https://www.waytoagi.com/category/38 。 通过 ChatGPT 生成文案,将这些文案复制到支持 AI 文字转视频的工具内,可实现短视频的自动生成。市面上一些手机剪辑软件也支持文字转视频,如腾讯智影的数字人播报功能、手机版剪映的图文成片功能。这类工具操作相对简单,让大众生产视频更轻松。 Morphstudio 的使用方法: 1. MorphVideoBot 的 Text to Video 命令:/video ,示例:/video Hello World!ar 16:9 motion 5 camera zoom in fps 30 s 5 。 2. MorphBot 的 Image to Video 命令:/animateA cat is walking ar 16:9 motion 5 camera pan up fps 30 。 参数说明: ar(MorphVideoBot 专用):设置视频的宽高比,如 16:9、4:3、1:1、3:4、9:16 等。 motion:调整视频中运动的强度,值越低运动越轻微,值越高运动越夸张。 camera:控制相机运动,如 Zoom(缩放):camera zoom in/out;Pan(平移):camera pan up/down/left/right;Rotate(旋转):camera rotate clockwise/counterclockwise 或 camera rotate cw/ccw;Static(静止):camera static 。 fps:设置视频的帧率,默认是每秒 24 帧。 s(MorphVideoBot 专用):设置视频的时长(秒)。 提示:更详细和描述性的提示可能会在生成的视频中产生更好的结果。可以随意尝试不同的设置以达到期望的效果。 内容由 AI 大模型生成,请仔细甄别。
2024-11-05
有AI英语陪练的软件吗
以下为您介绍一款 AI 英语陪练软件: Coze 可以免费为您提供 24 小时英语陪练服务。使用建议:建议直接使用豆包的语音通话方式,效果更好。 实际演示效果包括: 视频演示:扮演英语水平较差的学习者。 文字交流中的训练纠错。 解读上传的图片或文件的英文内容(目前支持在 Coze 端使用,豆包端暂不支持)。 直接试用: Coze 端使用链接:https://www.coze.cn/store/bot/7354381765919834127 豆包端使用链接:https://www.doubao.com/chat/22308348468226 教学步骤: 创建 AI Bot:首先打开扣子的首页,直接点击左上角的创建 AI Bot 按钮,然后在弹窗输入 Bot 的相关信息即可完成创建,接下来可细化其功能。 设计人设与回复逻辑:根据 AI Bot 的功能需求设计提示词。 调整模型设置:基于功能需求,以聊天为主的 AI Bot 建议多一些对话轮数的记录,可改为 20 轮。 插件:主要使用了英文名言警句可识别图片中的文字并返回结果。 设置开场白和预置问题:预置问题有参考价值。 设置语音:因为是英语陪练 AI Bot,选择比较亲切的英语音色。
2024-11-05
有没有AI相关的体重记录软件
目前常见的 AI 相关软件中,专门用于体重记录的相对较少。但一些综合性的健康管理类 APP 可能会运用到 AI 技术,例如薄荷健康、Keep 等,它们在记录体重的同时,还能基于您的身体数据和饮食运动情况,为您提供个性化的健康建议和健身方案。
2024-11-05
卡通形象变成卡通视频的工具
以下为将卡通形象变成卡通视频的工具及方法: 使用剪映可以实现此操作,具体步骤如下: 1. 生成数字人 在剪映右侧窗口顶部,打开“数字人”选项,选取免费且适合的数字人形象,如“婉婉青春”。软件会播放数字人的声音,可判断是否需要,点击右下角“添加数字人”,软件会生成对应音视频并添加到当前视频轨道中。左下角会提示渲染完成时间,可点击预览查看效果。 2. 增加背景图片 删除先前导入的文本内容,因为视频音频已包含文字。 点击左上角“媒体”菜单,“导入”本地图片,选择一张图片上传,点击图片右下角加号添加到视频轨道(会覆盖数字人)。 拖动轨道右侧竖线使图片与视频对齐,选中轨道,拖动图片角放大至合适尺寸,将数字人拖动到合适位置。 3. 增加字幕 点击文本智能字幕识别字幕,点击开始识别,软件会自动将文字智能分段形成字幕。 至此,数字人视频完成。若希望数字人换脸,需使用另一个工具。 另外,数字人视频的整体制作流程大致分为三步: 1. 创建视频内容:通过输入文稿内容,确定数字人播出的内容。 2. 生成数字人:通过工具及视频内容生产数字人形象及播放语音。 3. AI 换脸:通过 AI 工具,将数字人的脸转换成指定宣传的形象,以便以自己的品牌形式宣传。
2024-11-06
哪些软件可以用来生成卡通形象?
以下是一些可以用来生成卡通形象的软件及相关操作: 1. Midjourney 背景:之前有制作过相关教程,可利用其以图绘图功能生成迪斯尼卡通风格的头像。若没有账号或不懂基础操作,可参考之前的教程。 操作: 选一张满意的图片,在 Discord 社区的 Midjourney 服务器聊天栏点击“+”,上传文件选取图片并发送。 复制图片在浏览器中打开的链接。 在聊天窗口输入/imainge 找到/imagine prompt,将链接放入,加提示词(以英文逗号分隔)和设置参数。 设置参数: iw 1.5:设置参考图片的权重,数值越高与参考图片越接近,默认 0.5,最大 2,可选择中间值调整。 s 500:设置风格强度,个性化、艺术性,数字越大越有创造力和想象力,可设置 0 1000 间任意整数。 v 5:用 Midjourney 的第 5 代版本,需订阅付费,不想付费可用v 4。 no glasses:若不喜欢戴眼镜的图片,可使用此设置。 2. 提示词: 风格提示词:dark fantasy style(黑暗幻想风格)、Pop art(波普艺术)、impressionism(印象派)、Neoimpressionism(后印象派)、fauvism(野兽派)、expressionism(表现主义)、abstract expressionism(抽象表现主义)、cubism(立体主义)、contemporary art(当代艺术)、anime style(动画风格)、cartoon(卡通)、visionary art(视觉艺术)、comic book(漫画书)、streampunk(蒸汽朋克)、dark theme(黑暗主题)、miniature model film(微缩模型电影)、DC Comics(能生成美漫封面的漫画画面)、pixiv(纯二次元风格人像)、style ofAl Williamson(威廉森风格)、Bauhaus Style(包豪斯风格)、Warhol(安迪·沃霍尔风格)、Luminsm(光色主义)、Magic Realism(魔幻现实主义)、fantastic Realism(魔幻现实主义)、Classical Realism(批判现实主义)
2024-11-02
生成卡通形象的AI
以下是关于生成卡通形象的 AI 的相关内容: 1. 通用人物模版:如果想用真人照片生成卡通头像,可以用“真人照片”+“照片描述”+“方法 1 的关键词”来处理。在使用过程中,若生成了满意的图,记得保存,下次同种类型可直接拿来喂图,效果更好。 2. 生成式 AI 和视觉效果:生成式 AI 会被艺术家作为工具,且需要一定程度的用户监督。以漫画家 Yoko Li 为例,用其 70 张图片训练的模型能以令人不安的方式模仿生成图像,每个艺术家都要思考创作方向,训练过的模型能提供更多选项。AI 模型生成的图像通常有非白色背景。在创意资产为重要业务组成部分的行业中,生成式 AI 带来的经济效益提升、创造新风格和概念的灵活性以及生成完整工作成果的能力,将使行业发生明显变化,不仅限于图像,还适用于整个设计领域。 3. 小码哥的 AI 绘画示例:如“一只穿着柔软中国唐代服装的小白兔,超级可爱,电影灯光,复杂的花丝设计,皮克斯风格,拟人化,手持粉色灯笼,大眼睛,微笑,桃花,流动,迷人,不朽,蓬松,闪亮的刷毛,花瓣,童话故事,虚幻引擎 5 和辛烷渲染,令人难以置信的细节,4K,在艺术站流行,华丽,超广角,4K ar 10:16 test video upbeta upbeta upbeta”等十二生肖唐装系的描述。
2024-11-02
Midjourney生成知名动漫或卡通形象受限制了么?
Midjourney 在生成知名动漫或卡通形象时存在一定的限制。例如,在生成角色方面,最好不要生成过多角色,过多甚至可能指 2 个。做人、做动物的情况还好,但对于有拟人角色需求的情况,可能难以生成满意的结果。比如小龙喷火到小兔子举着的礼物盒这种看似简单的需求,可能无法达到满意效果,可能出现动物不拟人或龙的体型超大等情况。对于像中国龙这种数据样本较少的形象,生成符合要求的图很有挑战性。 在视频生成方面,如果想让角色做出一些较大的动作,比如转头、掉眼泪、抬手或更生动的表情变化,现有的技术还不够成熟,还需要更先进的技术、更丰富的数据和更强大的计算能力。此时的策略是尽量规避制作需要大动作表现的视频,如果实在避免不了,可以尝试制作一些只涉及小动作的场景,然后通过加入台词和场景描述来补充细节和深度,帮助观众更好地理解场景背景和角色心理,以弥补视觉上的不足。
2024-10-29
有没有照片生成卡通形象的AI工具
以下为您介绍一些可以将照片生成卡通形象的 AI 工具: Midjourney: 之前有制作过相关的视频教程,教大家从零开始使用并通过简单的提示词生成图片。 利用其以图绘图功能生成迪斯尼卡通风格的头像。具体操作是先选一张满意的照片,在 Discord 社区的 Midjourney 服务器聊天栏点击“+”,上传文件选取图片并发送(记得点击回车或发送按钮)。然后获取图片链接,加上 prompt 提示词发送给 Midjourney 即可。 出门问问: 这是一家以生成式 AI 和语音交互为核心的人工智能公司,提供面向创作者的 AIGC 工具等。 仅需上传一张照片,输入一段文字或者上传一段音频,就可以生成短视频让“照片开口说话”。不同风格的照片如真人、卡通、有胡须遮挡、有眼镜装饰等都可以驱动尝试。 如果您想用真人照片来生成卡通头像,就用“真人照片”+“照片描述”+“方法 1 的关键词”来处理。在使用过程中如果生成了满意的图,记得存起来,下次同种类型可直接拿来喂图,效果更好。
2024-10-10
使用人物Lora生成的图片中有多个人物时,怎么让人物的形象各不相同?
在 Stable Diffusion 中,若使用人物 Lora 生成的图片中有多个人物并想让人物形象各不相同,可参考以下方法: 1. 在提示词中输入数量词(如 2girls 或 3boys 等),再加上各自的描述提示词。若刷图成功率不高,可配合 openpose 控制,做一个多人骨架,以生成多人物构图。 2. 需使用不同的 Lora 来区分人物,但单纯靠提示词可能行不通。 3. 分区控制思路: Multidiffusion 的做法:启用 Tiled Diifusion,打开分区提示词控制,创建文生图画布。启用不同区域,分别填写背景、不同人物的描述词和 Lora。增加 controlnet 的 openpose 控制来稳定人物,但可能存在分区生成的人物连续性低、lora 控制不强等问题。 Latent Couple 的做法(文中未提及,需进一步探索)。 此外,关于 Lora 模型: 1. Lora 可以固定照片的特征,如人物特征、动作特征和照片风格。 2. 点击“生成”下面的第三个按钮,找到 Lora 选项,可添加下载保存到电脑的 Lora 模型,Lora 可叠加使用,但新手不建议使用太多,且 Lora 之间用英文逗号隔开,每个 Lora 后面的数字用于调整权重,一般只会降低权重。选择 Lora 应根据最初想要生成的照片类型决定。
2024-09-27
如何借鉴“决战拜年之巅”:这是一款基于 GLM 大模型开发的微信小程序游戏,玩家在 10 个 AI 角色组成的家人群里,面对“七大姑八大姨”的连环拷问,自由对话打出属于自己的结局。实现一个工作场合的游戏
以下是借鉴“决战拜年之巅”实现一个工作场合游戏的相关要点: 1. 开发背景:“决战拜年之巅”是参加 Globalgamejam 游戏比赛时,在 48 小时内开发的,主题源于“make me laugh”,产品负责人谐音想到江浙沪孝子排行榜的“孝”,结合春节想到做类似拜年的东西。 2. 火爆情况:在参赛群发布半成品后,在 QQ、微信迅速火爆,两天内有 200 万用户,最高峰同时在线 6 万人,服务器一度支持不了,凌晨才做好调整,后续有厂商赞助服务器,上线约一周。 3. 游戏特点:基于 GLM 大模型开发,又称过年模拟器,玩家在 10 个 AI 角色组成的家人群里,面对“七大姑八大姨”的连环拷问自由对话打出结局。 4. 借鉴要点: 明确创新主题和玩法,结合特定场景和需求。 注重用户体验,及时应对服务器等技术支持问题。 利用 AI 技术实现角色互动和自由对话。 需要注意的是,“决战拜年之巅”被认为可能是一个 chatbot 而非严格意义上的游戏。在设计工作场合的游戏时,要明确以下三个点:(具体要点未在提供的内容中明确)
2024-11-02
我想借助AI这个工具学习创意文本生产,写小说或者是具有知识产权的作品,最终实现财务自由,我可以如何规划,应该 做什么?
要借助 AI 工具学习创意文本生产并实现财务自由,您可以参考以下规划: 首先,深入学习和了解 AI 在创意文本生成方面的应用和技术。掌握常见的 AI 写作工具,如某些具有辅助创作功能的软件。 其次,不断提升自己的写作基础和创意能力。阅读大量优秀的小说和文学作品,学习不同的写作风格和技巧,积累丰富的素材和灵感。 然后,制定明确的创作计划。确定自己擅长和感兴趣的小说类型或主题,设定合理的写作目标和进度安排。 在创作过程中,充分利用 AI 工具提供的创意启发和辅助功能,但要注意保持作品的独特性和原创性,避免过度依赖 AI 生成的内容。 完成作品后,积极寻求出版或在合适的平台发布,通过版权销售、付费阅读等方式获取收益。 同时,持续关注市场需求和趋势,不断改进和优化自己的作品,以提高其市场竞争力。 需要注意的是,实现财务自由并非一蹴而就,需要长期的努力和坚持。
2024-10-11
哪个网站可以自由生成艺术字,光影字
以下为您推荐几个可以生成艺术字和光影字的网站及相关信息: 1. MewXAI(https://www.mewxai.cn/):这是一款强大专业且新手友好、操作简单的AI绘画创作平台。其功能包括 MX 绘画、MX Cute、MJ 绘画、边缘检测、室内设计、姿态检测、AI 艺术二维码、AI 艺术字等。AI 艺术字玩法能将光影文字、隐藏文字、艺术字融入艺术作品,美观且实用。 2. 公众号【白马与少年】:如果想要最新的 controlnet 模型,可以添加该公众号,回复【SD】获取。 3. 关于光影艺术字的生成教程: 字体设计:可以用 PS 或 PPT 制作,注意黑底白字。 SD 参数设置: 模型:麦橘 V7 提示词:City Night View,Outdoor,Contrast of Light and Darkness,highrises (可加城市名,如 shanghai) 反向词:NSFW,EasyNegative,badhandv4,ng_deepnegative_v1_75t,16tokennegativedeliberateneg,bad_prompt_version2,lowres,bad anatomy,blurry 迭代步数 30 采样 DDIM ControlNet:控制类型全部,预处理器 none,模型 control_v1p_sd15_brightness,控制权在 0.2,引导介入时机 0.3,引导终止时机 0.9。 进阶版(稳定度还在测试中):ControlNet(再加一个),控制类型 Tile,预处理器 none,模型 control_v11f1e_sd15_tile,控制权在 0.2,引导介入时机 0,引导终止时机 1。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-10-07
让人们自由发布agent的平台
以下是一些让人们自由发布 agent 的平台: 1. Coze:新一代一站式 AI Bot 开发平台,集成丰富插件工具,可拓展 Bot 能力边界,允许自定义插件开发,有详细文档和开发者支持。 2. Microsoft 的 Copilot Studio:主要功能包括外挂数据、定义流程、调用 API 和操作,以及将 Copilot 部署到各种渠道。 3. 文心智能体:百度推出的基于文心大模型的智能体平台,支持开发者打造产品能力。 4. MindOS 的 Agent 平台:允许用户定义 Agent 的个性、动机、知识,以及访问第三方数据和服务或执行工作流。 5. 斑头雁:2B 基于企业知识库构建专属 AI Agent 的平台,适用于多种场景,提供多种成熟模板。 6. 钉钉 AI 超级助理:依托钉钉强大场景和数据优势,在处理高频工作场景方面表现出色。 此外,扣子平台还有一些亮点: 插件丰富,不仅有官方插件,还有开发者自己开发的插件,可降低 Agent 开发难度,实现零代码开发。 可以公开自己的 Bot 配置,能看到别人开发的智能体的 prompt 信息,为学习智能体提供不错的方式。
2024-10-02
AI能够帮人实现财富自由吗
AI 有可能帮助人们实现财富自由,但并非必然。 从周鸿祎免费课 AI 系列第一讲中可知,人工智能的发展如果能在能源等领域实现突破,提高人类的科研水平,如让能源实现自由、让生物学帮助人体更加健康,这可能为人们创造更多的机会和财富。 在“输入咖啡,输出代码:AI 如何将资本转化为劳动力”的内容中提到,AI 软件公司有多种起源和结果,例如运行在现有软件之上的 AI 工具,甚至有可能取代现有软件,或者成为全新的劳动力类别。这意味着 AI 可能会创造新的商业模式和就业机会,从而为人们带来财富。 然而,马斯克在 xAI 动员大会纪要中也提到,AI 给出的答案可能具有争议性,这也说明其发展存在不确定性。 总之,AI 为实现财富自由提供了可能性,但需要人们善于把握机会,适应变化,并合理利用其带来的优势。
2024-09-19