直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

用哪个ai工具可以做双图,人物没变化

回答

以下是一些可以用于生成双图且人物没变化的 AI 工具及相关信息:

  1. Controlnet:正式绘画目前有两种出图方式,包括图生图和 controlnet。但如果底图质量不够,想要 AI 更自由发挥,除了调高重绘幅度,还可以在 controlnet 上有更多探索。输入正负 TAG,设置好图片尺寸、迭代步数、采样器、重绘幅度后等待图片生成。
  2. Midjourney:在网页版中,传一张图片,右下角有小 icon,鼠标 hover 上去会出现 3 个 icon,最左边小人的 icon 可把图片当做角色参考。官方对于角色一致性也给了一些简单的小 Tips。用在 2D 和 3D 角色上效果较好。

您可以根据自己的需求选择适合的工具。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

从游戏截图升级到KV品质,AI居然可以这样用!

正式绘画目前有两种出图方式,他们的区别为图生图和controlnet但如果底图质量不够,想要AI更自由发挥话,除了调高重绘幅度,还可以在controlnet上有更多的探索以上是用了canny找出画面的硬边缘,然后AI根据关键词和形状识别物体的效果,但人物服装和摩托的细节还是有了很大的改变,与游戏内容偏离较大。controlnet包含的功能很多且在不断地更新,本文就不展开详谈了,大家如果想多了解可以直接跳转B站深度学习~[https://www.bilibili.com/video/BV1Ds4y1e7ZB/?spm_id_from=333.337.search-card.all.click](https://www.bilibili.com/video/BV1Ds4y1e7ZB/?spm_id_from=333.337.search-card.all.click)输入正负TAG,设置好图片尺寸、迭代步数、采样器、重绘幅度后,等待图片接锅出炉!以下是个人使用的一些参数推荐

前Sora时代我最想做的AI短片——使用Pika、Pixverse、Runway、SVD四大AI视频工具

(这张双人关系的图我最后没用,因为四个工具都跑不出稳定的视频,我懒得Roll了)(角色一:扎马尾、穿白色T恤、穿牛仔裤的14岁女孩)(角色二:戴眼镜、灰色头发、穿灰色短衬衫的50岁男人)接着,确定了主场景,主场景是四面都是书柜的屋子,但是场景一致性太难保持了,所以我们取巧,用了穿书的方式,把场景分布到不同地区。在室内的镜头,因为AI对书房的理解也还比较相似,尽管有些穿帮的地方,还好主场景出现的时间不算长,倒也还能接受。解决了人物和场景一致性的问题,生图的障碍就还是双人关系镜头的部分。但这次要比上个视频做起来稍微容易一些,因为至少生成关系镜头没有那么麻烦了,MJ的语义理解好多了,部分镜头我们还比较喜欢,比如女孩能在镜子里看到妈妈这个镜头。但我们要自由地生成同场戏内不同角度的关系镜头,还是很难。比如女孩发现不对劲之后,回到书店,问阿叔怎么回事,阿叔没有说话,女孩生气离开这场戏,其实还需要一个两人在书店走廊里的中景或全景镜头,去展示两人的位置关系,但Roll得有点累了。

半个AI圈期待的Midjourney角色一致性首发评测 - 再入迷梦

还是能明显看出区别的。--cw 100的时候,人物的头饰、衣服都是大差不差的;--cw 0的时候,发型和衣服就全变了。至于用法,我比较习惯使用MJ的网页版,体验真不是好的一点半点,网址在此:https://alpha.midjourney.com/登进去之后,传一张图片,就会发现图片的右下角有一个小icon,鼠标hover上去以后就能看到出现了3个icon,最左边那个小人的icon就是把这张图片当做角色参考,中间那个链接icon就是作为风格参考,最右边那个就是仅作为图片prompt,就是传统意义上的图生图。当然,你也可以按住shift,点这三个按钮,就能把这三个全部点亮,形成cref + sref +图片prompt的超级组合拳。。。官方对于角色一致性,也给了一些简单的小Tips。真人和照片肯定是最难的,毕竟需要关注的细节太多,而且"神韵"是一个非常玄学的东西,有时候你就会觉得明明五官是一样的,但是为啥就是不像。。而用在2D和3D角色上,那肯定就会好很多了,毕竟只需要抓住几个主要特征就行,所以从这个功能本身上看,也能猜到,Niji V6的表现,肯定会比MJ V6要好很多。

其他人在问
ai从哪里开始学
学习 AI 是一个长期的过程,新手可以参考以下步骤: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛(比如图像、音乐、视频等),根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。不要害怕犯错,每个挑战都是成长的机会。随着时间的推移,您将逐渐建立起自己的 AI 知识体系,并能够在这一领域取得自己的成就。
2024-12-19
帮助初一孩子学好英语的AI是什么
以下是一些可以帮助初一孩子学好英语的 AI 工具和方法: 1. 工具方面: LingoDeer:使用游戏和互动活动教英语,提供各种课程,有家长仪表板可跟踪孩子进度。 Busuu:提供英语及多种语言课程,多种教学方法,有社区功能可与他人练习口语。 Memrise:用抽认卡和游戏教英语,涵盖多种课程,有社交功能可与亲友一起学习。 Rosetta Stone:使用沉浸式方法教英语,有语音识别功能帮助练习发音。 Duolingo:免费的语言学习应用,课程多样,游戏化方法让学习有趣。 2. 学习方法: 智能辅助工具:如 Grammarly 可进行英语写作和语法纠错。 语音识别和发音练习:如 Call Annie 用于口语练习和发音纠正。 自适应学习平台:如 Duolingo 为孩子量身定制学习计划,提供个性化内容。 智能导师和对话机器人:如 ChatGPT 进行英语会话练习和对话模拟。 在为孩子选择 AI 工具时,要考虑他们的年龄、兴趣和学习风格,还需考虑应用程序的功能和成本。
2024-12-19
帮助孩子学好英语的AI是什么
以下是一些可以帮助孩子学好英语的 AI 工具: 1. LingoDeer:这是一款通过游戏和互动活动教孩子英语的应用程序,提供各种课程,包括字母、数字、语法和词汇等,还有家长仪表板可跟踪孩子进度和设置学习目标。 2. Busuu:另一个流行的语言学习应用,提供英语及多种语言课程,采用多种教学方法,包括音频、视频课程和互动练习,还有社区功能让孩子与世界各地的孩子练习口语。 3. Memrise:使用抽认卡和游戏教孩子英语,提供从基本词汇到会话技巧的课程,具有社交功能可与朋友和家人一起学习。 4. Rosetta Stone:采用沉浸式方法教孩子英语,让孩子在自然环境中学习,还有语音识别功能帮助练习发音。 5. Duolingo:免费的语言学习应用,提供多种语言课程,通过游戏化方法使学习有趣。 在为孩子选择 AI 工具时,要考虑孩子的年龄、兴趣和学习风格,还需考虑应用程序的功能和成本。 此外,使用 AI 进行英语学习的方法还包括: 1. 利用智能辅助工具如 Grammarly 进行写作和语法纠错。 2. 使用语音识别应用如 Call Annie 进行口语练习和发音纠正。 3. 借助自适应学习平台如 Duolingo 获得量身定制的学习计划和个性化内容。 4. 利用智能对话机器人如 ChatGPT 进行会话练习和对话模拟。
2024-12-19
ai模型种类
以下是一些常见的 AI 模型: OpenAI 模型: GPT4 Beta:一组改进 GPT3.5 的模型,可以理解和生成自然语言或代码。 GPT3.5:一组改进 GPT3 的模型,可以理解并生成自然语言或代码。 DALL·E Beta:可以在给定自然语言提示的情况下生成和编辑图像的模型。 Whisper Beta:可以将音频转换为文本的模型。 Embeddings:一组可以将文本转换为数字形式的模型。 Codex Limited Beta:一组可以理解和生成代码的模型,包括将自然语言转换为代码。 Moderation:可以检测文本是否敏感或不安全的微调模型。 GPT3:一组可以理解和生成自然语言的模型。 智谱·AI 模型: WebGLM10B:利用百亿参数通用语言模型(GLM)提供高效、经济的网络增强型问题解答系统。 WebGLM2B MathGLM2B:在训练数据充足的情况下,20 亿参数的 MathGLM 模型能够准确地执行多位算术运算,准确率几乎可以达到 100%。 MathGLM500M MathGLM100M MathGLM10M MathGLMLarge:采用 GLM 的不同变体作为骨干来训练 MathGLM。 ProductHunt 2023 年度最佳产品榜单中的模型: GPT4(免费可用):与人类水平相当的 LLM,是 OpenAI 在深度学习规模扩大方面的最新里程碑,是一个大型多模态模型(接受图像和文本输入,输出文本),在各种专业和学术基准测试中表现出与人类相当的水平。 Midjourney v5(免费):最新、最先进的模型,具有极高的一致性,擅长以更高分辨率解释自然语言 prompt,并支持像使用 tile 这样的重复图案等高级功能。 DALL·E 3(免费可用):代表了生成完全符合文本的图像能力的一大飞跃。 Mistral 7B(免费):是一个具有 73 亿参数的模型,在所有基准测试上超越了 Llama 2 13B,在许多基准测试上超越了 Llama 1 34B,在代码任务上接近 CodeLlama 7B 的性能,同时在英语任务上表现良好。
2024-12-19
ai算法种类
以下是一些常见的 AI 算法种类: 分类算法:如 Categorization Algorithms、Classification Model 等。 聚类方法:如 Cluster Resolution Feature Selection、ClusterBased Splitting、Clustering Methods 等。 动态规划:如 Dynamic Programming 。 超参数相关:如 Hyperparameter Opimization、Hyperparameters 。 图像相关:如 Image And Speech Recognition、Image Classification、Image Classifier、Image Recognition 。 其他:如 Combined Gradient、Dual Algorithm、Dual Problem 等。
2024-12-19
ai原理
AI 的原理包括以下几个方面: 1. 概念:生成式 AI 生成的内容称为 AIGC。 2. 概念与关系: AI 即人工智能。 机器学习是电脑找规律学习,包括监督学习、无监督学习、强化学习。 监督学习使用有标签的训练数据,目标是学习输入和输出之间的映射关系,包括分类和回归。 无监督学习的数据没有标签,算法自主发现规律,经典任务如聚类。 强化学习从反馈中学习,以最大化奖励或最小化损失,类似训小狗。 深度学习是一种参照人脑的方法,具有神经网络和神经元,因层数多被称为深度,神经网络可用于监督学习、无监督学习、强化学习。 生成式 AI 可以生成文本、图片、音频、视频等内容形式。 LLM 是大语言模型,对于生成式 AI,生成图像的扩散模型不是大语言模型;对于大语言模型,生成只是其中一个处理任务,如谷歌的 BERT 模型可用于语义理解(不擅长文本生成),像上下文理解、情感分析、文本分类。 3. 技术里程碑:2017 年 6 月,谷歌团队发表论文《Attention is All You Need》,首次提出 Transformer 模型,它完全基于自注意力机制处理序列数据,无需依赖循环神经网络(RNN)或卷积神经网络(CNN),Transformer 比 RNN 更适合处理文本的长距离依赖性。
2024-12-19
跟公文写作相关的ai写作工具
以下是一些与公文写作相关的 AI 写作工具: 文献管理和搜索: Zotero:结合 AI 技术,能自动提取文献信息,便于管理和整理参考文献。 Semantic Scholar:由 AI 驱动的学术搜索引擎,提供文献推荐和引用分析。 内容生成和辅助写作: Grammarly:通过 AI 技术进行文本校对、语法修正和写作风格建议,提升语言质量。 Quillbot:基于 AI 的重写和摘要工具,可精简和优化内容。 研究和数据分析: Google Colab:提供基于云的 Jupyter 笔记本环境,支持 AI 和机器学习研究,方便数据分析和可视化。 Knitro:用于数学建模和优化,助力复杂数据分析和模型构建。 论文结构和格式: LaTeX:结合自动化和模板,高效处理格式和数学公式。 Overleaf:在线 LaTeX 编辑器,有丰富模板库和协作功能,简化编写过程。 研究伦理和抄袭检测: Turnitin:广泛使用的抄袭检测工具,确保论文原创性。 Crossref Similarity Check:检测潜在抄袭问题。 此外,还有一些中文的内容仿写 AI 工具: 秘塔写作猫:https://xiezuocat.com/ 是 AI 写作伴侣,能推敲用语、斟酌文法、改写文风,还能实时同步翻译,支持全文改写、一键修改、实时纠错并给出修改建议,智能分析文章属性并打分。 笔灵 AI 写作:https://ibiling.cn/ 是智能写作助手,擅长多种文体写作,支持一键改写/续写/扩写,智能锤炼打磨文字。 腾讯 Effidit 写作:https://effidit.qq.com/ 是由腾讯 AI Lab 开发的创作助手,能提升写作效率和创作体验。 对于 AI 新闻写作工具,推荐: Copy.ai:功能强大,提供丰富新闻写作模板和功能,可生成标题、摘要、正文等。 Writesonic:专注写作,提供新闻稿件生成、标题生成、摘要提取等功能。 Jasper AI:主打博客和营销文案,也可用于生成新闻类内容,写作质量高,支持多种语言。 使用这些工具时,应结合自身写作风格和需求,选择最合适的辅助工具。请注意,内容由 AI 大模型生成,请仔细甄别。
2024-12-19
如何快速了解用ai工具写作
以下是快速了解用 AI 工具写作的方法: 1. 确定写作主题:明确您的研究兴趣和目标,选择具有研究价值和创新性的主题。 2. 收集背景资料:使用 AI 工具如学术搜索引擎和文献管理软件搜集相关研究文献和资料。 3. 分析和总结信息:利用 AI 文本分析工具提取关键信息和主要观点。 4. 生成大纲:使用 AI 写作助手生成包括引言、文献综述、方法论、结果和讨论等部分的大纲。 5. 撰写文献综述:借助 AI 工具确保内容准确完整。 6. 构建方法论:根据研究需求,采用 AI 建议的方法和技术设计研究方法。 7. 数据分析:若涉及数据收集和分析,使用 AI 数据分析工具处理和解释数据。 8. 撰写和编辑:利用 AI 写作工具撰写各个部分,并检查语法和风格。 9. 生成参考文献:使用 AI 文献管理工具生成正确格式。 10. 审阅和修改:借助 AI 审阅工具检查逻辑性和一致性,并根据反馈修改。 11. 提交前的检查:使用 AI 抄袭检测工具确保原创性,并进行最后的格式调整。 同时需要注意,AI 工具只是辅助,不能完全替代研究者的专业判断和创造性思维,应保持批判性思维,确保研究质量和学术诚信。 另外,除了上述通用的写作方法,对于创作 AI 短片,您可以考虑以下几点: 确定故事来源:包括原创(如自身经历、梦境、想象)和改编(如经典 IP、名著、新闻、二创)。 进行剧本写作:虽然编剧有一定门槛,但短片创作篇幅较小、情节和角色相对简单,可从自身或朋友经历改编入手,也可对触动您的短篇故事进行改编。多与他人讨论故事,有助于修改和进步。 以下为一些中文的内容仿写 AI 工具: 秘塔写作猫:https://xiezuocat.com/ 它是 AI 写作伴侣,能推敲用语、斟酌文法、改写文风,实时同步翻译,支持全文改写、一键修改、实时纠错并给出修改建议,智能分析文章属性并打分。 笔灵 AI 写作:https://ibiling.cn/ 是得力的智能写作助手,支持多种文体的一键改写/续写/扩写,智能锤炼打磨文字。 腾讯 Effidit 写作:https://effidit.qq.com/ 由腾讯 AI Lab 开发,能提升写作者的写作效率和创作体验。 更多 AI 写作类工具可查看:https://www.waytoagi.com/sites/category/2 请注意,内容由 AI 大模型生成,请仔细甄别。
2024-12-19
AI PDF全文翻译工具
以下是一些可以用于翻译 PDF 全文的 AI 工具和方法: 1. DeepL(网站): ,点击页面「翻译文件」按钮,上传 PDF、Word 或 PowerPoint 文件即可。 2. 沉浸式翻译(浏览器插件): ,安装插件后,点击插件底部「更多」按钮,选择「制作双语 BPUB 电子书」、「翻译本地 PDF 文件」、「翻译 THML/TXT 文件」、「翻译本地字幕文件」。 3. Calibre(电子书管理应用): ,下载并安装 calibre,并安装翻译插件「Ebook Translator」。 4. 谷歌翻译(网页): ,使用工具把 PDF 转成 Word,再点击谷歌翻译「Document」按钮,上传 Word 文档。 5. 百度翻译(网页): ,点击导航栏「文件翻译」,上传 PDF、Word、Excel、PPT、TXT 等格式的文件,支持选择领域和导出格式,但进阶功能基本都需要付费。 6. 彩云小译(App):下载后点击「文档翻译」,可以直接导入 PDF、DOC、DOCX、PPT、PPTX、TXT、epub、srt 等格式的文档并开始翻译,但有免费次数限制且进阶功能需要付费。 7. 微信读书(App):下载 App 后将 PDF 文档添加到书架,打开并点击页面上方「切换成电子书」,轻触屏幕唤出翻译按钮。 8. 浏览器自带的翻译功能:如果一些 PDF 太大,翻译工具不支持,除了将 PDF 压缩或者切分外,还可以转成 HTML 格式,然后使用浏览器自带的网页翻译功能。 请注意,内容由 AI 大模型生成,请仔细甄别。
2024-12-19
目前ai工具排行榜
以下是一些目前常见的 AI 工具排行榜: 1. 创作方面: AI 研究工具:Claude、ChatGPT、Bing Chat、Perplexity 图片处理:DallE、Leonardo、BlueWillow、Midjourney 版权写作:Rytr、Copy AI、Wordtune、Writesonic 设计:Canva、Clipdrop、Designify、Microsoft Designer 网站搭建:10Web、Framer、Hostinger、Landingsite 视频处理:Klap、Opus、Invideo、Heygen 音频处理:Murf、LovoAI、Resemble、Eleven Labs SEO 优化:Alli AI、BlogSEO、Seona AI、Clearscope Logo 设计:Looka、LogoAI、Brandmark、Logomaster 聊天机器人:Droxy、Chatbase、Voiceflow、Chatsimple 自动化工具:Make、Zapier、Bardeen、Postman 市场营销 2. 访问量较大的工具: ChatGPT 以 140 亿次访问量领先,占分析流量的 60%以上。 Character AI 排名第二,访问量达到 38 亿次。 QuillBot 访问量达到 11 亿次。 过去一年,人工智能行业平均每月访问量为 20 亿次,过去 6 个月激增至 33 亿次。 分析的 50 个人工智能工具经历了 10.7 倍的增长率,平均每月访问量增加 2.363 亿次。 ChatGPT、Character AI 和 Google Bard 的净流量分别增长了 18 亿次、4.634 亿次和 6800 万次访问量。 Craiyon、MidJourney 和 Quillbot 在此期间面临最大的流量下降。 美国贡献了 55 亿人次访问量,占总访问量的 22.62%,而欧洲国家合计贡献了 39 亿人次访问量。 AI 聊天机器人工具最受欢迎,访问量达到 191 亿次。 超过 63%的 AI 工具用户通过移动设备访问。 性别数据揭示了一种差异:69.5%是男性用户,而 30.5%是女性用户。
2024-12-19
数字人唱歌ai工具
以下是一些数字人唱歌的 AI 工具及相关信息: 【TecCreative】创意工具箱: 数字人口播配音:输入口播文案,选择数字人形象、目标语言和输出类型,即可生成数字人口播视频。操作指引:输入口播文案——选择目标语言——选择数字人角色——选择输出类型——点击开始生成。 音频合成数字人:上传音频文件,选择数字人角色和输出类型,即可基于音频合成对应的数字人视频。操作指引:上传音频文件——选择数字人角色——选择输出类型——点击开始生成。注意:音频文件支持 MP3 和 WAV 格式,文件大小上限 5M。 电商带货本地生活: 三种方式创作数字人脸:使用逼真的照片或插图人脸、上传自己的照片、利用 DID 自带的 Stable Diffusion 的能力生成想象中的人脸。 三种方式让数字人说话:用 GPT 直接生成脚本让数字人说话、先选好脸再输入脚本、上传自己的音频记录或从电影、电视剧中剪辑台词或吟唱自编歌曲。 AI 数字人: 算法驱动的数字人:开源代码仓库包括 ASR 语音识别(如 openai 的 whisper、wenet、speech_recognition)、AI Agent(大模型有 ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等,Agent 部分可用 LangChain 的模块自定义)、TTS(如微软的 edgetts、VITS、sovitssvc 等)。 人物建模模型可通过手动建模(音频驱动)或 AIGC 的方式生成人物的动态效果(如 wav2lip 模型)。但简单构建方式存在一些问题,如生成指定人物的声音、TTS 生成的音频精确驱动数字人口型及动作、数字人使用知识库做出专业回答等。
2024-12-19
对口型ai工具
以下是一些对口型 AI 工具的相关信息: 即梦 AI:“对口型”是其“视频生成”中的二次编辑功能,现支持中文、英文配音。可上传包含完整人物面容的图片,进行视频生成,待视频生成完成后,点击预览视频下的“对口型”(嘴唇)按钮,输入台词并选择音色,或上传配音文件进行对口型效果生成。目前支持语言为中文(全部音色)、英文(推荐“超拟真”内的音色)。使用技巧包括上传写实/近写实的人物单人图片,输入 prompt 并选择参数生成视频,确保人物无形变等扭曲效果,确保人物生成的情绪与希望匹配的口型内容匹配,在生成的视频下方点击【对口型】,输入或上传需要配音的内容,注意视频生成时长和配音试听时长尽量对齐,点击生成。 HeyGen:是一个 AI 驱动的平台,可以创建逼真的数字人脸和角色。使用深度学习算法生成高质量的肖像和角色模型,适用于游戏、电影和虚拟现实等应用。网址:https://www.heygen.com/ 。 Synthesia:是一个 AI 视频制作平台,允许用户创建虚拟角色并进行语音和口型同步。支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 DID:提供 AI 拟真人视频产品服务和开发,只需上传人像照片和输入要说的内容,平台提供的 AI 语音机器人将自动转换成语音,然后就能合成一段非常逼真的会开口说话的视频。 此外,还有以下一些 AI 视频工具网站: Morph Studio:https://app.morphstudio.com/ ,还在内测。 Kaiber:https://kaiber.ai/ 。 Moonvalley:https://moonvalley.ai/ 。 Mootion:https://discord.gg/AapmuVJqxx ,3d 人物动作转视频。 美图旗下:https://www.miraclevision.com/ 。 Neverends:https://neverends.life/create ,操作傻瓜。 SD:Animatediff SVD deforum ,自己部署。 Leiapix:https://www.leiapix.com/ ,可以把一张照片转动态。 Krea:https://www.krea.ai/ 。 Opusclip:https://www.opus.pro/ ,利用长视频剪成短视频。 Raskai:https://zh.rask.ai/ ,短视频素材直接翻译至多语种。 invideoAI:https://invideo.io/make/aivideogenerator/ ,输入想法>自动生成脚本和分镜描述>生成视频>人工二编>合成长视频。 descript:https://www.descript.com/?ref=feizhuke.com 。 veed.io:https://www.veed.io/ ,自动翻译自动字幕。 clipchamp:https://app.clipchamp.com/ 。 typeframes:https://www.revid.ai/?ref=aibot.cn 。 请注意,这些工具的具体功能和可用性可能会随着时间和技术的发展而变化。在使用这些工具时,请确保遵守相关的使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。
2024-12-19
我想做简洁卡通风格的ai动画,根据故事文案生成的那种,需要保持人物一致性,用哪个工具比较好?
以下是一些适合生成简洁卡通风格、根据故事文案生成动画并保持人物一致性的工具: 1. U 传:在 U 传中,通过点击相应按钮参考角色、风格或图生图,可保持人物一致性。新注册有免费生成额度。 2. 季梦:可辅助写视频提示词,能根据上传的图片生成合理的运镜及提示词,还可写分镜脚本。若为 1.2 版本,选慢速或适中的标准模式,效果更好,且生成的视频无水印。每天给 60 积分。 3. 可玲:可辅助写视频提示词,能根据上传的图片生成合理的运镜及提示词,还可写分镜脚本。每天给 60 积分,可用于日常使用,创作片子可能需买会员,生成的视频有无水印选项。 此外,在使用 Midjourney 生图时,若要保持人物和场景一致性,有两个取巧的方式:一个是像上个视频一样生成动物,动物会比较容易保持一致性;另一个方式是特定的名人或者有特殊属性的人物。在确定影片风格时,比如可以选择皮克斯动画风格。同时,在提示词中利用 cref 命令也有助于保持人物的一致性。
2024-12-18
Changer软件能实现视频中人物的无缝换头吗
Changer 软件可以实现视频中人物的无缝换头。以下是一些相关的操作指引和注意事项: 上传原始视频和换脸图片,点击生成,即可自动识别视频中的人脸并进行替换。 在 TecCreative 创意工具箱中,操作指引为:上传原始视频——上传换脸图片——点击生成。 实战中,通过 JupyterLab 工具中的终端输入相关命令启动 facefusion 程序,在 facefusion 软件界面上传准备好的图片、视频,可看到预览效果,点击开始按钮执行换脸处理,完成后可下载处理后的视频。 此外,还有其他与图片和视频处理相关的方法和技巧,例如利用 MJ 画图、InsightFaceSwap 插件等进行处理。
2024-12-17
国内大模型领域关键人物、关键院校
以下是国内大模型领域的关键人物、关键院校及相关信息: 8 月正式上线的国内大模型: 北京: 百度(文心一言):https://wenxin.baidu.com 抖音(云雀大模型):https://www.doubao.com 智谱 AI(GLM 大模型):https://chatglm.cn 中科院(紫东太初大模型):https://xihe.mindspore.cn 百川智能(百川大模型):https://www.baichuanai.com/ 上海: 商汤(日日新大模型):https://www.sensetime.com/ MiniMax(ABAB 大模型):https://api.minimax.chat 上海人工智能实验室(书生通用大模型):https://internai.org.cn 聊天状态下能生成 Markdown 格式的:智谱清言、商量 Sensechat、MiniMax 目前不能进行自然语言交流的:昇思、书生 受限制使用:MiniMax(无法对生成的文本进行复制输出,且只有 15 元的预充值额度进行体验,完成企业认证后可以进行充值) 特色功能:昇思——生图,MiniMax——语音合成 阿里通义千问、360 智脑、讯飞星火等均不在首批获批名单中。据悉,广东地区获批公司分别为华为、腾讯,科大讯飞系其他地区获批产品。 中文大模型评测收集与调研: InfoQ + 极客帮:https://www.guotaixia.com/post/5124.html GAOKAOBench:地址:https://github.com/OpenLMLab/GAOKAOBench ,是一个以中国高考题目为数据集,测评大模型语言理解能力、逻辑推理能力的测评框架 清华安全大模型测评:地址:http://115.182.62.166:18000 ,清华收集的一个评测集,涵盖了仇恨言论、偏见歧视言论、犯罪违法、隐私、伦理道德等八大类别,包括细粒度划分的 40 余个二级安全类别 JioNLP 个人测评:评测数据集:https://github.com/dongrixinyu/JioNLP/wiki/LLM 评测数据集 ,考察 LLM 模型对人类用户的帮助效果、辅助能力,可否达到一个【智能助手】的水平。题型介绍:选择题来源于中国大陆国内各种专业性考试,重点在于考察模型对客观知识的覆盖面,占比 32%;主观题来源于日常总结,主要考察用户对 LLM 常用功能的效果。 EduTEP:华东师范大学计算机科学与技术学院 EduNLP 团队组建智能教育算法测评小组,开发智能教育可信评测平台(EduTEP)。EduTEP 对比多种大模型在教育领域中的综合性能,针对 K12 教育发布首个 CALMEDU 评测框架与 CALMEDU001 评测报告 娱乐资本论:我们的测试并非旨在提供学术上的严谨标准,我们的目标是:从实用的角度出发,分析这些大模型在各种文本应用场景,如小红书带货文案、抖音直播文案、知乎问答、小说创作、公关信写作、歌词生成、淘宝商品详情页文案、广告宣传片文案、剧本创意策划等方面的综合表现 中国大模型面临的真实问题: OpenAI 对字节跳动可能存在的违规使用其技术和知识产权的指控,字节跳动回应在 2023 年初技术团队在大模型探索初期有部分工程师将 GPT 的 API 服务应用于较小模型的实验性项目研究中,但强调该模型仅用于测试,从未计划上线或对外使用,且自 2023 年 4 月公司引入 GPT API 调用规范检查后已停止这种做法。 2024 年也有更多被指“套壳”国内大模型的事件,比如斯坦福大学 AI 团队主导的 Llama3V 开源模型,被证实套壳抄袭国内清华与面壁智能的开源模型。大模型的建设方式粗浅地分为三类。
2024-12-16
gpt是否可以识别图片中的人脸、人物
GPT 可以在一定程度上对图片中的人物进行识别和描述。例如,可以利用 GPT 的识图功能对人物照片的内容进行细致描述,包括人物的年龄、发型、肤色、五官、穿着、表情等方面,还能对人物所处的背景进行分析。但需要注意的是,其识别和描述的准确性可能会受到多种因素的影响,如图片的质量、清晰度、复杂程度等。同时,对于 GPT 是否能准确识别所有人脸和人物,还存在一定的不确定性和局限性。
2024-11-24
请问现在好用的AI图片生产工具有哪些,对人物一致性要求高
以下是一些好用的 AI 图片生产工具,且对人物一致性要求较高: 1. Artguru AI Art Generator:是一个在线平台,能够生成逼真图像,为设计师提供灵感,丰富创作过程。 2. Retrato:这是一款 AI 工具,可将图片转换为非凡肖像,拥有 500 多种风格选择,适合制作个性头像。 3. Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具有细节的全新视觉作品。 4. Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计的 AI 工具,能将上传的照片转换为芭比风格,效果出色。 在使用 AI 生图时,若要保证人物和场景的一致性,有两个取巧的方式:一是像生成动物,动物会比较容易保持一致性;二是特定的名人或有特殊属性的人物。 另外,目前市面上的 AI 工具分为线上和线下本地部署两种。线上的优势是出图速度快,不依赖本地显卡配置,无需下载大型模型,还能参考其他创作者的作品,但出图分辨率有限。线下部署的优势是可以添加插件,出图质量高,但对电脑配置要求高,使用时可能导致电脑宕机。可以充分发挥线上和线下平台的优势,线上用于找参考、测试模型,线下作为主要出图工具。
2024-11-23
可以根据照片生成人物的AI软件
以下是一些可以根据照片生成人物的 AI 软件: PhotoMaker:可以根据文字描述生成人物照片,能混合不同人物特征创造新形象,还能改变照片中人物的性别、年龄。访问链接:https://photomaker.github.io ,https://x.com/xiaohuggg/status/1746861045027869072?s=20 HeyGen:通过上传照片或文字提示,即可生成个性化 AI 数字形象视频。支持自定义肢体动作、服装、背景、年龄、性别等特征。仅需 1 分钟即可生成包含脚本、声音和情感表达的数字人视频。访问链接:https://x.com/imxiaohu/status/1852317866038809035
2024-11-22