直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

ai生成人物

回答

AI 生成人物的方法有很多,以下是一些常见的 AI 生成人物的方法和步骤:

  1. 选择 AI 工具:目前市面上有很多 AI 工具可以用于生成人物,如剪映、Midjourney 等。选择一个适合自己需求的 AI 工具。
  2. 输入描述信息:在 AI 工具中,输入关于人物的描述信息,如外貌、服装、表情、姿势等。这些信息可以通过文字、图片、音频等方式输入。
  3. 调整参数:根据输入的描述信息,调整 AI 工具的参数,如分辨率、颜色、亮度等,以获得更好的生成效果。
  4. 生成人物:点击生成按钮,AI 工具会根据输入的描述信息和参数,生成一个或多个人物形象。
  5. 调整和编辑:对生成的人物形象进行调整和编辑,如旋转、缩放、裁剪等,以满足自己的需求。
  6. 保存和导出:调整和编辑完成后,保存生成的人物形象,并导出为需要的格式,如图片、视频等。

需要注意的是,不同的 AI 工具可能具有不同的功能和操作方法,具体步骤可能会有所不同。同时,生成的人物形象可能会存在一定的误差和不完美,需要根据自己的需求进行调整和编辑。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

实战: 每个人都可以用10分钟轻松制作AI换脸、AI数字人视频的方法!

3.1生成数字人在剪映右侧窗口顶部,我们打开“数字人”选项,选取一位免费的、适合的数字人形象,这里我选择“婉婉-青春”。当你选择一个数字人形象时,软件会马上播放出该数字人的声音。你可以判断是否是你需要的,点击右下角的“添加数字人”,就会将选择的数字人添加到当前视频中。剪映App将会根据之前提供的内容,来生成对应音视频,并添加到当前视频文件的轨道中。左下角会提示你渲染何时完成。然后你可以点击预览按钮,查看生成的数字人效果。3.2增加背景图片接下来,可以直接删除先前导入的文本内容。这是因为视频中的音频中已经包含文字内容了。鼠标点击下方代表文字的轨道,或者点击软件中间文字内容,按删除键删去文字:为了让视频更美观,我们为视频增加背景图片。当然你可以增加多个背景图片,为简化演示,这里增加1张图片。点击左上角的“媒体”菜单,并点击“导入”按钮,来选择本地的一张图片上传:我选择一张书架图片上传,然后像添加文字内容一样,点击图片右下角的加号,将这个图片添加到视频的轨道上(会覆盖数字人):

实战: 每个人都可以用10分钟轻松制作AI换脸、AI数字人视频的方法!

此时,书架图片就会在视频轨道的下面,添加一条新轨道:为了让图片在整个视频播放的时候都显示,可以点击这个轨道最右侧的竖线,向右拖拽,直到视频的最后,也就是和视频对齐:此时,背景图片所在的轨道是选中状态。如果没选中,鼠标点击一下这个规定即可。在显示区域,拖动背景图的一个角,将图片放大到适合的尺寸,比如覆盖视频窗口。并将数字人拖动到合适的位置:3.3增加字幕点击文本-智能字幕-识别字幕,点击开始识别:软件会自动将文字智能分段并形成字幕:至此,数字人视频就完成了。点击右上角的“导出”按钮,导出视频以作备用。如果你希望数字换成自己希望的面孔,比如这个:就需要用另一个工具来进行换脸了。

7大方向快速生成合心意的AI人物形象

好了,人物篇就暂时写到这里了,生成一张满意的人物类型的图片我们需要输入的文字越精准,才能到越合心意的图片。这里我们总结一下关于生成人物的万能固定句式,一个越和心意的人物结果需要包含「人物的客观描述」+「视角」+「角度」+「距离」+「表情」+「服装」+「风格」+「光源」这些内容,当然你也可以只取其中部分的也会得到一个还不错的结果。同时,Midjourney要想达成自己期望的效果,可能不是只用一段魔法就能达成效果,可以多次逐步完成自己的效果,以前总想着一步达成目标,就去堆积好多的关键词在一段魔法里面,很多生成的结果很多次都不尽人意,尝试分步骤拆开之后,结果就好很多。

其他人在问
AI的工具类应用有哪些?
以下是一些常见的 AI 工具类应用: 1. AI 菜谱口味调整工具:如“下厨房”的口味调整功能,使用自然语言处理和数据分析技术,根据用户反馈调整菜谱口味,市场规模达数亿美元。 2. AI 语言学习纠错平台:像“英语流利说”的纠错功能,运用自然语言处理和机器学习技术,帮助语言学习者纠正错误,市场规模达数十亿美元。 3. AI 电影剧情分析系统:例如“豆瓣电影”的剧情分析工具,通过数据分析和自然语言处理技术,为用户提供深度解读,市场规模达数亿美元。 4. AI 办公文件分类系统:如“腾讯文档”的分类功能,借助数据分析和机器学习技术,自动分类办公文件,方便管理,市场规模达数亿美元。 5. AI 美容护肤方案定制平台:“美丽修行”的定制方案功能,利用图像识别和数据分析技术,根据用户肤质定制护肤方案,市场规模达数亿美元。 6. AI 菜谱生成平台:“豆果美食 APP”,采用自然语言处理和数据分析技术,根据用户口味和现有食材生成个性化菜谱,市场规模达数亿美元。 7. AI 语言学习助手:“沪江开心词场”,通过自然语言处理和机器学习技术,辅助用户学习语言,提供个性化学习方案,市场规模达数十亿美元。 8. AI 电影推荐系统:“爱奇艺”的智能推荐功能,运用数据分析和机器学习技术,根据用户喜好推荐电影,市场规模达数亿美元。 9. AI 办公自动化工具:“WPS Office”,借助自然语言处理和机器学习技术,提高办公效率,实现自动化办公流程,市场规模达数十亿美元。 10. AI 游戏道具推荐系统:在一些游戏中的推荐功能,使用数据分析和机器学习技术,根据玩家需求推荐游戏道具,市场规模达数亿美元。 11. AI 天气预报分时服务:“彩云天气”的分时预报,利用数据分析和机器学习技术,提供精准的分时天气预报,市场规模达数亿美元。 12. AI 医疗病历分析平台:“医渡云”的病历分析系统,通过数据分析和自然语言处理技术,分析医疗病历,辅助诊断,市场规模达数十亿美元。 13. AI 会议发言总结工具:“讯飞听见”的会议总结功能,运用自然语言处理和机器学习技术,自动总结会议发言内容,市场规模达数亿美元。 14. AI 书法作品临摹辅助工具:书法临摹软件,借助图像识别和数据分析技术,帮助书法爱好者进行临摹,市场规模达数亿美元。
2024-12-20
如何用AI工具写简历?
以下是使用 AI 工具写简历的方法和相关工具推荐: 1. 一些可用于写简历的 AI 工具: Kickresume 的 AI 简历写作器:使用 OpenAI 的 GPT4 语言模型,能为简历摘要、工作经验和教育等部分编写内容,并保持一致语调。 Rezi:受到超 200 万用户信任的领先 AI 简历构建平台,能自动化创建简历的各个方面,包括写作、编辑、格式化和优化。 Huntr 的 AI 简历构建器:提供免费简历模板,以及 AI 生成的总结、技能、成就生成器和 AI 驱动的简历工作匹配。 更多 AI 简历产品,可查看:https://www.waytoagi.com/category/79 2. 用于写作的通用 AI 工具: 最佳免费选项: 付费选项:带有插件的4.0/ChatGPT 目前,GPT4 是功能最强的人工智能写作工具,可在 Bing(选择“创新模式”)上免费访问,或通过购买 ChatGPT 的$20/月订阅来访问。Claude 紧随其后,也提供有限免费选项。 这些工具都能帮助您快速、高效地创建出专业的简历,您可以根据自身需要选择最适合的工具。但使用时请注意仔细甄别内容。
2024-12-20
视频生成哪一个ai最强
目前在视频生成领域,以下几个 AI 表现较为突出: Luma AI: Dream Machine 功能包括 txt2vid 文生视频和 img2vid 图生视频,还支持 Extend 延长 4s、循环动画、首尾帧动画能力。 8 月底最新发布的 Dream Machine 1.5 增强了提示词理解能力和视频生成能力,对视频内文字的表现很强。 在 img2vid 图生视频方面,生成效果在多方面远超其他产品,如生成时长较长(5s)、24 帧/s 非常丝滑、运动幅度大且能产生相机的多角度位移、提示词中可增加无人机控制的视角变化、运动过程中一致性保持较好、分辨率高且有效改善了运动幅度大带来的模糊感。 Runway:推出了实力强劲的 Gen3 模型。 此外,以下是其他视频生成的 Top10 产品及相关数据: |排行|产品名|分类|4 月访问量(万 Visit)|相对 3 月变化| |||||| |1|InVideo|其他视频生成|736|0.118| |2|Fliki|其他视频生成|237|0.165| |3|Animaker ai|其他视频生成|207|0.076| |4|Pictory|其他视频生成|122|0.17| |5|Steve AI|其他视频生成|76|0.119| |6|decohere|其他视频生成|57.5|0.017| |7|MagicHour|其他视频生成|53.7|0.071| |8|Lumen5|其他视频生成|51|0.149| |9|democreator|其他视频生成|41.9|0.136| |10|腾讯智影|其他视频生成|35.4|0.131|
2024-12-20
目前,有没有能替代My GPT这种功能的外国ai?
目前,在国外有一些能够替代 My GPT 功能的 AI 产品。例如,ChatGPT 是由 OpenAI 开发的知名 AI 助手,它在全球范围内具有广泛的影响力。ChatGPT 具有开创性,是首批向公众开放的大规模商用 AI 对话系统之一,改变了人们对 AI 的认知,为技术发展指明了方向。其界面简洁直观,交互流畅自然,降低了使用门槛。从技术角度看,背后的 GPT 系列模型性能和能力处于行业领先地位。但它也有局限性,且对于国内用户可能存在网络连接等问题。 此外,Google 的 Bard 也是一种选择。在写代码领域,GitHub 的 Copilot 有一些替代品,如 Tabnine、Codeium、Amazon CodeWhisperer、SourceGraph Cody、Tabby、fauxpilot/fauxpilot 等。 Meta 在 2023 年 2 月开源了 LLaMA 1,并在 7 月发布了进阶的 Llama 2 且允许商用,此举推进了大模型的发展。
2024-12-20
类似 characterai的虚拟对话
以下是为您整理的类似 CharacterAI 的虚拟对话相关内容: 一、Character.ai 1. 创建:创建角色的功能简洁,主要依赖用户编写的 Description(基础信息)和 Definition(复杂背景),已支持上传声音片段实现语言克隆。 2. 聊天:用户通过一问一答的多轮对话方式与角色进行交互,支持回复重新生成、回滚至指定位置。 二、筑梦岛 1. 聊天: 单人聊天是用户与 AI 角色交互的基本模式,本质是一问一答的多轮对话,支持重新生成。 多人聊天是伪群聊,通过指定某个角色对用户的话进行回复,但 AI 角色之间不能对话。 2. AI 角色: 设定是每一个角色最核心的人设属性,产品侧是一段角色介绍,背后往往对应着一段高质量 Prompt,甚至有其他工程、模型层面的优化措施。 梦境是用户分享的与 AI 角色聊天的片段,其他用户可以基于此对话片段继续参与聊天。 小剧场是【人设+场景】的对话聊天模式,同样的角色处于不同的场景背景,会展开不同的故事。 3. 创建:创建梦中人即捏崽,需要用户提供各类信息,其中最核心的是完整设定这样的人设背景信息;创建梦屋即拉群,用户可以添加多个 AI 角色创建一个群聊。 三、其他相关 1. 游戏方面:游戏是满足我们原始需求的模拟,游戏引擎发展了模拟方式,但无法有效模拟人类思想等的复杂性和突发性,直到 LLM 和 Agent 框架的突破,使得在游戏中拥有“具有真实目标、行动和对话的现实角色“成为可能。预计 2024 年游戏能模拟现实生活中的多种社交动态,每一个原始需求都可以获得模拟满足。 2. 从聊天机器人到拟人形象:如果 2023 年是我们与 AI 伴侣发短信的一年,那么 2024 年将可以直接跟 3D 拟人形象实时交谈,与 AI 同伴的对话将变得越来越具有洞察力、呈现力和个性化,娱乐将从被动体验转向主动体验,有线电视和互动游戏之间的界限将变得模糊。 3. GPTs、中间层、Chatbot 虚拟社交、AI Agent 方面:Replika 做重虚拟角色定制过程,强调角色唯一性;Cai、Talike、星野、筑梦岛等一众产品提供众多 Bot 供用户选择,并支持 UGC 创建 Bot 并分发;Aura 进入后虽然只有单个角色,但支持开启多个剧本的角色扮演,并且剧本由 AI 生成(降低了重复性)可以体验和较长文本的对话,但在整体体验上存在不足。
2024-12-20
ai可以为我做什么
AI 能为您做很多事情,包括但不限于以下方面: 1. 写作相关: 草拟各种类型的初稿,如博客文章、论文、宣传材料、演讲、讲座、剧本、短篇小说等。 改进您已有的文本,提供针对特定受众的更好建议。 以不同风格创建多个草稿,使内容更生动,添加例子等。 帮助完成如写邮件、创建销售模板、提供商业计划下一步等任务。 2. 激发创作灵感:通过与 AI 系统互动,激发您在写作方面做得更好。 3. 提供动力:当您在任务中遇到困难挑战而分心时,AI 能为您提供动力。 总之,AI 在写作和协助完成任务方面具有很大的潜力,能为您的工作和学习带来便利。
2024-12-20
免费生成思维导图的AI网址
以下是一些免费生成思维导图的 AI 网址: 1. GitMind:一款免费的跨平台 AI 思维导图软件,支持提问、回答、自动生成等多种模式,可通过 AI 自动生成思维导图。 2. ProcessOn:国内思维导图+AIGC 的工具,能够利用 AI 生成思维导图。 3. AmyMind:轻量级的在线 AI 思维导图工具,无需注册登录即可使用,支持自动生成节点。 4. Xmind Copilot:Xmind 推出的基于 GPT 的 AI 思维导图助手,可一键拓展思路,生成文章大纲。 5. TreeMind:“AI 人工智能”思维导图工具,输入需求后由 AI 自动完成思维导图生成。 6. EdrawMind:提供一系列 AI 工具,包括 AI 驱动的头脑风暴功能,有助于提升生产力。 总的来说,这些 AI 思维导图工具都能通过 AI 技术自动生成思维导图,提高制作效率,为知识工作者带来便利。 此外,以下是一些可以使用 AI 绘制示意图的工具和平台: 1. Lucidchart:强大的在线图表制作工具,集成 AI 功能,可自动化绘制流程图、思维导图、网络拓扑图等多种示意图。具有拖放界面,易于使用,支持团队协作和实时编辑,有丰富的模板库和自动布局功能。官网:https://www.lucidchart.com/ 2. Microsoft Visio:专业的图表绘制工具,适用于复杂的流程图、组织结构图和网络图。其 AI 功能可帮助自动化布局和优化图表设计。集成 Office 365,方便与其他 Office 应用程序协同工作,有丰富的图表类型和模板,支持自动化和数据驱动的图表更新。官网:https://www.microsoft.com/enus/microsoft365/visio/flowchartsoftware 3. Diagrams.net:免费且开源的在线图表绘制工具,适用于各种类型的示意图绘制。支持本地和云存储(如 Google Drive、Dropbox),有多种图形和模板,易于创建和分享图表,可与多种第三方工具集成。官网:https://www.diagrams.net/
2024-12-20
为什么ai生成视频被寄予厚望
AI 生成视频被寄予厚望的原因主要有以下几点: 1. 技术突破:2023 年是人工智能视频领域的飞跃之年,在这一年中见证了数十种视频生成工具的问世,文本生成视频的模型持续进步,并且像图像转视频、视频转视频这样的衍生技术也开始流行起来。 2. 应用潜力:虽然目前工具存在局限性,但仍预示着正处于一场巨大变革的初期阶段,未来有望仅凭一个文本提示(或者几个提示)就制作出高质量的短片。 3. 产品优势:例如国内的可灵,在视频生成质量、生成速度和可访问性方面表现出色,达到了与国际顶级模型相当的水准,处理效率更高,为国内用户提供了便捷、稳定的使用体验。 4. 生成方式多样:从交互方式来看,当前 AI 视频生成主要可分为文本生成视频、图片生成视频、视频生成视频三种形式,且存在多种生成技术,如先生成静态关键帧图像再构建为视频序列,或直接端到端生成视频的技术。
2024-12-19
你可以根据问题说生成PPT或者图片吗
以下是关于生成 PPT 或图片的相关内容: 增强版 Bot 是基于 AI 驱动的智能创作平台,可实现一站式内容生成,包括图片、PPT、PDF 等。例如,在对话框输入诉求“生成常见的系统架构风格架构设计图”即可生成相应图片,输入“帮我生成一篇包含以上架构风格的完整 PPT”可生成 PPT 幻灯片内容及相关模板选择,输入“根据上面的架构风格,制作一篇常见系统架构风格的 PDF 文件”可生成相应的可选模板。 在 MJ 应用中,为 PPT 配图可通过复制图像链接和提示词,在 discord 中输入相应命令生成图像。生成后可改变比例和镜头拉远,检查构图,选择合适的图放入 PPT 调整构图。 在制作课程时,可通过一系列提问模板让 ChatGPT 协助创作章节内容,并将其转换成 PPT 格式,还可加入学员案例、参考范例让其进行改写或续写。
2024-12-19
有生成提示词的提示词嘛
以下是为您提供的关于生成提示词的相关信息: Apple Intelligence 中各种智能应用的提示词已曝光,包括用于生成 Apple Photos 中“回忆”视频的提示词。生成的内容需以 JSON 格式响应,遵循特定的故事和照片说明指南,且不能包含宗教、政治、有害、暴力、色情、肮脏或任何负面、悲伤或挑衅的内容。 一泽 Eze 提出通过输入一句提示词和一个品牌 Logo,利用大模型 LLM 可一键生成超级符合品牌调性的创意名片。提示词已开源,同时还介绍了获取提示词的流程、注意事项,如提示词的目的是设计符合品牌调性的创意名片,Logo 建议使用清晰、底图透明的 PNG 格式,若生成结果不符合预期可尝试让模型重新生成或提出修改意见。 【SD】自动写提示词脚本 One Button Prompt 可通过设定主题、正向提示词等生成随机的提示词,还能通过图生图控制,生成的提示词风格各异,可进行修改调整,也可使用“Latent Couple”插件给画面做定义。
2024-12-19
我想用AI把图片生成营销视频
以下是关于用 AI 把图片生成营销视频的相关信息: 生成式人工智能在营销中的应用:DALLE 2 和其他图像生成工具已被用于广告,如亨氏使用番茄酱瓶的图像和类似标签论证“这就是人工智能眼中‘番茄酱’的样子”;雀巢使用维米尔画作的人工智能增强版帮助销售酸奶品牌;Stitch Fix 服装公司使用 DALLE 2 根据客户偏好创建服装可视化;美泰使用该技术生成玩具设计和营销的图像。 判断图片是否为 AI 生成:AI 作画的画质画风偶尔会波动,不像人类画师作品质量大多稳定向上发展,AI 就像皮下雇佣无数画技参差不齐画手的批皮营销号,画质质量胡乱。 制作商业级 AI 视频广告的出图方法:MJ 出图质量稳定,使用门槛低,暂时无其他替代工具。常规操作是登录 Discord 网站,打开 MJ 服务器出图,通过/imagine 命令输入提示词生成图片。若想提高效率,可使用 Autojourney 插件,它是电脑浏览器的一个插件,能批量发送提示词、自动下载图片、自动放大图片、生成提示词等,在浏览器拓展程序中下载安装,激活后将 MJ 出图提示词复制到插件中即可自动批量出图,一次可输入 10 组提示词。
2024-12-19
我想做简洁卡通风格的ai动画,根据故事文案生成的那种,需要保持人物一致性,用哪个工具比较好?
以下是一些适合生成简洁卡通风格、根据故事文案生成动画并保持人物一致性的工具: 1. U 传:在 U 传中,通过点击相应按钮参考角色、风格或图生图,可保持人物一致性。新注册有免费生成额度。 2. 季梦:可辅助写视频提示词,能根据上传的图片生成合理的运镜及提示词,还可写分镜脚本。若为 1.2 版本,选慢速或适中的标准模式,效果更好,且生成的视频无水印。每天给 60 积分。 3. 可玲:可辅助写视频提示词,能根据上传的图片生成合理的运镜及提示词,还可写分镜脚本。每天给 60 积分,可用于日常使用,创作片子可能需买会员,生成的视频有无水印选项。 此外,在使用 Midjourney 生图时,若要保持人物和场景一致性,有两个取巧的方式:一个是像上个视频一样生成动物,动物会比较容易保持一致性;另一个方式是特定的名人或者有特殊属性的人物。在确定影片风格时,比如可以选择皮克斯动画风格。同时,在提示词中利用 cref 命令也有助于保持人物的一致性。
2024-12-18
Changer软件能实现视频中人物的无缝换头吗
Changer 软件可以实现视频中人物的无缝换头。以下是一些相关的操作指引和注意事项: 上传原始视频和换脸图片,点击生成,即可自动识别视频中的人脸并进行替换。 在 TecCreative 创意工具箱中,操作指引为:上传原始视频——上传换脸图片——点击生成。 实战中,通过 JupyterLab 工具中的终端输入相关命令启动 facefusion 程序,在 facefusion 软件界面上传准备好的图片、视频,可看到预览效果,点击开始按钮执行换脸处理,完成后可下载处理后的视频。 此外,还有其他与图片和视频处理相关的方法和技巧,例如利用 MJ 画图、InsightFaceSwap 插件等进行处理。
2024-12-17
国内大模型领域关键人物、关键院校
以下是国内大模型领域的关键人物、关键院校及相关信息: 8 月正式上线的国内大模型: 北京: 百度(文心一言):https://wenxin.baidu.com 抖音(云雀大模型):https://www.doubao.com 智谱 AI(GLM 大模型):https://chatglm.cn 中科院(紫东太初大模型):https://xihe.mindspore.cn 百川智能(百川大模型):https://www.baichuanai.com/ 上海: 商汤(日日新大模型):https://www.sensetime.com/ MiniMax(ABAB 大模型):https://api.minimax.chat 上海人工智能实验室(书生通用大模型):https://internai.org.cn 聊天状态下能生成 Markdown 格式的:智谱清言、商量 Sensechat、MiniMax 目前不能进行自然语言交流的:昇思、书生 受限制使用:MiniMax(无法对生成的文本进行复制输出,且只有 15 元的预充值额度进行体验,完成企业认证后可以进行充值) 特色功能:昇思——生图,MiniMax——语音合成 阿里通义千问、360 智脑、讯飞星火等均不在首批获批名单中。据悉,广东地区获批公司分别为华为、腾讯,科大讯飞系其他地区获批产品。 中文大模型评测收集与调研: InfoQ + 极客帮:https://www.guotaixia.com/post/5124.html GAOKAOBench:地址:https://github.com/OpenLMLab/GAOKAOBench ,是一个以中国高考题目为数据集,测评大模型语言理解能力、逻辑推理能力的测评框架 清华安全大模型测评:地址:http://115.182.62.166:18000 ,清华收集的一个评测集,涵盖了仇恨言论、偏见歧视言论、犯罪违法、隐私、伦理道德等八大类别,包括细粒度划分的 40 余个二级安全类别 JioNLP 个人测评:评测数据集:https://github.com/dongrixinyu/JioNLP/wiki/LLM 评测数据集 ,考察 LLM 模型对人类用户的帮助效果、辅助能力,可否达到一个【智能助手】的水平。题型介绍:选择题来源于中国大陆国内各种专业性考试,重点在于考察模型对客观知识的覆盖面,占比 32%;主观题来源于日常总结,主要考察用户对 LLM 常用功能的效果。 EduTEP:华东师范大学计算机科学与技术学院 EduNLP 团队组建智能教育算法测评小组,开发智能教育可信评测平台(EduTEP)。EduTEP 对比多种大模型在教育领域中的综合性能,针对 K12 教育发布首个 CALMEDU 评测框架与 CALMEDU001 评测报告 娱乐资本论:我们的测试并非旨在提供学术上的严谨标准,我们的目标是:从实用的角度出发,分析这些大模型在各种文本应用场景,如小红书带货文案、抖音直播文案、知乎问答、小说创作、公关信写作、歌词生成、淘宝商品详情页文案、广告宣传片文案、剧本创意策划等方面的综合表现 中国大模型面临的真实问题: OpenAI 对字节跳动可能存在的违规使用其技术和知识产权的指控,字节跳动回应在 2023 年初技术团队在大模型探索初期有部分工程师将 GPT 的 API 服务应用于较小模型的实验性项目研究中,但强调该模型仅用于测试,从未计划上线或对外使用,且自 2023 年 4 月公司引入 GPT API 调用规范检查后已停止这种做法。 2024 年也有更多被指“套壳”国内大模型的事件,比如斯坦福大学 AI 团队主导的 Llama3V 开源模型,被证实套壳抄袭国内清华与面壁智能的开源模型。大模型的建设方式粗浅地分为三类。
2024-12-16
gpt是否可以识别图片中的人脸、人物
GPT 可以在一定程度上对图片中的人物进行识别和描述。例如,可以利用 GPT 的识图功能对人物照片的内容进行细致描述,包括人物的年龄、发型、肤色、五官、穿着、表情等方面,还能对人物所处的背景进行分析。但需要注意的是,其识别和描述的准确性可能会受到多种因素的影响,如图片的质量、清晰度、复杂程度等。同时,对于 GPT 是否能准确识别所有人脸和人物,还存在一定的不确定性和局限性。
2024-11-24
请问现在好用的AI图片生产工具有哪些,对人物一致性要求高
以下是一些好用的 AI 图片生产工具,且对人物一致性要求较高: 1. Artguru AI Art Generator:是一个在线平台,能够生成逼真图像,为设计师提供灵感,丰富创作过程。 2. Retrato:这是一款 AI 工具,可将图片转换为非凡肖像,拥有 500 多种风格选择,适合制作个性头像。 3. Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具有细节的全新视觉作品。 4. Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计的 AI 工具,能将上传的照片转换为芭比风格,效果出色。 在使用 AI 生图时,若要保证人物和场景的一致性,有两个取巧的方式:一是像生成动物,动物会比较容易保持一致性;二是特定的名人或有特殊属性的人物。 另外,目前市面上的 AI 工具分为线上和线下本地部署两种。线上的优势是出图速度快,不依赖本地显卡配置,无需下载大型模型,还能参考其他创作者的作品,但出图分辨率有限。线下部署的优势是可以添加插件,出图质量高,但对电脑配置要求高,使用时可能导致电脑宕机。可以充分发挥线上和线下平台的优势,线上用于找参考、测试模型,线下作为主要出图工具。
2024-11-23
可以根据照片生成人物的AI软件
以下是一些可以根据照片生成人物的 AI 软件: PhotoMaker:可以根据文字描述生成人物照片,能混合不同人物特征创造新形象,还能改变照片中人物的性别、年龄。访问链接:https://photomaker.github.io ,https://x.com/xiaohuggg/status/1746861045027869072?s=20 HeyGen:通过上传照片或文字提示,即可生成个性化 AI 数字形象视频。支持自定义肢体动作、服装、背景、年龄、性别等特征。仅需 1 分钟即可生成包含脚本、声音和情感表达的数字人视频。访问链接:https://x.com/imxiaohu/status/1852317866038809035
2024-11-22