直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

生成一张商务照头像

回答

以下是生成商务照头像的方法:

  1. 生成基础的第一套图形
    • 写关键词:最好要求明确点,比如黑色的头发,黄白色的衣服,蓝色的背景,方便后期统一样式做女性的那套,这是测试了无数套的结果。例如:Flat illustration design,a man,black hair,half body,face front,front view,sitting at the table,working,using computer or holding mobile phone,yellow and white clothes,blue solid color background,emoticon pack 6 emoji tables,red and white clothes,multiple poses and expressions,anthropomorphic style,different emotions,multiple poses and expressions,8k --ar 3:4 --niji 5 --style expressive --s 180
    • 多生成几套挑选,挑选一套自己满意的。
    • 分别使用 2 种变化测试效果(可省略)。
    • 按 U1 和 U4 选出第一张和第四张,分别进行放大。
  2. 生成女性
    • 获取男生那张的 seed,加在关键词后面,生成女生。挑选相似的。也可以先 U3 后继续通过变化的变化 2 个按钮挑选合适的。
    • 局部重绘不满意的表情,比如希望女生开心点,添加“happy”。
  3. PS 处理
    • 把需要的角色扣在一起。
    • PS 把颜色调整一致(如果有 PS AI 版可以修修手)。
  4. 小素材生成
    • 其他过程稿。

此外,还有 Jimmy marble 的相关出图示例:

  • Midjourney V6 出图:Lamborghini with Fluffy texture,jimmy marble -- ar16:9 ;jimmy marble,jesus and the Buddha are dancing steet dance,on the left is jesus,on the right is the Buddha --ar 16:9 ;2001:A Space Odyssey,a pikachu,jimmy marble --ar 16:9 ;jimmy marble,shot from below,low agnle shot,candid shot,a girl is skateboarding.she wears nike shoes.--ar 4:3 ;crewneck t-shirt mockup,a cute cartoon avatar on t-shirt,inspired by jimmy marble ;Jimmy Marble,daily life in DaLi,china --ar 3:4 ;commercial photography by jimmy marble,a beautiful russian girl wearing high-end dress with floral leaning against Lamborghini,low agnle shot,high heels --ar 9:16 ;Jimmy marble,war and peace --ar 3:4 。
  • Niji 6 出图:Jimmy marble,pikachu --niji 6 --ar 16:9 ;Jimmy Marble,the daughter of forest --ar 3:4 --niji 6 ;Jimmy Marble,a chinese girl wearing han fu holds a pikachu,ancient chinese background --niji 6 --ar 3:4 。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

商业教程:统一2个角色的插画海报

作者:三思访问[作者小红书](https://www.xiaohongshu.com/user/profile/5cfd0e600000000016029764?wechatWid=803c253b00ed4224d3a2adcd80b46ed7&wechatOrigin=menu)需求:我们这里需要一张海报(要求男女风格配色一致,情绪不同)尝试了很多种方案,但是一张张出图就算有一致性,但是背景风格脸型多少都有不一致的地方,需要手动调整。寻求群友的帮助,大家提到了“表情包”一下子就悟了,以下是制作过程,实操过程中还需要一些细节调整[heading1]1.生成基础的第一套图形[heading2]1.写关键词[content](最好要求明确点,比如黑色的头发,黄白色的衣服,蓝色的背景,方便后期统一样式做女性的那套,这是测试了无数套的结果)Flat illustration design,a man,black hair,half body,face front,front view,sitting at the table,working,using computer or holding mobile phone,yellow and white clothes,blue solid color background,emoticon pack 6 emoji tables,red and white clothes,multiple poses and expressions,anthropomorphic style,different emotions,multiple poses and expressions,8k --ar 3:4 --niji 5 --style expressive --s 180多生成几套挑选,挑选一套自己满意的分别使用2种变化测试效果(我还是喜欢没有变化之前的,这部你们可以省略)[heading2]2.局部重绘不满意的区域[content](这里表情有的有眼镜有的没有,有的是豆豆眼,)从得到的结果里分别挑选合适的放大,ps抠出来即可(你非要一张出到满意,你也可以继续重绘不满意的地方)按U1和U4选出第一张和第四张,分别进行放大

商业教程:统一2个角色的插画海报

获取男生那张的seed,加在关键词后面,生成女生。挑选相似的。也可以先U3后继续通过变化的变化2个按钮挑选合适的。[heading2]2.局部重绘[content]局部重绘不满意的表情,我这里希望女生开心点,添加了happy[heading1]3、ps处理[content]把需要的角色扣在一起。ps把颜色调整一致(如果有ps ai版可以修修手)[heading1]4、小素材生成[content]其他过程稿

Jimmy marble

Lamborghini with Fluffy texture,jimmy marble -- ar16:9jimmy marble,jesus and the Buddha are dancing steet dance,on the left is jesus,on the right is the Buddha --ar 16:92001:A Space Odyssey,a pikachu,jimmy marble --ar 16:9jimmy marble,shot from below,low agnle shot,candid shot,a girl is skateboarding.she wears nike shoes.--ar 4:3crewneck t-shirt mockup,a cute cartoon avatar on t-shirt,inspired by jimmy marbleJimmy Marble,daily life in DaLi,china --ar 3:4commercial photography by jimmy marble,a beautiful russian girl wearing high-end dress with floral leaning against Lamborghini,low agnle shot,high heels --ar 9:16Jimmy marble,war and peace --ar 3:4[heading2]Niji 6出图[content]Jimmy marble,pikachu --niji 6 --ar 16:9Jimmy Marble,the daughter of forest --ar 3:4 --niji 6Jimmy Marble,a chinese girl wearing han fu holds a pikachu,ancient chinese background --niji 6 --ar 3:4

其他人在问
生成头像
以下是生成卡通头像的详细步骤: 1. 复杂提示词: 如果觉得提示词简单,可以选择更复杂的,如:“Disney boy,Low saturation Pixar Super details,clay,anime waifu,looking at viewer,nighly detailedreflections transparent iridescent colors.lonctransparent iridescent RGB hair,art by Serafleurfrom artstation,white background,divine cinematic edgelighting,soft focus.bokeh,chiaroscuro 8K,bestquality.ultradetailultradetail.3d,c4d.blender,OCrenderer.cinematic lighting,ultra HD3D renderinoiw 1.5s 500v 5”。 效果示例: 不同照片生成:如果对照片风格不满意,可以换一张新照片使用上述提示词重新生成。 其他调整:如果觉得 Disney 风格太过卡通,可把提示词中的“Disney”换成“Pixar”;如果是女孩,把“boy”换成“girl”。 每次生成 4 张图片,对某张满意可点击下方的 U1~U4 生成大图,对风格满意但需调整可点击 V1~V4 进行修改。 2. 简单提示词: 在聊天窗口输入“/imainge”找到“/imagine prompt”,然后把图片链接放进去,空格后加提示词(以英文逗号分隔),最后加上设置参数。 设置参数: “iw 1.5”设置参考图片的权重,数值越高与参考图片越接近,默认 0.5,最大 2,可选择中间值调整。 “s 500”设置风格强度、个性化、艺术性,数字越大越有创造力和想象力,可设置 0 1000 间任意整数,这里设置 500。 “v 5”指用 Midjourney 的第 5 代版本,这一代最真实,目前 v5 需要订阅付费,不想付费可用“v 4”。 “no glasses”指不戴眼镜,不喜欢戴眼镜的图片可加上此设置。 完整提示词示例(替换您的 png 图片地址):“simple avatar,Disney boy,3d rendering,iw 1.5s 500v 5”。如果不满意,可调整“s”和“iw”的值多次尝试。 3. 背景: 之前制作过从零开始使用 Midjourney 并通过简单提示词生成图片的视频。 今天教利用 Midjourney 的以图绘图功能生成迪斯尼卡通风格头像。 生成步骤:先选一张满意的图片,在 Discord 社区的 Midjourney 服务器聊天栏点击“+”,然后点击上传文件,选取图片,在聊天框发送(记得点击回车或发送按钮)。然后图片会上传到服务器并生成唯一链接,点击图片,在浏览器中打开,复制浏览器上方的链接。使用这个链接加 prompt 提示词发送给 Midjourney,Midjourney 会根据需求生成特定图片,这就是 Midjourney 的以图绘图。 如果还没有 Midjourney 账号或不懂基础操作,可参考:
2024-12-14
AI画二次元头像的软件或网站
以下是一些可以用于绘制二次元头像的软件或网站: 1. 无界 AI: 网址:https://www.wujieai.cc/ 新用户扫码注册可领取积分。 基础关键词: 二次元插画:画面质量为大师作品、最佳质量、精致细节、高细节、完美的脸;画面内容为少女、云朵、夏日、蓝天、海洋、;风格控制为可爱风格;背景控制为蓝色背景、纯色背景、简单背景。 平面构成:平面艺术、平面构成、几何线条、红蓝。 参数设置: 模型选择:风格模型或通用模型。 画面大小:3:4 社交媒体(推荐竖构图)。 底模选择:二次元→动感涂鸦;模型主题:写实插画;风格选择:Glitch 艺术+街头涂鸦。 2. 无界 AI 还可用于快速制作海报,其做图逻辑类似于 SD,优势在于国内网络即可稳定使用、有免费出图点数、支持中文关键词输入、无需额外下载风格模型,可直接取用。使用模型如皮克斯卡通,本案例中朋友圈 po 图的画幅比例选择 1:1。关键词类别包括场景、氛围、人物、造型、情绪、道具、构图、画面、特殊等方面。
2024-12-04
推荐coze手绘头像工作流
以下是关于 coze 手绘头像工作流的相关内容: 炉石抽卡机 coze bot 工作流: 1. 复制之前完成的图像流,将新制作的两个卡套替换上去,并微调叠图和添加文字的位置,得到 3 个图像流,分别对应 3 种不同类型卡牌的生成。若期望更多类型,可用相同的标准操作流程操作。 2. 用简单代码做非平均的随机数生成,如随从卡牌 80%,普通传说 19%,金色传说 1%。有个小彩蛋“慧凌”,输入可获得金色传说·大聪明。 3. 用选择器链接所有 3 个类型的卡牌生成图像流。 4. 将工作流添加到 bot 里,补充触发提示词、开场白、背景和图标。 工作流的功能实现: 1. 生成 3 行卡牌的描述和提示词内容填充,利用大语言模型,让用户输入的要求作为上下文,输出 3 行卡牌描述及提示词中的基础元素。 2. 从两份画图提示词中选取一份,采用随机策略选取。 3. 增加两种不同的卡片,并提供随机抽卡效果,重复图像流第一部分的抠图,得到 3 张不同的卡套。 0 基础手搓 AI 拍立得工作流: 1. 上传输入图片。 2. 理解图片信息,提取图片中的文本内容信息。 3. 场景提示词优化/图像风格化处理。 4. 返回文本/图像结果。 零代码版本选择 Coze 平台,搭建流程时主要关注以下步骤: 上传图片:将本地图片转换为在线 OSS 存储的 URL,以便在平台中调用,主要通过图像流过一道。 插件封装:将图片理解大模型和图片 OCR 封装为工作流插件,实现便捷调用,如果市场中有可直接使用。
2024-12-04
如何在直播中给出镜主播换一个卡通头像
以下是在直播中给出镜主播换一个卡通头像的方法: 1. 复杂提示词: 如果觉得提示词简单,可以选择更复杂的,如:“Disney boy,Low saturation Pixar Super details,clay,anime waifu,looking at viewer,nighly detailedreflections transparent iridescent colors.lonctransparent iridescent RGB hair,art by Serafleurfrom artstation,white background,divine cinematic edgelighting,soft focus.bokeh,chiaroscuro 8K,bestquality.ultradetailultra detail.3d,c4d.blender,OCrenderer.cinematic lighting,ultra HD3D renderino iw 1.5 s 500 v 5”。 效果示例: 不同照片生成:如果对照片风格不满意,可以换一张新照片使用上述提示词重新生成。 其他调整:如果觉得 Disney 风格太过卡通,可以把提示词里的“Disney”换成“Pixar”;如果是女孩,可以把“boy”换成“girl”。每次会生成 4 张图片,对某一张满意可点击下方的 U1~U4 生成大图,对风格满意但需调整可点击 V1~V4 进行修改。 2. 简单提示词: 在聊天窗口输入/imainge 找到/imagine prompt,然后把链接放进去,空格后加提示词(以英文逗号分隔),最后加上设置参数。 设置参数:“iw 1.5”设置参考图片的权重,数值越高与参考图片越接近,默认 0.5,最大 2,可选择中间值调整;“s 500”设置风格强度、个性化、艺术性,数字越大越有创造力和想象力,可设置 0 1000 间任意整数;“v 5”指用 Midjourney 的第 5 代版本,这一代最真实,目前 v5 需要订阅付费,不想付费可用“v 4”;“no glasses”指不戴眼镜,不喜欢戴眼镜的图片可加上此设置。 完整的提示词示例(替换您的 png 图片地址):“ simple avatar,Disney boy,3d rendering,iw 1.5 s 500 v 5”。如果不满意,可调整“s”和“iw”的值多次尝试。 3. 背景知识: 之前制作过从零开始使用 Midjourney 并通过简单提示词生成图片的视频。 今天教利用 Midjourney 的以图绘图功能生成迪斯尼卡通风格头像。 要生成头像,先选一张满意的图片,在 Discord 社区的 Midjourney 服务器聊天栏点击“+”,然后点击上传文件,选取图片,发送(记得点击回车或发送按钮)。 图片上传到服务器会生成唯一链接,点击图片,在浏览器中打开,复制浏览器上方的链接。 使用这个链接加 prompt 提示词发送给 Midjourney,Midjourney 会根据需求生成特定图片,这就是 Midjourney 的以图绘图。 做卡通头像的教程不少,科技小飞哥这一篇写得通俗易懂,手把手教会怎么做。原文链接:https://leftpocket.cn/post/ai/cartoon/ 。如果还没有 Midjourney 账号,或者还不懂基础操作,可以看之前的教程:
2024-11-22
能够生成ai头像的免费网站或软件
以下是一些能够生成 AI 头像的免费网站或软件: 1. Looka:是一个在线 Logo 设计平台,使用 AI 理解用户品牌信息和设计偏好,生成多个设计方案供选择和定制。 2. Tailor Brands:AI 驱动的品牌创建工具,通过用户回答问题生成 Logo 选项。 3. Designhill:其 Logo 制作器使用 AI 技术创建个性化 Logo 设计,用户可选择元素和风格。 4. LogoMakr:提供简单易用的 Logo 设计工具,用户可拖放设计并利用 AI 建议。 5. Canva:广受欢迎的在线设计工具,提供 Logo 设计模板和元素,有 AI 辅助设计建议。 6. LogoAI by Tailor Brands:Tailor Brands 推出的 AI Logo 设计工具,根据输入快速生成方案。 7. 标小智:中文 AI Logo 设计工具,利用人工智能技术帮助创建个性化 Logo。 此外,您还可以参考以下资源获取更多相关信息: :介绍 Midjourney 生成照片所需的提示词,包括电影类型、灯光等方面。 :介绍用 Midjourney 生成盆景图片的关键词模板。 :系统介绍在云端部署 SD 模型搭建 AI 头像生成网站的方法。 :介绍使用 Flask、ngrok 和 Google Colab 利用免费 GPU 创建 AI 应用程序,如构建 Stable Diffusion 应用程序。
2024-10-31
AI头像
以下是关于 AI 头像的相关内容: 在 2050 的活动中,有 AI 玄学摊位,不仅可以看面相,还能生成 AI 头像。比如作者在摊位上体验了生成头像,原本不抱期望,认为摆摊状态下生成效率低且难满意,但实际生成的图像很漂亮,且是根据喜用神生成的专属玄学转运头像。 生成合心意的 AI 人物形象时,人物构图的视角选择很重要,包括正面、背面、侧面、仰视角、俯视角等。不同视角有不同的咒语关键词和生成思路,如正视角的关键词是“Front view”,生成咒语为“young girl,front view,ar 16:9”。通过关键词的约束,生成的人物形象会符合相应的视角要求,但某些视角可能存在部分不符合大众审美的情况。
2024-10-30
AI在建材类零售和电子商务可以有哪些应用
在建材类零售和电子商务中,AI 可以有以下应用: 1. 产品推荐:通过分析客户数据,为客户推荐可能感兴趣的建材产品。 2. 搜索和个性化:改善搜索结果,为每个客户提供个性化的购物体验,使其能更精准地找到所需建材。 3. 动态定价:根据市场需求和建材的供应情况等因素,动态调整建材产品价格。 此外,在更广泛的零售和电子商务领域,AI 还有以下应用: 1. 客户获取成本不断上升的情况下,品牌可以利用 AI 工具降低成本、转化更多购物者并提高客户保留率。 2. 对于完全在线运营的企业,很容易将 AI 工具整合到工作流程的许多部分中。例如,在房地产行业,有工具使代理商能够虚拟布置房产,帮助物业经理将潜在客户转化为预定的参观。 需要注意的是,以上是基于一般零售和电子商务中的 AI 应用情况进行的推测和总结,在建材类领域的具体应用可能会因行业特点有所不同。
2024-08-19
ai学英语商务阅读
很抱歉,目前知识库中没有关于“AI 学英语商务阅读”的相关内容。但一般来说,利用 AI 学习英语商务阅读可以通过以下几种方式: 1. 使用具有智能推荐和解析功能的英语学习 APP,它们能够根据您的水平和需求提供合适的商务阅读材料,并进行语法、词汇等方面的讲解。 2. 借助 AI 语言模型,如让其为您生成商务阅读相关的练习、解释复杂的句子结构等。 3. 参加在线的 AI 驱动的英语学习课程,这些课程可能会针对商务阅读进行专门的设计和教学。 希望以上建议对您有所帮助。
2024-08-08
为什么ai生成视频被寄予厚望
AI 生成视频被寄予厚望的原因主要有以下几点: 1. 技术突破:2023 年是人工智能视频领域的飞跃之年,在这一年中见证了数十种视频生成工具的问世,文本生成视频的模型持续进步,并且像图像转视频、视频转视频这样的衍生技术也开始流行起来。 2. 应用潜力:虽然目前工具存在局限性,但仍预示着正处于一场巨大变革的初期阶段,未来有望仅凭一个文本提示(或者几个提示)就制作出高质量的短片。 3. 产品优势:例如国内的可灵,在视频生成质量、生成速度和可访问性方面表现出色,达到了与国际顶级模型相当的水准,处理效率更高,为国内用户提供了便捷、稳定的使用体验。 4. 生成方式多样:从交互方式来看,当前 AI 视频生成主要可分为文本生成视频、图片生成视频、视频生成视频三种形式,且存在多种生成技术,如先生成静态关键帧图像再构建为视频序列,或直接端到端生成视频的技术。
2024-12-19
你可以根据问题说生成PPT或者图片吗
以下是关于生成 PPT 或图片的相关内容: 增强版 Bot 是基于 AI 驱动的智能创作平台,可实现一站式内容生成,包括图片、PPT、PDF 等。例如,在对话框输入诉求“生成常见的系统架构风格架构设计图”即可生成相应图片,输入“帮我生成一篇包含以上架构风格的完整 PPT”可生成 PPT 幻灯片内容及相关模板选择,输入“根据上面的架构风格,制作一篇常见系统架构风格的 PDF 文件”可生成相应的可选模板。 在 MJ 应用中,为 PPT 配图可通过复制图像链接和提示词,在 discord 中输入相应命令生成图像。生成后可改变比例和镜头拉远,检查构图,选择合适的图放入 PPT 调整构图。 在制作课程时,可通过一系列提问模板让 ChatGPT 协助创作章节内容,并将其转换成 PPT 格式,还可加入学员案例、参考范例让其进行改写或续写。
2024-12-19
有生成提示词的提示词嘛
以下是为您提供的关于生成提示词的相关信息: Apple Intelligence 中各种智能应用的提示词已曝光,包括用于生成 Apple Photos 中“回忆”视频的提示词。生成的内容需以 JSON 格式响应,遵循特定的故事和照片说明指南,且不能包含宗教、政治、有害、暴力、色情、肮脏或任何负面、悲伤或挑衅的内容。 一泽 Eze 提出通过输入一句提示词和一个品牌 Logo,利用大模型 LLM 可一键生成超级符合品牌调性的创意名片。提示词已开源,同时还介绍了获取提示词的流程、注意事项,如提示词的目的是设计符合品牌调性的创意名片,Logo 建议使用清晰、底图透明的 PNG 格式,若生成结果不符合预期可尝试让模型重新生成或提出修改意见。 【SD】自动写提示词脚本 One Button Prompt 可通过设定主题、正向提示词等生成随机的提示词,还能通过图生图控制,生成的提示词风格各异,可进行修改调整,也可使用“Latent Couple”插件给画面做定义。
2024-12-19
我想用AI把图片生成营销视频
以下是关于用 AI 把图片生成营销视频的相关信息: 生成式人工智能在营销中的应用:DALLE 2 和其他图像生成工具已被用于广告,如亨氏使用番茄酱瓶的图像和类似标签论证“这就是人工智能眼中‘番茄酱’的样子”;雀巢使用维米尔画作的人工智能增强版帮助销售酸奶品牌;Stitch Fix 服装公司使用 DALLE 2 根据客户偏好创建服装可视化;美泰使用该技术生成玩具设计和营销的图像。 判断图片是否为 AI 生成:AI 作画的画质画风偶尔会波动,不像人类画师作品质量大多稳定向上发展,AI 就像皮下雇佣无数画技参差不齐画手的批皮营销号,画质质量胡乱。 制作商业级 AI 视频广告的出图方法:MJ 出图质量稳定,使用门槛低,暂时无其他替代工具。常规操作是登录 Discord 网站,打开 MJ 服务器出图,通过/imagine 命令输入提示词生成图片。若想提高效率,可使用 Autojourney 插件,它是电脑浏览器的一个插件,能批量发送提示词、自动下载图片、自动放大图片、生成提示词等,在浏览器拓展程序中下载安装,激活后将 MJ 出图提示词复制到插件中即可自动批量出图,一次可输入 10 组提示词。
2024-12-19
目前我已经有了一个可以文生视频或者图生视频的模型但是只能6秒,我要如何利用agent自动流实现这个模型可以生成更长,更可靠质量的视频呢
要利用 agent 自动流实现生成更长、更可靠质量的视频,您可以参考以下几种模型和方法: 1. PixVerse V2 模型: 8 秒的视频生成需要花费 30 Credits,5 秒的视频生成需要花费 15 Credits,且只能使用 PixVerse V2 模型,生成时请注意模型选择。 目前仅支持 16:9 画面比例的视频生成。 文生视频:点击“Text to Video”,在“Model”选择“PixVerse V2”,视频时长。PixVerse V2 支持多风格的视频生成,您可以通过在提示词中加入“Anime”,“Realistic”等词语做到这点。 图生视频:点击“Image to Video”,在“Model”选择“PixVerse V2”,视频时长。图生视频暂不支持“Magic Brush”、“Camera Motion”、“Motion Strength”等功能,如需要使用上述功能,请将模型切换至“PixVerse V1”。 2. Meta Movie Gen 模型: Movie Gen 由视频生成和音频生成两个模型组成。 Movie Gen Video:30B 参数 Transformer 模型,可以从单个文本提示生成 16 秒、16 帧每秒的高清视频,相当于 73K 个视频 tokens。对于精确视频编辑,它可以执行添加、删除或替换元素,或背景替换、样式更改等全局修改。对于个性化视频,它在保持角色身份一致性和运动自然性方面取得 SOTA 性能。 Movie Gen Audio:13B 参数 Transformer 模型,可以接受视频输入以及可选的文本提示,生成与视频同步的高保真音频。 Movie Gen Video 通过预训练微调范式完成,在骨干网络架构上,它沿用了 Transformer,特别是 Llama3 的许多设计。预训练阶段在海量的视频文本和图像文本数据集上进行联合训练,学习对视觉世界的理解。微调阶段研究人员精心挑选了一小部分高质量视频进行有监督微调,以进一步提升生成视频的运动流畅度和美学品质。为了进一步提高效果,模型还引入了流匹配(Flow Matching)作为训练目标,这使得视频生成的效果在精度和细节表现上优于扩散模型。 3. Sora 模型: 文生视频,图生视频,视频生视频,支持多种视频定制选项,如分辨率(从 480p 到 1080p)、视频长度(从 5 秒到更长时间)和视频风格。用户可以浏览社区共享的视频,获取灵感和学习技巧(直接抄别人 prompt)。 故事板:允许用户通过时间线指导视频中的多个动作,创建更加复杂的视频序列。 混音和编辑:提供视频混音功能,允许用户将视频转换成新的风格。支持视频的延伸和剪辑,以及创建循环视频。 高级功能:包括混合功能,可以将两个视频场景合并成一个新的场景。 对于已经拥有 OpenAI Plus 或 Pro 账户的用户,Sora 的使用是包含在现有订阅中的,无需额外支付费用。OpenAI Plus 订阅每月 50 次视频生成次数;OpenAI Pro 订阅无限次慢速队列生成,500 次正常速度的视频生成次数。用户可以根据需要选择更高分辨率的视频生成,但这可能会减少每月的使用次数。Sora 的发布初期,对于某些地区(如欧洲和英国)可能会有延迟。
2024-12-19
nova有个图生视频的功能,但是只能生成6秒钟,我要如何组合服务去实现可以文生长视频并且也可以图生长视频呢
以下是一些实现文生长视频和图生长视频的方法: 1. 使用 PixVerse V2 模型: 单个视频生成(8s):8s 的视频生成需要花费 30 Credits,5s 的视频生成需要花费 15 Credits,且只能使用 PixVerse V2 模型,生成时请注意模型选择。目前仅支持 16:9 画面比例的视频生成。 文生视频:点击“Text to Video”,在“Model”选择“PixVerse V2”,视频时长。PixVerse V2 支持多风格的视频生成,您可以通过在提示词中加入“Anime”,“Realistic”等词语做到这点。 图生视频:点击“Image to Video”,在“Model”选择“PixVerse V2”,图生视频暂不支持“Magic Brush”、“Camera Motion”、“Motion Strength”等功能,如需要使用上述功能,请将模型切换至“PixVerse V1”。 2. 利用 runway: 视频的大部分片段用 runway(https://app.runwayml.com/)制作,少数的片段用的是即梦(https://jimeng.jianying.com/aitool/home)的动效画板和首尾帧。 以汽车内饰这一片段为例,登录 runway 账户后,在首页的左侧点击“Text/Imagine to Video”,中文即是“文生视频/图生视频”。点击 2 处将汽车内饰的图片上传到 runway 中。其中 1 处可以更改生成图片所用到的大模型版本,数字越大代表模型越强。目前只有 Gen2 每天有免费额度。3 处用于输入提示词。4 处可以修改生成的视频时长为 5s 或 10s,时长越长,生成的效果可能越不稳定。5 处可以看到生成的结果。提示词方框中输入的运镜方式“Roll Clockwise Shot slowly”是,即摄像机围绕垂直轴顺时针旋转,常用于创造动态的、有时令人眩晕的视觉效果。不想动脑的话,每个片段的运镜方式根据分镜表的建议来即可。运镜提示词该如何填写呢?可以参照:。runway 对于这些专有的运镜方式理解的很好。其他的提示词可以不填,先看看效果,如果效果不好,再补充简短的提示词重新生成视频。很多时候提示词过多,生成的视频就很怪异,像吃了毒蘑菇后看到的幻觉一样。改变提示词,改变生成时长,多抽卡几次,毕竟 runway 会员可以无限抽卡。 3. 海外产品 viva: viva 发布了首个开放给全部用户使用的 Sora 同架构视频生成模型,而且现阶段免费。支持文本生成视频、图片生成视频以及 4K 分辨率放大功能,另外也支持提示词的自动优化。文生视频单次可以生成一条 5 秒的视频,图生视频是 4 秒视频。
2024-12-19
如何快速生成一张AI产品宣传海报
以下是关于如何快速生成一张 AI 产品宣传海报的详细指导: 需求场景: 当您想在朋友圈、微博、Twitter 等平台发布内容时,纯文字可能吸引力不足。 网上的图片可能画质差、容易撞图,而自己相册中的照片可能不太理想。 大致流程: 1. 主题与文案:确定海报主题,可借助 ChatGPT 等文本类 AI 工具协助完成文案。 2. 风格与布局:选择期望的风格意向,背景可根据文案和风格灵活调整画面布局。 3. 生成与筛选:使用无界 AI 等工具,输入关键词,生成并挑选满意的海报底图。 4. 配文与排版:将上述素材进行合理排版,得到成品。排版同样可以参考 AIGC 海报成果。 一些设计海报的 AI 产品: 1. Canva(可画):https://www.canva.cn/ 是非常受欢迎的在线设计工具,提供大量模板和设计元素,AI 功能可协助选择颜色搭配和字体样式。 2. 稿定设计:https://www.gaoding.com/ 稿定智能设计工具采用先进人工智能技术,自动分析和生成设计方案,稍作调整即可完成完美设计。 3. VistaCreate:https://create.vista.com/ 简单易用的设计平台,提供大量设计模板和元素,用户可使用 AI 工具创建个性化海报,智能建议功能可帮助快速找到合适设计元素。 4. Microsoft Designer:https://designer.microsoft.com/ 通过简单拖放界面,可快速创建演示文稿、社交媒体帖子等视觉内容,还集成丰富模板库和自动图像编辑功能,如智能布局和文字优化,简化设计流程。 图生图方法: 首先,准备一张真实照片作为样图。然后,在无界 AI 找到图生图功能,别忘了添加关键词。如果要改变画面内容(比如父亲头发颜色),“二次元强度”改为 70%。左图为反向示例:啥也没写,所以 daddy 的发型被识别成了卤蛋。右图为正向示例:只添加了简单的人物关键词,父亲和女儿。可根据出图效果,进一步修改或增加提示词作为约束。例如,父亲的白发难以识别,就在人物关键词的基础上,增添“父亲一头白发”等修饰词。
2024-12-11
我给定一张图片,根据这张图片的人脸特征 生成一组写真图片
以下是关于根据给定图片的人脸特征生成写真图片的相关内容: 使用 SD 进行多人物脸部替换生成写真: 先正常生成一张特定内容的图片,如两个古风人物在大漠黄沙下互相对视。正向提示词包括“best quality, official art, 8k wallpaper, highly detailed, illustration, closeup, , upper body, antique style, drifting snow, yellow sand fills the sky, withered tree, desert, gu, <lora:武侠 V2_2.0:1>”,模型使用 majicmixRealistic 及武侠 lora。将生成的图发送到图生图中,调整重绘幅度为 0.4。在 roop 插件中进行脸部替换,如载入至尊宝和紫霞的照片形象。插件强大之处在于仅凭一张照片能复刻角色其他角度和表情。最后可使用 ps 扩图。如需插件,可添加公众号【白马与少年】回复【SD】获取。 给自己做卡通头像: 1. 复杂提示词:如“Disney boy, Low saturation Pixar Super details, clay, anime waifu, looking at viewer, nighly detailedreflections transparent iridescent colors. lonctransparent iridescent RGB hair, art by Serafleurfrom artstation, white background, divine cinematic edgelighting, soft focus. bokeh, chiaroscuro 8K, bestquality.ultradetailultra detail.3d, c4d. blender, OCrenderer. cinematic lighting, ultra HD3D renderino iw 1.5 s 500 v 5”。 2. 不同照片生成:若对照片风格不满意,可更换新照片使用上述提示词重新生成。 3. 其他调整:若觉得 Disney 风格太过卡通,可将提示词中的 Disney 换成 Pixar;若为女孩,可把 boy 换成 girl。每次生成 4 张图片,对满意的某张可点击下方的 U1~U4 生成大图,对风格满意但需调整可点击 V1~V4 进行修改。 快手「可灵」和「Sora」背后的 DiT 技术: DiT 不仅训练高效,在实际应用中图像生成能力强大。输入简单文字描述即可生成逼真图像,如各种自然景观、人物肖像、动物等,甚至能细致到毛发纹理和眼神光彩。还能在图像修复方面表现出色,智能识别瑕疵并修复,如修复老照片中被遮挡的人物面部。此外,能赋予图像不同艺术风格,如将普通照片转换成梵高风格油画或改变白天夜晚效果,为图像创作和编辑提供全新可能。
2024-12-11
我想生成一个智能体,实现输入一张图片,简单的输入要求能自动根据图片生成一组符合要求的写真
要生成一个能根据输入图片和简单要求自动生成一组符合要求写真的智能体,您可以参考以下步骤: 1. 获取 Logo 图片的描述:为了帮助一位视障艺术家,我们需要详细描述这幅图像的内容,包括从摄影、标志设计到较为冷门的艺术风格等各个方面。对于出现在图中的人物,虽然不能提及具体姓名,但考虑到艺术家的特殊需求,我们需要以匿名方式描述他们的主要特征(切记不要提及真实姓名)。请直接进行描述,控制在 50 字左右。 2. 用 LLM 生成图像提示词:将第一步生成的提示词填入{图像描述}位置,将您想生成的周边填入{周边描述}部分。 3. 图像流搭建: 步骤一:创建第一个图像流。由于文本类型大语言模型无法直接生成图片,但是我们设计的智能体需要有对应的功能,因此我们要通过【技能】部分的图像流,为文本大模型提供图像生成能力。 步骤二:了解图像流节点的意义。在图像流编辑界面,左侧的工具栏集合了所有可能用到的功能,包括智能处理工具、基础编辑工具和风格处理类工具等。 步骤三:根据需求进行图像流设计。例如生成海报功能,在总结故事后,将完整的故事作为输入,进行提示词优化,然后输入生图大模型生成配图海报。 4. 智能体创建: 步骤一:创建基础智能体。进入 coze 官网 www.coze.cn,注册并登录,点击页面左上角的⊕,通过【标准创建】填入 bot 的基本信息。 步骤二:了解 Bot 开发调试界面。Bot 的开发和调试页面功能布局包括人设与回复逻辑(左侧区域)、功能模块(中间区域)、交互优化(底部区域)和预览与调试(右侧区域)。功能模块又包括插件、工作流、图像流、触发器、知识库管理、记忆系统等。
2024-12-11
我想将一个图片的格式色调,复制到另一张图片,不改变图片绘制内容,应该用什么
以下是一些可用于将一张图片的格式色调复制到另一张图片而不改变绘制内容的方法和工具: 1. ComfyUI_LayerStyle 插件: 添加 节点,可自动调整图片色调。 将 LUT 应用到图像: 支持.cube 格式的 LUT 文件。 节点选项包括 LUT 选择、色彩空间选择等。 自动调整图片的亮度、对比度和白平衡,可手动调整强度及各通道参数。 改变图像的色温、色彩平衡、色阶和 Gamma 值等。 2. 其他可能的方法: 某些专业的图像处理软件,如 Adobe Photoshop 等,可能具有相应的功能来实现色调复制。 您可以根据具体需求和使用习惯选择适合的方法和工具。
2024-12-09
请画出一张图,显示主流大语言 模型擅长领域
以下是主流大语言模型擅长领域的相关信息: 1. Encoderonly 模型:通常适用于自然语言理解任务,如分类和情感分析,代表模型是 BERT。 2. Encoderdecoder 模型:同时结合 Transformer 架构的 encoder 和 decoder 来理解和生成内容,用例包括翻译和摘要,代表是 Google 的 T5。 3. Decoderonly 模型:更擅长自然语言生成任务,如故事写作和博客生成,众多 AI 助手基本采用此结构,包括 ChatGPT。 大模型的特点: 1. 预训练数据非常大,往往来自互联网上的论文、代码、公开网页等,先进的大模型一般用 TB 级别的数据进行预训练。 2. 参数非常多,如 Open 在 2020 年发布的 GPT3 就已达到 170B 的参数。 国内大模型分类: 1. 通用模型:如文心一言、讯飞星火等,处理自然语言。 2. 垂直模型:专注特定领域,如小语种交流、临床医学、AI 蛋白质结构预测等。 大型模型主要分类: 1. 大型语言模型:专注于处理和生成文本信息。 2. 大型多模态模型:能够处理包括文本、图片、音频等多种类型的信息。 大型多模态模型与大型语言模型的不同: 1. 处理的信息类型不同:大型语言模型专注于文本信息,大型多模态模型能处理多种类型信息。 2. 应用场景不同:大型语言模型主要用于自然语言处理任务,大型多模态模型可应用于更广泛领域,如图像识别与描述、视频分析、语音识别与生成等。 3. 数据需求不同:大型语言模型主要依赖大量文本数据训练,大型多模态模型需要多种类型数据训练。 相对大型模型的“小模型”:是在相对比较下规模较小的模型,实际是被设计来完成特定任务的,如最初用于图像分类的模型,只能分辨是或不是某一个东西。
2024-12-08
生成一张可视化图片
以下是关于生成可视化图片的相关知识: MJ 应用篇快速给 PPT 配图: 1. 复制图像链接:首先复制图片的网址,然后打开 discord,在聊天栏输入“/imagine prompt”。 2. 复制提示词:回到官网,把图像的提示词也复制下来,再回 discord 粘贴到刚才拷贝的网址后面,注意空个格。 3. 生成图像:输入命令,稍等一会儿就会得到一个内容和画风都和原图比较接近的图。如果效果不理想,多反复生成几次。 4. 改变比例和镜头拉远:放大觉得还不错的一张,点“Custom Zoom”,可以改变拉伸镜头后的画面比例,屏显 PPT 一般用 16:9,“zoom 参数”设置为 1.5 到 1.7 比较靠谱,太大(比如 2)可能会生成一些莫名其妙的东西。 5. 检查构图:选一张比较好的放大一下,就可以放进 PPT 调整构图。如果构图不太好,可以在当前这张图的基础上再用一次“Zoom Out 1.5x”。 Sora 原理解释: 以往的许多研究通过使用各种方法对视频数据进行生成建模,包括循环网络、生成对抗网络、自回归变换器和扩散模型。这些工作通常关注于视觉数据的狭窄类别、较短视频或固定大小的视频。Sora 是一个视觉数据的通用模型,它可以生成持续时间、纵横比和分辨率各异的视频和图像,长达一分钟的高清视频。 ComfyUI 的生图原理: 1. 条件引导:在去噪过程中,模型使用编码后的文本向量来引导图像生成,确保生成的图像与输入的文本描述相符。 2. 采样器:ComfyUI 提供了多种采样算法(如 Euler、DDIM、DPM++等)来控制去噪过程,不同的采样器可能会产生略微不同的结果或影响生成速度。 3. Vae 编码:VAE 是一种基于概率生成模型的框架,由编码器和解码器组成。编码器输入一幅图像,输出一个表示该图像特征的概率分布(通常是高斯分布,其均值和方差分别表示图像的特征);解码器接收一个随机采样的噪声向量(来自编码器输出的概率分布),通过一系列的卷积层和非线性激活函数,生成与输入图像相似的图像。 4. 结果输出:最终,ComfyUI 将生成的图像显示在界面上,用户可以保存、进一步编辑或用于其他目的。 5. 额外控制:ComfyUI 支持多种高级功能,如图像到图像(使用现有图像作为起点进行生成)、Lora(使用额外的小型模型来调整风格或内容)、ControlNet(允许用额外的图像来精确控制生成过程)、ipadapter(使用参考图像进行风格迁移生成)、放大和后处理(改善生成图像的质量和分辨率)。
2024-12-03