Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

动作姿态生成的网站

Answer

以下为一些关于动作姿态生成的网站相关信息:

在 Stable Diffusion 中,ControlNet 是一个强大的控制插件。对于姿态约束,您可以通过以下方式操作:

  1. 国风 3 模型点击生成姿势,但 AI 识别可能不准确,需耐心刷图和调整参数。
  2. 若要细化图片,可使用扩展图片的方法,将图发送到图生图,通过“缩放后留白”和提高重绘幅度改变背景,再用 ControlNet 中的 tile 模型细化,最后使用 SD 放大插件。
  3. 当找不到满足需求的动作图片时,可以自定义动作骨架。在【扩展】-【加载扩展列表】中搜索【posex】安装插件(若安装不了,可将分享的插件文件夹拷贝至...\sd-webui-aki-v4\extensions 目录,确保软件为最新版本后重启)。重启后来到首页,点击“将图片发送至 ControlNet”,可通过鼠标操作调整视角。如调一个玛丽琳梦露的经典动作,右边可调整出图尺寸,启用 ControlNet 时,若骨架图来自 posex 链接,无需添加图片和预处理器,直接加载 openpose 模型即可。

另外,公众号【白马与少年】有不同 pose 的骨架图可供参考,回复【SD】获取。该公众号还分享 Stable Diffusion、Blender 等学习心得,有 139 篇原创内容持续更新。

Content generated by AI large model, please carefully verify (powered by aily)

References

【SD】最强控制插件ControlNet(2)姿态约束

[title]【SD】最强控制插件ControlNet(2)姿态约束依旧是国风3模型,点击生成,这个姿势就绘制出来了。当然,AI的识别不会这么准确,经常会出现骨骼错位的崩坏图,所以需要你耐心的去刷图和调整参数。好了,今天我们介绍了ControlNet中关于姿态约束类的预处理器和模型。另外,我这边还收集了一些不同的pose的骨架图,可以在人物动作上做一些参考,有需要的可以添加我的公众号【白马与少年】,回复【SD】即可。-END-白马与少年Stable Diffusion、Blender等学习心得分享139篇原创内容(持续更新中)公众号微信扫一扫关注该公众号

【SD】最强控制插件ControlNet(2)姿态约束

[title]【SD】最强控制插件ControlNet(2)姿态约束这张图蛮好看的,我决定来把她细化一下。首先,我们使用之前讲过的扩展图片的方法,将这张图发送到图生图,通过“缩放后留白”和提高重绘幅度,将这张图片的背景变宽。再次发送到图生图,使用ControlNet中tile模型(这又是一个神器,后面细讲)进行细化。这时,图片拥有了更精致的细节,最后再使用一次SD放大插件。完美。以上,就是关于ControlNet中姿态约束类预处理器的介绍,但是很多时候,我们并不能恰好找到满足我们需求的动作图片拿来给ControlNet解析,那我们可不可以自定义动作骨架呢?答案当然是可以的,作为一个开源软件,各种各样的插件帮手自然是必须有的,这也是我们这么喜欢blender的原因。我们可以在【扩展】-【加载扩展列表】中搜索【posex】,就可以找到这个插件。如果安装不了,可以直接将我分享的这个插件文件夹拷贝至这个目录下...\sd-webui-aki-v4\extensions,确保软件是最新版本,然后重启。我们重启软件后来到首页,点击“将图片发送至ControlNet”,就可以得到如下界面。拖动鼠标左键可以旋转视角。拖动鼠标中键可以缩放视角。拖动鼠标右键可以拖动视角。如果玩坏了,可以点击这里重置镜头和动作。我们调一个玛丽琳梦露的经典动作来试一试,右边可以调整出图的尺寸。接下来启用ControlNet,因为骨架图是从posex链接过来的,所以这里不需要再添加图片,也不需要预处理器,直接加载openpose的模型就可以了。

Others are asking
我想知道目前最新、效果最好、代码和模型开源的动作捕捉算法,也叫做人体姿态估计,是哪篇文章
目前最新、效果较好且代码和模型开源的人体姿态估计(动作捕捉算法)相关的研究有以下两篇: 1. 【SD】最强手部识别,controlnet 新预处理器 dw openpose 作者:白马少年|公众号:【白马与少年】 发布时间:20230813 20:00 原文网址:https://mp.weixin.qq.com/s/_RiKxWy9MXt4DUJIKH5w 介绍:在 controlnet 中,手部识别一直使用的是 openpose 预处理器,但复杂手势有时无法识别。新的 dw openpose 预处理器能完美解决手部识别问题,将其放入特定目录即可使用。但需说明的是,目前这个 DW Pose 只是更精确的 openpose 预处理器,未对 ControlNet 的 openpose 模型做改动。 2. YOLONAS Pose:一个开源的实时人体姿态估计模型 应用场景:基于骨骼标记为基础,适用于智慧体育等场景,可对训练过程的姿态、数据、状态等进行统计和管理。 技术类型:视频、AI 学习模型 简介:主要功能是识别图片和视频中人的姿势,能快速处理图像并实时返回姿态数据,适应不同场景和设备。 主要特点: 实时性能:旨在提供实时的姿态估计,适用于需要即时反馈的应用。 高精度:利用神经网络架构搜索(NAS)提高姿态估计的准确性。 优化的网络结构:NAS 自动测试不同网络结构,找到最优模型。
2024-12-31
动作姿态生成
以下是关于动作姿态生成的相关内容: 在使用 Stable Diffusion 进行动作姿态生成时,可采用以下方法: 1. 利用 ControlNet 中的姿态约束功能,如国风 3 模型,点击生成姿态,但可能存在骨骼错位等问题,需要耐心刷图和调整参数。同时,还收集了不同 pose 的骨架图,可通过添加公众号【白马与少年】回复【SD】获取参考。 2. 对于人物绘制,先确定人物动作,可在草图基础上用 Clip Studio Pro 中的 3D 人物模型进行姿态调整,或使用其他 3D Pose 类软件生成人物姿态,然后使用 ControlNet 的 Openpose 功能生成人物姿态。为控制人物色彩,可采用合适图片放入 img2img 中调整 Denoising strength,或使用 ControlNet Color 等插件,过程中需进行 img2img 反复迭代,并适时加入背景元素,人物大致确定后用 photoshop 融合,再继续生成和调整。 3. 对于特殊物品如天狗面具,若 Stable Diffusion 没有合适模型和 Lora,可自行训练专用 Lora,使用时用 inpainting sketch 重绘或在 Photoshop 处理后进入 img2img 重绘,注意重绘区域要小。 4. 对图片进行细化时,可使用扩展图片方法,将图发送到图生图,用 ControlNet 中 tile 模型细化,再使用 SD 放大插件。若找不到满足需求的动作图片,可在【扩展】【加载扩展列表】中搜索【posex】插件,安装或拷贝至指定目录,重启软件后在首页点击“将图片发送至 ControlNet”进行操作,可通过鼠标操作调整视角,调动作时启用 ControlNet,若骨架图来自 posex 链接,无需添加图片和预处理器,直接加载 openpose 模型。
2024-11-01
如何在midjourney中只进行照片背景修改,而不修改人物姿态和表情
在 Midjourney 中只修改照片背景而不修改人物姿态和表情,您可以参考以下方法: 1. 得益于cref,midjourney 能够迅速达成角色一致性的目的而无需 Lora。其中,cref 代表 character reference(角色参考);cw 则代表 character weight(参考权重),默认为 100,会参考角色的人脸和服装特点。如果您只想关注人脸,请调低到 0。您不需要对角色原图使用/describe 来贴近目标生成角色的形象,因为cref 会帮您完成这件事情。 2. 风格复制和服装的替换,则应当用提示词(prompt)和sref,默认值 100,越高越接近参考图像的风格。 3. 如果遇到“形似而神不似”的问题,即 MJ 直出和原人物在眼睛、眉毛、鼻子等其他地方的大小、间距有一些细微的差距,您可以按照以下步骤操作: 使用/settings 确保您处于模式并且 Remix 设置为打开。 选择带有您想要更改的面部的图像。使用将其从网格中分离出来,然后选择。 由于您已经开启了 Remix,您将能够编辑提示。 从提示中删除cref 和cw。一旦删除了它们,修改提示以对面部进行更改。例如,您可以慷慨地选择面部的下半部分,并添加“清洁剃须”来除去胡须。您可以尝试使用小的负权重,例如 tattoos::0.5 来移除纹身。 注意:当您对更改满意时,请确保不要再次添加cref 到提示中!一旦添加回来,“面部交换”将再次发生,那些不需要的属性将重新出现。 4. 有时,Midjourney 在正确将角色放置在背景中时会遇到一些困难。如果结果不连贯(例如,您看到头部朝后或图像被奇怪地裁剪),请尝试将 stylize增加到 800 1000。您也可以尝试将cw 同时降低到低于 100 的值,视情况而定。
2024-10-10
AI应用在PPT生成的案例
以下是关于 AI 应用在 PPT 生成的案例: 1. 在“直播一期:知识库及 GPT 基础介绍”中提到,GPT 可以用于 PPT 生成,相关链接: 。 2. 在“给小白的 AI 产品推荐”中,推荐了国内的爱设计 PPT 作为 AI 辅助制作 PPT 的产品。其背后有强大的团队,能敏锐把握市场机遇,已确立市场领先地位,代表了国内 AI 辅助 PPT 制作的高水平。 3. 在“熊猫 Jay:超全的 AI 工具生成 PPT 的思路和使用指南,收获培训奖励 1000”中提到,目前市面上大多数 AI 生成 PPT 的主要思路为:AI 生成 PPT 大纲,手动优化大纲,导入工具生成 PPT,优化整体结构。并推荐了关于 ChatGPT 原理和提示词的文章。
2025-02-19
有什么AI相关的笔记软件,既可以记录我的想法、灵感,然后AI也可以直接生成对我所写内容的评价(如可以安抚情绪),并且这个笔记软件的检索功能很好用
以下是一些符合您需求的 AI 相关笔记软件: 1. Notion AI:https://www.notion.so/help/guides/category/ai?ref=indigox.me 随着大语言模型的流行,其在智能化方面表现出色。 2. Mem.ai:https://mem.ai/?ref=indigox.me 一款 AI 驱动的笔记工具。 3. Pile:https://udara.io/pile/ 开源且界面美观,助力日记撰写和记录,集成 OpenAI API,具有 AI 搜索和问题解答功能,保证安全隐私。项目源码:https://github.com/UdaraJay/Pile
2025-02-19
图片生成工具
以下是一些常见的图片生成工具: 1. Tripo AI:由 VAST 发布的在线 3D 建模平台,能利用文本或图像在几秒钟内生成高质量且可立即使用的 3D 模型,基于数十亿参数级别的 3D 大模型,实现快速的 2D 到 3D 转换,提供 AI 驱动的精准度和细节。 2. Meshy:功能全面,支持文本生成 3D、图片生成 3D 以及 AI 材质生成,用户可上传图片并描述材质和风格来生成高质量 3D 模型。 3. CSM AI:支持从视频和图像创建 3D 模型,Realtime Sketch to 3D 功能支持通过手绘草图实时设计 3D 形象再转换为 3D 模型。 4. Sudo AI:支持通过文本和图像生成 3D 模型,特别适用于游戏领域的模型生成,用户可上传图片或输入文本提示词来生成。 5. VoxCraft:由生数科技推出的免费 3D 模型生成工具,能将图像或文本快速转换成 3D 模型,并提供图像到 3D、文本到 3D 和文本到纹理等多种功能。 此外,谷歌图像生成工具具有理解能力强、生成速度快、可调整提示词和选项等特点,但有使用门槛,不能输入中文,每日免费 500 次。纳米搜索反推提示词工具可上传图片反推 midjourney 提示词,输出效果好,能调用多种模型,可用于查阅资料。 OpenAI 的图像生成端点允许在给定文本提示的情况下创建原始图像,生成的图像大小可为 256x26、512x512 或 1024x1024 像素,较小尺寸生成速度更快,可使用参数一次请求 1 10 张图像,描述越详细越可能获得想要的结果。其图像编辑端点允许通过上传蒙版来编辑和扩展图像。 这些工具通常具有用户友好的界面,无需专业 3D 建模技能即可简单操作,广泛应用于游戏开发、动画制作、3D 打印、视觉艺术等领域。
2025-02-19
提示词生成
以下是关于提示词生成的相关内容: ComfyUI 中的提示词生成: 在 ComfyUI 里使用 MiniCPM 做图片提示词反推与文本提示词生成,可以和 flux 模型配合生成图片。建议使用量化版本的模型(int4 结尾)以节省显存。 安装方法: 1. 进入 ComfyUI 自定义节点目录。 2. 克隆相关仓库。 3. 重启 ComfyUI。 模型网盘:https://pan.quark.cn/s/00b3b6fcd6ca ,下载后放入 ComfyUI 的 models 文件夹下 MiniCPM 文件夹中,没有就新建一个。 “城市狂想”中的图片提示词生成: 为大家提供了猫叔之前写的一段提示词的 prompt,生成了三条 prompt,如: 1. 远景,三分法构图,俯视视角,数字绘画,云雾缭绕的山谷,群山连绵起伏,山谷间云雾缭绕,阳光透过云层洒在山间,形成光与影的对比,模拟观众的视线逐渐接近这片土地,新印象派风格特征,使用数字画笔和渐变工具ar 16:9v 6.1 2. 远景,中心对称构图,俯视视角,摄影风格,云雾中的山谷,山峦在云雾中若隐若现,山谷中隐约可见的河流蜿蜒流淌,云雾的流动感和山的静态形成对比,现实主义风格特征,使用长焦镜头和景深控制技术ar 3:2v 6.1 3. 远景,对角线构图,俯视视角,水墨画风格,云雾缭绕的山谷,山峦线条流畅,云雾以墨色深浅表现,山谷中的云雾仿佛在流动,给人以动态的视觉感受,中国山水画风格特征,使用毛笔和水墨渲染技术ar 2:3v 6.1 同时为大家直接生成了 1 组共 12 段提示词,使用时需注意,如果在其他平台的工具中使用,请复制后删除包含“”以后的部分。 艺术字生成: 模型选择图片 2.1,输入提示词(可以直接参考案例提示词)。 案例参考: 1. 金色立体书法,”立冬“,字体上覆盖着积雪,雪山背景,冬季场景,冰雪覆盖,枯树点缀,柔和光影,梦幻意境,温暖与寒冷对比,静谧氛围,传统文化,唯美中国风 2. 巨大的春联,金色的书法字体,线条流畅,艺术美感,“万事如意” 3. 巨大的字体,书法字体,线条流畅,艺术美感,“书法”二字突出,沉稳,大气,背景是水墨画 4. 巨大的奶白色字体”柔软“,字体使用毛绒材质,立在厚厚的毛绒面料上,背景是蓝天 原文链接:https://mp.weixin.qq.com/s/jTMFYKxsN8dYNZu3VHKBnA
2025-02-19
可以自动生成PPT的工具
以下是一些可以自动生成 PPT 的工具: 1. WonderGPT:把颜值和交互体验做到极致,简单而美观。网址:https://wondergpt.co/ 2. StabilityGPT:在 GPT4 中运行 Stable Diffusion,作者做了一个 ChatGPT 插件,可以在 ChatGPT 发出提示词后返回 SD 生成的图像,能与 ChatGPT 原有的能力深度结合。 3. Graph Maker:上传数据之后通过自然语言对数据内容进行分析输出结果,包括生成可视化的图表分析。网址:https://www.graphma 4. Coda AI:Coda 发布的 AI 能力,在帮助写文档润色内容方面和 Notion 差不多,强大的功能是能够获取跟 Coda 链接的很多应用里的数据进行整合和分析甚至联动。网址:https://coda.io/prod 5. Motion Go:国产工具,原来是做 PPT 附加插件的,现在可以通过自然语言自动生成 PPT 页面和对应内容智能增加动画。网址:https://motion.yooai.com 6. Triple whale:AI 电商助手,支持广告的数据监测,创意数据的跟踪和分析、跟踪和管理与 KOL 的营销活动,AI 整合分析进行异常检测并给出建议。网址:https://www.triplewhale.com/ 7. Prompt Storm:ChatGPT 提示词浏览器扩展,一个简单易用的谷歌浏览器扩展。网址:https://promptstorm 此外,使用 Process ON 自动生成 PPT 的思路和步骤如下: 网址:https://www.processon.com/ 输入大纲和要点: 导入大纲和要点: 手动复制,相对较耗时间。 导入方式: 复制最终大纲内容到本地 txt 文件,将后缀改为.md。若看不见后缀,自行搜索开启后缀。 打开 Xmind 软件,将 md 文件导入 Xmind 文件中。 在 Process ON 导入 Xmind 文件。 输入主题自动生成大纲和要求:新增思维导图,输入主题,点击 AI 帮我创作。 选择模版并生成 PPT:点击下载,选择导入格式为 PPT 文件,选择模版再点击下载。若喜欢用 Process ON 且没有会员,可在某宝买一天会员。
2025-02-19
目前市面上免费的生成图片的AI工具有哪些?
目前市面上免费的生成图片的 AI 工具主要有以下几种: 1. 文生图工具: DALL·E:由 OpenAI 推出,能根据输入的文本描述生成逼真图片。 StableDiffusion:开源工具,可生成高质量图片,支持多种模型和算法。 MidJourney:因高质量的图像生成效果和用户友好的界面设计而受欢迎,在创意设计人群中流行。 您可以在 WaytoAGI 网站(https://www.waytoagi.com/category/104)查看更多文生图工具。 2. 图生图工具: Artguru AI Art Generator:在线平台,生成逼真图像,为设计师提供灵感,丰富创作过程。 Retrato:将图片转换为非凡肖像,有 500 多种风格选择,适合制作个性头像。 Stable Diffusion Reimagine:通过稳定扩散算法生成精细、具有细节的全新视觉作品。 Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计,将上传的照片转换为芭比风格,效果好。 3. 图片生成 3D 建模工具: Tripo AI:VAST 发布的在线 3D 建模平台,能利用文本或图像在几秒钟内生成高质量且可立即使用的 3D 模型。 Meshy:支持文本生成 3D、图片生成 3D 以及 AI 材质生成。 CSM AI:支持从视频和图像创建 3D 模型,Realtime Sketch to 3D 功能支持通过手绘草图实时设计 3D 形象,再转换为 3D 模型。 Sudo AI:支持通过文本和图像生成 3D 模型,适用于游戏领域的模型生成。 VoxCraft:由生数科技推出的免费 3D 模型生成工具,能将图像或文本快速转换成 3D 模型,并提供多种功能。 需要注意的是,这些工具可能存在一些局限,如偶尔会出现性能不稳定、生成内容不当等问题。内容由 AI 大模型生成,请仔细甄别。
2025-02-19
通往agi之路的网站啥时候建立的?
通往 AGI 之路(WayToAGI)于 2023 年 4 月 26 日诞生。
2025-02-19
AI制图 描述词网站
以下是一些关于 AI 制图描述词的网站: 1. http://www.atoolbox.net/ ,它可以通过选项卡的方式快速填写关键词信息。 2. https://ai.dawnmark.cn/ ,每种参数都有缩略图参考,方便更加直观地选择提示词。 3. https://civitai.com/ ,每一张图都有详细的参数,可以点击复制数据按钮,将参数粘贴到正向提示词栏里。 在进行 AI 制图描述时,通常的描述逻辑包括人物及主体特征(服饰、发型发色、五官、表情、动作),场景特征(室内室外、大场景、小细节),环境光照(白天黑夜、特定时段、光、天空),画幅视角(距离、人物比例、观察视角、镜头类型),画质(高画质、高分辨率),画风(插画、二次元、写实)。通过这些详细的提示词,能更精确地控制绘图。 对于新手而言,还需注意以下几点: 1. 图片内容通常分为二维插画以及三维立体两种主要表现形式。 2. 主题描述时,对于场景中的人物要进行独立描述,不要用一长串文字表达,以免 AI 识别不到。 3. 设计风格方面,可以找风格类的关键词参考或垫图/喂图,让 AI 根据给出的图片风格结合主题描述生成相应风格的图片。 4. 某些材质的描述,如玻璃、透明塑料、霓虹色彩等,关键词的运用有很多门道,需要针对某一种风格单独进行“咒语测试”。
2025-02-18
有哪些比较好的AI知识库学习网站
以下是一些比较好的 AI 知识库学习网站及相关学习建议: 通往 AGI 之路知识库: 提供了全面系统的 AI 学习路径,帮助您了解从 AI 常见名词到 AI 应用等各方面知识。 包含关于 AI 知识库使用及 AIPO 活动的介绍、AIPO 线下活动及 AI 相关探讨、way to AGI 社区活动与知识库介绍等内容。 信息来源有赛博蝉星公众号、国外优质博主的 blog 或 Twitter 等,推荐大家订阅获取最新信息并投稿。 有社区共创项目,如 AIPU、CONFIUI 生态大会,每月有切磋大会等活动,还发起了新活动 AIPO。 学习路径方面,有李弘毅老师的生成式 AI 导论等高质量学习内容,可系统化学习或通过社区共创活动反推学习,鼓励整理学习笔记并分享交流。 有经典必读文章,如介绍 GPT 运作原理、Transformer 模型、扩散模型等的文章,还包括软件 2.0 时代相关内容。 初学者入门推荐看 open AI 的官方 Cookbook,小琪姐做了中文精读翻译,也可查看 cloud 的相关内容。 有历史脉络类资料,整理了 open AI 的发展时间线和万字长文回顾等。 网站:ytoAGI.com 相关渠道:公众号“通往 AGI 之路”、 在线教育平台:如 Coursera、edX、Udacity 等,上面有一系列为初学者设计的课程,您可以按照自己的节奏学习,并有机会获得证书。 对于新手学习 AI,建议: 了解 AI 基本概念:阅读「」部分,熟悉 AI 的术语和基础概念。了解什么是人工智能,它的主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 开始 AI 学习之旅:在「」中,找到一系列为初学者设计的课程。特别推荐李宏毅老师的课程。 选择感兴趣的模块深入学习:AI 领域广泛(比如图像、音乐、视频等),根据自己的兴趣选择特定的模块进行深入学习。掌握提示词的技巧,它上手容易且很有用。 实践和尝试:理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 体验 AI 产品:与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。
2025-02-18
哪个ai工具可以根据现有的网站或截图生成源代码
以下是一些可以根据现有的网站或截图生成源代码的 AI 工具: :借助 GPT4 Vision 的能力,能直接将屏幕截图转换为 HTML/Tailwind CSS,并利用 DALLE 3 的图像生成能力生成相似图像。 此外,还有一些与网站制作相关的 AI 工具: Wix ADI 。基于用户提供的信息自动生成定制化网站,提供多个设计选项和布局,集成了 SEO 工具和分析功能。 Bookmark:网址为 。通过询问用户几个简单问题快速生成网站,提供直观的拖放编辑器,包括多种行业模板和自动化营销工具。 Firedrop:网址为 。其 AI 设计助手 Sacha 可根据用户指示创建和修改网站设计,提供实时编辑和预览功能,包含多种现代设计风格和自定义选项。 The Grid:网址为 。其 AI 设计助手 Molly 可以自动调整网站的设计和布局,基于内容和用户互动进行优化,支持多种内容类型。 在 AI 代码生成和开发工具方面: :由 Wingware 开发的专为 Python 编程设计的开发环境,集成了多种功能,年度许可证起价 179 美元/月。 :开源的 AI 开发助手,能根据产品需求生成完整的代码库,遵循 MIT 许可证。 :Sourcegraph 的 AI 工具,作为全面的编程助手能理解整个代码库,个人使用免费。
2025-02-18
有没有大模型测评网站
以下是一些大模型测评网站: 玉宝搞过的 LLM 在线评估网站:https://www.llmrank.cn/ ,可看到国内各个闭源大模型的 HUMANEVAL 测评得分,并能与 QWEN2 对比。 Compass Arena:由上海人工智能实验室和魔搭社区联合推出,集齐了国内主流的 20 多款大模型,包括阿里通义千问、百度文心一言、腾讯混元、讯飞星火、字节跳动豆包、智谱 AI、百川智能、零一万物、月之暗面等,用户可在平台选择大模型的两两“对战”,实名或匿名对战皆可。测评地址:https://opencompass.org.cn/arena 。 中文大模型评测收集与调研相关网站: InfoQ + 极客帮:https://www.guotaixia.com/post/5124.html GAOKAOBench:https://github.com/OpenLMLab/GAOKAOBench ,是以中国高考题目为数据集,测评大模型语言理解能力、逻辑推理能力的测评框架。 清华安全大模型测评:http://115.182.62.166:18000 ,清华收集的一个评测集,涵盖了仇恨言论、偏见歧视言论、犯罪违法、隐私、伦理道德等八大类别,包括细粒度划分的 40 余个二级安全类别。 JioNLP 个人测评:评测数据集:https://github.com/dongrixinyu/JioNLP/wiki/LLM 评测数据集 ,考察 LLM 模型对人类用户的帮助效果、辅助能力,可否达到一个【智能助手】的水平。 EduTEP:华东师范大学计算机科学与技术学院 EduNLP 团队组建智能教育算法测评小组,开发智能教育可信评测平台(EduTEP)。EduTEP 对比多种大模型在教育领域中的综合性能,针对 K12 教育发布首个 CALMEDU 评测框架与 CALMEDU001 评测报告。 娱乐资本论:从实用角度出发,分析大模型在各种文本应用场景,如小红书带货文案、抖音直播文案、知乎问答、小说创作、公关信写作、歌词生成、淘宝商品详情页文案、广告宣传片文案、剧本创意策划等方面的综合表现。 全面的模型测评网站:https://lmsys.org/blog/20230503arena/
2025-02-15
runway ia 网站入口
Runway 是一家总部位于旧金山的 AI 创业公司推出的产品。其在 2023 年初推出的 Gen2 代表了当前 AI 视频领域最前沿的模型,能够通过文字、图片等方式生成 4 秒左右的视频。 Runway 致力于专业视频剪辑领域的 AI 体验,同时也在扩展图片 AI 领域的能力。目前 Runway 支持在网页(https://runwayml.com/ )和 iOS 访问。网页端目前支持 125 积分的免费试用额度(可生成约 105 秒视频),iOS 则有 200 多,两端额度貌似并不同步,想要更多试用次数的朋友可以下载 iOS 版本。 注册零门槛,在网页右上角 Sign Up 注册,输入邮箱与基础信息,完成邮箱验证即可。 生成第一个视频的步骤如下: 1. 选择左侧工具栏“生成视频”。 2. 选择“文字/图片生成视频”。 3. 将图片拖入框内。 4. 选择一个动画系数。 5. 点击生成 4 秒视频。 6. 下载视频。 在各 AI 视频工具的比较中,Runway 在真实影像方面质感最好,战争片全景的镜头处理得最好,控件体验感较好,但特别爱变色,光影非常不稳定,控制能力最强,可指定局部对象设置运动笔刷。
2025-02-14
生成漫画动作参考图
以下是一些生成漫画动作参考图的方法: 1. 喂参考图:先上传喜欢的参考图,复制其链接。在关键词处填写“图片链接+这张图的关键词”,例如“链接图片.png,a Super cute sports girl,wearing a basketball vest,blueshortsbig watery eyes,clean bright basketball court background,super cute boy IP by pop mart,Bright color,mockup blind box toydisney stylefine luster,3D render,octane render,best quality,8k brightfront lightingFace Shot,fine luster,ultra detail,ar 9:16”。还可以通过修改关键词改变服装颜色等细节。 2. 使用 panels 命令:此命令可生成连续的动作和表情设计,将模型设置改为 niji mode 画动漫角色效果更好。例如“a Super cute sports anime girl,style by Miyazaki Hayao,6 panels with different poses 8K”,也可以使用“continuous running”生成更稳定的连续动作,甚至做成 gif 动画。 3. 利用 character sheet 命令:创建一个角色的多角度以及特写细节,例如“a Super cute sports anime girl,style by Miyazaki Hayao,character sheet,full body,8k”。 4. 使用 emoji、expression sheet:emoji 代表表情包,expression sheet 代表各种表情组合,可用此核心关键词设计出表情包。例如“图片链接.png a Super cute sports anime girl,style by Miyazaki Hayao,emoji,expression sheet,8k”。 另外,使用 ControlNet 插件也能生成漫画动作参考图。首先进入文生图,填写提示词生成一张图。然后将图片拖入到 ControlNet 中,预处理器选择 reference only,控制模型选择“均衡”,保真度数值越高,对图片的参考越强。可以通过添加关键词的方式给人物换装、更改服装和表情、更改动作和表情、更改姿态、环境和表情等。这个功能在绘制系列插画、漫画、小说插图等工作时,能保持主角形象的统一,也能根据情况实时调整,后期配合 lora 潜力巨大。
2025-02-11
midjourney中如何结合A图片的人物和B图片的动作和内容
在 Midjourney 中结合 A 图片的人物和 B 图片的动作和内容,可以使用新上线的“Character Reference”(cref)功能。以下是一些关键方法和示例: 1. 锚定细节:您可以掌控姿势、表情、情感、服装、道具、场景、动作等细节。例如:“Jo is a young woman with blue curly hair, pink sunglasses, and a colorful scarf around her neck. She waits in line at the bank. cref https://my.image.host/joisstanding.jpg”。 2. 让 cref 处理大部分工作:提示无需加强标志性细节,只是“操纵”或“定位”角色。例如:“有人正在银行排队等候。 cref https://my.image.host/joisstanding.jpg”。 3. 只提供场景:如果您的 cref 图像已包含想要的姿势和其他细节,您可以仅描述环境、周围环境、背景或情境,Midjourney 将努力将角色融入场景中。但可能会出现不连贯的结果,此时可尝试使用更高值的样式化,如“s 800”。 需要注意的是,此功能在使用 Midjourney 生成的图像人物时效果最佳,不太适用于真实人物或照片。同时,在 Midjourney V6 的 Web Alpha 版本中,您可以通过拖放或粘贴图像到想象栏,并选择相应图标来设置图像为图像提示、风格参考或角色参考。
2024-11-18
视频导出动作的AI
以下是关于视频导出动作的 AI 相关信息: AI 视频导出方面:普通社交媒体分享选 1080P,需放大选 720P,码率越高越好,可自定义最高 5 万。 Move AI 推出的 Move API 能从 2D 视频生成 3D 运动数据,支持多种 3D 文件格式导出,为 AR 应用、游戏开发等提供高质量 3D 运动数据,相关链接为 https://move.ai/api 。
2024-11-05
会自动作美女跳舞视频的AI
以下是为您提供的关于能自动制作美女跳舞视频的 AI 相关信息: XLabsAI 发布了 6 个不同的 Lora,分别是: 1. mjv6_lora Midjourney 风格,示例为:A fullprofile portrait of a Chinese dancer poised on a moonlit stone bridge, surrounded by the delicate blooms of a cherry orchard. Her silk garments ripple with her movement, her eyes are focused and intense, with skin details on her face. She's part of a scene inspired by classical poetry, her fluid motions a dance of elegance. The luminance is delicate and dreamlike, bestowing a soft ambience. 2. realism_lora 写实风格,示例为:In a conference room setting, a beauty women dressed in business attire are attending a meeting,random expressions, postures, and physical characteristics. A RAW ultrarealistic photo, UHD, 8k. 3. anime_lora 动漫风格,示例为:1girl. 4. disney_lora 迪斯尼风格,示例为:1cat, cartoon, disney. 5. scenery_lora 风景风格,示例为:A breathtaking view of the Himalayas mountain range, showcasing its majestic and serene beauty. The mountains are covered in snow, with their peaks reaching towards the sky, creating a stunning contrast with the blue horizon. The range is vast and imposing, with numerous towering peaks, including Mount Everest, the highest point on Earth. The scene captures the grandeur and tranquility of the Himalayas, with sunlight casting a soft glow on the snowcovered slopes. The foreground shows the rugged terrain and lush greenery of the lower elevations, adding to the diverse and spectacular landscape. 6. art_lora 艺术风格,示例为:Cat, European street, exploration, cozy, mysterious, colorful buildings, sunlight through leaves, cobblestone path, high definition, watercolor painting, warm tones, bright lighting effects, paper texture. Lora 下载地址:https://hfmirror.com/Kijai/fluxlorascomfyui/tree/main/xlabs
2024-09-21