目前最新、效果较好且代码和模型开源的人体姿态估计(动作捕捉算法)相关的研究有以下两篇:
作者:白马少年|公众号:【白马与少年】介绍:SD实践派,出品精细教程发布时间:2023-08-13 20:00原文网址:https://mp.weixin.qq.com/s/_RiKxWy9MX-t4DUJIK-H5w在我们的controlnet中,手部识别一直使用的是openpose预处理器,但是有些情况下,复杂的手势是无法识别的。比如,川建国同志的这张图。我们使用openpose-hand预处理器,检测出来的却没有手部。今天给大家推荐一款controlnet最新的预处理器,它能完美解决AI对于手部的识别问题,它就是——dw openpose大家从我的云盘中下载这个文件,将它放入到SD的这个目录下:extensions\sd-webui-controlnet\annotator\downloads\openpose我们刷新一下,就可以看到这个预处理器了,中文叫二阶蒸馏-全身姿态估计。可以看到手部被完美的识别了出来。我们再试试,使用战狼的经典形象,原先的预处理器无法识别。好像这种带透视的,手臂不完整的,都比较难以识别。换上我们的dw openpose,完美识别。出一张图试试看,可以看出,图中基本上复现了战狼这个手部的动作,但是感觉又挺奇怪的。需要说明一下的是,目前这个DW Pose只是更精确的openpose预处理器,并没有对ControlNet的openpose模型做任何改动,所以只能说AI的理解能力更强了,但是动手能力还有待提高。控制力度更强的ControlNet openpose模型需要我们等待后续的更新了。接下来,我们找一张难度没有那么大的图片试一试吧。
|技术名称|应用场景|技术类型|简介|主要特点|工作原理|其他|官方网站|项目及演示|论文|Github|在线体验|附件|最后更新时间||-|-|-|-|-|-|-|-|-|-|-|-|-|-||YOLO-NAS Pose:一个开源的实时人体姿态估计模型|基于骨骼标记为基础,智慧体育的场景是能想象的。<br>对于训练过程的姿态,数据,状态等进行统计和管理。<br>更科学有依据的提升。|视频,AI学习模型|它的主要功能是识别图片和视频中人的姿势。例如你有一段视频,里面有人在跳舞或者做运动,它能够识别出这个人的每个关节在哪里,比如手肘、膝盖等,然后画出这些关节具体姿态骨架图。<br>它能实时快速返回姿态数据并且还能适应不同的使用场景和设备。|YOLO-NAS-POSE的一些关键特点:<br>1、实时性能:YOLO-NAS-POSE旨在提供实时的姿态估计,这意味着它可以快速处理图像并实时返回姿态数据,适用于需要即时反馈的应用,如交互式系统。<br>2、高精度:通过利用神经网络架构搜索(NAS),YOLO-NAS-POSE能够找到最优的网络结构,从而提高姿态估计的准确性。<br>3、优化的网络结构:NAS通过大量的实验自动测试不同的网络结构,以找到在特定任务上表现最好的模型。这意味着YOLO-NAS-POSE的网络结构是为姿态估计任务特别优化的。<br>4、