直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

人脸识别

回答

以下是关于人脸识别的相关信息:

  • 视频模型“可灵”的测试内容包括场景识别(室内和室外)、物体识别(静态和动态)、人物识别(面部、姿态)、动作识别(基本动作)等方面。例如,测试了模型在不同室内环境(办公室、厨房、卧室等)和室外环境(街道、公园、商场等)中的表现,对不同面部特征(不同年龄、性别、种族等)、人物姿态(站立、坐下、躺卧等)和基本动作(走路、跑步、跳跃等)的识别能力。
  • 11 月 24 日的 XiaoHu.AI 日报中提到:
    • DeepFace 是面部识别和分析工具,功能包括面部验证、识别和属性分析,整合多个先进模型,准确率超越人类,支持实时视频分析和外部系统调用。
    • Comfyui 进行了 SVD Image 2 Video 优化,优化内存占用至 8GB,并提供 workflow 以供在不同显卡上运行。
    • 有泄露的 GPTs 提示大集合,涵盖学术、占卜、医疗咨询等多个应用领域。
    • PixelDance 是高动态视频生成模型,能通过文本和图片生成复杂场景视频,在连贯性和视频质量方面表现卓越。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

视频模型:可灵

1.场景识别室内场景:测试模型在不同室内环境中的表现,例如办公室、厨房、卧室等。一个穿着西装的人正在办公室里,坐在电脑前工作。背景有办公桌、文件柜和窗户。一个人在厨房里烹饪,背景有炉灶、冰箱和厨具。(人没出现)室外场景:测试模型在不同室外环境中的表现,例如街道、公园、商场等。https://lumalabs.ai/dream-machine一群人在街道上行走,背景有车辆、行人和商店。1.物体识别静态物体:评估模型对静止物体的识别能力,如家具、车辆、建筑物等。动态物体:评估模型对移动物体的识别能力,如行人、跑步者、骑自行车的人等。1.人物识别面部识别:测试模型对不同面部特征的识别能力,包括不同年龄、性别、种族等。一组不同年龄段的人,包括儿童、青少年、成年人和老人。不同种族的人物面部图像。(好像是一样的)姿态识别:评估模型对不同人物姿态的识别能力,例如站立、坐下、躺卧等。一个人站立在房间中。一个人躺在床上(啊?2个人)1.动作识别基本动作:评估模型对基本动作的识别能力,如走路、跑步、跳跃等。一个人在草地上跳跃。

XiaoHu.AI日报

🔔 Xiaohu.AI日报「11月24日」 ✨✨✨✨✨✨✨✨1⃣️🤖 DeepFace:面部识别和分析工具功能包括面部验证、识别和属性分析。整合多个先进模型,准确率超越人类。支持实时视频分析和外部系统调用。🔗 https://x.com/xiaohuggg/status/1728049969058423029?s=202⃣️🖥️ Comfyui:SVD Image 2 Video优化优化内存占用至8GB。提供workflow以供在不同显卡上运行。🔗 https://github.com/hylarucoder/comfyui-workflow/blob/main/svd/svd-image-to-video.json🔗 https://x.com/hylarucoder/status/1727997579429126361?s=203⃣️📚泄露的GPTs提示大集合汇集了多种GPTs模型的泄露提示。涵盖多个应用领域,如学术、占卜、医疗咨询等。🔗 https://github.com/linexjlin/GPTs🔗 https://x.com/xiaohuggg/status/1727922701317370118?s=204⃣️🎥 PixelDance:高动态视频生成模型通过文本和图片生成复杂场景视频。在连贯性和视频质量方面表现卓越。

XiaoHu.AI日报

🔔 Xiaohu.AI日报「11月24日」 ✨✨✨✨✨✨✨✨1⃣️🤖 DeepFace:面部识别和分析工具功能包括面部验证、识别和属性分析。整合多个先进模型,准确率超越人类。支持实时视频分析和外部系统调用。🔗 https://x.com/xiaohuggg/status/1728049969058423029?s=202⃣️🖥️ Comfyui:SVD Image 2 Video优化优化内存占用至8GB。提供workflow以供在不同显卡上运行。🔗 https://github.com/hylarucoder/comfyui-workflow/blob/main/svd/svd-image-to-video.json🔗 https://x.com/hylarucoder/status/1727997579429126361?s=203⃣️📚泄露的GPTs提示大集合汇集了多种GPTs模型的泄露提示。涵盖多个应用领域,如学术、占卜、医疗咨询等。🔗 https://github.com/linexjlin/GPTs🔗 https://x.com/xiaohuggg/status/1727922701317370118?s=204⃣️🎥 PixelDance:高动态视频生成模型通过文本和图片生成复杂场景视频。在连贯性和视频质量方面表现卓越。