Twelve Labs 成立于 2020 年,通过 API 为企业和开发者提供视频领域的多模态视频基础模型,主要用于视频多模态检索,用户可以通过输入文字、图片来寻找视频中的任意内容(text / picture to any);还推出了视频智能问答、智能分类的功能。
Twelve Labs 的愿景是成为 ChatGPT for video,目前是视频多模态搜索领域最好的产品,其最大的亮点是视频搜索效果非常准确,能够理解抽象概念,在同类中处于绝对领先的位置,客户普遍评价其搜索质量很好,搜索速度快、泛用性好。视频基础模型的壁垒很高,从优质的视频数据、处理数据的 infra、index 系统、训练方式,甚至到和芯片公司(投资方)的合作,Twelve Labs 都构建了一定的 "先发优势"。