以下是 2024 年 AI 应用的一些趋势:
苹果Vision Pro成为必备的机器人研究工具尽管消费者对Vision Pro的需求平淡无奇,但它在机器人研究领域引起了轰动,在那里其高分辨率、高级跟踪和处理能力被研究人员用于远程操作控制机器人的运动和动作。如Open-TeleVision和Bunny-Vision Pro使用它来帮助实现精确控制多指机械手(例如前者距离为3000英里),展示比以前的方法更复杂的任务的改进性能,如实时控制、通过碰撞避免的安全性和有效的双臂协调。在医学中利用大模型生成合成数据微调Stable Diffusion中的U-Net和CLIP文本编码器,从大量真实胸部X射线(CXR)及其相应的放射科医生报告中生成一个大型数据集,从而产生由权威放射科医生评估为高保真度和概念正确性的合成CXR扫描数据,并且生成的X射线图像可用于数据增强和自监督学习。企业自动化获得人工智能后将优先升级传统的机器人流程自动化(RPA),如UiPath,面临着高昂的设置成本、脆弱的执行和繁重的维护。两个新颖的方法,FlowMind(JP Morgan)和ECLAIR(斯坦福大学),使用基础模型来解决这些限制。FlowMind专注于金融工作流,通过API使用LLM来生成可执行的工作流。在对NCEN-QA数据集进行实验时,FlowMind在工作流理解方面达到了99.5%的准确率。ECLAIR采取了更广泛的方法,使用多模态模型从演示中学习,并直接与各种企业环境中的图形用户界面交互。在网页导航任务上,ECLAIR将完成率提高了从0%到40%。
算力瓶颈不只是单纯的技术和建设问题,而是影响整个行业竞争格局的重要变量。我们逐渐进入一个多模态灵活转换的新时代。简单来说,就是用AI实现文本、图像、音频、视频及其他更多模态之间的互相理解和相互转换。在人类劳动的未来图景中,劳动形式正在逐步“软件化”。复杂劳动被抽象为可调用的软件服务,劳动流程被大幅标准化和模块化,劳动能力像“即插即用”的工具一样易于获取。AI行业目前仍处于严重亏损的阶段,商业化进程仍有巨大提升空间。云厂商不仅掌握着庞大的商业生态和技术资源,还拥有数千亿美元的云服务市场规模。它们是产业链中毋庸置疑的“链主”。2024年,头部AI应用的品类变化并不显著。创意工具(如图像和视频内容创作)依然占据最大比重。To P(面向专业用户)应用展现出强大的市场潜力,ToB(面向企业)应用发展路径相对复杂,ToC应用面临较大的挑战。在AI应用领域,Copilot和AI Agent是两种主要的技术实现方式。Copilot可以理解为“辅助驾驶”,适合拥有先发优势的大厂。AI Agent可以视作“自动驾驶”,或许适合有足够创新能力的创业公司。北美和欧洲贡献了AI移动应用市场三分之二的份额,这也是众多中国AI公司积极出海的重要原因之一。希望能带来新的思考角度。我们持续关注AI赛道的发展,如果你是AI领域的创业者或者从业者,欢迎联系本文作者峰瑞资本投资合伙人陈石(chenshi@freesvc.com)。p.s.我们使用GPT辅助编辑了部分内容。互动福利
原文:https://a16z.com/100-gen-ai-apps-3/发表时间:2024年8月21日[无论我们是在构建节省时间的新工作流程](https://a16z.com/ai-voice-agents/)、探索[实际](https://x.com/omooretweets/status/1808897223645933709)[用途](https://x.com/omooretweets/status/1761069953736945823),还是试验新的[创意](https://a16z.com/category/consumer/creativity/#arts-and-crafts),跟上不断扩大的消费级AI产品领域都是一项动态、快速发展的工作。但在产品发布、投资公告和大肆宣传的功能不断涌现的过程中,值得一问的是:这些生成AI应用中,哪些是真正被[人们](https://x.com/omooretweets/status/1823380097531093232)使用的?哪些行为和类别在消费者中获得了关注?而哪些AI应用是人们反复使用的,而不是随便尝试后就放弃的?欢迎来到Top100 AI消费者应用第三版。每六个月,我们会深入挖掘数据,对前50款AI优先Web产品进行排名(排名依据每月独立访问量)和前50个AI优先移动应用(由每月活跃用户[)与我们之前的2024年3月报告](https://a16z.com/100-gen-ai-apps/)相比,这一次,近30%的公司是新公司。然而,除了这些排名所体现的标志意义之外,数据还揭示了一些值得注意的趋势,包括新兴和不断扩大的类别、新兴竞争对手和参与模式。以下是我们的一些重要结论: