以下是对机器人发展趋势的分析:
在机器人学领域,出现了一些显著的发展趋势。
特斯拉训练的机器人“Optimus”通过人类示范学习抓取物体,且无需特定任务编程,这意味着可快速扩展到多种任务。当在互联网上所有视频上训练的超大规模模型出现时,有望实现惊人的机器人性能。
在应用方面,聊天机器人不仅在一对一对话中有跃进式改进,还正在融入我们的社交生活,成为我们社交关系中的一部分。
在产业发展趋势上,多模态、文生图在 ToC 领域会继续涌现杀手级应用,知识工程成为大模型落地的关键要素。Agent 架构对大模型至关重要。人形具身智能机器人产业将获得十倍速发展,如 Figure AI 与 GPT 合作的机器人进步迅速,斯坦福的机械臂能听懂人的指令完成任务。大模型的认知能力不断提升,使得自动驾驶迎来革命性变化,如特斯拉宣布要做自动出租车车队。
另一项机器人学发展——这次来自特斯拉(2023年5月16日)。他们训练了他们的机器人“Optimus”去抓取物体——而且“没有进行特定任务的编程”。一切都是通过人类示范学习的。“这意味着我们现在可以快速扩展到许多任务。”再次强调:如果人类示范是先进机器人学性能所需的一切,那么一个在互联网上所有视频上训练的100万亿参数模型肯定能够实现惊人的机器人学性能...左边的图片展示了1万亿参数的GPT-4在图像识别方面的能力。其回应已经比许多人类所能想出的更加清晰和写得更好。那么,当你在互联网上所有可用数据的基础上训练一个比GPT-4大100倍、与人类大脑大小相当的模型时,会发生什么呢?重要:注意AI模型能够生成同一场景的多个角度,具有物理上准确的光线,甚至在某些情况下还能生成物理上准确的流体和雨水。如果你能生成具有准确、常识性物理的图像和视频,你就拥有了常识推理能力。如果你能生成常识,你就理解了常识。
我们还开始看到更广泛的应用领域出现早期迹象,超越了AI“男朋友”和“女朋友”。Snapchat最近透露,在头两个月内,有1.5亿人向其聊天机器人发送了超过100亿条消息。他们在聊些什么呢?结果发现,宠物、流行文化新闻和足球是一些热门的话题。是的,聊天机器人已经存在了几十年,但我们相信这一次确实不同。如今的机器人不仅仅是在一对一对话中进行了一次跃进式的改进,它们正在渗透到我们的社交生活中。人工智能伴侣正在与我们的朋友和家人的关系中无缝融入,就像任何其他人一样加入我们的社区。在这篇文章中,我们将深入探讨人工智能伴侣关系的新兴行为:为什么人们创建伴侣,他们是如何创建的,以及接下来可能出现的功能或应用案例。
多模态的发展,文生图的发展,ToC会继续涌现杀手级应用。知识工程成为大模型落地的决定性要素。无论做通用大模型还是做专有大模型,知识成为决定性,没有知识的大模型就是个傻子。Agent架构,最近吴恩达——著名的人工智能世界级科学家,讲了好几次Agent的课。他反复讲到Agent架构对大模型至关重要,这是我今天一个讲课的重点。还有人形具身智能机器人产业获得十倍速的发展。Figure AI跟GPT合作做的机器人进步很快,最近斯坦福那个机械臂当它操作不对的时候,能听懂人的指令。比如说把一个海绵塞到口袋里,海绵掉在地上,然后人就说把口袋撑大一点,那它就能够照着人的指令完成这个任务。还有大模型认知能力不断提升,自动驾驶迎来革命性变化。这话音没落,特斯拉已经在自动驾驶上,至少暂时从电车的这个层次跳出来了。最近马斯克宣布要做自动出租车车队。