AI 语言模型的记忆能力主要与以下因素相关:
Inworld AI 开发的角色引擎,增加了可配置的安全性、知识、记忆、叙事控制、多模态等功能,其中长期记忆方面,角色能以类似人类的记忆功能操作,从闪存和长期记忆中检索信息。
人类的思维是由自然语言或感官记忆构成的超高维时间序列,而人工智能与人类不同,人类会为事物赋予意义与价值,人工智能则更追求“更准”。强化学习是人工智能的一个重要分支,通过定义状态、动作与奖励等元素,让 AI 求解如何选择动作以获得最大的期望奖励总和。
在智能体中同样也分为长期记忆和短期记忆。长期记忆主要有长文本(持久化)、总结、RAG这三种实现方式,而短期记忆则主要存在于模型的上下文中,由对话内容(用户输入、模型输出)和系统提示词组成。图4.2.1记忆分类长文本(KV Cache):KV Cache是Transformer架构中的一个功能,它通过缓存历史计算的Key(K)和Value(V)来减少冗余计算,加速模型的推理过程。在长文本处理中,KV Cache可以显著减少重复计算,提高推理速度。它通过缓存先前计算的K和V,避免了在每一步生成中重新计算所有token的K和V。然而,KV Cache的实现并非没有挑战。它需要额外的存储空间来缓存K和V,这可能导致显存占用显著增加,尤其是在处理非常长的序列时。为了解决这一问题,研究者们提出了多种优化技术,包括MQA(Memory-Quality Attention)、GQA(Grouped Query Attention)和Page Attention等。如果未来结合持久化KV Cache、KV Cache的压缩技术,把成本可以控制在一个相对较低的水平。那么,通过记录下所有对话的历史以及AI当时的思考过程和情绪状态,我们就有可能打造出一个记忆力超越人类的智能体。这样的智能体不仅能够回忆起更多详细信息,还能在提供服务时展现出更高级别的个性化和情感连贯性。延申阅读:EFFICIENT STREAMING LANGUAGE MODELS WITH ATTENTION SINKS(https://arxiv.org/pdf/2309.17453)总结:首先是文本总结,这是一种直观且广泛使用的方法。通过将长篇聊天记录或文档简化成几句关键描述,文本总结不仅提高了信息检索的效率,还使得内容更易于理解和记忆。这种方式在商业报告、新闻摘要等多个领域都有广泛应用。
https://twitter.com/xiaohuggg/status/1687047341969440768?s=46Inworld AI是一家专注于游戏和人工智能的初创公司,他们开发了一种名为Inworld的AI角色引擎,它可以将游戏的NPC进行AI化,并可以集成到游戏当中。这个引擎超越了大语言模型,增加了可配置的安全性、知识、记忆、叙事控制、多模态等功能。它可以使NPC能够自我学习和适应,具有情绪智能!Inworld的角色引擎可以创建具有独特个性和上下文意识的角色,这些角色可以无缝地集成到实时应用中,同时内置了优化规模和性能的功能。这个引擎可以让AI非玩家角色(NPC)通过模拟人类的全方位沟通方式(包括语言、手势、表情和动作)来表达个性。为了让NPC更加人性化,他们开发了Character Brain(性格大脑)引擎这种引擎不仅仅是一个对话AI,它使AI NPC能够学习和适应,具有情绪智能的关系导航能力,具有记忆和回忆能力,并能够自主地发起目标,执行动作并遵循自己的动机。它的功能包括:1、目标和行动:使用定义的触发器、意图识别和动机来触发角色对玩家行为的反应,并在游戏中驱动交互。允许你驱动响应玩家输入的NPC行为,以一种动态和自定义的方式。2、长期记忆:角色以类似人类的记忆功能操作,从闪存和长期记忆中检索信息,创建吸引玩家回归的引人入胜的体验。2、个性:通过使用自然语言创建不同的个性。添加关于角色背景故事、动机和缺点的丰富细节,使角色生动起来。3、情绪:Inworld角色能够对与用户的互动表达情绪。情绪可以映射到动画、目标和触发器。
丁一点头:比方说,你脑子里有“狗”这个概念,这是因为你见过几只不同的狗、听过同学们用声音描述自己家里养的狗,获取过摸狗的触觉。随后,你脑中就有了相关记忆综合得到“狗”的抽象概念。有时候,即便没有任何关于狗的感官,比如只是躺在床上闭着眼,你也会想到“狗”有关的画面或其他信息……可事实上,你脑中的各种思维也是一个由自然语言或感官记忆构成的超高维时间序列,不妨将这个时间序列记为thought。那么,这个时间序列也是感官数据通过复杂的函数运转得到的:f:(V,A,S,T,F)→thought简单地说,我们获取的所有感官信息是一个复杂的数据结构,我们的思想是一个超高维的序列数据结构。这些数据结构之间存在复杂的函数映射关系,足以表示我们从感官中获取所有信息、抽象的概念与意义,乃至全部的事物……沉默了片刻之后,我又想到了第二个问题——意义,或者说是价值。诚然,按照多模态模型与大语言模型的发展速度,恐怕人类所认识的所有事物,连同实在感官到抽象概念,很快会被人工智能超过。但是,与人工智能不同的是,人会为这些事物赋予意义与价值。通俗地说,人工智能只会追求“更准”,但是,人会追求“更好”。人不是捕捉与记录客观事物的工具,人的行为总是有目的、有意义的。丁一为我介绍了强化学习(Reinforcement Learning)的概念。强化学习是人工智能与机器学习领域中一个重要的分支。我们熟知的AlphaGo就是用强化学习技术做的。在强化学习中,我们会定义几个元素:状态(state)、动作(action)与奖励(reward),并让AI求解在各种状态下,如何选择动作,以使得自己获得最大的期望奖励总和,也可以叫做“总效用”(Utility)。