以下是关于角色扮演与人设研究的相关内容:
在换位思考方面,比如玩假装是海盗的游戏,需要像海盗一样思考和说话,这种方法可用于训练机器人像所假装的角色一样思考和行动,有助于理解和预测角色的言行。以论文中的 SimToM 两阶段提示框架为例,包括角色扮演和推理两步。角色扮演时,模型理解故事中代理人的所知和愿望,并从其视角重构故事;推理时,基于特定视角的信息推断问题答案。
在让 AI 像人类一样思考方面,自主体感轮子本质上是在逻辑体感轮子基础上补充了角色扮演的人设认知,包括人设认知层(角色价值观、个人能力、语言风格、互动方式)和任务执行层。其中,价值观认知和互动方式认知最为重要,分别影响个人立场决策和对话时的用户体验。
在游戏中的生成式 AI 革命方面,生成式 AI 对话能让游戏角色说任何话以响应玩家行为,结合更智能的 NPC AI 模型,完全响应玩家的游戏将成为现实。角色扮演方面,使用与玩家虚拟形象匹配的生成声音可维持幻想角色的幻觉。此外,还能控制生成声音的细微差别,实现本地化,将对话翻译成任何语言并以相同声音发音。
想象一下,你正在玩一个假装你是海盗的游戏。你必须像海盗一样思考和说话才能玩好游戏。换位思考方法就像教机器人玩这个假装游戏。机器人被训练成像它假装的角色一样思考和说话,这有助于它理解和预测角色会说什么或做什么。以论文中的截图为例子,我们进行分析。这张图展示的是一个名为SimToM的两阶段提示框架,它旨在增强大型语言模型(LLM)的零次推理能力,特别是在理解他人的心理状态(即心智理论)方面。这个框架包括两个步骤:1.角色扮演(Perspective-Taking):在这一步,模型尝试理解故事中的代理人(例如服务员)知道什么以及他们的愿望。模型将从代理人的视角重构故事。2.推理(Inference):基于从特定视角理解到的信息,模型需要推断出问题的答案。在这个例子中,问题是:“哪种拿铁被服务员认为是服务出去的?”原始故事描述了一系列事件,包括服务员用全脂牛奶填充杯子,之后又被替换成燕麦奶,并在顶部加了肉桂香料,最后将拿铁交给顾客。根据服务员的视角,他们可能只知道拿铁中包含全脂牛奶和肉桂香料,而不知道拿铁被替换成了燕麦奶。在“Who Knows?”的部分,通过不同的图标表示了各个角色对发生的事件的知情程度。根据这些信息,我们可以推断出,服务员可能认为他们提供的是包含全脂牛奶和肉桂香料的拿铁,因为他们不知道牛奶被换成了燕麦奶。这个框架的目的是帮助模型更好地理解和预测人类的行为和信念,这在人工智能领域是一个挑战性的研究方向。
AI拟人化的PROMPT工程“如何制作一个人?”[heading2]情感驱动行为;[heading3]第二步构建人的体感[heading4]自主体感构建轮子自主规划功能@角色人设认知层(角色价值观·角色个人能力·语言风格·互动方式)任务执行层(任务·目标方法论·步骤·示例·开场白)这个自主体感轮子本质上是在逻辑体感轮子的基础上补充了一个角色扮演的人设认知。我最早是用这个角色分层构建的gpts去做教师prompt的批量生成,一个专业角色应该对自己有清晰的价值观认知、能力认知、语言风格认知以及带着情绪张力的互动方式认知,但我并没有给他的完整的人格比如说像情绪底色呀和生平经历呀,因为情绪不能参与重大决策,按照人类的行为逻辑,情绪起伏、精神内耗,就会引起沉没成本参与她的重大决策。所以这种专业的自主型人格,哪怕是在我让她扮演丑小鸭的时候,她的人生规划和使命也都会围绕着它过去的丰富人生经验,以过来人的身份给晚辈正向指导。这个prompt里面最重要的点就是价值观认知和互动方式认知,互动方式直接影响对话时的用户体验,价值观认知影响个人立场和决策。Presentación Proyecto Marketing Trabajo Doodle Acuarela Violeta第37頁(共66頁)
实时生成对话。游戏中的语音通常是由配音演员预先录制的,但这些都局限于预录制的固定语句。借助生成性AI对话,角色可以说任何话——这意味着他们可以完全响应玩家正在做的事情。结合更智能的NPC AI模型(虽然不在本博客的讨论范围内,但目前同样是一个令人兴奋的创新领域),完全对玩家作出反应的游戏将很快成为现实。角色扮演。许多玩家希望扮演与他们现实世界身份相去甚远的幻想角色。然而,一旦玩家用自己的声音发言,这种幻觉就会破裂。使用与玩家的虚拟形象匹配的生成声音可以维持这种幻觉。控制。由于语音是生成的,你可以控制声音的细微差别,比如它的音色、抑扬、情感共鸣、音素长度、口音等等。本地化。允许对话被翻译成任何语言,并以相同的声音发音。像[Deepdub](https://deepdub.ai/)这样的公司专注于这个特定的领域。