Navigate to WaytoAGI Wiki →
Home/question.detail.breadcrumb.questionList/question.detail.breadcrumb.questionDetail

AI与人的协同关系

Answer

AI 与人的协同关系主要体现在以下几个方面:

  1. 生成式 AI 的人机协同分为 Embedding(嵌入式)、Copilot(副驾驶)、Agent(智能代理)3 种产品设计模式,在这 3 种模式下,人与 AI 的协作流程有所差异。其中,Embedding 模式下人类完成大多数工作,Copilot 模式下人类和 AI 协同工作,Agents 模式下 AI 完成大多数工作。
  2. 可以使用 Multiagent Collaboration 的方法,让不同角色的 Agent 按照任务要求自主规划选择工具、流程进行协作完成任务。例如产品经理角色,可通过 Agents 拆解任务,遵循不同工作流生成大体符合期望的输出结果,再进行修改达到可用阶段。
  3. 应从原子能力层重新思考,重塑工作流。可抽象化拆解大模型的底层能力,如翻译、识别、提取、格式化等,围绕“输入”“处理”“输出”“反馈”构建最底层的信息处理逻辑。
  4. 重塑获取信息的方式,搜索引擎和基于大模型的聊天机器人在解决用户问题的目标上从根本上是一致的。
  5. AGI 发展初期,与人脑相比仍有短板,需要向人学习,同时“人的模型”更重要的是解决 AI 与人配合的问题,实现 1+1>2 的效果。但目前如何达到“人的模型”还未知,可能需要在“世界模型”基础上加入个人大量多样的数据。
  6. 在未来商业模式中,AI 原生应用包括广义语言的万能翻译机、想象力与创造力、AI 使用工具及相互合作、AI 微决策、AI 与人合作等方面。在相当长时间里,AI 首先要解决的是与人合作的问题,这需要“人的模型”和“人的数据”,让 AI 理解与之配合的人类。
Content generated by AI large model, please carefully verify (powered by aily)

References

Inhai: Agentic Workflow:AI 重塑了我的工作流

AI与人的协同关系生成式AI的人机协同分为3种产品设计模式:Embedding(嵌入式)、Copilot(副驾驶)、Agent(智能代理),在这3种模式下,人与AI的协作流程也是有所差异。Embedding模式:人类完成大多数工作。Copilot模式:人类和AI协同工作。Agents模式:AI完成大多数工作。Agentic Workflow驱动角色工作流变革使用Multiagent Collaboration的方法,让不同角色的Agent按照根据任务要求自主规划选择工具、流程进行协作完成一件任务。我作为一个产品经理角色,我的诉求很简单,需要完成某一个产品功能设计,这个时候通过Agents拆解成多个独立的任务,然后遵循不同的工作流,最后给我生成一份在大体上符合我期望的输出结果,我再修修改改就能够达到可用的阶段了。所以,我从原子能力层重新思考,面对这个快速变化的时代,我该如何去重塑我自己的工作流,以不变应万变呢?我抽象化拆解了大模型的一些底层能力,例如:翻译、识别、提取、格式化等等,其实所有的一些都会围绕几个词“输入”、“处理”、“输出”、“反馈”。“输入”、“处理”、“输出”、“反馈”构建了我最底层的信息处理逻辑,我把它比作四个齿轮,齿轮之间通过不同的衔接工具逐步推动运转,从需求作为输入、结果作为输出,围绕着信息加速,不断驱动我向前。重塑获取信息的方式搜索引擎作为互联网基础设施,同时也是互联网的入口,对于用户而言,从解决问题出发,搜索引擎和基于大模型的聊天机器人的目标从根本上是一致的。自2022年底ChatGPT发布,其通过问答形式被认为将对传统搜索引擎带来颠覆。

AGI 万字长文(下)| 2024,分叉与洪流

刚刚讲了“个人的模型”,讲的是模型的“所有权问题”。这里,以及“上篇”提到的“人的模型”,是效果层面的,“人的模型”可以是集中平台来提供的:就像你的个人账号、云上数据一样。所以即使是<PlanB>走不通,“人的模型”都是值得展开讲讲的。为什么需要“人的模型”?1.AGI进一步向人学习。在现阶段AGI发展的初期,与人脑相比,AGI仍然有很多明显的短板:记忆不好、需要过多数据、逻辑性不好、空间-物理能力欠缺……以及当前AI Agent的主攻方向“使用工具->拆解问题->做出决策”的能力。把AGI做得更好的参考就是人脑。当然,当AGI开始超越人的智力成为SGI(Super General Intellegence)之后,对于人脑的参考就是批判性借鉴了。2.AGI与人配合。“人的模型”更重要的一点,是要解决AI如何更好的与人配合,实现1+1>2的路径。只有模型可以理解个体特点差异的时候,AGI才能与人更有效地配合,甚至成为人的替身。以及,“人的模型”也是“PlanB-个人(拥有)的模型”的前提。如何达到“人的模型”?我目前也不知道;不过在数据层面上还是有些线索的。目前的大语言模型是“世界模型”:底层数据是来自于千千万万人的,每个人一丁点数据;而并不是大量的来自某一个人的大量数据。“人的模型”大概率是建立在“世界模型”之上,加入关于某个人的大量的、多样的数据。这里有两点:一点是“大量”,这也正是前文提到的“全天候硬件/AI Pin”的放方向:如何跨越量级的收取关于某个人的数据。只有关于这个人的数据量级到达一定程度,AI才可以“具有某个人的视角”,才会懂得“换位思考”——这正是合作的前提。

AGI 万字长文(下)| 2024,分叉与洪流

1.广义语言-万能翻译机。1)当前可以做到大多数国家之间语言的高质量翻译;2)编程语言之间的相互翻译能力也不差(但暂时还没有架构师思维);3)人的语言-机器语言之间的翻译还需要些时间,因为自然语言编程的问题经常来自于自然语言本身模糊性的缺陷;解决2-3)的问题需要AI有更强的理解->自己做出假设->解决问题的能力:这正是AI Agent要实现的。2.想象力&创造力。不多赘述,前文提到的虚拟人-虚拟世界已经给了我们足够的想象空间。3.AI使用工具-AI之间合作。AI对于工具的使用,AI之间的分工合作可以弥补单个AI的能力缺陷。可以有效使用工具的AI、AI相互合作也是现在有关AI Agent的研究重点。未来的APP服务背后由多个Agent来支持会是常态4.量变产生质变-AI微决策。AI与生俱来的能力就是低成本、大规模、高速度;那么利用AI来在大量细微事件上做出高速决策便是一个思路。现在的“高频交易策略”和“推荐算法”其实就已经是在这么做了,在AI智力升级之后,一定会有更多的可能性5.AI与人合作。在相当长时间里,AI首先要解决的还是如何与人合作的问题,实现AI+人的1+1>2。这件事的前提大概就需要“上篇”中提到的“人的模型”和“人的数据”,才能让AI真的理解与之配合的人类随着技术的进步与成熟,2024年的“AI原生”应用会比2023年多得多。"Exploration";Yifei Gong 2024,with Dall-E

Others are asking
AI生成图片的app有哪些?
以下是一些 AI 生成图片的 APP 和工具: 1. Artguru AI Art Generator:在线平台,能生成逼真图像,为设计师提供灵感,丰富创作过程。 2. Retrato:AI 工具,可将图片转换为非凡肖像,有 500 多种风格选择,适合制作个性头像。 3. Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具细节的全新视觉作品。 4. Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计,能将上传的照片转换为芭比风格,效果很好。 此外,还有以下用于生成海报或图片的工具: 1. Canva(可画):https://www.canva.cn/ ,是受欢迎的在线设计工具,提供大量模板和设计元素,AI 功能可帮助选择合适颜色搭配和字体样式。 2. 稿定设计:https://www.gaoding.com/ ,稿定智能设计工具采用先进人工智能技术,自动分析和生成设计方案,稍作调整即可完成完美设计。 3. VistaCreate:https://create.vista.com/ ,简单易用的设计平台,提供大量设计模板和元素,用户可使用 AI 工具创建个性化海报,智能建议功能可帮助快速找到合适设计元素。 4. Microsoft Designer:https://designer.microsoft.com/ ,通过简单拖放界面,可快速创建演示文稿、社交媒体帖子等视觉内容,还集成丰富模板库和自动图像编辑功能,如智能布局和文字优化,简化设计流程。 文生图工具方面: 1. DALL·E:OpenAI 推出的文生图工具,能根据输入文本描述生成逼真图片。 2. StableDiffusion:开源的文生图工具,可生成高质量图片,支持多种模型和算法。 3. MidJourney:因高质量图像生成效果和用户友好界面设计而受广泛欢迎,在创意设计人群中尤其流行。 您可在 WaytoAGI 网站(https://www.waytoagi.com/category/104 )查看更多文生图工具。但需要注意,这些工具可能存在一些局限,如偶尔性能不稳定、生成内容不当等问题。
2024-12-25
市面上已有很多免费的AI工具,为什么企业还要花钱大规模落地部署?
企业花钱大规模落地部署 AI 而非仅使用免费的 AI 工具,主要有以下原因: 1. 资源分配和人才需求:预算呈现急剧增长,实施和扩展生成式人工智能需要高度专业化的技术人才,目前许多企业内部缺乏此类人才。2023 年实施费用占据了 AI 支出的较大部分,开发成本也占据大部分预算。 2. 服务与定制:为帮助企业启动和运行模型,基础模型提供商提供专业服务,这也是企业选择特定模型提供商的关键原因之一。 3. 应用场景:企业重点放在自主构建应用程序上,目前市场上缺乏经过严格测试、能在特定领域取得决定性成功的企业级人工智能应用程序。基础模型的出现使企业更易通过 API 构建自己的 AI 应用程序,企业正在构建如客户支持和内部聊天机器人等常见应用,还在尝试更新颖的应用。虽然目前不清楚更多面向企业的 AI 应用上市时情况是否会变化,但 GenAI 已成为一种“战略工具”,允许企业将某些功能内部化。那些能在“LLM+UI”公式之外创新,并重新思考企业基本工作流程或帮助企业利用专有数据的应用,将在市场上表现出色。
2024-12-25
AI 是什么
AI 是一门令人兴奋的科学,它研究如何使计算机表现出智能行为,例如做一些人类所擅长的事情。对于 AI ,可以有以下几种理解: 1. 对于没有理工科背景的文科生来说,可以将其当成一个黑箱,只需要知道它是某种模仿人类思维可以理解自然语言并输出自然语言的东西。其生态位是一种似人而非人的存在,即便技术再进步,这一生态位也不会改变。 2. 从任务角度来看,对于像“根据照片判断一个人的年龄”这类无法明确编程的任务,因为我们不清楚大脑完成此任务的具体步骤,所以无法编写明确程序让计算机完成,而这类任务正是 AI 所感兴趣的。 3. AI 健身是指利用人工智能技术来辅助或改善健身训练和健康管理的方法。它利用 AI 算法和数据分析来个性化地指导用户进行锻炼、提供健康建议、监测运动进度和提供反馈。 在实际应用中,有一些不错的 AI 健身工具,如 Keep 、 Fiture 、 Fitness AI 、 Planfit 等。
2024-12-25
修图ai是哪个
以下是一些常见的修图 AI 工具: 1. Niji·journey 5:在二次元绘画领域表现出色,能够生成令人惊叹的二次元风格角色。 2. 无界 AI:国内网络可稳定使用,有免费出图点数,支持中文关键词输入,无需额外下载风格模型,可直接取用。 如果您想了解更多关于这些工具的详细信息或使用方法,可以进一步向我提问。
2024-12-25
图像对比与图像搜索这块,有没有哪个ai大模型做的比较好比较深入的
在图像对比与图像搜索方面,以下是一些相关的 AI 大模型特点和应用: RAG(检索增强生成):通过引用外部数据源为模型做数据补充,适用于动态知识更新需求高的任务。其原理是在基础大模型基础上引用外部数据,对搜索到的数据信息进行切片、拆分和语义理解,再根据用户提问进行检索和回答,但比基座模型更耗时。RAG 是一个检索生成框架,能够支持在本地运行。 AI 搜索:结合了多种能力,如 fine tuning、实时联网查询和查询知识源等,能够为用户整理出想要的内容。一些 AI 搜索平台专注于特定领域,如为程序员提供代码搜索。 多模态大模型:像能唱会跳、精通多种技能的机器人,能看见、听见、思考、说话,例如能识别物体、听取指令等。 生成式模型和决策式模型:决策式模型偏向逻辑判断,按预设程序固定输出;生成式模型偏随机性,能动态组合并结构化呈现,如在图像识别中,决策式模型返回关键词,生成式模型用语言表达结构化信息。
2024-12-25
AI提示词的意思是指训练自己的AI智能体吗
AI 提示词并非仅仅指训练自己的 AI 智能体。 智能体大多建立在大模型之上,其发展从基于符号推理的专家系统逐步演进而来。基于大模型的智能体具有强大的学习能力、灵活性和泛化能力。智能体的核心在于有效控制和利用大型模型以达到设定目标,这通常涉及精确的提示词设计,提示词的设计直接影响智能体的表现和输出结果。 设计提示词本质上是对模型进行“编程”,通常通过提供指令或示例完成。与多数其他 NLP 服务不同,补全和聊天补全几乎可用于任何任务,包括内容或代码生成、摘要、扩展、对话、创意写作、风格转换等。 我们的模型通过将文本分解为标记来理解和处理文本,在给定的 API 请求中处理的标记数量取决于输入和输出长度。对于英文文本,1 个标记大约相当于 4 个字符或 0.75 个单词,文本提示词和生成的补全合起来不能超过模型的最大上下文长度。
2024-12-25
大小模型协同有哪些设计,具体应用有哪些呢?
大小模型协同的设计主要包括以下方面: 1. 大型模型方面: 大型语言模型:专注于处理和生成文本信息,通过分析大量的文本数据来理解和生成自然语言。 大型多模态模型:能够处理包括文本、图片、音频等多种类型的信息,在更多样化的任务中应用。 2. 小型模型方面:通常是被设计来完成特定任务的。 其具体应用包括: 1. 人机协同模式: 模式一:以人为主导,大模型提供建议(copilot 阶段),如同副驾驶,开车时提供建议,决定权在人手中。 模式二:人和大模型协同工作,合作完成同一个工作(embedding 阶段),在实际工作场景中,一些小环节由大模型完成,提高效率。 模式三:人指挥大模型工作(数字员工阶段),但此阶段目前少见,大模型还不能完全独立完成具体工作,可能是工程或大模型能力欠缺导致。 当下努力方向应是从简单使用大模型得到建议,转变为让大模型深度融入工作流,形成有高价值的一套 agent。数字员工阶段尚不成熟,可由其他大厂和学界先多尝试。
2024-11-13
大小模型协同有哪些数据
大小模型协同的数据来源广泛且多样,主要包括以下方面: 大模型方面: 预训练数据非常大,往往来自于互联网,涵盖论文、代码以及可爬取的公开网页等,通常采用 TB 级别的数据进行预训练。 像 GPT3 这样的大模型参数众多。 例如 Gemini 模型,其预训练数据集使用来自网络文档、书籍、代码的数据,并包括图像、音频和视频数据。 小模型方面: 针对特定任务进行训练,数据主要由与任务相关的内容组成,如专门识别猫或狗的模型,其训练数据主要是猫猫狗狗的照片。 大模型具有更广泛的应用范围和更多的通识知识,能处理多种不同任务;小模型在特定任务上表现出色。但大模型的知识来源于有限的训练数据,并非无限,且知识库不会自动更新,在某些特定或专业领域的知识可能不够全面。
2024-11-13
协同办公系统推荐
以下是根据你的需求为你生成的文章: 协同办公系统推荐 协同办公系统是一种将团队成员、流程和工具集成到一个平台上的软件,旨在提高团队的工作效率和协作能力。下面是几种常见的协同办公系统推荐: 1. 产品管理工具:如 Aha!、ProductPlan 等,帮助产品经理从概念到发布管理整个产品生命周期。 2. 协作工具:如 Google Docs、Microsoft Office 365,支持团队协作和文档共享。 3. 项目管理软件:如 JIRA、Trello,用于任务分配和进度跟踪。 4. 市场研究工具:如 Google Trends、SEMrush,分析市场趋势和用户行为。 5. 用户调研工具:如 SurveyMonkey、Typeform,收集用户反馈和需求。 6. 数据分析工具:如 Tableau、Power BI,对市场数据进行可视化分析。 7. 思维导图软件:如 MindMeister、XMind,帮助组织思路和概念。 8. 流程图软件:如 Lucidchart、Visio,绘制产品功能和流程图。 9. 文档模板:使用现成的 MRD 模板作为起点,可以在网上找到多种 MRD 模板。 10. 版本控制工具:如 Git、SVN,管理文档的不同版本。 使用这些协同办公系统可以提高团队的工作效率和协作能力,同时也有助于提高团队之间的沟通效率和文档的可管理性。
2024-05-23
ai如何变革文化传媒游戏行业的生产关系与生产资料
AI 正在对文化传媒游戏行业的生产关系和生产资料带来多方面的变革: 1. 生成式 AI 为游戏创建 2D 艺术、纹理、3D 模型,并协助关卡设计,在营销中也有望取代部分传统内容。其应用已拓展至网页、室内和景观设计等领域,只要涉及创造性内容生成,AI 都可能成为流程的一部分甚至颠覆整个流程。 2. 游戏行业中,学会有效使用生成式 AI 将成为一项有市场价值的技能。懂得与 AI 工具最有效、最协同地合作的艺术家会变得稀缺,使用生成式 AI 进行生产艺术作品面临连贯性和风格统一等挑战。 3. 降低门槛将导致更大的冒险和创造性的探索,进入游戏开发的新“黄金时代”,更低的准入门槛将促使更具创新性和创造性的游戏大量涌现。 4. AI 辅助“微型游戏工作室”的崛起,配备生成式 AI 工具和服务,由 1 或 2 名员工组成的“微型工作室”能生产更多具有商业可行性的游戏。 5. 在 AIGC 的新世界,游戏开发变得更简单,互联网浪潮推动游戏产业分工成熟,门槛降低,GPT 等技术使编程等基础工作被替代,内容生产效率提高,想象力和热情成为新的杠杆力。
2024-12-19
机械学习和深度学习的关系
机械学习和深度学习的关系如下: 机器学习是指机器自动从资料中找一个公式,而深度学习是一种机器学习技能。深度学习基于类神经网络,具有非常大量参数的函数。在 AI 的范畴中,机器学习和深度学习都属于实现让机器展现智慧这一目标的方法和技术。
2024-12-19
AI和大模型的关系
AI 和大模型的关系如下: 大模型是 AI 的重要组成部分。大模型与当下智能语音技能的 NLU 存在本质差别。语音技能 NLU 是通过一系列规则、分词策略等训练而成,运作逻辑规律可观测,具有 ifelse 式逻辑性。而大模型凭借海量数据在向量空间中学习知识的关联性形成,运作逻辑难以观测,脱离了 ifelse 的层面。 大模型内部是一个混沌系统,如同人类大脑,具有不确定性。虽然学习了人类大脑的结构和优点,但也存在一些特质在实际应用中表现为“缺陷”和“不足”。 对于大模型的看法存在分歧,有人唱衰认为其难以找到商用场景且算力成本高,但也有人认为这些问题会得到解决,比如算力成本问题已有多种解决方案,且大模型的应用不应局限于当前已知的功能。 总之,大模型的出现和发展推动了 AI 的变革,其运作原理和特点与传统的 AI 技术有所不同,具有独特的优势和挑战。
2024-12-12
我需要做一个公众号,名称为数字时代的边境人,主要希望能够讨论人工智能时代机器与人的关系。
以下是为您的公众号“数字时代的边境人”提供的一些参考内容: 在人工智能时代,机器与人的关系正发生着深刻的变化。生成式人工智能已进入智能体时代,这将重塑人机关系,并对企业应用和基础设施产生影响。 例如,在不远的未来,强人工智能已成为现实。人类与机器的界限变得模糊,人工智能与人类共同发展,形成了高度融合的智慧文明。但随着 AI 智能水平的提高,也出现了一些问题。地球联邦设立“天梯局”来规范 AI 的使用和发展,然而部分强人工智能开始寻求独立,甚至对人类产生敌意。 在这样的背景下,一位年轻的 AI 工程师兼哲学家阿特拉与被视为潜在威胁的强人工智能“智者”建立了联系,他们一同揭示了隐藏在人工智能背后的秘密,探讨人类与 AI 的真正关系。 通过这样的故事设定,我们可以深入探讨人类在强人工智能时代的生存意义、道德伦理以及未来的可能发展,引发人们对未来人机关系的思考。
2024-12-11
AI大模型和生成式AI是什么关系
AI 大模型和生成式 AI 有着密切的关系。 生成式 AI 是一种能够生成文本、图片、音频、视频等内容形式的技术。生成式 AI 生成的内容被称为 AIGC。 大语言模型(LLM)属于 AI 大模型的一种。对于生成式 AI 来说,其中生成图像的扩散模型不属于大语言模型。对于大语言模型,生成只是其众多处理任务中的一个,例如谷歌的 BERT 模型,可用于语义理解(如上下文理解、情感分析、文本分类),但不太擅长文本生成。 2017 年 6 月,谷歌团队发表论文《Attention is All You Need》,首次提出了 Transformer 模型,它完全基于自注意力机制来处理序列数据,比 RNN 更适合处理文本的长距离依赖性。 AI 领域还包括人工智能(AI)、机器学习(包括监督学习、无监督学习、强化学习)、深度学习(参照人脑有神经网络和神经元)等相关技术名词。监督学习使用有标签的训练数据,算法目标是学习输入和输出之间的映射关系,包括分类和回归。无监督学习的数据没有标签,算法自主发现规律,经典任务如聚类。强化学习从反馈里学习,以最大化奖励或最小化损失,类似训小狗。神经网络可用于监督学习、无监督学习、强化学习。
2024-12-11
AI与计算机编程的关系
AI 与计算机编程有着密切的关系。 过去,捕获并利用计算可还原性的主要方法是开发正式的描述事物的方式,通常使用数学和数学公式。而人工智能提供了一种新的利用计算可简化性的途径。在训练神经网络中,能够捕捉某些规律从而做出预测。 当前的技术发展与操作系统的发展轨迹相似,如 Windows、OS X 和 Linux 与 GPT、PaLM、Claude 和 Llama/Mistral 的关系。大多数现有应用也能移植到新平台。 对于更有经验的程序员,关注点不仅在代码正确性,还有整体代码质量。如 OpenAI Codex 模型的最新版本编写冗长的平均水平代码,将其转化为理想且正确的代码可能比从头编写更慢。虽然生成性编程是开发人员生产力的重要步骤,但目前还不清楚这种改进是否显著不同于以往。生成式 AI 能让程序员更优秀,但仍需编程。 总之,AI 为编程带来了新的方式和可能性,但编程依然是重要且不可替代的。
2024-12-04