直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

agent最新动态

回答

以下是关于 Agent 的最新动态:

  • 吴恩达在美国红杉 AI 活动上指出,Agent 工作流程与传统使用 LLM 的方式不同,更加迭代和对话式。目前有 4 种主要的 Agent 设计模式:
    • Reflection:让 Agent 审视和修正自己生成的输出。
    • Tool Use:LLM 生成代码、调用 API 等进行实际操作。
    • Planning:让 Agent 分解复杂任务并按计划执行。
    • Multiagent Collaboration:多个 Agent 扮演不同角色合作完成任务。 这些设计模式还在快速发展中,有的比较成熟可靠,有的仍存在不确定性,但都展现了提高 AI 能力的潜力。吴恩达认为未来 AI Agent 能力将大幅扩展,我们需要学会将任务委托给 Agent 并耐心等待结果,快速 token 生成也很重要。
  • 从词源和历史变迁来看,“Agent”在不同时期和领域有着不同的应用和含义。随着大航海时代及全球贸易的兴起,其在商业领域的角色日益重要,如贸易代理和公司代理商。在工业革命期间,职能拓展到保险、房地产等新兴行业,19 世纪在政府及情报领域也广泛使用,如情报特工和便衣警察。在现代社会(20 世纪至 21 世纪),涵盖了多种职业角色,尤其在娱乐和体育行业,指艺人经纪人和运动员经理等,还包括劳务代理和招聘代理(猎头)。“Agent”这个词本身具有行动的含义,后期又附加了“替身”的意思,多数情况下指“拥有行动的替身,都是替代他人做某事”。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

红杉 AI Ascent 2024 会议

转自有新公众号:https://mp.weixin.qq.com/s/4ky_OSLrHh2MxdT3AjqW1Q今天分享的是吴恩达教授在美国红杉AI活动上关于Agent的最新趋势与洞察。吴恩达表示Agent工作流程与传统使用LLM的方式不同,它更加迭代和对话式。目前,有4种主要的Agent设计模式,分别是:1.Reflection:让Agent审视和修正自己生成的输出;2.Tool Use:LLM生成代码、调用API等进行实际操作;3.Planning:让Agent分解复杂任务并按计划执行;4.Multiagent Collaboration:多个Agent扮演不同角色合作完成任务;这些设计模式目前还在快速发展中,有的比较成熟可靠,有的仍存在不确定性,但都展现了提高AI能力的潜力。吴恩达认为,未来AI Agent能力将大幅扩展,我们需要学会将任务委托给Agent并耐心等待结果,而不是追求即时响应。另外,快速token生成也很重要,即使基于质量较低的LLM,快速迭代生成新token也可能获得良好结果。以下为这次分享的全部内容:我期待与大家分享我对AI Agent所见到的东西,这是一个我认为每个人在构建AI时都应该注意的激动人心的趋势。同时,我也对所有其他的“接下来会发生什么”的展示感到兴奋。

AI-Agent系列(一):智能体起源探究

随着大航海时代及全球贸易的兴起,“Agent”的角色在商业领域变得日益重要。16至17世纪间,贸易代理和公司代理商开始在全球范围内进行商品交易,如荷兰东印度公司的代理人。18至19世纪工业革命期间,“Agent”的职能进一步拓展到保险、房地产等新兴行业。此外,在19世纪,政府及情报领域也开始广泛使用“Agent”,比如情报特工和便衣警察,在维护国家安全与社会秩序方面发挥了不可或缺的作用。现代(20世纪至21世纪):在20世纪至21世纪的现代社会中,“Agent”一词涵盖了多种职业角色,尤其在娱乐和体育行业中,它指的是艺人经纪人和运动员经理等职位。这些专业经理人负责安排试镜、进行合同谈判以及规划职业生涯,确保客户能在竞争激烈的行业中获得成功。此外,“Agent”还包括劳务代理和招聘代理(猎头)。劳务代理提供劳动力匹配服务,帮助求职者找到合适的工作,并为雇主提供所需的人才,如劳务派遣公司将临时员工派遣到需要额外支持的企业单位。而猎头则专门为公司招募高技能或高级管理职位的专业人士,通过筛选简历、安排面试并评估候选人来帮助企业找到最合适的员工。凭借深厚的行业知识与广泛的联系网络,这些猎头为企业与顶尖人才之间搭建了重要桥梁。从词源和词的历史变迁中,大家就能看到,“Agent”这个词本身就具有行动的含义,到了后期又附加了“替身”的意思。且无论哪个领域,“Agent”都多数情况下都在指:“拥有行动的替身,都是替代他人做某事“

AI-Agent系列(一):智能体起源探究

随着大航海时代及全球贸易的兴起,“Agent”的角色在商业领域变得日益重要。16至17世纪间,贸易代理和公司代理商开始在全球范围内进行商品交易,如荷兰东印度公司的代理人。18至19世纪工业革命期间,“Agent”的职能进一步拓展到保险、房地产等新兴行业。此外,在19世纪,政府及情报领域也开始广泛使用“Agent”,比如情报特工和便衣警察,在维护国家安全与社会秩序方面发挥了不可或缺的作用。现代(20世纪至21世纪):在20世纪至21世纪的现代社会中,“Agent”一词涵盖了多种职业角色,尤其在娱乐和体育行业中,它指的是艺人经纪人和运动员经理等职位。这些专业经理人负责安排试镜、进行合同谈判以及规划职业生涯,确保客户能在竞争激烈的行业中获得成功。此外,“Agent”还包括劳务代理和招聘代理(猎头)。劳务代理提供劳动力匹配服务,帮助求职者找到合适的工作,并为雇主提供所需的人才,如劳务派遣公司将临时员工派遣到需要额外支持的企业单位。而猎头则专门为公司招募高技能或高级管理职位的专业人士,通过筛选简历、安排面试并评估候选人来帮助企业找到最合适的员工。凭借深厚的行业知识与广泛的联系网络,这些猎头为企业与顶尖人才之间搭建了重要桥梁。从词源和词的历史变迁中,大家就能看到,“Agent”这个词本身就具有行动的含义,到了后期又附加了“替身”的意思。且无论哪个领域,“Agent”都多数情况下都在指:“拥有行动的替身,都是替代他人做某事“

其他人在问
如何搭自己的agent
搭建自己的 Agent 可以按照以下步骤进行: 1. 从案例入门: 三分钟捏 Bot: Step 1:(10 秒)登录控制台 登录扣子控制台(coze.cn)。 使用手机号或抖音注册/登录。 Step 2:(20 秒)在我的空间创建 Agent 在扣子主页左上角点击“创建 Bot”。 选择空间名称为“个人空间”、Bot 名称为“第一个 Bot”,并点击“确认”完成配置。如需使用其他空间,请先创建后再选择;Bot 名称可以自定义。 Step 3:(30 秒)编写 Prompt 填写 Prompt,即自己想要创建的 Bot 功能说明。第一次可以使用一个简短的词语作为 Prompt 提示词。 Step 4:(30 秒)优化 Prompt 点击“优化”,使用来帮忙优化。 Step 5:(30 秒)设置开场白 Step 6:(30 秒)其他环节 Step 7:(30 秒)发布到多平台&使用 2. 进阶之路: 15 分钟做什么:查看下其他 Bot,获取灵感。 1 小时做什么:找到和自己兴趣、工作方向等可以结合的 Bot,深入沟通。阅读以下文章:文章 1、文章 2、文章 3。 一周做什么:了解基础组件;寻找不错的扣子,借鉴&复制;加入 Agent 共学小组;尝试在群里问第一个问题。 一个月做什么:合理安排时间;参与 WaytoAGI Agent 共学计划;自己创建 Agent,并分享自己捏 Bot 的经历和心得。 在 WaytoAGI 有哪些支持:文档资源、交流群、活动。 一些好的 Agent 构建平台包括: 1. Coze:是一个新一代的一站式 AI Bot 开发平台,集成了丰富插件工具,适用于构建基于 AI 模型的各类问答 Bot。 2. Mircosoft 的 Copilot Studio:主要功能包括外挂数据、定义流程、调用 API 和操作,以及将 Copilot 部署到各种渠道。 3. 文心智能体:百度推出的基于文心大模型的智能体平台,支持开发者根据自身需求打造产品能力。 4. MindOS 的 Agent 平台:允许用户定义 Agent 的个性、动机、知识,以及访问第三方数据和服务或执行工作流。 5. 斑头雁:2B 基于企业知识库构建专属 AI Agent 的平台,适用于多种场景,提供多种成熟模板。 6. 钉钉 AI 超级助理:依托钉钉强大的场景和数据优势,在处理高频工作场景方面表现出色。 Agent 搭建共学快闪 0507 的作业: |时间|作业|备注| |||| |5 月 7 号|创建 https://www.coze.com 账号<br>创建 https://www.coze.cn 账号<br>加入共学的 team(看第三列备注)<br>有精力的话:可以提前阅读:<br>尝试创建自己的第一个 Bot,用来免费使用 GPT4|海外版本<br>Click the link to join my team WaytoAGI on the Coze Bot Platform<br>👉🏻 https://www.coze.com/invite/8UrPdX0vuusXq5H6dF4P<br>国内版本<br>coze.cn<br>👉🏻 https://www.coze.cn/invite/EpD2Ud0bdPcvutscWStY| |5 月 10 日罗文|认领一个插件制作插件说明|| PS:上述两个作业在 5 月 8 号分享结束之后就可以上手进行了,5 月 9 号会针对工作流和多 Agent 模式进行进一步的讲解。大家制作的 Bot 都可以在飞书群中进行投稿,然后会有专门的同学记录到 Bot 收集板。
2024-11-22
如何训练Agent?
在人工智能领域中,训练 Agent 主要有以下方法和特点: 1. 基于迁移学习和元学习的 Agent 训练: 传统强化学习中,Agent 训练消耗大量样本和时间,泛化能力不足。为突破此瓶颈,引入迁移学习,促进不同任务间知识和经验迁移,减轻新任务学习负担,提升学习效率和性能,增强泛化能力。 元学习让 Agent 学会从少量样本中迅速掌握新任务最优策略,利用已有知识和策略调整学习路径,减少对大规模样本集依赖。 但迁移学习和元学习面临挑战,如迁移学习在源任务与目标任务差异大时可能无效甚至负面迁移,元学习需大量预训练和样本构建学习能力,使通用高效学习策略开发复杂艰巨。 时间:21 世纪初至今 特点:迁移学习将一个任务知识迁移到其他任务;元学习学习如何学习,快速适应新任务 技术:迁移学习如领域自适应;元学习如 MAML、MetaLearner LSTM 优点:提高学习效率,适应新任务 缺点:对源任务和目标任务相似性有要求 2. 基于强化学习的 Agent 训练: 强化学习关注如何让 Agent 通过与环境互动自我学习,在特定任务中累积最大长期奖励。起初主要依托策略搜索和价值函数优化等算法,如 Qlearning 和 SARSA。 随着深度学习兴起,深度神经网络与强化学习结合形成深度强化学习,赋予 Agent 从高维输入学习复杂策略的能力,有 AlphaGo 和 DQN 等成果。 深度强化学习允许 Agent 在未知环境自主探索学习,无需人工指导,在游戏、机器人控制等领域有应用潜力。 但面临诸多挑战,包括训练周期长、采样效率低、稳定性问题,在复杂真实环境应用困难。 时间:20 世纪 90 年代至今 特点:通过试错学习最优行为策略,以最大化累积奖励 技术:Qlearning、SARSA、深度强化学习(结合 DNN 和 RL) 优点:能够处理高维状态空间和连续动作空间 缺点:样本效率低,训练时间长
2024-11-21
agent的搭建
以下是一些常见的 Agent 构建平台: 1. Coze:新一代一站式 AI Bot 开发平台,适用于构建基于 AI 模型的各类问答 Bot,集成丰富插件工具,能拓展 Bot 能力边界。 2. Microsoft 的 Copilot Studio:主要功能包括外挂数据、定义流程、调用 API 和操作,以及将 Copilot 部署到各种渠道。 3. 文心智能体:百度推出的基于文心大模型的智能体(Agent)平台,支持开发者根据需求打造产品能力。 4. MindOS 的 Agent 平台:允许用户定义 Agent 的个性、动机、知识,以及访问第三方数据和服务或执行工作流。 5. 斑头雁:2B 基于企业知识库构建专属 AI Agent 的平台,适用于客服、营销、销售等场景,提供多种成熟模板,功能强大且开箱即用。 6. 钉钉 AI 超级助理:依托钉钉强大的场景和数据优势,在处理高频工作场景如销售、客服、行程安排等方面表现出色。 搭建工作流驱动的 Agent 通常可分为以下 3 个步骤: 1. 规划: 制定任务的关键方法。 总结任务目标与执行形式。 将任务分解为可管理的子任务,确立逻辑顺序和依赖关系。 设计每个子任务的执行方法。 2. 实施: 在 Coze 上搭建工作流框架,设定每个节点的逻辑关系。 详细配置子任务节点,并验证每个子任务的可用性。 3. 完善: 整体试运行 Agent,识别功能和性能的卡点。 通过反复测试和迭代,优化至达到预期水平。 您可以根据自己的需求选择适合的平台进行进一步探索和应用。
2024-11-21
AGI 和RAG AGENT有什么区别
AGI(通用人工智能)、RAG(检索增强生成)和 Agent 存在以下区别: Agent: 本质是动态 Prompt 拼接,通过工程化手段将业务需求转述为新的 Prompt。 包含短期记忆(messages 里的历史 QA 对)和长期记忆(summary 之后的文本塞回 system prompt)。 可以通过工具触发检索和 Action,触发 tool_calls 标记进入请求循环,拿模型生成的请求参数进行 API request,再把结果返回给大模型进行交互。 如 Multi Agents ,主要是更换 system prompt 和 tools 。 为 LLM 增加工具、记忆、行动、规划等能力,目前行业主要使用 langchain 框架,在 prompt 层和工具层完成设计。 有效使用工具的前提是全面了解工具的应用场景和调用方法,学习使用工具的方法包括从 demonstration 中学习和从 reward 中学习。 在追求 AGI 的征途中,具身 Agent 强调将智能系统与物理世界紧密结合,能够主动感知和理解物理环境并互动,产生具身行动。 RAG: 是向量相似性检索,可放在 system prompt 里或通过 tools 触发检索。 AGI:是一种更广泛和全面的智能概念,旨在实现类似人类的通用智能能力。 需要注意的是,这些概念的发展和应用仍在不断演进,想做深做好还有很多需要探索和解决的问题。
2024-11-19
有没有语音交互领域的AI Agent的好的思路
以下是关于语音交互领域的 AI Agent 的一些思路: 1. 构建像人一样的 Agent:实现所需的记忆模块、工作流模块和各种工具调用模块,这在工程上具有一定挑战。 2. 驱动躯壳的实现:定义灵魂部分的接口,躯壳部分通过 API 调用,如 HTTP、webSocket 等。要处理好包含情绪的语音表达以及躯壳的口型、表情、动作和语音的同步及匹配,目前主流方案只能做到预设一些表情动作,再做一些逻辑判断来播放预设,语音驱动口型相对成熟但闭源。 3. 保证实时性:由于算法部分组成庞大,几乎不能单机部署,特别是大模型部分,会涉及网络耗时和模型推理耗时,低延时是亟需解决的问题。 4. 实现多元跨模态:不仅要有语音交互,还可根据实际需求加入其他感官,如通过添加摄像头数据获取视觉信息并进行图像解析。 5. 处理拟人化场景:正常与人交流时会有插话、转移话题等情况,需要通过工程手段丝滑处理。 此外,像 AutoGLM 这样的产品,通过模拟人类操作来实现跨应用的控制,展现出了一定的智能理解能力,如能根据用户意图选择合适的应用场景。但仍存在语音识别偏差、操作稳定性需提升、支持平台有限等问题,未来随着多模态理解能力和操作精准度的提高,发展空间较大。
2024-11-19
AI agent和智能体有什么区别
AI agent 和智能体在以下方面存在区别: 1. 概念侧重点:AI agent 更强调作为数字人的大脑,拥有记忆模块等,以实现更真实的交互;智能体则被视为智能的最小单元,是可以设定目标后主动完成任务的。 2. 能力构成:AI agent 主要通过接入大语言模型,并结合工具、记忆、行动、规划等能力来发挥作用;智能体不仅具备推理能力,还能执行全自动化业务,但目前许多相关产品仍需人类参与。 3. 实现方式:AI agent 目前行业里主要通过如 langchain 框架,在 prompt 层和工具层完成设计,将大模型与工具进行串接;智能体在实现上可能涉及更多复杂的技术和逻辑。
2024-11-12
aigc最新发展动态
以下是 AIGC 的最新发展动态: AIGC 作为一种强大的技术,能够赋能诸多领域,但也存在多重潜在的合规风险。我国对 AIGC 的监管框架由多部法律和规定构成,形成共同监管的形势。 AIGC 主要分为语言文本生成、图像生成和音视频生成。语言文本生成利用多种模型生成文本,图像生成依赖于多种技术,音视频生成也有相应的技术,且在多个领域有广泛应用。 自 2023 年开年以来,生成式人工智能技术逐步涵盖艺术创作产业、医疗保健、虚拟现实、数据合成与数据增强等多个领域,为各行业带来了更多创新、效率与价值。 2024 年 7 月至 8 月,AIGC 领域有众多新动态,如 Anthropic 新增分享和后台功能、LLM 分布式训练框架 OpenDiLoCo、Odysseyml 重构 AI 视频生成技术、Open AI 发布 GPT4omini、Mistral 发布三个小模型、Meta 发布 Llama3.1 405B 模型、AI 音乐工具 Udio 的大规模更新、OpenAI 推出 SearchGPT 搜索功能、Google 发布 Gemma 2 2B 和 Gemini 1.5 Pro、FLUX 开源图像的新标杆、Meta 发布 SAM 2 分割模型等。
2024-11-24
最近一个月最重要的AI动态
以下是最近一个月的一些重要 AI 动态: 2024 年 4 月第二周:谷歌发布了一堆 AI 能力和升级,AI 音乐生成工具 Udio 发布,Open AI 发布 GPT4 Turbo 正式版,AI 画图应用 Ideogram 发布模型更新。 2024 年 4 月第三周:Meta 正式发布 Llama3 8B、70B 模型,Open AI 的 Assistants API 更新等,Reka Core 发布,一个 GPT4 级别的多模态 LLM,Mixtral8X22B 模型开源。 2024 年 4 月第四周:Open AI 的动态包括企业服务、起初研究和 ChatGPT 体验优化。 2024 年 5 月第一周:Claude 推出移动应用以及团队版计划,突然爆火的两款 SD 图像风格,亚马逊推出了 Amazon Q AI 助手。 2024 年 5 月第二周:Open AI 高强度预热发布会,Open AI 宣布和 Stack Overflow 达成合作,Controlnet 作者敏神发布 ICLight 光线融合生成项目。 此外,在过去的一段时间里,人工智能行业发展迅速。在过去 12 个月里,人工智能行业是重要的技术发展之一。从 2022 年 9 月到 2023 年 8 月,研究的工具访问量大幅增长。这一飞跃从去年 11 月 ChatGPT 成为最快达到 100 万用户的平台开始,炒作持续攀升,直到 2023 年 5 月达到峰值,之后虽有回落,但人们的兴趣仍然巨大。 另外,关于如何使用 AI 做事,目前似乎没有完善的用户文档,相关指南多通过 Twitter 影响者获得。作者基于自身经验为学生和读者准备的人工智能入门指南也需不断修改。
2024-11-15
总结一下最新AI动态和新闻,各种新技术和新的应用方向
以下是最新的 AI 动态和新闻,以及新技术和新的应用方向: 技术研究方向: 数学基础:包括线性代数、概率论、优化理论等。 机器学习基础:涵盖监督学习、无监督学习、强化学习等。 深度学习:涉及神经网络、卷积网络、递归网络、注意力机制等。 自然语言处理:包含语言模型、文本分类、机器翻译等。 计算机视觉:有图像分类、目标检测、语义分割等。 前沿领域:如大模型、多模态 AI、自监督学习、小样本学习等。 科研实践:包括论文阅读、模型实现、实验设计等。 应用方向: 编程基础:如 Python、C++等。 机器学习基础:如监督学习、无监督学习等。 深度学习框架:如 TensorFlow、PyTorch 等。 应用领域:包括自然语言处理、计算机视觉、推荐系统等。 数据处理:涵盖数据采集、清洗、特征工程等。 模型部署:涉及模型优化、模型服务等。 行业实践:包含项目实战、案例分析等。 AIGC 周刊动态: 2024 年 7 月第二周:快手发布可灵网页版及大量模型更新;阶跃星辰发布多款模型;商汤打造类似 GPT4o 的实时语音演示;GraphRAG:微软开源新型 RAG 架构。 2024 年 7 月第三周:Anthropic 新增分享和后台功能;LLM 分布式训练框架 OpenDiLoCo;Odysseyml 重构 AI 视频生成技术。 2024 年 7 月第四周:Open AI 发布 GPT4omini、Mistral 发布三个小模型,还有其他一堆小模型等。 2024 年 7 月第五周:Meta 发布的 Llama3.1 405B 模型,具备 128K token 上下文窗口及对 8 种语言的改进,能与领先闭源模型竞争。评估显示其在指令遵循、代码和数学能力上表现优异。同时,还提到 AI 音乐工具 Udio 的大规模更新,以及 OpenAI 推出的 SearchGPT 搜索功能。 新手学习 AI 的方法: 了解 AI 基本概念:阅读「」部分,熟悉术语和基础概念,了解主要分支及联系,浏览入门文章。 开始学习之旅:在「」中找到为初学者设计的课程,推荐李宏毅老师的课程,通过在线教育平台按自己节奏学习。 选择感兴趣的模块深入学习:如图像、音乐、视频等,掌握提示词技巧。 实践和尝试:实践巩固知识,使用各种产品创作,分享实践成果。 体验 AI 产品:与 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人互动,了解工作原理和交互方式。
2024-10-31
如何快速了解AI行业动态
以下是快速了解 AI 行业动态的一些方法: 1. 持续学习和跟进:AI 是一个快速发展的领域,新的研究成果和技术不断涌现。关注 AI 领域的新闻、博客、论坛和社交媒体,保持对最新发展的了解。考虑加入 AI 相关的社群和组织,参加研讨会、工作坊和会议,与其他 AI 爱好者和专业人士交流。 2. 明确主题:在开始获取信息之前,先选定一个吸引人的主题。以当前 AI 领域的热度为例,每天都有众多新闻值得关注。可以通过阅读各类 AI 主题的公众号、追踪相关博主的动态、参与行业微信群讨论等多元化渠道,来捕捉 AI 界的最新动态。 3. 持续学习与更新: 鼓励员工学习 AI 相关知识和技能。通过提升员工对 AI 技术的理解和应用能力,增强企业整体的 AI 适应能力。组织 AI 相关的培训课程,提供在线学习资源,帮助员工了解 AI 的基础知识和应用实例。在企业内部培养持续学习和创新的文化,鼓励员工探索和实践 AI 相关技术。通过激励机制(如奖励、认证)鼓励员工参与 AI 学习和应用。例如,提供机器学习、数据分析等相关课程,帮助员工掌握 AI 在实际工作中的应用技能。 关注 AI 技术的最新发展,及时更新和优化 AI 应用。保持企业 AI 应用的先进性和竞争力,适应技术发展的快速变化。持续关注 AI 领域的最新研究和行业动态,包括新技术、工具、最佳实践等。定期评估现有 AI 应用的性能和效果,根据最新技术进展进行更新和优化。与 AI 领域的专家和机构保持交流和合作,获取最新的知识和支持。建立有效的反馈机制,收集员工和客户对 AI 应用的反馈,作为持续改进的依据。根据市场需求和竞争环境的变化,及时调整 AI 策略和应用。
2024-10-23
AI发展最新动态
AI 发展的最新动态包括以下方面: 新手学习 AI :AI 是快速发展的领域,新的研究成果和技术不断涌现。新手可通过关注 AI 领域的新闻、博客、论坛和社交媒体,保持对最新发展的了解。考虑加入 AI 相关的社群和组织,参加研讨会、工作坊和会议,与其他 AI 爱好者和专业人士交流来学习。 技术历史和发展方向 : 发展历程 :早期阶段有专家系统、博弈论、机器学习初步理论;知识驱动时期有专家系统、知识表示、自动推理;统计学习时期有机器学习算法如决策树、支持向量机、贝叶斯方法等;深度学习时期有深度神经网络、卷积神经网络、循环神经网络等。 前沿技术点 :大模型如 GPT、PaLM 等;多模态 AI 如视觉 语言模型、多模态融合;自监督学习如自监督预训练、对比学习、掩码语言模型等;小样本学习如元学习、一次学习、提示学习等;可解释 AI 如模型可解释性、因果推理、符号推理等;机器人学如强化学习、运动规划、人机交互等;量子 AI 如量子机器学习、量子神经网络等;AI 芯片和硬件加速。 红杉|AI 50 未来公司 :去年生成式 AI 从不引人注意走到 AI 50 强榜单前列,今年随着企业用户和消费者的 AI 生产力大幅提高,它成为前沿和中心。2023 年美国大部分 AI 风投流向基础设施领域,应用公司仍在 AI 50 强榜单中占据主导地位。如今许多公司正将 AI 融入工作流程以快速达成 KPI,大公司通过将 AI 融入产品获益,如 ServiceNow 实现近 20%的事件避免率,Palo Alto Networks 降低处理费用成本,Hubspot 扩大支持的用户规模,瑞典金融科技公司 Klarna 节省 4000 多万美元。不远的将来,有望看到 UX 和 UI 围绕 AI 功能重新设计,开发全新用户界面提供新体验。
2024-10-19
你可以将我上传的相片生成为动态的视频?
以下是将您上传的相片生成为动态视频的步骤: 1. 使用 Camera Motion: 点击“AddImage”上传图片。 在“Prompt”中输入提示词。 选择您想要的运镜方向,并输入相应的运镜值(https://waytoagi.feishu.cn/docx/Ci9yd5xu2o46rXxNofdcnqH9nXbdoxcniTMBNtWHj6MSpXvB2DTyUh)。 设置运动幅度,运动幅度和画面主体运动幅度有关,与运镜大小无关,可以设置成您想要的任意值。 选择好种子(seed)、是否高清(HD Quality)、是否去除水印(Remove Watermark)。 点击“create”,生成视频。 2. 端午节动态视频制作示例: 初稿图:可以使用即梦制作一张端午节海报,也可用 sd,若做出的素材满意可跳过 ps 合成部分,直接制作动态视频。即梦关键词如“中国端午节,背景是 3 个山形巨型粽子,四周云雾缭绕,赛龙舟,龙舟在水面上前行,河流从巨大的山形粽子之间蜿蜒延伸到远方,背景是雾蒙蒙的山脉,美食摄影,细节丰富,白天,仙雾,云朵,电影照明,超高品质,超高分辨率,超高清,超清晰细节,产品广告,8K,中国风”。 ps 合成:准备素材,如河流、船、粽子等,用 ps ai 把不需要的粽子去掉,把需要的粽子扣过来,多 p 条船。 sd 放大优化细节:不追求完美或者没有 sd 的可以跳过,此步骤是为了让粽子更加融合,增加点细节。 使 AI 视频工具做动态:可以用即梦、runway 等。如果效果不满意,可添加关键词。 在剪映里把视频放进去(AJ 操作):将 PNG 透明底图放上,然后导出。 希望以上内容对您有所帮助。
2024-10-12
最新的AI资讯
以下是为您提供的最新 AI 资讯: 新手学习 AI 方面:AI 是快速发展的领域,新的研究成果和技术不断涌现。您可以关注 AI 领域的新闻、博客、论坛和社交媒体,保持对最新发展的了解。考虑加入 AI 相关的社群和组织,参加研讨会、工作坊和会议,与其他 AI 爱好者和专业人士交流。 AIGC Weekly 32 方面: Netflix 列出了一个年薪 90 万美元的机器学习平台产品经理的 AI 产品工作岗位: Shopify 的 AI 助手现已上线。Sidekick 是一个帮助机器人,它知道如何在 Shopify 中执行任何操作提取相关数据、操作新功能或创建报告: Artifact(Ins 创始人做的 AI 新闻浏览软件)推出了自定义内容阅读语音的功能: OpenAI、谷歌、微软和 Anthropic 组建了前沿模型论坛,主要目的是确保 AI 模型的安全发展: Open AI 悄咪咪下线了他们的 ChatGPT 生成内容的检测器: 2024 人工智能报告方面: 全球芯片出口管制下,中国仍成重要市场。美国商务部长吉娜·雷蒙多警告英伟达,中国在美芯片制造商中所占的份额正在减少。字节跳动通过美国的甲骨文租用 NVIDIA H100 访问权限,而阿里巴巴和腾讯则与 NVIDIA 就在美国建立自己的数据中心进行谈判。与此同时,谷歌和微软直接向中国大型企业推销他们的云服务。 模型变得更便宜了。以前认为提供强大模型的成本过高,但现在提供这些模型的推断成本正在下降。OpenAI 更达到 100 倍下降!Google Gemini 生产了一种具有很强竞争力的定价系列!Gemini 1.5 Pro 和 1.5 Flash 的价格在推出后几个月内下降了 64%86%,而性能强劲,例如 Flash8B 比 1.5 Flash 贵 50%,但在许多基准测试中表现相当。注意:价格适用于<128K 令牌提示和输出。检索日期为 2024 年 10 月 4 日。考虑到计算成本很高,模型构建者越来越依赖与大型科技公司建立合作伙伴关系。反垄断监管机构担心这将进一步巩固现有公司的地位。
2024-11-23
最新AI资讯
以下是为您提供的最新 AI 资讯: 新手学习 AI 方面:AI 是快速发展的领域,新的研究成果和技术不断涌现。您可以关注 AI 领域的新闻、博客、论坛和社交媒体,保持对最新发展的了解。考虑加入 AI 相关的社群和组织,参加研讨会、工作坊和会议,与其他 AI 爱好者和专业人士交流。 AIGC Weekly 32 方面: Netflix 列出了一个年薪 90 万美元的机器学习平台产品经理的 AI 产品工作岗位: Shopify 的 AI 助手现已上线。Sidekick 是一个帮助机器人,它知道如何在 Shopify 中执行任何操作提取相关数据、操作新功能或创建报告: Artifact(Ins 创始人做的 AI 新闻浏览软件)推出了自定义内容阅读语音的功能: OpenAI、谷歌、微软和 Anthropic 组建了前沿模型论坛,主要目的是确保 AI 模型的安全发展: Open AI 悄咪咪下线了他们的 ChatGPT 生成内容的检测器: ShowMeAI 周刊 No.12 方面: JENOVA:AI Reddit 搜索& AI Youtube 搜索功能上线,以及为啥这个需求爆了? Artifacts:与 AI 交互的形式,正在被开发者们玩出新花样 画布:更彻底的 AI 交互革命,从一维走向二维的 LLM 交互新体验 再见,会读!为体面的退场鼓掌!&&源源不断冒出的更多新产品们 AI 编程:江山代有 AI 出,各领风骚数十天,以及 AI Coding 赛道洞察 AI 陪伴:EVE 创始人 VS C.AI 工程师,到底谁才是真正的 AI 陪伴? AI 原生游戏:1001 Nights 和 Oasis,两个极端,哪种才是真正的 Native 方向? Kimi:杨植麟身陷诉讼风波,发布数学推理模型 k0math,但是回应不了一切? Scaling Law:如果此路不通向 AGI,敢问路在何方? 社群讨论:如何选择创业产品的承载形式:App、网站、小程序
2024-11-22
AI 的最新资讯
以下是为您整理的 AI 最新资讯: 新手学习 AI 方面:AI 是快速发展的领域,新的研究成果和技术不断涌现。您可以关注 AI 领域的新闻、博客、论坛和社交媒体,保持对最新发展的了解。考虑加入 AI 相关的社群和组织,参加研讨会、工作坊和会议,与其他 AI 爱好者和专业人士交流。 AIGC Weekly 32 方面: Netflix 列出了一个年薪 90 万美元的机器学习平台产品经理的 AI 产品工作岗位: Shopify 的 AI 助手现已上线。Sidekick 是一个帮助机器人,它知道如何在 Shopify 中执行任何操作提取相关数据、操作新功能或创建报告: Artifact(Ins 创始人做的 AI 新闻浏览软件)推出了自定义内容阅读语音的功能: OpenAI、谷歌、微软和 Anthropic 组建了前沿模型论坛,主要目的是确保 AI 模型的安全发展: Open AI 悄咪咪下线了他们的 ChatGPT 生成内容的检测器: XiaoHu.AI 日报 10 月 10 日方面: PMRF:全新图像修复算法。擅长处理去噪、超分辨率、着色、盲图像恢复等任务,生成自然逼真的图像。不仅提高图片清晰度,还确保图片看起来像真实世界中的图像。能应对复杂图像退化问题,修复细节丰富的面部图像或多重损坏的图片,效果优质。详细介绍: 2024 年诺贝尔化学奖授予三位科学家:大卫·贝克、丹米斯·哈萨比斯、约翰·乔普。表彰贝克在计算蛋白质设计的贡献,以及哈萨比斯和乔普在蛋白质结构预测方面的杰出贡献。 nworld AI 发布《Beyond 2024》,具有动态游戏 AI,角色和系统根据玩家行为和环境做出实时反应,敌对角色动态调整策略,NPC 拥有独立思维。复杂动作与互动方面,AI 不再局限于对话,还能执行复杂动作,决策算法和认知系统增强了游戏中的 AI 表现。协作支持方面,AI 代理不仅在游戏中协作,还可为老年人提供局部支持,独立做出策略选择。
2024-11-22
AI目前最新发展是什么
AI 目前的最新发展包括以下几个方面: 1. 技术发展历程: 早期阶段(1950s 1960s):专家系统、博弈论、机器学习初步理论。 知识驱动时期(1970s 1980s):专家系统、知识表示、自动推理。 统计学习时期(1990s 2000s):机器学习算法(决策树、支持向量机、贝叶斯方法等)。 深度学习时期(2010s 至今):深度神经网络、卷积神经网络、循环神经网络等。 2. 当前前沿技术点: 大模型(Large Language Models):GPT、PaLM 等。 多模态 AI:视觉 语言模型(CLIP、Stable Diffusion)、多模态融合。 自监督学习:自监督预训练、对比学习、掩码语言模型等。 小样本学习:元学习、一次学习、提示学习等。 可解释 AI:模型可解释性、因果推理、符号推理等。 机器人学:强化学习、运动规划、人机交互等。 量子 AI:量子机器学习、量子神经网络等。 AI 芯片和硬件加速。 3. 产品设计和商业化思路的变化: 从通用能力到专业化细分:如图像生成(Midjourney、Stable Diffusion 等)、视频制作(Pika、Runway 等)、音频处理(各种 AI 配音、音乐生成工具)等,每个细分领域的产品都在不断提升核心能力,为用户提供更精准和高质量的服务。 商业模式的探索与创新:ToB 市场的深耕(如针对内容创作者的 ReadPo)、新型广告模式(如天宫搜索的“宝典彩页”)等,从单纯的技术展示向解决用户痛点和创造商业价值转变。 此外,AI 是一个快速发展的领域,新的研究成果和技术不断涌现。新手可以通过持续学习和跟进,关注 AI 领域的新闻、博客、论坛和社交媒体,考虑加入 AI 相关的社群和组织,参加研讨会、工作坊和会议,与其他 AI 爱好者和专业人士交流来保持对最新发展的了解。
2024-11-18
马斯克脑机接口最新发展
马斯克脑机接口的最新发展包括以下方面: 脑虎科技创始人彭雷指出脑机接口是人类脑计划的核心底层工具,能长期稳定读取大规模神经元活动信号。脑机接口是交叉领域,存在侵入式解决方案,如马斯克采用的柔性脑机结构,其柔性丝比头发细很多,通道无上限,可通过脑机信号控制物体。 2024 年 8 月 4 日,《马斯克最新 6 万字访谈!8.5 小时详解脑机接口、机器人、外星人,以及 AI 与人类的未来(一)》发布,这是马斯克第 5 次参加 Lex Fridman 播客,也是有史以来时间最长、最完整、信息量最大的一次,全球首位 Neuralink 脑机接口植入者 Noland 也参与了对话。 2024 年 1 月 30 日,马斯克宣布首例人类大脑芯片植入手术成功。
2024-11-16