Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

你能帮我找到这篇报告吗?他的名字是《InfoQ:中国AI Agent应用研究报告2024》

Answer

以下是为您找到的《InfoQ:中国 AI Agent 应用研究报告 2024》的链接:https://waytoagi.feishu.cn/record/Y45LrXJiwe4SgYc5tMZcVVtqn6b

Content generated by AI large model, please carefully verify (powered by aily)

References

4.4 历史更新

[title]4.4历史更新[heading2]2024年9月[heading3]9月10日《[大模型行业可信应用框架研究报告](https://waytoagi.feishu.cn/record/Z9evrpRl6ezkSwcdOyPcDiffn2d)》由蚂蚁集团和中国信通院联合发布,探讨了大模型在金融、医疗、政务等行业的应用挑战和解决方案。报告提出了一个系统化的可信应用框架,强调了专业性、可控性、真实性和安全性四个核心要素,并从数据质量、模型能力、推理过程、系统安全等方面提供了具体的技术实现建议。其它一些报告发布在[研究报告板块](https://waytoagi.feishu.cn/wiki/WvhZwk16WiEnSvk8AcpcdZetnMe)和[知识星球](https://t.zsxq.com/18DnZxlrl):《[InfoQ:中国AI Agent应用研究报告2024](https://waytoagi.feishu.cn/record/Y45LrXJiwe4SgYc5tMZcVVtqn6b)》《[新战略:2024人形机器人产业半年研究报告](https://waytoagi.feishu.cn/record/CMtPrA26ReWXCBcrc6HcHC1ynHo)》《[脉脉:2024大模型人才报告](https://waytoagi.feishu.cn/record/BaV7rrxQneDbSmcGAYCcsyKPnrd)》《[2024人工智能术语研究阶段性成果报告](https://waytoagi.feishu.cn/record/UeYSrwRKsehI4acgKR5cqIfPnvb)》

4.4 历史更新

《[InfoQ:中国AGI市场发展研究报告2024](https://waytoagi.feishu.cn/record/UoEir75zMefzbtcDrbgckg9Fn2c)》这是今天在AIcon大会上发布的研究报告,报告认为营销、零售、金融、企业服务、教育等领域都在探索AGI应用,但应用深度有限,处于基础探索期。AGI市场趋势预测:应用场景将走向与人类协同共生,人才供给将贯穿业务各个环节,成本将持续降低,价值将凸显。《[哈佛大学朱科航:自动化社会科学Agent与人类行为建模| Agent Insights](https://mp.weixin.qq.com/s/Q9jvHhUGITDlO1YYg-zyyw)》本文介绍了哈佛大学的朱科航在自动化社会科学领域的研究成果。他结合大语言模型和Agent技术,实现了对人类行为的建模和深度学习。通过利用LLM-based Agent进行自动化实验,可以高效地模拟社会科学测试,提出新的因果关系假设。他从物理转向机器学习研究的原因在于想更深入地理解人类社会行为,并借助大数据模型实现更好的应用。《[亲测有效:一文教你注册、安装、订阅使用ChatGPT 4o](https://waytoagi.feishu.cn/wiki/DxHowE1S9iy1Rik4YElciljln8d)》这是JessieZTalk所写的非常详细使用ChatGPT 4o的亲身体验,如果你在使用过程中遇到任何问题,都可以在文章中找到答案。她的另一篇文章《[快速学习AIGC,有料通俗易懂版!](https://waytoagi.feishu.cn/wiki/EJDAw2ovbis1c3kcsKvc2NPXni0)》作为入门学习AI,也推荐阅读。

4.4 历史更新

[title]4.4历史更新[heading2]2024年4月[heading3]4月26日《[SalesDriver:Al+销售线索营销进阶](https://waytoagi.feishu.cn/record/F3N0rsiiAeRkzOcBlXkct9uWnOd)》在网站问答区经常有客户问,AI怎么和我的工作相结合,这篇研究报告很详细给出了AI与销售线索营销结合的可操作方法:AI在销售线索营销中的应用主要体现在客户画像构建、潜客孵化、MQL甄别、个性化内容产出等方面。此外,AI还通过行为数据跟踪辅助销售精准跟进,优化营销策略,实现客户分级和差异化触达,以及销售线索的自动化管理,全面提升销售线索营销的效率和效果。同步上传了其它一系列AI报告:《[钉钉AI助理白皮书](https://waytoagi.feishu.cn/record/NIshrk7MHeSjNkc8OWAcyDV1nrf)》《[金杜律师事务所:2024人工智能的法律探究报告](https://waytoagi.feishu.cn/record/OW0yrL9Kde8HtIcMftucZwBhnyf)》《[量子位:2024中国AIGC应用全景报告](https://waytoagi.feishu.cn/record/WVHTrwMZyeV43bcGi3yckS55nEd)》《[中国移动:AI Agent在运营商业务智能网络的应用探讨](https://waytoagi.feishu.cn/record/CBoCrYZ2xekPx7c029ocmDCfnph)》《[华福证券:被低估的大模型“腾讯混元”](https://waytoagi.feishu.cn/record/ZaMJrOhjRe5msoc2twkcNG1fnDc)》

Others are asking
如何用AI制作故事板
以下是使用 AI 制作故事板的一些方法和步骤: 1. 确定主题和风格:比如丝绸之路的古风主题,并选择合适的模型和指令,如 Fanbook 中的 niji6 模型及sref 指令,确定视频尺寸为 16:9。 2. 设定故事主线和镜头:在有故事剧本及相关资料的基础上,按照场景、地点、镜号、画面描述、台词、音效等维度进行分镜头的填充。 3. 精简人物对话:尽可能精简人物的对话,提炼重点,根据台词长短合理安排画面数量。 4. 借助语言大模型获取灵感:当对某一句台词没有足够的画面灵感时,可以借助语言大模型,如 Kimi,让其帮助写好画面描述甚至加上对音效的需求。 5. 利用相关工具和应用程序: Project Odyssey 第二季中的 Playhouse 可使用人工智能为 2D 或 3D 角色制作动画,控制 3D 场景中的每个元素。 Playbook 是基于扩散的 3D 场景引擎,利用 ComfyUI 进行图像和视频生成。 Tripo AI 能在 8 秒内生成带纹理的 3D 网格模型,还开发了自动绑定、动画和风格化功能。 SAGA 是一款优秀的剧本创作和故事板应用程序,由强大的生成式人工智能模型支持。 6. 结合多种 AI 工具:在拍摄纪录片《未来的超级个体》时,结合使用 GPT4 完成内容策划和脚本撰写,使用 Dalle3 和 Midjourney 完成故事板的画面生成,使用 Perplexity AI 进行信息搜索和分析。
2025-02-17
AI数字人
AI 数字人是运用数字技术创造出来的人,目前业界尚无准确定义,一般可根据技术栈分为两类: 1. 真人驱动的数字人:重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业及直播带货。其表现质量与手动建模精细程度及动捕设备精密程度直接相关,不过随着视觉算法进步,在无昂贵动捕设备时也能通过摄像头捕捉人体骨骼和人脸关键点信息达到不错效果。 2. 算法驱动的数字人:强调自驱动,人为干预更少,技术实现更复杂。其大致流程包含三个核心算法: ASR(语音识别):能将用户音频数据转化为文字,便于数字人理解和生成回应,以实现像人与人一样的对话交互。 AI Agent(人工智能体):充当数字人的大脑,可接入大语言模型,拥有记忆模块等使其更真实。 TTS(文字转语音):将数字人依靠 LLM 生成的文字输出转换为语音,保持语音交互一致性。 此外,还有一些与 AI 数字人相关的摊位活动,如为企业和个人提供数字劳动力,解决重复性、创意性工作难题的“AI 数字员工”体验 demo,包括抖音运营、AI 客服、智能问诊、企业定制员工、定制知识库等;以及“AIGC 数字艺术挂画”“数字生命赋予每个人的新生”“AI 智能体应用”“Ai 心理疏导”“AIGC(图生图)趣味定制;AI 数字人定制”等。
2025-02-17
有什么用于搭建页面的ai应用吗
以下是一些用于搭建页面的 AI 应用: 1. 韦恩:扣子“AI 应用”入门 选择桌面网页,进入界面编排页面。 左侧有组件、模板和结构,组件包括布局组件、展示组件、输入组件和 AI 组件等。 中间是页面布局,左侧组件拖入并通过右侧的属性面板、事件面板进行设置。 右侧是属性面板和事件面板,不同组件的事件种类不同。 模板部分有官方提供的参考模板,结构部分方便找到页面及相关组件。 2. Wix ADI 网址:https://www.wix.com/ 特点:基于用户提供的信息自动生成定制化网站,提供多个设计选项和布局,集成了 SEO 工具和分析功能。 3. Bookmark 网址:https://www.bookmark.com/ 特点:AIDA 通过询问用户几个简单问题快速生成网站,提供直观的拖放编辑器,包括多种行业模板和自动化营销工具。 4. Firedrop 网址:https://firedrop.ai/ 特点:Sacha 是 AI 设计助手,可根据用户指示创建和修改网站设计,提供实时编辑和预览功能,包含多种现代设计风格和自定义选项。 5. The Grid 网址:https://thegrid.io/ 特点:Molly 是 AI 设计助手,可自动调整网站设计和布局,基于内容和用户互动优化,支持多种内容类型。 此外,还有韦恩:扣子“AI 应用”进阶中提到的邮票收藏馆应用的搭建案例,包括业务背景与逻辑梳理、页面设计等方面。
2025-02-17
最新的AI行业动态和进展有哪些,包含2025年
以下是关于最新的 AI 行业动态和进展(包含 2025 年)的内容: 2024 年: 图片超短视频的精细操控:包括表情、细致动作、视频文字匹配。 有一定操控能力的生成式短视频:风格化、动漫风最先成熟,真人稍晚。 AI 音频能力长足进展:带感情的 AI 配音基本成熟。 “全真 AI 颜值网红”出现,可以稳定输出视频,可以直播带货。 游戏 AI NPC 有里程碑式进展,出现新的游戏生产方式。 AI 男/女朋友聊天基本成熟:记忆上有明显突破,可以较好模拟人的感情,产品加入视频音频,粘性提升并开始出圈。 实时生成的内容开始在社交媒体内容、广告中出现。 AI Agent 有明确进展,办公场景“AI 助手”开始有良好使用体验。 AI 的商业模式开始有明确用例:数据合成、工程平台、模型安全等。 可穿戴全天候 AI 硬件层出不穷,虽然大多数不会成功。 中国 AI 达到或超过 GPT4 水平;美国出现 GPT5;世界上开始现“主权 AI”。 华为昇腾生态开始形成,国内推理芯片开始国产替代(训练替代要稍晚)。 AI 造成的 DeepFake、诈骗、网络攻击等开始进入公众视野,并引发担忧。 AI 立法、伦理讨论仍然大规模落后于技术进展。 2025 2027 年: AI 3D 技术、物理规则成熟:正常人无法区别 AI 生成还是实景拍摄。 全真 AI 虚拟人成熟:包含感情的 AI NPC 成熟,开放世界游戏成熟;游戏中几乎无法区别真人和 NPC。 AR/VR 技术大规模商用。 接近 AGI 的技术出现。 人与 AI 配合的工作方式成为常态,很多日常决策开始由 AI 来执行。 AI 生产的数据量超过全人类生产数据量,“真实”成为稀缺资源。 具身智能、核聚变、芯片、超导、机器人等技术有明显进展突破。 “人的模型”出现,出现“集中化 AGI”与“个人 AGI”的历史分叉。 AI 引发的社会问题开始加重,结构性失业开始出现。 AGI 对于地缘政治的影响开始显露。 此外,还有以下相关动态: 算力瓶颈不只是单纯的技术和建设问题,而是影响整个行业竞争格局的重要变量。 逐渐进入多模态灵活转换的新时代,实现文本、图像、音频、视频及其他更多模态之间的互相理解和相互转换。 人类劳动形式逐步“软件化”,复杂劳动被抽象为可调用的软件服务,劳动流程被大幅标准化和模块化,劳动能力像“即插即用”的工具一样易于获取。 AI 行业目前仍处于严重亏损的阶段,商业化进程仍有巨大提升空间。 云厂商是产业链中毋庸置疑的“链主”。 2024 年,头部 AI 应用的品类变化并不显著。创意工具(如图像和视频内容创作)依然占据最大比重。To P(面向专业用户)应用展现出强大的市场潜力,ToB(面向企业)应用发展路径相对复杂,ToC 应用面临较大的挑战。 在 AI 应用领域,Copilot 和 AI Agent 是两种主要的技术实现方式。 北美和欧洲贡献了 AI 移动应用市场三分之二的份额,众多中国 AI 公司积极出海。 2024 年 10 月的大事记包括: Gartner 发布 2025 年十大战略技术趋势。 DeepSeek 开源多模态 LLM 框架 Janus。 司南开源大模型能力评估模型 CompassJudger。 Anthropic 发布新功能 computer use,发布 Claude 3.5 Haiku,更新 Claude 3.5 Sonnet。 Stability AI 发布 Stable Diffusion 3.5。 x.AI 正式推出 API。 ComfyUI V1 官方桌面版开放内测。 华为发布纯血操作系统鸿蒙 OS NEXT。 Jina AI 推出高性能分类器 Classifier API。 OpenAI 发布图像生成模型 sCM。 Midjourney 上线外部图片编辑器。 Runway 发布动画视频功能 ActOne。 Ideogram 推出 AI 画板工具 Canvas。 Genmo 开源视频生成模型 Mochi 1。 荣耀发布操作系统 MagicOS 9.0。 美国 14 岁少年与 C.AI 聊天后离世。 新华社发文表示警惕「AI 污染」乱象。 港中文&趣丸推出 TTS 模型 MaskGCT。 科大讯飞发布讯飞星火 4.0 Turbo。 阿里通义代码模式开始内测。 Anthropic Claude 新增数据分析功能。 北京市大中小学推广 AI 学伴和 AI 导学应用。 稚晖君开源「灵犀 X1」全套资料。 OpenAI 高管 Miles Brundage 离职。
2025-02-17
最新的AI行业动态和进展有哪些
以下是最新的 AI 行业动态和进展: 1. 《2024 年度 AI 十大趋势报告》发布,其中提到大模型创新方面,架构优化加速涌现,融合迭代大势所趋;Scaling Law 泛化方面,推理能力成皇冠明珠,倒逼计算和数据变革;AGI 探索方面,视频生成点燃世界模型,空间智能统⼀虚拟和现实;AI 应用格局方面,第⼀轮洗牌结束,聚焦 20 赛道 5 大场景;AI 应用竞争方面,多领域竞速运营大于技术,AI 助手兵家必争;AI 应用增长方面,AI+X 赋能类产品大干快上,原生 AI 爆款难求;AI 产品趋势方面,多模态上马,Agent 席卷⼀切,高度个性化呼之欲出;AI 智变千行百业,左手变革生产力,右手重塑行业生态;AI 行业渗透率方面,数据基础决定初速度,用户需求成为加速度;AI 创投方面,投融资马太效应明显,国家队出手频率提升。 2. 2024 年 9 月的 AI 行业大事记: 9 月 12 日:李继刚再现神级 Prompt,玩法持续翻新;Mistral 发布首个多模态模型 Pixtral 12B。 9 月 13 日:商汤 Vimi 相机开放微博小程序;元象开源中国最大 MoE 大模型 XVERSEMoEA36B;OpenAI 发布 o1 模型。 9 月 14 日:人工智能生成合成内容标识办法(征求意见稿);Jina AI 发布 ReaderLM 和 Jina Embeddings V3。 9 月 18 日:DeepSeek 发文庆祝登上 LMSYS 榜单国产第一,几小时后 Qwen 新模型表示不服。 9 月 19 日:云栖大会;通义万相 AI 生视频上线;快手可灵 1.5 模型新增运动笔刷能力。 9 月 20 日:腾讯元器智能体对外发布;秘塔科技产品经理 JD 走红 AI 圈;阶跃跃问接入 Step2 万亿参数 MoE 语言大模型。 9 月 21 日:大模型测试基准研究组正式成立。 9 月 23 日:钉钉 365 会员上线。 9 月 24 日:讯飞星火 API 全新升级;豆包大模型全系列发布&更新。 9 月 25 日:Vidu API 正式开放,加速企业级视频创作;OpenAI 发布高级语音功能;西湖心辰开源 WestlakeOmni。 3. 2024 年,国内 AI 行业融资总金额增加,但事件数同比下降,马太效应越发明显,资本更青睐热点和高成熟度赛道。智能驾驶在各细分赛道中独占鳌头,AI+教育、AI+游戏、AI+医疗等赛道投资总额也有增长。政府积极推进 AI 原生行业发展,北京、上海、武汉等城市出台系列政策吸引人才和企业,国家队频繁投资体现政策支持。
2025-02-17
ai在学习领域应用
AI 在学习领域有广泛的应用,具体如下: 对于中学生: 1. 从编程语言入手学习:可以选择 Python、JavaScript 等编程语言,学习编程语法、数据结构、算法等基础知识,为后续的 AI 学习奠定基础。 2. 尝试使用 AI 工具和平台:例如 ChatGPT、Midjourney 等生成工具,体验其应用场景。也可以探索面向中学生的教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识:了解 AI 的基本概念、发展历程、主要技术(如机器学习、深度学习等),以及其在教育、医疗、金融等领域的应用案例。 4. 参与 AI 相关的实践项目:参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动,尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 5. 关注 AI 发展的前沿动态:关注权威媒体和学者,了解最新进展,思考其对未来社会的影响,培养思考和判断能力。 AI 的应用场景还包括: 1. 自动驾驶:用于开发自动驾驶汽车,提高交通安全性和效率。 2. 交通管理:优化交通信号灯和交通流量,缓解交通拥堵。 3. 物流和配送:优化物流路线和配送计划,降低运输成本,包括无人机送货。 4. 教育:实现个性化学习,为每个学生提供定制化的学习体验。 5. 农业:分析农田数据,提高农作物的产量和质量。 6. 娱乐:开发虚拟现实和增强现实体验。 7. 能源:优化能源的使用,提高能源效率。 在教育领域的具体应用: 1. 个性化学习平台:如 Knewton 平台,通过集成算法和大数据分析,实时跟踪学生学习进度,诊断学习难点,提供个性化学习建议和资源。 2. 自动评估:如 Pearson 的 Intelligent Essay Assessor,利用自然语言处理技术批改作文和开放性答案题,减轻教师批改负担,提高评估效率和一致性。 3. 智能辅助教学工具:如 Google 的 AI 教育工具 AutoML,创建定制学习内容,提高学习动机和知识掌握程度。 4. 虚拟现实和增强现实:如 Labster 的虚拟实验室平台,提供高科技实验室场景,让学生安全进行实验操作并获得即时反馈。
2025-02-17
明略科技:2024年中国AI Agent行业研究
以下是关于 2024 年中国 AI Agent 行业的相关研究报告: 2024 年 9 月: 《》 《》 2024 年 8 月: 《》深入分析了 AI Agent 的市场定义、发展阶段、核心组件及其在企业用户场景中的应用。 《》指出企业实施 AI Agent 的主要目标是降低运营成本,尤其是在知识库管理、数据分析、营销与客户服务等领域。 2024 年 5 月: 《》提到 AI Agent 市场处于早期阶段,其商业价值在于提升工作均值、实现行业知识库构建、改变工作流程及生产关系。未来,AI Agent 将作为数字生产力,通过与工作流的结合,成为企业知识资产积累与复用的关键角色,推动技术革命。
2025-02-10
告诉我最新的国际ai资讯(比如从2024年有什么ai被发明了,国际上一共有什么大的ai公司,中国的ai发展的怎么样了(deepseek怎么样))
以下是为您整理的最新国际 AI 资讯: 2024 年 2 月 5 日:百度智能云成功点亮昆仑芯三代万卡集群,这是国内首个正式点亮的自研万卡集群。 在 Lex Fridman 的播客中,Dylan Patel 和 Nathan Lambert 深入探讨了中国的 DeepSeek AI 模型,特别是 DeepSeekV3 和 DeepSeekR1。Nathan 强调 DeepSeek 是最开放的模型之一,采用 MIT 许可,鼓励商业用途,推动行业走向开源。 2025 年 AI 语音助手研究显示,语音技术是 AI 应用的关键,企业和用户都将受益。2024 年将是语音助手快速发展的时期,技术不断升级,市场竞争加剧,涌现出多种创业公司。未来,AI 语音将成为服务的“万能钥匙”,应用场景广泛,从医疗到教育,推动行业变革与创新。 2024 年 1 月 17 日:随着预训练技术遭遇瓶颈,GPT5 迟迟未能问世,从业者开始从不同角度寻找突破。以 o1 为标志,大模型正式迈入“PostTraining”时代;开源发展迅猛,Llama 3.1 首次击败闭源模型;中国本土大模型 DeepSeek V3,在 GPT4o 发布仅 7 个月后,用 1/10 算力实现了几乎同等水平。同时,大模型的日渐成熟也让产业重心从基础模型转向应用落地。AI 在编程领域爆发,“数字员工”崛起。 李飞飞在访谈中探讨了 AI Agent 的发展及其未来。她强调 AI Agent 应作为工具和赋能者,而非主导者,确保人们的自主性。李飞飞回顾了 ImageNet 的创立背景,并提到正在推动的“空间智能”概念,旨在理解和融合物理与数字三维世界。她认为,未来这两者的界限将逐渐模糊,从而带来更大变革。
2025-02-08
2024 AI工具排行榜
以下是 2024 年部分 AI 工具的相关信息: 开发者工具: 23 年 12 月至 24 年 3 月的访问量排行榜中,非大厂的 Top1 公司是 Langchain,其 3 月 PV 为 356 万,单 PV 价值为 56.18 美元。 赛道方面,天花板潜力 TAM 为 120 亿美元,总体趋势平稳增长,月平均增速为 82 万 PV/月,原生产品占比高。 竞争方面,Top1 占 19%,Top3 占 54%,马太效应弱,网络效应强,大厂已入局,技术门槛中。 教育工具: 23 年 12 月至 24 年 3 月的访问量排行榜中,非大厂的 Top1 公司是 Quizlet,其 3 月 PV 为 1.3 亿。 赛道方面,天花板潜力 TAM 约为 30 亿,总体趋势快速增长,月平均增速为 1793 万 PV/月,原生产品占比低。 竞争方面,Top1 占 45%,Top3 占 76%,马太效应弱,网络效应弱,大厂未入局,技术门槛中。 此外,在展望 2025 时,AI 行业的创新机会方面,2024 年 9 月 OpenAI 发布了新一代语言模型 o1,业界推测其采用了全新的训练与推理方案,结合强化学习技术,显著增强了推理能力,可能借鉴了下围棋的 AlphaGo Zero 的技术思路。
2025-01-26
2024年视频换脸技术
2024 年视频换脸技术面临一些挑战和发展趋势: 挑战方面: 可控性和一致性存在挑战,如人脸转动中保持观感不变形、多个生成片段保持人物一致性、遵循生成指令等,目前视频生成的体感仍需改进,需要底层模型的进步。 成本较高,生成一段 5 秒视频的成本最低约为 1 元人民币,限制了 C 端玩法和大规模应用。 发展趋势: 原生多模态成为 AI 架构的主流选择,从 OpenAI 的 GPT4V 到 Anthropic 的 Claude3V 和 xAI 的 Grok1.5V 等,行业正从简单的模态叠加向真正的多模态融合迈进。原生多模态模型采用统一的编码器解码器架构,在预训练阶段完成多模态信息的深度融合,提升了模型的理解能力,实现了模态间的无缝转换和互补增强,能够处理更复杂的任务。 自 2023 年末开始,Runway、Pika、Meta、Google 等不断推出视频生成/编辑工具,2024 年是 AI 视频技术逐渐成熟并开始商用的一年,下半年或 2025 年可能会看到 AI3D 技术的突破。抖音的成功证明音频、视频加入泛社交/娱乐产品会带来质的飞跃,AI 陪聊赛道中视频、音频技术的加入也将带来内容生产和社交方式的质变。
2025-01-24
2024大模型典型应用案例集
以下是 2024 大模型的一些典型应用案例及相关信息: 《2024 大模型典型示范应用案例集》汇集了 97 个优秀案例,展示了大模型技术在教育、医疗、金融、政务等多个行业和领域的应用。案例由阿里云、百度、华为等领先企业实施,上海成为应用落地的热点地区,大中型企业是主要试验场。AI 智能体和知识库成为提升大模型落地实效的关键手段。 在智能终端行业,中国超半数手机厂商都在使用文心大模型,包括三星、荣耀、vivo、OPPO、小米等主流手机品牌;上汽大众、吉利汽车、蔚来汽车、长安汽车等十余家车企已接入百度文心大模型。 整体来看,在主流大模型厂商中,百度表现突出,拿下最关键的中标项目数量、中标金额两项第一。截至 11 月,其文心大模型日均调用量超过 15 亿次,千帆平台帮助客户精调了 3.3 万个模型、开发了 77 万个企业应用。今年三季度财报披露,百度智能云营收达 49 亿元,同比增长 11%,其增长主要由互联网、教育、金融等行业对模型训练和推理的高需求带动。 企业想要真正将大模型在自身场景落地,需要具备构建算力、数据治理、模型训练、场景落实、应用搭建、持续运营、安全合规等整套能力。 相关报告: 《信达证券:AI 行业设计领域专题报告:Adobe AI 功能覆盖全面,Canva、美图等力争上游》 《中国信通院:大模型基准测试体系研究报告(2024 年)》 《埃森哲:人工智能行业:2024 在生成式人工智能时代重塑工作、劳动力和员工》 此外,还有一些相关活动,如: 2024 年是国内大模型技术加速落地的关键年份,各大厂商如百度、阿里、字节等在 AI 大模型领域展开激烈竞争。百度凭借 40 个中标项目和 2.74 亿元中标金额在行业中处于领先地位。尤其在金融、智能终端等行业,百度文心大模型的应用广泛,表现亮眼。 🏮「非遗贺春」魔多蛇年春节 AI 模型创作大赛,大赛时间 2024 年 12 月 24 日2025 年 1 月 15 日。大赛奖池【¥12000】现金奖励+官方高含金量荣誉证书+会员与算力激励+流量激励。双赛道同时开启,赛道一【春节】+赛道二【爱非遗 AI 传承】。本次活动由浙江省非遗保护中心(浙江省非遗馆)指导×浙江省非遗保护基金会主办×魔多 AI 联合承办,由提供社区传播支持。
2025-01-16
2024年人工智能指数报告 下载
以下是为您提供的 2024 年人工智能指数报告的相关下载信息: 1. 《》由微软和领英联合发布,揭示了人工智能(AI)在工作场所的快速增长和深远影响。 2. 可在知识星球下载的报告: 《》深入分析了 AI Agent 的市场定义、发展阶段、核心组件及其在企业用户场景中的应用。 《》企业实施 AI Agent 的主要目标是降低运营成本,尤其是在知识库管理、数据分析、营销与客户服务等领域。 3. 《》数据处理应从模型为中心转向数据为中心,并强调向量数据库在提升模型服务能力中的核心作用。 4. 斯坦福大学发布的基础模型透明度指数相关报告:在上一届 SOAI 发布后不久,斯坦福大学发布了其首个基础模型透明度指数,模型开发者的平均得分为 37 分。在团队的中期更新中,这一分数攀升至 58 分。2024 年 5 月,该指数的最新一期基于 100 项指标,评估了 14 家领先的基础模型开发者的透明度,这些指标涵盖“上游”因素数据、劳动力、计算、围绕能力和风险的“模型级”因素、围绕分布的“下游”标准以及社会影响。计算和使用政策的评分出现了最强劲的改善,而“上游”评分仍然疲弱。 5. 《2024 年人工智能现状:辉煌、戏谑和“牛市”》报告链接:
2025-01-11
有关agent的介绍
AI Agent 是当前 AI 领域中较为热门的概念,被认为是大模型未来的主要发展方向之一。 从原理上看,中间的“智能体”通常是 LLM(语言模型)或大模型。为其增加的四个能力分别是工具、记忆、行动和规划。目前行业中主要使用 langchain 框架,将 LLM 与 LLM 之间以及 LLM 与工具之间通过代码或 prompt 的形式进行串接。例如,给大模型提供长期记忆,相当于给予一个数据库工具让其记录重要信息;规划和行动则是在大模型的 prompt 层进行逻辑设计,如将目标拆解并输出不同的固定格式 action 指令给工具。 从产品角度,Agent 可以有不同的设定。比如是一个历史新闻探索向导,身份为历史新闻探索向导,性格知识渊博、温暖亲切、富有同情心,角色是主导新闻解析和历史背景分析,还可以为其设计背景故事使其更加生动。 在人工智能领域,Agent 智能代理是一种能够感知环境并根据感知信息做出决策以实现特定目标的系统,能够自动执行任务,如搜索信息、监控系统状态或与用户交互。
2025-02-16
AIagent的发展方向
AI Agent 被认为是大模型未来的主要发展方向之一,其发展具有以下特点和阶段: 从原理上看,中间的“智能体”通常是 LLM 或大模型,为其增加了工具、记忆、行动、规划四个能力。目前行业里主要用到的是 langchain 框架,它通过代码或 prompt 的形式将 LLM 与 LLM 之间以及 LLM 与工具之间进行串接。 在人工智能的发展历程中,AI Agent 并非一蹴而就,其发展可分为几个阶段,并受到符号主义、连接主义、行为主义的影响。在人工智能的黎明时期,符号人工智能作为主导范式,以对符号逻辑的依赖著称,代表之作是基于知识的专家系统。其特点是基于逻辑和规则系统,使用符号来表示知识,通过符号操作进行推理。优点是推理过程明确、可解释性强,缺点是知识获取困难、缺乏常识、难以处理模糊性。时间为 20 世纪 50 70 年代。 近期出现的各类 AI 搜索引擎不断颠覆传统搜索引擎,如 perplexity.ai、metaso、360 搜索、ThinkAny 等。AI Agent 在辅助高效处理信息和简便信息表达方面表现出色,例如智能摘要能辅助快速筛选信息,自然语言描述可生成美观可用的图片。在工作流方面,每个人应根据自身情况找到适合的工具,如产品经理可使用 AI 进行用户画像、竞品调研、设计产品测试用例、绘制产品功能流程图等。关于 AI Agent 的未来,曾被认为异想天开的想法都可能成为现实,技术迭代会不断向前。
2025-02-15
AI Agent 或者 工作流, 落地的场景
以下是 AI Agent 或工作流的一些落地场景: Long horizon task 长期任务执行:Agent 能像称职的项目经理,分解大任务为小步骤,保持目标导向并适时调整策略。 多模态理解:Agent 能同时理解文字、图像、声音等多种交流方式,全方位感知世界和任务上下文。 记忆与行动:通过先进的记忆机制,Agent 能积累经验,记住对话、操作步骤和效果,行动更精准高效。 自适应学习:从每次交互中吸取经验,不断完善策略,实现“智慧成长”。 在技术层面,有两条技术路线:以自主决策为核心的 LLM 控制流和以工作流(Workflow)编排为重点的工具集成系统。Anthropic 提出的 MCP(Model Context Protocol)提供了通用接口协议,将外部资源抽象为“上下文提供者”,便于模型与外部世界交互。 工作流驱动的 Agent 搭建,简单情况分为 3 个步骤:规划,包括制定任务关键方法、总结目标与执行形式、分解子任务等;实施,在 Coze 上搭建框架并分步构建和测试功能;完善,全面评估并优化效果。 典型例子如利用 Kimi Chat 进行网页搜索和总结分析。 包括 Agent 自行规划任务执行的工作流路径,适用于简单或线性流程。 多 Agent 协作,如吴恩达通过开源项目 ChatDev 举例,让大语言模型扮演不同角色共同开发应用或复杂程序。 OpenAI 研究主管 Lilian Weng 提出 Agent 的基础架构为“Agent=LLM+规划+记忆+工具使用”,规划包括子目标分解、反思与改进。
2025-02-15
腾讯agent开发
AppAgent 是由腾讯开发的一种基于大型语言模型(LLM)的多模态 Agent 框架。 其主要特点和功能包括: 多模态代理:能够处理和理解多种类型的信息(如文本、图像、触控操作等)。 直观交互:通过模仿人类的直观动作(如点击和滑动屏幕)来与手机应用程序交互,能够在手机上执行各种任务,例如在社交媒体上发帖、帮用户撰写和发送邮件、使用地图、在线购物,甚至进行复杂的图像编辑等。 对于之后模仿数据的反利用也有不错的应用场景,例如互联网或 AI 或涉及到原型+UE 的工作都可以在基于模仿数据的基础上进行反推,进而让设计出的产品原型和 UE 交互更优解。 AppAgent 在 50 个任务上进行了广泛测试,涵盖了 10 种不同的应用程序。该项目由腾讯和德州大学达拉斯分校的研究团开发。 相关链接: 官方网站:https://appagentofficial.github.io 相关报道:https://x.com/xiaohuggg/status/1738083914193965528?s=20
2025-02-14
什么是Agent
Agent(智能体)是一种能够在环境中自主感知、思考并采取行动以实现特定目标的实体。它可以是软件程序,也可以是硬件设备。 从产品角度来看,比如我们的 Agent 可以是一个历史新闻探索向导,具有知识渊博、温暖亲切、富有同情心的性格,主导新闻解析和历史背景分析。为使角色更生动,可设计背景故事,明确其起源、经历和动机,定义性格特点、说话方式和风格,以及设计对话风格和角色技能。 在结合大型语言模型(LLM)的情况下,LLM Agent 能够利用大型语言模型的自然语言处理能力,理解用户的输入,并在此基础上进行智能决策和行动。其组成部分包括规划(负责将复杂任务分解成可执行的子任务,并评估执行策略)、记忆(包括短期记忆用于存储对话上下文,长期记忆存储用户特征和业务数据)、工具(如 API 调用、插件扩展等辅助手段)和行动(将规划和记忆转换为具体输出,包括与外部环境的互动或工具调用)。 在 LLM 支持的自主 Agent 系统中,LLM 充当 Agents 的大脑,还包括规划(子目标分解、反思完善)、记忆(短期记忆、长期记忆)和工具使用(调用外部 API 获取额外信息)等方面。
2025-02-14
什么是agent
Agent(智能体)在人工智能和计算机科学领域是一个重要概念,指能够感知环境并采取行动以实现特定目标的实体,可以是软件程序或硬件设备。 从产品角度看,比如我们的 Agent 可以是一个历史新闻探索向导,具有知识渊博、温暖亲切、富有同情心的性格,主导新闻解析和历史背景分析,为使其角色更生动,可设计背景故事,明确角色背景和身份、性格和语气、互动方式、技能等。 在结合大型语言模型(LLM)的情况下,LLM Agent 是指结合大型语言模型和自主智能体特性的系统,能够利用大型语言模型的自然语言处理能力,理解用户输入,并进行智能决策和行动。其组成部分包括规划(负责将复杂任务分解成可执行的子任务,并评估执行策略)、记忆(包括短期记忆用于存储对话上下文,长期记忆存储用户特征和业务数据)、工具(如 API 调用、插件扩展等辅助手段)、行动(将规划和记忆转换为具体输出,包括与外部环境的互动或工具调用)。 在 LLM 支持的自主 Agent 系统中,LLM 充当 Agents 的大脑,还包括规划(子目标分解、反思完善)、记忆(短期记忆、长期记忆)、工具使用(调用外部 API 获取额外信息)等方面。
2025-02-12