直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

人工智能2024进展综述

回答

以下是关于人工智能 2024 进展的综述:

一、技术与应用方面的进展

  1. 图片-超短视频的精细操控:包括表情、细致动作、视频-文字匹配。
  2. 生成式短视频:风格化、动漫风最先成熟,真人稍晚。
  3. AI 音频能力:带感情的 AI 配音基本成熟。
  4. “全真 AI 颜值网红”:可以稳定输出视频并直播带货。
  5. 游戏 AI NPC:有里程碑式进展,出现新的游戏生产方式。
  6. AI 男/女朋友聊天:记忆上有明显突破,能较好模拟人的感情,产品加入视频音频,粘性提升并开始出圈。
  7. 实时生成的内容:开始在社交媒体内容、广告中出现。
  8. AI Agent:有明确进展,办公场景“AI 助手”开始有良好使用体验。

二、商业模式与硬件方面

  1. AI 的商业模式:开始有明确用例,如数据合成、工程平台、模型安全等。
  2. 可穿戴-全天候 AI 硬件:层出不穷,虽然大多数不会成功。

三、国内外发展情况

  1. 中国 AI:达到或超过 GPT4 水平。
  2. 美国:出现 GPT5。
  3. 世界:开始现“主权 AI”。
  4. 华为昇腾生态:开始形成,国内推理芯片开始国产替代(训练替代要稍晚)。

四、相关问题与挑战

  1. AI 造成的 DeepFake、诈骗、网络攻击等开始进入公众视野,并引发担忧。
  2. AI 立法、伦理讨论仍然大规模落后于技术进展。

五、其他相关内容

  1. 精选英文报告中添加了《人工智能生成内容(AIGC)进展》,135 页文档非常全面概述人工智能生成的内容,涵盖其基础、前沿、应用和社会影响。
  2. 更新了 E2B 的Agent 全景图
  3. 图解 108 个思维模型》详细介绍了 108 种助于理解复杂概念、改善决策过程和提升问题解决技能的思维模型。

此外,红杉资本的观点认为:

  1. AI 产品越来越契合市场的需要,如人工智能驱动的客户服务平台 Klarnas 实现了大量客户服务查询的自动化。
  2. 生成式人工智能正在经历快速增长,第一年收入约 30 亿美元。
  3. 存在 AI 的$200B 问题,即投资与回报的不平衡。
  4. 预测 2024 年将是真正的 AI 应用从 Copilots 转变为人类 Agents 的一年,未来人工智能将更有能力完成更高层次的认知任务,计算平衡从预训练转向推理。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

AGI 万字长文(下)| 2024,分叉与洪流

2024年内图片-超短视频的精细操控:表情、细致动作、视频-文字匹配有一定操控能力的生成式短视频:风格化、动漫风最先成熟;真人稍晚AI音频能力长足进展:带感情的AI配音基本成熟“全真AI颜值网红”出现,可以稳定输出视频,可以直播带货游戏AI NPC有里程碑式进展,出现新的游戏生产方式AI男/女朋友聊天基本成熟:记忆上有明显突破,可以较好模拟人的感情,产品加入视频音频,粘性提升并开始出圈实时生成的内容开始在社交媒体内容、广告中出现AI Agent有明确进展,办公场景“AI助手”开始有良好使用体验2AI的商业模式开始有明确用例:数据合成、工程平台、模型安全等可穿戴-全天候AI硬件层出不穷,虽然大多数不会成功中国AI达到或超过GPT4水平;美国出现GPT5;世界上开始现“主权AI”华为昇腾生态开始形成,国内推理芯片开始国产替代(训练替代要稍晚)AI造成的DeepFake、诈骗、网络攻击等开始进入公众视野,并引发担忧AI立法、伦理讨论仍然大规模落后于技术进展……2025-2027AI 3D技术、物理规则成熟:正常人无法区别AI生成还是实景拍摄

4.6 历史更新

在精选英文报告中添加了《[人工智能生成内容(AIGC)进展](https://waytoagi.feishu.cn/record/MxccrEKunexvJKciWFacxMOTnEe)》,135页文档非常全面概述人工智能生成的内容,涵盖其基础、前沿、应用和社会影响。它将涵盖大型语言模型和扩散模型的基础知识,以及该领域的最新研究和应用。更新了E2B的[Agent全景图](https://waytoagi.feishu.cn/wiki/N6TZwqysRiil4WkWDkNcmv1SnJK?table=ldxrMcFRW4FlV1vI):《[图解108个思维模型](https://waytoagi.feishu.cn/record/IULHrlzpIekCl2clny0cYM1Lnfc)》详细介绍了108种助于理解复杂概念、改善决策过程和提升问题解决技能的思维模型。每个模型都通过图解的方式展示,以便更容易理解,并附有简短的描述,解释其在个人成长、商业策略、学习和创造力等多个生活领域的应用。这些模型覆盖了心理学概念、商业策略、学习方法和决策过程等广泛主题。而且很有趣的是作者将它做成了扑克牌的形态,打印出来可以常看常新。([知识星球可供下载](https://t.zsxq.com/179eZQ3AP))

观点:红杉资本 | 2024年:AI的机遇、现状和未来预测

AI产品越来越契合市场的需要:人工智能已经在客户支持、法律服务和软件工程等行业展示了产品与市场的契合度。例如,由人工智能驱动的客户服务平台Klarnas通过处理三分之二的客户服务查询,实现了相当于700个全职座席工作的自动化。生成式人工智能正在经历快速增长:第一年的收入约为30亿美元,这一壮举是SaaS市场花了近十年时间才实现的。与以前的技术转变相比,这凸显了人工智能的加速采用和价值创造潜力。AI的$200B问题:虽然公司在AI基础设施上投入了大量资金,仅去年一年就有大约500亿美元用于NVIDIA GPU,但AI应用程序产生的收入仍然相对适中。这就提出了一个问题,即对人工智能的投资何时以及如何转化为可观的回报?预测:Sonya Huang预测,2024年将是真正的AI应用将我们从Copilots(副驾驶)转变为可以作为人类Agents(代理)的一年。之前的人工智能可能更像是一种辅助工具,而未来的人工智能将变成你的同事。她还预计,随着人工智能应用进入生产阶段,人工智能将更有能力完成更高层次的认知任务,如规划和推理,并使计算的平衡从预训练转向推理。

其他人在问
某银行计划对外采购2024年分行内训师培训项目,现需要对采购内容做详细要求,培训内容以AI工具课程开发与设计,课程制作与实践,短视频制作,直播授课技巧等,我该如何对培训老师资质,授课经验,AI工具运用等技能做细化要求
以下是为您提供的关于银行采购 2024 年分行内训师培训项目中对培训老师资质、授课经验、AI 工具运用等技能的细化要求建议: 培训老师资质: 具备相关领域的专业教育背景,如计算机科学、人工智能等。 持有相关的行业认证或资格证书。 授课经验: 拥有丰富的企业内训经验,特别是在金融行业的培训经历。 成功完成过类似 AI 工具课程开发与设计、课程制作与实践等相关课程的授课。 AI 工具运用技能: 熟练掌握多种主流的 AI 工具,如常见的机器学习框架、自然语言处理工具等。 能够运用 AI 工具进行实际项目开发,并具有相关的案例成果。 熟悉短视频制作和直播授课中涉及的 AI 辅助技术,如智能剪辑工具、虚拟主播技术等。 希望以上建议对您有所帮助。
2024-09-13
2024大模型典型示范应用案例集在哪可下载
2024 大模型典型示范应用案例集可以在以下链接下载:https://waytoagi.feishu.cn/record/UXgRrbKPue5a2McLLRBcobienQg 。该案例集汇集了 97 个优秀案例,展示了大模型技术在多个行业和领域的应用,如教育、医疗、金融、政务等。案例由阿里云、百度、华为等领先企业实施,体现了大模型在提升效率、降低成本、创新服务等方面的显著成效。上海成为应用落地的热点地区,大中型企业是主要试验场。AI 智能体和知识库成为提升大模型落地实效的关键手段。这些案例为行业提供参考,推动大模型技术深入赋能实体经济,促进高质量发展。
2024-09-09
Error occurred when executing IPAdapterAdvanced: insightface model is required for FaceID models File "D:\AI\comfyui_20240421\execution.py", line 151, in recursive_execute output_data, output_ui = get_output_data(obj, input_data_all) File "D:\AI\co
以下是针对您所遇到的报错问题的一些解决建议: 1. 对于 ipadater 部分报错说 model 不存在的情况,将文中画圈部分修改调整到不报错。Pulid 部分,除了下载好对应的节点以及参考官方网站最下面的安装对应要求外,还要注意上图中的第二要点,对应安装一些内容,具体要求可查看云盘中命名为“pulid 插件模型位置.png”的文件及对应的云盘链接:PulID 全套模型,链接:https://pan.baidu.com/s/1ami4FA4w9mjuAsPK49kMAw?pwd=y6hb,提取码:y6hb。否则将会遇到报错:Error occurred when executing PulidEvaClipLoader。 2. 对于 Ollama 大模型部分,为了应对没下载大模型带来的报错,需要下载大模型。首先,下载 ollama,网站: 。 3. 如果缺少 ipadapter 的模型,可去这个网址下载:https://github.com/cubiq/ComfyUI_IPAdapter_plus 。如果遇到“Error occurred when executing IPAdapterUnifiedLoader:ClipVision model not found.......”类似的报错,可在这个网址里找到多个关于 IPAdapter 报错的解决办法:https://github.com/cubiq/ComfyUI_IPAdapter_plus/issues/313 。 另外,换脸工作流的核心组件是 Apply InstantID Advanced 节点,这个节点的作用就是将源人脸替换到目标图像中。其中,instantID 模型擅长提取图片的高层次特征,包括面部的纹理信息、几何结构、风格特征等,在图中例子是 IPAdpater,用于识别和保留目标图像 image_kps 的风格并迁移到生成图像中。instantID Face Analysis 节点用于提取人脸五官的特征向量,作用是使生成图像时,人脸的眼睛、鼻子、嘴巴等样子仍然符合源人脸 image 的特征。controlnet 模型的作用是识别目标图像 image_kps 的低层次特征,包括骨架、姿势、边缘、结构。controlnet 模型和 instantID 模型起到不同的控制作用,结合使用可以达到将源人脸的五官替换目标图像中五官的效果。
2024-09-03
《生成式 AI 导论 2024》李宏毅课程在哪里可以学习
您可以在以下网址学习李宏毅的《生成式 AI 导论 2024》课程:https://www.youtube.com/watch?v=AVIKFXLCPY8 课程目录如下: 第 0 講:課程說明(2024 年 2 月 24 日) 第 1 講:生成式 AI 是什麼?(2024 年 2 月 24 日) 第 2 講:今日的生成式人工智慧厲害在哪裡?從「工具」變為「工具人」(2024 年 3 月 3 日) 第 3 講:訓練不了人工智慧?你可以訓練你自己—神奇咒語與提供更多資訊(2024 年 3 月 3 日) 第 4 講:訓練不了人工智慧?你可以訓練你自己—拆解問題與使用工具(2024 年 3 月 10 日) 待更新…… 该课程的附录内容包括: 一、课程介绍 这是台湾大学李宏毅教授的生成式 AI 课程,主要介绍了生成式 AI 的基本概念、发展历程、技术架构和应用场景等内容。课程共分为 12 讲,每讲约 2 小时。 二、学习目标 通过学习本课程,掌握生成式 AI 的基本概念和常见技术,能够使用相关框架搭建简单的生成式模型,了解生成式 AI 的发展现状和未来趋势。 三、学习内容 1. 什么是生成式 AI 生成式 AI 的定义和分类 生成式 AI 与判别式 AI 的区别 生成式 AI 的应用领域 2. 生成式模型 生成式模型的基本结构和训练方法 生成式模型的评估指标 常见的生成式模型及其优缺点 3. 生成式对话 生成式对话的基本概念和应用场景 生成式对话系统的架构和关键技术 基于生成式模型的对话生成方法 4. 预训练语言模型 预训练语言模型的发展历程和关键技术 预训练语言模型的优缺点 预训练语言模型在生成式 AI 中的应用 5. 生成式 AI 的挑战与展望 生成式 AI 面临的挑战和解决方法 生成式 AI 的未来发展趋势和研究方向 四、学习资源 教材:《生成式 AI 导论 2024》,李宏毅
2024-09-03
有关于2024年世界人工智能大会的相关文章吗?
2024 年世界人工智能大会在上海举办,展示了 500 家企业的 1500 项展品,突出了机器人和大模型技术。国产机器人和大模型在 AI 应用、人机交互和专业领域展现出巨大潜力,预示着 AI 技术正快速融入日常生活和各行各业。相关文章包括: 《》 《》 《世界人工智能大会》 《》 《》 《》 《》 《》
2024-07-11
AI的整个发展史,有没有AI相关综述,让我阅读一下
以下是为您提供的关于 AI 发展史及相关综述的内容: 1. 《机器之心的进化 / 理解 AI 驱动的软件 2.0 智能革命》:涵盖了 AI 进化史的多个方面,包括前神经网络时代、Machine Learning 的跃迁、开启潘多拉的魔盒等,文章较长,约 22800 字,阅读前可先观看一段 Elon Musk 和 Jack Ma 在 WAIC 2019 关于人工智能的对谈视频。 2. 对于初学者: 微软的 AI 初学者课程《Introduction and History of AI》: AI for every one(吴恩达教程): 大语言模型原理介绍视频(李宏毅): 谷歌生成式 AI 课程: ChatGPT 入门: 如果您是新手学习 AI,可参考以下学习路径指南: 1. 了解 AI 基本概念:阅读「」熟悉术语和基础概念,浏览入门文章了解 AI 历史、应用和发展趋势。 2. 开始 AI 学习之旅:在「」中找到为初学者设计的课程,可通过在线教育平台(如 Coursera、edX、Udacity)按自己节奏学习并获取证书。 3. 选择感兴趣的模块深入学习:AI 领域广泛,如图像、音乐、视频等,可根据兴趣选择特定模块深入学习。
2024-09-16
如何用AI写论文综述
利用 AI 写论文综述可以参考以下步骤和建议: 1. 确定论文综述的主题:明确研究兴趣和目标,选择具有研究价值和创新性的主题。 2. 收集背景资料:使用学术搜索引擎和文献管理软件等 AI 工具来搜集相关研究文献和资料。 3. 分析和总结信息:借助 AI 文本分析工具提取收集资料中的关键信息和主要观点。 4. 生成大纲:利用 AI 写作助手生成包括引言、文献综述、方法论、结果和讨论等部分的大纲。 5. 撰写文献综述:使用 AI 工具辅助撰写,确保内容准确完整。 6. 构建方法论:根据研究需求,参考 AI 建议的方法和技术设计研究方法。 7. 数据分析:若涉及数据收集和分析,运用 AI 数据分析工具处理和解释数据。 8. 撰写和编辑:通过 AI 写作工具撰写各部分,并进行语法和风格检查。 9. 生成参考文献:利用 AI 文献管理工具生成正确的参考文献格式。 10. 审阅和修改:使用 AI 审阅工具检查论文的逻辑性和一致性,并根据反馈修改。 11. 提交前的检查:最后,用 AI 抄袭检测工具确保论文的原创性,并进行最后的格式调整。 在论文写作领域,常用的 AI 工具和平台有: 1. 文献管理和搜索: Zotero:结合 AI 技术,可自动提取文献信息,帮助管理和整理参考文献。 Semantic Scholar:由 AI 驱动的学术搜索引擎,提供文献推荐和引用分析。 2. 内容生成和辅助写作: Grammarly:通过 AI 技术提供文本校对、语法修正和写作风格建议,提升语言质量。 Quillbot:基于 AI 的重写和摘要工具,可精简和优化论文内容。 3. 研究和数据分析: Google Colab:提供基于云的 Jupyter 笔记本环境,支持 AI 和机器学习研究,便于数据分析和可视化。 Knitro:用于数学建模和优化的软件,助力复杂数据分析和模型构建。 4. 论文结构和格式: LaTeX:结合自动化和模板,高效处理论文格式和数学公式。 Overleaf:在线 LaTeX 编辑器,有丰富模板库和协作功能,简化编写过程。 5. 研究伦理和抄袭检测: Turnitin:广泛使用的抄袭检测工具,确保论文原创性。 此外,使用 AI 写东西时,可以让它草拟初稿,如博客文章、论文、宣传材料等。还可以将文本粘贴到 AI 中,要求其改进内容、提供针对特定受众的更好建议、创建不同风格的草稿、使内容更生动或添加例子等。也可以像使用实习生一样,让 AI 帮忙写邮件、创建销售模板、给出商业计划的下一步等。
2024-09-15
如何使用ai生成文献综述
以下是关于如何使用 AI 生成文献综述的步骤和建议: 1. 确定课题主题:明确您的研究兴趣和目标,选择一个具有研究价值和创新性的主题。 2. 收集背景资料:使用 AI 工具如学术搜索引擎和文献管理软件来搜集相关的研究文献和资料。 3. 分析和总结信息:利用 AI 文本分析工具来分析收集到的资料,提取关键信息和主要观点。 4. 生成大纲:使用 AI 写作助手生成课题的大纲,包括引言、文献综述、方法论、结果和讨论等部分。 5. 撰写文献综述:利用 AI 工具来帮助撰写文献综述部分,确保内容的准确性和完整性。 6. 构建方法论:根据研究需求,利用 AI 建议的方法和技术来设计研究方法。 7. 数据分析:如果课题涉及数据收集和分析,可以使用 AI 数据分析工具来处理和解释数据。 8. 撰写和编辑:利用 AI 写作工具来撰写课题的各个部分,并进行语法和风格的检查。 9. 生成参考文献:使用 AI 文献管理工具来生成正确的参考文献格式。 10. 审阅和修改:利用 AI 审阅工具来检查课题的逻辑性和一致性,并根据反馈进行修改。 11. 提交前的检查:最后,使用 AI 抄袭检测工具来确保课题的原创性,并进行最后的格式调整。 关于专利审查方面的 AI 使用,步骤如下: 1. 注册和登录:在对应的平台上注册账户并登录。 2. 上传专利文献:上传待审查的专利文献或输入检索关键词。 3. 选择分析功能:根据需要选择专利检索、分析、评估或生成功能。 4. 查看结果和报告:查看 AI 生成的检索结果、分析报告和评估结果。 5. 进一步处理:根据分析结果进行进一步的人工审查和处理,或者直接生成专利申请文件。 对于内容创作者,通过智能工具实现博客高效数字化转型的个人化建议: 1. AI 辅助头脑风暴:下次遇到创意瓶颈时,尝试用 AI 进行头脑风暴。给 AI 一个主题,让它生成多个创意方向,然后从中选择最适合的进行深化。 2. 建立 AI 写作流程:逐步将 AI 整合到您的写作流程中。可以从使用 AI 生成文章大纲开始,然后尝试让 AI 扩展某些段落或提供相关数据支持。 3. 多语言内容探索:如果您有兴趣拓展国际市场,可以尝试使用 AI 辅助翻译和本地化您的内容。从一篇博文开始,逐步扩大到更多内容。 4. 优化 SEO:利用 AI 工具分析您的内容,获取 SEO 优化建议。尝试根据 AI 的建议调整标题、元描述和关键词使用。
2024-09-12
人工智能发展前景
人工智能的发展前景十分广阔。 在日常生活中,我们已经能感受到人工智能的普及,比如交通、天气预测以及电视节目推荐等方面,它正以惊人的速度发展,使计算机能够以过去难以想象的方式观察、理解世界并与之互动。 从未来进化的角度看,当计算机在各项任务上超过人类时,可能会在不断改进的过程中导致超级智能的出现。届时,机器可能会具有自我意识和超级智能,成为真正的数字生命形式,这将带来关于机器意识、物种竞争等一系列有趣且重要的问题。 在产业发展方面,人工智能是引领新一轮科技革命和产业变革的基础性和战略性技术,正加速与实体经济深度融合,深刻改变工业生产模式和经济发展形态。其产业链包括基础层(算力、算法和数据)、框架层(用于模型开发的深度学习框架和工具)、模型层(大模型等技术和产品)、应用层(在行业场景的应用)等 4 个部分。近年来,我国人工智能产业在技术创新、产品创造和行业应用等方面实现快速发展,形成庞大市场规模。伴随以大模型为代表的新技术加速迭代,人工智能产业呈现出创新技术群体突破、行业应用融合发展、国际合作深度协同等新特点,亟需完善人工智能产业标准体系。
2024-09-18
人工智能发展前景
人工智能的发展前景十分广阔。 在日常生活中,我们已经能感受到人工智能的普及,如交通、天气预测和电视节目推荐等方面,它正以惊人速度发展,使计算机能以过去难以想象的方式观察、理解和与世界互动。 对于未来,当计算机在各项任务上超过人类时,可能会出现超级智能,机器可能会具有自我意识,成为真正的数字生命形式。这将带来关于机器意识、物种竞争等一系列有趣且重要的问题。 从产业角度看,人工智能是引领科技革命和产业变革的基础性和战略性技术,加速与实体经济深度融合,改变工业生产和经济发展形态,对建设制造强国、网络强国和数字中国有重要支撑作用。其产业链包括基础层、框架层、模型层和应用层,近年来在技术创新、产品创造和行业应用等方面快速发展,形成庞大市场规模。随着以大模型为代表的新技术加速迭代,呈现出创新技术群体突破、行业应用融合发展、国际合作深度协同等新特点,也亟需完善产业标准体系。
2024-09-18
人工智能发展前景
人工智能的发展前景十分广阔。 在日常生活中,我们已经能感受到人工智能的普及,比如交通、天气预测以及电视节目推荐等方面,它正以惊人的速度发展,使计算机能够以过去难以想象的方式观察、理解世界并与之互动。 从未来进化的角度看,当计算机在各项任务上超过人类时,可能会在不断改进的过程中导致超级智能的出现。届时,机器可能具有自我意识和超级智能,我们对机器意识的概念将发生重大转变,甚至会出现真正的数字生命形式。这也带来了一系列有趣的问题,如 DILIs 和人类之间合作与竞争的基础,以及对具有自我意识的 DILIs 模拟疼痛是否构成折磨等。 在产业发展方面,人工智能是引领新一轮科技革命和产业变革的基础性和战略性技术,加速与实体经济深度融合,改变工业生产模式和经济发展形态,对建设制造强国、网络强国和数字中国发挥重要支撑作用。其产业链包括基础层(算力、算法和数据)、框架层(用于模型开发的深度学习框架和工具)、模型层(大模型等技术和产品)、应用层(在行业场景的应用)。近年来,我国人工智能产业在技术创新、产品创造和行业应用等方面快速发展,形成庞大市场规模。随着以大模型为代表的新技术加速迭代,人工智能产业呈现出创新技术群体突破、行业应用融合发展、国际合作深度协同等新特点,也亟需完善产业标准体系。
2024-09-18
人工智能发展前景
人工智能的发展前景十分广阔。 在日常生活中,我们已与人工智能频繁互动,如交通、天气预测和电视节目推荐等,其普及程度和发展速度令人惊叹,使计算机能以过去难以想象的方式观察、理解和与世界互动。 从进化的角度看,当计算机在各项任务上超越人类后,可能会在不断改进的螺旋中发展出超级智能,甚至可能出现具有自我意识的数字生命形式,这将带来关于机器意识、物种竞争等一系列有趣且重要的问题。 在产业方面,人工智能是引领科技革命和产业变革的基础性和战略性技术,加速与实体经济深度融合,改变工业生产和经济发展形态,对建设制造强国、网络强国和数字中国意义重大。其产业链包括基础层(算力、算法和数据)、框架层(深度学习框架和工具)、模型层(大模型等)和应用层(行业场景应用),近年来在技术创新、产品创造和行业应用等方面快速发展,形成庞大市场规模。随着以大模型为代表的新技术加速迭代,呈现出创新技术群体突破、行业应用融合发展、国际合作深度协同等新特点,也亟需完善产业标准体系。
2024-09-18
人工智能发展前景
人工智能的发展前景十分广阔。 在日常生活中,我们已经能感受到人工智能的普及,比如交通、天气预测以及电视节目推荐等方面,它正以惊人的速度发展,使计算机能够以过去难以想象的方式观察、理解世界并与之互动。 从未来进化的角度看,当计算机在各项任务上超过人类时,可能会在不断改进的过程中导致超级智能的出现,甚至可能出现具有自我意识和超级智能的数字生命形式,这将带来一系列关于意识、合作与竞争等方面的重大转变和问题。 在产业发展方面,人工智能是引领新一轮科技革命和产业变革的基础性和战略性技术,正加速与实体经济深度融合,深刻改变工业生产模式和经济发展形态,对建设制造强国、网络强国和数字中国发挥重要支撑作用。其产业链包括基础层(算力、算法和数据)、框架层(深度学习框架和工具)、模型层(大模型等)、应用层(行业场景应用)等部分。近年来,我国人工智能产业在技术创新、产品创造和行业应用等方面快速发展,形成庞大市场规模。随着以大模型为代表的新技术加速迭代,人工智能产业呈现出创新技术群体突破、行业应用融合发展、国际合作深度协同等新特点,也亟需完善产业标准体系。
2024-09-18
人工智能发展前景
人工智能的发展前景十分广阔。 在日常生活中,我们已经能在交通、天气预测、电视节目推荐等方面与人工智能进行互动,且其普及程度和发展速度令人惊叹,使计算机能够以过去难以想象的方式观察、理解和与世界互动。 从未来进化的角度看,当计算机在各项任务上超越人类时,可能会在不断改进的螺旋中导致超级智能的出现,甚至可能出现具有自我意识和超级智能的数字生命形式,这将带来关于机器意识、物种竞争等一系列有趣且重要的问题。 在产业方面,人工智能是引领新一轮科技革命和产业变革的基础性和战略性技术,正与实体经济深度融合,改变工业生产模式和经济发展形态,对建设制造强国、网络强国和数字中国有重要支撑作用。其产业链包括基础层(算力、算法和数据)、框架层(深度学习框架和工具)、模型层(大模型等)、应用层(行业场景应用),近年来在技术创新、产品创造和行业应用等方面快速发展,形成庞大市场规模。随着以大模型为代表的新技术加速迭代,呈现出创新技术群体突破、行业应用融合发展、国际合作深度协同等新特点,也亟需完善产业标准体系。
2024-09-18
Ai最新进展
AI 技术的发展历程如下: 1. 早期阶段(1950s 1960s):包括专家系统、博弈论、机器学习初步理论。 2. 知识驱动时期(1970s 1980s):有专家系统、知识表示、自动推理。 3. 统计学习时期(1990s 2000s):出现了机器学习算法,如决策树、支持向量机、贝叶斯方法等。 4. 深度学习时期(2010s 至今):深度神经网络、卷积神经网络、循环神经网络等得到广泛应用。 当前 AI 的前沿技术点包括: 1. 大模型,如 GPT、PaLM 等。 2. 多模态 AI,例如视觉 语言模型(CLIP、Stable Diffusion)、多模态融合。 3. 自监督学习,包含自监督预训练、对比学习、掩码语言模型等。 4. 小样本学习,如元学习、一次学习、提示学习等。 5. 可解释 AI,涉及模型可解释性、因果推理、符号推理等。 6. 机器人学,包括强化学习、运动规划、人机交互等。 7. 量子 AI,有量子机器学习、量子神经网络等。 8. AI 芯片和硬件加速。 此外,绿洲资本张津剑认为 AI 技术正在加速发展,并且没有看到任何减缓的迹象。尽管媒体报道可能有所减少,但 AI 的实际进展非常迅速。
2024-09-03
国内医疗行业的大模型有哪些,关于慢性病领域的有和进展
在国内医疗行业,大模型的应用主要涵盖疾病的诊断与预测、药物研发以及个性化医疗等方向。目前很多医疗研究机构都在进行医疗大模型的开发研究。 在慢性病领域,AI 随访/答疑助手方面有一定进展。例如腾讯健康智能随访、讯飞家庭医生随访系统等随访系统,目前主要起到数据库的作用,记录患者信息等,主要的随访和答疑工作仍由医护人员完成,但随着就诊人数增长,工作量超负荷。大模型为这类产品提供了基础,预计短期内能够实现 AI 提供大部分建议,医生护士做少量修改即可发送,不过仍需要按照科室进行精调,如骨科关注康复进度、疼痛发炎情况,肿瘤关注用药指导、药品之间的相互作用等。
2024-08-28
LLM写ABAP代码的最新进展
大型语言模型(LLM)在编写ABAP代码方面的能力正在不断提升。ABAP(高级业务应用编程)是SAP系统的编程语言,专门用于开发企业资源规划(ERP)软件。以下是一些LLM编写ABAP代码的最新进展: 1. 代码生成:LLM可以基于自然语言描述生成ABAP代码片段,帮助开发者快速实现特定功能。 2. 代码补全:通过机器学习技术,LLM能够预测并补全ABAP代码,提高开发效率。 3. 代码审查:LLM可以分析ABAP代码,识别潜在的错误和不规范的编程实践。 4. 文档生成:LLM能够根据ABAP代码自动生成文档,包括函数描述、参数说明等。 5. 模式识别:LLM可以识别ABAP编程中的常见模式和最佳实践,并在代码生成时应用这些模式。 6. 交互式学习:一些LLM提供交互式学习环境,帮助开发者通过实例学习ABAP编程。 7. 集成开发环境(IDE)插件:LLM技术被集成到ABAP开发工具中,提供智能代码提示和错误检测。 8. 自动化测试:LLM可以生成测试用例,帮助自动化ABAP代码的测试过程。 9. 性能优化:LLM可以分析ABAP代码的性能瓶颈,并提出优化建议。 10. 跨语言能力:一些LLM能够理解多种编程语言的概念,并将其应用于ABAP代码的编写。 然而,尽管LLM在编写ABAP代码方面取得了进展,但它们仍然面临一些挑战,例如: 领域特定知识:ABAP是一种领域特定的语言,需要对SAP系统有深入的理解。 复杂逻辑处理:企业级应用的逻辑可能非常复杂,LLM需要能够处理这些复杂性。 代码维护性:自动生成的代码需要易于理解和维护。 随着技术的发展,LLM在ABAP编程领域的应用将越来越广泛,但它们可能仍然需要与人类开发者合作,以确保生成的代码既高效又可靠。
2024-08-05
最新的 RAG 进展和业界实践
以下是关于最新的 RAG 进展和业界实践的详细介绍: RAG 是检索增强生成(Retrieval Augmented Generation)的简称,是当前最火热的企业级 LLM 应用方案。概括来说,它是知识检索与内容生成的结合,就像大模型的开卷考试,谁的资料更全、翻找更快更准,结果往往更好。 Lewis 等人(2021)提出了一个通用的 RAG 微调方法,使用预训练的 seq2seq 作为参数记忆,用维基百科的密集向量索引作为非参数记忆,并通过神经网络预训练的检索器访问。RAG 在 Natural Questions、WebQuestions 和 CuratedTrec 等基准测试中表现出色,用 MSMARCO 和 Jeopardy 问题进行测试时,生成的答案更符合事实、更具体、更多样,FEVER 事实验证使用 RAG 后也得到了更好的结果,这表明 RAG 是一种可行的方案,能在知识密集型任务中增强语言模型的输出。 目前,大部分公司倾向于使用 RAG 方法进行信息检索,因为相比长文本的使用成本,使用向量数据库的成本更低。在 RAG 应用中,一些公司会使用微调的 Embedding Model 增强检索能力,也有些公司会选择使用知识图谱或者 ES 等非向量数据库的 RAG 方法。一个正常的模型使用 RAG 仍是当前主流。由于大语言模型存在信息滞后和不包含业务知识的特点,常需外挂知识库协助解决问题,此时 Embedding 模型的召回效果直接影响大模型的回答效果,所以很多场景下需要微调 Embedding 模型提高召回效果。 最近,基于检索器的方法越来越流行,常与 ChatGPT 等流行 LLM 结合使用来提高其能力和事实一致性。例如,在 LangChain 文档中可以找到一个使用检索器和 LLM 回答问题并给出知识来源的简单例子。 此外,来自马里兰大学、劳伦斯利弗莫尔国家实验室、纽约大学的研究学者提出了一个大模型微调的方法,在微调时只需要在 Embedding 层上加随机噪声即可大幅度提升微调模型的对话能力,且不会削弱模型的推理能力。用 Alpaca 微调 LLaMA27B 可以在 AlpacaEval 上取得一定表现,而用加了噪声的嵌入则表现更佳,不过该工作只在较小的模型上进行微调。
2024-07-26
大模型生成UI方向进展
根据搜索结果,大模型在生成 UI 设计方面取得了以下进展: 1. 出现了专门针对 UI 设计的生成式 AI 工具,如"即时 AI"。这类工具可以根据文字描述快速生成可编辑的 UI 设计稿,大大提高了设计效率。 2. 国内外都有相关的大模型产品在发展,如 OpenAI 的 GPT4、百度的文心一言等。这些大模型在理解语义、生成内容等方面不断进步,为 UI 设计工具提供了强大的基础能力。 3. 新一代的生成式 UI 设计工具,如 Galileo AI,已经开始支持对生成结果进行自定义样式调整,如颜色、字体、圆角等。这种交互式的设计流程更符合实际需求。 4. 大模型生成 UI 设计的方向正在从单纯的内容生成,向交互式的设计协作模式发展。用户可以通过对话方式不断优化设计,大大提高了设计质量。 5. 总的来说,大模型技术正在推动 UI 设计工具从静态内容生成向动态、可交互的方向发展。未来设计师可以更高效地利用 AI 辅助完成设计工作。 综上所述,大模型在 UI 设计领域取得了显著进展,为设计师提供了更强大的创作工具和方法。这一趋势值得持续关注和研究。
2024-04-23
GPT4最新进展
GPT4是OpenAI开发的大型多模态语言模型,它能够接受图像和文本输入,并产生文本输出。以下是GPT4的一些最新进展: 1. GPT4 Turbo的发布:OpenAI推出了GPT4 Turbo的预览版,这是一个更强大的模型,它了解截至2023年4月的世界事件。GPT4 Turbo具有128K的上下文窗口,可以处理相当于300多页文本的输入。相比于GPT4,GPT4 Turbo在性能上进行了优化,提供了更低的价格,输入token价格降低了3倍,输出token价格降低了2倍。 2. 功能和性能提升:GPT4 Turbo支持多模态API调用,包括视觉功能和DALL·E 3 API。它还在指令跟随和JSON模式方面进行了改进,提供了更高的准确性和更有效的JSON格式输出。 3. 可重复输出和对数概率:GPT4 Turbo引入了新的seed参数,允许模型返回大部分时间一致的完成,这对于调试请求和编写单元测试非常有用。OpenAI还计划推出一个功能,返回最可能输出的令牌的对数概率,这将对构建搜索体验中的自动完成等功能非常有用。 4. GPT3.5 Turbo更新:除了GPT4 Turbo之外,OpenAI还发布了GPT3.5 Turbo的新版本,支持16K的上下文窗口,并改进了指令跟随、JSON模式和并行函数调用。 5. 助手API和新模态:OpenAI发布了助手API,允许开发者在自己的应用程序中构建Agent类体验。GPT4 Turbo可以通过Chat Completions API接受图像输入,实现生成标题、详细分析现实世界的图像以及阅读带有图表的文档等功能。 6. 技术报告:OpenAI发布了GPT4的技术报告,详细介绍了模型的开发、性能、能力和局限性。GPT4在多项专业和学术基准测试中展现出人类水平的表现,包括通过模拟律师资格考试并在SAT考试中取得高分。 7. 安全性和可靠性:尽管GPT4在性能上取得了显著进步,但它仍然存在一些局限性,例如可能产生不准确的信息(俗称“幻觉”)和有限的上下文窗口。OpenAI在模型开发过程中注重安全性,以减少潜在的风险。 8. 企业级服务:Azure OpenAI服务发布了企业级可用的GPT4国际预览版,允许企业构建自己的应用程序,并利用生成式AI技术提高效率。 9. 价格降低和速率限制提高:OpenAI降低了API价格,以将节省的费用传递给开发者,并提高了每分钟的令牌限制,以帮助开发者扩展应用程序。 10. 版权保护:OpenAI推出了版权保护措施,如果客户面临版权侵权的法律索赔,OpenAI将介入保护客户并支付相关费用。 这些进展显示了GPT4在多模态能力、性能优化、安全性和企业级应用方面的持续发展和创新。随着GPT4的不断改进和新功能的推出,它在自然语言处理领域的应用潜力将进一步扩大。
2024-04-22