直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

现在AI开展到了什么水平?国内外AI发展差距有多大?

回答

目前,AI 在多个领域取得了显著进展。在 2024 年内,图片和超短视频的精细操控能力将得到提升,包括表情、细致动作和视频-文字匹配等方面。生成式短视频将具备一定操控能力,风格化和动漫风将最先成熟,真人风格稍晚。AI 音频能力也将有长足进展,带感情的 AI 配音基本成熟。“全真 AI 颜值网红”将出现,可以稳定输出视频并进行直播带货。游戏 AI NPC 将有里程碑式进展,带来新的游戏生产方式。AI 男/女朋友聊天将基本成熟,在记忆方面有明显突破,能够较好模拟人的感情,产品将加入视频和音频,粘性提升并开始出圈。实时生成的内容将开始在社交媒体内容和广告中出现。AI Agent 将有明确进展,办公场景中的“AI 助手”将开始有良好使用体验。AI 的商业模式也将开始有明确用例,如数据合成、工程平台和模型安全等。可穿戴全天候 AI 硬件将层出不穷,但大多数可能不会成功。中国 AI 有望达到或超过 GPT4 水平,美国可能会出现 GPT5,世界上可能会出现“主权 AI”。华为昇腾生态将开始形成,国内推理芯片将开始国产替代。然而,AI 造成的 DeepFake、诈骗和网络攻击等问题也将开始进入公众视野,并引发担忧。AI 立法和伦理讨论仍然大规模落后于技术进展。

从全球范围来看,美国和中国在 AI 领域处于领先地位。根据《全球人工智能指数》,美国以 100 分的绝对优势稳坐第一位,中国以近 62 分的得分位居第二。在创新、投资等主要指标中,中美差距也较为明显。不过,随着技术的不断发展,其他国家也在加大对 AI 的投入和研究,未来的发展格局仍存在变数。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

AGI 万字长文(下)| 2024,分叉与洪流

2024年内图片-超短视频的精细操控:表情、细致动作、视频-文字匹配有一定操控能力的生成式短视频:风格化、动漫风最先成熟;真人稍晚AI音频能力长足进展:带感情的AI配音基本成熟“全真AI颜值网红”出现,可以稳定输出视频,可以直播带货游戏AI NPC有里程碑式进展,出现新的游戏生产方式AI男/女朋友聊天基本成熟:记忆上有明显突破,可以较好模拟人的感情,产品加入视频音频,粘性提升并开始出圈实时生成的内容开始在社交媒体内容、广告中出现AI Agent有明确进展,办公场景“AI助手”开始有良好使用体验2AI的商业模式开始有明确用例:数据合成、工程平台、模型安全等可穿戴-全天候AI硬件层出不穷,虽然大多数不会成功中国AI达到或超过GPT4水平;美国出现GPT5;世界上开始现“主权AI”华为昇腾生态开始形成,国内推理芯片开始国产替代(训练替代要稍晚)AI造成的DeepFake、诈骗、网络攻击等开始进入公众视野,并引发担忧AI立法、伦理讨论仍然大规模落后于技术进展……2025-2027AI 3D技术、物理规则成熟:正常人无法区别AI生成还是实景拍摄

AGI 万字长文(下)| 2024,分叉与洪流

AGI将对于全行业科技发展起到推动作用。这点目前仅仅是苗头,但AGI在各领域的科研中越来越重要是既定的事实。以及,如果AGI的能力有比较大差距,对于科技进步-经济发展将产生质变性的影响。有更好AGI的国家会有更快的全面技术进步。对于AI的立法、监管、伦理讨论大范围落后于技术发展。全世界主要国家都急于拥有有自己的AI,当然不会有人搬起石头砸自己的脚。目前唯一有点对于AI治理讨论的只有欧洲,而且也都在纸面上。我国相关法规讨论的出发点完全在于“对于舆论的影响”,根本没有触及AGI本身的伦理问题。决策路径大概是政治>经济>>AI伦理。更远的判断,只能让时间检验。

4.6 历史更新

《[全球人工智能指数](https://waytoagi.feishu.cn/record/LzUirp0PveFtuQcYoXdc4sCOnCh)》是去年年中由英国权威统计机构Tortoise Media发布,美国、中国分列全球AI赛道的第一位和第二位,远远超过名列3-5位的新加坡、英国和加拿大。不过,美国以100分的绝对优势稳坐第一位,中国以近62分的得分位居第二;此外,在创新、投资等主要指标中,中美差距也较为明显。该网站的数据可视化做得非常精美,值得收藏。《[李飞飞、吴恩达对谈:这一次,AI冬天不会到来](https://waytoagi.feishu.cn/record/H4ACrFOGmeW0jfcR6Rdc7nzwn0d)》来自极客公园的报道,在CES 2024上,吴恩达和李飞飞讨论了人工智能的发展和应用。他们认为,2024年将是人工智能技术深化和应用拓展的一年,将成为下一次数字革命或工业革命的驱动力。他们都认为,这次人工智能浪潮不会像过去的一次一样进入低谷。

其他人在问
去ai味
要去除 AI 味,可以从以下几个方面入手: 1. 对于聊天 AI,使其变得不正经、放肆、幽默、通俗。注意语气的自然化,比如使用语气词嗯、吧、啊、哈哈哈等,让回答更自然、贴近日常对话风格。还要注意口语化词语(相对于书面语)的使用,不过增加网络语言语料库需谨慎,以免生搬硬套带来副作用。 2. 对于睿声生成的配音,若语速慢有 AI 味儿,可使用剪映的音频变速功能加速配音,以消除 AI 味儿并配合视频前段的快节奏。 3. 对于 GPT 的回复,避免其用 1、2、3、4 或“首先、其次、最后”这种模式,可让其扮演特定角色并给出明确输出要求。但这种方法可能换汤不换药,要想让其更有趣,可让它在回复中加点感情,比如用括号补充动作,营造特定环境等。
2024-09-19
可以建立知识库的ai有哪些
以下是一些可以建立知识库的 AI 工具和平台: 1. 飞书软件:例如“通往 AGI 之路”,您可以在飞书大群中与机器人对话获取对应的资料。 2. Coze:在“大圣:胎教级教程:万字长文带你使用 Coze 打造企业级知识库”中有相关介绍。 3. Mem:如 https://get.mem.ai/ ,它可以保存组织中每次会议的记录,并在人们开始新项目时主动建议相关的决策、项目或人员,节省时间。 4. GPT:通过 OpenAI 的 embedding API 解决方案,可以搭建基于 GPT API 的定制化知识库,但需要注意其免费版 ChatGPT 一次交互的容量限制。
2024-09-19
notion ai的功能
Notion AI 具有以下功能: 直接在 Notion 中接入 AI 的能力,能让工作更迅速,写作更出色,思考更伟大。 可以在笔记和文档中应用 AI 的力量。 能够实现 AI 数据库自动填充功能。 可以改变知识管理的方式,让人们摆脱繁琐的信息组织工作,用户只需简单地将信息丢到 Notion 中,就可以通过各种方式进行检索。
2024-09-19
PopAI的功能
PopAI 是一款办公效率工具,具有以下功能: 1. 类似 ChatGPT 的聊天功能。 2. 集成了众多工作中可用的效率工具,如 PPT 和流程图生成、提示生成等。 3. 率先集成了 GPT4V 的图像 API 且调教良好,能清晰解释图像相关内容。 4. 具有创新的交互,在回答内容后可进行如翻译为中文、扩写重新排版并添加内容变为一篇文章等“Enrich”操作。 5. “Enrich”操作不仅不是干巴巴的填充,还会配合相关图片,必要时绘制流程图。
2024-09-19
popai 的功能
Poe 是一个 AI 聊天网站,支持与多个智能 AI 机器人(如 GPT4 等)进行实时在线交流。注册账号后可免费使用,部分功能需要付费订阅。不同的 AI 机器人有不同特点,可根据需求选择使用。总体而言,Poe 为用户提供了便捷的智能对话体验。其官网地址是:https://poe.com/ ,在官网帮助中心上可以找到具体教程。 此外,Poe 平台还推出了其他多种功能,比如多个机器人一起聊天、文件上传和视频输入等。Odyssey 是一个能提供好莱坞级别的 AI 视频生成和编辑工具的项目。PaintsUndo 可以输入静态图像自动生成整个绘画的全过程视频,该项目主要研究和再现数字绘画中的绘画行为,为数字艺术创作提供新的工具和方法。更多详细介绍可参考:https://xiaohu.ai/p/10996 、https://x.com/imxiaohu/status/1810574723048489063 、https://xiaohu.ai/p/11005 、https://x.com/imxiaohu/status/1810589354114626008 、https://xiaohu.ai/p/11010 、https://lllyasviel.github.io/pages/paints_undo/
2024-09-19
可用于记笔记的ai有哪些
以下是一些可用于记笔记的 AI 相关产品: 1. MeetRecord:这是一家专注于销售通话记录和辅导的软件公司。其核心功能包括 AI 驱动的笔记记录,能通过人工智能技术自动记录和分析销售通话,提供会议内容的关键词和主题分析,自动生成会议纪要和行动项;还有个性化辅导计划,能生成个性化的辅导计划,模仿表现最好的销售人员,并实施自动呼叫评分系统;此外,还具备交易智能和推荐、CRM 自动化、多语言支持以及安全性与企业化支持等功能。 2. 目前没有更多明确提及专门用于记笔记的其他 AI 产品的相关信息。但在一些关于人工智能的讨论中,提到了手写笔记对于信息留存和思维培养的重要性,例如在关于防止 AI 取代人类思考的论述中,指出手写笔记有助于将信息从短期记忆转移到长期记忆,成为更好的概念思考者。
2024-09-19
llama.cpp处理过的模型可以有多大程度的提升
在计算机科学领域,特别是在机器学习和人工智能方面,性能的提升可以有多种方式。对于 llama.cpp处理过的模型,可能的提升可以包括但不限于以下几个方面: 1. 模型精度提升:通过改进模型结构、调整超参数、增加训练数据量等方式,可以提高模型的预测准确性和泛化能力。这样的提升可以使得模型在实际应用中取得更好的效果。 2. 模型速度提升:通过优化模型的计算效率、减少模型的复杂度、使用更高效的算法等方式,可以提高模型的推理速度和训练速度。这样的提升可以使得模型在实时应用和大规模数据处理中更具竞争力。 3. 模型规模提升:通过增加模型的容量、引入更多的特征或上下文信息、使用集成学习等方式,可以提升模型的表达能力和适应性,使得模型可以处理更复杂的任务和更丰富的数据。 4. 模型可解释性提升:通过改进模型的可解释性、增加模型的解释性特征、使用可解释的模型结构等方式,可以提高模型对决策过程的透明度和可理解性,增强模型在实际应用中的可信度和可接受性。 5. 模型稳定性提升:通过改进模型的鲁棒性、增加模型的泛化能力、引入鲁棒的训练和评估方法等方式,可以提高模型在不同数据分布和环境条件下的稳定性和可靠性,减少模型在实际应用中出现的意外情况和错误。 这些提升可以单独或者组合起来实现,取决于具体的应用场景、数据特征、任务要求和资源限制等因素。通过不断改进和优化,llama.cpp处理过的模型可以在性能上取得更大程度的提升,从而更好地满足实际需求。
2024-04-18
国内外好用的图生视频模型
以下是一些国内外好用的图生视频模型: 可灵(国内,免费) 网址:https://klingai.kuaishou.com/ 支持文生视频、图生视频。 支持图生视频首尾帧功能。 提示词可使用中文。 文生视频支持正向提示词、反向提示词、运镜控制、时长选择(5s、10s),支持 16:9、9:16、1:1 尺寸。 图生视频除了不可运镜控制以外,其他跟文生视频基本相同。 默认生成 5s 的视频。 ETNA(国内) 网址:https://etna.7volcanoes.com/ 由七火山科技开发的文生视频 AI 模型。 可以根据用户简短的文本描述生成相应的视频内容。 生成的视频长度在 8 15 秒,画质可达到 4K,最高 38402160,画面细腻逼真,帧率 60fps。 文生视频,支持中文,时空理解。 关于可灵的文生视频效果,测试者 Austin 周安鑫进行了以下测试: 1. 场景识别:包括室内和室外,如客厅的沙发、液晶电视、漂亮的波斯猫、超现实主义的蜿蜒河流、茂密森林、灿烂花海、碧绿草坪等。 2. 物体识别:涵盖静态和动态物体,如水晶球、跳动的火焰、翱翔的飞鸟、闪烁的流星、飞溅的水珠等。 3. 人物识别:包括面部和姿态,如一个人笑容灿烂、一个人惊恐愤怒,一位芭蕾舞女孩在冰面上跳舞等。 4. 动作识别:包含基本和复杂动作,如短跑运动员快速奔跑、赛车手驾驶跑车激烈漂移等。 5. 事件检测:有简单和复杂事件,如一位帅哥在喝水、外星文明和地球进行星际大战等。 6. 环境变化:涉及光线和天气,如奇幻的极光舞动变幻、城市写字楼灯光忽明忽暗、闪电交加、乌云密布、台风、大雨等。 7. 多对象场景:包括单一和多对象场景,如 1 个飞行员驾驶战斗机翱翔太空、海军指挥航母战斗群展开激烈战斗等。 8. 特殊场景:有遮挡和非标准场景,如城市大雾遮挡摩天大楼、一边是神秘海底世界,一边是梦幻糖果屋。 9. 细节检测:包含小物体和微表情,如崭新的苹果电脑屏幕上播放电影、瞳孔收缩、脸颊泛红、嘴唇微微颤抖。
2024-09-19
关于大模型技术体系、国内外应用研究希望有一段内容总结给我
以下是关于大模型技术体系、国内外应用研究的总结: 大模型技术体系: Embedding(嵌入):是一个浮点数的向量,用于度量相关性,有词、句子、文档、图像等分类。在大模型中有重要价值,可从数据集中获取结果并保存为 csv 文件。 模型架构:多模态大模型架构分为模态编码器、输入投影器、语言模型骨干、输出投影器和模态生成器等部分,不同架构有不同的应用和实现选择。 训练流程:包括多模态预训练和多模态指令微调两个阶段。 架构分类:如 encoderonly 适用于自然语言理解任务,encoderdecoder 用于理解和生成内容,decoderonly 擅长自然语言生成任务。 大模型的特点: 预训练数据量大,来自互联网上的多种来源,如论文、代码、公开网页等,通常以 TB 级别计。 参数众多,如 GPT3 已达 170B 的参数。 国内外应用研究: 企业级应用开发涉及利用开源的 Embedding 模型、向量数据库做检索增强生成(RAG),以及购买 GPU 服务器搭建企业级大模型项目。 对多模态大模型从模型架构、训练数据集规模等多维度进行对比,总结提升模型效果的重要训练方法,并探讨未来发展的 5 大方向,包括构建更强大的模型、设计更具挑战性的评估集、移动端/轻量级部署、具备实体性的智能和持续性指令调整。
2024-09-13
有去了解哪些国内外的Agent产品?详细讲讲其中一个
国内外有多个 Agent 产品,以下为您详细介绍其中一些: 1. 扣子(coze.cn):是国内的新一代一站式 AI Bot 开发平台,适用于构建基于 AI 模型的各类问答 Bot,集成了丰富的插件工具,可拓展 Bot 的能力边界。 2. Coze(coze.com):海外版的 Agent 平台。 3. 百度 AppBuilder:百度推出的相关平台。 4. 阿里通义千问:具有一定特色和功能。 5. 智谱 AI:在 AI 领域有一定影响力。 此外,还有以下一些 Agent 构建平台: 1. Microsoft 的 Copilot Studio:主要功能包括外挂数据、定义流程、调用 API 和操作,以及将 Copilot 部署到各种渠道。 2. 文心智能体:百度推出的基于文心大模型的智能体平台,支持开发者根据自身需求打造产品能力。 3. MindOS 的 Agent 平台:允许用户定义 Agent 的个性、动机、知识,以及访问第三方数据和服务或执行设计良好的工作流。 4. 斑头雁:2B 基于企业知识库构建专属 AI Agent 的平台,适用于客服、营销、销售等多种场景,提供多种成熟模板,功能强大且开箱即用。 5. 钉钉 AI 超级助理:依托于钉钉强大的场景和数据优势,提供更深入的环境感知和记忆功能,在处理高频工作场景如销售、客服、行程安排等方面表现出色。 在 ToC 领域,目前成体系的主要有以下几类产品: 1. 主打 AI 角色扮演赛道的产品,例如“猫箱”“剧本戏”“名人朋友圈”这类,在 LLM 基础上,在 prompt 上加了些特定角色定义。 2. 主打 AI 陪伴类的产品,例如“星野”“Talkie”“BubblePal”等,这类产品在 LLM 基础上,在 prompt 上加了些特定角色定义,且会在长短记忆上做出处理,以突出陪伴意义。随着陪伴时间越久,知识库沉淀的个性化记录越丰富,AI 也会越懂您。 3. 做 AI 搜索工具的产品,例如“秘塔”“360 搜索”等,这类产品多为 RAG,也有会在搜索内容基础上,把内容结构化,整出一个图谱或者脑图。 4. 单纯的做 AIGC 的产品,例如“可灵”“ai 写作手”“即梦”“md”等,借助 AI 的生成能力做出。 5. Agent 产品,目前只有头部的厂商在做,比如字节的扣子,支付宝的智能助理,百度的文心智能体,腾讯的元宝。
2024-09-04
国内外的智能体平台都有哪些?尽可能罗列出来
国内外的智能体平台有: 国内:Dify.AI、字节扣子、腾讯元器。 需要注意的是,个人比较常用的国内智能体平台是字节扣子,相关文章主要对比了字节扣子和腾讯元器。智能体相当于个人的数字员工,可以不断提效,帮助实现制定的目标,这和现实中老板给员工下达任务有相似之处。
2024-08-31
你好:目前国内外哪款绘画AI工具最好?
目前国内外有很多热门的 AI 绘画工具,其中 Midjourney 是一款备受关注的工具。 Midjourney 具有以下特点: 1. 容易上手,对于完全不懂 AI 绘图的新手来说是不错的入门选择。 2. 现阶段的 AI 能辅助进行设计,视觉效果相当吸睛。 3. 模型强大,能生成高质量的图像,且支持用户充分的个性化设置。 然而,Midjourney 也存在一些不足: 1. 使用过程不够便捷,需要通过 Discord 应用加入 Midjourney 的频道,或者创建自己的频道并邀请 Midjourney 机器人,才能开始生成图片。 2. 在用户体验和易用性方面还有待改进,没有帮助用户解决“最后一公里”的问题,学习曲线较陡峭。
2024-08-19
国内外大模型测评
以下是关于国内外大模型测评的相关内容: 在 2023 年度的中文大模型基准测评中: 国内外大模型总体表现方面,90.63 分遥遥领先,高于其他国内大模型及国外大模型。国内最好模型文心一言 4.0(API)总分 79.02 分,距离 GPT4Turbo 有 11.61 分,距离 GPT4(网页)有 4.9 分的差距。过去 1 年国内大模型有长足进步,综合能力超过 GPT 3.5 和 GeminiPro 的模型有 11 个,如百度的文心一言 4.0、阿里云的通义千问 2.0 和 Qwen 72BChat、OPPO 的 AndesGPT、清华&智谱 AI 的智谱清言、字节跳动的云雀大模型等。在 SuperCLUE 测评中,国外模型平均成绩为 69.42 分,国内模型平均成绩为 65.95 分,差距在 4 分左右,且国内外平均水平差距在缩小,11 月差距在 10 分左右。阿里云的 Qwen72B、Yi 34BChat 均优于 Llama213BChat。 国内大模型竞争格局方面,从大厂和创业公司的平均成绩来看,大厂与创业公司差值约 6.33 分,较 11 月份差距在增大,说明大厂在大模型竞争中长期资源投入方面有一定优势。过去八个月国内模型在 SuperCLUE 基准上的前三名情况如下:12 月和 11 月的第一名是文心一言 4.0,10 月第一名是 BlueLM,9 月第一名是 SenseChat3.0,8 月第一名是 Baichuan213BChat,7 月第一名是文心一言(网页 v2.2.0),6 月第一名是 360 智脑,5 月第一名是 360 智脑。第二名在不同月份分别是通义千问 2.0、Moonshot 等。 主观和客观对比方面,通过对比模型在主观简答题 OPEN 和客观选择题 OPT 上的不同表现,国内大模型多数擅长做选择题,普遍选择题分数高于简答题分数。文心一言 4.0 和智谱清言表现相对稳定,分别为(13.38)和(14.01),GPT4 Turbo 的表现最为稳定,差值仅有 0.86。SuperCLUE 认为,客观题相对主观题更容易通过题库形式进行训练和提升,同时由于客观题中包含中文特性问题,中文模型有一定优势,应综合来看模型的评测效果。国外的代表性大模型如 GPT4 的不同版本、Claude2、Llama2 都有很好的稳定性表现,值得国内大模型进一步分析研究。
2024-08-15