直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

近几个月,中国AI行业有什么重要进展?

回答

以下是近几个月中国 AI 行业的一些重要进展:

  • 过去 12 个月,人工智能行业流量增长显著。2022 年 9 月研究起始时,分析的工具产生 2.418 亿次访问,到 2023 年 8 月达到 28 亿次访问量。
  • 从去年 11 月 ChatGPT 成为最快达到 100 万用户的平台后,行业热度持续攀升,2023 年 5 月访问量达到约 41 亿的峰值。
  • 2023 年上半年国内笃信靠资金和卡能发展类 GPT 架构,但下半年纷纷转向“垂直应用”“商业化”,不提 AGI。目前国内最领先的模型水平大概在准 ChatGPT3.5 水平,和 GPT4 有差距。
  • 百度的“文心 4.0”是当前国内能力较好的模型之一,即将发布的阿里的“通义千问”。
  • 中国开源项目在今年赢得全球粉丝,成为积极开源贡献者。DeepSeek 在编码任务中表现出色,阿里巴巴发布的 Qwen-2 系列视觉能力令人印象深刻,清华大学的自然语言处理实验室资助的 OpenBMB 项目催生了 MiniCPM 项目。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

翻译:AI 行业分析:50 个访问量最大的 AI 工具及流量行为

[title]翻译:AI行业分析:50个访问量最大的AI工具及流量行为[heading2]AI行业:过去12个月的流量增长在过去12个月里,人工智能行业是我们长期以来看到的最重要的技术发展之一。在我们研究的起始月份(2022年9月)期间,我们分析的工具产生了2.418亿次访问。正如您在图表中看到的,所有50个工具的总流量在研究期间增长了10.7倍。但在2023年8月的最后一个月,这些工具产生了惊人的28亿次访问量。从这个角度来看,从研究开始一个月到研究结束,流量增加了26亿。这相当于在研究的12个月内平均每月访问量增加2.363亿次。但这一切从哪里开始呢?这一飞跃真正从去年11月开始——当时ChatGPT成为有史以来最快达到100万用户的平台(仅用了5天)。在最初的繁荣之后,炒作一直持续攀升,直到2023年5月,月访问量达到峰值约41亿。这是我们第一次看到行业流量回落12亿。整个期间的平均流量为每月20亿。但有趣的是,如果我们只看最近6个月,每月平均流量为33亿。像人工智能这样的新兴技术趋势能引起如此大的兴趣是非常罕见的。即使在12亿次访问量回落和下降之后,人们的兴趣仍然巨大-行业总兴趣徘徊在上一年增长10.7倍左右。从这个角度来看,风投和投资者可以在人工智能竞赛中挑选几乎任何一匹大马,并在短短一年内安全地实现3-10倍的增长(假设兴趣反映在财务和用户基础上)。

AGI万字长文(上)| 2023回顾与反思

[title]AGI万字长文(上)| 2023回顾与反思[heading1]上篇:2023,风暴的前奏[heading2]<7>国内进展与卡脖子从业内人的角度,ChatGPT和GPT4的出现时最令人惊讶的,不是它的能力,而是保密工作做的太好。2023之前国内AI行业还处在沾沾自喜,自认为和美国只有个把月差距,而且还有人口数据优势;这种论调一下子被GPT4打回了原形。OpenAI在国内完全没有预警的情况下,直接拉开2年技术差距。具体原因,可能是国内的骄傲自大,可能是被之前Google主推的T5技术路线带偏,也可能是因为AGI实在是影响过于巨大,FBI、美国国防部这些国家机关不可能没和OpenAI打过招呼。OpenAI的成功是大力出奇迹,所以23年上半年国内也笃信只要有卡有钱就可以“大炼钢铁”。那时不论是纷纷囤卡招人,研究类GPT架构的大厂们,还是讲着中国OpenAI的故事,拿着巨额融资的创业公司们,都想要第一个创造国产AGI。而到了下半年,在试验了一番发现不容易之后,又纷纷转向要做“垂直应用”、“商业化”;反而不提AGI了。这个转向是短视的,甚至是致命的。2023年,中美在AGI技术的差距并没有缩小。现在,国内最领先的模型水平大概在准ChatGPT3.5的水平,和GPT4还有不小差距;甚至还不如临时拼凑的Mistral团队的水平。大厂。大厂们无论是人才、GPU、数据,还是资金储备都是可以冲击AGI的,不过从实际效果上来看还并没有明确亮点。但与此同时,受内部短期考核压力的裹挟,大多数力量应该都放在卷新产品圈地盘和向上汇报工作上了。从另一个角度,这些模型虽然能力一般,但和业务的结合都是比较充分的。最后,大厂们同时背负了太多其他业务和政治考量:对于是否做大模型的出头鸟,很多公司都是要三思的。具体来讲,百度和阿里是大厂里比较高调:百度的“文心4.0”是当前国内能力最好的模型之一,即将发布的阿里的“通义千问

2024人工智能报告|一文迅速了解今年的AI界都发生了什么?

[title]2024人工智能报告|一文迅速了解今年的AI界都发生了什么?[heading2]二、2024国内VS国外AI企业,竞争达到白热化阶段**中国开源项目在今年赢得全球粉丝,并且已经成为积极开源贡献者。**其中几个模型在个别子领域中脱颖而出,成为强有力的竞争者。DeepSeek在编码任务中已成为社区的最爱,其组合了速度、轻便性和准确性而推出的deepseek-coder-v2。阿里巴巴最近发布了Qwen-2系列,社区对其视觉能力印象深刻,从具有挑战性的OCR任务到分析复杂的艺术作品,都完成的非常好。在较小的一端,清华大学的自然语言处理实验室资助了OpenBMB项目,该项目催生了MiniCPM项目。这些是可以在设备上运行的小型<2.5B参数模型。它们的2.8B视觉模型在某些指标上仅略低于GPT-4V。2024年是AI图像视频迅速发展的一年,这个赛道竞争异常激烈国外Stability AI发布的Stable Video Diffusion,是第一个能够从文本提示生成高质量、真实视频的模型之一,并且在定制化方面取得了显著的进步。并且在今年3月,他们推出了Stable Video 3D,该模型经过第三个对象数据集的微调,可以预测三维轨道。OpenAI的Sora能够生成长达一分钟的视频,同时保持三维一致性、物体持久性和高分辨率。它使用时空补丁,类似于在变压器模型中使用的令牌,但用于视觉内容,以高效地从大量视频数据集中学习。除此之外,Sora还使用了其原始大小和纵横比的视觉数据进行训练,从而消除了通常会降低质量的裁剪和缩放。Google DeepMind的Veo将文本和可选图像提示与嘈杂压缩视频输入相结合,通过编码器和潜在扩散模型处理它们,以创建独特的压缩视频表示。然后系统将此表示解码为最终的高分辨率视频。

其他人在问
那个文生视频或图生视频的AI可以生成融合变化的效果
以下是关于文生视频或图生视频的 AI 生成融合变化效果的相关信息: 在人工智能技术迅速发展的当下,AI“词生卡”技术兴起,它将文字描述转化为视觉图像,重塑了创意产业格局。AI 的多模态输出能力已基本成型,包括文生文、文生图、文生码、文生视频、图生视频等,但大多在某个维度能力强,跨界融合还不够。 从生成方式分类,AI 视频生成包含: 1. 文生视频、图生视频,如 Runway、Pika labs、SD + Deforum、SD + Infinite zoom、SD + AnimateDiff、Warpfusion、Stability Animation 等。 一些热门产品如 Luma AI,其 Dream Machine 目前支持 txt2vid 文生视频和 img2vid 图生视频两种能力,8 月底最新发布的 Dream Machine 1.5 增强了提示词理解能力和视频生成能力。Luma AI 的 img2vid 生成效果在多方面表现出色,如生成时长较长、运动幅度大、能产生相机多角度位移、运动过程一致性保持较好、分辨率高且有效改善模糊感等。
2024-11-23
怎么用ai制作由人变成动物的视频
以下是使用 AI 制作由人变成动物视频的方法: 一、创建视频内容 1. 准备内容 先准备一段视频中播放的内容文字,可以是产品介绍、课程讲解、游戏攻略等任何您希望推广让大家了解的文字。 您也可以利用 AI 来生成这段文字。 2. 制作视频 使用剪映 App 对视频进行简单处理。电脑端打开剪映 App,点击“开始创作”。 选择顶部工具栏中的“文本”,点击默认文本右下角的“+”号,为视频添加一个文字内容的轨道。 在界面右侧将准备好的文字内容替换默认文本内容。 二、生成数字人 1. 生成数字人 在剪映右侧窗口顶部,打开“数字人”选项,选取一位免费且适合的数字人形象,如“婉婉青春”。 选择数字人形象时,软件会播放其声音,可判断是否需要,点击右下角“添加数字人”,软件会根据提供的内容生成对应音视频并添加到当前视频轨道中。 左下角会提示渲染完成时间,完成后可点击预览按钮查看效果。 2. 增加背景图片 删除先前导入的文本内容。 点击左上角“媒体”菜单,点击“导入”按钮,选择本地一张图片上传。 点击图片右下角的加号将图片添加到视频轨道上(会覆盖数字人)。 点击轨道最右侧的竖线,向右拖拽直到视频最后,使图片在整个视频播放时都显示。 选中背景图片所在轨道,拖动图片的角将其放大到适合尺寸,并将数字人拖动到合适位置。 此外,如果您想创作一个生物融合成新物种的视频,例如猪和老鹰融合成一个新的物种,以 GPT4 为例的制作教程如下: 1. 故事情节的构思 构思一个吸引人的故事情节,比如新物种的起源故事,结合猪和老鹰的特点以及这种融合带来的独特能力和挑战,考虑添加神秘或奇幻元素增强阴暗风格。 2. 视觉效果的设计 使用 3D 建模和特效技术创造出既霸气又具有阴暗风格的新物种形象,高质量的视觉效果和流畅的动画能吸引更多观众并提高视频的分享率。 3. 音乐和声音设计 配置适当的背景音乐和声效,以增强视频的氛围,选择能激起观众情绪的音乐和声音效果,让视频更加引人入胜。 4. 社交媒体互动
2024-11-23
AI分镜
以下是关于《李清照》AI 视频创作的分镜内容: |分镜|子分镜|分镜主视觉|配音|角色|配音|画面| |||||||| |8|0801<br>0802|嗯~谁在叫我<br>小姑娘,你从哪里来?你叫什么名字呀?|王维||| |9|0901 疑惑<br>0902 诗文|疑惑自言自语<br>疑惑的表情<br>看到明月松间照,清泉石上流惊喜|我叫什么名字呢?(疑惑)<br>哦~(惊讶)<br>李清照吟诵:明月松间照,清泉石上流。|少年李清照|| |10|1001 惊喜<br>1002 照清高亮|李清照灵机一动<br>墙上诗:明月松间照,清泉石上流。照和清高亮显示|背景音效:灵机一动|||| |11|11 得意|李清照脸部特写,惊喜表情|我叫李清照(高兴)|少年李清照|| |12|12 王维沉思|王维沉思|李清照~李清照,好名字、好名字|王维|| |13|13 夜景|明月下溪水潺潺|王维吟诵:明月松间照,清泉石上流。|王维|| |20|20|画面穿越到当代写字楼办公室|忙乱和电话铃声|背景声|| |21|21|面对电脑的李清照一脸茫然|||| |22|22|旁边两个同事聊天|你们打算什么时间要孩子?<br>要孩子,要什么孩子,我们是丁克家庭。|同事甲<br>同事乙|| |23|23|李清照满脑子疑惑,丁克是什么意思|疑问背景音|背景声|| |24|24|李清照查询丁克的意思,发现是不要孩子的家庭。|||| |25|25|旁边两个同事聊天|那你不打算结婚吗?<br>我才 30 岁,结哪门子婚,我的环游世界梦想还没有实现呢|同事甲<br>同事乙|| |26|26|李清照满脑子疑惑,为什么可以不结婚?怎么生活?|疑问背景音|背景声|| |27|27|李清照开始查阅资料|清照~清照~你不下班吗?<br>哦哦~我查点资料|同事甲<br>李清照|| |1||远景一个古装小女孩草丛中嬉戏|背景音乐:小女孩嬉戏声|||| |2|0201 欢快<br>0202 疑惑|李清照与蝴蝶对话:远景、特写|蝴蝶:你叫什么名字呀?(欢快)<br>李清照:嗯~嗯~我叫什么名字呢?(疑惑)|蝴蝶<br>少年李清照|| |3|0202 放大|李清照特写|||| |4|04 穿越唐代|李清照满是疑惑|画外音:这是什么地方?(疑惑)|少年李清照|| |5|《辋川别业》建筑|写有《辋川别业》的古代建筑|辋川别业、辋川别业,难到这是王维的住处!(恍然大悟)|少年李清照|| |6|06|《维摩诘诗集》特写|真的是王维(高兴)|少年李清照|| |7|07|李清照高兴奔向王维|王伯伯~王伯伯~(高兴)|少年李清照||
2024-11-23
学习AI
以下是针对新手学习 AI 的建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,可根据自己的兴趣选择特定模块深入学习。 掌握提示词的技巧,其上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库中有很多大家实践后的作品、文章分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解其工作原理和交互方式。 对于中学生学习 AI,建议如下: 1. 从编程语言入手学习: 从 Python、JavaScript 等编程语言开始,学习编程语法、数据结构、算法等基础知识。 2. 尝试使用 AI 工具和平台: 使用 ChatGPT、Midjourney 等 AI 生成工具,体验 AI 的应用场景。 探索面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识: 了解 AI 的基本概念、发展历程、主要技术如机器学习、深度学习等。 学习 AI 在教育、医疗、金融等领域的应用案例。 4. 参与 AI 相关的实践项目: 参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动。 尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 5. 关注 AI 发展的前沿动态: 关注 AI 领域的权威媒体和学者,了解 AI 技术的最新进展。 思考 AI 技术对未来社会的影响,培养对 AI 的思考和判断能力。 记住,学习 AI 是一个长期的过程,需要耐心和持续的努力。不要害怕犯错,每个挑战都是成长的机会。完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。
2024-11-23
有什么 ai 辅助打工人学习的工具推荐
以下是为打工人推荐的一些 AI 辅助学习工具: 英语学习工具: 1. Speak:这是一款 AI 英语学习 APP,利用先进的 AI 语言学习技术,提供全面实时反馈,支持随时随地练习口语,且 OpenAI 曾投资该公司。 2. Duolingo:提供游戏化学习平台,通过 AI 辅助教学,帮助学习新词汇和短语,其口语练习功能有助于练习发音和口语表达。 3. Call Annie:在发音过程中能根据发言调整表情和动作,让人感觉如同与真人对话,可随时通过视频或语音进行英语对话。 英语和数学通用学习方法: 1. 利用智能辅助工具,如英语写作助手 Grammarly 进行写作和语法纠错。 2. 借助语音识别应用,如 Call Annie 进行口语练习和发音纠正。 3. 使用自适应学习平台,如 Duolingo 为您量身定制学习计划。 4. 运用智能导师和对话机器人,如 ChatGPT 进行会话练习和对话模拟。 数学学习工具: 1. 自适应学习系统,如 Khan Academy,结合 AI 技术提供个性化学习路径和练习题。 2. 智能题库和作业辅助工具,如 Photomath,通过图像识别和数学推理技术提供数学问题解答和解题步骤。 3. 虚拟教学助手,如 Socratic,利用 AI 技术解答数学问题、提供教学视频和答疑服务。 4. 参与交互式学习平台,如 Wolfram Alpha 的数学学习课程和实践项目,利用 AI 技术进行数学建模和问题求解。 内容仿写工具: 1. 秘塔写作猫:https://xiezuocat.com/ ,是 AI 写作伴侣,能推敲用语、斟酌文法、改写文风,实时同步翻译,支持全文改写、一键修改、实时纠错并给出修改建议,智能分析文章属性并打分。 2. 笔灵 AI 写作:https://ibiling.cn/ ,是智能写作助手,支持多种文体写作,能一键改写/续写/扩写,智能锤炼打磨文字。 3. 腾讯 Effidit 写作:https://effidit.qq.com/ ,由腾讯 AI Lab 开发,能提升写作者的写作效率和创作体验。 更多 AI 写作类工具可以查看:https://www.waytoagi.com/sites/category/2 。请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-11-23
如何理解AI的边界
AI 的边界可以从以下几个方面来理解: 1. 从生态位角度:AI 是一种似人而非人的存在,无论其技术如何发展,都处于这样的生态位。在与 AI 相处时,要基于其“非人”的一面,通过清晰的语言文字指令压缩其自由度,明确告诉它需要做什么、边界在哪里、目标是什么、实现路径和方法以及提供所需的正确知识。 2. 在品牌卖点提炼中的应用:在搭建智能体提炼品牌卖点前,要先明确 AI 的能力边界。例如,AI 对公司的主要产品、产品解决的用户需求、产品独特之处、获得的认可、依赖的核心渠道、核心购买人群、使用过的营销手段、在新渠道的期望结果等方面了解程度接近于 0。AI 真正的能力在于通过分析数据和信息进行逻辑推理、快速处理和分析数据并提取有价值的信息和模式、拥有大量训练数据并能输出更全面的相关信息、理解用户提供的内容并按正确结构梳理有效输出内容。因此,智能体更适合作为引导型的灵感提问助手。 3. 在编程方面:在许多情况下,我们给 AI 下达明确命令完成一次性任务。当期待提高,希望进一步解脱繁琐日常任务时,需要了解 AI 编程的边界和限制。编程准则第一条是能不编尽量不编,优先找线上工具、插件、本地应用,对于 API 功能,先找现成开源工具,然后考虑付费服务,都找不到时才考虑自己编程,且编程时要以终为始,聚焦目标。
2024-11-23
最近几个月AI发生的大事件
以下是最近几个月 AI 领域发生的一些大事件: 1. 尽管科技公司因美联储加息资本狂欢结束,SaaS 公司股价下跌、裁员紧缩,但 DallE 2 发布,一大批炫酷的 AI 公司登场,在风投界引发风潮,基于生成式 AI 产品的公司估值达数十亿美元,虽收入少且商业模式未经验证。 2. 数百万人尝试像 ChatGPT 这样能流畅对话的生成式 AI 模型和像 DALLE 这样的创意图像生成器,其获得的关注引导大量投资流动,塑造了技术未来几年的应用方式。对于一直对 AI 改变社会持乐观态度的人,特别是在健康和医学等关键领域,近几个月感觉像科幻小说变为现实。 3. 生成性 AI 使得最近图像生成领域激增。短短十年,从仅限专家使用的 AI 模型发展到可供公众使用的能编写有效代码、用自然语言提示创建准确图像的模型,创新步伐不断加快。
2024-08-24
撰写内容概要:以ai换脸诈骗和声音合成诈骗为蓝本查阅网站、文献期刊等专家在相关方面的研究进展及其成果,并进行汇总评述。(1)表述收集资料的来源情况、收集资料的数量情况;(2)将所收集的资料进行分类,按照几个分类方面逐一进行表述,表述涵盖专家的观点、结论、思路、方案等;(3)小组综合性的对所收集到的资料进行评述,描述当前的进展情况、优劣点、未来发展等。)
以下是根据您提供的资料进行的汇总评述: 一、收集资料的情况 1. 来源情况:资料来源于陶力文律师的相关论述、关于 AI 音乐的论文、质朴发言的研究报告等。 2. 数量情况:共收集到 3 份相关资料。 二、资料分类及专家观点 1. 关于律师如何写好提示词用好 AI 观点:强调结构化内容组织、规定概述内容解读结语结构、案例和挑战结合、结合法规和实际操作、使用商业术语等。 结论:通过多种方式提升文章的专业性和针对性。 思路:从标题、文章结构等方面进行规划。 方案:按照特定的结构和要求进行写作。 2. 基于频谱图的音乐录音中自动调谐人声检测 观点:聚焦音乐中人声音高的自动调音检测,提出数据驱动的检测方法。 结论:所提方法在检测上表现出较高的精确度和准确率。 思路:包括音频预处理、特征提取和分类等步骤。 方案:创建新数据集,进行全面评估。 3. 文生图/文生视频技术发展路径与应用场景 观点:从横向和纵向梳理文生图技术发展脉络,分析主流路径和模型核心原理。 结论:揭示技术的优势、局限性和未来发展方向。 思路:探讨技术在实际应用中的潜力和挑战。 方案:预测未来发展趋势,提供全面深入的视角。 三、综合性评述 当前在这些领域的研究取得了一定的进展,如在音乐自动调音检测方面提出了新的方法和数据集,在文生图/文生视频技术方面梳理了发展路径和应用场景。 优点在于研究具有创新性和实用性,为相关领域的发展提供了有价值的参考。但也存在一些不足,如音乐检测研究中缺乏专业自动调音样本,部分技术在实际应用中可能面临一些挑战。 未来发展方面,有望在数据样本的丰富性、技术的优化和多模态整合等方面取得进一步突破,拓展更多的应用场景。
2024-11-15
主流大厂目前的agi 进展
目前主流大厂在 AGI 方面的进展情况如下: 2023 年之前,国内 AI 行业自认为与美国差距不大,但 ChatGPT 和 GPT4 的出现打破了这种认知,OpenAI 直接拉开了 2 年的技术差距。 2023 年上半年,国内大厂纷纷囤卡招人,研究类 GPT 架构,或成立创业公司,试图创造国产 AGI。但下半年发现不容易后,纷纷转向“垂直应用”“商业化”,不再提 AGI。 国内最领先的模型水平大概在准 ChatGPT3.5 的水平,和 GPT4 还有不小差距。 百度和阿里在大厂中比较高调,百度的“文心 4.0”是当前国内能力较好的模型之一,即将发布的阿里的“通义千问”也备受关注。 大厂们在人才、GPU、数据和资金储备方面具备冲击 AGI 的条件,但实际效果尚无明确亮点,且受内部短期考核压力影响,多数力量用于卷新产品和向上汇报工作,同时还背负其他业务和政治考量。
2024-11-12
AI加教育的最新进展
以下是 AI 加教育的最新进展: 案例方面: “AI 赋能教师全场景”,来自 MQ 老师的投稿贡献。 “未来教育的裂缝:如果教育跟不上 AI”,揭示了人工智能在教育领域从理论走向实际应用带来的颠覆性改变。 “化学:使用大型语言模型进行自主化学研究”。 “翻译:怎么把一份英文 PDF 完整地翻译成中文?”,介绍了 8 种方法。 对未来的预判: 个性化学习时代已到来,AI 将作为教育生态系统的一部分与人类教师协作,为孩子提供不同的学习体验,如混合式教学、定制学习路径等。 教育工作者将成为学习的引导者和伙伴,更多关注孩子的全人发展,如创造力和社交智慧。 未来 3 年,提升人机协作效率的领域,如 AI 作业批改、备课、定制教育规划、学前启蒙等,对教育从业者蕴藏着巨大机遇。 探索实践: 过去半年多,梳理教学和育儿工作流,每个环节与 AI 协作可大幅提升效率,但也加剧了知识获取的不平等。从家长的“育”、老师的“教”和学生的“学”进行了落地实践的拆解。
2024-11-05
最新AI进展
以下是关于最新 AI 进展的相关内容: AI 技术的发展历程: 1. 早期阶段(1950s 1960s):包括专家系统、博弈论、机器学习初步理论。 2. 知识驱动时期(1970s 1980s):有专家系统、知识表示、自动推理。 3. 统计学习时期(1990s 2000s):出现机器学习算法如决策树、支持向量机、贝叶斯方法等。 4. 深度学习时期(2010s 至今):深度神经网络、卷积神经网络、循环神经网络等得到发展。 当前 AI 前沿技术点: 1. 大模型(Large Language Models):如 GPT、PaLM 等。 2. 多模态 AI:包括视觉 语言模型(CLIP、Stable Diffusion)、多模态融合。 3. 自监督学习:如自监督预训练、对比学习、掩码语言模型等。 4. 小样本学习:例如元学习、一次学习、提示学习等。 5. 可解释 AI:涉及模型可解释性、因果推理、符号推理等。 6. 机器人学:涵盖强化学习、运动规划、人机交互等。 7. 量子 AI:包括量子机器学习、量子神经网络等。 8. AI 芯片和硬件加速。 10 月 14 日的 AI 相关进展: 1. ChatGPT 命令工具上线,提供搜索、图像、O1 推理三种命令,使普通模型也具备高级推理能力,测试表明所有模型均支持命令调用,显著提升了 ChatGPT 的整体能力。 2. Anthropic CEO 展望未来,认为 AI 将在 5 10 年内助力扫除几乎所有疾病,寿命翻倍至 150 岁,包括在医学进展方面实现 50 100 年的突破,如大规模预防自然传染病与开发“万能疫苗”,降低癌症死亡率,治愈遗传疾病,开发抗衰老疗法,帮助治疗抑郁症、精神分裂症等疾病,同时自动化劳动解放人类创造力,推动全球经济增长,但也需平衡风险与潜力。 3. ChatGPT 4.0 Canvas 功能助力写作,提供思路、润色语言、内容扩展,支持快速修改与撤回版本,极大提升写作效率,未来或将支持多人协作、数据图表生成、甚至直接生成 PPT。 对于新手学习 AI,要持续学习和跟进,关注 AI 领域的新闻、博客、论坛和社交媒体,保持对最新发展的了解。考虑加入 AI 相关的社群和组织,参加研讨会、工作坊和会议,与其他 AI 爱好者和专业人士交流。
2024-10-31
中国上市公司在ai应用方面的进展
目前,中国上市公司在 AI 应用方面取得了一定进展。 一方面,许多公司正将 AI 融入其工作流程,以快速达成 KPI、扩张规模和降低成本。例如,工作流程自动化平台 ServiceNow 通过 AI 驱动的 Now Assist,实现了近 20%的事件避免率;Palo Alto Networks 利用 AI 降低了处理费用的成本;Hubspot 利用 AI 扩大了能够支持的用户规模。瑞典金融科技公司 Klarna 最近宣布,通过将 AI 融入用户支持,他们在运行率方面节省了 4000 多万美元。 另一方面,对于 AI 应用层的创业者来说,存在一些问题和探索。中国企业软件的发展曾受人均 GDP 不够高、人力成本等因素限制,但如果 AI 能极大降低软件成本并提高效率,可能带来价值突破。我们期待中国 2B 的 AI 软件应用实现跨越式发展。 此外,还有一些相关的资源可供参考,如 2022 2024 年融资 2000 万美金以上的公司列表和详细公司分析、AI Grant 公司列表和详细公司分析、AIGC 行业与商业观察等。同时,也有关于 AI 变革公司/产业实践探索的相关内容,如 2023 年年报中中国上市公司对生成式 AI 的使用,以及安克创新的 AI 实践分析等。
2024-10-28
近期的大模型进展
近期大模型的进展主要包括以下方面: 多模态大模型: 现状:随着数据集和模型规模扩大,传统多模态模型计算量大,研究重点在于各模态的连接,利用现成训练好的单模态基础模型可减少训练费用和提升效率。通过多模态预训练和指令微调实现模态对齐及模型输出与人类意图对齐是核心挑战。 发展历程:最初集中在多模态内容理解和文本生成,如 Flamingo、BLIP2 等;同时实现多模态输入和输出工作,如 MMLMM;将 LLM 和外部工具继承进来,实现“anytoany”的多模态理解和生成,如 visualchatgpt 等;还有为减少级联过程中传播误差的工作。 大型视觉模型 Sora:符合视觉模型的规模化定律,展示了新兴能力,包括遵循指令、视觉提示工程和视频理解等,是第一个展示确认新兴能力的视觉模型,标志着计算机视觉领域的重要里程碑。 OpenAI 的新模型 o1preview/mini:复杂问题思考过程长,相对简单问题也需 5 10 秒,使用条数少,冷却时间长,但推理模型准确率不断攀升,为行业注入了强心剂。
2024-10-23
教育行业的,个性化推荐系统是怎么做的?
在教育行业中,个性化推荐系统的实现通常涉及以下几个方面: 1. 数据收集与分析:收集学生的学习行为、兴趣偏好、学习成绩等多方面数据,并进行深入分析。 2. 模型选择与训练:可以采用如大型语言模型等,并通过合适的算法和数据进行训练。 3. 提示策略应用:例如像 LLMRec 方法中提到的基本提示、推荐驱动提示、参与引导提示和推荐驱动+参与引导提示等策略,以提高推荐性能。 4. 考虑伦理和道德问题:要注意避免模型中的偏见,防止学生利用推荐系统作弊等问题。 例如,在“LLMRec:通过提示大语言模型进行个性化推荐”的研究中,提出了多种有效的提示策略,实验证明将原始内容描述与大语言模型生成的增强输入文本结合,并使用这些策略可以提升推荐效果。同时,像“沃顿商学院:面向教师和学生的人工智能简介”中也提到,人工智能在教育中的应用能预测学生行为和提供个性化教学内容,但也存在一些问题需要关注和解决。
2024-11-22
帮我生成一个个人的职业目标为数据分析师,职业规划为想要找到一个计算机行业类的公司,我的优势是社交方面和处理数据方面很强,我的2弱势是不太可以创新
以下是为您生成的以数据分析师为职业目标,且希望在计算机行业公司工作的职业规划建议: 首先,鉴于您在社交和处理数据方面的优势,您可以积极利用这两点。在社交方面,主动参与行业相关的社交活动、线上论坛或社群,扩大人脉资源,这有助于您获取更多的行业信息和潜在的工作机会。在处理数据方面,不断提升自己的专业技能,例如学习更高级的数据处理工具和技术,以提高工作效率和质量。 对于您在创新方面的弱势,建议您多关注行业内的创新案例和趋势,通过学习和模仿来逐渐培养创新思维。可以参加一些创新思维的培训课程或者阅读相关的书籍。 在求职过程中,有针对性地投递计算机行业中对数据分析师有需求的公司。准备一份精心制作的简历,突出您在社交和数据处理方面的优势,并诚实地提及您在创新方面的不足以及您为改进所做的努力。 进入公司后,持续学习和提升自己,与团队成员保持良好的沟通和合作,不断积累项目经验,逐步提升自己在数据分析领域的专业能力和影响力。
2024-11-20
还有更多的行业应用案例吗?
以下是一些 AI 在不同行业的应用案例: 企业运营:包括日常办公文档材料撰写整理、营销对话机器人、市场分析、销售策略咨询、法律文书起草、案例分析、法律条文梳理、人力资源简历筛选、预招聘、员工培训。 教育:协助评估学生学习情况,为职业规划提供建议;针对学生情况以及兴趣定制化学习内容;论文初稿搭建及论文审核;帮助低收入国家/家庭通过 GPT 获得平等的教育资源。 游戏/媒体:定制化游戏,动态生成 NPC 互动,自定义剧情,开放式结局;出海文案内容生成,语言翻译及辅助广告投放和运营;数字虚拟人直播;游戏平台代码重构;AI 自动生成副本。 零售/电商:舆情、投诉、突发事件监测及分析;品牌营销内容撰写及投放;自动化库存管理;自动生成或完成 SKU 类别选择、数量和价格分配;客户购物趋势分析及洞察。 金融/保险:个人金融理财顾问;贷款信息摘要及初始批复;识别并检测欺诈活动风险;客服中心分析及内容洞察;保险理赔处理及分析;投资者报告/研究报告总结。 制造业/汽车:生产计划、供应链计划状态查询;产线预测性维保辅助;产品质量分析与溯源;自动驾驶全场景模拟训练及虚拟汽车助手;线上购车品牌、配置对比分析。 生命科学:研发阶段靶点发现及产品成药性;医学文献内容检索,重点摘要提取,相关法规整理;医药代表培训及知识库建立;分诊导诊助理、诊疗助理、术后护理及复建辅助。 不仅如此,ChatGPT 大模型以及生成式 AI 技术还将在图片、视频、数字人等领域的各种复杂场景中落地,利用海量的数据资源和算法实现商业化应用与迭代更新。
2024-11-20
我想收集一些AIGC行业应用的案例
以下是一些 AIGC 行业应用的案例: 在内容创作方面: 文字生成:使用大型语言模型(如 GPT 系列模型)生成文章、故事、对话等内容。 图像生成:使用 Stable Diffusion、DALLE 等模型生成艺术作品、照片等。 视频生成:使用 Runway、KLING 等模型生成动画、短视频等。 在制造业领域: 产品设计和开发:利用 AI 生成工具如 Adobe Firefly、Midjourney 等,可以根据文字描述快速生成产品的 3D 模型、渲染图、插图等设计元素,大幅提高产品设计效率。 工艺规划和优化:结合大语言模型的自然语言处理能力,可以自动生成制造工艺流程、设备选型、质量控制等方案,优化生产过程。 设备维护和故障诊断:利用 AI 模型分析设备运行数据,可以预测设备故障,并自动生成维修建议,提高设备可靠性。 供应链管理:AI 可以根据历史数据和市场变化,自动生成采购计划、库存预测、物流优化等内容,提高供应链管理效率。 客户服务:基于对话模型的 AI 客服机器人,可以自动生成个性化的客户回复,提升客户体验。 在医疗行业: 疾病的诊断与预测、药物研发以及个性化医疗。例如,麻省理工学院利用 AI 发现了一种名为 Halicin 的新型广谱抗生素。 在广告营销行业: 从初期的市场分析、中期的客户转化以及后期的客户复购均可参与,为消费者提供更个性化、智能化和互动性强的营销体验,还能降低内容制作成本并加速创意实现。
2024-11-20
贸易行业风控与ai的结合案例
以下是一些贸易行业风控与 AI 结合的案例: 案例一:录播课编程作业的自动批改 场景:在班主任日常工作中,批改作业占据了 50%以上的时间,作业包括孩子拖动编程积木实现的作品以及孩子自己根据人物讲的故事等。 目标:扩大班主任的服务半径,提高对学生和家长的服务效率。 痛点:现有的作业批改方式无法统一标准,对于问答题和创作题的评分存在主观性,影响了教学质量和效率。 原理:利用 BERT 机器学习模型(准确来说是 BERT 的变种),结合老师的批注(正样本和负样本),实现作业的自动和标准化批改。 期望结果:理解和模拟老师的评分逻辑,减轻老师的工作负担。 落地结果:自动批改节省班主任 50%以上的时间,服务半径从 50 人扩大到 200 人。 案例二:智慧安检标签在关务风控平台的应用 场景:海关在对申报货物查验时,需要保证单货一致。 痛点:客户通过顺丰申报的品名不一定是真实品名,存在顺丰货物被海关查验导致整车被扣的风险。 解决方案:推动关务部门与 AIOT 部门的跨部门合作,应用 AIOT 的智慧安检判图标签(如是否含有液体或粉末)与货物品名对应的标签比对(如衣服对应的是常规标签),再输出是否有风险的结论给中转场人员(开箱查验)。 落地结果:风控识别开箱复核有效率提升,成功识别重大货物风险。 此外,在法律领域也有相关应用,如法规研究与解读中,法规检索最好使用法律行业垂类的 AI 产品。在法律意见书撰写或非诉交易文件材料方面,也可以通过输入特定的 Prompt 指令词,让 AI 自动生成相关内容。
2024-11-20
AI 在直播电商行业都有哪些应用
AI 在直播电商行业的应用主要包括以下方面: 1. 数字人直播: 盈利方式: 直接销售数字人工具软件,包括实时驱动和非实时驱动两类,实时驱动价格较高,非实时效果差且价格混乱。 提供数字人运营服务,按直播间成交额抽佣。 适用品类和场景: 适用于不需要强展示的商品,如品牌食品饮料;虚拟商品,如门票、优惠券等。 效果最好的是店播,不适用于促销场景。 壁垒和未来市场格局: 目前有技术门槛,长期看技术上无壁垒。 不会一家独大,可能有 4 5 家一线效果公司。 能把客户服务好、规模化扩张的公司更有价值,大平台下场可能带来降维打击。 2. 阿里巴巴营销技巧和产品页面优化: 市场分析:利用 AI 分析工具研究市场趋势、消费者行为和竞争对手情况。 关键词优化:AI 推荐高流量、高转化的关键词。 产品页面设计:AI 设计工具生成吸引人的页面布局。 内容生成:AI 文案工具撰写产品描述和营销文案。 图像识别和优化:选择或生成高质量产品图片。 价格策略:分析价格对销量的影响。 客户反馈分析:了解客户需求,优化产品和服务。 个性化推荐:根据用户偏好提供推荐。 聊天机器人:提供 24/7 客户服务。 营销活动分析:了解活动效果。 库存管理:预测需求,优化库存。 支付和交易优化:分析支付方式对交易成功率的影响。 社交媒体营销:在社交媒体上精准营销。 直播和视频营销:优化直播和视频内容。 3. 虚拟主播: 品牌应用:欧莱雅、YSL、兰蔻、李宁、北面等品牌会使用 AI 驱动的虚拟主播自播,通常在午夜时段排期。 服务与功能:阿里云提供品牌智能直播间基础版服务,包括直播剧本智能生成等多种功能。 案例特点: 形象风格:有 3D 卡通和 2D 拟真人等。 动作和语音:预设丰富动作库和真实语音。 商品展示:以图片为主,背景墙和画面有特效。 直播互动:流程相对固定,包括进场互动、引导关注分享下单、问答互动等。 存在问题:无法与产品接触,测评缺乏真实性,易引起用户反感,目前更像花瓶,负责基础介绍和问答。
2024-11-19