Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

AI发展大事记与 时间线

Answer

以下是 AI 发展的大事记与时间线:

  • 2022 年 11 月 30 日,OpenAI 发布基于 GPT 3.5 的 ChatGPT。
  • 2024 年 3 月,AI 发展持续升温,潞晨科技发布 OpenSora,Suno 发布 V3 版本爆火。
  • 2024 年 4 月,英伟达发布硬件股价飙升。
  • 2024 年 5 月,苹果发布 AI 芯片,张吕敏发布 IC light,AI 竞争白热化,伊莉雅离开 OpenAI 并成立新公司,估值超五亿美金。
  • 2024 年 7 月,快手开源 LivePortrait 模型,表情迁移。
  • 2024 年 8 月,StabilityAI 老板成立新公司发布 flux 大模型。
  • 2024 年 9 月,阿里云发布模型,海螺 AI 参战,Google 发布 GameGen 实时生成游戏,通义千问 2.5 系列全家桶开源,华为发布 cloud matrix 云计算基础设施,GPT 高级语音模式上线,Meta 发布 AI 眼镜 Orion,AI 代码编辑器 cursor 爆火。
  • 2024 年 10 月,Pika 发布 1.5 模型,诺奖颁发给 AI 奠基人,特斯拉发布机器人,Adobe 发布 Illustrator+Al 生成矢量图,智谱 AI 发布 autoGLM,腾讯混元开源 3D 模型。

在更早的时间:

  • 1943 年,心理学家麦卡洛克和数学家皮特斯提出了机器的神经元模型,为后续的神经网络奠定了基础。
  • 1950 年,伟大的计算机先驱图灵最早提出了图灵测试,做为判别机器是否具备智能的标准。
  • 1956 年,在美国一个小镇的达特茅斯学院中,马文·明斯基和约翰·麦凯西拉着香农大佬站台背书,共同发起召开了著名的达特茅斯会议,在这次会议上,人工智能 Artifical Intelligence 一词被正式提出,并做为一门学科被确立下来。

2024 年的其他进展:

  • 2 月,OpenAI 发布视频生成模型 Sora,首次实现高质量文本生成视频,开创 AI 视频生成新纪元。
  • 3 月,Suno 发布 V3 版本,AI 音乐生成方向进入生产力可用状态。
  • 4 月,Meta 发布高性能开源大模型 Llama-3,降低了 AI 技术的准入门槛。
  • 5 月,GPT-4 发布,Ray-Ban 与 Meta 合作的智能眼镜销量突破百万,字节上线即梦 AI。
  • 6 月,快手发布可灵。
  • 9 月,OpenAI 发布 o1 预览版。
  • 10 月,Rosetta 和 AlphaFold 算法的研发者因在蛋白质结构设计和预测中的突破性贡献获得诺贝尔化学奖,约翰·霍普菲尔德和杰弗里·辛顿因人工神经网络和深度学习的开创性贡献获诺贝尔物理学奖,Anthropic 大模型 Claude 3.5 Sonnet 获得“computer use”功能。
  • 12 月,OpenAI 发布 o3 系列模型。
Content generated by AI large model, please carefully verify (powered by aily)

References

帆哥:2024AI大事纪

[02:44]3月AI发展持续升温[02:44]3月潞晨科技发布OpenSora[03:13]3月Suno发布V3版本爆火[03:49]4月英伟达发布硬件股价飙升[04:43]5月苹果发布AI芯片[04:53]5月张吕敏发布IC light[05:27]5月AI竞争白热化[05:28]5月伊莉雅离开OpenAI,AI竞争白热化[05:58]伊利亚成立新公司,估值超五亿美金[06:34]7月快手开源LivePortrait模型,表情迁移[07:10]8月StabilityAI老板成立新公司发布flux大模型[07:34]9月阿里云发布模型,海螺AI参战[08:12]9月AI新动态不断[08:14]9月,Google发布GameGen实时生成游戏[08:25]9月,通义千问2.5系列全家桶开源[08:30]9月,华为发布cloud matrix云计算基础设施[08:33]9月,GPT高级语音模式上线[08:39]9月,Meta发布AI眼镜Orion[08:49]9月,AI代码编辑器cursor爆火[09:02]10月,Pika发布1.5模型[09:08]10月,诺奖颁发给AI奠基人[09:17]10月,特斯拉发布机器人[09:23]10月,Adobe发布Illustrator+Al生成矢量图[09:32]10月,智谱AI发布autoGLM[09:49]10月,腾讯混元开源3D模型

码观 | 共识与非共识:从模型到应用,2024 AI 趋势回首与展望

三、应用形态的重构。AI Agent的突破让行业看到更多可能性——机器人获得自主行动能力的新方向,而AI编程工具的进展,也许预示着人机协作模式的变革。2024 AI关键进展时间线2月OpenAI发布视频生成模型Sora,首次实现高质量文本生成视频,开创AI视频生成新纪元3月Suno发布V3版本,AI音乐生成方向进入生产力可用状态(production ready)4月Meta发布高性能开源大模型Llama-3,降低了AI技术的准入门槛5月GPT-4发布Ray-Ban与Meta合作的智能眼镜销量突破百万字节上线即梦AI6月快手发布可灵Apple Intelligence发布9月OpenAI发布o1预览版10月Rosetta和AlphaFold算法的研发者因在蛋白质结构设计和预测中的突破性贡献获得诺贝尔化学奖约翰·霍普菲尔德和杰弗里·辛顿因人工神经网络和深度学习的开创性贡献获诺贝尔物理学奖Anthropic大模型Claude 3.5 Sonnet获得“computer use”功能12月OpenAI发布o3系列模型

走入AI的世界

2022年11月30日,OpenAI发布基于GPT 3.5的ChatGPT,自此开始,一股AI浪潮席卷全球,但AI(人工智能,Artificial Intelligence)并不是近几年才有的新鲜事,他的起源,最早可以追溯到上世纪的1943年。1943年,心理学家麦卡洛克和数学家皮特斯提出了机器的神经元模型,为后续的神经网络奠定了基础。1950年,伟大的计算机先驱图灵最早提出了图灵测试,做为判别机器是否具备智能的标准(即在一个对外不可见的房间内放置一台可以与外界沟通的机器,如果外界交互的人无法区分房间里到底是真人还是机器,那么我们就说房间里的机器具备了智能,通过了图灵测试)。1956年,在美国一个小镇的达特茅斯学院中,马文·明斯基和约翰·麦凯西拉着香农大佬站台背书,共同发起召开了著名的达特茅斯会议,在这次会议上,人工智能Artificial Intelligence一词被正式提出,并做为一门学科被确立下来。此后接近70年的漫长时间里,AI的发展起起落落,两次掀起人类对AI毁灭人类世界的恐慌,热度拉满,但又最终以“不过如此”冷却收场。图1 AI发展史

Others are asking
AI 搜索中用户查询理解
Perplexity AI 是一家专注于开发新一代 AI 搜索引擎的公司,由前 OpenAI 研究科学家 Aravind Srinivas 与前 Meta 研究科学家 Denis Yarats(Perplexity CTO)等合伙人于 2022 年 8 月共同创办。 其优势包括: 1. 理解能力强,能够深入理解查询的语义,而非仅仅匹配关键词,从而提供更准确和相关的结果。 2. 生成式回答,可生成通顺的自然语言回答,而非简单返回网页链接和片段,使结果更易于理解和使用。 3. 个性化和上下文感知,能根据用户的历史查询和偏好个性化结果,提供更贴合需求的答复。 劣势有: 1. 训练成本高,训练大型 LLM 模型需要大量计算资源和高质量训练数据。 2. 可解释性差,LLM 的工作原理较为黑箱,难以解释为何给出某个结果,缺乏透明度。 3. 潜在的偏差和不当内容,由于训练数据的局限性,LLM 可能产生偏见或不当内容。 独特之处在于将 LLM 技术应用于搜索引擎领域,试图颠覆传统基于关键词匹配的搜索范式,为用户提供更自然和智能的搜索体验,还融合了个性化和上下文感知等功能,努力成为新一代的“智能助手”。 总的来说,Perplexity 凭借 LLM 的强大语义理解能力,为搜索引擎带来了新的可能性,但也面临着一些技术和伦理挑战。 在搜索领域,推荐算法存在精确推荐提高用户黏性和平台广告收益的优点,但也有导致信息茧房和信息过载等负面影响。搜索引擎采用以用户查询为导向的“拉取式”信息获取模式,极大改变了人们获取信息的方式,搜索广告因用户搜索往往携带着明确意图,点击转化率通常高于泛泛的推荐广告,在数字广告市场中长期占据重要份额。 AI 智能体中的检索增强生成(RAG)是当今大多数现代人工智能应用程序的标准架构。以 Sana 的企业搜索用例为例,其过程始于应用程序加载和转换无结构文件,将其转换为 LLM 可查询格式,分块成更小的文本块并作为向量嵌入存储在数据库中。当用户提出问题时,系统检索语义上最相关的上下文块,折叠到“元提示”中与检索到的信息一起馈送给 LLM,LLM 合成答复返回给用户。在生产中,AI 应用程序具有更复杂的流程,包含多个检索步骤和提示链,将结果综合生成最终输出。例如 Eve 法律研究的共同驾驭员,会将查询分解为独立提示链,运行每个提示链生成中间输出,并综合编写最终备忘录。
2025-03-17
目前支持上下文长度最长的是什么AI
目前支持上下文长度较长的 AI 有以下几种: Kimi:是国内最早支持 20 万字无损上下文的 AI,现在已提升到 200 万字,对长文理解表现出色,适合处理长文本或大量信息的任务,但在文字生成和语义理解、文字生成质量方面可能不如国内其他产品,且不支持用户自定义智能体。 http://X.AI 发布的 Grok1.5:支持 128k 上下文长度,性能翻倍,在 MATH、HumanEval、GSM8K、MMLU 测试中表现出色。 AI21 发布的 Jamba:创新的 SSMTransformer 架构,支持 256K 上下文长度,结合 Joint Attention 和 Mamba 技术,提升长上下文吞吐量。
2025-03-17
检索有关AI入门必读书籍
以下是为您推荐的 AI 入门必读书籍: 1. 「」,有助于熟悉 AI 的术语和基础概念。 2. 「」,其中包含为初学者设计的课程。 3. GPT1 到 Deepseek R1 所有公开论文 The 2025 AI Engineer Reading List:涉及人工智能工程的 10 个领域,包括 LLMs、基准、提示、RAG、代理、CodeGen、视觉、语音、扩散、微调。如果您想从零开始,可以从此处开始。 4. 入门经典必读:作者为 ,原文地址:https://a16z.com/2023/05/25/aicanon/ 。文中分享了一份用于更深入了解现代 AI 的精选资源列表。
2025-03-17
AI应用分类
AI 的应用场景非常广泛,主要包括以下几类: 1. 医疗保健: 医学影像分析:用于分析医学图像辅助诊断疾病。 药物研发:加速药物研发过程,识别潜在药物候选物和设计新治疗方法。 个性化医疗:分析患者数据提供个性化治疗方案。 机器人辅助手术:控制手术机器人提高手术精度和安全性。 2. 金融服务: 风控和反欺诈:识别和阻止欺诈行为,降低金融机构风险。 信用评估:评估借款人信用风险,帮助做出贷款决策。 投资分析:分析市场数据辅助投资决策。 客户服务:提供 24/7 服务并回答常见问题。 3. 零售和电子商务: 产品推荐:分析客户数据推荐可能感兴趣的产品。 搜索和个性化:改善搜索结果提供个性化购物体验。 动态定价:根据市场需求调整产品价格。 聊天机器人:回答客户问题并解决问题。 4. 制造业: 预测性维护:预测机器故障避免停机。 质量控制:检测产品缺陷提高质量。 供应链管理:优化供应链提高效率和降低成本。 机器人自动化:控制工业机器人提高生产效率。 5. 交通运输:(未给出具体应用场景) 此外,还有众多具体的 AI 应用产品,例如: 1. 辅助创作与学习:AI 智能写作助手、语言学习助手、诗歌创作助手、书法字体生成器、漫画生成器等。 2. 推荐与规划:AI 图像识别商品推荐、美食推荐平台、旅游行程规划器、时尚穿搭建议平台、智能投资顾问等。 3. 监控与预警:AI 宠物健康监测设备、家居安全监控系统、天气预报预警系统、医疗诊断辅助系统等。 4. 优化与管理:办公自动化工具、物流路径优化工具、家居清洁机器人调度系统、金融风险评估工具等。 5. 销售与交易:AI 艺术作品生成器、书法作品销售平台、摄影作品销售平台、汽车销售平台、房地产交易平台等。 具体如: AI 摄影参数调整助手:利用图像识别、数据分析技术,在一些摄影 APP 中根据场景自动调整摄影参数。 AI 音乐情感分析平台:通过机器学习、音频处理技术,有相关音乐情感分析软件可判断音乐的情感倾向。 AI 家居智能照明系统:结合物联网技术、机器学习,像小米智能照明系统可根据用户习惯和环境变化自动调整灯光。 AI 金融风险预警平台:运用数据分析、机器学习,金融风险预警软件能提前预警金融风险。 AI 旅游路线优化平台:借助数据分析、自然语言处理,马蜂窝可根据用户需求优化旅游路线。
2025-03-17
写自媒体文章,哪个AI软件好
以下是一些适合用于写自媒体文章的 AI 软件: 1. Wordvice AI:集校对、改写转述和翻译等功能于一体的 AI 写作助手,基于大型语言模型提供全面的英文论文润色服务。 2. ChatGPT:由 OpenAI 开发的大型语言模型,可用于学生和写作人员的多方面写作辅助。 3. Quillbot:人工智能文本摘要和改写工具,可用于快速筛选和改写文献资料。 4. HyperWrite:基于 AI 的写作助手和大纲生成器,可帮助用户在写作前进行头脑风暴和大纲规划。 5. Wordtune:AI 驱动的文本改写和润色工具,可以帮助用户优化文章的语言表达。 6. Smodin:提供 AI 驱动的论文撰写功能,可以根据输入生成符合要求的学术论文。 利用 AI 不到 30 分钟打造爆款公众号文章的步骤如下: 1. 收集相关资料:明确文章主题后,借助 AI 工具高效完成。例如使用 Perplexity.AI 的强大搜索功能获取信息,输入具体的 Prompt 定位相关资讯,还可使用具备联网搜索功能的工具如微软的 Bing 搜索引擎。 2. 整理资料:收集完资料后,使用月之暗面开发的 Kimi 这个 AI 会话助手进行整理。需注意 Kimi 阅读能力有限,可分批次提供资料确保其有效读取和理解。
2025-03-17
给我推荐个 ai视频提示词
以下为为您推荐的 AI 视频提示词: 1. 史诗灾难场景 提示词: 2. 赛博朋克未来都市 提示词: 3. 奇幻神话场景 提示词: 4. Adobe Firefly AI 视频功能相关 提示词:Miniature adorable monsters made out of wool and felt,dancing with each other,3d render,octane,soft lighting,dreamy bokeh,cinematic.(用羊毛和毛毡制成的微型可爱怪物,互相跳舞,3D 渲染,辛烷值,柔和的灯光,梦幻般的散景,电影) 提示词:Footage of a camera on a drone flying over a desert with wind blowing over the dunes creating waves in the sand below.(无人机上的摄像机飞越沙漠的镜头,风吹过沙丘,在下面的沙子上产生波浪) 提示词:Detailed extremely macro closeup view of a white dandelion viewed through a large red magnifying glass 提示词:Cinematic closeup and detailed portrait of a reindeer in a snowy forest at sunset.The lighting is cinematic and gorgeous and soft and sunkissed,with golden backlight and dreamy bokeh and lens flares.The color grade is cinematic and magical.(日落时雪林中驯鹿的电影特写和详细肖像。灯光如电影股华丽、柔和、如阳光股,金色背光、梦幻股的散景和镜头光量。色彩等级具有电影股的魔力。) 提示词:Slowmotion fiery volcanic landscape,with lava spewing out of craters.the camera flies through the lava and lava splatters onto the lens.The lighting is cinematic and moody.The color grade is cinematic,dramatic,and highcontrast.(慢动作的炽热火山景观,熔岩从火山口喷涌而出。相机飞过熔岩,熔岩溅到镜头上。灯光具有电影感和喜怒无常。色彩等级具有电影感、戏剧性和高对比度)
2025-03-17
2024ai 大事记
以下是 2024 年 AI 大事纪的相关内容: 1 月: 斯坦福大学 Mobile Aloha。 1 月 10 号 LumaAl Genie 文生 3D。 1 月 11 号 GPT store 上线。 MagnificAl 高清放大爆火。 1 月最后一天苹果 Vision Pro 宣布发售。 3 月: 潞晨科技发布 OpenSora。 Suno 发布 V3 版本爆火。 4 月:英伟达发布硬件股价飙升。 5 月: 苹果发布 AI 芯片。 张吕敏发布 IC light。 7 月:快手开源 LivePortrait 模型,表情迁移。 8 月:StabilityAI 老板成立新公司发布 flux 大模型。 9 月: 阿里云发布模型,海螺 AI 参战。 Google 发布 GameGen 实时生成游戏。 通义千问 2.5 系列全家桶开源。 华为发布 cloud matrix 云计算基础设施。 GPT 高级语音模式上线。 Meta 发布 AI 眼镜 Orion。 AI 代码编辑器 cursor 爆火。 10 月: Pika 发布 1.5 模型。 诺奖颁发给 AI 奠基人。 特斯拉发布机器人。 Adobe 发布 Illustrator+Al 生成矢量图。 智谱 AI 发布 autoGLM。 腾讯混元开源 3D 模型。 云深处发布机器人山猫机器狗。 Apple 发布 Mac mini。 12 月: 李飞飞发布空间智能成果。 腾讯开源混元视频模型。 Open AI 开 12 天发布会。 微软发布 Trellis 最强开源图生 3D。 Gemini2.0 视觉交互智能体。 智元机器人开始量产。 谷歌发布 Veo2 能生成 4K 视频。 需要注意的是,本大事记经过一定筛选,带有一定倾向性,但不包含任何广告或其他商业考量,仅以新闻热度与大众反响为依据。仅代表个人看法,如有遗漏请谅解。
2025-01-10
2024AI 大事记
以下是 2024 年 AI 大事纪: 1 月: 斯坦福大学 Mobile Aloha 1 月 10 号 LumaAl Genie 文生 3D 1 月 11 号 GPT store 上线 MagnificAl 高清放大爆火 1 月最后一天苹果 Vision Pro 宣布发售 3 月: 潞晨科技发布 OpenSora Suno 发布 V3 版本爆火 4 月:英伟达发布硬件股价飙升 5 月: 苹果发布 AI 芯片 张吕敏发布 IC light AI 竞争白热化 伊莉雅离开 OpenAI,伊利亚成立新公司,估值超五亿美金 7 月:快手开源 LivePortrait 模型,表情迁移 8 月:StabilityAI 老板成立新公司发布 flux 大模型 9 月: 阿里云发布模型,海螺 AI 参战 Google 发布 GameGen 实时生成游戏 通义千问 2.5 系列全家桶开源 华为发布 cloud matrix 云计算基础设施 GPT 高级语音模式上线 Meta 发布 AI 眼镜 Orion AI 代码编辑器 cursor 爆火 10 月: Pika 发布 1.5 模型 诺奖颁发给 AI 奠基人 特斯拉发布机器人 Adobe 发布 Illustrator+Al 生成矢量图 智谱 AI 发布 autoGLM 腾讯混元开源 3D 模型 云深处发布机器人山猫机器狗 Apple 发布 Mac mini 12 月: 李飞飞发布空间智能成果 腾讯开源混元视频模型 Open AI 开 12 天发布会 微软发布 Trellis 最强开源图生 3D Gemini2.0 视觉交互智能体 智元机器人开始量产 谷歌发布 Veo2 能生成 4K 视频 宇树科技机器狗爆火,似奔着打架去 SORA 兑现引关注,被测试出奇怪问题 需要说明的是,本大事记经过一定筛选,带有一定倾向性,但不包含任何广告或其他商业考量,仅以新闻热度与大众反响为依据。仅代表个人看法,如有遗漏请谅解。
2025-01-10
如何创设一个作业时间计划管理智能体
以下是创设一个作业时间计划管理智能体的步骤: 1. 创建智能体:使用单 Agent 对话流模式。 编排对话流:点击创建新的对话流并与智能体关联。在获取笔记详情节点和笔记评论节点分别配置 cookie,note_link 使用开始节点的 USER_INPUT。 数据处理:使用代码节点对两个插件获取的结果进行处理,注意代码节点输出的配置格式。 2. 测试:找到一篇小红书笔记,试运行对话流,在对话窗口输入地址查看数据。回到智能体的编排页面进行同样的测试,确保对话流执行成功。 3. 发布: 选择多维表格,点击配置。 输出类型选文本,输入类型选择字段选择器。 完善上架信息,填写表格,选发布范围时可选择仅自己可用以加快审核。 提交上架信息,返回配置界面显示已完成,即可完成最终提交。 另外,在创建智能体时还需注意: 1. 像在“DeepSeek+扣子”的案例中,输入人设等信息,放上创建的工作流,但工作流中如【所有视频片段拼接】节点使用的插件 api_token 填的是个人 token 时,不能直接发布。可以将 api_token 作为工作流最开始的输入,用户自己购买后输入 api_token 再发布。 2. 如创建“画小二智能小助手”Coze 智能体,需打开扣子官网(https://www.coze.cn/),在 Coze 商店体验地址(https://www.coze.cn/store/bot/7371793524687241256?panel=1&bid=6cqnnu5qo7g00)点击创建 Bot,在对话框中工作空间选择“个人空间”并命名。同时设置提示词。
2025-03-17
文本生成视频最长时间的工具是什么
目前,能够进行文本生成视频且生成时间较长的工具包括以下几种: 1. Pika:出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。 2. SVD:如果熟悉 Stable Diffusion,可以安装此最新插件,在图片基础上直接生成视频,这是由 Stability AI 开源的 video model。 3. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需要收费,其视频生成时长上限为 30 秒。 4. Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 5. Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 更多的文生视频的网站可以查看这里:https://www.waytoagi.com/category/38 。 需要注意的是,内容由 AI 大模型生成,请仔细甄别。
2025-03-16
可以给出国内出名的大语言模型的信息吗,包括其模型名称,版本,发布时间,发布公司,模型参数,性能特点等信息,尽可能覆盖更多的大模型,使用表格输出,并按照发布时间排序
|模型名称|版本|发布时间|发布公司|模型参数|性能特点|适合应用| |||||||| |Baichuan213BChat|Baichuan2192K|10月31日|百川智能|未提及|在逻辑推理、知识百科、生成与创作、上下文对话等基础能力上排名200亿参数量级国内模型第一,在计算和代码能力上有一定优化空间|场景相对广泛且可以私有化部署,重点推荐在小说/广告/公文写作等内容创作场景、智能客服/语音助手以及任务拆解规划等场景,可部署在教育、医疗、金融等垂直行业中应用,同时可部署在低算力终端处理基础智能任务| |文心一言|V4.0|10月17日|百度|未提及|在计算、逻辑推理、生成与创作、传统安全这4大基础能力上排名国内第一,在代码、知识与百科、语言理解与抽取、工具使用能力上排名国内前三,各项能力表现均衡且绝大部分能力有很高的水平|能力栈较为广泛,可应用的场景较多,重点推荐在查询搜索知识应用、任务拆解规划Agent、文案写作以及代码编写及纠错等方面的应用,由于在逻辑推理方面的不俗表现,可以重点关注在科学研究、教育、工业方面的落地能力| |通义千问 2.0|2.0|10月31日|阿里云|千亿级参数|未提及|未提及|
2025-03-15
AI应用赛道中top应用介绍,实现的功能和应用场景,产品Launch时间:AIGC功能 Launch时间、当前月活用户数、营收利润、一年成本投入、市场占有率、目前融资金额及估值、创始团队介绍、公司员工规模、所属国家、用户来源、用户来自于哪些国家、用户profile、转化率、ROI等等, 盈利模式,优劣势与未来发展趋势。
以下是关于 AI 应用赛道的相关介绍: 应用场景:涵盖医疗、制造业、金融风控、消费端个性化服务、办公、农业、能源优化、娱乐等领域。 关键技术: 1. 包括大语言模型作为中枢神经系统,记忆模块实现长期和短期记忆,以及规划能力中的目标设定、任务拆解、生成策略、执行与反馈、资源管理和多智能体协同。 2. 强化学习用于环境感知和决策调整,多模态融合涉及多种数据类型,低成本训练是考虑成本的重要因素。 智能体特征:包括自主性、交互性和适应性,如通过自我对弈和博弈不断进化,在金融风控领域利用大量数据提升准确率。 AI 技术路线:从有语言能力的 AI 到有推理能力,再到能使用工具、发明创新以及形成组织,共五级。 智能体框架类型:分为任务驱动型、多智能体协作、强化学习型、具身智能体、应用型智能体,每种类型都有代表性框架。 智能体与大模型的关系:大模型是中枢和基石,智能体是行动引擎,两者协同演进,智能体产生的数据可反哺大模型。 未来趋势:智能体可能在中小企业中更具效益,人机协作中人类成为监督角色,但存在算力成本、伦理风险、技术瓶颈等挑战。 B 端变现与创业方向: 1. B 端变现细分包括高频率和大规模的内容生产细分,如文字、视频、3D 模型、AI 智能体等,底层是需求和数据收集及训练模型,算力和能源是关键。 2. 自媒体创业:视频号等平台尚有蓝海空间,需具备内容创新和差异化,内容成本低且更新迭代快。 3. 游戏创业:个人或团队可做轻量化游戏,结合 AI 技术,满足放松和社交需求,专注垂类赛道,避免与大厂竞争。 4. 影视创业:25 年将是拐点,更多内容会采用 AI 技术,如哪吒 2 因前期规划未用 AI 技术。 5. 广告营销创业:重点是 AI 虚拟人,数字插画可走治愈类型,要明确平台用户画像和产品定位,做好次留存和引入私域。 AI 虚拟人的发展与创业机遇: 1. 创业难点:创业对创业者综合能力要求极高,找到志同道合且能力互补的战友是创业前期最难的事。 2. AI 虚拟人发展:从早期以首位为核心的宅文化虚拟偶像,到以 CG 技术和动捕语音合成技术为核心的角色,再到如今以动捕和人工智能技术为核心的服务型虚拟人,其发展历程不断演进。 3. 虚拟人产业链:包括基础层的硬件和软件研发,平台层如商汤、百度等提供工具和系统,应用层涉及影视、传媒、游戏、金融、文旅等内容变现。 4. 未来创业机遇:AI 虚拟人是未来 310 年 Web 3.0 的风口,提前布局未来有潜力的赛道,准备好迎接机遇。 相关案例和产品信息: 1. 10 月 26 日,AI 翻译和口型匹配技术在视频制作中的应用逐渐流行,公司如 Captions、HeyGen 和 Verbalate 通过 AI 生成字幕、配音和口型匹配等功能,帮助用户轻松实现视频翻译本地化。 2. 10 月 25 日,Perplexity 最新估值约为 5 亿美元,较 3 月宣布的 1.5 亿美元估值上涨 300%以上,当前的付费用户数量达到了 1.5 万人,截止本月,Perplexity 的 ARR 达到 300 万美元,最新估值约为 ARR 的 150 倍。 3. 《100 个有意思的 AI 应用》由国盛证券出品,分为基于 LLM 自然语言能力的对话、写作、阅读、分析等应用;多模态技术持续发展,图像、视频、音频、3D 等 AIGC 应用;企业级应用等。
2025-03-14
快速帮我补充下大模型的发展时间线和关键节点,以及当前最前沿的新闻
大模型的发展时间线和关键节点如下: 2017 年:发布《Attention Is All You Need》论文。 2018 年: Google 提出 BERT,创新性地采用双向预训练并行获取上下文语义信息及掩码语言建模。 OpenAI 提出 GPT,开创仅使用自回归语言建模作为预训练目标的方式。 2021 年:Meta 提出 Large LAnguage Model Approach(LLAMA),成为首个开源模型。 2022 年 11 月 30 日:ChatGPT 发布,在全球范围内掀起人工智能浪潮。 2022 年 12 月:字节云雀大模型等出现。 2023 年: 国内大模型发展大致分为准备期(国内产学研迅速形成大模型共识)、成长期(数量和质量逐渐增长)、爆发期(开源闭源大模型层出不穷,形成百模大战态势)。 关键进展包括:Meta 开源 Llama2、OpenAI 发布多模态 GPT4V 及 GPT4 Turbo、百川智能开源 Baichuan7B 及 Baichuan2、百度升级文心一言 4.0、清华&智谱 AI 开源 ChatGLM2 及清华开源 ChatGLM3、腾讯发布混元助手等。 当前最前沿的新闻包括:过去半年,国内领军大模型企业实现了大模型代际追赶的奇迹,从 7 月份与 GPT3.5 的 20 分差距,到 11 月份测评时已在总分上超越 GPT3.5。
2025-03-14
我有很多产品视频,需要进行混剪,可以怎么通过AI减少工作时间,提升工作效率
以下是一些通过 AI 减少产品视频混剪工作时间、提升工作效率的方法: 1. 利用数字人技术:无需真人模特,只需上传产品图片,数字人即可手持产品进行口播展示。支持语音和口型同步,动作、姿势定制,提供 1000+多国家数字人模特,覆盖全球 28+种语言,能快速生成产品宣传视频,省去拍摄烦恼。您可以在线体验: 。 2. 产品链接生成视频:输入产品链接,一键生成数字人产品介绍视频。目前产品链接主要支持 Amazon、Shopify、ETSY、Ebay、Appstore、Google Play、WIKI 等,其他网站来源持续接入中。操作指引为输入产品网站链接——选择数字人角色——点击立即生成。如遇生成失败的问题,可尝试删除链接后缀,点击重新生成。 3. AI 视频高光切片:智能提取视频高光片段,高效二创生成新视频。适用场景为有初始长视频素材,需要提取高光镜头对初始素材进行混剪投放到短视频平台。使用指引为点击上传视频——立即生成。您可以参考案例示意,如初始视频 。
2025-03-10
ai的发展问题
AI 的发展是一个多方面且不断演进的过程。 从历史角度来看,图灵作为计算机科学和人工智能之父,提出了“图灵测试”来判断机器是否具有智能。如今,像 ChatGPT 这样的产品在与人类交流方面已经取得了令人震惊的进展,虽然学术界对其是否通过图灵测试仍存在争议,但也引发了关于新的判定标准如自主意识的思考。 在未来的发展预测方面,2024 年内,预计会在图片超短视频的精细操控、AI 音频、“全真 AI 颜值网红”、游戏 AI NPC、AI 男/女朋友聊天、实时生成内容、AI Agent、AI 的商业模式、可穿戴全天候 AI 硬件等方面有明确进展。同时,也面临着 AI 造成的 DeepFake、诈骗、网络攻击等问题,以及 AI 立法、伦理讨论落后于技术进展的情况。 到 2025 2027 年,AI 3D 技术、全真 AI 虚拟人、AR/VR 技术有望成熟,人与 AI 配合的工作方式将成为常态,同时也会带来如结构性失业等社会问题。 红杉资本的 Sonya Huang 认为,当前人工智能在各个行业的影响不断扩大,AI 产品越来越契合市场需要,生成式人工智能快速增长,但也存在如“AI 的$200B 问题”等挑战。她预测 2024 年将是真正的 AI 应用从“副驾驶”转变为“代理”的一年,未来人工智能将更有能力完成更高层次的认知任务,计算平衡将从预训练转向推理。但目前人工智能公司的融资环境不均衡,关键挑战在于提高用户保留率和缩小期望与现实之间的差距,产品与市场的契合度也需要进一步提升。
2025-03-17
AI的发展历史
AI 的发展历史如下: 1. 早期阶段(1950s 1960s):包括专家系统、博弈论、机器学习初步理论等。 2. 知识驱动时期(1970s 1980s):以专家系统、知识表示、自动推理为主要特点。 3. 统计学习时期(1990s 2000s):出现了机器学习算法,如决策树、支持向量机、贝叶斯方法等。 4. 深度学习时期(2010s 至今):深度神经网络、卷积神经网络、循环神经网络等得到广泛应用。 当前 AI 的前沿技术点包括: 1. 大模型,如 GPT、PaLM 等。 2. 多模态 AI,如视觉 语言模型(CLIP、Stable Diffusion)、多模态融合。 3. 自监督学习,如自监督预训练、对比学习、掩码语言模型等。 4. 小样本学习,如元学习、一次学习、提示学习等。 5. 可解释 AI,包括模型可解释性、因果推理、符号推理等。 6. 机器人学,涵盖强化学习、运动规划、人机交互等。 7. 量子 AI,如量子机器学习、量子神经网络等。 8. AI 芯片和硬件加速。 AI 的起源最早可追溯到 1943 年,心理学家麦卡洛克和数学家皮特斯提出了机器的神经元模型,为后续的神经网络奠定了基础。1950 年,图灵最早提出了图灵测试,作为判别机器是否具备智能的标准。1956 年,在美国达特茅斯学院召开的会议上,人工智能一词被正式提出,并作为一门学科被确立下来。此后近 70 年,AI 的发展起起落落。 最初,符号推理流行,带来了专家系统等重要进展,但因方法局限,20 世纪 70 年代出现“人工智能寒冬”。随着计算资源便宜和数据增多,神经网络方法在计算机视觉、语音理解等领域展现出色性能,过去十年中,“人工智能”一词常被用作“神经网络”的同义词。
2025-03-17
现在的AI发展到什么程度了
目前,AI 的发展已不再局限于单一的技术和应用范畴,而是融合了众多学科知识,并深入渗透到生活的各个层面,引发了一场生产力的革命。 有观点认为,AI 引领的是第四次工业革命的浪潮,继蒸汽机引发的机械化变革、电力驱动的电气化革新,以及电脑普及带来的信息化浪潮之后,AI 正推动着智能化时代的到来。 2025 开年 3 个月,AI 已经狂飙,更新密集发布,发展速度远超大多数人的预期,每天都在进步。 从技术层面看,Transformer 架构在 2017 年就被提出,但 AI 是近几年才爆发,其中重要因素之一是神经网络的规模。以 GPT 模型为例,从 2018 年第一代的 1 亿左右参数量,到 2023 年第四代的万亿规模(估计),随着参数量的增加,AI 的能力不断提升,在超过一定规模后,出现了“涌现”能力,智能程度飞速上升,但对于这种“涌现”出现的机理,目前还没有统一的解释。可以说,目前 AI 的发展更像是一种“发现”。
2025-03-14
AI发展史
AI(人工智能)的发展历程如下: 1. 起源阶段(1943 年):心理学家麦卡洛克和数学家皮特斯提出机器的神经元模型,为后续的神经网络奠定基础。 2. 1950 年:计算机先驱图灵最早提出图灵测试,作为判别机器是否具备智能的标准。 3. 1956 年:在美国达特茅斯学院,马文·明斯基和约翰·麦凯西等人共同发起召开达特茅斯会议,人工智能一词被正式提出,并作为一门学科确立下来。 此后近 70 年,AI 的发展起起落落。 AI 技术发展历程还包括: 1. 早期阶段(1950s 1960s):专家系统、博弈论、机器学习初步理论。 2. 知识驱动时期(1970s 1980s):专家系统、知识表示、自动推理。 3. 统计学习时期(1990s 2000s):机器学习算法如决策树、支持向量机、贝叶斯方法等。 4. 深度学习时期(2010s 至今):深度神经网络、卷积神经网络、循环神经网络等。 当前 AI 前沿技术点有: 1. 大模型:如 GPT、PaLM 等。 2. 多模态 AI:视觉 语言模型如 CLIP、Stable Diffusion,以及多模态融合。 3. 自监督学习:自监督预训练、对比学习、掩码语言模型等。 4. 小样本学习:元学习、一次学习、提示学习等。 5. 可解释 AI:模型可解释性、因果推理、符号推理等。 6. 机器人学:强化学习、运动规划、人机交互等。 7. 量子 AI:量子机器学习、量子神经网络等。 8. AI 芯片和硬件加速。
2025-03-12