Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

ai的发展问题

Answer

AI 的发展是一个多方面且不断演进的过程。

从历史角度来看,图灵作为计算机科学和人工智能之父,提出了“图灵测试”来判断机器是否具有智能。如今,像 ChatGPT 这样的产品在与人类交流方面已经取得了令人震惊的进展,虽然学术界对其是否通过图灵测试仍存在争议,但也引发了关于新的判定标准如自主意识的思考。

在未来的发展预测方面,2024 年内,预计会在图片-超短视频的精细操控、AI 音频、“全真 AI 颜值网红”、游戏 AI NPC、AI 男/女朋友聊天、实时生成内容、AI Agent、AI 的商业模式、可穿戴-全天候 AI 硬件等方面有明确进展。同时,也面临着 AI 造成的 DeepFake、诈骗、网络攻击等问题,以及 AI 立法、伦理讨论落后于技术进展的情况。

到 2025 - 2027 年,AI 3D 技术、全真 AI 虚拟人、AR/VR 技术有望成熟,人与 AI 配合的工作方式将成为常态,同时也会带来如结构性失业等社会问题。

红杉资本的 Sonya Huang 认为,当前人工智能在各个行业的影响不断扩大,AI 产品越来越契合市场需要,生成式人工智能快速增长,但也存在如“AI 的$200B 问题”等挑战。她预测 2024 年将是真正的 AI 应用从“副驾驶”转变为“代理”的一年,未来人工智能将更有能力完成更高层次的认知任务,计算平衡将从预训练转向推理。但目前人工智能公司的融资环境不均衡,关键挑战在于提高用户保留率和缩小期望与现实之间的差距,产品与市场的契合度也需要进一步提升。

Content generated by AI large model, please carefully verify (powered by aily)

References

一个希望有点意思的AI分享(一)

咱们会通过一些具体的例子,让大家对AI是什么有个印象;然后会尝试介绍一些AI的技术原理,希望你能体会到AI技术的美妙和深刻;接着我们会解释如何理解”AI能做什么“这个问题;再者我们会介绍一些具体的工具案例和资料;最后我们会简单聊一些AI的未来发展以及影响。首先来看AI是什么这个问题。我们从它的父亲说起。有一部电影叫做《模仿游戏》,它讲述的就是计算机科学和人工智能之父,图灵的故事。他在二战期间构建的机器,或者说计算机的原型,破译了德军的密码。他预见了计算机的发展,并开始考虑一个很深刻的问题:“如何判断一台机器具有智能?”在他的1950年的论文中,他提出了一种被称为“图灵测试”的方法。测试中,一位人类提问者通过文字通道向两个回应者(一个是计算机,另一个是人类)连续提问。在相当长的时间内,如果提问者无法可靠地区分哪个回应者是计算机,哪个是人类,那么可以认为这台计算机具备了智能。这是一个非常经典和深刻的方法,要实现这一点其实很困难。下面是2024年春OpenAI公司发布新一代ChatGPT聊天机器人(GPT4o)产品时的发布会视频,你可以选择从9分钟开始直接看用户和ChatGPT交流的现场展示部分。如果你之前对AI没有那么关注,相信你会感到震惊。这个体验已经非常接近和正常人类的交流。事实上如果考虑到知识丰富和情绪稳定,它应该比大多数人类更适合交流;p那么,请你想象一下,如果你是提问者,你觉得ChatGPT可以跨越图灵测试吗?虽然学术界依然存在着很多争议,但是确实有很多人认为目前的AI产品已经可以通过图灵测试。事实上,这可能比绝大多数人认为的到来得早得多。也有人说,我们需要新的标准来判定AI真正拥有智慧,比如,它是否拥有自主意识?那自主意识又是什么以及如何测定呢?这是人类面临的新问题。

AGI 万字长文(下)| 2024,分叉与洪流

2024年内图片-超短视频的精细操控:表情、细致动作、视频-文字匹配有一定操控能力的生成式短视频:风格化、动漫风最先成熟;真人稍晚AI音频能力长足进展:带感情的AI配音基本成熟“全真AI颜值网红”出现,可以稳定输出视频,可以直播带货游戏AI NPC有里程碑式进展,出现新的游戏生产方式AI男/女朋友聊天基本成熟:记忆上有明显突破,可以较好模拟人的感情,产品加入视频音频,粘性提升并开始出圈实时生成的内容开始在社交媒体内容、广告中出现AI Agent有明确进展,办公场景“AI助手”开始有良好使用体验2AI的商业模式开始有明确用例:数据合成、工程平台、模型安全等可穿戴-全天候AI硬件层出不穷,虽然大多数不会成功中国AI达到或超过GPT4水平;美国出现GPT5;世界上开始现“主权AI”华为昇腾生态开始形成,国内推理芯片开始国产替代(训练替代要稍晚)AI造成的DeepFake、诈骗、网络攻击等开始进入公众视野,并引发担忧AI立法、伦理讨论仍然大规模落后于技术进展……2025-2027AI 3D技术、物理规则成熟:正常人无法区别AI生成还是实景拍摄全真AI虚拟人成熟:包含感情的AI NPC成熟,开放世界游戏成熟;游戏中几乎无法区别真人和NPCAR/VR技术大规模商用接近AGI的技术出现人与AI配合的工作方式成为常态,很多日常决策开始由AI来执行AI生产的数据量超过全人类生产数据量,“真实”成为稀缺资源具身智能、核聚变、芯片、超导、机器人等技术有明显进展突破“人的模型”出现,出现“集中化AGI”与“个人AGI”的历史分叉AI引发的社会问题开始加重,结构性失业开始出现AGI对于地缘政治的影响开始显露……"Limit of Understanding";Yifei Gong 2024,with Dall-E

观点:红杉资本 | 2024年:AI的机遇、现状和未来预测

Sonya Huang的演讲深入探讨了人工智能的现状,强调了它在各个行业的影响以及人工智能充分发挥其潜力需要解决的挑战。[heading2]核心观点:[content]AI产品越来越契合市场的需要:人工智能已经在客户支持、法律服务和软件工程等行业展示了产品与市场的契合度。例如,由人工智能驱动的客户服务平台Klarnas通过处理三分之二的客户服务查询,实现了相当于700个全职座席工作的自动化。生成式人工智能正在经历快速增长:第一年的收入约为30亿美元,这一壮举是SaaS市场花了近十年时间才实现的。与以前的技术转变相比,这凸显了人工智能的加速采用和价值创造潜力。AI的$200B问题:虽然公司在AI基础设施上投入了大量资金,仅去年一年就有大约500亿美元用于NVIDIA GPU,但AI应用程序产生的收入仍然相对适中。这就提出了一个问题,即对人工智能的投资何时以及如何转化为可观的回报?预测:Sonya Huang预测,2024年将是真正的AI应用将我们从Copilots(副驾驶)转变为可以作为人类Agents(代理)的一年。之前的人工智能可能更像是一种辅助工具,而未来的人工智能将变成你的同事。她还预计,随着人工智能应用进入生产阶段,人工智能将更有能力完成更高层次的认知任务,如规划和推理,并使计算的平衡从预训练转向推理。融资环境不均衡:目前的人工智能公司的融资环境并不均衡,更关注基础模型而不是应用。对于希望利用人工智能革命的初创公司来说,这既是挑战也是机遇。关键挑战:从长远来看,提高用户保留率和缩小期望与现实之间的差距是人工智能应用取得成功需要解决的关键挑战。目前,与移动应用相比,生成式AI应用的日月活跃用户比率和一个月留存率较低。产品与市场的契合度需要进一步提升:随着基础模型变得更加智能,人工智能的产品与市场的契合度有望加速,从而在各个行业中出现更成功的人工智能应用。

Others are asking
会议记录ai
以下是关于会议记录 AI 的相关信息: 会议记录工具: 以下是一些可以用于会议总结的网站和工具: 免费的会议语音转文字工具: 有免费的会议语音转文字工具,不过大部分有使用的时间限制,超过一定的免费时间后就需要付费。以下是几款推荐的工具: 飞书妙记:https://www.feishu.cn/product/minutes ,飞书的办公套件之一 通义听悟:https://tingwu.aliyun.com/home ,阿里推出的 AI 会议转录工具 讯飞听见:https://www.iflyrec.com/ ,讯飞旗下智慧办公服务平台 Otter AI:https://otter.ai/ ,转录采访和会议纪要 更多会议记录工具请访问网站:https://waytoagi.com/sites/category/29 会议记录相关内容: 2024 年 11 月 13 日的会议记录包括: 如果能和教育结合是最好的。 AI 的能力边界展示。 办公提效。 可以提前收集教育领域的需求,让小伙伴针对性地做一些产品和服务(云谷老师协助收集需求和案例,社群小伙伴帮助实现),包括办公提效的具体场景、家校沟通、个性化教育、心理疏导、备课体系、作业批改、出题建议、对老师出题后的建议和评估、辅助出题、建立孩子的成长体系记录、孩子的成长记录智能体、孩子成长的游戏(如寻宝游戏)、朗读(模拟老师来泛读,学生背诵,AI 来评判)、文生图和文生视频(备课时的针对性)、学科本身的一些教育辅助、分析学生行为并给出策略(基于教育心理学等)、教师模拟培训、公开课备课辅助。 需求可能需要描述更清晰的最终交付物形态和背后的思考等。 企业方面可能包括具身智能、3D 眼镜、AI 绘本、AI 图书、学习机、飞书的多维表格、蚂蚁的智能体、Coze 的智能体、Zeabur 等云平台、0 编码平台、大模型(通义、智谱、kimi、deepseek 等)、编程辅助、文生图(可灵、即梦等)、推荐咖啡和奶茶等 AI 调配(需要相应资质)。
2025-03-18
最新AI领域咨询
以下是最新的 AI 领域资讯: 新手学习 AI 方面:AI 是快速发展的领域,新的研究成果和技术不断涌现。新手应持续学习和跟进,关注 AI 领域的新闻、博客、论坛和社交媒体,保持对最新发展的了解。考虑加入 AI 相关的社群和组织,参加研讨会、工作坊和会议,与其他 AI 爱好者和专业人士交流。 法律法规方面:2022 年 7 月发布了政策文件,提出建立创新的 AI 监管非法定框架,基于包括透明、安全等一系列跨部门原则。2023 年的 AI 监管白皮书基于收到的反馈阐述了最新立场,尤其考虑了新的中央职能需求,如进行系统范围的风险监测和评估 AI 监管框架。欢迎对最新提案进行反馈,并将积极与利益相关者协商,截止到 6 月 21 日。 行政命令方面:拜登签署了 AI 行政命令。美国政府已与多国就 AI 治理框架进行广泛协商,采取的行动是美国在安全、可靠和可信 AI 方法上的重要步骤,未来还需更多行动,并将继续与国会合作推进两党立法。
2025-03-18
AI对话,怎么去AI化
要实现 AI 对话的去 AI 化,可以从以下几个方面入手: 1. 语言风格: 使其具有生活化的语言习惯,使用语气词如嗯、吧、啊、哈哈哈等,增加口语化词语。 塑造搞笑人设,通过设置夸张、比喻、双关、对比、反差等手法实现幽默。 让回答变得不正经、放肆,例如大胆地开一些“玩笑”,但要注意避免侵犯他人。 2. 交流技巧: 像教实习生一样,给 AI 明确的“操作手册”,清晰表达自己的需求。 像拼乐高一样,将复杂任务拆成小模块,逐个击破。 像打乒乓球一样,进行有来有往的多回合交流,不断优化答案。 3. 准备工作: 交流前通过主题阅读相关书籍让大脑进入相关氛围。 清晰表达脑海中的想法,不能放弃指挥权,不能完全依赖 AI 随机生成。 注意框架的使用,将复杂场景拆细,同时根据不同场景灵活调整框架的维度。 4. 提示词运用: 根据场景决定提示词的约束和泛化,如公司固定的 SOP 需强约束,探讨发散场景则利用泛化能力。 练习提示词的压缩表达,先将想法用一段话描述,再浓缩,尝试用一个词或一个字精准概括。 需要注意的是,在让 AI 变得更像人类交流的过程中,最终还是要以内容质量为核心。
2025-03-18
有没有一键生成流程图的AI。参考[一招搞定:用AI秒生成专业流程图](https://mp.weixin.qq.com/s/cSLHwMFQhfU-VjSvRDJhzw)
目前有一些可以一键生成流程图的 AI 工具,例如: Lucidchart: 注册并登录: 选择模板:在模板库中搜索“项目管理流程图”。 编辑图表:根据项目需求添加和编辑图形和流程步骤。 优化布局:利用 AI 自动布局功能,优化图表的外观。 保存和分享:保存图表并与团队成员分享,或导出为 PDF、PNG 等格式。 利用这些 AI 工具,可以快速、高效地创建专业的流程图,满足各种工作和项目需求。但需要注意的是,内容由 AI 大模型生成,请仔细甄别。
2025-03-18
ai修改视频文案
以下是关于 AI 修改视频文案的相关内容: 在文案创作方面: 最初打算用旁白朗诵方式制作片子,类似《舌尖上的中国》,但直接让 GPT 写文案效果平淡,需更具体提出需求。 利用 360 浏览器字幕提取功能捕捉《爱我中华》视频文案,让 Kimi 和 ChatGPT 进行分析学习,以理解写作风格并融会贯通。对比发现,Kimi 在对中文的理解和写作能力上更突出。 让 AI 按此风格写作,整合两个 AI 的作品并调整,使文案更顺口,如将“钟山风雨起苍黄,江南佳丽地,金粉六朝都”改为“钟山风雨起苍黄,古都烟云梦犹长”。 在现阶段应用场景方面: 制作低成本的营销视频、企业宣传视频、培训课程,可使用 Synthesia、HeyGen AI、DID 等产品,用 Avatar 代替真人出镜。 出海企业给产品推广、介绍使用体验,诗云马良平台早在 21 年就推出给视频中模特换脸、切换语言的能力,近期 HenGen AI 也有相关能力,且能匹配 Avatar 口型与视频。 在歌词创作方面: 文案完成后,因剪映预设的 AI 语音效果不佳,决定为南京写歌并制作 MV。 将文案复制给 AI 进行歌词改写和取名,可定义风格和时间长度。 对比 Kimi 和 ChatGPT 写的歌词,最终修改 ChatGPT 写的歌词定稿,如“悠悠金陵风,古韵今犹存,钟山风雨起,金粉六朝魂。龙蟠虎踞地,文采风流情。梦开始之处,南京故事行。走过历史长廊,触摸时间痕迹,秦淮夜色下,灯火映繁华。夫子庙旧梦长,儒韵千古传,石头城波光里,岁月永流转。”
2025-03-18
Google AI Studio 怎么下载?
要下载 Google AI Studio,您可以按照以下步骤进行操作: 1. 打开浏览器,访问 https://aistudio.google.com/prompts/new_chat 。 2. 登录您的 Google 账户。 3. 在 model 选项处选择 Gemini 2.0 Flash Experimental 模型即可。 或者您也可以通过下载 Gemini 应用(Android 或 iOS)来使用。
2025-03-18
我自己想做一个英语背单词的游戏,让AI写出Markdown代码运行后,发现问题很大,但是我有不知如何修改这些代码。所以我觉得自己应该懂Markdown 代码语言。但是我不知道Markdown是最适合的编程语言吗?
Markdown 语言不太适合用于编写复杂的英语背单词游戏。虽然 Markdown 简单易用,常用于文档格式化,但在实现游戏逻辑和功能方面存在较大局限性。 如果您想开发英语背单词游戏,更适合使用编程语言,如 Python 等。在处理代码问题时,您可以参考以下方法: 1. 对于编程小白,向 AI 提供代码范例,尤其是新进入代码节点的 IDE 中的范例,减少对 AI 所写代码的改动。 2. 向 AI 说清楚输入变量与输出变量的类型。 3. 说明与工作流中匹配或想要的变量名称,以减少二次修改。 4. 列出输入变量的具体书写形式,对于复杂形式可使用特定方法获取。 5. 说清楚代码要实现的功能,复杂功能尽量将运行逻辑描述清楚,多用变量名称指代涉及的变量。 如果代码运行效果不尽人意,可把当前的代码、输入变量、预期结果提供给 AI,并告知错误的结果或者报错信息,让 AI 帮忙寻找问题并提供修改方案。提问时可参考以下方式: 以上是我目前的 python 代码,我的输入变量。 但是代码运行后的实际结果却是。 另外,在游戏开发与修改过程中,还需注意文件的存放要求、功能优化、平台上传等方面的问题。例如,三个重要文件需在一个文件夹,本地内置图像、音乐等也需在同一文件夹。游戏功能可增加关卡、调整金币获取和技能点花费、解决 Bug 等。研究将游戏发布到 4399 开放平台时,需注册、实名制,审核较严格。获取游戏素材可从官网免费下载或淘宝购买抠好的素材。
2025-03-18
如何解决deepseek一直“服务器繁忙,请稍后再试。”的问题?
如果您的 DeepSeek 一直显示“服务器繁忙,请稍后再试”,可以尝试以下方法: 1. 秘塔搜索: https://metaso.cn 2. 360 纳米 Al 搜索: https://www.n.cn/ 3. 硅基流动: https://siliconflow.cn/zhcn/ 4. 字节跳动火山擎: https://console.partner.volcengine.com/auth/login?redirectURI=%2Fpartner%2F5. 5. 百度云千帆: https://login.bce.baidu.com/ 6. 英伟达: https://build.nvidia.com/deepseekai/deepseekr1 7. Groq: https://groq.com/ 8. Chutes: https://chutes.ai/app 9. 阿里云百炼: https://api.together.ai/playground/chat/deepseekai/DeepSeekR1 10. Github: https://github.com/marketplace/models/azuremldeepseek/DeepSeekR1/playground 11. POE: https://poe.com/DeepSeekR1 12. Cursor: https://cursor.sh/ 13. Monica: https://monica.im/invitation?c=ACZ7WJJ9 14. Lambda: https://lambdalabscom/6 15. Cerebras: https://cerebras.ai 16. Perplexity: https://www.perplexity.ai 17. 阿里云百炼: https://api.together.ai/playground/chat/deepseekai/DeepSeekR1 另外,国内版的 Trae 目前有三个模型可供选择,都是免费无限量使用,包括 DeepSeek 系列模型,速度令人满意,能够较快地给出回答,没有遇到“服务器繁忙”的提示。 您还可以通过以下步骤解决“服务器繁忙”的问题: 1. 安装插件:使用 Chrome 或 Microsoft Edge 浏览器,点击此链接,安装浏览器插件,添加到拓展程序:https://chromewebstore.google.com/detail/pageassist%E6%9C%AC%E5%9C%B0ai%E6%A8%A1%E5%9E%8B%E7%9A%84web/jfgfiigpkhlkbnfnbobbkinehhfdhndo 2. 打开聊天页面:点击右上角的插件列表,找到 Page Assist 插件,点击打开。 3. 配置“DeepSeekR1”模型的 API key:基础 URL:https://ark.cnbeijing.volces.com/api/v3 ,填好之后,点击保存,关掉提醒弹窗。 4. 添加“DeepSeekR1”模型。 5. 打开联网功能,还可以支持联网搜索使用 R1。
2025-03-16
AI可以解决什么问题
AI 可以解决以下几类问题: 1. 教育培训方面: 可以作为数字教师,如让牛顿亲自授课《牛顿运动定律》,让白居易为您讲述《长恨歌》背后的故事。 能够与学生进行对话交流,知识的获取不再受时空限制。 提供定制化的学习计划和学习资源,实现因材施教,提高学习效率和成果。 作为数字陪伴,促进儿童成长,提高学习成绩。 2. 科学研究方面: 在不追踪整个可能性图的情况下,尝试找到为不同的可能状态或结果分配分数的方法,并仅追求分数最高的路径。 在自动定理证明中,“从初始命题向下”和“从最终定理向上”工作,试图找出路径在中间的交汇处。 训练语言模型人工智能来生成代表路径的标记序列或证明。 此外,AI 还在不断发展和拓展其应用领域,为人们的生活和工作带来更多的便利和创新。
2025-03-15
1、Puzzle 选择一个你(们)感兴趣的社会问题或者现象。 “赛博信仰”指在网络环境下衍生的一系列超现实、寄托心理期许的新兴文化现象。这种现象反映了人们在数字化时代中对精神寄托、心理安慰和未来预测的需求。赛博信仰不仅是一种文化现象,也反映了现代社会中人们对科技、信仰和现实之间关系的重新思考。 2、Facts 关于这个问题/现象,都有哪些基本事实? 比如有人购买电子形式的马克思、爱因斯坦的脑子,象征着对智慧的渴望;借助塔罗测试程序、deepseek算命等AI工具,尝试预知命运;夸赞鹿童、转发锦鲤
关于“赛博信仰”这一现象,目前所了解到的基本事实包括:有人购买电子形式的马克思、爱因斯坦的脑子以象征对智慧的渴望;借助塔罗测试程序、deepseek 算命等 AI 工具尝试预知命运;夸赞鹿童、转发锦鲤等。但目前掌握的相关事实相对有限,还需要进一步的研究和观察来更全面地了解这一现象。
2025-03-13
智能体能够在工作为我们解决哪些具体的问题,怎么搭建自己的智能体
智能体能够在工作中为我们解决以下具体问题: 1. 回答私有领域问题,如公司制度、人员信息等。 2. 及时获取最新信息,如实时天气、比赛结果等。 3. 准确回答专业问题,如复杂数学计算、图像生成等。 智能体的典型应用场景包括: 1. 私有领域知识问答:准备好相关知识库文件,可在百炼控制台快速创建应用,适用于公司制度、人员信息等场景。 2. 个性化聊天机器人:百炼提供长期记忆功能,保存关键历史对话信息,还集成夸克搜索和图像生成等插件,扩展聊天功能。 3. 智能助手:引入 RAG(检索增强生成)能力、长期记忆和自定义插件等功能,帮助提升工作效率,如处理邮件、撰写周报等。 搭建自己的智能体的一般步骤如下: 1. 创建一个智能体,输入人设等信息。 2. 放上创建的工作流。 3. 配置完成后进行测试。 需要注意的是,在工作流中,若【所有视频片段拼接】节点使用的插件 api_token 填的是您的 token,为避免他人调用消耗您的费用,不能直接发布。您可以将 api_token 作为工作流最开始的输入,用户购买后输入 api_token 再发布。 目前有不少大厂推出自己的 AI 智能体平台,如字节的扣子、阿里的魔搭社区等。以扣子为例,其是字节跳动旗下的新一代一站式 AI Bot 开发平台,无论是否具备编程基础,都能在该平台上迅速构建基于 AI 模型的各类问答 Bot,开发完成后还可发布到各种社交平台和通讯软件上。搭建扣子智能体可以通过简单 3 步:首先起一个智能体的名称,然后写一段智能体的简单介绍,最后使用 AI 创建一个头像即可。
2025-03-10
如何调试智能体回答问题准确率
调试智能体回答问题准确率可以参考以下方法: 1. 从问题场景出发:明确活动为问答对话场景,考验智能体对问题的理解和准确回答能力,真实对话场景中一般以完整句子回复。 2. 具体交流技巧:与大语言模型交流时尽量具体、丰富、少歧义,多说有用的信息。 3. 测试方法:可使用弱智吧问题对 LLM 进行测试,评价提示词的生成效果。 4. 行业案例参考: 服务和业务助手:关注回答准确率、数据覆盖范围,具备丰富的文档/多媒体/数据库支持、多数据源打通、文档 Meta 信息增强、搜索过滤、大模型召回判定等功能。 个人助理:关注回答准确率、业务数据关联性、人设契合度、多模态,通过 Prompt 优化、多模态数据上传、互联网搜索、音频/视频交互等方式提升。 多模态文件交互和数据处理:关注成本、延迟、多场景适配度,可进行自定义文件解析设置、视觉解析增强、企业级数据管理。 例如在服务和业务助手方面,内部业务助手可使用企业内部规章制度等构建知识库进行内部知识问答,通过复杂文档解析视觉增强来提供更好的文档理解。在医疗助手/法律助手/智能导购等场景,构建领域内知识库,结合规则性和智能性进行相似度阈值判定和大模型智能分析,减少数据混淆和模型幻觉问题,但判定速度略慢且有额外大模型调用费用,适合高度定制化和智能化搜索服务场景。
2025-03-08
AI发展大事记与 时间线
以下是 AI 发展的大事记与时间线: 2022 年 11 月 30 日,OpenAI 发布基于 GPT 3.5 的 ChatGPT。 2024 年 3 月,AI 发展持续升温,潞晨科技发布 OpenSora,Suno 发布 V3 版本爆火。 2024 年 4 月,英伟达发布硬件股价飙升。 2024 年 5 月,苹果发布 AI 芯片,张吕敏发布 IC light,AI 竞争白热化,伊莉雅离开 OpenAI 并成立新公司,估值超五亿美金。 2024 年 7 月,快手开源 LivePortrait 模型,表情迁移。 2024 年 8 月,StabilityAI 老板成立新公司发布 flux 大模型。 2024 年 9 月,阿里云发布模型,海螺 AI 参战,Google 发布 GameGen 实时生成游戏,通义千问 2.5 系列全家桶开源,华为发布 cloud matrix 云计算基础设施,GPT 高级语音模式上线,Meta 发布 AI 眼镜 Orion,AI 代码编辑器 cursor 爆火。 2024 年 10 月,Pika 发布 1.5 模型,诺奖颁发给 AI 奠基人,特斯拉发布机器人,Adobe 发布 Illustrator+Al 生成矢量图,智谱 AI 发布 autoGLM,腾讯混元开源 3D 模型。 在更早的时间: 1943 年,心理学家麦卡洛克和数学家皮特斯提出了机器的神经元模型,为后续的神经网络奠定了基础。 1950 年,伟大的计算机先驱图灵最早提出了图灵测试,做为判别机器是否具备智能的标准。 1956 年,在美国一个小镇的达特茅斯学院中,马文·明斯基和约翰·麦凯西拉着香农大佬站台背书,共同发起召开了著名的达特茅斯会议,在这次会议上,人工智能 Artifical Intelligence 一词被正式提出,并做为一门学科被确立下来。 2024 年的其他进展: 2 月,OpenAI 发布视频生成模型 Sora,首次实现高质量文本生成视频,开创 AI 视频生成新纪元。 3 月,Suno 发布 V3 版本,AI 音乐生成方向进入生产力可用状态。 4 月,Meta 发布高性能开源大模型 Llama3,降低了 AI 技术的准入门槛。 5 月,GPT4 发布,RayBan 与 Meta 合作的智能眼镜销量突破百万,字节上线即梦 AI。 6 月,快手发布可灵。 9 月,OpenAI 发布 o1 预览版。 10 月,Rosetta 和 AlphaFold 算法的研发者因在蛋白质结构设计和预测中的突破性贡献获得诺贝尔化学奖,约翰·霍普菲尔德和杰弗里·辛顿因人工神经网络和深度学习的开创性贡献获诺贝尔物理学奖,Anthropic 大模型 Claude 3.5 Sonnet 获得“computer use”功能。 12 月,OpenAI 发布 o3 系列模型。
2025-03-17
AI的发展历史
AI 的发展历史如下: 1. 早期阶段(1950s 1960s):包括专家系统、博弈论、机器学习初步理论等。 2. 知识驱动时期(1970s 1980s):以专家系统、知识表示、自动推理为主要特点。 3. 统计学习时期(1990s 2000s):出现了机器学习算法,如决策树、支持向量机、贝叶斯方法等。 4. 深度学习时期(2010s 至今):深度神经网络、卷积神经网络、循环神经网络等得到广泛应用。 当前 AI 的前沿技术点包括: 1. 大模型,如 GPT、PaLM 等。 2. 多模态 AI,如视觉 语言模型(CLIP、Stable Diffusion)、多模态融合。 3. 自监督学习,如自监督预训练、对比学习、掩码语言模型等。 4. 小样本学习,如元学习、一次学习、提示学习等。 5. 可解释 AI,包括模型可解释性、因果推理、符号推理等。 6. 机器人学,涵盖强化学习、运动规划、人机交互等。 7. 量子 AI,如量子机器学习、量子神经网络等。 8. AI 芯片和硬件加速。 AI 的起源最早可追溯到 1943 年,心理学家麦卡洛克和数学家皮特斯提出了机器的神经元模型,为后续的神经网络奠定了基础。1950 年,图灵最早提出了图灵测试,作为判别机器是否具备智能的标准。1956 年,在美国达特茅斯学院召开的会议上,人工智能一词被正式提出,并作为一门学科被确立下来。此后近 70 年,AI 的发展起起落落。 最初,符号推理流行,带来了专家系统等重要进展,但因方法局限,20 世纪 70 年代出现“人工智能寒冬”。随着计算资源便宜和数据增多,神经网络方法在计算机视觉、语音理解等领域展现出色性能,过去十年中,“人工智能”一词常被用作“神经网络”的同义词。
2025-03-17
现在的AI发展到什么程度了
目前,AI 的发展已不再局限于单一的技术和应用范畴,而是融合了众多学科知识,并深入渗透到生活的各个层面,引发了一场生产力的革命。 有观点认为,AI 引领的是第四次工业革命的浪潮,继蒸汽机引发的机械化变革、电力驱动的电气化革新,以及电脑普及带来的信息化浪潮之后,AI 正推动着智能化时代的到来。 2025 开年 3 个月,AI 已经狂飙,更新密集发布,发展速度远超大多数人的预期,每天都在进步。 从技术层面看,Transformer 架构在 2017 年就被提出,但 AI 是近几年才爆发,其中重要因素之一是神经网络的规模。以 GPT 模型为例,从 2018 年第一代的 1 亿左右参数量,到 2023 年第四代的万亿规模(估计),随着参数量的增加,AI 的能力不断提升,在超过一定规模后,出现了“涌现”能力,智能程度飞速上升,但对于这种“涌现”出现的机理,目前还没有统一的解释。可以说,目前 AI 的发展更像是一种“发现”。
2025-03-14
AI应用赛道中top应用介绍,实现的功能和应用场景,产品Launch时间:AIGC功能 Launch时间、当前月活用户数、营收利润、一年成本投入、市场占有率、目前融资金额及估值、创始团队介绍、公司员工规模、所属国家、用户来源、用户来自于哪些国家、用户profile、转化率、ROI等等, 盈利模式,优劣势与未来发展趋势。
以下是关于 AI 应用赛道的相关介绍: 应用场景:涵盖医疗、制造业、金融风控、消费端个性化服务、办公、农业、能源优化、娱乐等领域。 关键技术: 1. 包括大语言模型作为中枢神经系统,记忆模块实现长期和短期记忆,以及规划能力中的目标设定、任务拆解、生成策略、执行与反馈、资源管理和多智能体协同。 2. 强化学习用于环境感知和决策调整,多模态融合涉及多种数据类型,低成本训练是考虑成本的重要因素。 智能体特征:包括自主性、交互性和适应性,如通过自我对弈和博弈不断进化,在金融风控领域利用大量数据提升准确率。 AI 技术路线:从有语言能力的 AI 到有推理能力,再到能使用工具、发明创新以及形成组织,共五级。 智能体框架类型:分为任务驱动型、多智能体协作、强化学习型、具身智能体、应用型智能体,每种类型都有代表性框架。 智能体与大模型的关系:大模型是中枢和基石,智能体是行动引擎,两者协同演进,智能体产生的数据可反哺大模型。 未来趋势:智能体可能在中小企业中更具效益,人机协作中人类成为监督角色,但存在算力成本、伦理风险、技术瓶颈等挑战。 B 端变现与创业方向: 1. B 端变现细分包括高频率和大规模的内容生产细分,如文字、视频、3D 模型、AI 智能体等,底层是需求和数据收集及训练模型,算力和能源是关键。 2. 自媒体创业:视频号等平台尚有蓝海空间,需具备内容创新和差异化,内容成本低且更新迭代快。 3. 游戏创业:个人或团队可做轻量化游戏,结合 AI 技术,满足放松和社交需求,专注垂类赛道,避免与大厂竞争。 4. 影视创业:25 年将是拐点,更多内容会采用 AI 技术,如哪吒 2 因前期规划未用 AI 技术。 5. 广告营销创业:重点是 AI 虚拟人,数字插画可走治愈类型,要明确平台用户画像和产品定位,做好次留存和引入私域。 AI 虚拟人的发展与创业机遇: 1. 创业难点:创业对创业者综合能力要求极高,找到志同道合且能力互补的战友是创业前期最难的事。 2. AI 虚拟人发展:从早期以首位为核心的宅文化虚拟偶像,到以 CG 技术和动捕语音合成技术为核心的角色,再到如今以动捕和人工智能技术为核心的服务型虚拟人,其发展历程不断演进。 3. 虚拟人产业链:包括基础层的硬件和软件研发,平台层如商汤、百度等提供工具和系统,应用层涉及影视、传媒、游戏、金融、文旅等内容变现。 4. 未来创业机遇:AI 虚拟人是未来 310 年 Web 3.0 的风口,提前布局未来有潜力的赛道,准备好迎接机遇。 相关案例和产品信息: 1. 10 月 26 日,AI 翻译和口型匹配技术在视频制作中的应用逐渐流行,公司如 Captions、HeyGen 和 Verbalate 通过 AI 生成字幕、配音和口型匹配等功能,帮助用户轻松实现视频翻译本地化。 2. 10 月 25 日,Perplexity 最新估值约为 5 亿美元,较 3 月宣布的 1.5 亿美元估值上涨 300%以上,当前的付费用户数量达到了 1.5 万人,截止本月,Perplexity 的 ARR 达到 300 万美元,最新估值约为 ARR 的 150 倍。 3. 《100 个有意思的 AI 应用》由国盛证券出品,分为基于 LLM 自然语言能力的对话、写作、阅读、分析等应用;多模态技术持续发展,图像、视频、音频、3D 等 AIGC 应用;企业级应用等。
2025-03-14
快速帮我补充下大模型的发展时间线和关键节点,以及当前最前沿的新闻
大模型的发展时间线和关键节点如下: 2017 年:发布《Attention Is All You Need》论文。 2018 年: Google 提出 BERT,创新性地采用双向预训练并行获取上下文语义信息及掩码语言建模。 OpenAI 提出 GPT,开创仅使用自回归语言建模作为预训练目标的方式。 2021 年:Meta 提出 Large LAnguage Model Approach(LLAMA),成为首个开源模型。 2022 年 11 月 30 日:ChatGPT 发布,在全球范围内掀起人工智能浪潮。 2022 年 12 月:字节云雀大模型等出现。 2023 年: 国内大模型发展大致分为准备期(国内产学研迅速形成大模型共识)、成长期(数量和质量逐渐增长)、爆发期(开源闭源大模型层出不穷,形成百模大战态势)。 关键进展包括:Meta 开源 Llama2、OpenAI 发布多模态 GPT4V 及 GPT4 Turbo、百川智能开源 Baichuan7B 及 Baichuan2、百度升级文心一言 4.0、清华&智谱 AI 开源 ChatGLM2 及清华开源 ChatGLM3、腾讯发布混元助手等。 当前最前沿的新闻包括:过去半年,国内领军大模型企业实现了大模型代际追赶的奇迹,从 7 月份与 GPT3.5 的 20 分差距,到 11 月份测评时已在总分上超越 GPT3.5。
2025-03-14
AI发展史
AI(人工智能)的发展历程如下: 1. 起源阶段(1943 年):心理学家麦卡洛克和数学家皮特斯提出机器的神经元模型,为后续的神经网络奠定基础。 2. 1950 年:计算机先驱图灵最早提出图灵测试,作为判别机器是否具备智能的标准。 3. 1956 年:在美国达特茅斯学院,马文·明斯基和约翰·麦凯西等人共同发起召开达特茅斯会议,人工智能一词被正式提出,并作为一门学科确立下来。 此后近 70 年,AI 的发展起起落落。 AI 技术发展历程还包括: 1. 早期阶段(1950s 1960s):专家系统、博弈论、机器学习初步理论。 2. 知识驱动时期(1970s 1980s):专家系统、知识表示、自动推理。 3. 统计学习时期(1990s 2000s):机器学习算法如决策树、支持向量机、贝叶斯方法等。 4. 深度学习时期(2010s 至今):深度神经网络、卷积神经网络、循环神经网络等。 当前 AI 前沿技术点有: 1. 大模型:如 GPT、PaLM 等。 2. 多模态 AI:视觉 语言模型如 CLIP、Stable Diffusion,以及多模态融合。 3. 自监督学习:自监督预训练、对比学习、掩码语言模型等。 4. 小样本学习:元学习、一次学习、提示学习等。 5. 可解释 AI:模型可解释性、因果推理、符号推理等。 6. 机器人学:强化学习、运动规划、人机交互等。 7. 量子 AI:量子机器学习、量子神经网络等。 8. AI 芯片和硬件加速。
2025-03-12