Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

从行业角度怎么理解AI行业

Answer

从行业角度理解 AI 行业可以从以下几个方面来看:

  1. 领军人物与公司:以 OpenAI 及其掌舵人山姆·奥特曼为例,了解其为人处事态度和原则,以及宏伟构想,有助于洞悉 AI 行业的理念趋势。
  2. 行业渗透率:AI 对各行业的渗透呈现出不同的生态位。如智能驾驶和具身智能行业对 AI 技术需求紧密且伴生性强,处于第一梯队;营销、游戏、影视和智能硬件行业处于第二梯队,通过 AI 技术实现生产降本增效和行业升级;教育和医疗基础行业处于第三梯队,在政策支持下积极拥抱 AI 技术,但对安全可控性有更高要求。行业的数据基础和用户需求是影响 AI 技术渗透和变革力的关键因素。
  3. 创投情况:2024 年,AI 仍是最强吸金赛道。国内 AI 行业融资总金额增加,但事件数同比下降,马太效应明显,资本更青睐热点和高成熟度赛道。智能驾驶在各细分赛道中独占鳌头,AI+教育、AI+游戏、AI+医疗等赛道投资总额也有所增长。同时,政府积极推进 AI 原生行业发展,出台政策吸引人才和企业,国家队频繁出手投资体现政策支持。
Content generated by AI large model, please carefully verify (powered by aily)

References

山姆·奥特曼传(一):我是如何走到今天的

在商业投资领域流传着这样一句话:想了解一个行业,需要了解行业中的龙头公司。而想了解一个公司,则需要首先了解它的领导。当下AI行业的佼佼者非OpenAI莫属,而山姆·奥特曼则是这家龙头公司的掌舵人。以小看大,了解其为人处事态度和原则,可洞悉这位领袖的优秀本质。以近看远,可看清其宏伟构想,掌握AI行业的理念趋势。

《2024年度AI十大趋势报告》发布:技术创新、产品洗牌、行业动态一文看尽

报告中,量子位智库将AI渗透行业的关键归纳为3类情景、9大因素,以解码行业发展背后不变的规律。以下图所示的8个代表行业为例:从AI行业影响力图谱可以看出,当前阶段,AI对各行业的渗透及引发的变革,呈现出较为清晰的三个生态位:第一梯队中的智能驾驶和具身智能行业对AI技术具有紧密需求和强伴生性,显示出强关联。第二梯队包括营销、游戏行业、影视行业和智能硬件。前三者通过AI技术实现生产降本增效、深度整合工作流;智能硬件行业有望通过AI技术推动行业升级。第三梯队涵盖了教育和医疗基础行业。这些行业在政策支持下积极拥抱AI技术,同时对安全可控性有更高要求。总体而言,AI技术在不同行业的渗透和变革力受到多种因素的影响,其中,行业的数据基础和用户需求或成关键因素。

《2024年度AI十大趋势报告》发布:技术创新、产品洗牌、行业动态一文看尽

回顾2024年,放眼世界,AI仍旧是最强吸金赛道。据统计,国内AI行业融资总金额增加,但事件数同比下降,反应了机构更加谨慎的理性态度;同时马太效应越发明显,资本更青睐热点赛道和高成熟度赛道。在各细分赛道中,智能驾驶独占鳌头,投资事件数量和金额总数远超其他赛道,且多家企业的成功IPO为市场注入了巨大信心与活力。AI+教育、AI+游戏、AI+医疗等赛道也迎来了投资总额的增长,调研统计结果显示,机构对技术难度更高、壁垒更强、更晚达到TPF(Technology-Product Fit)的赛道展现出更强兴趣。在政策方面,由于政府对AI技术本身及其在各行业落地的长期关注,尤其积极推进AI原生行业发展,北京、上海、武汉等城市已经出台一系列政策,吸引AI相关的人才聚集与企业落地。同时,国家队的频繁出手投资体现出政策的鼓励与支持。2024年度AI十大趋势报告2023十大前沿科技趋势报告|多行文本|标签|备注|附件||-|-|-|-||2022十大前沿科技趋势报告|年度趋势||||2021十大前沿科技趋势报告|年度趋势|||

Others are asking
零基础学习ai
以下是为零基础学习 AI 提供的建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,可根据自己的兴趣选择特定模块深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 知识库提供了很多实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解其工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 此外,还有一个案例供您参考:二师兄来自上海,是典型的 80 后,房地产行业从业二十年,计算机零基础。2024 年 2 月,他在七彩虹的售后群中,因老哥分享用 AI 绘画的心得,要了 SD 秋叶安装包,下载了教学视频,迈出了 AI 学习的第一步。之后他不断学习和实践,如在 3 月啃完 SD 的所有教程并开始炼丹,4 月与小伙伴探讨 AI 变现途径,5 月加入 Prompt battle 社群,开始 Midjourney 的学习。
2025-02-18
AI数据分析
以下是关于 AI 数据分析的相关内容: ChatGPT 助力数据分析: 本文重点介绍了 AI 与数据分析结合的应用,通过实际案例与相关技巧,描述了 ChatGPT 如何助力数据分析。 实现了两种方式支持多维数据分析: SQL 分析:分析平台自身使用情况,输入一句话可分析用户配置图表相关数据。用户描述想分析的内容,后台连接 DB,附带表结构信息让 AI 输出 SQL 语句,校验为 SELECT 类型后执行返回结果数据,再传给 GPT 分析,最后输出分析结论和建议并返回前端页面渲染图表。 个性化分析:平台支持上传数据,可提供数据信息辅助分析,前端解析文件后传给 GPT 分析,后续步骤与 SQL 分析一致。 分析完成后展示结果数据的图表和分析结论,图表支持折线图和柱状图可随意切换。 生成式 AI 季度数据报告 2024 月 1 3 月: 作者包括郎瀚威 Will、张蔚 WeitoAGI、江志桐 Clara 等。 报告涵盖总体流量概览、分类榜单、文字相关(个人生产力、营销、教育、社交)、创意相关(图像、视频)、音频大类、代码大类、Agent、B2B 垂类等方面。 涉及数据准备、分类标准图谱准备、赛道分析、竞争分析等内容。
2025-02-18
找一个能够生成音乐的AI。我给一个曲名(比如《生日快乐歌》),他就能给我生成不同风格的音乐供我下载。
以下为您推荐能够根据给定曲名生成不同风格音乐并供下载的 AI 工具: 1. Suno AI: 地址:https://www.suno.ai/ 简介:被誉为音乐界的 ChatGPT,能够根据简单提示创造出从歌词到人声和配器的完整音乐作品。 账号要求:需要拥有 Discord、谷歌或微软中的至少一个账号,并确保网络环境稳定。 订阅信息: 免费用户每天 50 积分,每首歌消耗 5 积分,每天可创作 10 首歌曲,每次点击生成两首歌曲。 Pro 用户每月 2500 点数(大约 500 首歌),按月每月 10 美元,按年每月 8 美元,每年 96 美元。 Premier 用户每月 10000 点数(大约 2000 首歌),按月每月 30 美元,按年每月 24 美元,每年 288 美元。 操作模式: 默认模式:包括关闭个性化、歌曲描述、乐器开关、模型选择 v3 等设置。 个性化模式:开启个性化定制,可填写歌词、曲风、标题等。 生成歌词:可使用大模型如 Kimi、GPT、文心一言等生成。 开始生成:填写好所需内容后点击 Create,等待 2 3 分钟即可。 下载:生成后可下载。 2. Udio:由前 Google DeepMind 工程师开发,通过文本提示快速生成符合用户音乐风格喜好的高质量音乐作品。地址:https://www.udio.com/ 3. YuE:支持从歌词生成 5 分钟高质量音乐(含人声与伴奏),多语言支持(中、英、日、韩),覆盖多种音乐风格与专业声乐技术。详细介绍:https://www.xiaohu.ai/c/xiaohuai/yue5
2025-02-18
什么是aigc
AIGC(人工智能生成内容)是一种利用人工智能技术生成各种类型内容的应用方式。它能够通过机器学习和深度学习算法,根据输入的数据和指令生成符合特定要求的内容,在内容创作、广告、媒体等领域有着广泛的应用。 具体来说,AIGC 包括以下方面: 1. 文字生成:使用大型语言模型(如 GPT 系列模型)生成文章、故事、对话等内容。 2. 图像生成:使用 Stable Diffusion、DALLE 等模型生成艺术作品、照片等。 3. 视频生成:使用 Runway、KLING 等模型生成动画、短视频等。 AIGC 作为一种强大的技术,能赋能诸多领域,但也存在多重潜在的合规风险。目前,我国对 AIGC 的监管框架由《网络安全法》《数据安全法》及《个人信息保护法》构成,并与《互联网信息服务算法推荐管理规定》、《互联网信息服务深度合成管理规定》、《生成式人工智能服务管理暂行办法》、《科技伦理审查办法(试行)》等形成了共同监管的形势。 AIGC 主要分为语言文本生成、图像生成和音视频生成。语言文本生成利用马尔科夫链、RNN、LSTMs 和 Transformer 等模型生成文本,如 GPT4 和 Gemini Ultra。图像生成依赖于 GANs、VAEs 和 Stable Diffusion 等技术,应用于数据增强和艺术创作,代表项目有 Stable Diffusion 和 StyleGAN 2。音视频生成利用扩散模型、GANs 和 Video Diffusion 等,广泛应用于娱乐和语音生成,代表项目有 Sora 和 WaveNet。此外,AIGC 还可应用于音乐生成、游戏开发和医疗保健等领域,展现出广泛的应用前景。 例如 AI 文本续写,文字转图像的 AI 图、AI 主持人等,都属于 AIGC 的应用。类似的名词缩写还有 UGC(普通用户生产),PGC(专业用户生产)等。能进行 AIGC 的产品项目也很多,能进行 AIGC 的媒介也很多,包括且不限于: 1. 语言文字类:OpenAI 的 GPT,Google 的 Bard,百度的文心一言,还有一种国内大佬下场要做的的 LLM 都是语言类的。 2. 语音声音类:Google 的 WaveNet,微软的 Deep Nerual Network,百度的 DeepSpeech 等,还有合成 AI 孙燕姿大火的开源模型 Sovits。 3. 图片美术类:早期有 GEN 等图片识别/生成技术,去年大热的扩散模型又带火了我们比较熟悉的、生成质量无敌的 Midjourney,先驱者谷歌的 Disco Diffusion,一直在排队测试的 OpenAI 的 Dalle·2,以及 stability ai 和 runaway 共同推出的 Stable Diffusion。
2025-02-18
多维表格AI接入分享课程有回放么
多维表格 AI 接入分享课程有回放。例如,在“1204|微信超级 AI 知识助手教学(上)—智谱共学营智能纪要”中提到直播有回放。在“飞书多维表格 AI 共学解锁更强大的豆包 2024 年 12 月 21 日”中,王大仙表示分享有回放,可顺着搭建流程使用。
2025-02-18
我的毕业论文是AIGC的陶寺遗址空间可视分析技术研究,请问有何思路
对于您的毕业论文主题“AIGC 的陶寺遗址空间可视分析技术研究”,以下是一些可能的思路供您参考: 首先,深入了解陶寺遗址的相关背景和特点,包括其历史、文化、地理等方面的信息,这将为后续的分析提供基础。 其次,研究 AIGC 技术在空间可视分析方面的应用现状和前沿成果,了解相关的算法、模型和工具。 然后,考虑如何收集和整理陶寺遗址的空间数据,例如通过实地测量、卫星图像、考古记录等方式获取数据,并对数据进行预处理和清洗。 接着,运用合适的 AIGC 技术和算法,对陶寺遗址的空间数据进行可视化呈现,例如创建三维模型、绘制地图、生成动态图像等,以直观展示遗址的空间特征和关系。 在可视化的基础上,进行深入的分析,例如探究遗址的布局规律、空间结构、功能分区等,挖掘潜在的历史和文化信息。 最后,对研究结果进行评估和验证,确保其准确性和可靠性,并提出进一步的改进和优化方向。 希望这些思路能对您有所帮助,祝您顺利完成毕业论文!
2025-02-18
我想做一个产品(生涯规划领域的垂直大模型),这个产品服务的对象是所有人:帮助所有人进行更好的职业规划。每个人都能通过使用这个产品更好地了解自己,了解自己的天赋、兴趣、优势,然后找到自己的热爱的领域和热爱的事业,并且能够个性化地推荐相关的行业和职业,包括职业的主要工作内容和核心能力要求等等。 请对这个产品进行可行性分析,并给出产品的发展规划,别忘了给这个项目起一个名字。
以下是对您提出的生涯规划领域垂直大模型产品的可行性分析和发展规划,并为项目取名为“生涯智途”。 可行性分析: 1. 需求广泛:帮助人们进行职业规划是一个普遍存在的需求,涵盖了各个年龄段和职业阶段的人群。 2. 数据可用性:可以通过各种渠道收集大量与职业相关的数据,包括行业报告、职位描述、人才需求等。 3. 技术支持:当前大模型技术的发展为实现这样的产品提供了可能,能够处理和分析大量复杂的数据。 发展规划: 1. 数据收集与整理:广泛收集各类职业数据,建立丰富的数据库,确保数据的准确性和完整性。 2. 模型训练与优化:利用收集到的数据进行模型训练,不断优化模型,提高预测和推荐的准确性。 3. 功能开发: 个性化测评:开发能够准确评估用户天赋、兴趣、优势的功能模块。 精准推荐:根据用户的特点,提供个性化的行业和职业推荐,并详细介绍职业的工作内容和核心能力要求。 持续学习与更新:随着行业变化,及时更新数据和模型,以提供最新的职业信息。 4. 用户体验优化:设计简洁、易用的界面,提供良好的用户交互体验。 5. 市场推广:通过线上线下多种渠道进行推广,提高产品的知名度和用户覆盖面。 希望以上分析和规划对您有所帮助。
2025-02-18
有关于数据标注行业发展趋势的文章吗?
以下是关于数据标注行业发展趋势的相关内容: 数据标注行业呈现出以下几个主要的发展趋势: 从量到质的转变:早期大模型训练侧重通过大量算力和大规模数据集来提升性能,但随着技术进步,数据质量成为提高模型性能的关键瓶颈,更注重提高数据的质量和相关性,而非单纯增加数据量和算力。 数据标注向知识密集型转变:多模态模型需处理多种类型数据,使数据标注过程更细致复杂。例如进行情绪判断或推理时,需要更高水平的理解和分析能力。这要求从事标注的人员不仅要接受专业培训,在某些情况下还需要特定领域专家执行。 数据标注的自动化和合成数据的使用:随着人工智能技术发展,数据标注领域正经历自动化转型,可使用大模型自动标注数据,提高标注效率并减少人力成本。合成数据使用越来越普遍,因其成本较低、能避免隐私问题及可生成长尾场景数据。例如在自动驾驶领域,可用于生成罕见但关键的路况场景,提高模型的鲁棒性和准确性。 此外,相关法律法规也对生成式人工智能技术研发过程中的数据标注做出规定,如提供者应制定清晰、具体、可操作的标注规则,开展数据标注质量评估,对标注人员进行必要培训等。
2025-02-17
deepseek的产生对AI行业的影响
DeepSeek 的产生对 AI 行业具有多方面的影响: 1. 华尔街分析师的反应: DeepSeek 展示出媲美领先 AI 产品性能的模型,但成本仅为其一小部分,在全球主要市场的 App Store 登顶。 Jefferies 警告其技术可能打破资本开支狂热,Citi 对其技术突破提出质疑。 高盛预测其可能改变科技巨头与初创公司的竞争格局,降低 AI 行业进入门槛。 2. 实际使用体验: 在文字能力上表现突出,尤其在中文场景中高度符合日常、写作习惯,但在专业论文总结方面稍弱。 数学能力经过优化,表现不错;编程能力略逊于 GPT,据用户反馈。 GRPO 算法替代传统 PPO,降低价值函数估计难度,提高语言评价场景的灵活性与训练速度。 3. 训练成本方面: 训练成本远高于传闻的 600 万美元,总计约 13 亿美元。 定价低于实际成本,导致高额亏损。 MixtureofExpert 方法降低计算需求,但大规模内存使用可能反而增加总成本。 4. 竞争格局影响: 以低成本开发顶级 AI 模型的 Mistral AI 被中国 DeepSeek 迅速赶超。 DeepSeek 的“极简算力”模式可能削弱 Mistral 的竞争优势。
2025-02-17
最新的AI行业动态和进展有哪些,包含2025年
以下是关于最新的 AI 行业动态和进展(包含 2025 年)的内容: 2024 年: 图片超短视频的精细操控:包括表情、细致动作、视频文字匹配。 有一定操控能力的生成式短视频:风格化、动漫风最先成熟,真人稍晚。 AI 音频能力长足进展:带感情的 AI 配音基本成熟。 “全真 AI 颜值网红”出现,可以稳定输出视频,可以直播带货。 游戏 AI NPC 有里程碑式进展,出现新的游戏生产方式。 AI 男/女朋友聊天基本成熟:记忆上有明显突破,可以较好模拟人的感情,产品加入视频音频,粘性提升并开始出圈。 实时生成的内容开始在社交媒体内容、广告中出现。 AI Agent 有明确进展,办公场景“AI 助手”开始有良好使用体验。 AI 的商业模式开始有明确用例:数据合成、工程平台、模型安全等。 可穿戴全天候 AI 硬件层出不穷,虽然大多数不会成功。 中国 AI 达到或超过 GPT4 水平;美国出现 GPT5;世界上开始现“主权 AI”。 华为昇腾生态开始形成,国内推理芯片开始国产替代(训练替代要稍晚)。 AI 造成的 DeepFake、诈骗、网络攻击等开始进入公众视野,并引发担忧。 AI 立法、伦理讨论仍然大规模落后于技术进展。 2025 2027 年: AI 3D 技术、物理规则成熟:正常人无法区别 AI 生成还是实景拍摄。 全真 AI 虚拟人成熟:包含感情的 AI NPC 成熟,开放世界游戏成熟;游戏中几乎无法区别真人和 NPC。 AR/VR 技术大规模商用。 接近 AGI 的技术出现。 人与 AI 配合的工作方式成为常态,很多日常决策开始由 AI 来执行。 AI 生产的数据量超过全人类生产数据量,“真实”成为稀缺资源。 具身智能、核聚变、芯片、超导、机器人等技术有明显进展突破。 “人的模型”出现,出现“集中化 AGI”与“个人 AGI”的历史分叉。 AI 引发的社会问题开始加重,结构性失业开始出现。 AGI 对于地缘政治的影响开始显露。 此外,还有以下相关动态: 算力瓶颈不只是单纯的技术和建设问题,而是影响整个行业竞争格局的重要变量。 逐渐进入多模态灵活转换的新时代,实现文本、图像、音频、视频及其他更多模态之间的互相理解和相互转换。 人类劳动形式逐步“软件化”,复杂劳动被抽象为可调用的软件服务,劳动流程被大幅标准化和模块化,劳动能力像“即插即用”的工具一样易于获取。 AI 行业目前仍处于严重亏损的阶段,商业化进程仍有巨大提升空间。 云厂商是产业链中毋庸置疑的“链主”。 2024 年,头部 AI 应用的品类变化并不显著。创意工具(如图像和视频内容创作)依然占据最大比重。To P(面向专业用户)应用展现出强大的市场潜力,ToB(面向企业)应用发展路径相对复杂,ToC 应用面临较大的挑战。 在 AI 应用领域,Copilot 和 AI Agent 是两种主要的技术实现方式。 北美和欧洲贡献了 AI 移动应用市场三分之二的份额,众多中国 AI 公司积极出海。 2024 年 10 月的大事记包括: Gartner 发布 2025 年十大战略技术趋势。 DeepSeek 开源多模态 LLM 框架 Janus。 司南开源大模型能力评估模型 CompassJudger。 Anthropic 发布新功能 computer use,发布 Claude 3.5 Haiku,更新 Claude 3.5 Sonnet。 Stability AI 发布 Stable Diffusion 3.5。 x.AI 正式推出 API。 ComfyUI V1 官方桌面版开放内测。 华为发布纯血操作系统鸿蒙 OS NEXT。 Jina AI 推出高性能分类器 Classifier API。 OpenAI 发布图像生成模型 sCM。 Midjourney 上线外部图片编辑器。 Runway 发布动画视频功能 ActOne。 Ideogram 推出 AI 画板工具 Canvas。 Genmo 开源视频生成模型 Mochi 1。 荣耀发布操作系统 MagicOS 9.0。 美国 14 岁少年与 C.AI 聊天后离世。 新华社发文表示警惕「AI 污染」乱象。 港中文&趣丸推出 TTS 模型 MaskGCT。 科大讯飞发布讯飞星火 4.0 Turbo。 阿里通义代码模式开始内测。 Anthropic Claude 新增数据分析功能。 北京市大中小学推广 AI 学伴和 AI 导学应用。 稚晖君开源「灵犀 X1」全套资料。 OpenAI 高管 Miles Brundage 离职。
2025-02-17
最新的AI行业动态和进展有哪些
以下是最新的 AI 行业动态和进展: 1. 《2024 年度 AI 十大趋势报告》发布,其中提到大模型创新方面,架构优化加速涌现,融合迭代大势所趋;Scaling Law 泛化方面,推理能力成皇冠明珠,倒逼计算和数据变革;AGI 探索方面,视频生成点燃世界模型,空间智能统⼀虚拟和现实;AI 应用格局方面,第⼀轮洗牌结束,聚焦 20 赛道 5 大场景;AI 应用竞争方面,多领域竞速运营大于技术,AI 助手兵家必争;AI 应用增长方面,AI+X 赋能类产品大干快上,原生 AI 爆款难求;AI 产品趋势方面,多模态上马,Agent 席卷⼀切,高度个性化呼之欲出;AI 智变千行百业,左手变革生产力,右手重塑行业生态;AI 行业渗透率方面,数据基础决定初速度,用户需求成为加速度;AI 创投方面,投融资马太效应明显,国家队出手频率提升。 2. 2024 年 9 月的 AI 行业大事记: 9 月 12 日:李继刚再现神级 Prompt,玩法持续翻新;Mistral 发布首个多模态模型 Pixtral 12B。 9 月 13 日:商汤 Vimi 相机开放微博小程序;元象开源中国最大 MoE 大模型 XVERSEMoEA36B;OpenAI 发布 o1 模型。 9 月 14 日:人工智能生成合成内容标识办法(征求意见稿);Jina AI 发布 ReaderLM 和 Jina Embeddings V3。 9 月 18 日:DeepSeek 发文庆祝登上 LMSYS 榜单国产第一,几小时后 Qwen 新模型表示不服。 9 月 19 日:云栖大会;通义万相 AI 生视频上线;快手可灵 1.5 模型新增运动笔刷能力。 9 月 20 日:腾讯元器智能体对外发布;秘塔科技产品经理 JD 走红 AI 圈;阶跃跃问接入 Step2 万亿参数 MoE 语言大模型。 9 月 21 日:大模型测试基准研究组正式成立。 9 月 23 日:钉钉 365 会员上线。 9 月 24 日:讯飞星火 API 全新升级;豆包大模型全系列发布&更新。 9 月 25 日:Vidu API 正式开放,加速企业级视频创作;OpenAI 发布高级语音功能;西湖心辰开源 WestlakeOmni。 3. 2024 年,国内 AI 行业融资总金额增加,但事件数同比下降,马太效应越发明显,资本更青睐热点和高成熟度赛道。智能驾驶在各细分赛道中独占鳌头,AI+教育、AI+游戏、AI+医疗等赛道投资总额也有增长。政府积极推进 AI 原生行业发展,北京、上海、武汉等城市出台系列政策吸引人才和企业,国家队频繁投资体现政策支持。
2025-02-17
最新的AI行业动态和进展有哪些
以下是最新的 AI 行业动态和进展: 1. 《2024 年度 AI 十大趋势报告》发布,其中提到: 大模型创新方面,架构优化加速涌现,融合迭代大势所趋。 Scaling Law 泛化,推理能力成皇冠明珠,倒逼计算和数据变革。 AGI 探索中,视频生成点燃世界模型,空间智能统⼀虚拟和现实。 AI 应用格局方面,第一轮洗牌结束,聚焦 20 赛道 5 大场景。 AI 应用竞争中,多领域竞速运营大于技术,AI 助手兵家必争。 AI 应用增长方面,AI+X 赋能类产品大干快上,原生 AI 爆款难求。 AI 产品趋势为多模态上马,Agent 席卷一切,高度个性化呼之欲出。 AI 智变千行百业,左手变革生产力,右手重塑行业生态。 AI 行业渗透率方面,数据基础决定初速度,用户需求成为加速度。 AI 创投方面,投融资马太效应明显,国家队出手频率提升。 2. 2024 年 9 月的 AI 行业大事记: 9 月 12 日:李继刚再现神级 Prompt,玩法持续翻新;Mistral 发布首个多模态模型 Pixtral 12B。 9 月 13 日:商汤 Vimi 相机开放微博小程序;元象开源中国最大 MoE 大模型 XVERSEMoEA36B;OpenAI 发布 o1 模型。 9 月 14 日:人工智能生成合成内容标识办法(征求意见稿);Jina AI 发布 ReaderLM 和 Jina Embeddings V3。 9 月 18 日:DeepSeek 发文庆祝登上 LMSYS 榜单国产第一,几小时后 Qwen 新模型表示不服。 9 月 19 日:云栖大会;通义万相 AI 生视频上线;快手可灵 1.5 模型新增运动笔刷能力。 9 月 20 日:腾讯元器智能体对外发布;秘塔科技产品经理 JD 走红 AI 圈;阶跃跃问接入 Step2 万亿参数 MoE 语言大模型。 9 月 21 日:大模型测试基准研究组正式成立,国家队来了。 9 月 23 日:钉钉 365 会员上线。 9 月 24 日:讯飞星火 API 全新升级;豆包大模型全系列发布&更新。 9 月 25 日:Vidu API 正式开放,加速企业级视频创作;OpenAI 发布高级语音功能;西湖心辰开源 WestlakeOmni。 3. 从行业视角来看,2024 年国内 AI 行业融资总金额增加,但事件数同比下降,马太效应越发明显,资本更青睐热点和高成熟度赛道。智能驾驶在各细分赛道中独占鳌头,AI+教育、AI+游戏、AI+医疗等赛道投资总额也有增长。在政策方面,政府积极推进 AI 原生行业发展,北京、上海、武汉等城市出台系列政策吸引人才和企业,国家队频繁出手投资体现政策支持。
2025-02-17
兼职督学岗位,通过飞书平台为高中生服务,包括:1)解答学习方法等疑问;2)发送测试卷;3)提交测试卷后通知后端制作学习计划;4)发送学习计划链接;5)定期推送知识点和打卡提醒;6)查看打卡并反馈。所有文档通过飞书云文档链接发送。现在我想通过利用coze将deepseek等ai接入飞书的形式,制作出产品赋能督学在这一岗位的工作效率,并希望在这一过程中,锻炼我的ai能力,再想办法让上司或者老板为我这个产品支付报酬,请问我可以从哪些角度开发产品?
以下是一些您可以从以下角度开发产品来赋能兼职督学岗位的工作效率,并锻炼您的 AI 能力,以争取上司或老板为产品支付报酬: 1. 利用 Coze 的多语言模型支持,为解答高中生学习方法等疑问提供更准确和全面的回答。 2. 借助插件系统,集成与学习相关的插件,如学习资料查询、学习工具推荐等,丰富服务内容。 3. 运用知识库功能,上传各类学科知识点、优秀学习案例等,方便在服务中快速调用和推送。 4. 利用数据库和记忆能力,记住每个高中生的学习情况和需求,提供个性化服务。 5. 设计工作流,例如自动发送测试卷、自动通知后端制作学习计划、自动推送学习计划链接等流程,提高工作效率。 6. 采用多代理模式,针对不同学科或学习阶段设置专门的代理,提供更精准的服务。 7. 利用 Coze 易于发布和分享的特点,将服务产品推广给更多需要的高中生和督学人员。
2025-02-18
兼职督学岗位,通过飞书平台为高中生服务,包括:1)解答学习方法等疑问;2)发送测试卷;3)提交测试卷后通知后端制作学习计划;4)发送学习计划链接;5)定期推送知识点和打卡提醒;6)查看打卡并反馈。所有文档通过飞书云文档链接发送。现在我想通过利用coze将deepseek等ai接入飞书的形式,制作出产品赋能督学在这一岗位的工作效率,并希望在这一过程中,锻炼我的ai能力,再想办法让上司或者老板为我这个产品支付报酬,请问我可以从哪些角度开发产品?又该如何将它推销给上司?
以下是关于您利用 Coze 和 DeepSeek 等 AI 接入飞书来赋能兼职督学岗位工作效率的一些建议: 开发产品的角度: 1. 智能答疑系统:利用 AI 技术,对高中生常见的学习方法疑问进行自动分析和回答,提高答疑效率和准确性。 2. 个性化测试卷生成:根据学生的学习情况和需求,通过 AI 生成个性化的测试卷。 3. 学习计划优化:基于学生提交的测试卷结果,利用 AI 更精准地制定学习计划。 4. 知识点精准推送:运用 AI 分析学生的学习进度和薄弱环节,定期推送更具针对性的知识点。 5. 打卡提醒优化:通过 AI 实现更灵活、个性化的打卡提醒方式。 推销给上司的方法: 1. 展示效率提升:详细说明产品如何大幅提高兼职督学的工作效率,节省人力和时间成本。 2. 个性化服务优势:强调产品能够为高中生提供更个性化、精准的服务,提升学习效果。 3. 数据支持:提供相关的数据和案例,证明 AI 赋能后的积极效果。 4. 成本效益分析:说明开发和使用该产品的成本相对较低,而带来的收益显著。 5. 未来发展潜力:阐述产品在不断优化和拓展功能方面的潜力,适应更多的教育需求。 另外,Coze 是由字节跳动推出的 AI 聊天机器人和应用程序编辑开发平台,专为开发下一代 AI 聊天机器人而设计。它具有多语言模型支持、插件系统、知识库功能、数据库和记忆能力、工作流设计、多代理模式、免费使用、易于发布和分享等特点。这些特点可以为您的产品开发提供有力支持。
2025-02-18
我想用deepseek 写微信公众号文章,我将要写的主题告诉他,让它为我生成个人角度的文章,我要写的主题一般围绕着软件分享,技术分享等。请你根据我的要求为我写一份适用的提示词
以下是为您生成的适用于使用 DeepSeek 写微信公众号文章的提示词: 我要写一篇关于软件分享或技术分享的微信公众号文章,文章标题要足够吸引人,以便能广泛传播。文章内容要详细且有条理,先介绍分享的软件或技术的基本情况,包括其功能、特点和优势;然后结合实际案例或个人使用体验,阐述其在实际应用中的效果和价值;最后总结并展望其未来的发展前景。请为我生成这样一篇完整的文章。
2025-02-12
可灵同一画面,多角度分镜头画面
以下是关于镜头和 AIGC 相关的知识: 镜头提示词: 过肩镜头:从角色肩膀后方拍摄,常用于对话场景,提供角色间关系的视角。 反打镜头:常与过肩镜头结合,用于拍摄对话场景中另一个角色的反应或视角。 潜望镜头:使用特殊设备拍摄,常用于捕捉极低或极高角度的画面。 主观晃动镜头:结合角色视角与晃动效果,模拟紧张或晕眩状态。 分屏镜头:将屏幕分成多个部分,展示不同地点或角度的同时事件,增强叙事复杂性和多样性。 显影镜头:逐步揭示重要信息或角色,通常通过镜头移动或焦点转移实现,增加悬念和期待感。 隐喻镜头:通过象征性画面传达深层意义或主题,深化观众对情节的理解。 负片镜头:使用颜色反转等效果创造不寻常视觉风格,常用于表现梦境或幻想场景。 剪影镜头:通过强光源背对着拍摄对象,使其成为黑色剪影,强调形状和姿态。 聚光镜头:使用聚光灯突出特定角色或物体,使其在画面中显得重要。 双重曝光镜头:将两个画面叠加,创造梦幻或象征性效果。 多重曝光镜头:在同一胶片上多次曝光,形成复合画面,常用于表现复杂情感或梦幻场景。 双重镜头:同时对前景和背景的两个对象保持清晰对焦,常用于复杂场景中的多重叙事。 AIGC 电影化叙事: 电影感与 AI 感:一切元素为叙事服务,将观众沉浸在故事中。视频 AI 感可能存在的问题包括固定镜头、运动幅度小易引起视觉疲劳、镜头间缺乏视听语言、画面跳跃未为故事服务、有不和谐画面元素等。 故事叙事:带着故事去制作,采用三幕式结构(设定、冲突、解决),注重角色弧光、隐喻和主题。 画面分镜:先找到桥段中最重要的画面,进行分镜设计,通过不同视角和构图增强叙事感,分解镜头切换方式打造流畅视觉节奏,保持视觉风格一致性。 音乐与音效:把控情感节奏,用音乐引导观众情绪,配合故事起伏增强感染力;设计音效细节,营造氛围为画面增添真实感,实现音乐与视觉的配合。 图像类 AI 产品: 可灵:由快手团队开发,用于生成高质量图像和视频,图像质量高,最初采用内测邀请制,现向所有用户开放,价格相对较高,重度用户年费可达几千元,平均每月 400 600 元,也有每日免费点数和 60 多元单月的最便宜包月选项供轻度用户选择。 通义万相:在中文理解和处理方面出色,用户可选择多种艺术和图像风格,生成图像质量高、细节丰富,操作界面简洁直观,可与阿里其他产品和服务无缝整合,重点是现在免费,每天签到获取灵感值即可,但存在某些类型图像无法生成、处理非中文或国际化内容可能不够出色、处理多元文化内容可能存在偏差等局限性。
2025-01-09
从评审导师的角度优化“人工智能驱动企业供应链效率影响研究——基于专精特新中小企业的实证数据”这个工商学术研究生学位论文题目
作为评审导师,以下是对这个论文题目的一些优化建议: “人工智能对专精特新中小企业供应链效率的驱动作用及影响研究——基于实证数据分析” 这样的表述更加清晰地突出了人工智能的驱动作用,并且明确了是基于实证数据进行的分析。您觉得如何?
2025-01-08
我想要根据一个模特去生成她多个角度的图片
以下是根据您的需求生成模特多个角度图片的方法: 1. 准备工作: 准备一张人物的多角度图片,该图共有 15 个不同视图,尺寸设置为 1328×800px,放大两倍后可保证每张小图为 512×512px。 加上网格图,通过 lineart 分割不同块面。 设置 controlnet,第一张图选择 openpose_face 得到人物 15 个面部角度,第二张图选择 lineart_standard得到清晰的表格分区。 为防止小图模式下人脸崩坏,可增加 ADetailer 的脸部修复插件。 2. 开始生图: 设置文生图提示词: 大模型:majicmixRealistic_v6.safetensors 正向提示词:,auburn hair,eyes open,cinematic lighting,Hyperrealism,depth of field,photography,ultra highres,photorealistic,8k,hyperrealism,studio lighting,photography 负向提示词:EasyNegative,canvasframe,canvas frame,eyes shut,wink,blurry,hands,closed eyes,,lowres,sig,signature,watermark,username,bad,immature,cartoon,anime,3d,painting,b&w 设置参数: 迭代步数:50 采样方法:DPM++2M Karras 尺寸:1328×800px 出图,可得到 15 个不同角度的人物图片。
2025-01-08
deepseek为什么在古诗词理解上这么弱智?
DeepSeek 在很多方面表现出色,并非像您认为的在古诗词理解上弱智。它具有以下优点: 1. 语气还原:能还原帝王的语气,相比其他模型输出更准确恰当,兼顾了古典文字和可读性。 2. 熟悉历史细节:可能与支持“深度探索”和“联网搜索”同时开启有关,能准确还原唐初的历史称谓,如“太极宫”“甘露殿”“掖庭局”“观音婢”“宫门鱼符”等,对“魏徵”等字词的使用也很讲究。 3. 输出具体且细节惊人:其输出充满具体而惊人的细节,行文的隐喻拿捏到位,如“狼毫蘸墨时发现指尖残留着未洗净的血痂”等句子,虽未直接写“愧疚与野心,挣扎与抱负”,但句句体现。
2025-02-18
如何理解Deepseek认知启发式的设计理念
DeepSeek 认知启发式的设计理念主要包括以下几个方面: 1. 将 Agent 封装成 Prompt,并将 Prompt 储存在文件中,以保证最低成本的人人可用,同时减轻调试负担。 2. 通过提示词文件,让 DeepSeek 实现同时使用联网功能和深度思考功能。 3. 在模型默认能力的基础上优化输出质量,通过思考减轻 AI 味,增加可读性。 4. 参照大模型的 temperature 设计了阈值系统,但可能形式大于实质,后续可能根据反馈修改。 5. 用 XML 来进行更为规范的设定,而非 Lisp(有难度)和 Markdown(运行不太稳定)。 此外,DeepSeek 具有以下特点: AI 特性定位:支持多模态理解,包括文本/代码/数学公式混合输入;具备动态上下文,即对话式连续记忆(约 4K tokens 上下文窗口);具有任务适应性,可切换创意生成/逻辑推理/数据分析模式。 系统响应机制:采用意图识别+内容生成双通道理,自动检测 prompt 中的任务类型、输出格式、知识范围,对位置权重(开头/结尾)、符号强调敏感。 在提示词系统方面: 基础指令框架包括四要素模板、格式控制语法等。格式控制语法中,强制结构使用```包裹格式要求,占位符标记用{{}}标注需填充内容,优先级符号中>表示关键要求,!表示禁止项。 进阶控制技巧包含思维链引导、知识库调用、多模态输出。思维链引导中有分步标记法和苏格拉底式追问;知识库调用中有领域限定指令和文献引用模式。 HiDeepSeek 是为解决使用 AI 工具时答案思考过程不可见的问题而设计的工具,其核心目标是让 AI 像人类交流时那样展示思考过程,在技术层面通过特别规则实现,例如要求 AI 思考像人类一样自然。它能帮助用户更好地理解和使用 AI,让 AI 成为更好的助手。
2025-02-11
扣子工作流上传图片并让AI理解图片内容
扣子工作流可以实现上传图片并让 AI 理解图片内容。具体步骤如下: 1. 上传输入图片:将本地图片转换为在线 OSS 存储的 URL,以便在平台中进行调用。 2. 理解图片信息,提取图片中的文本内容信息:通过封装的图片理解大模型和图片 OCR 等插件来实现。 3. 场景提示词优化/图像风格化处理。 4. 返回文本/图像结果。 在搭建工作流时,主要关注以下几个步骤: 1. 点击工作流后面的“➕”来添加一个工作流。 2. 点击创建工作流。 3. 给工作流起名字和描述,名字只能用字母、数字和下划线,描述清晰以便区分。 4. 初始化的工作流:左边有各种可用的插件和搭建 Agent 的工具,可通过点击加号或直接拖拽使用。插件一般有对应的参数说明,初始化后会生成开始模块和结束模块,且只能以开始模块启动,结束模块终结工作流。 此外,扣子平台具有以下特点和功能: 1. 集成了丰富的插件工具,包括资讯阅读、旅游出行、效率办公、图片理解等 API 及多模态模型,支持内置插件和自定义插件。 2. 提供简单易用的知识库功能来管理和存储数据,支持多种格式的数据上传,包括文本格式、表格格式,也支持本地文件和在线网页内容及 API JSON 数据的上传。 3. 具有持久化的记忆能力,可记住用户对话的重要参数或内容。 4. 工作流功能灵活,可通过拖拉拽的方式搭建处理逻辑复杂且稳定性要求高的任务流。
2025-02-10
长文本理解能里较强的AI
以下是一些长文本理解能力较强的 AI 模型: 1. 智谱·AI 的 ChatGLM26B32k:这是第二代 ChatGLM 长上下文对话模型,在 ChatGLM26B 的基础上进一步强化了对于长文本的理解能力,能够更好地处理最多 32K 长度的上下文。在实际使用中,如果上下文长度基本在 8K 以内,推荐使用 ChatGLM26B;如果需要处理超过 8K 的上下文长度,推荐使用 ChatGLM26B32K。此外,还有 ChatGLM26B32kint4 版本,它是 ChatGLM26B32K 的 int4 版本。 2. 通义千问的 Qwen2.51M:推出 7B、14B 两个尺寸,在处理长文本任务中稳定超越 GPT4omini,同时开源推理框架,在处理百万级别长文本输入时可实现近 7 倍的提速。首次将开源 Qwen 模型的上下文扩展到 1M 长度。在上下文长度为 100 万 Tokens 的大海捞针任务中,Qwen2.51M 能够准确地从 1M 长度的文档中检索出隐藏信息。其开源平台包括 Huggingface(https://huggingface.co/spaces/Qwen/Qwen2.51MDemo)和 Modelscope(https://www.modelscope.cn/studios/Qwen/Qwen2.51MDemo)。
2025-02-09
请给我整理一套怎么才能学习和使用AI的方法,列举几个例子是怎么能快速的理解ai的发展历史及原理
以下是一套学习和使用 AI 的方法,以及帮助您快速理解 AI 发展历史及原理的途径: 一、学习 AI 的方法 1. 了解 AI 基本概念 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习 AI 领域广泛(比如图像、音乐、视频等),根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 5. 体验 AI 产品 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 二、快速理解 AI 发展历史及原理的途径 1. AI 背景知识 基础理论:了解人工智能、机器学习、深度学习的定义及其之间的关系。 历史发展:简要回顾 AI 的发展历程和重要里程碑。 2. 数学基础 统计学基础:熟悉均值、中位数、方差等统计概念。 线性代数:了解向量、矩阵等线性代数基本概念。 概率论:基础的概率论知识,如条件概率、贝叶斯定理。 3. 算法和模型 监督学习:了解常用算法,如线性回归、决策树、支持向量机(SVM)。 无监督学习:熟悉聚类、降维等算法。 强化学习:简介强化学习的基本概念。 4. 评估和调优 性能评估:了解如何评估模型性能,包括交叉验证、精确度、召回率等。 模型调优:学习如何使用网格搜索等技术优化模型参数。 5. 神经网络基础 网络结构:理解神经网络的基本结构,包括前馈网络、卷积神经网络(CNN)、循环神经网络(RNN)。 激活函数:了解常用的激活函数,如 ReLU、Sigmoid、Tanh。 无论是技术研究还是应用实践,数学和编程基础都是必不可少的。同时需要紧跟前沿技术发展动态,并结合实际问题进行实践锻炼。
2025-02-07
视频理解大模型技术
以下是关于视频理解大模型技术的相关知识: 1. 概念:生成式 AI 生成的内容称为 AIGC。 2. 概念与关系: AI 即人工智能。 机器学习是电脑找规律学习,包括监督学习、无监督学习、强化学习。 监督学习使用有标签的训练数据,目标是学习输入和输出之间的映射关系,包括分类和回归。 无监督学习的数据没有标签,算法自主发现规律,经典任务如聚类。 强化学习从反馈里学习,最大化奖励或最小化损失,类似训小狗。 深度学习是一种参照人脑有神经网络和神经元的方法(因层数多称为深度),神经网络可用于监督学习、无监督学习、强化学习。 生成式 AI 可以生成文本、图片、音频、视频等内容形式。 LLM 是大语言模型,对于生成式 AI,生成图像的扩散模型不是大语言模型;对于大语言模型,生成只是其中一个处理任务,如谷歌的 BERT 模型可用于语义理解(不擅长文本生成),像上下文理解、情感分析、文本分类。 3. 技术里程碑:2017 年 6 月,谷歌团队发表论文《Attention is All You Need》,首次提出 Transformer 模型,它完全基于自注意力机制(SelfAttention)处理序列数据,无需依赖循环神经网络(RNN)或卷积神经网络(CNN),Transformer 比 RNN 更适合处理文本的长距离依赖性。
2025-02-06