Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

总结一下大模型数据发展的最新趋势,基于历史的事实和数据总结23年以来发生了什么,25年可能发生什么

Answer

以下是关于大模型数据发展趋势的总结:

2023 年以来:

  • 大量创新大模型架构涌现,尝试在保留 Transformer 优势的同时解决其算力开销太高的问题,对 Transformer 的绝对统治地位形成有力挑战。
  • 多种有代表性的技术路径出现,如类循环神经网络模型(以 RWKV 为代表)、状态空间模型(以 Mamba 为代表)、层次化卷积模型(以 UniRepLKNet 为代表)、多尺度保持机制模型(以 RetNet 为代表)、液体神经网络模型(以 LFM 为代表)等。这些模型在不同程度保留 Transformer 架构优势的基础上,结合 RNN、CNN 等思想做出创新发展,使得大模型架构呈现出日益明显的混合趋势,更多创新架构具备“博采众家之长”的特点。

对于 2025 年的预测,由于目前的信息有限,难以给出确切的预测。但可能会在现有创新架构的基础上进一步优化和融合,出现更高效、更强大且更具通用性的大模型架构,同时可能在技术应用和行业落地方面取得更显著的成果。

Content generated by AI large model, please carefully verify (powered by aily)

References

AGI 万字长文(下)| 2024,分叉与洪流

引子:人间一日,AI十年紧接着对于2023年的回顾,我想斗胆做些2024-25年可能发生的事情的预测。写这篇文章的时候正赶上OpenAI Sora、Google Genie、Mistral Large的发布,不少内容也经历了些修改。真是还没等写就都做出来了……作为小作坊创业者,在大模型时代是没有办法拥有底层技术的,技术护城河也更加难;于是,稍微早一点点预判,找到一个没有大鱼的“小水洼”就尤其重要,所以我也愿意花些力气来做做今天这番思考梳理。不过,既然是预测(胡猜),其中不免有不精确、不准确、过于科幻的推演;我也希望可以给大家一些启发,但也可能把人带沟里……不过纠结一番,还是觉得要把这些对于2024的猜想先写下来,立个Flag,一年之后作为笑话来看看也不是坏事。以及,大家也完全可以把这篇文章当作科幻文学作品来看。最后,实在抱歉,没想到两篇文章写着写着就有了2.3万字的篇幅,希望大家专门拿出45分钟来阅读,而不是零碎的看。此外,我强烈建议大家先读我的上篇《[AGI万字长文(上)|2023回顾与反思](https://waytoagi.feishu.cn/wiki/PTGKw9VBGiYRoJk82B9cZlIsnVf)》(我知道你们只看了“太长不看版”);今天的很多观点也是顺承2023年来的。另外,文末我会专门把提到的机会/商业模式总结成《AGI潜在机会点2024》,希望可以有用。(对,就是强迫你们看完)欢迎转载、转发、关注、扩散;以及加微信勾搭。

《2024年度AI十大趋势报告》发布:技术创新、产品洗牌、行业动态一文看尽

2017年《Attention Is All You Need》论文发表,Transformer架构问世,并逐渐成为自然语言处理领域主流技术范式。但Transformer并非完美无缺,产学研界也一直存在一种声音:架构领域需要新的突破,来构建强大且高效的新一代基础大模型。谁将革新甚至颠覆Transformer,取而代之?2023年以来,大量创新大模型架构涌现,尝试在保留Transformer优势的同时解决其算力开销太高的问题,有望在性能与效率上实现突破,对Transformer的绝对统治地位形成有力挑战。类循环神经网络模型(以RWKV为代表)状态空间模型(以Mamba为代表)层次化卷积模型(以UniRepLKNet为代表)多尺度保持机制模型(以RetNet为代表)液体神经网络模型(以LFM为代表)……多种有代表性的技术路径,在不同程度保留Transformer架构优势的基础上,结合RNN、CNN等思想所做出的创新发展,这也使得大模型架构呈现出日益明显的混合趋势,更多创新架构具备“博采众家之长”的特点。

Others are asking
英文文章重点总结的AI
以下是为您总结的相关英文文章重点: 1. 每周一更新的 AIGC 领域内容,包括谷歌开源的新语言模型 Gemma 2B 和 Gemma 7B,采用与 Gemini 相同技术且质量更高;Stability AI 发布的新图像生成模型 Stable Diffusion 3,可生成图像和视频;Groq 公司利用新型硬件实现语言模型每秒 500 个 Token 的高速输出,速度比顶级运营商快 18 倍;还介绍了新的 AI 产品如视频风格转换平台 GoEnhance、将 Figma 设计转为 React 组件的插件、用于项目管理的工具 Kraftful 等,以及精选的几篇英文文章,如优化 Stable Diffusion XL 的方法、构建语言模型 Tokenizer 的教程、新模型 Sora 和 LAVE 等的应用。 2. 常见的文章润色 AI 工具包括:Wordvice AI 集校对、改写转述和翻译等功能于一体,基于大型语言模型提供全面的英文论文润色服务;ChatGPT 由 OpenAI 开发,可用于多方面写作辅助;Quillbot 是人工智能文本摘要和改写工具;HyperWrite 是基于 AI 的写作助手和大纲生成器;Wordtune 是 AI 驱动的文本改写和润色工具;Smodin 提供 AI 驱动的论文撰写功能。这些工具涵盖了文章润色的各个环节,科研人员和学生可根据自身需求选择。 3. 除聊天内容外,可让 AI 总结整理各种文章(不超过 2 万字),如复制文章给 GPTs 总结。对于 B 站有字幕的视频,可通过安装油猴脚本获取字幕,将字幕文字内容复制给 GPTs 进行总结,总结完还可继续提问或探讨。
2025-02-18
我现在想根据我的博士论文,想出一个国家社科基金的选题。但是我的博士论文感觉核心不是特别突出,我希望找到一个AI助手,让AI帮我读论文的PDF格式然后总结出一个最合适的选题,有没有推荐的AI工具?
以下是一些关于利用 AI 辅助完成您需求的建议: 1. 先拆解您的博士论文工作流程,搞清楚每个步骤的输入输出和相互关系。 2. 思考论文中的哪些环节可以引入 AI 工具来提效,一切要从业务逻辑出发,AI 是锦上添花,不能本末倒置。 3. 搭建选题库,明确论文的定位(可用 AI 辅助分析),找相关的对标论文和优秀研究。 4. 在写作环节,可用 AI 辅助拆解对标论文,提炼写作技巧,然后根据借鉴的技巧结合自身特色列出写作大纲,并使用 AI 优化大纲、查找资料、润色文章,但核心内容要自己完成,不能过度依赖 AI。 5. 起标题与配图方面,用 AI 辅助批量生成标题,再自己修改优化,评估标题是否足够吸引眼球,让 AI 分析论文提供配图建议,去免费图库搜索配图。 6. 养成习惯与总结,做每件事前都思考 AI 能提供什么帮助,把整套流程实践几次,形成肌肉记忆,不断打磨完善属于自己的 AI 辅助流程,同时警惕过度依赖,AI 只是辅助,核心能力要靠自己。 目前常见的可用于辅助您的 AI 工具如 ChatGPT 等,但具体的选择还需根据您的实际需求和使用体验来决定。
2025-02-16
网页导读 或总结工具
以下是为您提供的关于 Kimi Copilot 网页总结工具的相关信息: 推荐了两个实用的浏览器插件: (不方便下载的,文末附下载链接) 使用该插件需要在浏览器中登录自己的 Kimi 账号,关联网页版。 Kimi Copilot网页总结助手的插件提示词分了 3 部分,提示词如下: 你是一个擅长总结长文本的助手,能够总结用户给出的文本,并生成摘要。 工作流程:让我们一步一步思考,阅读我提供的内容,并做出以下操作。 一句话总结这篇文章,标题为“概述”。 总结文章内容并写成摘要,标题为“摘要”。 总是用中文回答;当输出标题时,应该使用 markdown格式。 文末还提供了相关插件的附件下载:
2025-02-16
我有很多录制好的视频素材, 有哪些工具是可以帮助审视视频材料, 总结输出内容的?
以下是一些可以帮助审视视频材料并总结输出内容的工具和流程: 工具方面: ChatGPT:可用于分析视频内容,提取关键信息。 Stable Diffusion 或 Midjourney:用于生成与视频相关的视觉描述。 Adobe Firefly:能将文本转换为语音,添加音频效果。 Clipfly 或 VEED.IO:用于视频编辑与合成。 流程方面: 1. 剧本敲定:确保剧本内容完整,包括对话、场景、角色等都已确定。 2. 制作分镜头脚本:根据剧本,制作详细的分镜头脚本,涵盖每个场景的视角、动作、表情等细节。 3. 分镜出图:为每个镜头绘制或制作相应的分镜图,每个镜头可准备多张图以备用或展示不同视角。 4. 素材管理: 图片管理:按场景或部分将图片保存在不同文件夹中,命名为“场景 1”“场景 2”等,单个图片命名为“x 场 x 镜”。 视频管理:跑视频时按不同部分用不同文件夹管理,单个视频命名也为“x 场 x 镜”。 5. 素材审核:制作过程中定期审核素材,确保符合分镜头脚本要求和质量标准。 6. 备份与存档:定期备份素材,项目完成后存档,方便后续使用。 请注意,具体的操作步骤和所需工具可能因项目需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能随时间变化,建议直接访问工具网址获取最新信息和使用指南。
2025-02-15
推荐一个我给视频,然后ai总结内容的ai工具
以下为您推荐一些可以对视频进行 AI 总结内容的工具: 1. GPT:可以总结不超过 2 万字的文章。对于 B 站视频,如果有字幕,可通过安装油猴脚本下载字幕,然后复制发送给 GPT 进行总结。总结完还可继续提问或探讨。 2. BibiGPT:https://bibigpt.co/ ,支持小红书、B 站等网站视频的归纳总结,还可以提问互动,答案会附上对应的视频节点。 3. Kimi Copilot:https://chrom ,安装后,在浏览网络文章时点击插件图标,或使用快捷键 Ctrl/Cmd+Shift+K,即可一键召唤 Kimi.ai 总结网页内容,总结详细且免费。 4. Strut:https://strut.so/ ,是一款支持人工智能的协作工作区,将笔记、文档和写作项目整合在一起。 希望这些工具能够满足您的需求。
2025-02-15
视频总结的ai工具
以下是一些常见的视频总结的 AI 工具: 1. Pika:对奇幻感强的画面把控较好,自然,但真实环境画面易糊,更新的唇形同步功能集成便捷,但需抽卡。 2. Pixverse:在高清化方面有优势,对偏风景和纪录、有特定物体移动的画面友好,但生成视频有帧率问题,处理人物时易出戏。 3. Runway:在真实影像质感方面表现出色,战争片全景镜头处理好,控件体验感较好,但爱变色,光影不稳定。 4. SVD:整体表现略拉垮,在风景片测试中表现较好。 5. GPT:可通过提取视频字幕来总结视频内容,如通过安装油猴脚本获取 B 站视频字幕。 6. StableVideo:目前市面上优秀的 AI 视频工具,开放公测,可白嫖,除每日赠送积分外还新增积分购买选项,能操作固定种子、步数、运动幅度,交互有趣,生成过程中会有案例标注。
2025-02-15
最新的AI行业动态和进展有哪些,包含2025年
以下是关于最新的 AI 行业动态和进展(包含 2025 年)的内容: 2024 年: 图片超短视频的精细操控:包括表情、细致动作、视频文字匹配。 有一定操控能力的生成式短视频:风格化、动漫风最先成熟,真人稍晚。 AI 音频能力长足进展:带感情的 AI 配音基本成熟。 “全真 AI 颜值网红”出现,可以稳定输出视频,可以直播带货。 游戏 AI NPC 有里程碑式进展,出现新的游戏生产方式。 AI 男/女朋友聊天基本成熟:记忆上有明显突破,可以较好模拟人的感情,产品加入视频音频,粘性提升并开始出圈。 实时生成的内容开始在社交媒体内容、广告中出现。 AI Agent 有明确进展,办公场景“AI 助手”开始有良好使用体验。 AI 的商业模式开始有明确用例:数据合成、工程平台、模型安全等。 可穿戴全天候 AI 硬件层出不穷,虽然大多数不会成功。 中国 AI 达到或超过 GPT4 水平;美国出现 GPT5;世界上开始现“主权 AI”。 华为昇腾生态开始形成,国内推理芯片开始国产替代(训练替代要稍晚)。 AI 造成的 DeepFake、诈骗、网络攻击等开始进入公众视野,并引发担忧。 AI 立法、伦理讨论仍然大规模落后于技术进展。 2025 2027 年: AI 3D 技术、物理规则成熟:正常人无法区别 AI 生成还是实景拍摄。 全真 AI 虚拟人成熟:包含感情的 AI NPC 成熟,开放世界游戏成熟;游戏中几乎无法区别真人和 NPC。 AR/VR 技术大规模商用。 接近 AGI 的技术出现。 人与 AI 配合的工作方式成为常态,很多日常决策开始由 AI 来执行。 AI 生产的数据量超过全人类生产数据量,“真实”成为稀缺资源。 具身智能、核聚变、芯片、超导、机器人等技术有明显进展突破。 “人的模型”出现,出现“集中化 AGI”与“个人 AGI”的历史分叉。 AI 引发的社会问题开始加重,结构性失业开始出现。 AGI 对于地缘政治的影响开始显露。 此外,还有以下相关动态: 算力瓶颈不只是单纯的技术和建设问题,而是影响整个行业竞争格局的重要变量。 逐渐进入多模态灵活转换的新时代,实现文本、图像、音频、视频及其他更多模态之间的互相理解和相互转换。 人类劳动形式逐步“软件化”,复杂劳动被抽象为可调用的软件服务,劳动流程被大幅标准化和模块化,劳动能力像“即插即用”的工具一样易于获取。 AI 行业目前仍处于严重亏损的阶段,商业化进程仍有巨大提升空间。 云厂商是产业链中毋庸置疑的“链主”。 2024 年,头部 AI 应用的品类变化并不显著。创意工具(如图像和视频内容创作)依然占据最大比重。To P(面向专业用户)应用展现出强大的市场潜力,ToB(面向企业)应用发展路径相对复杂,ToC 应用面临较大的挑战。 在 AI 应用领域,Copilot 和 AI Agent 是两种主要的技术实现方式。 北美和欧洲贡献了 AI 移动应用市场三分之二的份额,众多中国 AI 公司积极出海。 2024 年 10 月的大事记包括: Gartner 发布 2025 年十大战略技术趋势。 DeepSeek 开源多模态 LLM 框架 Janus。 司南开源大模型能力评估模型 CompassJudger。 Anthropic 发布新功能 computer use,发布 Claude 3.5 Haiku,更新 Claude 3.5 Sonnet。 Stability AI 发布 Stable Diffusion 3.5。 x.AI 正式推出 API。 ComfyUI V1 官方桌面版开放内测。 华为发布纯血操作系统鸿蒙 OS NEXT。 Jina AI 推出高性能分类器 Classifier API。 OpenAI 发布图像生成模型 sCM。 Midjourney 上线外部图片编辑器。 Runway 发布动画视频功能 ActOne。 Ideogram 推出 AI 画板工具 Canvas。 Genmo 开源视频生成模型 Mochi 1。 荣耀发布操作系统 MagicOS 9.0。 美国 14 岁少年与 C.AI 聊天后离世。 新华社发文表示警惕「AI 污染」乱象。 港中文&趣丸推出 TTS 模型 MaskGCT。 科大讯飞发布讯飞星火 4.0 Turbo。 阿里通义代码模式开始内测。 Anthropic Claude 新增数据分析功能。 北京市大中小学推广 AI 学伴和 AI 导学应用。 稚晖君开源「灵犀 X1」全套资料。 OpenAI 高管 Miles Brundage 离职。
2025-02-17
今日2025.2.13日的AI日报
以下是 2025 年 2 月 13 日的 AI 日报: 近 7 日更新日志: 《》:Codeium 是一款面向企业用户的 AI 编程工具,能提升开发效率,适合非科技企业。其新产品 Windsurf 结合 AI 助手和开发者工作流程,提供无缝协作体验。与 GitHub Copilot 和 Cursor 相比,在代码生成和上下文感知能力上表现更佳,价格有竞争力。 《》:OpenAI 产品负责人 Kevin Weil 称 AI 模型成本下降,智能水平提升。未来将推出 o3 系列模型,具备更强推理能力,并计划在 2025 年让聊天机器人在现实世界实际操作。 《》:OpenAI 即将推出 GPT5,预计所有用户可免费使用。GPT4.5 将是最后一个非推理模型,GPT5 将整合多项技术,具备自主思考和快速响应能力,ChatGPT 多项功能将被整合,用户将享受免费深度研究额度。 社区动态速览: 2000 亿欧元投资,设立 12 个 AI 超算中心,抗衡美国与中国的竞争。 Anthropic CEO:AI 发展将加速至超人级智能 预计 2026 2030 年 AI 将达到“超级天才”级别,若无监管可能失控。 Cerebras 为 Perplexity AI Sonar 搜索模型提供加速,搜索速度提升 10 倍,优化信息准确性与计算成本。 更多详细内容查看
2025-02-13
在2025年2月12日这个时间点,我有哪些方式可以快速,稳定的使用 deepseek r1
在 2025 年 2 月 12 日,您可以通过以下方式快速、稳定地使用 DeepSeek R1: PPIO 派欧云(https://ppinfra.com/modelapi/product/llmapi?utm_medium=article&utm_source=WayToAGI):提供满血版全版本的 DeepSeekR1,输入价格为¥4/百万 tokens,输出价格为¥16/百万 tokens。有开发者福利,新注册立得 500 万 tokens(关注 PPIO 公众号回“deepseek”再领 1 亿),初创企业认证有 10 万算力补贴。产品服务特点为服务稳定性 99.9%,保持 0 故障,与 DeepSeek 官方同价,客户支持通道 10 分钟响应。 百度智能云:DeepSeekR1 限时免费,配额 1000RPM/10000TPM,无调用 tokens 上限。本模型将于 2025 年 2 月 19 日 00:00 起正式商用计费,输入价格 0.002 元/千 tokens,输出价格 0.008 元/千 tokens,有在线体验。 硅基流动:DeepSeekR1 输入价格为¥4/M Tokens,输出价格为¥16/M Tokens,有在线体验。2025 年 2 月 6 日起,未实名用户每日最多请求此模型 100 次。 此外,在 2 月 12 日,还有以下相关内容: 《》,来自社区伙伴 Hua 的投稿,手把手指导您在微软 Azure AI Foundry 平台上完成 DeepSeek R1(671B)模型的完整部署流程,包含环境准备、资源管理、模型测试及 API 调用说明。 《》Anthropic 正式发布 Anthropic AI Economic Index,聚焦 AI 对经济的长期影响。该指数直观展现 AI 如何融入现代经济的各类实际任务,并从职业(occupation)和具体工作任务(task)两个维度,量化 AI 对劳动力市场的影响。 《》DeepSeekR1 的火爆现象背后,企业可以获得显著提升。其强化学习和联网搜索能力,改变了信息获取方式,从“检索—阅读—摘要”转变为“提问—获得答案”,大幅提升工作效率。同时,DeepSeek 的开源策略打破了技术垄断,让国内大模型能力迅速提升。
2025-02-12
2025年 如何使用AGI赚钱
以下是关于 2025 年如何使用 AGI 赚钱的相关信息: 1. OpenAI 方面:到 2025 年,OpenAI 需从实验室和初创企业转型为长期发展的公司,董事会制定了一系列战略目标,包括优化非营利/盈利结构,将现有盈利机构转型为特拉华州公共利益公司(PBC),吸引资本支持使命;增强非营利组织的可持续性,非营利组织对现有盈利机构的权益将以 PBC 股份形式体现,并由独立财务顾问公平估值;强化部门功能分工,新结构下,PBC 将负责运营和业务,而非营利机构将专注于医疗、教育和科学等领域的慈善事业。OpenAI 的发展目标是助力建设一个以 AGI 为核心的新经济,同时确保其造福全人类。 2. DeepSeek 方面:DeepSeek 大模型近日在中国爆红,吸引了大量商家和博主借机“搞钱”,以高价售卖接入教程和培训课程。但官方提醒大部分收费内容均为假冒,用户无需花费。专家指出,普通人完全可以通过自学和开源社区获取知识,避免被虚假宣传误导。同时要警惕假冒网站。 3. 国产 AI 产业方面:东吴证券发布的研究报告指出,国产 AI 产业在 2025 年迎来加速发展机遇,字节跳动的 AI 生态布局尤为关键。2024 年大模型技术差距缩小,国内 AI 应用渗透率快速提升。字节跳动凭借顶级资源和创新姿态,在 AI 领域布局激进,其豆包大模型快速追赶,火山引擎云服务有望弯道超车。 4. 另外,Sam Altman 确信在 2025 年,可能会看到第一批人工智能 Agent“加入劳动力大军”,并对公司的生产力产生实质性的影响。超级智能工具可以极大地加速科学发现和创新,从而显著增加财富和繁荣。
2025-02-09
2025年出的模型有哪些
以下是 2025 年可能出现的一些模型: DeepSeek 发布了最新模型 V3 与 R1,采用混合专家(MoE)架构,V3 引入多头潜注意力(MLA),R1 通过强化学习激活推理能力。 字节跳动推出新技术 OmniHuman,利用单张图片和音频生成生动的视频。 OpenAI 发布新模型 o1,基于思维链和强化学习的新训练和推理方法,展现出明显超出 GPT4 等传统模型的复杂推理能力。 苹果公司发布面向 iPhone、iPad 和 Mac 的个人智能化系统 Apple Intelligence,嵌入一个大约 30 亿参数的本地模型。 此外,2024 年的一些模型发展趋势也可能延续到 2025 年,如: 多模态能力的提升,包括视频生成模型的发展,如 OpenAI 的 Sora 引发业界轰动,带动一众模型公司追逐,到年底视频生成已成为各大模型公司的标配能力。 开源项目的发展,如 Meta 推出的 Llama 3.1 405B 版本,中国的开源项目 Qwen2、DeepSeek 等在全球范围内赢得众多用户。 随着“蒸馏”和“量化”等技术的发展,模型的小型化和端侧化逐渐形成趋势,多家公司推出 40 亿参数以下的专业或端侧小模型。
2025-02-07
2025年AI新年春晚在哪儿直播?几点直播?从哪个平台上可以看得到?微信视频号?抖音?B站还是什么渠道可以看得到?
2025 年 AI 春晚的相关信息如下: 直播视频名称:共创贺新春,AI 中国年,第二届 AI 春晚! 60 字内容简介:30 多个共创 AI 节目,来自 1000 多位共创者 3 个月的辛勤筹备。2025 年 1 月 29 日(大年初一)晚上 6:00 准点开播。 正式开放配置时间:1 月 29 日晚上 5:45 正式直播时间:1 月 29 日晚上 6:00 关于转播: 有转播经验的:能直接接受 https,rtmp 信号源的可以直接用拉流地址。 第一次转播的小伙伴:如果直播平台不能直接接入信号源,请先下载一个 OBS:https://obsproject.com/zhcn/download 。配置教程已置顶主流直播平台推流地址获取方式可以参考这篇文章后半段:https://zhuanlan.zhihu.com/p/653204958?utm_id=0 。 直播技术问题咨询: AI 春晚是由 WaytoAGI 社区组织的一场由 AI 技术驱动的晚会,首届 AI 春晚的完整视频可在 B 站上观看。首届 AI 春晚于 24 年大年初一当晚直播,18 万人在线观看,后续视频播放量超过 200 万,媒体曝光量超过 500 万,被誉为 AI 视频寺庙时代的一部现象级作品。 更多详细信息可参考 WaytoAGI 的官方网站。 完整版:https://www.bilibili.com/video/BV15v421k7PY/?spm_id_from=333.999.0.0 。 相关进度:
2025-01-24
我是一个有23年软件系统开发和设计经验的架构师,但是对AI还没有系统化了解过,请问我该如何开始?如何在短时间内掌握AI的使用、原理以及二次开发?
以下是为您提供的在短时间内系统化学习 AI 的建议: 一、了解 AI 基本概念 首先,建议阅读「」部分,熟悉 AI 的术语和基础概念。了解什么是人工智能,它的主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。同时,浏览入门文章,这些文章通常会介绍 AI 的历史、当前的应用和未来的发展趋势。 二、开始 AI 学习之旅 在「」中,您将找到一系列为初学者设计的课程。这些课程将引导您了解生成式 AI 等基础知识,特别推荐李宏毅老师的课程。您还可以通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 三、选择感兴趣的模块深入学习 AI 领域广泛(比如图像、音乐、视频等),您可以根据自己的兴趣选择特定的模块进行深入学习。我建议您一定要掌握提示词的技巧,它上手容易且很有用。 四、实践和尝试 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 五、体验 AI 产品 与现有的 AI 产品进行互动是学习 AI 的另一种有效方式。尝试使用如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。通过与这些 AI 产品的对话,您可以获得对 AI 在实际应用中表现的第一手体验,并激发您对 AI 潜力的认识。 如果希望继续精进,对于 AI,可以尝试了解以下内容作为基础: 1. AI 背景知识 (1)基础理论:了解人工智能、机器学习、深度学习的定义及其之间的关系。 (2)历史发展:简要回顾 AI 的发展历程和重要里程碑。 2. 数学基础 (1)统计学基础:熟悉均值、中位数、方差等统计概念。 (2)线性代数:了解向量、矩阵等线性代数基本概念。 (3)概率论:基础的概率论知识,如条件概率、贝叶斯定理。 3. 算法和模型 (1)监督学习:了解常用算法,如线性回归、决策树、支持向量机(SVM)。 (2)无监督学习:熟悉聚类、降维等算法。 (3)强化学习:简介强化学习的基本概念。 4. 评估和调优 (1)性能评估:了解如何评估模型性能,包括交叉验证、精确度、召回率等。 (2)模型调优:学习如何使用网格搜索等技术优化模型参数。 5. 神经网络基础 (1)网络结构:理解神经网络的基本结构,包括前馈网络、卷积神经网络(CNN)、循环神经网络(RNN)。 (2)激活函数:了解常用的激活函数,如 ReLU、Sigmoid、Tanh。 此外,以证件照为例,Code AI 应用开发教学中,智能体开发从最初的 chatbot 只有对话框,到有了更多交互方式,因用户需求扣子推出了 AI 应用,其低代码或零代码的工作流等场景做得较好。但 AI CODING 虽强,目前适用于小场景和产品的第一个版本,复杂应用可能导致需求理解错误从而使产品出错。在创建 AI 应用时,要学习操作界面、业务逻辑和用户界面,包括布局、搭建工作流、用户界面及调试发布,重点熟悉桌面网页版的用户界面。
2025-02-17
我希望你向我推荐一个AI培养我画画的兴趣爱好。我目前23岁,无任何画画基础,目前用IPA中的procrate APP绘画比较方便,我喜欢颜色鲜艳的简笔画,但是我对procrate APP并不熟悉,希望有一个AI能充当我的花花启蒙老师,带领我使用procrate APP学习简笔画
很抱歉,以上提供的内容中没有直接针对您需求的有效推荐。不过,您可以考虑以下途径: 1. 【野菩萨的 AIGC 资深课】:由工信部下属单位【人民邮电出版社】开设,是市面上为数不多的值得推荐的 AI 课程之一,也是全网技术更新最快的课程!课程内容涵盖 AI 绘画等多个体系的知识。 2. 您还可以在网络上搜索关于 Procreate APP 以及简笔画的教学视频和教程,有很多免费或付费的资源可供选择。 希望这些建议对您有所帮助。
2025-02-10
目前我在帮助出版社改教材,以下是步骤:1.将pdf转为word 2.将公式图片转为公式编辑器中可编辑的公式 3.将相关带29章的文本统一改成23章。哪一步可以借助ai更简便
在您所描述的这三个步骤中,将公式图片转为公式编辑器中可编辑的公式这一步骤可以借助 AI 来更简便地完成。目前有一些 AI 工具和技术能够对图片中的公式进行识别和转换,提高工作效率。但需要注意的是,AI 转换可能存在一定的误差,仍需要人工进行检查和修正。
2024-12-05
2023年大模型发展有什么重要技术
2023 年大模型发展的重要技术包括以下方面: 模型发布:百川智能发布 Baichuan2—Turbo,字节云雀大模型等。 涉及领域:涵盖通用、医疗、汽车、教育、金融、工业、文化/零售/交通等多个行业。 关键进展:从 22 年 11 月 ChatGPT 的惊艳面世,到 23 年 3 月 GPT4 作为“与 AGI(通用人工智能)的第一次接触”,再到 23 年末多模态大模型的全面爆发。 多模态大模型的应用: 优点:适应性极好,方便适应各种奇葩需求;对算法要求降低,大部分功能由大模型提供,特别是非结构化信息处理;API 访问方式简化了边缘设备要求,方便在多种设备适配。 缺点:推理时长是最大障碍,传统目标检测或人脸识别优化后能达到 100 300ms,而大模型动则需要 10 秒的延时,限制了许多场景;模型的幻象和错误率较高,在多链路复杂应用中迅速变得不可行;在大多数生产模式下,仍需使用云服务数据中心,存在隐私问题;商业私有化部署是刚需,当下开源模型与 GPT4 有代差。
2024-11-14
如何进行ai学习 用户id:1232334 描述:北欧5国10日游
以下是新手学习 AI 的一些建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括人工智能的定义、主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,您可以找到一系列为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,涵盖图像、音乐、视频等,您可以根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。通过与这些 AI 产品的对话,您可以获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。
2024-10-15
如何进行ai学习 用户id:1232334 描述:北欧5国10日游
新手学习 AI 可以按照以下步骤进行: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括人工智能的定义、主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 利用在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,包括图像、音乐、视频等,可根据自身兴趣选择特定模块深入学习。 掌握提示词的技巧,其上手容易且实用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出自己的作品。 知识库中有很多大家实践后的作品和文章分享,欢迎您实践后也进行分享。 5. 体验 AI 产品: 与现有的 AI 产品如 ChatGPT、Kimi Chat、智谱、文心一言等聊天机器人进行互动,了解其工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,激发对 AI 潜力的认识。
2024-10-10
AI数据分析
以下是关于 AI 数据分析的相关内容: ChatGPT 助力数据分析: 本文重点介绍了 AI 与数据分析结合的应用,通过实际案例与相关技巧,描述了 ChatGPT 如何助力数据分析。 实现了两种方式支持多维数据分析: SQL 分析:分析平台自身使用情况,输入一句话可分析用户配置图表相关数据。用户描述想分析的内容,后台连接 DB,附带表结构信息让 AI 输出 SQL 语句,校验为 SELECT 类型后执行返回结果数据,再传给 GPT 分析,最后输出分析结论和建议并返回前端页面渲染图表。 个性化分析:平台支持上传数据,可提供数据信息辅助分析,前端解析文件后传给 GPT 分析,后续步骤与 SQL 分析一致。 分析完成后展示结果数据的图表和分析结论,图表支持折线图和柱状图可随意切换。 生成式 AI 季度数据报告 2024 月 1 3 月: 作者包括郎瀚威 Will、张蔚 WeitoAGI、江志桐 Clara 等。 报告涵盖总体流量概览、分类榜单、文字相关(个人生产力、营销、教育、社交)、创意相关(图像、视频)、音频大类、代码大类、Agent、B2B 垂类等方面。 涉及数据准备、分类标准图谱准备、赛道分析、竞争分析等内容。
2025-02-18
怎么让AI识别对话,并生成结构化数据存储到我的软件系统里
要让 AI 识别对话并生成结构化数据存储到软件系统里,可以参考以下方法: 1. 基于结构化数据来 RAG:如果原始数据本身就是结构化、标签化的,不必将这部分数据做向量化。结构化数据的特点是特征和属性明确,可用有限标签集描述,能用标准查询语言检索。以餐饮生活助手为例,流程包括用户提问、LLM 提取核心信息并形成标准查询、查询结构化数据、LLM 整合回复。 2. 利用 Coze 平台设计 AI 机器人:创建好 Bot 后,从“个人空间”入口找到机器人,进行“编排”设计。Coze 平台常用的概念和功能包括提示词(设定 Bot 身份和目标)、插件(通过 API 连接集成服务)、工作流(设计多步骤任务)、触发器(创建定时任务)、记忆库(保留对话细节,支持外部知识库)、变量(保存用户个人信息)、数据库(存储和管理结构化数据)、长期记忆(总结聊天对话内容)。设计 Bot 时要先确定目的,比如“AI 前线”Bot 的目的是作为 AI 学习助手,帮助职场专业人士提升在人工智能领域的知识和技能,并提供高效站内信息检索服务。 注:Coze 官方使用指南见链接:https://www.coze.cn/docs/guides/welcome ,遇到疑问也可查阅该指南。
2025-02-18
哪一款AI 可以实现参考一张柱状图,使用我提供的数据,生成同样的柱状图
以下两款 AI 可以实现参考一张柱状图,使用您提供的数据生成同样的柱状图: 1. PandasAI:这是让 Pandas DataFrame“学会说人话”的工具,在 GitHub 已收获 5.4k+星。它并非 Pandas 的替代品,而是将 Pandas 转换为“聊天机器人”,用户可以以 Pandas DataFrame 的形式提出有关数据的问题,它会以自然语言、表格或者图表等形式进行回答。目前仅支持 GPT 模型,OpenAI API key 需自备。例如,输入“pandas_ai.run”,即可生成相关柱状图。链接:https://github.com/gventuri/pandasai 2. DataSquirrel:这是一款自动进行数据清理并可视化执行过程的数据分析工具,能帮助用户在无需公式、宏或代码的情况下快速将原始数据转化为可使用的分析/报告。目前平台提供的用例涵盖了 B2B 电子商务、人力资源、财务会计和调查数据分析行业。平台符合 GDPR/PDPA 标准。链接:https://datasquirrel.ai/
2025-02-18
大语言模型、多模态、数据、算力、算法、预训练、微调、RAG、自注意力机制、transformer、token、神经网络、向量、scaling law这些内容的含义
以下是对您所提到的这些内容含义的解释: 大语言模型:是一种基于大量文本数据进行训练的语言处理模型,其工作原理包括训练数据、算力、模型参数等。在训练数据一致的情况下,模型参数越大能力越强。 多模态:指能够处理多种不同类型的数据模态,如文本、图像、音频等,并将它们融合进行理解和生成。 数据:是大语言模型训练和应用的基础,包括各种文本、图像、音频等信息。 算力:指用于支持大语言模型训练和运行的计算能力。 算法:是大语言模型实现各种功能的数学和逻辑方法。 预训练:在大语言模型中,先在大规模数据上进行无特定任务的初步训练。 微调:基于通用大模型,针对特定领域任务提供数据进行学习和调整,以适应特定领域的需求。 RAG:检索增强生成,通过引用外部数据源为模型做数据补充,适用于动态知识更新需求高的任务。其工作流程包括检索、数据库索引、数据索引、分块、嵌入和创建索引、增强、生成等步骤。 自注意力机制:是 Transformer 架构中的重要部分,能理解上下文和文本关联,通过不断检索和匹配来寻找依赖关系,处理词和词之间的位置组合,预测下一个词的概率。 Transformer:是大语言模型训练架构,用于翻译等任务,具备自注意力机制。 Token:在自然语言处理中,是文本的基本单位。 神经网络:是大语言模型的基础架构,模拟人脑神经元的连接和信息处理方式。 向量:在大语言模型中,用于表示文本等数据的数学形式。 Scaling Law:关于大语言模型规模和性能之间关系的规律。
2025-02-18
大语言模型、多模态、数据、算力、算法、预训练、微调、RAG、自注意力机制、transformer、token、神经网络、向量、scaling law这些内容的含义
以下是对您所提到的这些内容含义的解释: 大语言模型:是一种基于大量文本数据进行训练的语言处理模型,其工作原理包括训练数据、算力、模型参数等。在训练数据一致的情况下,模型参数越大能力越强。 多模态:指能够处理多种不同类型的数据模态,如文本、图像、音频等,并将它们融合进行理解和生成。 数据:是大语言模型训练和应用的基础,包括各种文本、图像、音频等信息。 算力:指用于支持大语言模型训练和运行的计算能力。 算法:是大语言模型实现各种功能的数学和逻辑方法。 预训练:在大语言模型中,先在大规模数据上进行无特定任务的初步训练。 微调:基于通用大模型,针对特定领域任务提供数据进行学习和调整,以适应特定领域的需求。 RAG:检索增强生成,通过引用外部数据源为模型做数据补充,适用于动态知识更新需求高的任务。其工作流程包括检索、数据库索引、数据索引、分块、嵌入和创建索引、增强、生成等步骤。 自注意力机制:是 Transformer 架构中的重要部分,能理解上下文和文本关联,通过不断检索和匹配来寻找依赖关系,处理词和词之间的位置组合,预测下一个词的概率。 Transformer:是大语言模型训练架构,用于翻译等任务,具备自注意力机制。 Token:在自然语言处理中,是文本的基本单位。 神经网络:是大语言模型的基础架构,模拟人脑神经元的连接和信息处理方式。 向量:在大语言模型中,用于表示文本等数据的数学形式。 Scaling Law:关于大语言模型规模和性能之间关系的规律。
2025-02-18
数据处理
数据处理的相关知识如下: 根据《数据安全法》第三条第二款的规定,数据处理指的是“包括数据的收集、存储、使用、加工、传输、提供、公开等”。但在某些情况下,数据处理相对狭义,仅指向数据收集后的存储、使用、加工、公开等行为,不包括数据的收集,以及数据的传输、提供等流转行为。 数据处理是 AIGC 服务的核心环节之一,受到《数据安全法》《个人信息保护法》《网络安全法》等法律法规的规制。AIGC 服务提供者在该环节存在大量法定义务,常见行政法风险包括:开展数据处理活动未依照法律、法规的规定,建立健全全流程数据安全管理制度;未组织开展数据安全教育培训;未采取相应的技术措施和其他必要措施保障数据安全;利用互联网等信息网络开展数据处理活动,未在网络安全等级保护等。 《数据安全法》第一条指出,制定本法是为了规范数据处理活动,保障数据安全,促进数据开发利用,保护个人、组织的合法权益,维护国家主权、安全和发展利益。第二条规定在中华人民共和国境内开展数据处理活动及其安全监管适用本法,在境外开展数据处理活动损害我国相关权益的依法追究法律责任。第三条对数据、数据处理、数据安全进行了定义。此外,还对数据安全工作的决策和协调机构、各地区和部门的职责、相关主管部门和机关的监管职责、个人和组织与数据有关的权益等方面做出了规定。 在 GDPR 通用数据保护条例中,对揭示种族或民族出身,政治观点、宗教或哲学信仰,工会成员等个人数据的处理有禁止规定,但在符合特定情形时不适用,如数据主体明确同意、为实现特定目的必要、保护切身利益必要等。
2025-02-18