Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

入门大模型的简要学习清单

Answer

以下是一份大模型入门的简要学习清单:

  1. 理解大模型的底层原理:
    • 了解预训练阶段大模型的学习内容和数据量,例如以 GPT-3 为例,其训练使用了约 4990 亿 token 的数据集,相当于 86 万本《西游记》。
    • 熟悉 Transformer 模型架构,这是处理文本内容的经典架构,虽然具体细节不清楚不影响使用大模型,但感兴趣可通过相关链接深入了解。
  2. 掌握大模型的概念:
    • 通俗地说,大模型通过输入大量语料让计算机获得类似人类的“思考”能力,能进行文本生成、推理问答、对话、文档摘要等工作。
  3. 类比学习大模型的训练和使用过程:
    • 找学校:训练大模型需要大量计算,GPU 更合适,只有有资本购买大量 GPU 的才有能力训练自己的大模型。
    • 确定教材:大模型需要大量数据,几千亿序列(Token)的输入基本是标配。
    • 找老师:选择合适的算法让大模型更好理解 Token 之间的关系。
    • 就业指导:为让大模型更好胜任某一行业,需要进行微调(fine tuning)指导。
    • 搬砖:就业指导完成后,进行如翻译、问答等工作,在大模型里称为推导(infer)。
  4. 了解 Token:
    • Token 被视为模型处理和生成的文本单位,可以代表单个字符、单词、子单词等,在将输入进行分词时会对其数字化,形成词汇表。
Content generated by AI large model, please carefully verify (powered by aily)

References

走入AI的世界

[title]走入AI的世界[heading2]3清楚原理:必须理解的核心概念和听得懂的底层原理[heading4]3.2大模型的底层原理那么预训练阶段大模型就行学了些什么,又学了多少内容呢?以GPT-3为例,训练他一共用了4990亿token的数据集(约570GB文本),这其中绝大多数都是来源于高质量的网页、书籍数据库、维基百科等的内容,可能你对4990亿token这个数字没有直观的体感,那么我们不妨做个换算,它大概相当于86万本《西游记》,人生不过3万天,也就是说,即使你不吃不喝不睡,以每天读完一本《西游戏》的阅读速度去看这些资料,也大概要28.6辈子才能读完。转换器模型(Transformer):Transformer这个单词你可能很陌生,但它的另一个中文翻译“变形金刚”你一定不陌生,Transformer是一种处理文本内容的经典模型架构,图16中左半部分就是GPT-1所使用的Transformer架构图(右边则是经典的Diffusion模型架构图,用于图像生成)。图16 Transformer和Diffusion关于Transformer的具体细节,即使不清楚,也并不太会影响你用好大模型,因此我们不做更多展开讨论了,感兴趣的朋友可以移步这里:[【官方双语】GPT是什么?直观解释Transformer |深度学习第5章_哔哩哔哩_bilibili](https://www.bilibili.com/video/BV13z421U7cs/?vd_source=951ca0c0cac945e03634d853abc79977)[Transformer Explainer:LLM Transformer Model Visually Explained](https://poloclub.github.io/transformer-explainer/)

大模型入门指南

[title]大模型入门指南[heading1]什么是大模型通俗来讲,大模型就是输入大量语料,来让计算机获得类似人类的“思考”能力,使之能够理解自然语言,能够进行『文本生成』、『推理问答』、『对话』、『文档摘要』等工作。既然是学习,那我们就可以用『上学参加工作』这件事来类比大模型的训练、使用过程:1.找学校::训练LLM需要大量的计算,因此GPU更合适,因此只有购买得起大量GPU的贵族学校才有资本训练自己的大模型2.确定教材::大模型顾名思义就是大,需要的数据量特别多,几千亿序列(Token)的输入基本是标配3.找老师::即用什么样的算法讲述“书本”中的内容,让大模型能够更好理解Token之间的关系4.就业指导::学完书本中的知识后,为了让大模型能够更好胜任某一行业,需要进行微调(fine tuning)指导5.搬砖::就业指导完成后,下面就要正式干活了,比如进行一次翻译、问答等,在大模型里称之为推导(infer)在LLM中,Token([2])被视为模型处理和生成的文本单位。它们可以代表单个字符、单词、子单词,甚至更大的语言单位,具体取决于所使用的分词方法(Tokenization)。Token是原始文本数据与LLM可以使用的数字表示之间的桥梁。在将输入进行分词时,会对其进行数字化,形成一个词汇表(Vocabulary),比如:The cat sat on the mat,会被分割成“The”、“cat”、“sat”等的同时,会生成下面的词汇表:|Token|ID|<br>|-|-|<br>|The|345|<br>|cat|1256|<br>|sat|1726|<br>|…|…|

大模型入门指南

[title]大模型入门指南原文地址:https://mp.weixin.qq.com/s/9nJ7g2mo7nOv4iGXT_CPNg作者:写代码的西瓜随着ChatGPT的到来,大模型([1])(Large Language Model,简称LLM)成了新时代的buzzword,各种GPT产品百花齐放。大多数人直接用现有产品就可以了,但对于喜欢刨根问底的程序员来说,能够在本地运行会更有意思。但由于没有相关背景,笔者一开始在接触时,很多GitHub上的搭建教程看得是云里雾里,而且这方面的介绍文章要不就是太晦涩难懂,要不就是太大众小白,于是就有了这篇文章,主要介绍笔者在搭建大模型过程中学到的知识,以及如何在macOS上运行大模型。笔者水平有限,不足之处请读者指出。

Others are asking
简要概括《奇点临近》这本书的内容
《奇点临近》是雷·库兹韦尔的新作,书中描述了宇宙与人类发展的六个阶段。预言未来几十年内技术将迅速提升,改变人类生活,比如通过脑机接口等技术,人类能提升认知能力、逆转衰老、实现数字永生。但这些技术也带来潜在风险,如 AI 失控和基因编辑滥用。库兹韦尔的预见为我们描绘了一个激动人心又充满挑战的未来。
2024-12-18
文心一言的开发公司是谁,功能特点,优势性和局限性请帮我简要概括
文心一言是由百度开发的全新一代知识增强大语言模型。 功能特点: 在计算、逻辑推理、生成与创作、传统安全这 4 大基础能力上排名国内第一。 在代码、知识与百科、语言理解与抽取、工具使用能力上排名国内前三。 各项能力表现均衡且大部分能力水平较高。 能力栈广泛,可应用场景较多,重点推荐在查询搜索知识应用、任务拆解规划 Agent、文案写作以及代码编写及纠错等方面的应用,在逻辑推理方面表现不俗,可关注在科学研究、教育、工业方面的落地能力。 优势: 能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。 局限性: 从某些测试和感觉来看,其能力水平可能在 GPT3 的阶段,输出内容的可靠性与 ChatGPT 相比还有差距。
2024-11-22
推荐一款能够修正英语语法,并智能扩写的AI,并简要介绍其功能
以下为您推荐能够修正英语语法并智能扩写的 AI 工具及简要介绍其功能: Grammarly:可以进行英语写作和语法纠错,帮助改进英语表达和写作能力。 ChatGPT:能用于英语会话练习和对话模拟,提高交流能力和语感。 此外,关于内容仿写的 AI 工具,为您推荐以下几款中文工具: 秘塔写作猫:网址为 https://xiezuocat.com/ 。它是 AI 写作伴侣,能推敲用语、斟酌文法、改写文风,实时同步翻译,支持全文改写、一键修改、实时纠错并给出修改建议,还能智能分析文章各类属性并打分。 笔灵 AI 写作:网址为 https://ibiling.cn/ 。是智能写作助手,能处理多种文体,支持一键改写/续写/扩写,智能锤炼打磨文字。 腾讯 Effidit 写作:网址为 https://effidit.qq.com/ 。由腾讯 AI Lab 开发,能提升写作者的写作效率和创作体验。 更多 AI 写作类工具可以查看:https://www.waytoagi.com/sites/category/2 。请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-11-22
请根据提供的AI工具网址,搜索常用的AI工具,实际操作AI工具,记录使用过程中的感受和发现,提交一份体验报告,描述工具的使用过程和个人感受,并就AI相关的热点话题,AI伦理、AI与就业等简要发表自己的看法。
以下是一份关于常用 AI 工具的体验报告: 一、AI 工具使用过程和感受 1. 超级简历优化助手 使用过程:用户上传简历,工具分析内容并提供优化建议。 个人感受:对于求职者来说,能够针对性地提升简历质量,提高求职成功率,操作简单易懂。 2. 酷家乐等设计软件 使用过程:用户上传户型图,软件通过 AI 生成多种室内设计方案。 个人感受:为室内设计提供了便捷和丰富的创意,节省了设计时间和精力。 3. Amper Music 使用过程:用户提出需求,工具生成旋律和编曲。 个人感受:对音乐创作者有很大的辅助作用,激发创作灵感。 4. 松果倾诉智能助手 使用过程:通过文字或语音与用户交流,提供情感咨询。 个人感受:在情感支持方面提供了及时的帮助和建议。 5. 小佩宠物智能设备 使用过程:实时监测宠物的活动、饮食等状况,提供健康预警。 个人感受:让宠物主人能更方便地关注宠物健康。 6. 马蜂窝智能行程规划 使用过程:根据用户输入的目的地、时间等因素定制旅游路线。 个人感受:为旅行规划提供了个性化的方案,节省了规划时间。 7. 作业帮智能辅导 使用过程:根据学生的学习情况提供针对性的学习方案。 个人感受:有助于学生获得更贴合自身需求的学习辅导。 8. AI 游戏道具推荐系统 使用过程:在游戏中分析玩家风格和进度,推荐合适道具。 个人感受:提升了游戏体验,使玩家能更有效地获取所需道具。 9. AI 天气预报分时服务 使用过程:利用彩云天气提供每小时的天气预报。 个人感受:为出行和活动安排提供了更精准的参考。 10. AI 医疗病历分析平台 使用过程:分析医疗病历中的症状、检查结果等信息,为医生提供辅助诊断建议。 个人感受:有助于提高医疗诊断的准确性和效率。 11. AI 会议发言总结工具 使用过程:在会议中自动总结发言者的主要观点和重点内容。 个人感受:方便会议记录和回顾,提高工作效率。 12. AI 书法作品临摹辅助工具 使用过程:识别书法作品的笔画和结构,为用户提供临摹指导和评价。 个人感受:对书法爱好者的临摹学习有一定的帮助。 二、关于 AI 相关热点话题的看法 1. AI 伦理 随着 AI 技术的广泛应用,数据隐私、算法偏见等伦理问题日益凸显。需要建立健全的法律法规和伦理准则,确保 AI 的发展符合人类的价值观和利益。 2. AI 与就业 AI 的发展可能会导致一些传统岗位的减少,但同时也会创造新的就业机会,如 AI 开发、维护和管理等。重要的是通过教育和培训,提升劳动者的技能,以适应新的就业需求。 三、健身的 AI 产品 1. Keep:中国最大的健身平台,提供全面的健身解决方案,帮助用户实现健身目标。 2. Fiture:沸彻魔镜集硬件、丰富课程内容、明星教练和社区于一体。 3. Fitness AI:利用人工智能进行锻炼,增强力量和速度。 4. Planfit:健身房家庭训练与 AI 健身计划,AI 教练使用大量文本数据和 ChatGPT 实时提供指导。
2024-11-11
入门大模型的简要学习书籍清单
以下是为您推荐的入门大模型的简要学习书籍清单: 1. 《大模型入门指南》: 通俗解释了大模型,即通过输入大量语料让计算机获得类似人类的“思考”能力,能进行文本生成、推理问答、对话、文档摘要等工作。 用上学参加工作类比大模型的训练和使用过程,包括找学校(训练所需的大量计算和 GPU)、确定教材(大量数据)、找老师(算法)、就业指导(微调)、搬砖(推导)。 介绍了 Token 作为模型处理和生成的文本单位,以及其在数字化和形成词汇表中的作用。 2. 《从 0 到 1 了解大模型安全,看这篇就够了》: 介绍了不同类型的模型架构,如 encoderonly 适用于自然语言理解任务,encoderdecoder 用于理解和生成内容,decoderonly 更擅长自然语言生成任务。 指出目前大型语言模型多为只使用 Decoder 的 Decoderonly 架构,其预训练数据量大,参数多。 提到了大模型在安全性方面的差别。 3. 《走入 AI 的世界》: 以 GPT3 为例,说明了预训练阶段大模型学习的内容和数量,如使用了 4990 亿 token 的数据集,相当于 86 万本《西游记》。 介绍了 Transformer 模型,这是一种处理文本内容的经典架构,不清楚其具体细节不影响使用大模型,感兴趣可通过相关链接深入了解。
2024-10-28
请简要介绍WaytoAGI知识库
WaytoAGI 是一个由一群热爱 AI 的专家和爱好者共同建设的开源 AI 知识库。 在短短一年间,靠着口口相传拥有高达数千万的访问量。其知识库内容丰富,涵盖了 AI 绘画、AI 视频、AI 智能体、AI 3D 等多个版块,还包含赛事和活动以促进大家动手实践,有 AI 领域的最新进展、教程、工具和一线实战案例。 WaytoAGI 不仅是一个普通的技术社区,更是一个汇聚行业顶尖创作者和 KOL 的思想交流平台,社区制作的优质作品多次登上央视首页,广受好评。 它还孵化了如离谱村等大型共创项目,离谱村是由 WaytoAGI 孵化的千人共创项目,让大家学习和接触 AI 更容易、更感兴趣。参与者不分年龄层,都可以通过 AI 工具创作出各种各样的作品。 “通往 AGI 之路”的品牌 VI 融合了独特的设计元素,以彩虹色彰显多元性和创新,以鹿的形象象征智慧与优雅,通过非衬线字体展现现代感和清晰性,共同构建了一个充满活力和前瞻性的品牌形象。
2024-10-11
Deepseek 从入门到精通
以下是关于 DeepSeek 从入门到精通的相关资源: 《》 ,由清华大学新闻与传播学院、新媒体研究中心、元宇宙文化实验室提供,类型为 PPT 课件。
2025-02-21
有java scala hadoop spark flink开发经验员工入门AI 学习提纲以及对应学习内容
以下是为有 Java、Scala、Hadoop、Spark、Flink 开发经验的员工提供的 AI 入门学习提纲及对应学习内容: 1. 学习资源推荐: 系统化学习:观看李弘毅老师的生成式 AI 导论、吴达的生成式 AI 入门视频等,并整理学习笔记与大家交流互动。 社区共创学习:参与社区共创活动,通过做小项目反向推动学习。 参考资料:A16Z 推荐的 AI 相关原理内容,包括 GPT 相关知识、Transformer 模型运作原理、大语言模型词语接龙原理等基础知识。 官方 cookbook:open AI 的官方 cookbook,小琪姐做了中文精读翻译。 历史脉络资料:整理 open AI 的发展时间线、万字长文回顾等。 2. 学习路径: 从提示词开始学习与各类模型的对话,了解其重要性和结构化提示词的优势。 学习过程中可以先从国内模型工具入手,不花钱,若想进阶再考虑高阶方向。 3. 其他学习方式: 创作者将内容做成可视化形式,后续会发到群里。 上传相关 PPT 用作参考。 从温达、李弘毅老师课程等学习入门。 了解时代杂志评选的百位领军人物。 学习 AI 相关名词解释,如 AGI、AIGC、agent、prompt 等,可通过与 AI 对话或李继刚老师的课程来理解。 订阅赛博蝉星公众号、国外优质博主的 blog 或 Twitter 等获取最新信息并投稿。 参与社区活动,如 AIPU、CONFIUI 生态大会、每月的切磋大会、新活动 AIPO 等。
2025-02-21
ai入门学习
以下是新手学习 AI 的全面指南: 1. 了解 AI 基本概念: 建议阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,您将找到一系列为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛(比如图像、音乐、视频等),您可以根据自己的兴趣选择特定的模块进行深入学习。 一定要掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动是学习 AI 的另一种有效方式。尝试使用如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 此外,还有以下相关的学习内容: 1. 入门指南:强化学习: 原文地址:https://mp.weixin.qq.com/s/pOO0llKRKL1HKG8uz_Nm0A 学习深度强化学习的第一个算法可以选择 DQN,并以搞懂它作为入门目标。 2. 写给不会代码的您:20 分钟上手 Python+AI: 在深入学习 AI 时,编程可能会带来挑战,但这份指南旨在让大家更快掌握 Python 和 AI 的相互调用。 您可以在接下来的 20 分钟内,循序渐进地完成以下任务:完成一个简单程序、完成一个爬虫应用抓取公众号文章、完成一个 AI 应用为公众号文章生成概述。 关于 Python:Python 拥有丰富的标准库,还可以通过 pip 工具从类似 GitHub 的平台订购新的工具,在 AI 领域被广泛使用。 关于 OpenAI API:OpenAI 通过 ChatGPT 提供开箱即用的服务,也通过 OpenAI API 提供更加灵活的服务,可通过代码调用完成更多自动化任务。
2025-02-20
Ai基础入门
以下是新手学习 AI 的基础入门指南: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括人工智能的定义、主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,如图像、音乐、视频等,可根据兴趣选择特定模块深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库中有很多实践后的作品、文章分享,欢迎实践后分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解其工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 如果希望继续精进,对于 AI,可以尝试了解以下内容作为基础: 1. AI 背景知识: 基础理论:了解人工智能、机器学习、深度学习的定义及其之间的关系。 历史发展:简要回顾 AI 的发展历程和重要里程碑。 2. 数学基础: 统计学基础:熟悉均值、中位数、方差等统计概念。 线性代数:了解向量、矩阵等线性代数基本概念。 概率论:基础的概率论知识,如条件概率、贝叶斯定理。 3. 算法和模型: 监督学习:了解常用算法,如线性回归、决策树、支持向量机(SVM)。 无监督学习:熟悉聚类、降维等算法。 强化学习:简介强化学习的基本概念。 4. 评估和调优: 性能评估:了解如何评估模型性能,包括交叉验证、精确度、召回率等。 模型调优:学习如何使用网格搜索等技术优化模型参数。 5. 神经网络基础: 网络结构:理解神经网络的基本结构,包括前馈网络、卷积神经网络(CNN)、循环神经网络(RNN)。 激活函数:了解常用的激活函数,如 ReLU、Sigmoid、Tanh。 此外,第二期「AI 实训营」手把手学 AI 【第二期:大咖带你快速上手通义灵码 AI 程序员】,讲师为梦飞,WaytoAGI Agent 核心创作者,词元映射 CEO。课程安排如下: |时间|主题|课程内容| |||| |01/22 20:00<br>|0 基础入门篇:写代码像聊天一样简单<br>可以进入钉钉群获取更多文档:https://alidocs.dingtalk.com/i/nodes/yQod3RxJKGvvkP3rfj5Lgoy7Jkb4Mw9r?utm_scene=person_space|AI 编程的能力与边界<br>通义灵码上手指南<br>一句话 AI 编程小游戏展示| |01/23 20:00<br>|AI 编程实战篇:人人都能“福从天降”|0 基础带练“福从天降”小游戏<br>自然语言生成更多小游戏<br>如何在 Github 部署并生成在线链接| 加入通义灵码钉钉共学群(钉钉群号:78080029971),大咖在线答疑!
2025-02-19
Ai入门
以下是关于 AI 入门的相关内容: Python + AI 入门: 许多朋友在深入学习 AI 时因编程而感到困难,各类教程默认会打命令行也增加了入门难度。 本入门旨在让大家在 20 分钟内掌握 Python 和 AI 的相互调用,完成简单程序、爬虫应用抓取公众号文章、为公众号文章生成概述等任务。 Python 拥有丰富的标准库,若不够用可通过 pip 工具从类似 GitHub 的平台订购新道具,在 AI 领域被广泛使用。 OpenAI 通过 ChatGPT 提供开箱即用的服务,也通过 OpenAI API 提供更灵活的服务,可通过代码调用完成更多自动化任务。 《雪梅 May 的 AI 学习日记》: 第一阶段包括迈出第一步,看书听课进社区。 DAY5:研究并开始使用 Kimi,抱着每天问 100 个问题的心态调整思考模式,养成有问题问 AI 的习惯,可参考。 DAY6:应朋友推荐学习吴恩达的生成式人工智能课程,可在 B 站搜索对应关键词获取资源,学习笔记参考,抽空陆续 3 天学完。 DAY7:探索用 AI 解决真实问题,如团队写行业研究报告。 适用于 JavaScript 的 AI 堆栈入门: 尽管当前版本是起点,但会逐步完善堆栈并增加更多选项。路线图包括交互式 CLI 用于 createaistack、事务性数据库用于高级用例、更多向量数据库和部署平台选项、开源模型的轻量级微调步骤等。 对在创建过程中发挥重要作用的开源项目如表示感谢。
2025-02-19
入门学习
新手入门学习 AI 可以参考以下步骤: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,能找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,可根据自己的兴趣选择特定模块深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 知识库提供了很多实践后的作品、文章分享,欢迎实践后分享。 5. 体验 AI 产品: 与现有的 AI 产品如 ChatGPT、Kimi Chat、智谱、文心一言等聊天机器人进行互动,了解其工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 如果是入门强化学习: 1. 如果没有概率论和线性代数基础,且差不多都忘完了,可以去看一下相关课程学习一下,大约周末一天时间能搞定;如果不关注公式,这一步可先忽略。 2. 对机器学习没有基础的话,可以先看吴恩达的课程,有大致理解后,再看李宏毅的课程作为补充。如果单纯想入门学习强化学习,只需要看李宏毅课程前几节讲完神经网络那里就差不多了,这个视频课程估计要看 25 小时左右。 3. 学完之后可以跟着《动手学深度学习 https://hrl.boyuai.com/》一起动手学习学到的概念,写写代码,入门的话看前五章就好,本篇文章的很多资料也整理自这本书,大约 10 小时左右。 4. 接下来可以看看 B 站王树森的深度学习的课程,先看前几节学习强化学习的基础知识点,大约 5 小时左右。 5. 到这个阶段可能还是懵的,需要上手做点项目,可以看《动手学强化学习》这本书,已开源 https://hrl.boyuai.com/,只看到 DQN 的部分,大约十几小时。
2025-02-19
使用飞书机器人(如Coze智能体)自动抓取外部链接(如网页、公众号文章),通过多维表格存储为“稍后读”清单,并自动提取关键信息(标题、摘要、标签)
以下是使用飞书机器人(如 Coze 智能体)自动抓取外部链接(如网页、公众号文章),通过多维表格存储为“稍后读”清单,并自动提取关键信息(标题、摘要、标签)的相关内容: 前期准备: 1. 简化“收集”: 实现跨平台收集功能,支持电脑(web 端)、安卓、iOS 多端操作。 输入一个 URL 即可完成收集,借鉴微信文件传输助手的方式,通过聊天窗口输入更符合用户习惯。 2. 自动化“整理入库”: 系统在入库时自动整理每条内容的关键信息,包括标题、摘要、作者、发布平台、发布日期、收集时间和阅读状态。 阅读清单支持跨平台查看。 3. 智能“选择”推荐: 根据当前收藏记录和用户阅读兴趣进行相关性匹配,生成阅读计划。 使用步骤: 1. 设置稍后读存储地址: 首次使用,访问。 点击「更多创建副本」,然后复制新表格的分享链接。 将新链接发送到智能体对话中。 还可以发送“查询存储位置”、“修改存储位置”来更换飞书多维表格链接,调整稍后读存储位置。 2. 收藏待阅读的页面链接: 在对话中输入需要收藏的页面链接,第一次使用会要求授权共享数据,授权通过后再次输入即可完成收藏。 目前部分页面链接可能小概率保存失败。 3. 智能推荐想看的内容: 在对话中发送“我想看 xx”、“xx 内容”,即可按个人兴趣推荐阅读计划。 通过飞书机器人与 Coze 搭建的智能体进行对话,在聊天窗口中完成链接输入和阅读计划输出,由 Coze 调用大模型、插件完成内容的整理、推荐,利用飞书多维表格存储和管理稍后读数据,理论上无需开发任何插件、APP,就能实现跨平台的稍后读收集与智能阅读计划的推荐。部署完成后,您可以在电脑、手机端通过飞书机器人与稍后读助手进行对话,也可以直接在 Coze 商店中与 bot 进行对话,如果部署到微信服务号、订阅号,还可以通过这些渠道调用 bot。
2025-02-16
有哪个大模型工具可以提供“word技术规范书转功能清单”功能
目前尚未有确切的大模型工具专门提供“word 技术规范书转功能清单”的功能。但一些通用的自然语言处理工具和办公软件的插件可能会对您有所帮助,例如一些基于云服务的办公自动化工具,不过其效果可能因具体的文档内容和格式而有所差异。
2025-01-21
AIGC伦理检查清单
以下是一份关于 AIGC 伦理检查清单的相关内容: AIGC 概述: GenAI(生成式 AI)是能够从已有数据中学习并生成新数据或内容的 AI 应用,利用 GenAI 创建的内容即 AIGC(AIGenerated Content)。 我国对 AIGC 的监管框架由《网络安全法》《数据安全法》及《个人信息保护法》构成,并与《互联网信息服务算法推荐管理规定》、《互联网信息服务深度合成管理规定》、《生成式人工智能服务管理暂行办法》、《科技伦理审查办法(试行)》等形成共同监管形势。 AIGC 的分类及应用: 主要分为语言文本生成、图像生成和音视频生成。 语言文本生成利用马尔科夫链、RNN、LSTMs 和 Transformer 等模型生成文本,如 GPT4 和 GeminiUltra。 图像生成依赖于 GANs、VAEs 和 Stable Diffusion 等技术,应用于数据增强和艺术创作,代表项目有 Stable Diffusion 和 StyleGAN 2。 音视频生成利用扩散模型、GANs 和 Video Diffusion 等,广泛应用于娱乐和语音生成,代表项目有 Sora 和 WaveNet。 还可应用于音乐生成、游戏开发和医疗保健等领域,展现出广泛的应用前景。 AIGC 触发的法律与道德风险: 重伦理道德,主要体现在两方面: 国家安全:不得生成煽动颠覆国家政权、推翻社会主义制度,危害国家安全和利益、损害国家形象,煽动分裂国家、破坏国家统一和社会稳定,宣扬恐怖主义、极端主义。 伦理道德:不得宣扬民族仇恨、民族歧视,暴力、淫秽色情,以及虚假有害信息等法律、行政法规禁止的内容。 GenAI 工具和 AIGC 提供者应注意在算法设计、训练数据选择、模型生成和优化、提供服务等过程中,采取有效措施防止产生民族、信仰、国别、地域、性别、年龄、职业、健康等歧视。
2024-11-21
最近有什么类似任务清单的AI应用
以下是一些类似任务清单的 AI 应用: WPS 文档翻译功能:这是一个 AI 办公文档翻译工具,使用自然语言处理技术,市场规模达数亿美元。它能快速翻译办公文档,提高工作效率,例如可快速翻译 Word、Excel、PPT 等文档。 美丽修行 APP:作为 AI 美容护肤产品推荐平台,运用数据分析和自然语言处理技术,市场规模达数亿美元。它能根据用户肤质推荐适合的美容护肤产品,比如为油性皮肤推荐控油、保湿的护肤品。 360 儿童手表:这是一个 AI 儿童安全监控系统,采用图像识别和机器学习技术,市场规模达数亿美元。它能保障儿童安全,让家长放心,比如当孩子走出安全区域时会自动向家长发送警报。 汽车之家 APP:作为 AI 汽车保养提醒系统,运用数据分析和机器学习技术,市场规模达数亿美元。它能提醒车主及时进行汽车保养,例如当汽车行驶到一定里程时会推送保养提醒信息。 平安好医生 APP:这是一个 AI 医疗诊断辅助系统,使用数据分析和机器学习技术,市场规模达数十亿美元。它能辅助医生进行疾病诊断,提高诊断准确性,比如用户上传症状描述和检查报告后,系统能给出初步诊断建议和治疗方案。 腾讯会议:作为 AI 会议记录生成工具,运用语音识别和自然语言处理技术,市场规模达数亿美元。它能自动生成会议记录,方便回顾和整理,比如在会议过程中能生成包括发言内容、讨论要点等的记录。 字体管家 APP:这是一个 AI 书法字体生成器,采用图像生成和机器学习技术,市场规模达数亿美元。它能生成各种风格的书法字体,比如生成楷书、行书、草书等字体。 醒图 APP:作为 AI 摄影构图建议工具,运用图像识别和数据分析技术,市场规模达数亿美元。它能为摄影爱好者提供构图建议,提升照片质量,比如引导用户将主体放在画面的黄金分割点上。 宝宝树安全座椅推荐:这是一个 AI 儿童安全座椅推荐系统,运用数据分析和机器学习技术,市场规模达数亿美元。它能为家长推荐合适的儿童安全座椅,比如根据儿童年龄、体重等信息进行推荐。 途虎养车保养推荐:作为 AI 汽车保养套餐推荐系统,运用数据分析和机器学习技术,市场规模达数十亿美元。它能根据车辆情况推荐保养套餐,比如分析车辆型号、行驶里程等。 丰巢快递柜管理系统:这是一个 AI 物流快递柜管理系统,采用数据分析和物联网技术,市场规模达数十亿美元。它能优化快递柜使用效率,比如分配柜子、通知取件等。 智联招聘面试模拟功能:作为 AI 招聘面试模拟平台,运用自然语言处理和机器学习技术,市场规模达数亿美元。它能帮助求职者进行面试模拟,比如模拟面试官提问并提供反馈。 酷家乐装修设计软件:这是一个 AI 房地产装修设计平台,运用图像生成和机器学习技术,市场规模达数十亿美元。它能为用户提供装修设计方案,比如生成各种装修设计方案供用户选择和调整。
2024-11-19
在办公场景中的AI工具清单
以下是在办公场景中常见的 AI 工具清单: PPT 制作工具: Gamma:在线 PPT 制作网站,可通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式。链接:https://gamma.app/ 美图 AI PPT:通过输入简单文本描述生成专业 PPT 设计,有丰富模板库和设计元素。链接:https://www.xdesign.com/ppt/ Mindshow:AI 驱动的 PPT 辅助工具,提供智能设计功能,如自动布局、图像选择和文本优化等。链接:https://www.mindshow.fun/ 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理技术,提供智能文本生成、语音输入、文档格式化等功能。链接:https://zhiwen.xfyun.cn/ 商业顾问工具: Sameday:可以接电话并预约。链接:https://www.gosameday.com/ Truelark:可以处理短信、电子邮件和聊天。链接:https://truelark.com/ Osome:可以管理后台办公室。链接:https://osome.com/sg/ Durable:可以创建一个完整的专业网站。链接:https://durable.co/ Harvey 和 Spellbook:帮助法律团队自动化任务,如接待、研究和文件起草。 Interior AI:使代理商能够虚拟布置房产。链接:https://interiorai.com/ Zuma:帮助物业经理将潜在客户转化为预定的参观。链接:https://www.getzuma.com/ 通用内容创建工具:Jasper(https://www.jasper.ai/)、Copy(http://copy.ai/)、Writer(http://writer.ai/) 其他类型工具: 辅助创作与学习:AI 智能写作助手、AI 语言学习助手、诗歌创作助手、书法字体生成器、漫画生成器等。 推荐与规划:AI 图像识别商品推荐、美食推荐平台、旅游行程规划器、时尚穿搭建议平台、智能投资顾问等。 监控与预警:AI 宠物健康监测设备、家居安全监控系统、天气预报预警系统、医疗诊断辅助系统等。 优化与管理:办公自动化工具、物流路径优化工具、家居清洁机器人调度系统、金融风险评估工具等。 销售与交易:AI 艺术作品生成器、书法作品销售平台、摄影作品销售平台、汽车销售平台、房地产交易平台等。
2024-10-30
我是高中历史老师,我想知道用什么AI模型可以“将自己的PPT变成一篇论文”
目前在将 PPT 转换为论文方面,GPT 模型可能会有所帮助。例如,在“教育:一个历史老师用 GPT 给学生讲课”的案例中,学生利用 GPT 相关功能进行模拟体验,并根据要求撰写论文,包括分析模拟的准确性、进行事实核查等。 另外,Claude 模型也能在相关工作中发挥作用。比如可以帮助快速寻找符合条件的论文、提取精炼论文中的信息,甚至找到适合的 PPT 制作工具并指导使用。 此外,一些神经网络大模型通过预测下一个字的方式生成文字,这种方式具有一定的创意性,且可拓展到图像、声音等领域。但需要注意的是,AI 的预测不一定保证完全正确。
2025-02-22
ai绘画中的模型是什么意思
在 AI 绘画中,模型具有以下含义和特点: 1. 大模型如同主菜或主食,是生成图片的基础框架,决定了图片的基本风格和内容。 2. 小模型(Lora)如同佐料或调料包,能够帮助快速实现特定风格或角色的绘制,比如改变人物形象、画风,添加模型中原本没有的元素,如绘制特定的国内节日元素。 3. 模型的选择与搭配很重要,大模型和 Lora 要基于同一个基础模型才能搭配使用,以生成各种风格的图片。 4. 常用的模型网站有:。 5. 下载模型后需要将之放置在指定的目录下,不同类型的模型放置位置不同。例如,大模型(Ckpt)放入 models\\Stablediffusion;VAE 模型放置在 models\\Stablediffusion 或 models\\VAE 目录,然后在 webui 的设置栏目选择;Lora/LoHA/LoCon 模型放入 extensions\\sdwebuiadditionalnetworks\\models\\lora,也可以在 models/Lora 目录;Embedding 模型放入 embeddings 目录。模型的类型可以通过检测。
2025-02-22
美国有哪些语言模型
美国的语言模型主要有 OpenAI 的 GPT4 、谷歌 DeepMind 与纽约大学团队开发的语言模型、谷歌的 LaMDA 等。其中,Llama 3.1 是较大的版本,在推理、数学、多语言和长上下文任务中能与 GPT4 相抗衡。此外,还包括被评估的如 GPT3 、PaLM 等语言模型。
2025-02-22
学习AI大模型
以下是关于学习 AI 大模型的相关知识: 1. 概念 生成式 AI 生成的内容称为 AIGC。 2. 概念与关系 AI 即人工智能。 机器学习是电脑找规律学习,包括监督学习、无监督学习、强化学习。 监督学习:使用有标签的训练数据,算法目标是学习输入和输出之间的映射关系,包括分类和回归。 无监督学习:学习的数据没有标签,算法自主发现规律,经典任务如聚类,例如让模型将一堆新闻文章根据主题或内容特征分成相似特征的组。 强化学习:从反馈中学习,以最大化奖励或最小化损失,类似训小狗。 深度学习是一种参照人脑有神经网络和神经元(因有很多层所以叫深度)的方法,神经网络可用于监督学习、无监督学习、强化学习。 生成式 AI 可以生成文本、图片、音频、视频等内容形式。 LLM 是大语言模型,对于生成式 AI,生成图像的扩散模型不是大语言模型;对于大语言模型,生成只是其中一个处理任务,如谷歌的 BERT 模型可用于语义理解(不擅长文本生成),像上下文理解、情感分析、文本分类。 3. 技术里程碑 2017 年 6 月,谷歌团队发表论文《Attention is All You Need》,首次提出 Transformer 模型,它完全基于自注意力机制(SelfAttention)处理序列数据,不依赖于循环神经网络(RNN)或卷积神经网络(CNN)。
2025-02-22
适合当作搜索引擎的大模型是什么?
以下是一些适合当作搜索引擎的大模型: Perplexity.ai:本质是个可联网的搜索引擎,完全免费,支持网页版、APP(目前支持 iOS,安卓即将推出)、Chrome 插件。网页版能力全面,能够根据提问从互联网上搜寻信息并给出总结后的答案。很多 Chat GPT 中调用插件才能解决的事情(联网查询、旅行、住宿、商品推荐)靠 Perplexity 就可以解决了。能给出信息来源网址,根据搜索内容给出继续对话的问题建议。支持筛选 Academic(包含不同领域的学术研究论文)、Wolfram|Alpha(包含数学、科学、经济学、语言学、工程学、社会科学、文化等领域的知识库)、Wikipedia(维基百科)、Youtube、Reddit(娱乐、社交和新闻网站)、News 进行搜索。访问地址: 。但要注意不要在开着浏览器翻译能力的同时使用,很可能会报错。另外,不使用 Copilot 能力的效果比较灾难,无法给出具体的酒店建议,只是列举了几个可以查酒店的渠道。
2025-02-22
2024 年值得关注的中文大模型全景图
2024 年,AI 大模型在生产和生活中落地速度迅猛,被称为国内大模型落地元年。以下是一些值得关注的情况: 国内大模型行业形成了以百度、阿里、字节等科技大厂和创业“AI 六小虎”为主要玩家的竞争格局。 2024 年 1 至 11 月,国内大模型中标项目数量和金额大幅增长,中标项目共 728 个,是 2023 年全年的 3.6 倍;中标金额 17.1 亿元,是 2023 年全年的 2.6 倍。中标项目数前五的行业分别是运营商、能源、教育、政务、金融。 厂商方面,百度以 40 个中标项目数、2.74 亿元的中标金额排名所有厂商之首,科大讯飞居第二。 在金融行业,百度以 14 个中标数量、3734.4 万元中标金额排名第一;科大讯飞居第二。 在智能终端行业,超半数手机厂商都在使用文心大模型,包括三星、荣耀、vivo、OPPO、小米等主流手机品牌;上汽大众、吉利汽车、蔚来汽车、长安汽车等十余家车企已接入百度文心大模型。 百度表现突出,截至 11 月,其文心大模型日均调用量超过 15 亿次,千帆平台帮助客户精调了 3.3 万个模型、开发了 77 万个企业应用。今年三季度财报披露,百度智能云营收达 49 亿元,同比增长 11%。 2024 年 9 月 AI 行业大事记: 9 月 12 日:李继刚再现神级 Prompt,玩法持续翻新;Mistral 发布首个多模态模型 Pixtral 12B。 9 月 13 日:商汤 Vimi 相机开放微博小程序;元象开源中国最大 MoE 大模型 XVERSEMoEA36B;OpenAI 发布 o1 模型。 9 月 14 日:人工智能生成合成内容标识办法;Jina AI 发布 ReaderLM、Jina Embeddings V3。 9 月 18 日:DeepSeek 发文庆祝登上 LMSYS 榜单国产第一,几小时后 Qwen 新模型表示不服。 9 月 19 日:云栖大会;通义万相 AI 生视频上线;快手可灵 1.5 模型新增运动笔刷能力。 9 月 20 日:腾讯元器智能体对外发布;秘塔科技产品经理 JD 走红 AI 圈;阶跃跃问接入 Step2 万亿参数 MoE 语言大模型。 9 月 21 日:大模型测试基准研究组正式成立。 9 月 23 日:钉钉 365 会员上线。 9 月 24 日:讯飞星火 API 全新升级;豆包大模型全系列发布&更新。 9 月 25 日:Vidu API 正式开放,加速企业级视频创作;OpenAI 发布高级语音功能;西湖心辰开源 WestlakeOmni。 大模型进入产业落地后,除了大模型本身能力质量要过硬外,落地应用所需要的全栈技术能力、工程化配套工具等对落地效果有直接影响。企业想要真正将大模型在自身场景落地,需要具备构建算力、数据治理、模型训练、场景落实、应用搭建、持续运营、安全合规等整套能力,大模型的竞争正在加速成为体系化之战。
2025-02-21