Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

入门大模型的简要学习清单

Answer

以下是一份大模型入门的简要学习清单:

  1. 理解大模型的底层原理:
    • 了解预训练阶段大模型的学习内容和数据量,例如以 GPT-3 为例,其训练使用了约 4990 亿 token 的数据集,相当于 86 万本《西游记》。
    • 熟悉 Transformer 模型架构,这是处理文本内容的经典架构,虽然具体细节不清楚不影响使用大模型,但感兴趣可通过相关链接深入了解。
  2. 掌握大模型的概念:
    • 通俗地说,大模型通过输入大量语料让计算机获得类似人类的“思考”能力,能进行文本生成、推理问答、对话、文档摘要等工作。
  3. 类比学习大模型的训练和使用过程:
    • 找学校:训练大模型需要大量计算,GPU 更合适,只有有资本购买大量 GPU 的才有能力训练自己的大模型。
    • 确定教材:大模型需要大量数据,几千亿序列(Token)的输入基本是标配。
    • 找老师:选择合适的算法让大模型更好理解 Token 之间的关系。
    • 就业指导:为让大模型更好胜任某一行业,需要进行微调(fine tuning)指导。
    • 搬砖:就业指导完成后,进行如翻译、问答等工作,在大模型里称为推导(infer)。
  4. 了解 Token:
    • Token 被视为模型处理和生成的文本单位,可以代表单个字符、单词、子单词等,在将输入进行分词时会对其数字化,形成词汇表。
Content generated by AI large model, please carefully verify (powered by aily)

References

走入AI的世界

[title]走入AI的世界[heading2]3清楚原理:必须理解的核心概念和听得懂的底层原理[heading4]3.2大模型的底层原理那么预训练阶段大模型就行学了些什么,又学了多少内容呢?以GPT-3为例,训练他一共用了4990亿token的数据集(约570GB文本),这其中绝大多数都是来源于高质量的网页、书籍数据库、维基百科等的内容,可能你对4990亿token这个数字没有直观的体感,那么我们不妨做个换算,它大概相当于86万本《西游记》,人生不过3万天,也就是说,即使你不吃不喝不睡,以每天读完一本《西游戏》的阅读速度去看这些资料,也大概要28.6辈子才能读完。转换器模型(Transformer):Transformer这个单词你可能很陌生,但它的另一个中文翻译“变形金刚”你一定不陌生,Transformer是一种处理文本内容的经典模型架构,图16中左半部分就是GPT-1所使用的Transformer架构图(右边则是经典的Diffusion模型架构图,用于图像生成)。图16 Transformer和Diffusion关于Transformer的具体细节,即使不清楚,也并不太会影响你用好大模型,因此我们不做更多展开讨论了,感兴趣的朋友可以移步这里:[【官方双语】GPT是什么?直观解释Transformer |深度学习第5章_哔哩哔哩_bilibili](https://www.bilibili.com/video/BV13z421U7cs/?vd_source=951ca0c0cac945e03634d853abc79977)[Transformer Explainer:LLM Transformer Model Visually Explained](https://poloclub.github.io/transformer-explainer/)

大模型入门指南

[title]大模型入门指南[heading1]什么是大模型通俗来讲,大模型就是输入大量语料,来让计算机获得类似人类的“思考”能力,使之能够理解自然语言,能够进行『文本生成』、『推理问答』、『对话』、『文档摘要』等工作。既然是学习,那我们就可以用『上学参加工作』这件事来类比大模型的训练、使用过程:1.找学校::训练LLM需要大量的计算,因此GPU更合适,因此只有购买得起大量GPU的贵族学校才有资本训练自己的大模型2.确定教材::大模型顾名思义就是大,需要的数据量特别多,几千亿序列(Token)的输入基本是标配3.找老师::即用什么样的算法讲述“书本”中的内容,让大模型能够更好理解Token之间的关系4.就业指导::学完书本中的知识后,为了让大模型能够更好胜任某一行业,需要进行微调(fine tuning)指导5.搬砖::就业指导完成后,下面就要正式干活了,比如进行一次翻译、问答等,在大模型里称之为推导(infer)在LLM中,Token([2])被视为模型处理和生成的文本单位。它们可以代表单个字符、单词、子单词,甚至更大的语言单位,具体取决于所使用的分词方法(Tokenization)。Token是原始文本数据与LLM可以使用的数字表示之间的桥梁。在将输入进行分词时,会对其进行数字化,形成一个词汇表(Vocabulary),比如:The cat sat on the mat,会被分割成“The”、“cat”、“sat”等的同时,会生成下面的词汇表:|Token|ID|<br>|-|-|<br>|The|345|<br>|cat|1256|<br>|sat|1726|<br>|…|…|

大模型入门指南

[title]大模型入门指南原文地址:https://mp.weixin.qq.com/s/9nJ7g2mo7nOv4iGXT_CPNg作者:写代码的西瓜随着ChatGPT的到来,大模型([1])(Large Language Model,简称LLM)成了新时代的buzzword,各种GPT产品百花齐放。大多数人直接用现有产品就可以了,但对于喜欢刨根问底的程序员来说,能够在本地运行会更有意思。但由于没有相关背景,笔者一开始在接触时,很多GitHub上的搭建教程看得是云里雾里,而且这方面的介绍文章要不就是太晦涩难懂,要不就是太大众小白,于是就有了这篇文章,主要介绍笔者在搭建大模型过程中学到的知识,以及如何在macOS上运行大模型。笔者水平有限,不足之处请读者指出。

Others are asking
简要概括《奇点临近》这本书的内容
《奇点临近》是雷·库兹韦尔的新作,书中描述了宇宙与人类发展的六个阶段。预言未来几十年内技术将迅速提升,改变人类生活,比如通过脑机接口等技术,人类能提升认知能力、逆转衰老、实现数字永生。但这些技术也带来潜在风险,如 AI 失控和基因编辑滥用。库兹韦尔的预见为我们描绘了一个激动人心又充满挑战的未来。
2024-12-18
文心一言的开发公司是谁,功能特点,优势性和局限性请帮我简要概括
文心一言是由百度开发的全新一代知识增强大语言模型。 功能特点: 在计算、逻辑推理、生成与创作、传统安全这 4 大基础能力上排名国内第一。 在代码、知识与百科、语言理解与抽取、工具使用能力上排名国内前三。 各项能力表现均衡且大部分能力水平较高。 能力栈广泛,可应用场景较多,重点推荐在查询搜索知识应用、任务拆解规划 Agent、文案写作以及代码编写及纠错等方面的应用,在逻辑推理方面表现不俗,可关注在科学研究、教育、工业方面的落地能力。 优势: 能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。 局限性: 从某些测试和感觉来看,其能力水平可能在 GPT3 的阶段,输出内容的可靠性与 ChatGPT 相比还有差距。
2024-11-22
推荐一款能够修正英语语法,并智能扩写的AI,并简要介绍其功能
以下为您推荐能够修正英语语法并智能扩写的 AI 工具及简要介绍其功能: Grammarly:可以进行英语写作和语法纠错,帮助改进英语表达和写作能力。 ChatGPT:能用于英语会话练习和对话模拟,提高交流能力和语感。 此外,关于内容仿写的 AI 工具,为您推荐以下几款中文工具: 秘塔写作猫:网址为 https://xiezuocat.com/ 。它是 AI 写作伴侣,能推敲用语、斟酌文法、改写文风,实时同步翻译,支持全文改写、一键修改、实时纠错并给出修改建议,还能智能分析文章各类属性并打分。 笔灵 AI 写作:网址为 https://ibiling.cn/ 。是智能写作助手,能处理多种文体,支持一键改写/续写/扩写,智能锤炼打磨文字。 腾讯 Effidit 写作:网址为 https://effidit.qq.com/ 。由腾讯 AI Lab 开发,能提升写作者的写作效率和创作体验。 更多 AI 写作类工具可以查看:https://www.waytoagi.com/sites/category/2 。请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-11-22
请根据提供的AI工具网址,搜索常用的AI工具,实际操作AI工具,记录使用过程中的感受和发现,提交一份体验报告,描述工具的使用过程和个人感受,并就AI相关的热点话题,AI伦理、AI与就业等简要发表自己的看法。
以下是一份关于常用 AI 工具的体验报告: 一、AI 工具使用过程和感受 1. 超级简历优化助手 使用过程:用户上传简历,工具分析内容并提供优化建议。 个人感受:对于求职者来说,能够针对性地提升简历质量,提高求职成功率,操作简单易懂。 2. 酷家乐等设计软件 使用过程:用户上传户型图,软件通过 AI 生成多种室内设计方案。 个人感受:为室内设计提供了便捷和丰富的创意,节省了设计时间和精力。 3. Amper Music 使用过程:用户提出需求,工具生成旋律和编曲。 个人感受:对音乐创作者有很大的辅助作用,激发创作灵感。 4. 松果倾诉智能助手 使用过程:通过文字或语音与用户交流,提供情感咨询。 个人感受:在情感支持方面提供了及时的帮助和建议。 5. 小佩宠物智能设备 使用过程:实时监测宠物的活动、饮食等状况,提供健康预警。 个人感受:让宠物主人能更方便地关注宠物健康。 6. 马蜂窝智能行程规划 使用过程:根据用户输入的目的地、时间等因素定制旅游路线。 个人感受:为旅行规划提供了个性化的方案,节省了规划时间。 7. 作业帮智能辅导 使用过程:根据学生的学习情况提供针对性的学习方案。 个人感受:有助于学生获得更贴合自身需求的学习辅导。 8. AI 游戏道具推荐系统 使用过程:在游戏中分析玩家风格和进度,推荐合适道具。 个人感受:提升了游戏体验,使玩家能更有效地获取所需道具。 9. AI 天气预报分时服务 使用过程:利用彩云天气提供每小时的天气预报。 个人感受:为出行和活动安排提供了更精准的参考。 10. AI 医疗病历分析平台 使用过程:分析医疗病历中的症状、检查结果等信息,为医生提供辅助诊断建议。 个人感受:有助于提高医疗诊断的准确性和效率。 11. AI 会议发言总结工具 使用过程:在会议中自动总结发言者的主要观点和重点内容。 个人感受:方便会议记录和回顾,提高工作效率。 12. AI 书法作品临摹辅助工具 使用过程:识别书法作品的笔画和结构,为用户提供临摹指导和评价。 个人感受:对书法爱好者的临摹学习有一定的帮助。 二、关于 AI 相关热点话题的看法 1. AI 伦理 随着 AI 技术的广泛应用,数据隐私、算法偏见等伦理问题日益凸显。需要建立健全的法律法规和伦理准则,确保 AI 的发展符合人类的价值观和利益。 2. AI 与就业 AI 的发展可能会导致一些传统岗位的减少,但同时也会创造新的就业机会,如 AI 开发、维护和管理等。重要的是通过教育和培训,提升劳动者的技能,以适应新的就业需求。 三、健身的 AI 产品 1. Keep:中国最大的健身平台,提供全面的健身解决方案,帮助用户实现健身目标。 2. Fiture:沸彻魔镜集硬件、丰富课程内容、明星教练和社区于一体。 3. Fitness AI:利用人工智能进行锻炼,增强力量和速度。 4. Planfit:健身房家庭训练与 AI 健身计划,AI 教练使用大量文本数据和 ChatGPT 实时提供指导。
2024-11-11
入门大模型的简要学习书籍清单
以下是为您推荐的入门大模型的简要学习书籍清单: 1. 《大模型入门指南》: 通俗解释了大模型,即通过输入大量语料让计算机获得类似人类的“思考”能力,能进行文本生成、推理问答、对话、文档摘要等工作。 用上学参加工作类比大模型的训练和使用过程,包括找学校(训练所需的大量计算和 GPU)、确定教材(大量数据)、找老师(算法)、就业指导(微调)、搬砖(推导)。 介绍了 Token 作为模型处理和生成的文本单位,以及其在数字化和形成词汇表中的作用。 2. 《从 0 到 1 了解大模型安全,看这篇就够了》: 介绍了不同类型的模型架构,如 encoderonly 适用于自然语言理解任务,encoderdecoder 用于理解和生成内容,decoderonly 更擅长自然语言生成任务。 指出目前大型语言模型多为只使用 Decoder 的 Decoderonly 架构,其预训练数据量大,参数多。 提到了大模型在安全性方面的差别。 3. 《走入 AI 的世界》: 以 GPT3 为例,说明了预训练阶段大模型学习的内容和数量,如使用了 4990 亿 token 的数据集,相当于 86 万本《西游记》。 介绍了 Transformer 模型,这是一种处理文本内容的经典架构,不清楚其具体细节不影响使用大模型,感兴趣可通过相关链接深入了解。
2024-10-28
请简要介绍WaytoAGI知识库
WaytoAGI 是一个由一群热爱 AI 的专家和爱好者共同建设的开源 AI 知识库。 在短短一年间,靠着口口相传拥有高达数千万的访问量。其知识库内容丰富,涵盖了 AI 绘画、AI 视频、AI 智能体、AI 3D 等多个版块,还包含赛事和活动以促进大家动手实践,有 AI 领域的最新进展、教程、工具和一线实战案例。 WaytoAGI 不仅是一个普通的技术社区,更是一个汇聚行业顶尖创作者和 KOL 的思想交流平台,社区制作的优质作品多次登上央视首页,广受好评。 它还孵化了如离谱村等大型共创项目,离谱村是由 WaytoAGI 孵化的千人共创项目,让大家学习和接触 AI 更容易、更感兴趣。参与者不分年龄层,都可以通过 AI 工具创作出各种各样的作品。 “通往 AGI 之路”的品牌 VI 融合了独特的设计元素,以彩虹色彰显多元性和创新,以鹿的形象象征智慧与优雅,通过非衬线字体展现现代感和清晰性,共同构建了一个充满活力和前瞻性的品牌形象。
2024-10-11
入门
以下是为您提供的 AI 入门相关内容: 强化学习入门: 学习之前先明确目的。 学习深度强化学习的第一个算法通常是 DQN,以搞懂它作为入门目标。 参考资料:https://github.com/ty4z2008/Qix/blob/master/dl.md 。 Stable Diffusion 入门: 基本介绍:https://waytoagi.feishu.cn/wiki/CeOvwZPwCijV79kt9jccfkRan5e 。 运作方式:https://waytoagi.feishu.cn/wiki/TNIRw7qsViYNVgkPaazcuaVfndc 。 新人视频教程:https://waytoagi.feishu.cn/wiki/O5jEwgZIRiQ10xkqGOQcKtSBnSe 。 文字教程:https://zhuanlan.zhihu.com/p/622238031 。 模型网站: C 站SD 模型网站:https://civitai.com/ 。 Liblibai模型+在线 SD:https://www.liblib.ai/ 。 huggingface:https://huggingface.co/models?pipeline_tag=texttoimage&sort=trending 。 吐司站:https://tusiart.com/ 。 人像摄影模型介绍:https://www.bilibili.com/video/BV1DP41167bZ 。 扣子“AI 应用”入门: 讲师韦恩是智能体创业者、WayToAGI 共建者、微软提示词工程师、多平台 Agent 开发者、企业级 AI Agent 定制专家,荣获多家 AI 开发平台的比赛奖项,有 12 年程序开发背景,是多家企业的 AI 落地顾问。 课程计划: DAY1:入门,搭建证件照应用,需要有一定的智能体搭建基础。 DAY2:进阶,邮票收藏馆搭建,需要有第一天的 AI 应用搭建基础,传送门:https://waytoagi.feishu.cn/wiki/NiXNwxVtHiP68Pk7bKmcNRDon6d?from=from_copylink 。 您将收获: 全面认识扣子的 AI 应用的底层逻辑。 解决 AI 应用核心卡点:工具栏、表单使用、加载动图、界面布局等卡点。 收获一个价值千元的 AI 应用证件照。
2025-03-26
AI 入门
以下是关于 AI 入门的一些指导: 适用于 JavaScript 的 AI 堆栈入门: 路线图: 提供交互式 CLI 用于 createaistack,让开发人员能选择项目脚手架和依赖项。 增加用于高级用例的事务性数据库,例如在问答中保留问题、用户偏好等。 提供更多的向量数据库和部署平台选项。 推出用于开源模型的轻量级微调步骤。 感谢 Tailwind、ai sdk、dotenv、Next.js、langchain.js 等开源项目在创建过程中的重要作用。 写给不会代码的你:20 分钟上手 Python+AI: 在深入学习 AI 时,编程可能会让新手感到困难,此教程旨在让大家在 20 分钟内掌握 Python 和 AI 的相互调用。 完成任务:包括完成一个简单程序、一个爬虫应用以抓取公众号文章、一个 AI 应用为公众号文章生成概述。 背景知识: Python 拥有丰富的标准库,若不够用还可通过 pip 工具从类似 GitHub 的平台订购新道具,在 AI 领域被广泛使用。 OpenAI 通过 ChatGPT 提供开箱即用的服务,也通过 OpenAI API 提供更灵活的代码调用服务以完成更多自动化任务。 新手如何学习 AI: 了解 AI 基本概念: 阅读「」熟悉术语和基础概念,了解其主要分支及联系,浏览入门文章。 开始 AI 学习之旅: 在「」中找到初学者课程,推荐李宏毅老师的课程,通过在线教育平台按自己节奏学习并获取证书。 选择感兴趣的模块深入学习: AI 领域广泛,可根据兴趣选择特定模块,如掌握提示词技巧。 实践和尝试: 实践是巩固知识的关键,尝试使用各种产品并分享实践成果。 体验 AI 产品: 与 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人互动,了解其工作原理和交互方式。
2025-03-25
AI入门视频推荐
以下为您推荐一些 AI 入门视频: 1. 吴达的生成式 AI 入门视频。 2. 吴恩达推出的《生成式 AI 入门视频课程》,一共 31 集,宝玉老师每天翻译一集,可在 B 站观看学习。 此外,在“通往 AGI 之路知识库”中还有很多与 AI 相关的学习内容,例如 AIPO 与 config UI 的生态大会相关介绍、AI 学习路径和方法的分享等。
2025-03-25
教我工作流的底层逻辑跟如何入门学习工作流
工作流的底层逻辑及入门学习方法如下: 工作流通常由多个节点构成,节点是其基本单元,本质上是包含输入和输出的函数。常见的节点类型包括: 1. LLM(大语言模型):使用输入参数和提示词生成处理结果。 2. Code(代码):通过 IDE 编写代码处理输入参数,并返回输出值。 3. Knowledage(知识库):根据输入参数从关联知识库中召回数据,并返回。 4. Condition(条件判断):ifelse 逻辑节点,用于设计工作流内的分支流程,根据设置条件运行相应的分支。 5. Variable(获取变量):从 Bot 中获取变量作为参数在工作流中使用。 6. Database(数据库):在工作流中使用提前配置在 Bot 数据库中的数据。 以下是一些入门学习工作流的示例和资源: 1. 对于生成绿幕素材和绿幕素材抠图的工作流,您可以下载工作流文件拖入 ComfyUI 中自动加载,然后对照相关说明进行学习。工作流链接:https://pan.quark.cn/s/01eae57419ce 提取码:KxgB 2. 对于 Glif 图像流制作冰淇淋甜品地标,您可以按照以下步骤学习: 1 分钟交作业:点击网址 https://glif.app/@jianStuart/glifs/cly85fy2i000cqe87zcu72i5l ,选一张主体区分度高且主体为地标的图,上传图片并点击相应按钮,多点几次选一张满意的即可。 5 分钟学习制作:点击顶上的“build”按钮,点击“+”加号,选择“img input”,再点下面的“+”加号,选“image generator”,把提示词放进节点,打开“advanced controls”,修改参数,勾选“Enable input image”并改参数。 3. 对于 Coze 平台的工作流,官方有现成的教程参考: 海外参考文档:https://www.coze.com/docs/zh_cn/use_workflow.html 国内参考文档:https://www.coze.cn/docs/guides/use_workflow 国内版本还提供了一些示例,建议跟着实操一遍,如: 搜索新闻:https://www.coze.cn/docs/guides/workflow_search_news 使用 LLM 处理问题:https://www.coze.cn/docs/guides/workflow_use_llm 生成随机数:https://www.coze.cn/docs/guides/workflow_use_code 搜索并获取第一个链接的内容:https://www.coze.cn/docs/guides/workflow_get_content 识别用户意图:https://www.coze.cn/docs/guides/workflow_user_intent
2025-03-24
我是ai视频入门新手,我该如何从零学习可使用的工具组合与降低工作流程
对于 AI 视频入门新手,从零学习可用的工具组合与降低工作流程,您可以参考以下内容: 工具组合方面: Runway:在真实影像方面质感较好,战争片全景镜头处理出色,控件体验感不错,但存在爱变色、光影不稳定的问题。 SVD:在风景片测试中表现较好,其他方面一般。 Pixverse:擅长物体滑行运动。 Pika:在生成人物表情自然的画面方面表现出色,可用于局部重绘。 11labs:用于制作 AI 声音,英文效果较好,但存在声音没有情绪和情感的问题。 MJ:局部重绘功能强大。 ComfyUI:可进行高清放大和细节增强。 可灵:图生视频效果质量高且稳定,但贵且慢。 Pika 2.2 版本:在首尾帧过渡上有不错表现。 Pixverse:生成速度最快的视频生成平台。 工作流程方面: 1. 分析小说内容:使用如 ChatGPT 等 AI 工具提取关键场景、角色和情节。 2. 生成角色与场景描述:借助如 Stable Diffusion 或 Midjourney 等工具生成视觉描述。 3. 图像生成:使用 AI 图像生成工具创建角色和场景图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成脚本。 5. AI 声音制作:利用如 11labs 等工具将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用如剪映等视频编辑软件将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,提高视频质量。 8. 审阅与调整:观看视频,根据需要重新编辑某些场景或调整音频。 9. 输出与分享:完成编辑后,输出最终视频并在所需平台分享。 需要注意的是,具体的操作步骤和所需工具可能因项目需求和个人偏好有所不同。同时,AI 工具的可用性和功能可能会随时间变化,建议直接访问工具网址获取最新信息和使用指南。
2025-03-24
入门指南
以下是强化学习的入门指南: 1. 基础知识补充:如果没有相关基础且概率论和线性代数知识遗忘较多,可以学习相关课程,周末一天可完成;若对机器学习无基础,可先看吴恩达课程,再以李宏毅课程补充,单纯入门强化学习只需看前几节讲完神经网络的部分,此视频课程约需 25 小时。 2. 动手实践:跟着《动手学深度学习 https://hrl.boyuai.com/》学习并写代码,入门看前五章,约 10 小时。 3. 深入学习基础知识点:观看 B 站王树森的深度学习课程的前几节,约 5 小时。 4. 项目实践:可以看《动手学强化学习》,看到 DQN 部分,约十几小时。同时,文中还提到行动只有向左或向右两个,模型构建简单,DQN 的网络模型采用一层 128 个神经元的全连接并以 ReLU 作为激活函数,选用两层网络结构;需要一个缓存区存放从环境中采样的数据;有训练函数,批量从缓存区获取数据,使用 DQN 算法进行训练;还有主循环函数,在每个 episode 中选择动作(使用 εgreedy 策略),执行动作并将结果存储在 replay buffer 中,训练完使用保存好的 model.pth 参数即可实际使用。 文章作者为腾讯互动娱乐工程师 luozhiyun,原文地址:https://mp.weixin.qq.com/s/pOO0llKRKL1HKG8uz_Nm0A,感谢群友.com 的推荐。在学习前先明确目的,本文以搞懂 DQN 算法作为入门目标。像 https://github.com/ty4z2008/Qix/blob/master/dl.md 这类链接中有很多资料,但需筛选。
2025-03-22
国内的大语言模型清单
以下是一些国内的大语言模型: 1. 文心一言:可用于文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成等。 2. 讯飞星火:通用模型,处理自然语言。 3. “悟道・天鹰”(北京智源人工智能研究院):首个具备中英文双语知识、支持商用许可协议、国内数据合规需求的开源语言大模型。 此外,如果想了解国内大模型的效果,可以参考第三方基准评测报告:
2025-03-20
我需要一个能够生成适合初中生的个性化的英语单词清单,用什么工具比较合适
以下为您推荐几种适合生成适合初中生个性化英语单词清单的工具: 1. DeepSeek:您可以输入单词主题、图片风格、单词数量等,它会为您输出指定数量的相关单词,并以数组形式呈现,包括单词、中文、美式音标以及相关的英文句子和中文翻译。 2. Claude:您可以输入任意三个中文词语或一个主题让其随机生成 Word Search 表格,有助于提升初中生的语言能力、专注力、认知能力等。 3. 利用搞定设计结合 ChatGPT:通过搞定设计制作单词卡模板,然后使用 ChatGPT 生成单词内容并整理放入 Excel 文件中,实现批量制作单词卡片。
2025-02-26
给我30份中央人民政府网站和工业和信息部网站2020~2023年期间发布的重要的国家层面与人工智能相关政策文件,列个清单
以下是中央人民政府网站和工业和信息部网站 2020 2023 年期间发布的部分重要的国家层面与人工智能相关政策文件清单: 1. 互联网信息服务算法推荐管理规定(算法推荐规定),于 2023 年 3 月 1 日生效。 2. 互联网信息服务深度合成管理规定(深度合成规定),于 2023 年 1 月 10 日生效。 3. 生成式人工智能服务管理暂行办法(生成式 AI 办法),于 2023 年 7 月 13 日公布并于 2023 年 8 月 15 日生效。 4. 生成式人工智能服务安全基本要求(征求意见稿),于 2023 年 10 月 11 日公开征求意见,意见反馈截止日期为 2023 年 10 月 25 日。 5. 科技伦理审查办法(试行)(征求意见稿)(伦理审查办法(草案)),于 2023 年 4 月 14 日公开征求意见,意见反馈截止时间为 2023 年 5 月 3 日。 6. 国家人工智能产业综合标准化体系建设指南(征求意见稿),于 2024 年 1 月 17 日公开征集意见,意见反馈截止时间为 2024 年 1 月 31 日。 由于未能获取到 30 份相关政策文件,建议您通过中央人民政府网站和工业和信息部网站的搜索功能,以获取更全面和准确的信息。
2025-02-25
我要学习AIGC ,零基础,刚接触,请给我制定一个系统的学习清单
以下是为您制定的零基础学习 AIGC 的系统学习清单: 1. 阅读彭博社对谷歌 CEO Sundar Pichai 的访谈,了解关于搜索未来、Gemini 构建、与微软和 OpenAI 竞争、美中在 AI 方面的竞争以及谷歌文化挑战等内容,同时关注 Google 对 AI 技术未来包括 AGI 的承诺和看法。 2. 查看 Elicit 发布的机器学习必读清单,系统学习机器学习基础、Transformer 与基础模型、训练与微调、推理与运行策略等方面,从基础概念入门到深度强化学习和反向传播等进阶内容,深入了解 Transformer 架构以及训练和精调语言模型的方法与策略,分析大语言模型如何处理复杂推理和解决问题的任务。 3. 学习提示工程基础,掌握三种高级提示工程技巧,包括思维链(CoT)提示、思维树(ToT)提示和思维图(GoT)提示。 4. 观看【AI 学习笔记】小白如何理解技术原理与建立框架的相关内容,了解什么是 AI 大模型及其原理,包括生成式 AI 生成的内容(AIGC)、相关技术名词(如 AI、机器学习、监督学习、无监督学习、强化学习、深度学习、生成式 AI、LLM 等)以及技术里程碑(如谷歌团队发表的《Attention is All You Need》论文提出的 Transformer 模型)。
2025-02-24
使用飞书机器人(如Coze智能体)自动抓取外部链接(如网页、公众号文章),通过多维表格存储为“稍后读”清单,并自动提取关键信息(标题、摘要、标签)
以下是使用飞书机器人(如 Coze 智能体)自动抓取外部链接(如网页、公众号文章),通过多维表格存储为“稍后读”清单,并自动提取关键信息(标题、摘要、标签)的相关内容: 前期准备: 1. 简化“收集”: 实现跨平台收集功能,支持电脑(web 端)、安卓、iOS 多端操作。 输入一个 URL 即可完成收集,借鉴微信文件传输助手的方式,通过聊天窗口输入更符合用户习惯。 2. 自动化“整理入库”: 系统在入库时自动整理每条内容的关键信息,包括标题、摘要、作者、发布平台、发布日期、收集时间和阅读状态。 阅读清单支持跨平台查看。 3. 智能“选择”推荐: 根据当前收藏记录和用户阅读兴趣进行相关性匹配,生成阅读计划。 使用步骤: 1. 设置稍后读存储地址: 首次使用,访问。 点击「更多创建副本」,然后复制新表格的分享链接。 将新链接发送到智能体对话中。 还可以发送“查询存储位置”、“修改存储位置”来更换飞书多维表格链接,调整稍后读存储位置。 2. 收藏待阅读的页面链接: 在对话中输入需要收藏的页面链接,第一次使用会要求授权共享数据,授权通过后再次输入即可完成收藏。 目前部分页面链接可能小概率保存失败。 3. 智能推荐想看的内容: 在对话中发送“我想看 xx”、“xx 内容”,即可按个人兴趣推荐阅读计划。 通过飞书机器人与 Coze 搭建的智能体进行对话,在聊天窗口中完成链接输入和阅读计划输出,由 Coze 调用大模型、插件完成内容的整理、推荐,利用飞书多维表格存储和管理稍后读数据,理论上无需开发任何插件、APP,就能实现跨平台的稍后读收集与智能阅读计划的推荐。部署完成后,您可以在电脑、手机端通过飞书机器人与稍后读助手进行对话,也可以直接在 Coze 商店中与 bot 进行对话,如果部署到微信服务号、订阅号,还可以通过这些渠道调用 bot。
2025-02-16
有哪个大模型工具可以提供“word技术规范书转功能清单”功能
目前尚未有确切的大模型工具专门提供“word 技术规范书转功能清单”的功能。但一些通用的自然语言处理工具和办公软件的插件可能会对您有所帮助,例如一些基于云服务的办公自动化工具,不过其效果可能因具体的文档内容和格式而有所差异。
2025-01-21
搭建私有大模型
搭建私有大模型可以参考以下几种方法: 1. 方法一 搭建,用于汇聚整合多种大模型接口,方便后续更换使用各种大模型,同时会告知如何白嫖大模型接口。 搭建,这是一个知识库问答系统,将知识文件放入,并接入上面的大模型作为分析知识库的大脑,最后回答问题。若不想接入微信,搭建完此系统即可,它也有问答界面。 搭建,其中的cow插件能进行文件总结、MJ绘画。 2. 方法二 部署大语言模型: 下载并安装Ollama,根据电脑系统,从https://ollama.com/download 下载。下载完成后,双击打开,点击“Install”。安装完成后,将下方地址复制进浏览器中,若出现相关字样,表示安装完成:http://127.0.0.1:11434/ 。 下载qwen2:0.5b模型(0.5b是为了方便测试,下载快,设备充足可下载更大模型)。若为windows电脑,点击win+R,输入cmd,点击回车;若为Mac电脑,按下Command(⌘)+Space键打开Spotlight搜索,输入“Terminal”或“终端”,然后从搜索结果中选择“终端”应用程序。复制相关命令行,粘贴进入,点击回车,等待下载完成。 3. 方法三 企业大模型四步走的第一步是私有化部署通用大模型,一是解决AI科普问题,二是满足一些通用需求。若有能力,可赠送免费的私有化部署通用大模型,其为千亿模型的缩小版、浓缩版,能解决科普问题,让企业员工熟悉大模型,同时满足办公等通用需求。此外,还提供了360AI办公的一套会员服务,围绕办公营销需求做了很多工具,以订阅模式耗费算力,每天几乎一块钱。
2025-03-26
我是一位程序开发小白,不会用代码开发程序。我现在有一台安装Window 11操作系统的笔记本电脑,配置为14代i7CPU、32G内存、1TB硬盘、1张RTX4070显卡。我想部署一套本地的大模型+智能体+知识库。我要怎么样才能实现无代码部署,请列出详细的安装步骤。
以下是为您提供的无代码部署本地大模型、智能体和知识库的详细安装步骤: 1. 硬件评估:您的笔记本电脑配置为 14 代 i7 CPU、32G 内存、1TB 硬盘、1 张 RTX4070 显卡,基本满足部署要求。但需要注意,运行内存最低 32GB,越高越好,最低配可能会经常爆显存。建议将软件和模型部署在 SSD(固态硬盘)上,以提高加载模型的速度。 2. 选择合适的部署工具:ComfyUI 是一个相对配置要求较低、系统资源占用少、出图速度快的工具。它最低可在小于 3G 的 GPU 上运行,甚至没有 GPU 光用 CPU 也可以,但速度极慢。SDXL 出来后提高了运行配置,最低需要 8GB 显存+32GB 运行内存,12GB 流畅运行,推荐 16GB 以上。 3. 安装准备:如果您的电脑能顺畅清晰地玩 3A 游戏,那么运行相关部署工具一般也没问题。 4. 预算和需求:根据您的需求和预算来选择合适的配置。例如,如果有做 AIGC 视频、建模渲染和炼丹(lora)的需求,可能需要更高的配置。 请注意,以上步骤仅为参考,实际部署过程可能会因具体情况而有所不同。
2025-03-26
ai大模型和工具组合使用技巧
以下是关于 AI 大模型和工具组合使用的技巧: 1. 在 Obsidian 中的使用: 简单方法:通过命令面板打开创建的页面(默认快捷键 Ctrl+P),在弹出的搜索框中输入插件名称(如 custom frames),选择 OpenKimi 并打开设置好的窗口。 进阶配置:包括笔记仓库嵌入大模型(Copilot)、笔记内容作为 RAG 嵌入大模型(Smart Conections)、笔记内使用大模型编写内容。 2. 利用大模型与工具的典型例子:如使用 Kimi Chat 查询问题时,它会在互联网上检索相关内容并总结分析给出结论,同时还有很多不同领域类型的工具为大模型在获取、处理、呈现信息上做补充。 3. Agentic Workflow 方面: Agent 通过自行规划任务执行的工作流路径,面向简单或线性流程的运行。 多 Agent 协作:吴恩达通过开源项目 ChatDev 举例,让大语言模型扮演不同角色相互协作开发应用或复杂程序。 AI Agent 基本框架:OpenAI 的研究主管 Lilian Weng 提出“Agent=LLM+规划+记忆+工具使用”的基础架构,其中大模型 LLM 扮演“大脑”,规划包括子目标分解、反思与改进。 4. 从提示词优化到底层能力提升: 任务拆解:将复杂任务的提示词拆解成若干步骤的智能体,每个智能体负责特定子任务。 工作流构建:组合多个提示词或 AI 工具搭建高频重复工作的工作流。 创作场景的灵活应用:在创作过程中使用简单提示词和连续追问调整大模型回答。 深度思考辅助:将大模型用于辅助深度思考,从居高临下的指挥变为伙伴式的协作和相互学习,关注利用大模型训练和增强认知能力。
2025-03-26
帮我列举2025年3月1日以来,国内外、闭源开源模型厂商的更新记录。
以下是 2025 年 3 月 1 日以来,国内外、闭源开源模型厂商的部分更新记录: 2025 年 3 月 20 日,OpenAI 推出了一套全新的音频模型,旨在通过 API 为开发者提供更智能、更可定制的语音代理支持,包括改进的语音转文本和文本转语音功能,为语音交互应用带来显著提升。 李开复公开表示 OpenAI 面临生存危机,商业模式不可持续。他强调中国的 DeepSeek 以极低成本提供接近的性能,开源模式将主导未来 AI 发展。他认为企业级 AI 应用将成为投资重点,资源限制反而促进了创新。李开复大胆预测,中国将出现三大 AI 玩家,竞争愈发激烈。 SuperCLUE 发布《中文大模型基准测评 2025 年 3 月报告》,指出 2022 2025 年经历多阶段发展,国内外模型差距缩小。测评显示 o3mini总分领先,国产模型表现亮眼,如 DeepSeekR1 等在部分能力上与国际领先模型相当,且小参数模型潜力大。性价比上,国产模型优势明显。DeepSeek 系列模型深度分析表明,其 R1 在多方面表现出色,蒸馏模型实用性高,不同第三方平台的联网搜索和稳定性有差异。 以上信息来源包括: 《》 《》 《》
2025-03-26
用扣子的时候怎么让大模型严格按照知识库内容进行输出
以下是关于让大模型严格按照知识库内容进行输出的相关信息: 扣子的知识库功能强大,可上传和存储知识内容,提供多种查找方法。在智能体中使用知识库,收集相关内容,当智能体回答用户时会先检索知识库,使回复更准确。 在“掘金 x 扣子 Hackathon 活动 深圳站”的总冠军工作流中,对于用户向小说人物角色的提问,通过一系列节点,包括开始节点接收问题、知识库节点检索、大模型节点生成答案等,本质上是一个根据用户 query 进行检索增强生成(RAG)的任务,每个工作流中都嵌入了知识库节点,维护了如小说合集等知识库。 大模型节点是调用大语言模型,使用变量和提示词生成回复。按需选择基础版或专业版模型,基础版支持扣子预设的一批模型资源,专业版除默认添加的豆包模型外,还支持按需接入火山引擎方舟平台的模型资源。模型选择右下角生成多样性可从多个维度调整不同模型在生成内容时的随机性,有精确模式、平衡模式和创意模式等预置模式。输入方面,开启智能体对话历史后,上下文信息将自动携带进入大模型,参数名可随意设置但建议有规律,变量值可引用前面链接过的节点的输出或进行输入。
2025-03-26
我是一个没有技术背景且对AI感兴趣的互联网产品经理,目标是希望理解AI的实现原理并且能够跟开发算法工程师沟通交流,请给我举出AI模型或者机器学习的分类吧。
以下是 AI 模型和机器学习的分类: 1. AI(人工智能):是一个广泛的概念,旨在使计算机系统能够模拟人类智能。 2. 机器学习:是人工智能的一个子领域,让计算机通过数据学习来提高性能。包括以下几种类型: 监督学习:使用有标签的训练数据,算法学习输入和输出之间的映射关系,包括分类和回归任务。 无监督学习:学习的数据没有标签,算法自主发现规律,经典任务如聚类。 强化学习:从反馈中学习,以最大化奖励或最小化损失,类似训练小狗。 3. 深度学习:是机器学习的一个子领域,模拟人脑创建人工神经网络处理数据,包含多个处理层,在图像识别、语音识别和自然语言处理等任务中表现出色。 4. 大语言模型:是深度学习在自然语言处理领域的应用,目标是理解和生成人类语言,如 ChatGPT、文心一言等。同时具有生成式 AI 的特点,能够生成文本、图像、音频和视频等内容。 2017 年 6 月,谷歌团队发表论文《Attention is All You Need》,首次提出了 Transformer 模型,它基于自注意力机制处理序列数据,不依赖循环神经网络或卷积神经网络。生成式 AI 生成的内容称为 AIGC。
2025-03-26