Navigate to WaytoAGI Wiki →
Home/question.detail.breadcrumb.questionList/question.detail.breadcrumb.questionDetail

入门大模型的简要学习清单

Answer

以下是一份大模型入门的简要学习清单:

  1. 理解大模型的底层原理:
    • 了解预训练阶段大模型的学习内容和数据量,例如以 GPT-3 为例,其训练使用了约 4990 亿 token 的数据集,相当于 86 万本《西游记》。
    • 熟悉 Transformer 模型架构,这是处理文本内容的经典架构,虽然具体细节不清楚不影响使用大模型,但感兴趣可通过相关链接深入了解。
  2. 掌握大模型的概念:
    • 通俗地说,大模型通过输入大量语料让计算机获得类似人类的“思考”能力,能进行文本生成、推理问答、对话、文档摘要等工作。
  3. 类比学习大模型的训练和使用过程:
    • 找学校:训练大模型需要大量计算,GPU 更合适,只有有资本购买大量 GPU 的才有能力训练自己的大模型。
    • 确定教材:大模型需要大量数据,几千亿序列(Token)的输入基本是标配。
    • 找老师:选择合适的算法让大模型更好理解 Token 之间的关系。
    • 就业指导:为让大模型更好胜任某一行业,需要进行微调(fine tuning)指导。
    • 搬砖:就业指导完成后,进行如翻译、问答等工作,在大模型里称为推导(infer)。
  4. 了解 Token:
    • Token 被视为模型处理和生成的文本单位,可以代表单个字符、单词、子单词等,在将输入进行分词时会对其数字化,形成词汇表。
Content generated by AI large model, please carefully verify (powered by aily)

References

走入AI的世界

[title]走入AI的世界[heading2]3清楚原理:必须理解的核心概念和听得懂的底层原理[heading4]3.2大模型的底层原理那么预训练阶段大模型就行学了些什么,又学了多少内容呢?以GPT-3为例,训练他一共用了4990亿token的数据集(约570GB文本),这其中绝大多数都是来源于高质量的网页、书籍数据库、维基百科等的内容,可能你对4990亿token这个数字没有直观的体感,那么我们不妨做个换算,它大概相当于86万本《西游记》,人生不过3万天,也就是说,即使你不吃不喝不睡,以每天读完一本《西游戏》的阅读速度去看这些资料,也大概要28.6辈子才能读完。转换器模型(Transformer):Transformer这个单词你可能很陌生,但它的另一个中文翻译“变形金刚”你一定不陌生,Transformer是一种处理文本内容的经典模型架构,图16中左半部分就是GPT-1所使用的Transformer架构图(右边则是经典的Diffusion模型架构图,用于图像生成)。图16 Transformer和Diffusion关于Transformer的具体细节,即使不清楚,也并不太会影响你用好大模型,因此我们不做更多展开讨论了,感兴趣的朋友可以移步这里:[【官方双语】GPT是什么?直观解释Transformer |深度学习第5章_哔哩哔哩_bilibili](https://www.bilibili.com/video/BV13z421U7cs/?vd_source=951ca0c0cac945e03634d853abc79977)[Transformer Explainer:LLM Transformer Model Visually Explained](https://poloclub.github.io/transformer-explainer/)

大模型入门指南

[title]大模型入门指南[heading1]什么是大模型通俗来讲,大模型就是输入大量语料,来让计算机获得类似人类的“思考”能力,使之能够理解自然语言,能够进行『文本生成』、『推理问答』、『对话』、『文档摘要』等工作。既然是学习,那我们就可以用『上学参加工作』这件事来类比大模型的训练、使用过程:1.找学校::训练LLM需要大量的计算,因此GPU更合适,因此只有购买得起大量GPU的贵族学校才有资本训练自己的大模型2.确定教材::大模型顾名思义就是大,需要的数据量特别多,几千亿序列(Token)的输入基本是标配3.找老师::即用什么样的算法讲述“书本”中的内容,让大模型能够更好理解Token之间的关系4.就业指导::学完书本中的知识后,为了让大模型能够更好胜任某一行业,需要进行微调(fine tuning)指导5.搬砖::就业指导完成后,下面就要正式干活了,比如进行一次翻译、问答等,在大模型里称之为推导(infer)在LLM中,Token([2])被视为模型处理和生成的文本单位。它们可以代表单个字符、单词、子单词,甚至更大的语言单位,具体取决于所使用的分词方法(Tokenization)。Token是原始文本数据与LLM可以使用的数字表示之间的桥梁。在将输入进行分词时,会对其进行数字化,形成一个词汇表(Vocabulary),比如:The cat sat on the mat,会被分割成“The”、“cat”、“sat”等的同时,会生成下面的词汇表:|Token|ID|<br>|-|-|<br>|The|345|<br>|cat|1256|<br>|sat|1726|<br>|…|…|

大模型入门指南

[title]大模型入门指南原文地址:https://mp.weixin.qq.com/s/9nJ7g2mo7nOv4iGXT_CPNg作者:写代码的西瓜随着ChatGPT的到来,大模型([1])(Large Language Model,简称LLM)成了新时代的buzzword,各种GPT产品百花齐放。大多数人直接用现有产品就可以了,但对于喜欢刨根问底的程序员来说,能够在本地运行会更有意思。但由于没有相关背景,笔者一开始在接触时,很多GitHub上的搭建教程看得是云里雾里,而且这方面的介绍文章要不就是太晦涩难懂,要不就是太大众小白,于是就有了这篇文章,主要介绍笔者在搭建大模型过程中学到的知识,以及如何在macOS上运行大模型。笔者水平有限,不足之处请读者指出。

Others are asking
简要概括《奇点临近》这本书的内容
《奇点临近》是雷·库兹韦尔的新作,书中描述了宇宙与人类发展的六个阶段。预言未来几十年内技术将迅速提升,改变人类生活,比如通过脑机接口等技术,人类能提升认知能力、逆转衰老、实现数字永生。但这些技术也带来潜在风险,如 AI 失控和基因编辑滥用。库兹韦尔的预见为我们描绘了一个激动人心又充满挑战的未来。
2024-12-18
文心一言的开发公司是谁,功能特点,优势性和局限性请帮我简要概括
文心一言是由百度开发的全新一代知识增强大语言模型。 功能特点: 在计算、逻辑推理、生成与创作、传统安全这 4 大基础能力上排名国内第一。 在代码、知识与百科、语言理解与抽取、工具使用能力上排名国内前三。 各项能力表现均衡且大部分能力水平较高。 能力栈广泛,可应用场景较多,重点推荐在查询搜索知识应用、任务拆解规划 Agent、文案写作以及代码编写及纠错等方面的应用,在逻辑推理方面表现不俗,可关注在科学研究、教育、工业方面的落地能力。 优势: 能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。 局限性: 从某些测试和感觉来看,其能力水平可能在 GPT3 的阶段,输出内容的可靠性与 ChatGPT 相比还有差距。
2024-11-22
推荐一款能够修正英语语法,并智能扩写的AI,并简要介绍其功能
以下为您推荐能够修正英语语法并智能扩写的 AI 工具及简要介绍其功能: Grammarly:可以进行英语写作和语法纠错,帮助改进英语表达和写作能力。 ChatGPT:能用于英语会话练习和对话模拟,提高交流能力和语感。 此外,关于内容仿写的 AI 工具,为您推荐以下几款中文工具: 秘塔写作猫:网址为 https://xiezuocat.com/ 。它是 AI 写作伴侣,能推敲用语、斟酌文法、改写文风,实时同步翻译,支持全文改写、一键修改、实时纠错并给出修改建议,还能智能分析文章各类属性并打分。 笔灵 AI 写作:网址为 https://ibiling.cn/ 。是智能写作助手,能处理多种文体,支持一键改写/续写/扩写,智能锤炼打磨文字。 腾讯 Effidit 写作:网址为 https://effidit.qq.com/ 。由腾讯 AI Lab 开发,能提升写作者的写作效率和创作体验。 更多 AI 写作类工具可以查看:https://www.waytoagi.com/sites/category/2 。请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-11-22
请根据提供的AI工具网址,搜索常用的AI工具,实际操作AI工具,记录使用过程中的感受和发现,提交一份体验报告,描述工具的使用过程和个人感受,并就AI相关的热点话题,AI伦理、AI与就业等简要发表自己的看法。
以下是一份关于常用 AI 工具的体验报告: 一、AI 工具使用过程和感受 1. 超级简历优化助手 使用过程:用户上传简历,工具分析内容并提供优化建议。 个人感受:对于求职者来说,能够针对性地提升简历质量,提高求职成功率,操作简单易懂。 2. 酷家乐等设计软件 使用过程:用户上传户型图,软件通过 AI 生成多种室内设计方案。 个人感受:为室内设计提供了便捷和丰富的创意,节省了设计时间和精力。 3. Amper Music 使用过程:用户提出需求,工具生成旋律和编曲。 个人感受:对音乐创作者有很大的辅助作用,激发创作灵感。 4. 松果倾诉智能助手 使用过程:通过文字或语音与用户交流,提供情感咨询。 个人感受:在情感支持方面提供了及时的帮助和建议。 5. 小佩宠物智能设备 使用过程:实时监测宠物的活动、饮食等状况,提供健康预警。 个人感受:让宠物主人能更方便地关注宠物健康。 6. 马蜂窝智能行程规划 使用过程:根据用户输入的目的地、时间等因素定制旅游路线。 个人感受:为旅行规划提供了个性化的方案,节省了规划时间。 7. 作业帮智能辅导 使用过程:根据学生的学习情况提供针对性的学习方案。 个人感受:有助于学生获得更贴合自身需求的学习辅导。 8. AI 游戏道具推荐系统 使用过程:在游戏中分析玩家风格和进度,推荐合适道具。 个人感受:提升了游戏体验,使玩家能更有效地获取所需道具。 9. AI 天气预报分时服务 使用过程:利用彩云天气提供每小时的天气预报。 个人感受:为出行和活动安排提供了更精准的参考。 10. AI 医疗病历分析平台 使用过程:分析医疗病历中的症状、检查结果等信息,为医生提供辅助诊断建议。 个人感受:有助于提高医疗诊断的准确性和效率。 11. AI 会议发言总结工具 使用过程:在会议中自动总结发言者的主要观点和重点内容。 个人感受:方便会议记录和回顾,提高工作效率。 12. AI 书法作品临摹辅助工具 使用过程:识别书法作品的笔画和结构,为用户提供临摹指导和评价。 个人感受:对书法爱好者的临摹学习有一定的帮助。 二、关于 AI 相关热点话题的看法 1. AI 伦理 随着 AI 技术的广泛应用,数据隐私、算法偏见等伦理问题日益凸显。需要建立健全的法律法规和伦理准则,确保 AI 的发展符合人类的价值观和利益。 2. AI 与就业 AI 的发展可能会导致一些传统岗位的减少,但同时也会创造新的就业机会,如 AI 开发、维护和管理等。重要的是通过教育和培训,提升劳动者的技能,以适应新的就业需求。 三、健身的 AI 产品 1. Keep:中国最大的健身平台,提供全面的健身解决方案,帮助用户实现健身目标。 2. Fiture:沸彻魔镜集硬件、丰富课程内容、明星教练和社区于一体。 3. Fitness AI:利用人工智能进行锻炼,增强力量和速度。 4. Planfit:健身房家庭训练与 AI 健身计划,AI 教练使用大量文本数据和 ChatGPT 实时提供指导。
2024-11-11
入门大模型的简要学习书籍清单
以下是为您推荐的入门大模型的简要学习书籍清单: 1. 《大模型入门指南》: 通俗解释了大模型,即通过输入大量语料让计算机获得类似人类的“思考”能力,能进行文本生成、推理问答、对话、文档摘要等工作。 用上学参加工作类比大模型的训练和使用过程,包括找学校(训练所需的大量计算和 GPU)、确定教材(大量数据)、找老师(算法)、就业指导(微调)、搬砖(推导)。 介绍了 Token 作为模型处理和生成的文本单位,以及其在数字化和形成词汇表中的作用。 2. 《从 0 到 1 了解大模型安全,看这篇就够了》: 介绍了不同类型的模型架构,如 encoderonly 适用于自然语言理解任务,encoderdecoder 用于理解和生成内容,decoderonly 更擅长自然语言生成任务。 指出目前大型语言模型多为只使用 Decoder 的 Decoderonly 架构,其预训练数据量大,参数多。 提到了大模型在安全性方面的差别。 3. 《走入 AI 的世界》: 以 GPT3 为例,说明了预训练阶段大模型学习的内容和数量,如使用了 4990 亿 token 的数据集,相当于 86 万本《西游记》。 介绍了 Transformer 模型,这是一种处理文本内容的经典架构,不清楚其具体细节不影响使用大模型,感兴趣可通过相关链接深入了解。
2024-10-28
请简要介绍WaytoAGI知识库
WaytoAGI 是一个由一群热爱 AI 的专家和爱好者共同建设的开源 AI 知识库。 在短短一年间,靠着口口相传拥有高达数千万的访问量。其知识库内容丰富,涵盖了 AI 绘画、AI 视频、AI 智能体、AI 3D 等多个版块,还包含赛事和活动以促进大家动手实践,有 AI 领域的最新进展、教程、工具和一线实战案例。 WaytoAGI 不仅是一个普通的技术社区,更是一个汇聚行业顶尖创作者和 KOL 的思想交流平台,社区制作的优质作品多次登上央视首页,广受好评。 它还孵化了如离谱村等大型共创项目,离谱村是由 WaytoAGI 孵化的千人共创项目,让大家学习和接触 AI 更容易、更感兴趣。参与者不分年龄层,都可以通过 AI 工具创作出各种各样的作品。 “通往 AGI 之路”的品牌 VI 融合了独特的设计元素,以彩虹色彰显多元性和创新,以鹿的形象象征智慧与优雅,通过非衬线字体展现现代感和清晰性,共同构建了一个充满活力和前瞻性的品牌形象。
2024-10-11
入门从哪里看起
对于新手入门学习 AI,以下是一些建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,您将找到一系列为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛(比如图像、音乐、视频等),您可以根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 此外,您还可以参考以下资源: 1. 新人的学习路径和建议: 2. 学习交流群: 3. 基础教程: 另外,还有关于入门强化学习的文章,如腾讯互动娱乐工程师 luozhiyun 所写,原文地址:https://mp.weixin.qq.com/s/pOO0llKRKL1HKG8uz_Nm0A 。在学习之前先明确自己的目的,比如以搞懂 DQN 算法作为入门强化学习的目标。
2024-12-21
AI入门
以下是为您提供的 AI 入门指导: 一、背景 在深入学习 AI 时,编程可能会让您感到困难,因为很多教程默认您会打命令行。 二、关于 Python Python 就像哆啦 A 梦的百宝袋,拥有丰富的标准库,遇到问题时可直接使用。若标准库不够,还能通过 pip 工具从类似 GitHub 的平台订购新道具。Python 在 AI 领域被广泛使用。 三、关于 OpenAI API OpenAI 通过两种方式提供服务:一是通过 ChatGPT 提供开箱即用的服务,直接对话即可;二是通过 OpenAI API 提供更灵活的服务,通过代码调用完成更多自动化任务。 四、学习方法 1. 了解 AI 基本概念 阅读「」部分,熟悉术语和基础概念,了解人工智能的主要分支及它们之间的联系。 浏览入门文章,了解 AI 的历史、应用和发展趋势。 2. 开始学习之旅 在「」中找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)按照自己的节奏学习,有机会获得证书。 3. 选择感兴趣的模块深入学习 AI 领域广泛,如图像、音乐、视频等,可根据兴趣选择特定模块深入学习,一定要掌握提示词技巧。 4. 实践和尝试 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 知识库中有很多实践后的作品和文章分享,欢迎您实践后分享。 5. 体验 AI 产品 与 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人互动,了解其工作原理和交互方式,获得实际应用中的第一手体验,激发对 AI 潜力的认识。 在接下来的 20 分钟内,您可以循序渐进地完成以下任务: 1. 完成一个简单程序。 2. 完成一个爬虫应用,抓取公众号文章。 3. 完成一个 AI 应用,为公众号文章生成概述。
2024-12-19
如何快速入门AI
以下是快速入门 AI 的方法: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,如图像、音乐、视频等,可根据自身兴趣选择特定模块深入学习。 掌握提示词的技巧,其上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 知识库提供了很多实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解其工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 对于不会代码的朋友,在深入学习 AI 时,若觉得编程困难,可参考以下 20 分钟上手 Python + AI 的方法: 1. 存在的问题: 许多朋友发现深入学习 AI 需要编程,变得头大。 各类教程默认会打命令行,导致入门十分困难。 2. 解决方法: 这份简明入门旨在让大家更快掌握 Python 和 AI 的相互调用。 在接下来的 20 分钟内,循序渐进完成以下任务: 完成一个简单程序。 完成一个爬虫应用,抓取公众号文章。 完成一个 AI 应用,为公众号文章生成概述。 3. 一些背景: 关于 Python:Python 就像哆拉 A 梦,拥有装满各种道具的标准库,若不够用,可通过 pip 一类的工具从 GitHub 一类的分享代码平台订购新道具,且在 AI 领域被广泛使用。 关于 OpenAI API:OpenAI 通过两种方式提供服务,其一通过 ChatGPT 提供开箱即用的服务,直接对话即可;其二通过 OpenAI API 提供更加灵活的服务,通过代码调用完成更多自动化任务。
2024-12-19
我们普通人如何入门AI
普通人入门 AI 可以参考以下步骤: 1. 了解 AI 基本概念: 建议阅读「」部分,熟悉 AI 的术语和基础概念,包括人工智能的定义、主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,能找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,还有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,可以根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出自己的作品。在知识库有很多大家实践后的作品、文章分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 另外,对于普通人直观初接触 AI,有两个方面: 1. 最低成本能直接上手试的工具是什么,自己能否试试。 2. 现在最普遍/最好的工具是什么、能达到什么效果。虽然底层都是大模型,但 AI 工具各有侧重,不同公司也有各自的优化。关于每一种工具的详细入门、讲解和应用,WayToAIG 已经分好了类目。为了更便捷展示 AI 的能力,让普通人更直观地马上上手,可以选择聊天工具、绘画工具、视频工具、音乐工具等进行体验。
2024-12-18
如何入门ai
以下是入门 AI 的一些建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,可根据自己的兴趣选择特定模块深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库中有很多大家实践后的作品、文章分享,欢迎您实践后也进行分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解其工作原理和交互方式。 对于不会代码的朋友,20 分钟上手 Python+AI 的方法如下: 1. 了解背景: Python 就像哆拉 A 梦,拥有标准库这个百宝袋,若不够用还可通过 pip 工具从类似 GitHub 的平台订购新道具,且在 AI 领域被广泛使用。 OpenAI 通过 ChatGPT 提供开箱即用的服务,也通过 OpenAI API 提供更灵活的代码调用服务。 2. 完成任务: 在 20 分钟内,循序渐进完成一个简单程序、一个爬虫应用抓取公众号文章、一个为公众号文章生成概述的 AI 应用。 另外,入门强化学习可参考以下内容: 明确学习目的,如以搞懂 DQN 算法作为入门目标。 可参考相关资料,如 https://github.com/ty4z2008/Qix/blob/master/dl.md 。
2024-12-18
comfyui入门
ComfyUI 是一个基于节点流程式的 stable diffusion AI 绘图工具 WebUI,可想象成集成了 stable diffusion 功能的 substance designer,将 stable diffusion 流程拆分成节点,实现更精准工作流定制和完善的可复现性。 其优势包括: 1. 对显存要求相对较低,启动和出图速度快。 2. 生成自由度更高。 3. 可以和 webui 共享环境和模型。 4. 能搭建自己的工作流程,可导出流程并分享,报错时能清晰发现错误所在。 5. 生成的图片拖进后会还原整个工作流程,模型也会选择好。 劣势有: 1. 操作门槛高,需要有清晰逻辑。 2. 生态没有 webui 多(但常用的都有),也有一些针对 Comfyui 开发的有趣插件。 官方链接:从 github 上下载作者部署好环境和依赖的整合包,按照官方文档安装即可:https://github.com/comfyanonymous/ComfyUI 。 相关学习资料: 1. ComfyUI 官方文档:提供使用手册和安装指南,适合初学者和有经验用户,网站:https://www.comfyuidoc.com/zh/ 。 2. 优设网:有详细的入门教程,适合初学者,地址:https://www.uisdc.com/comfyui3 。 3. 知乎:有用户分享部署教程和使用说明,适合有一定基础并希望进一步了解的用户,地址:https://zhuanlan.zhihu.com/p/662041596 。 4. Bilibili:有一系列涵盖从新手入门到精通各个阶段的视频教程,地址:https://www.bilibili.com/video/BV14r4y1d7r8/ 。 ComfyUI 共学 WaytoAGI 共学计划中的高频问题及自学资料: 1. 知识库跳转,展开菜单。 2. 。 3. 【海辛】因为一直被几个好朋友问 comfyui 怎么入门,给朋友录了几节 comfyui 基础课,顺手分享给大家~看完这 5 节应该就基本入门啦,然后可以看互联网上任何的进阶教程了。 安装部署: 界面介绍: 文生图、图生图: ComfyUI 中使用 ControlNet: ComfyUI 中不同放大图像方式:
2024-12-18
AIGC伦理检查清单
以下是一份关于 AIGC 伦理检查清单的相关内容: AIGC 概述: GenAI(生成式 AI)是能够从已有数据中学习并生成新数据或内容的 AI 应用,利用 GenAI 创建的内容即 AIGC(AIGenerated Content)。 我国对 AIGC 的监管框架由《网络安全法》《数据安全法》及《个人信息保护法》构成,并与《互联网信息服务算法推荐管理规定》、《互联网信息服务深度合成管理规定》、《生成式人工智能服务管理暂行办法》、《科技伦理审查办法(试行)》等形成共同监管形势。 AIGC 的分类及应用: 主要分为语言文本生成、图像生成和音视频生成。 语言文本生成利用马尔科夫链、RNN、LSTMs 和 Transformer 等模型生成文本,如 GPT4 和 GeminiUltra。 图像生成依赖于 GANs、VAEs 和 Stable Diffusion 等技术,应用于数据增强和艺术创作,代表项目有 Stable Diffusion 和 StyleGAN 2。 音视频生成利用扩散模型、GANs 和 Video Diffusion 等,广泛应用于娱乐和语音生成,代表项目有 Sora 和 WaveNet。 还可应用于音乐生成、游戏开发和医疗保健等领域,展现出广泛的应用前景。 AIGC 触发的法律与道德风险: 重伦理道德,主要体现在两方面: 国家安全:不得生成煽动颠覆国家政权、推翻社会主义制度,危害国家安全和利益、损害国家形象,煽动分裂国家、破坏国家统一和社会稳定,宣扬恐怖主义、极端主义。 伦理道德:不得宣扬民族仇恨、民族歧视,暴力、淫秽色情,以及虚假有害信息等法律、行政法规禁止的内容。 GenAI 工具和 AIGC 提供者应注意在算法设计、训练数据选择、模型生成和优化、提供服务等过程中,采取有效措施防止产生民族、信仰、国别、地域、性别、年龄、职业、健康等歧视。
2024-11-21
最近有什么类似任务清单的AI应用
以下是一些类似任务清单的 AI 应用: WPS 文档翻译功能:这是一个 AI 办公文档翻译工具,使用自然语言处理技术,市场规模达数亿美元。它能快速翻译办公文档,提高工作效率,例如可快速翻译 Word、Excel、PPT 等文档。 美丽修行 APP:作为 AI 美容护肤产品推荐平台,运用数据分析和自然语言处理技术,市场规模达数亿美元。它能根据用户肤质推荐适合的美容护肤产品,比如为油性皮肤推荐控油、保湿的护肤品。 360 儿童手表:这是一个 AI 儿童安全监控系统,采用图像识别和机器学习技术,市场规模达数亿美元。它能保障儿童安全,让家长放心,比如当孩子走出安全区域时会自动向家长发送警报。 汽车之家 APP:作为 AI 汽车保养提醒系统,运用数据分析和机器学习技术,市场规模达数亿美元。它能提醒车主及时进行汽车保养,例如当汽车行驶到一定里程时会推送保养提醒信息。 平安好医生 APP:这是一个 AI 医疗诊断辅助系统,使用数据分析和机器学习技术,市场规模达数十亿美元。它能辅助医生进行疾病诊断,提高诊断准确性,比如用户上传症状描述和检查报告后,系统能给出初步诊断建议和治疗方案。 腾讯会议:作为 AI 会议记录生成工具,运用语音识别和自然语言处理技术,市场规模达数亿美元。它能自动生成会议记录,方便回顾和整理,比如在会议过程中能生成包括发言内容、讨论要点等的记录。 字体管家 APP:这是一个 AI 书法字体生成器,采用图像生成和机器学习技术,市场规模达数亿美元。它能生成各种风格的书法字体,比如生成楷书、行书、草书等字体。 醒图 APP:作为 AI 摄影构图建议工具,运用图像识别和数据分析技术,市场规模达数亿美元。它能为摄影爱好者提供构图建议,提升照片质量,比如引导用户将主体放在画面的黄金分割点上。 宝宝树安全座椅推荐:这是一个 AI 儿童安全座椅推荐系统,运用数据分析和机器学习技术,市场规模达数亿美元。它能为家长推荐合适的儿童安全座椅,比如根据儿童年龄、体重等信息进行推荐。 途虎养车保养推荐:作为 AI 汽车保养套餐推荐系统,运用数据分析和机器学习技术,市场规模达数十亿美元。它能根据车辆情况推荐保养套餐,比如分析车辆型号、行驶里程等。 丰巢快递柜管理系统:这是一个 AI 物流快递柜管理系统,采用数据分析和物联网技术,市场规模达数十亿美元。它能优化快递柜使用效率,比如分配柜子、通知取件等。 智联招聘面试模拟功能:作为 AI 招聘面试模拟平台,运用自然语言处理和机器学习技术,市场规模达数亿美元。它能帮助求职者进行面试模拟,比如模拟面试官提问并提供反馈。 酷家乐装修设计软件:这是一个 AI 房地产装修设计平台,运用图像生成和机器学习技术,市场规模达数十亿美元。它能为用户提供装修设计方案,比如生成各种装修设计方案供用户选择和调整。
2024-11-19
在办公场景中的AI工具清单
以下是在办公场景中常见的 AI 工具清单: PPT 制作工具: Gamma:在线 PPT 制作网站,可通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式。链接:https://gamma.app/ 美图 AI PPT:通过输入简单文本描述生成专业 PPT 设计,有丰富模板库和设计元素。链接:https://www.xdesign.com/ppt/ Mindshow:AI 驱动的 PPT 辅助工具,提供智能设计功能,如自动布局、图像选择和文本优化等。链接:https://www.mindshow.fun/ 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理技术,提供智能文本生成、语音输入、文档格式化等功能。链接:https://zhiwen.xfyun.cn/ 商业顾问工具: Sameday:可以接电话并预约。链接:https://www.gosameday.com/ Truelark:可以处理短信、电子邮件和聊天。链接:https://truelark.com/ Osome:可以管理后台办公室。链接:https://osome.com/sg/ Durable:可以创建一个完整的专业网站。链接:https://durable.co/ Harvey 和 Spellbook:帮助法律团队自动化任务,如接待、研究和文件起草。 Interior AI:使代理商能够虚拟布置房产。链接:https://interiorai.com/ Zuma:帮助物业经理将潜在客户转化为预定的参观。链接:https://www.getzuma.com/ 通用内容创建工具:Jasper(https://www.jasper.ai/)、Copy(http://copy.ai/)、Writer(http://writer.ai/) 其他类型工具: 辅助创作与学习:AI 智能写作助手、AI 语言学习助手、诗歌创作助手、书法字体生成器、漫画生成器等。 推荐与规划:AI 图像识别商品推荐、美食推荐平台、旅游行程规划器、时尚穿搭建议平台、智能投资顾问等。 监控与预警:AI 宠物健康监测设备、家居安全监控系统、天气预报预警系统、医疗诊断辅助系统等。 优化与管理:办公自动化工具、物流路径优化工具、家居清洁机器人调度系统、金融风险评估工具等。 销售与交易:AI 艺术作品生成器、书法作品销售平台、摄影作品销售平台、汽车销售平台、房地产交易平台等。
2024-10-30
如何了解AI的基本概念,是否有词条清单
以下是帮助您了解 AI 基本概念的一些途径和内容: 阅读相关资料:建议阅读「」部分,熟悉 AI 的术语和基础概念,了解人工智能、机器学习、深度学习的定义及其之间的关系,以及 AI 的主要分支和它们之间的联系。 浏览入门文章:这些文章通常会介绍 AI 的历史、当前的应用和未来的发展趋势。 学习数学基础:包括统计学基础(熟悉均值、中位数、方差等统计概念)、线性代数(了解向量、矩阵等基本概念)、概率论(基础的概率论知识,如条件概率、贝叶斯定理)。 了解算法和模型:监督学习(如线性回归、决策树、支持向量机)、无监督学习(如聚类、降维)、强化学习(简介强化学习的基本概念)。 掌握评估和调优知识:如性能评估(包括交叉验证、精确度、召回率等)、模型调优(学习如何使用网格搜索等技术优化模型参数)。 您还可以通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。同时,AI 领域广泛,您可以根据自己的兴趣选择特定的模块(比如图像、音乐、视频等)进行深入学习。
2024-09-12
你好,你的大模型是什么
大模型是指输入大量语料,使计算机获得类似人类的“思考”能力,能够理解自然语言,并进行文本生成、推理问答、对话、文档摘要等工作。 大模型的训练和使用过程可以用“上学参加工作”来类比: 1. 找学校:训练大模型需要大量计算,GPU 更合适,只有购买得起大量 GPU 的才有资本训练自己的大模型。 2. 确定教材:大模型需要的数据量特别多,几千亿序列(Token)的输入基本是标配。 3. 找老师:即用合适的算法讲述“书本”中的内容,让大模型能够更好理解 Token 之间的关系。 4. 就业指导:为了让大模型更好胜任某一行业,需要进行微调(fine tuning)指导。 5. 搬砖:就业指导完成后,正式干活,比如进行翻译、问答等,在大模型里称之为推导(infer)。 在大模型中,Token 被视为模型处理和生成的文本单位,它们可以代表单个字符、单词、子单词,甚至更大的语言单位,具体取决于所使用的分词方法(Tokenization)。Token 是原始文本数据与大模型可以使用的数字表示之间的桥梁。在将输入进行分词时,会对其进行数字化,形成一个词汇表(Vocabulary)。 为了让计算机理解 Token 之间的联系,还需要把 Token 表示成稠密矩阵向量,这个过程称之为 embedding,常见的算法有: 基于统计:Word2Vec,通过上下文统计信息学习词向量;GloVe,基于词共现统计信息学习词向量。 基于深度网络:CNN,使用卷积网络获得图像或文本向量;RNN/LSTM,利用序列模型获得文本向量。 基于神经网络:BERT,基于 Transformer 和掩码语言建模(Masked LM)进行词向量预训练;Doc2Vec,使用神经网络获得文本序列的向量。 以 Transform 为代表的大模型采用自注意力(Selfattention)机制来学习不同 token 之间的依赖关系,生成高质量 embedding。大模型的“大”,指的是用于表达 token 之间关系的参数多,主要是指模型中的权重(weight)与偏置(bias),例如 GPT3 拥有 1750 亿参数,其中权重数量达到了这一量级,而词汇表 token 数只有 5 万左右。 此外,如果您想获取更多模型,大多数模型可以在 Civitai(C 站)https://civitai.com/ 下载。下载模型时的注意事项包括: 科学上网,需自行想办法。 点击右上角筛选按钮,找到所需模型类型,如 Checkpoint=大模型、LoRA=Lora 等。 看照片,感兴趣的点进去,点击右边“Download”下载保存到电脑本地。还可以点击左上角“Images”,查看别人做好的图片,找到喜欢的点进去,复制图片信息。 模型下载保存地址: 大模型:SD 根目录即存放 SD 的文件夹。 Lora、VAE 等也有相应的保存位置。 如果不知道下载的模型类型及应存放的文件夹,可以使用秋叶的模型解析工具 https://spell.novelai.dev/,将模型拖动到空白处,自动弹出模型信息,查看模型种类。
2024-12-23
如果我现在想用claude但是无法登陆,有哪几种可以体验到claude模型的方式
以下是几种可以体验到 Claude 模型的方式: 1. 通过:这是一个优秀的 AI 助手工具,付费后可使用 Claude 3.5 sonnet、ChatGPT4O 等顶级大模型。 2. 访问:Claude 官方原版,注册后可每日限额免费体验,但存在较高的封号风险。 3. 还可以通过 Cursor、Windsurf 等 AI 编程产品,调用 Claude AI API,但不支持 Artifacts 这种即时预览的使用方式,需要单独保存代码文件后查看。不过好处是,可以用 MD、CSV 等格式的文件,存储提示词、更新记录和 AI 交互数据。 Claude AI 是一款由 Anthropic 公司开发的 AI 助手,是基于自然语言处理技术和人工智能算法的聊天机器人。以开创性计算机科学家克劳德·香农(Claude Shannon)的名字命名,利用先进的机器学习技术、自然语言处理和深度学习算法,为各种应用提供支持。 Anthropic 发布了 Claude 3 模型,该模型更擅长遵循复杂的多步指令,特别擅长遵循品牌语调和响应指南,并开发用户可以信任的客户体验。此外,Claude 3 模型更擅长生成流行的结构化输出,如 JSON 格式。Opus 和 Sonnet 现已可在 API 中使用,该 API 现已普遍可用,使开发人员能够立即注册并开始使用这些模型。Haiku 将很快可用。现在可以在上使用新的 Claude 3 模型。 要注册 Claude.ai,可以按照以下步骤进行: 1. 访问 Claude 的官方网站。 2. 点击注册或登录界面中的“Sign Up”或“Continue with email”选项。 3. 填写邮箱地址并设置密码,然后提交表单。 4. 系统会向邮箱发送一封验证邮件,打开邮件并使用其中的验证码来完成邮箱验证。 如果在注册过程中遇到需要海外手机号接收验证码的问题,可能的解决方案有: 1. 使用虚拟海外号服务,如 SMSActivate、SMSPool 等,购买一个海外虚拟手机号来接收 Claude 的验证码。 2. 借助第三方服务网站如 uiuihao.com 完成注册 Claude 账号。 3. 如果有海外朋友,可以请他们帮忙接收验证码,并将验证码告知。 完成注册后,如果希望升级到 Claude Pro 版本以获取更强大的功能和更高的 API 调用限额,需要填写支付信息并选择一个合适的订阅计划。值得注意的是,订阅 Claude Pro 可能需要使用海外支付方式。请注意,Claude.ai 目前处于公开测试阶段,未付费用户使用平台可能会受到一些限制。如果在注册过程中遇到任何问题,可以参考其他用户分享的详细注册教程和解决策略。
2024-12-23
我现在是一家公司的实习生,目前参与的项目是AI法律大模型未来法官助手,这个系统的功能是提取案件中的信息,自动填写到预设好的要件中,比如犯罪嫌疑人的姓名、身份证号、出生日期、事发经过等等,我该如何去学习提示词
以下是关于如何学习提示词运用的建议: 1. 理解提示词的作用:提示词为模型提供上下文和指示,其质量直接影响模型输出质量。 2. 学习提示词的构建技巧: 明确任务目标,用简洁准确的语言描述。 给予足够的背景信息和示例,帮助模型理解语境。 使用清晰的指令,如“解释”“总结”“创作”等。 对特殊要求应给予明确指示,如输出格式、字数限制等。 3. 参考优秀案例:研究和学习已有的优秀提示词案例,在领域社区、Github 等资源中获取大量案例。 4. 实践、迭代、优化:多与语言模型互动,根据输出结果提高提示词质量,尝试各种变体,比较分析输出差异,持续优化提示词构建。 5. 活用提示工程工具:如 Anthropic 的 Constitutional AI 等,辅助构建和优化提示词。 6. 跟上前沿研究:提示工程是前沿研究领域,持续关注最新研究成果和方法论。 精心设计的提示词能最大限度发挥语言模型的潜力,多实践、多学习、多总结,终可掌握窍门。同时,在与大模型交互时,方法论不是关键,不断尝试和交互是最佳方法,无需严格遵循规则,未达成目的就锲而不舍地再尝试或更换模型。另外,用 Markdown 格式清晰表达问题有助于提高与模型交流的效率和精确性,其具有结构清晰、格式化强调、适用性广等优点。
2024-12-23
推荐一个AI工具,帮助我每天自动执行以下步骤:从本地上传文件给大模型,该文件内含有新闻网页链接,大模型读取链接并汇总内容
以下为您推荐的 AI 工具可能有助于您实现每天自动执行从本地上传文件给大模型,并让大模型读取文件内新闻网页链接并汇总内容的需求: 1. AI 拍立得(Pailido): 特点:即拍即得,简化流程,操作直观高效。 体验方式:微信小程序搜索“Pailido”。 交互逻辑:用户选择拍摄场景类型并拍照,AI 自动识别和分析照片内容信息,依据预设场景规则迅速生成符合情境的反馈。 实现场景: 图片转成文本:用户上传图片后,大模型根据选择的场景生成相关文字描述或解说文本,可用于生成美食点评、朋友圈发布文案、闲鱼上架示例模版等。 图片转绘图片:用户上传图片后,大模型按照指定风格快速生成图像的转绘版本,适应不同风格和场景需求,如图片粘土风、图片积木风、图片像素风等。 2. 内容仿写 AI 工具: 秘塔写作猫:https://xiezuocat.com/ ,是 AI 写作伴侣,能推敲用语、斟酌文法、改写文风,实时同步翻译,支持全文改写、一键修改、实时纠错并给出修改建议,智能分析文章属性并打分。 笔灵 AI 写作:https://ibiling.cn/ ,是智能写作助手,支持多种文体写作,如心得体会、公文写作、演讲稿、小说、论文等,支持一键改写/续写/扩写,智能锤炼打磨文字。 腾讯 Effidit 写作:https://effidit.qq.com/ ,由腾讯 AI Lab 开发的智能创作助手,能提升写作者的写作效率和创作体验。 更多 AI 写作类工具可以查看:https://www.waytoagi.com/sites/category/2 。请注意,内容由 AI 大模型生成,请仔细甄别。
2024-12-21
如何利用AGI创建3D打印的模型
利用 AGI 创建 3D 打印模型的方法如下: 1. 将孩子的画转换为 3D 模型: 使用 AutoDL 部署 Wonder3D:https://qa3dhma45mc.feishu.cn/wiki/Pzwvwibcpiki2YkXepaco8Tinzg (较难) 使用 AutoDL 部署 TripoSR:https://qa3dhma45mc.feishu.cn/wiki/Ax1IwzWG6iDNMEkkaW3cAFzInWe (小白一学就会) 具体实物(如鸟/玩偶/汽车)的 3D 转换效果最佳,wonder3D 能智能去除背景(若效果不佳,需手动扣除背景) 对于一些非现实类玩偶类作品,wonder3D 识别效果不佳时,可先使用 StableDiffusion 将平面图转换为伪 3D 效果图再生成模型。以 usagi 为例,先通过 SD 生成 3D 的 usagi,再将 usagi 输入 wonder3D。 2. 生成特定模型,如创建一个乐高 logo 的 STL 文件: 设计乐高 logo:使用矢量图形编辑软件(如 Adobe Illustrator 或 Inkscape)创建或获取矢量格式的乐高 logo,确保符合标准。 导入 3D 建模软件:将矢量 logo 导入到 3D 建模软件(如 Blender、Fusion 360 或 Tinkercad)中。 创建 3D 模型:在 3D 建模软件中根据矢量图形创建 3D 模型,调整尺寸和厚度以适合打印。 导出 STL 文件:将完成的 3D 模型导出为 STL 文件格式。 以下是在 Blender 中使用 Python 脚本创建简单 3D 文本作为乐高 logo 并导出为 STL 文件的步骤: 打开 Blender,切换到“脚本编辑器”界面。 输入脚本,点击“运行脚本”按钮,Blender 将创建 3D 文本对象并导出为 STL 文件。 检查生成的 STL 文件,可根据需要调整脚本中的参数(如字体、位置、挤压深度等)以获得满意的乐高 logo 3D 模型。 此外,还有一些其他动态: 阿里妈妈发布了:https://huggingface.co/alimamacreative/FLUX.1TurboAlpha ,演示图片质量损失小,比 FLUX schell 本身好很多。 拓竹旗下 3D 打印社区 Make World 发布 AI:https://bambulab.com/zh/signin ,3D 生成模型找到落地和变现路径。 上海国投公司搞了一个:https://www.ithome.com/0/801/764.htm ,基金规模 100 亿元,首期 30 亿元,并与稀宇科技(MiniMax)、阶跃星辰签署战略合作协议。 智谱的:https://kimi.moonshot.cn/ 都推出基于深度思考 COT 的 AI 搜索。 字节跳动发布:https://mp.weixin.qq.com/s/GwhoQ2JCMQwtLN6rsrJQw ,支持随时唤起豆包交流和辅助。 :https://x.com/krea_ai/status/1844369566237184198 ,集成了海螺、Luma、Runway 和可灵四家最好的视频生成模型。 :https://klingai.kuaishou.com/ ,现在可以直接输入文本指定对应声音朗读,然后再对口型。
2024-12-20
如何通过提示词提高模型数据对比和筛选能力
以下是一些通过提示词提高模型数据对比和筛选能力的方法: 1. 选择自定义提示词或预定义话题,在网站上使用如 Llama3.1 8B Instruct 模型时,输入对话内容等待内容生成,若右边分析未刷新可在相关按钮间切换。由于归因聚类使用大模型,需稍作等待,最终结果可能因模型使用的温度等因素而不同。 2. 在写提示词时不能依赖直觉和偷懒,要实话实说,补充详细信息以避免模型在边缘情况上犯错,这样也能提高数据质量。 3. 在分类问题中,提示中的每个输入应分类到预定义类别之一。在提示末尾使用分隔符如“\n\n\n\n”,选择映射到单个 token 的类,推理时指定 max_tokens=1,确保提示加完成不超过 2048 个 token,每班至少有 100 个例子,可指定 logprobs=5 获得类日志概率,用于微调的数据集应在结构和任务类型上与模型使用的数据集相似。例如在确保网站广告文字正确的案例中,可微调分类器,使用合适的分隔符和模型。
2024-12-20