Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

llm cookbook 有资源吗

Answer

以下是关于 LLM 学习资源和 OpenAI Cookbook 的相关信息:

学习大型语言模型(LLM)开发的资源和路径:

  1. 掌握深度学习和自然语言处理基础:
    • 机器学习、深度学习、神经网络等基础理论。
    • 自然语言处理基础,如词向量、序列模型、注意力机制等。
    • 相关课程:吴恩达的深度学习课程、斯坦福 cs224n 等。
  2. 理解 Transformer 和 BERT 等模型原理:
    • Transformer 模型架构及自注意力机制原理。
    • BERT 的预训练和微调方法。
    • 掌握相关论文,如 Attention is All You Need、BERT 论文等。
  3. 学习 LLM 模型训练和微调:
    • 大规模文本语料预处理。
    • LLM 预训练框架,如 PyTorch、TensorFlow 等。
    • 微调 LLM 模型进行特定任务迁移。
    • 相关资源:HuggingFace 课程、论文及开源仓库等。
  4. LLM 模型优化和部署:
    • 模型压缩、蒸馏、并行等优化技术。
    • 模型评估和可解释性。
    • 模型服务化、在线推理、多语言支持等。
    • 相关资源:ONNX、TVM、BentoML 等开源工具。
  5. LLM 工程实践和案例学习:
    • 结合行业场景,进行个性化的 LLM 训练。
    • 分析和优化具体 LLM 工程案例。
    • 研究 LLM 新模型、新方法的最新进展。
  6. 持续跟踪前沿发展动态:
    • 关注顶会最新论文、技术博客等资源。

OpenAI Cookbook 资源: 如需更多灵感,请访问OpenAI Cookbook,其中包含示例代码以及指向第三方资源的链接,例如:

  1. 提示库和工具
  2. 提示指南
  3. 视频课程
  4. 关于改进推理的高级提示的论文

此外,还有 LLM 开源中文大语言模型及数据集集合中的相关资源: HuggingLLM:

OpenAI Cookbook:

  • 地址:https://github.com/openai/openai-cookbook
  • 简介:该项目是 OpenAI 提供的使用 OpenAI API 的示例和指导,其中包括如何构建一个问答机器人等教程,能够为从业人员开发类似应用时带来指导。
Content generated by AI large model, please carefully verify (powered by aily)

References

问:怎么系统学习 llm 开发?

学习大型语言模型(LLM)的开发是一个系统性的过程,需要涵盖多个方面的知识和技能。以下是一些建议的学习路径和资源:1.掌握深度学习和自然语言处理基础-机器学习、深度学习、神经网络等基础理论-自然语言处理基础,如词向量、序列模型、注意力机制等-相关课程:吴恩达的深度学习课程、斯坦福cs224n等2.理解Transformer和BERT等模型原理-Transformer模型架构及自注意力机制原理-BERT的预训练和微调方法-掌握相关论文,如Attention is All You Need、BERT论文等3.学习LLM模型训练和微调-大规模文本语料预处理-LLM预训练框架,如PyTorch、TensorFlow等-微调LLM模型进行特定任务迁移-相关资源:HuggingFace课程、论文及开源仓库等4.LLM模型优化和部署-模型压缩、蒸馏、并行等优化技术-模型评估和可解释性-模型服务化、在线推理、多语言支持等-相关资源:ONNX、TVM、BentoML等开源工具5.LLM工程实践和案例学习-结合行业场景,进行个性化的LLM训练-分析和优化具体LLM工程案例-研究LLM新模型、新方法的最新进展6.持续跟踪前沿发展动态-关注顶会最新论文、技术博客等资源

目录:OpenAI 官方指南

如需更多灵感,请访问[OpenAI Cookbook](https://github.com/openai/openai-cookbook),其中包含示例代码以及指向第三方资源的链接,例如:[提示库和工具](https://github.com/openai/openai-cookbook#prompting-libraries--tools)[提示指南](https://github.com/openai/openai-cookbook#prompting-guides)[视频课程](https://github.com/openai/openai-cookbook#video-courses)[关于改进推理的高级提示的论文](https://github.com/openai/openai-cookbook#papers-on-advanced-prompting-to-improve-reasoning)

LLM开源中文大语言模型及数据集集合

HuggingLLM:地址:[https://github.com/datawhalechina/hugging-llm](https://github.com/datawhalechina/hugging-llm)简介:介绍ChatGPT原理、使用和应用,降低使用门槛,让更多感兴趣的非NLP或算法专业人士能够无障碍使用LLM创造价值。OpenAI Cookbook:地址:[https://github.com/openai/openai-cookbook](https://github.com/openai/openai-cookbook)简介:该项目是OpenAI提供的使用OpenAI API的示例和指导,其中包括如何构建一个问答机器人等教程,能够为从业人员开发类似应用时带来指导。

Others are asking
我怎样用低代码工具去构建我的AI智能体?LLM应用?
以下是关于如何用低代码工具构建 AI 智能体和 LLM 应用的一些建议: 在构建基于 LLM 的应用时,Anthropic 建议先寻找最简单的解决方案,只在必要时增加复杂度。智能系统通常会以延迟和成本为代价来换取更好的任务表现,开发者需要考虑这种权衡是否合理。当需要更复杂的解决方案时,工作流适合需要可预测性和一致性的明确任务,而智能体则更适合需要灵活性和模型驱动决策的大规模场景。不过,对于许多应用来说,优化单个 LLM 调用(配合检索和上下文示例)通常就足够了。 目前有许多框架可以简化智能系统的实现,例如: 1. LangChain 的 LangGraph。 2. 亚马逊 Bedrock 的 AI Agent 框架。 3. Rivet(一个拖放式 GUI 的 LLM 工作流构建器)。 4. Vellum(另一个用于构建和测试复杂工作流的 GUI 工具)。 这些框架通过简化标准的底层任务(如调用 LLM、定义和解析工具、链接调用等)使入门变得容易,但它们往往会创建额外的抽象层,可能会使底层提示词和响应变得难以调试,也可能诱使开发者在简单设置就足够的情况下增加不必要的复杂性。建议开发者先直接使用 LLM API,许多模式只需要几行代码就能实现。如果确实要使用框架,请确保理解底层代码。 此外,还有以下相关工具和应用: 1. VectorShift:能在几分钟内构建和部署生成式人工智能应用程序,利用大型语言模型(例如 ChatGPT)构建聊天机器人、文档搜索引擎和文档创建工作流程,无需编码。 2. Unriddle:帮助更快阅读、写作和学习的工具,能简化复杂的主题,找到信息,提问并立即获得答案。 工具使用或函数调用通常被视为从 RAG 到主动行为的第一个半步,为现代人工智能栈增加了一个新的层。一些流行的原语如网页浏览(Browserbase、Tiny Fish)、代码解释(E2B)和授权+认证(Anon)已经出现,它们使 LLM 能够导航网络、与外部软件(如 CRM、ERP)交互并运行自定义代码。Omni 的计算 AI 功能体现了这种方法,它利用 LLM 直接输出适当的 Excel 函数到电子表格中,然后执行计算并自动生成复杂查询供用户使用。 详细示例请参考:https://github.com/anthropics/anthropiccookbook/tree/main/patterns/agents
2025-02-17
类似于ollama和vllm这样的LLM 框架有哪些
以下是类似于 ollama 和 vllm 的 LLM 框架: 1. Encoderonly 框架(也叫 AutoEncoder),典型代表如 BERT 等。 2. Encoderdecoder 框架,典型代表如 T5 和 GLM 等。 3. Decoderonly 框架(也叫 AutoRegressive),典型代表如 GPT 系列、LLaMa、PaLM 等。 此外,还有一些在 LLM 应用中发挥重要作用的框架,如: 1. LangChain:是当前大模型应用开发的主流框架之一,提供了一系列工具和接口,其核心在于“链”概念,包括 Model I/O、Retrieval、Chains、Agents、Memory 和 Callbacks 等组件,生态系统还包括 LangSmith、LangGraph 和 LangServe 等工具。 2. LlamaIndex:在促进 LLM 和整合上下文数据方面表现出色,抽象出许多提示链的细节,与外部 API 的接口,从向量数据库检索上下文数据,并在多个 LLM 调用中维持内存。
2025-02-17
LLM 训练推理模型有哪些
以下是一些常见的 LLM 训练推理模型: 1. FengshenbangLM: 地址: 简介:是 IDEA 研究院认知计算与自然语言研究中心主导的大模型开源体系,开源了姜子牙通用大模型 V1,是基于 LLaMa 的 130 亿参数的大规模预训练模型,具备翻译、编程、文本分类、信息抽取、摘要、文案生成、常识问答和数学计算等能力。除姜子牙系列模型之外,还开源了太乙、二郎神系列等模型。 2. BiLLa: 地址: 简介:开源了推理能力增强的中英双语 LLaMA 模型。较大提升 LLaMA 的中文理解能力,并尽可能减少对原始 LLaMA 英文能力的损伤;训练过程增加较多的任务型数据,利用 ChatGPT 生成解析,强化模型理解任务求解逻辑;全量参数更新,追求更好的生成效果。 3. Moss: 地址: 简介:支持中英双语和多种插件的开源对话语言模型,MOSS 基座语言模型在约七千亿中英文以及代码单词上预训练得到,后续经过对话指令微调、插件增强学习和人类偏好训练具备多轮对话能力及使用多种插件的能力。 此外,Andrej Karpathy 的相关介绍中提到了 LLM 训练的一些情况,如训练过程涉及大约 10TB 的文本,通常来源于互联网的抓取,需要大量的互联网资源和一个 GPU 集群,费用大约 200 万美元。Karpathy 的视频还详细介绍了 LLM 训练的全部过程,包括预训练、有监督微调和强化学习等。
2025-02-16
大型语言模型(LLM)基于Transformer架构的模型的优缺点是什么,有什么局限性
大型语言模型(LLM)基于 Transformer 架构的模型具有以下优点: 1. 在大量数据集上进行预训练,展现出卓越的语言处理能力,能预测接下来的 Token。 然而,也存在一些缺点和局限性: 1. 瞬态状态:天生缺乏持久的记忆或状态,需要额外的软件或系统来保留和管理上下文。 2. 概率性质:随机性导致响应的不确定性,对相同提示词可能产生不同回答。 3. 过时信息:依赖预训练数据,只能访问历史知识,无法获取实时更新。 4. 内容制造:可能生成看似合理但不准确的信息,即“幻觉”。 5. 资源密集:巨大规模意味着显著的计算和财务成本,影响可扩展性和可访问性。 6. 领域特定性:本质上通用,但通常需要特定领域数据才能在专业任务中表现出色。 7. 缺乏创造性:像一个高性能的知识检索工具,超出检索范围时表现差,甚至出现“幻觉”。面对复杂逻辑推导和新的知识推演能力不足,无法基于新的语料推演出新知识。 8. 对于特定领域或高度专业化的查询,容易产生错误信息或“幻觉”,特别是当查询超出训练数据或需要最新信息时。
2025-02-13
anythingllm安装包
以下是关于 AnythingLLM 安装包的相关信息: 安装地址:https://useanything.com/download 。 安装完成后会进入配置页面,主要分为三步: 第一步:选择大模型。 第二步:选择文本嵌入模型。 第三步:选择向量数据库。 在 AnythingLLM 中有 Workspace 的概念,可以创建自己独有的 Workspace 与其他项目数据进行隔离。配置流程包括: 首先创建一个工作空间。 上传文档并且在工作空间中进行文本嵌入。 选择对话模式,提供了 Chat 模式和 Query 模式。Chat 模式大模型会根据训练数据和上传的文档数据综合给出答案,Query 模式大模型仅依靠文档中的数据给出答案。 完成上述配置后,即可与大模型进行对话。 此外,在 GitHubDaily 开源项目列表 2023 年复盘的 AIGC 部分中, 是一个可打造成企业内部知识库的私人专属 GPT,能将任何文档、资源或内容转换为大语言模型(LLM)知识库,在对话中引用其中内容。
2025-02-06
AnythingLLM 怎么用,好用吗
AnythingLLM 是一款功能强大的软件,具有以下特点和使用方法: 功能:包含了所有 Open WebUI 的能力,并且额外支持选择文本嵌入模型和向量数据库。 安装和配置:安装地址为 https://useanything.com/download 。安装完成后进入配置页面,主要分为三步:选择大模型、选择文本嵌入模型、选择向量数据库。 构建本地知识库:其中有 Workspace 的概念,可以创建自己独有的 Workspace 与其他项目数据隔离。首先创建工作空间,然后上传文档并进行文本嵌入,接着选择对话模式,提供了 Chat 模式(大模型根据训练数据和上传文档数据综合给出答案)和 Query 模式(大模型仅依靠文档中的数据给出答案),最后进行测试对话。 相关评价:被认为是一个可打造成企业内部知识库的私人专属 GPT,能将任何文档、资源或内容转换为大语言模型(LLM)知识库,支持多用户使用,可设权限,兼容多种 LLM 和数据库。 总的来说,AnythingLLM 的使用效果因人而异,需要您亲自实践和体验来判断其是否好用。
2025-02-04
我该怎么学习ai?帮我组织一个流程,能很好的利用你的资源。
以下是为您组织的学习 AI 的流程: 一、了解 AI 基本概念 建议阅读「」部分,熟悉 AI 的术语和基础概念,包括人工智能的定义、主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。同时,浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 二、开始 AI 学习之旅 在「」中,您将找到一系列为初学者设计的课程。特别推荐李宏毅老师的课程。您还可以通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 三、选择感兴趣的模块深入学习 AI 领域广泛,涵盖图像、音乐、视频等方面。您可以根据自己的兴趣选择特定的模块进行深入学习,同时一定要掌握提示词的技巧,它上手容易且很有用。 四、实践和尝试 理论学习之后,实践是巩固知识的关键。尝试使用各种产品做出您的作品,在知识库中也有很多大家实践后的作品、文章分享,欢迎您实践后也进行分享。 五、体验 AI 产品 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发您对 AI 潜力的认识。 另外,费曼学习法也是一种有效的学习方式。它强调通过教授他人来深化个人理解和知识的掌握,基本步骤包括选择一个概念、教给他人、回顾和简化、组织和比较。其应用场景包括个人学习、教学和培训、知识分享等。 WaytoAGI(通往 AGI 之路)是一个致力于人工智能学习的中文知识库和社区平台,汇集了上千个人工智能网站和工具,提供最新的 AI 工具、AI 应用、AI 智能体和行业资讯,还有丰富的学习资源、实践活动,并倡导开放共享的知识体系。在没有任何推广的情况下,WaytoAGI 一年时间已有超过 100 万用户和超千万次的访问量,目前合作过众多公司和产品。
2025-02-17
角色:你是一名房地产开发公司的总经理 背景:现在要在公司内部推广AI工具的使用,通过具体AI工具解决公司内部各部门具体问题,来提升工作效率。 任务:请你完成年度AI提升工作效率的工作策划, 要求:工作策划要有目标、行动计划、团队人员需求及分工、具体AI工具及对应解决的问题、需要费用明细及资源需求、有哪些风险点
由于您提供的内容中没有具体的相关信息,以下为您生成一份较为通用的房地产开发公司年度 AI 提升工作效率的工作策划示例,您可以根据实际情况进行调整和完善。 一、目标 通过在公司内部推广 AI 工具的使用,在本年度内实现各部门工作效率提升 30%以上,降低人力成本 15%左右,提高项目质量和客户满意度。 二、行动计划 1. 第一季度 进行市场调研,了解适合房地产开发行业的 AI 工具。 组织内部培训,让员工初步了解 AI 工具的应用。 2. 第二季度 针对各部门需求,选择并引入相应的 AI 工具进行试点应用。 建立数据收集和分析机制,为 AI 工具的优化提供支持。 3. 第三季度 对试点部门的应用效果进行评估和总结。 根据评估结果,对 AI 工具进行调整和优化。 4. 第四季度 在全公司范围内推广成熟的 AI 工具应用。 对全年的 AI 应用效果进行总结和评估。 三、团队人员需求及分工 1. 成立 AI 推广小组 组长:负责整体工作的规划和协调。 技术专家:负责 AI 工具的选型、配置和技术支持。 培训师:负责组织员工培训和指导使用。 数据分析师:负责收集和分析数据,为工具优化提供依据。 部门联络人:每个部门指定一名联络人,负责与推广小组沟通本部门的需求和问题。 四、具体 AI 工具及对应解决的问题 1. 智能客服系统 解决客户咨询响应不及时的问题,提高客户满意度。 2. 项目管理 AI 工具 优化项目进度安排和资源分配,提高项目管理效率。 3. 市场分析 AI 工具 精准分析市场趋势和客户需求,为项目定位提供依据。 五、需要费用明细及资源需求 1. 费用明细 AI 工具采购费用:万元。 培训费用:万元。 技术支持和维护费用:万元。 数据采集和分析费用:万元。 2. 资源需求 服务器和存储设备,以支持 AI 工具的运行和数据存储。 足够的网络带宽,确保数据传输的流畅性。 六、风险点 1. 员工对新技术的接受度和适应能力可能较低,需要加强培训和引导。 2. AI 工具的应用效果可能不如预期,需要及时调整和优化。 3. 数据安全和隐私保护可能存在风险,需要建立完善的防护机制。
2025-02-13
吴恩达有《面向所有人的生成式 AI 入门课程 Generative AI for Everyone》下载资源
以下是吴恩达《面向所有人的生成式 AI 入门课程 Generative AI for Everyone》的相关资源: B 站: 学习笔记: 飞书: 下的相关课程
2025-02-07
我是一名一线教师,想要学习如何搭建智能体。请跟我一起制定合适的进阶路径和推荐资源链接。
以下是为您制定的学习搭建智能体的进阶路径和推荐资源链接: 进阶路径: 1. 注册智谱 Tokens 智谱 AI 开放平台:https://bigmodel.cn/ 新注册用户可获得 2000 万 Tokens。 可通过充值/购买多种模型的低价福利资源包,如直接充值现金,所有模型可适用:https://open.bigmodel.cn/finance/pay ;免费 GLM4Flash 语言模型/ 。所有资源包购买地址:https://bigmodel.cn/finance/resourcepack 。 共学营报名赠送资源包。 2. 先去【财务台】左侧的【资源包管理】查看自己的资源包,本次项目会使用到的有 GLM4、GLM4VPlus、CogVideoX、CogView3Plus 模型。 3. 进入智能体中心我的智能体,开始创建智能体。此流程会手把手进行编辑,完成一个简单智能体的搭建。 推荐资源链接: 1. 智谱 BigModel 共学营第二期:把您的微信变成超级 AI 助理 https://bigmodel.cn/ 2. 教师的 AI 减负指南 3. 提示词培训课——Part2 在搭建智能体的过程中,您需要像导演一样,编排具体流程,检查结果,修改流程,反复迭代。提示语的核心是逻辑,要将复杂的任务拆分成科学合理的步骤,并且让前一步的结果都成为后一步的基础。同时,不要害怕犯错,每一次尝试都是向成功迈进的一步。
2024-12-30
ai在人力资源服务行业上的发展趋势
以下是关于 AI 在人力资源服务行业发展趋势的相关内容: 人工智能和机器学习在金融服务行业的应用已有十多年,促成了信贷评估、欺诈评分等方面的改进。大型语言模型通过生成式人工智能代表着重大飞跃,正在改变多个领域,包括教育、游戏、商业等。与传统 AI/ML 侧重基于现有数据进行预测或分类不同,生成式人工智能能创造全新内容。这种能力结合对大量非结构化数据的训练和无限计算能力,可能带来金融服务市场数十年来最大的变革。在金融服务行业,预计优秀的新公司和现有企业将立即开始接纳生成式人工智能。 在人力资源服务行业,相关报告如《用友:AI 在企业招聘中的应用现状调研报告》预测,随着技术进步,AI 将进一步推动个性化人力资源管理,创造无人值守的 HR 平台,推动企业持续发展。 知名投资机构 Nfx 分析指出,AI 正在强制逆转 SaaS 缩写的含义,从“软件即服务”转变为“服务即软件”,软件既能组织任务也能执行任务,无需雇佣额外劳动力,传统劳动力市场将和软件融合成新市场。从企业组织结构来看,提供这种 AI 劳动力的产品有两种形式。
2024-12-10
AI for social science 有哪些重要的资源
以下是一些关于 AI for social science 的重要资源: 1. 《人工智能权利法案蓝图》:其中提到了公民权利、公民自由和隐私方面的内容,包括言论自由、投票自由以及免受歧视、过度惩罚、非法监视和侵犯隐私等,还涉及机会均等和获取关键资源或服务等方面。 2. AGI 万字长文(下)| 2024,分叉与洪流:如果从“AGI 已经出现”的阴谋论出发,AGI 所需要的基本资源无法回避,在能源领域,如可控核聚变技术,在 AI 的协助下有了一定进展。 3. 4.5.2016 EN:通过耦合注册表中的信息,研究者能够在诸如心血管疾病、癌症和抑郁症等广泛的医疗状况方面获得极有价值的新知识。在社会科学领域,基于注册表的研究使研究者能够获得关于失业、教育等一系列社会状况与其他生活状况的长期相关性的重要知识。通过注册表获得的研究结果提供了坚实、高质量的知识,可为基于知识的政策的制定和实施提供基础,提高许多人的生活质量,并提高社会服务的效率。
2024-12-10