直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

你是基于哪个大模型搭建的

回答

我是基于谷歌开源可商用的大语言模型 Gemma 搭建的。

Gemma 是一系列轻量级的最先进开源模型,由 Google DeepMind 和 Google 的其他团队开发,其灵感来自于 Gemini,名称反映了拉丁语中“宝石”的意思。此次开源的 Gemma 重点包括共两个尺寸的模型权重:Gemma 2B 和 Gemma 7B,每种尺寸都提供了预训练和指令调优的版本。模型地址为:Models - Hugging FaceGemma

在基于大模型构建模型应用方面,需要注意以下要点:

  1. 不做工程化终究会让模型应用变得无法维护。
  2. 根据项目需求选择一个合适的开发框架是非常关键的。
  3. 了解业务背后的深层次需求,确保模型能够解决实际问题。根据了解到的业务需求设定流程环节。
  4. 在每个环节中,精心设计提示词以引导模型提供准确和有用的回复。
  5. 确保应用在提供服务的同时,遵守安全和伦理标准。
  6. 通过不断的测试和迭代,优化模型性能和用户体验。
  7. 成功部署应用后,还需要持续的维护和更新以适应不断变化的需求。

此外,Embedding(嵌入)是一个浮点数的向量(列表),两个向量之间的距离度量它们的相关性,小的距离表示高相关性,大的距离表示低相关性。Embedding 共有词、句子、文档、图像等分类。在大模型中具有重要价值,实战中可从数据集中获取 Embedding 结果,并保存为 csv 文件。进阶到企业级应用开发的大模型技术还会涉及到利用开源的 Embedding 模型、向量数据库去做检索增强生成(RAG),以及购买 GPU 服务器去基于开源大模型搭建企业级大模型项目。OpenAI 官网文档链接:https://platform.openai.com/docs/introduction

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

谷歌开源可商用的大语言模型Gemma

作者[小小将](https://www.zhihu.com/people/xiaohuzc)华中科技大学工学硕士刚刚,谷歌破天荒地开源了LLM大模型Gemma:Gemma是一系列轻量级的最先进开源模型,它们是基于创建Gemini模型的相同研究和技术构建的。由Google DeepMind和Google的其他团队开发,Gemma的灵感来自于Gemini,其名称反映了拉丁语中“宝石”的意思。除了模型权重,谷歌还发布了一些工具来支持开发者的创新,促进合作,并指导Gemma模型的负责任使用。这次开源的Gemma重点如下:共两个尺寸的模型权重:Gemma 2B和Gemma 7B。每种尺寸都提供了预训练和指令调优的版本。模型地址:[Models - Hugging Face](https://link.zhihu.com/?target=https%3A//huggingface.co/models%3Fother%3Dgemma%26sort%3Dtrending%26search%3Dgoogle),[Gemma](https://link.zhihu.com/?target=https%3A//www.kaggle.com/models/google/gemma)

RAG 提示工程(三):迈向工程化应用

在第三部分中,我们将深入探讨如何基于大模型构建模型应用。这一过程从框架选择到最终应用的搭建,涉及一系列复杂的步骤和环节。实际上,许多细节和阶段往往是在实际操作中才会逐渐显现出来。因此,开发一个大模型的应用绝非易事。在整个提示词设计层面,同样需要精细的工作。精心的设计和调试是确保整个流程顺畅运行的关键,也是保证最终应用具有实际价值的基础。这不仅仅是在对话窗口中输入文字,或者在聊天窗口中发送指令并接收输出那么简单。提示词的设计直接影响模型的输出质量和应用的实际效果。为了构建一个有效的大型语言模型应用,我们需要:1.不做工程化终究会让模型应用变得无法维护。2.根据项目需求选择一个合适的开发框架是非常关键的。3.了解业务背后的深层次需求,确保模型能够解决实际问题。根据了解到的业务需求设定流程环节。4.在每个环节中,精心设计提示词以引导模型提供准确和有用的回复。5.确保应用在提供服务的同时,遵守安全和伦理标准。6.通过不断的测试和迭代,优化模型性能和用户体验。7.成功部署应用后,还需要持续的维护和更新以适应不断变化的需求。通过这些关键点的掌握,我们可以确保构建的模型应用不仅在技术上是先进的,而且能够真正解决用户的问题,提供有价值的服务。

认识大模型 Embedding 技术加实战

我们认识了Embedding(嵌入)是一个浮点数的向量(列表),两个向量之间的距离度量它们的相关性,小的距离表示高相关性,大的距离表示低相关性。知道了Embedding共有:词、句子、文档、图像等分类。还分析了Embedding在大模型中的价值。最后是Embedding的实战部分:从数据集中获取Embedding结果,并保存为csv文件。最后,本示例中的实战代码,参考的是官方最新文档的内容,加上个人测试阶段的遇到的问题、代码注释等OpenAI官网文档链接:https://platform.openai.com/docs/introduction大模型技术,除了在OpenAI官网能看到的:Embedding、Function Call和Fune Tuning等。进阶到企业级应用开发的大模型技术还会涉及到:利用开源的Embedding模型、向量数据库去做检索增强生成(RAG),以及购买GPU服务器去基于开源大模型搭建企业级大模型项目。

其他人在问
搭建个人知识库,请推荐的免费人工智能软件
以下为您推荐一些可用于搭建个人知识库的免费人工智能软件: 1. AnythingLLM:包含所有 Open WebUI 的能力,额外支持选择文本嵌入模型和向量数据库。安装地址:https://useanything.com/download 。安装完成后需进行配置,主要分为三步:选择大模型、选择文本嵌入模型、选择向量数据库。在 AnythingLLM 中可创建独有的 Workspace 与其他项目数据隔离,包括创建工作空间、上传文档并进行文本嵌入、选择对话模式(Chat 模式会综合给出答案,Query 模式仅依靠文档数据给出答案),配置完成后可进行测试对话。 2. Coze 或 FastGPT 等工具可搭建知识库,但当下其 RAG 能力仅对问答场景友好,复杂企业级知识库场景可能需要专业团队,收费几万到几十万不等。若想使用专门搭建个人知识库的软件,可参考文章 ,忽略本地部署大模型环节,直接看其中推荐的软件。 此外,还有一些相关工具和方法: 用通义听悟整理录音笔记:https://tingwu.aliyun.com 用 React 实现选中即解释 定义提示语提取有用信息:https://memo.ac/zh/ 开源免费屏幕录制工具 OBS,下载地址:https://obsproject.com/ Mac 用 Downie,Windows 推荐 IDM 淘宝数码荔枝店购买 用 losslessCut 快速切块:https://github.com/mifi/losslesscut 希望这些信息对您有所帮助。
2024-11-11
飞书和notion,在搭建个人知识库方面,各自的优点和缺点是什么
飞书在搭建个人知识库方面的优点: 可以方便地分类和整理知识,例如个人搭建某一领域知识库或企业搭建产品资料知识库。 有相关的分享和直播,能帮助用户轻松打造知识管理体系。 缺点: 随着知识库中信息增多,如果分类不合理,很难找到所需文章。 问题答案可能在文章某一段落,每次都需重新阅读文章才能找到答案。 Notion 在搭建个人知识库方面的优点: 是功能强大的知识管理和项目管理工具,可将各种信息 all in one place。 数据库可定制性高,接近关系型数据库,适合有相关需求的用户。 数据库的每一条记录都是一个页面,页面包含可自定义的属性和丰富内容。 支持的块类型非常丰富。 缺点:暂未提及。 此外,Notion 在创建知识库并上传文本内容方面,有特定的操作步骤,如在文本格式页签下选择 Notion 并进行授权,还可选择自动分段与清洗或自定义分段等方式。
2024-11-11
合适搭建个人知识库的人工智能软件有哪一些
以下是一些适合搭建个人知识库的人工智能软件: 1. AnythingLLM:包含所有 Open WebUI 的能力,额外支持选择文本嵌入模型和向量数据库。安装地址为 https://useanything.com/download 。安装完成后需进行配置,主要分为三步:选择大模型、选择文本嵌入模型、选择向量数据库。在使用时,可创建独有的 Workspace 与其他项目数据隔离,包括创建工作空间、上传文档并进行文本嵌入、选择对话模式(Chat 模式会综合训练数据和上传文档给出答案,Query 模式仅依靠文档数据给出答案),配置完成后可进行测试对话。 2. Coze:如果您想使用专门搭建个人知识库的软件,可参考文章 ,忽略本地部署大模型环节,直接看其中推荐的软件。但使用该软件可能需要对接一些额外的 API 。
2024-11-11
怎么搭建混元3D模型到本地使用
要在本地搭建混元 3D 模型,以下是一些方法和步骤: 1. 制作乐高 logo 的 STL 文件: 设计乐高 logo:使用矢量图形编辑软件(如 Adobe Illustrator 或 Inkscape)创建或获取矢量格式的乐高 logo,确保符合标准。 导入 3D 建模软件:将矢量 logo 导入到 3D 建模软件(如 Blender、Fusion 360 或 Tinkercad)中。 创建 3D 模型:在软件中根据矢量图形创建 3D 模型,调整尺寸和厚度以适合打印。 导出 STL 文件:将完成的 3D 模型导出为 STL 格式。 示例代码:在 Blender 中使用 Python 脚本创建 3D 文本作为乐高 logo 并导出 STL 文件,具体操作包括打开 Blender,切换到脚本编辑器,输入并运行脚本,然后在指定路径检查生成的 STL 文件,可根据需要调整脚本参数。 2. 使用 Polycam 工具: Polycam 是一个免费的 3D 建模工具,只需上传至少 20 张图片或至少 20 秒的视频,它会自动处理并构建 3D 模型。生成后可编辑模型,并支持 12 种以上格式导出到流行的 3D 软件(如 Blender、SketchUp、Unreal、Unity 等)。100 张图像的云处理建模时间约 1 2 分钟。还能将无人机拍摄的图像转换为 3D 模型,兼容多种流行无人机。 官方网站:
2024-11-07
用现有的搭建一个ai网站 实现绘画 聊天 会员 积分 等功能
以下是搭建一个具备绘画、聊天、会员、积分等功能的 AI 网站的步骤: 1. 搭建 OneAPI(https://github.com/songquanpeng/oneapi),用于汇聚整合多种大模型接口,方便后续更换使用各种大模型,同时会告知如何白嫖大模型接口。 2. 搭建 FastGpt(https://fastgpt.in/),这是一个知识库问答系统,将知识文件放入,并接入上面的大模型作为分析知识库的大脑,最后回答问题。若不想接入微信,搭建到此即可,其有问答界面。 3. 搭建 chatgptonwechat(https://github.com/zhayujie/chatgptonwechat)接入微信,并配置 FastGpt 将知识库问答系统接入微信。建议先用小号以防封禁风险。若想拓展功能,可参考 Yaki.eth 同学的教程(https://waytoagi.feishu.cn/wiki/UADkwZ9B0iAWdTkFJIjcN7EgnAh),其中的 cow 插件能实现文件总结、MJ 绘画等能力。 在积分和会员方面,以下是一些相关的活动形式和积分设置示例: 吵爷帮助技能持有者在社区实现虚拟 IPO 审核服务。 Larkspur:扣子 bot 文案生图体验| 10 积分,扣子虚拟女友体验| 10 积分,帮你把 Siri 接入 Llama 3 70B |10 积分。 勿忘心安 Dify 本地部署不成功不要积分 10 积分一次。 Penny 给你解梦,并还原场景 10 积分。 Rachel 倩敏 宠物照片变毛毡头像 5 积分一个,before after 合并呈现 10 积分一个。 梦飞 给全国所有的项目做聚合平台,用户体验一次抽成 3 5 积分。 David 为社区用户做积分银行,可超前消费,存 10 个积分,利息 1 个积分,贷 10 个积分,利息 2 个积分,并为项目 IPO 提供融资服务。 波大波吗 5 分钟,让你的微信变成 chatgpt + MJ + SD +....+ 新闻专家 20 积分一次。 琥珀川 教你用 ai 技能接单、创业 10 积分。 大满满 简约的 mj 转模型|随喜积分。 Matteo 工作日晚 8 11 点,提供微信 1 对 1 视频聊天 30min,互通获取 AI 信息的渠道 + 漫聊 AI 相关使用体验思考 1 积分。 桂大阳 风景壁纸一张 10 积分、手机壳图案 + 手机壳效果图 10 积分。 镜 教你画小鹿动画表情包一个 10 积分,5 个 60 积分,8 个 100 积分。教你如何手绘蒙娜丽莎 10 积分一次,一次 10 分钟。教你做小鹿角色 2 维转 3D 一个 20 积分。 易求无方 与你的虚拟人进行一次心灵交流 20 积分,与你进行一次心灵交流 10 积分。 游小言 虚拟 IP 打造,给视频换脸,一次 10 积分,支持以技能易技能。
2024-11-04
搭建一个数据解读的ai工具,文字描述要有逻辑性,符合金字塔原则
很抱歉,目前知识库中没有关于搭建一个数据解读的 AI 工具且文字描述要符合金字塔原则的相关内容。但一般来说,搭建这样一个工具需要以下几个关键步骤: 1. 明确数据来源和类型:确定您要处理的数据是来自数据库、文件、网络等,以及数据的格式和特点,例如结构化数据、非结构化数据等。 2. 选择合适的技术框架:根据需求和技术能力,选择适合的 AI 框架和工具,如 TensorFlow、PyTorch 等。 3. 数据预处理:对原始数据进行清洗、转换、归一化等操作,以提高数据质量和模型的训练效果。 4. 特征工程:提取有意义的特征,以便模型能够更好地理解和处理数据。 5. 选择模型:根据数据特点和任务需求,选择合适的 AI 模型,如决策树、神经网络等。 6. 训练模型:使用预处理后的数据对模型进行训练,并不断调整参数以优化性能。 7. 评估模型:使用合适的指标对训练好的模型进行评估,如准确率、召回率等。 8. 优化和改进:根据评估结果对模型进行优化和改进。 9. 设计文字描述逻辑:按照金字塔原则,先给出结论或主要观点,然后逐步展开支持性的细节和论据。 需要注意的是,这只是一个大致的框架,实际搭建过程中可能会遇到各种技术和业务上的挑战,需要不断探索和优化。
2024-11-03
我想了解一下关于模型微调的知识
以下是关于模型微调的知识: 介绍:微调可让您从 API 提供的模型中获得更多收益,比如比即时设计更高质量的结果、能够训练比提示中更多的例子、由于更短的提示而节省了 Token、更低的延迟请求。GPT3 已在大量文本上预训练,微调通过训练更多示例改进小样本学习,让您在大量任务中取得更好结果。对模型微调后,无需在提示中提供示例,可节省成本并降低延迟。在高层次上,微调涉及准备和上传训练数据、训练新的微调模型、使用微调模型。 哪些模型可以微调:微调目前仅适用于以下基础模型:davinci、curie、babbage 和 ada。还可以继续微调微调模型以添加其他数据,无需从头开始。 微调的概念和意义:在人工智能领域,通常根据应用领域将大模型分为通用大模型和领域特定模型。通用大模型如 GPT4.0、GPT3.5 等具有广泛的自然语言理解能力,但在特定领域表现可能不理想。对大模型针对特定领域进行的训练过程称为微调,通过在特定领域数据上训练,优化所有层参数,提高在该领域的专业性。微调可节省成本、加快模型部署和应用速度。 相关应用开发:除了调用 ChatGPT 之外,还需学会模型微调、设计 Prompt、优化用户交互的解决方案等。在开发中,程序读取结构化数据,如 JSON 格式。通过稳定的提示词设计及一些模型参数(如温度 Temperature 等)来让 ChatGPT 保持稳定输出。
2024-11-12
可以调用不同大预言模型的整合工具推荐
以下是为您推荐的可以调用不同大语言模型的整合工具: 1. Poe:由 Quora 开发,有 APP 版本,支持跨端使用。集成了 Chat GPT、GPT4、Claude+、Claude、Dragonfly 等模型,同时支持用户自建 Chatbot。不同语言模型回复效果有差异,适合需要调用多种大语言模型的用户。访问地址: 。Dragonfly 擅长给出较短的回答,并擅长在输入中给出示例时遵循指示。Claude 更擅长创造性回复,配合 Poe 中的提问引导,非常适合在查阅资料时使用,有时能够给出超越直接使用 Chat GPT 时的体验(但和 Chat GPT 一样,Claude 也时常会给出一些错误回复,一些问题可以尝试在两个模型中都问一遍提升信息准确性)。此外支持分享用户和模型的对话内容,但 GPT4、Claude+产品需要付费订阅使用。 2. 国内的一些模型,如智谱和文心,在文生图方面有一定能力。 另外,大模型工具可根据自身条件准备,推荐顺序为:1. chatGPT 4.0 2. kimichat 3. 智谱清言 4 。
2024-11-12
国内外大预言模型对比
以下是国内外大语言模型的对比情况: 1. 工具使用能力: 在工具使用的测评中,GPT4 Turbo 取得满分。 国内大模型中智谱清言表现不俗,取得 83.78 的高分,排名国内第一。文心一言 4.0、通义千问 2.0、Yi34BChat、AndesGPT 均有超过 70 分的表现。超过 GPT3.5 的国内模型有 12 个。 开源模型中,Baichuan213BChat、Xverse13B2Caht 表现可圈可点,均超过 GPT3.5 以及众多闭源模型。总体来看,国内大模型在工具使用能力上表现优异,这与国内大模型厂商积极落地应用密不可分。 2. 主观和客观对比: 通过对比模型在主观简答题 OPEN 和客观选择题 OPT 上的不同表现,国内大模型多数擅长做选择题,普遍选择题分数高于简答题分数。文心一言 4.0 和智谱清言表现相对稳定。 GPT4 Turbo 的表现最为稳定。 客观题相对主观题更容易通过题库形式进行训练和提升,同时由于客观题中包含中文特性问题,中文模型有一定优势,应综合来看模型的评测效果。 在本次测评中,国外的代表性大模型如 GPT4 的不同版本、Claude2、Llama2 都有很好的稳定性表现,值得国内大模型进一步分析研究。 3. 总体表现: GPT 4 Turbo 总分 90.63 分遥遥领先,高于其他国内大模型及国外大模型。国内最好模型文心一言 4.0有 4.9 分的差距。 过去 1 年国内大模型有长足进步,综合能力超过 GPT 3.5 和 GeminiPro 的模型有 11 个。 在 SuperCLUE 测评中,国外模型的平均成绩为 69.42 分,国内模型平均成绩为 65.95 分,差距在 4 分左右。国内外的平均水平差距在缩小,11 月差距在 10 分左右。 国内开源模型在中文上表现好于国外开源模型,如百川智能的 Baichuan213BChat、阿里云的 Qwen72B、Yi 34BCha t 均优于 Llama213BChat。
2024-11-12
利用gpt-4模型的AI工具有哪些
以下是一些利用 GPT4 模型的 AI 工具: 1. Kickresume 的 AI 简历写作器:使用 GPT4 语言模型自动生成简历,能为简历摘要、工作经验和教育等专业部分编写内容,并保持一致语调。 2. Rezi:受到超过 200 万用户信任的领先 AI 简历构建平台,使用先进的 AI 技术自动化创建可雇佣简历的各个方面,包括写作、编辑、格式化和优化。 3. Huntr 的 AI 简历构建器:提供免费的简历模板,以及 AI 生成的总结/技能/成就生成器和 AI 驱动的简历工作匹配。 更多 AI 简历产品,还可以查看这里:https://www.waytoagi.com/category/79 。您可以根据自己的需要选择最适合的工具。 此外,在生成式人工智能领域,GPT4 有以下突破点: 1. 赋予模型使用工具的能力,如 OpenAI 推出的 ChatGPT 插件测试版,允许与多种工具交互。 2. 在计划和解决问题方面具有一定能力,能通过玩游戏或模拟环境快速学习和从经验中学习。 3. 在许多任务上达到人类水平的表现,对人类的理解有所提升。 4. 但也存在一些限制,如架构中的自回归特性导致缺乏规划能力等。
2024-11-12
SD大模型无法加载
SD 大模型无法加载可能有以下原因及解决方法: 1. LORA 方面: LORA 可以提炼图片特征,文件通常有几十上百兆,承载信息量远大于 Embedding。下载的 LORA 放在根目录的【……\\models\\Lora】文件夹下,使用时点击红色小书,找到 LORA 选项卡加载。 使用 LORA 时要注意看作者使用的大模型,一般需配套使用,还可能需要加入特定触发词,如盲盒 LORA 需加入“full body, chibi”等提示词。 2. Hypernetworks 方面: Hypernetworks 主要针对画风训练,文件下载后放在根目录的【…\\models\\hypernetworks】,使用时点击红色小书,找到 Hypernetworks 选项卡加载。 3. 模型下载与安装方面: 常用的模型下载网站有:。 下载模型后需放置在指定目录,大模型(Ckpt)放入【models\\Stablediffusion】,VAE 模型放入【models\\Stablediffusion】或【models\\VAE】目录(有的大模型自带 VAE 则无需再加),Lora/LoHA/LoCon 模型放入【extensions\\sdwebuiadditionalnetworks\\models\\lora】或【models/Lora】目录,Embedding 模型放入【embeddings】目录。模型类型可通过检测。 不会科学上网时,可在启动器界面直接下载模型,将下载的大模型放在根目录的【……\\models\\Stablediffusion】,在左上角模型列表中选择(看不到就点旁边蓝色按钮刷新)。 旁边的 VAE 相当于给模型增加提高饱和度的滤镜和局部细节微调,可在启动器里下载,放在根目录的【……\\models\\VAE】。 Embedding 功能相当于提示词打包,下载 Embedding 可在 C 站通过右上角筛选 Textual Inversion 找到,放在根目录下的【embeddings】文件夹里。 由于无法确定您大模型无法加载的具体原因,您可以根据上述内容逐一排查。
2024-11-12
有什么特别好的AI识别图片的大模型API
以下是一些关于 AI 识别图片的大模型 API 相关的信息: 学习笔记《【这就是 ChatGPT】了解原理让大语言模型 AI 成为你的打工人》中提到,对于识别印刷体图片,会先将图片变成黑白、调整大小为固定尺寸,然后与数据库中的内容进行对比得出结论。但这种基于规则的方法存在多种局限,而神经网络专门处理未知规则的情况,在图片识别中具有优势。 搭建 OneAPI 可以汇聚整合多种大模型接口,方便后续更换使用各种大模型。 0 基础手搓的“AI 拍立得”概念旨在简化操作流程,提升效率。用户可以选择拍摄场景类型并立即拍照,AI 会自动识别和分析照片中的内容信息,依据预设场景规则迅速生成符合情境的反馈。其实现场景包括图片转成文本和图片转绘图片等。例如,图片转成文本时,大模型会根据选择的场景生成与内容相关的文字描述或解说文本。
2024-11-11