Chat with Wiki - 通义千问私有化部署方案

Answer

以下是关于通义千问私有化部署的相关方案：

在 FastGPT+OneAPI+COW 框架下的部署：
- 回到宝塔，选择 Docker（若显示“当前未安装”则进行安装，否则无需此步）。
- 点击确定，等待安装完成，完成后刷新页面确认安装成功。
- 打开左侧【终端】，粘贴两行命令验证 Docker 是否可用。
- 一条一条复制并粘贴相关命令完成安装。
- 访问 OneAPI，地址为：http://这里改成你自己宝塔左上角的地址:3001/（举例：http://11.123.23.454:3001/），账号默认 root，密码 123456。
- 点击【渠道】，类型选择阿里通义千问，名称随意。
- 将千问里创建的 API Key 粘贴到秘钥里，点击确认。
- 点击【令牌】-【添加新令牌】，名称随意，时间设为永不过期、额度设为无限额度，点击【提交】。
- 点击【令牌】，复制出现的 key 并保存。
在 Langchain+Ollama+RSSHub 框架下的部署：
- Ollama 支持包括通义千问在内的多种大型语言模型，适用于多种操作系统，同时支持 cpu 和 gpu。
- 可通过 https://ollama.com/library 查找模型库，通过简单步骤自定义模型，还提供了 REST API 用于运行和管理模型及与其他应用程序的集成选项。
- 访问 https://ollama.com/download/ 进行下载安装，安装完之后确保 ollama 后台服务已启动。
在 0 基础手搓 AI 拍立得框架下的部署：
- 可以选择通义千问作为模型供应商，其指令灵活性比较丰富，接口调用入门流程长一些，密钥安全性更高。接口调用费用为：调用：¥0.008/千 tokens，训练：¥0.03/千 tokens。可参考通义千问接口调用示例。

Content generated by AI large model, please carefully verify (powered by aily)

References

张梦飞：【知识库】FastGPT+OneAPI+COW带有知识库的机器人完整教程

1、回到宝塔，选择Docker（如果如图显示，就跟着我安装。如果没显示“当前未安装”，就不需要这一步）2、选择，点击确定。比较慢，等待安装完成。3、安装完成后，刷新当前页面。看到下图的样子，则表示安装成功。4、打开左侧【终端】，粘贴以下两行，再验证下Docker是否可用。看见版本号，就是没问题了。5、一条一条复制以下命令，依次粘贴进入6、一条一条复制以下命令，依次粘贴进入7、完成安装。[heading1]四、配置OneAPI[content]1、访问OneAPI。访问地址：http://这里改成你自己宝塔左上角的地址:3001/（举例：http://11.123.23.454:3001/）账号默认root，密码1234562、点击【渠道】2、类型选择阿里通义千问，名称随意，类型不用删减。3、把千问里创建的API Key粘贴到秘钥里中。点击确认4、点击【令牌】-【添加新令牌】6、名称随意，时间设为永不过期、额度设为无限额度。点击【提交】7、点击【令牌】，会看到自己设置的。点击复制，出现key，然后在标红那一行中，自己手动复制下来。8、OneAPI完成。保存好这个KEY

本地部署资讯问答机器人：Langchain+Ollama+RSSHub 实现 RAG

1.支持多种大型语言模型：Ollama支持包括通义千问、Llama 2、Mistral和Gemma等在内的多种大型语言模型，这些模型可用于不同的应用场景。2.易于使用：Ollama旨在使用户能够轻松地在本地环境中启动和运行大模型，适用于macOS、Windows和Linux系统，同时支持cpu和gpu。3.模型库：Ollama提供了一个模型库，用户可以从中下载不同的模型。这些模型有不同的参数和大小，以满足不同的需求和硬件条件。Ollama支持的模型库可以通过https://ollama.com/library进行查找。4.自定义模型：用户可以通过简单的步骤自定义模型，例如修改模型的温度参数来调整创造性和连贯性，或者设置特定的系统消息。5.API和集成：Ollama还提供了REST API，用于运行和管理模型，以及与其他应用程序的集成选项。6.社区贡献：Ollama社区贡献丰富，包括多种集成插件和界面，如Web和桌面应用、Telegram机器人、Obsidian插件等。7.总的来说，Ollama是一个为了方便用户在本地运行和管理大型语言模型而设计的框架，具有良好的可扩展性和多样的使用场景。后面在捏Bot的过程中需要使用Ollama，我们需要先安装，访问以下链接进行下载安装。https://ollama.com/download/安装完之后，确保ollama后台服务已启动（在mac上启动ollama应用程序即可，在linux上可以通过ollama serve启动）。我们可以通过ollama list进行确认，当我们还没下载模型的时候，正常会显示空：可以通过ollama命令下载模型，目前，我下载了4个模型：几个模型简介如下:

0基础手搓AI拍立得

用成本相对较高，大家可以选择以下供应商中|模型厂商|类型|特点|成本|网址/文档||-|-|-|-|-||智谱 GLM-4V|通用视觉类大模型|拍立得最早使用的模型 接口响应速度快 指令灵活性差一些 一个接口支持图片/视频/文本，视频和图片类型不能同时输入|调用：0.05元/千tokens|[智谱接口调用示例](https://bigmodel.cn/dev/api/normal-model/glm-4v)||阿里云百炼 qwen-vl-plus|通用视觉类大模型|拍立得目前使用的模型 指令灵活性比较丰富 接口调用入门流程长一些，密钥安全性更高|调用：¥0.008/千tokens 训练：¥0.03/千tokens|[通义千问接口调用示例](https://bailian.console.aliyun.com/?spm=5176.21213303.J_qCOwPWspKEuWcmp8qiZNQ.33.14162f3drQWnj1&scm=20140722.S_card@@%E4%BA%A7%E5%93%81@@2983180._.ID_card@@%E4%BA%A7%E5%93%81@@2983180-RL_%E7%99%BE%E7%82%BC%E5%A4%A7%E6%A8%A1%E5%9E%8B-LOC_search~UND~card~UND~item-OR_ser-V_3-RE_cardNew-P0_0#/model-market/detail/qwen-vl-plus?tabKey=sdk)||阶跃星辰|通用视觉类大模型|响应速度快 支持视频理解|输入：¥0.005～0.015/千tokens 输出：¥0.02～0.07/千tokens|[阶跃星辰接口调用示例](https://platform.stepfun.com/docs/guide/image_chat)||百度PaddlePaddle|OCR，垂直小模型|文本识别能力补齐增强|私有化部署服务费 API调用在¥0.05～0.1/次|[Paddle OCR开源地址](https://github.com/PaddlePaddle/PaddleOCR)|