Chat with Wiki - 除了ollama外还有什么好用

Answer

除了 Ollama 外，以下是一些好用的本地部署或相关的工具和框架：

Google Gemma：Google 发布的家用版小模型，分别有 2b（20 亿参数）和 7b（70 亿参数）版本。相对千亿参数的大模型，这种小模型可能不适合解决特别复杂的任务，但从趋势上看是模型本地化提升基础操作效率的模板。小型的 llama 也支持本地部署。
Langchain：支持多种大型语言模型，包括通义千问、Llama 2、Mistral 和 Gemma 等，易于使用，适用于多种操作系统，同时支持 cpu 和 gpu。提供模型库，用户可从中下载不同模型，还支持自定义模型、API 和集成，社区贡献丰富。

如果您想了解更多关于这些工具和框架的详细信息，建议您进一步查阅相关资料。

Content generated by AI large model, please carefully verify (powered by aily)

References

作者：吵爷Google刚刚发布了家用版的小模型Gemma，分别为2b（20亿参数）和7b（70亿参数）版本。相对千亿参数的大模型，这种小模型可能不适合解决特别复杂的任务，但是从趋势上看应该是模型本地化提升基础操作效率的模板。类似之前国内发布的ChatGLM-6B。现在的部署环境比一年前要友好多了，首先提一下Ollama，Ollama是一个开源的大型语言模型服务，可以非常方便地部署最新版本的GPT模型并通过接口使用，支持热加载模型文件,无需重新启动即可切换不同的模型。除了Gemma，像小型的llama也支持本地部署。环境准备首先进入ollama.com，下载程序并安装（支持windows，linux和macos）查找cmd进入命令提示符，输入ollama-v检查版本，安装完成后版本应该显示0.1.26cls清空屏幕，接下来直接输入ollama run gemma运行模型（默认是2b），首次需要下载，需要等待一段时间，如果想用7b，运行ollama run gemma:7b完成以后就可以直接对话了，2个模型都安装以后，可以重复上面的指令切换。2b的反应速度非常快，但是能够互动的话题有限。7b我也试了下，能跑是能跑（我是3050显卡），但是会有明显的卡顿，输出内容的质量相对会高不少，但无论2b还是7b，对非英文语种的反馈都不是很稳定。2b测试7b测试另外模型里一些常用的内部指令/set显示设置界面可调整的设置项/show显示模型信息/load<model>加载一个已有模型/bye退出

本地部署资讯问答机器人：Langchain+Ollama+RSSHub 实现 RAG

1.支持多种大型语言模型：Ollama支持包括通义千问、Llama 2、Mistral和Gemma等在内的多种大型语言模型，这些模型可用于不同的应用场景。2.易于使用：Ollama旨在使用户能够轻松地在本地环境中启动和运行大模型，适用于macOS、Windows和Linux系统，同时支持cpu和gpu。3.模型库：Ollama提供了一个模型库，用户可以从中下载不同的模型。这些模型有不同的参数和大小，以满足不同的需求和硬件条件。Ollama支持的模型库可以通过https://ollama.com/library进行查找。4.自定义模型：用户可以通过简单的步骤自定义模型，例如修改模型的温度参数来调整创造性和连贯性，或者设置特定的系统消息。5.API和集成：Ollama还提供了REST API，用于运行和管理模型，以及与其他应用程序的集成选项。6.社区贡献：Ollama社区贡献丰富，包括多种集成插件和界面，如Web和桌面应用、Telegram机器人、Obsidian插件等。7.总的来说，Ollama是一个为了方便用户在本地运行和管理大型语言模型而设计的框架，具有良好的可扩展性和多样的使用场景。后面在捏Bot的过程中需要使用Ollama，我们需要先安装，访问以下链接进行下载安装。https://ollama.com/download/安装完之后，确保ollama后台服务已启动（在mac上启动ollama应用程序即可，在linux上可以通过ollama serve启动）。我们可以通过ollama list进行确认，当我们还没下载模型的时候，正常会显示空：可以通过ollama命令下载模型，目前，我下载了4个模型：几个模型简介如下:

盘盘：手机AI新时代轻松运行小型模型

Ollama是一个开源框架，专为在本地机器上便捷部署和运行大型语言模型（LLM）而设计。以下是其主要特点和功能概述：简化部署大型语言模型的过程，使得非专业用户也能方便地管理和运行复杂的模型。官方网站：https://ollama.com/[heading3]避坑操作[content]以下操作都在termux软件进行操作1.termux软件中执行命令apt-get update2.安装curl命令，apt install curl-y3.安装ollama命令，curl-fsSL https://ollama.com/install.sh|sh1.图一ollama安装过程；图二ollama安装完成1.termux软件中执行命令ollama serve1.后台运行termux软件（正常返回到手机桌面即可）2.返回桌面长按termux软件图标，选择New session，重新启动一个新termux连接1.新termux连接中执行命令./start-ubuntu.sh[heading4]命令集合[heading3]启动模型[content]我使用phi3模型来做演示1.termux软件中执行命令ollama run phi32.等待下载完成phi3模型，请耐心等待3.启动正常，可以正常使用phi3模型[heading4]命令集合[content]当然ollama还有很多其他模型，如有需要请ollama官网自行查看命令与下载。[heading2]简单结果输出[content]作者个人简介，如有问题可以直接连接作者。[Welcome to P.|盘盘个人杂志](https://g10npwhy4nv.feishu.cn/docx/U1Iqduc3mox5F8xmbUzcCC6qnof)