Chat with Wiki - 通过ollama和通义千问大模型，如果要实现一个智能机器人，支持模型微调，扩展知识库，问答记忆功能的实现步骤

Answer

要通过 Ollama 和通义千问大模型实现一个支持模型微调、扩展知识库和问答记忆功能的智能机器人，可参考以下步骤：

安装和启动 Ollama 服务：
- 在 Mac 上启动 Ollama 应用程序，在 Linux 上通过 ollama serve 启动。
- 通过 ollama list 确认服务是否已启动。
下载模型：
- 可下载如 Gemma（7B 模型）、Mistral（7B 模型）、Mixtral（8*7B 的 MoE 模型）、Qwen（通义千问，7B 模型）等。
了解 Ollama 的特点和优势：
- 支持多种大型语言模型，包括通义千问、Llama 2、Mistral 和 Gemma 等，适用于不同应用场景。
- 易于在 macOS、Windows 和 Linux 系统使用，支持 CPU 和 GPU。
- 提供模型库，可通过 https://ollama.com/library 查找和下载不同模型，满足不同需求和硬件条件。
- 支持自定义模型，如修改温度参数调整创造性和连贯性，或设置特定系统消息。
- 提供 REST API 用于运行和管理模型，以及与其他应用程序的集成选项。
- 社区贡献丰富，有多种集成插件和界面。
安装相关模型：访问 https://ollama.com/download/ 进行下载安装。
选择文本向量模型：使用文本向量模型 bge-m3，可从 https://huggingface.co/BAAI/bge-m3 下载。
利用 FAISS 创建向量存储：从 hf 下载好模型放置在指定路径，通过相关函数创建高效的向量存储。
实现 RAG：基于用户问题从向量数据库中检索相关段落，根据设定阈值过滤，让模型参考上下文信息回答问题。
创建网页 UI：通过 gradio 创建网页 UI 并进行评测。获取完整代码可关注公众号发送 fin 获取 github 仓库代码链接。
进行问答测试：对同样的问题和上下文，基于 Qwen-7b、Gemma、Mistral、Mixtral 和 GPT-4 分别进行多次测试。

Content generated by AI large model, please carefully verify (powered by aily)

References

本地部署资讯问答机器人：Langchain+Ollama+RSSHub 实现 RAG

安装完之后，确保ollama后台服务已启动（在mac上启动ollama应用程序即可，在linux上可以通过ollama serve启动）。我们可以通过ollama list进行确认，当我们还没下载模型的时候，正常会显示空：可以通过ollama命令下载模型，目前，我下载了4个模型：几个模型简介如下:Gemma：Gemma是由Google推出的轻量级模型，Google表示，“Gemma 2B和7B与其他开放式模型相比，在其规模上实现了同类最佳的性能。”本次开发，下载的是7B模型。Mistral：Mistral是由欧洲法国Mistral AI团队推出的大模型，该模型采用了分组查询注意力（GQA）以实现更快的推断速度。本次开发，下载的是7B模型。Mixtral：Mixtral也是由Mistral AI团队推出的大模型，但Mixtral是一个8*7B的MoE模型，在大多数基准测试中都优于Llama 2 70B和GPT-3.5。Qwen：Qwen（通义千问）是由阿里巴巴推出的大模型，本次开发，下载的是7B模型。万物皆可RSS巧妇难为无米之炊。不管是获取日常新闻，还是获取A股行情，都需要有稳定靠谱的数据源。大家可能第一时间会想到爬虫，但自己去搭建和维护这样一个爬虫系统还是比较麻烦的。有没有其他更好的方式呢？这就需要用到「上古神器」 RSS了！

本地部署资讯问答机器人：Langchain+Ollama+RSSHub 实现 RAG

1.支持多种大型语言模型：Ollama支持包括通义千问、Llama 2、Mistral和Gemma等在内的多种大型语言模型，这些模型可用于不同的应用场景。2.易于使用：Ollama旨在使用户能够轻松地在本地环境中启动和运行大模型，适用于macOS、Windows和Linux系统，同时支持cpu和gpu。3.模型库：Ollama提供了一个模型库，用户可以从中下载不同的模型。这些模型有不同的参数和大小，以满足不同的需求和硬件条件。Ollama支持的模型库可以通过https://ollama.com/library进行查找。4.自定义模型：用户可以通过简单的步骤自定义模型，例如修改模型的温度参数来调整创造性和连贯性，或者设置特定的系统消息。5.API和集成：Ollama还提供了REST API，用于运行和管理模型，以及与其他应用程序的集成选项。6.社区贡献：Ollama社区贡献丰富，包括多种集成插件和界面，如Web和桌面应用、Telegram机器人、Obsidian插件等。7.总的来说，Ollama是一个为了方便用户在本地运行和管理大型语言模型而设计的框架，具有良好的可扩展性和多样的使用场景。后面在捏Bot的过程中需要使用Ollama，我们需要先安装，访问以下链接进行下载安装。https://ollama.com/download/

本地部署资讯问答机器人：Langchain+Ollama+RSSHub 实现 RAG

这里，我们使用文本向量模型bge-m3。https://huggingface.co/BAAI/bge-m3bge-m3是智源研究院发布的新一代通用向量模型，它具有以下特点：支持超过100种语言的语义表示及检索任务，多语言、跨语言能力全面领先（M ulti-Lingual）最高支持8192长度的输入文本，高效实现句子、段落、篇章、文档等不同粒度的检索任务（M ulti-Granularity）同时集成了稠密检索、稀疏检索、多向量检索三大能力，一站式支撑不同语义检索场景（M ulti-Functionality）从hf下载好模型之后，假设放置在某个路径/path/to/bge-m3，通过下面函数，利用FAISS创建一个高效的向量存储。|实现RAG基于用户的问题，从向量数据库中检索相关段落，并根据设定的阈值进行过滤，最后让模型参考上下文信息回答用户的问题，从而实现RAG。|创建网页UI最后，通过gradio创建网页UI，并进行评测。生成的Web UI如下：需要上述完整代码的读者，关注本公众号，然后发送fin，即可获取github仓库代码链接。问答测试对于同样的问题和上下文，我基于Qwen-7b、Gemma、Mistral、Mixtral和GPT-4分别进行了多次测试。下面是一些case：qwengemmamistralmixtralgpt4