Chat with Wiki - 会议语音识别并转为总结，思维导图。有什么开源项目模型支持？

Answer

以下是一些支持会议语音识别并转为总结、思维导图的开源项目：

熊猫大侠：
- 基于 COW 框架的 ChatBot 实现。
- 支持多端部署，可接入个人微信、微信公众号、企业微信应用。
- 具备基础对话功能，支持私聊及群聊的消息智能回复，多轮会话上下文记忆，支持 GPT-3、GPT-3.5、GPT-4、文心一言模型。
- 支持语音识别，可识别语音消息，通过文字或语音回复，支持 azure、baidu、google、openai 等多种语音模型。
- 支持图片生成和图生图，可选择 Dell-E、stable diffusion、replicate、Midjourney 模型。
- 拥有丰富插件，支持个性化插件扩展，已实现多角色切换、文字冒险、敏感词过滤、聊天记录总结等插件。
- Tool 工具能与操作系统和互联网交互，支持最新信息搜索、数学计算、天气和资讯查询、网页总结，基于chatgpt-tool-hub实现。
- 可通过上传知识库文件自定义专属机器人，作为数字分身、领域知识库、智能客服使用，基于 LinkAI 实现。
- 项目地址(Github)：https://github.com/zhayujie/chatgpt-on-wechat
- 项目地址(Gitee)：https://gitee.com/zhayujie/chatgpt-on-wechat
阿里云百炼大模型平台：
- 具备对话分析能力，可根据对话内容生成标题和质检项等，结果以 JSON 结构呈现。
- 支持 API 调用，为实现企业级应用融合，可接入 API 将应用包装到工作流程链路中，满足企业数据安全隔离等需求。
- 支持图像生成，可通过 Flux 模型等生成图像，设置参数如正向提示词、负面提示词等。
- 支持文本生成，能生成小红书风格文案、朋友圈文案等各种营销文案，还能结合多模态模型创作歌曲。
- 拥有语音模型，包括语音合成和识别，可选择多种角色和自定义内容，对通用文字识别准确，对专有名词可微调识别。
- 支持视频处理，如影视传媒理解，能提取视频信息、分析爆点、生成字幕和思维导图等。
- 支持工作流串联，实时语音识别后可生成会议纪要，实现企业级应用中的工作流串联。
- 支持智能体应用的搭建与发布，工作流应用由多个节点组成，包括大模型节点、知识库节点、API 节点等，可实现意图分类和商品导购，还能进行文本转换兜底。
- 智能体应用创建有多种应用模板，可添加知识库，如客服话术知识库，能通过提示词和知识库数据进行智能客服问答。
- 支持多模态交互，包括语音交互和视频交互，语音交互可配置是否智能打断，视频交互需使用 VO 模型。
- 发布渠道有官方应用、钉钉机器人、微信公众号等，还有低代码开发平台，可快速创建 Web 应用。

Content generated by AI large model, please carefully verify (powered by aily)

References

最新版本支持的功能如下：多端部署：可接入个人微信、微信公众号、企业微信应用基础对话：私聊及群聊的消息智能回复，支持多轮会话上下文记忆，支持GPT-3,GPT-3.5,GPT-4,文心一言模型语音识别：可识别语音消息，通过文字或语音回复，支持azure,baidu,google,openai等多种语音模型图片生成：支持图片生成和图生图（如照片修复），可选择Dell-E,stable diffusion,replicate,Midjourney模型丰富插件：支持个性化插件扩展，已实现多角色切换、文字冒险、敏感词过滤、聊天记录总结等插件Tool工具：与操作系统和互联网交互，支持最新信息搜索、数学计算、天气和资讯查询、网页总结，基于[chatgpt-tool-hub](https://github.com/goldfishh/chatgpt-tool-hub)实现知识库：通过上传知识库文件自定义专属机器人，可作为数字分身、领域知识库、智能客服使用，基于LinkAI实现项目地址(Github)：[https://github.com/zhayujie/chatgpt-on-wechat](https://github.com/zhayujie/chatgpt-on-wechat)项目地址(Gitee)：[https://gitee.com/zhayujie/chatgpt-on-wechat](https://gitee.com/zhayujie/chatgpt-on-wechat)

熊猫大侠：基于COW框架的ChatBot实现步骤

入门篇：应用广场超多案例解析 2025年1月7日

[heading2]总结阿里云百炼大模型平台的能力与应用体验对话分析能力：创建了对话分析，可根据对话内容生成标题和质检项等，结果以JSON结构呈现。API调用：为实现企业级应用融合，可接入API将应用包装到工作流程链路中，满足企业数据安全隔离等需求。图像生成：可通过Flux模型等生成图像，设置参数如正向提示词、负面提示词等。文本生成：能生成小红书风格文案、朋友圈文案等各种营销文案，还能结合多模态模型创作歌曲。语音模型：包括语音合成和识别，可选择多种角色和自定义内容，对通用文字识别准确，对专有名词可微调识别。视频处理：如影视传媒理解，能提取视频信息、分析爆点、生成字幕和思维导图等。工作流串联：实时语音识别后可生成会议纪要，实现企业级应用中的工作流串联。智能体应用的搭建与发布工作流应用：由多个节点组成，包括大模型节点、知识库节点、API节点等，可实现意图分类和商品导购，还能进行文本转换兜底。智能体应用创建：有多种应用模板，可添加知识库，如客服话术知识库，能通过提示词和知识库数据进行智能客服问答。多模态交互：包括语音交互和视频交互，语音交互可配置是否智能打断，视频交互需使用VO模型。发布渠道：有官方应用、钉钉机器人、微信公众号等，还有低代码开发平台，可快速创建Web应用。