以下是一些支持会议语音识别并转为总结、思维导图的开源项目:
最新版本支持的功能如下:多端部署:可接入个人微信、微信公众号、企业微信应用基础对话:私聊及群聊的消息智能回复,支持多轮会话上下文记忆,支持GPT-3,GPT-3.5,GPT-4,文心一言模型语音识别:可识别语音消息,通过文字或语音回复,支持azure,baidu,google,openai等多种语音模型图片生成:支持图片生成和图生图(如照片修复),可选择Dell-E,stable diffusion,replicate,Midjourney模型丰富插件:支持个性化插件扩展,已实现多角色切换、文字冒险、敏感词过滤、聊天记录总结等插件Tool工具:与操作系统和互联网交互,支持最新信息搜索、数学计算、天气和资讯查询、网页总结,基于[chatgpt-tool-hub](https://github.com/goldfishh/chatgpt-tool-hub)实现知识库:通过上传知识库文件自定义专属机器人,可作为数字分身、领域知识库、智能客服使用,基于LinkAI实现项目地址(Github):[https://github.com/zhayujie/chatgpt-on-wechat](https://github.com/zhayujie/chatgpt-on-wechat)项目地址(Gitee):[https://gitee.com/zhayujie/chatgpt-on-wechat](https://gitee.com/zhayujie/chatgpt-on-wechat)
最新版本支持的功能如下:多端部署:可接入个人微信、微信公众号、企业微信应用基础对话:私聊及群聊的消息智能回复,支持多轮会话上下文记忆,支持GPT-3,GPT-3.5,GPT-4,文心一言模型语音识别:可识别语音消息,通过文字或语音回复,支持azure,baidu,google,openai等多种语音模型图片生成:支持图片生成和图生图(如照片修复),可选择Dell-E,stable diffusion,replicate,Midjourney模型丰富插件:支持个性化插件扩展,已实现多角色切换、文字冒险、敏感词过滤、聊天记录总结等插件Tool工具:与操作系统和互联网交互,支持最新信息搜索、数学计算、天气和资讯查询、网页总结,基于[chatgpt-tool-hub](https://github.com/goldfishh/chatgpt-tool-hub)实现知识库:通过上传知识库文件自定义专属机器人,可作为数字分身、领域知识库、智能客服使用,基于LinkAI实现项目地址(Github):[https://github.com/zhayujie/chatgpt-on-wechat](https://github.com/zhayujie/chatgpt-on-wechat)项目地址(Gitee):[https://gitee.com/zhayujie/chatgpt-on-wechat](https://gitee.com/zhayujie/chatgpt-on-wechat)
[heading2]总结阿里云百炼大模型平台的能力与应用体验对话分析能力:创建了对话分析,可根据对话内容生成标题和质检项等,结果以JSON结构呈现。API调用:为实现企业级应用融合,可接入API将应用包装到工作流程链路中,满足企业数据安全隔离等需求。图像生成:可通过Flux模型等生成图像,设置参数如正向提示词、负面提示词等。文本生成:能生成小红书风格文案、朋友圈文案等各种营销文案,还能结合多模态模型创作歌曲。语音模型:包括语音合成和识别,可选择多种角色和自定义内容,对通用文字识别准确,对专有名词可微调识别。视频处理:如影视传媒理解,能提取视频信息、分析爆点、生成字幕和思维导图等。工作流串联:实时语音识别后可生成会议纪要,实现企业级应用中的工作流串联。智能体应用的搭建与发布工作流应用:由多个节点组成,包括大模型节点、知识库节点、API节点等,可实现意图分类和商品导购,还能进行文本转换兜底。智能体应用创建:有多种应用模板,可添加知识库,如客服话术知识库,能通过提示词和知识库数据进行智能客服问答。多模态交互:包括语音交互和视频交互,语音交互可配置是否智能打断,视频交互需使用VO模型。发布渠道:有官方应用、钉钉机器人、微信公众号等,还有低代码开发平台,可快速创建Web应用。