直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

ChatGLM是谁开发的

回答

ChatGLM 是由清华大学开发的。它是一个开源的、支持中英双语的对话语言模型,底座是 GLM 语言模型。其相关项目地址为:https://github.com/THUDM/ChatGLM-6B 。它是中文领域效果最好的开源底座模型之一,针对中文问答和对话进行了优化,经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持。此外,基于 ChatGLM 还有在医疗领域的微调模型,如 Med-ChatGLM ,地址为:https://github.com/SCIR-HI/Med-ChatGLM

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

信鑫:基于大模型 + 知识库的 Code Review 实践

[title]信鑫:基于大模型+知识库的Code Review实践[heading2]名词解释|名词|释义|<br>|-|-|<br>|CR / Code Review|越来越多的企业都要求研发团队在代码的开发过程中要进行CodeReview(简称CR),在保障代码质量的同时,促进团队成员之间的交流,提高代码水平。|<br>|llm /大规模语言模型|大规模语言模型(Large Language Models,LLMs)是自然语言处理中使用大量文本数据训练的神经网络模型,可以生成高质量的文本并理解语言。如GPT、BERT等。|<br>|AIGC|利用NLP、NLG、计算机视觉、语音技术等生成文字、图像、视频等内容。<br>全称是人工智能生成/创作内容(Artificial Intelligence Generated Content);是继UGC,PGC后,利用人工智能技术,自动生成内容的生产方式;AIGC底层技术的发展,驱动围绕不同内容类型(模态)和垂直领域的应用加速涌现。|<br>|Gemma|Gemma是一个轻量级、先进的开放模型系列,采用与创建Gemini模型相同的研究和技术构建而成。Gemma由Google DeepMind和Google的其他团队开发,以拉丁语gemma(意为“宝石”)命名。Gemma模型权重由促进创新、协作和负责任地使用人工智能(AI)的开发者工具提供支持。|<br>|LLaMA|Meta(Facebook)的大型多模态语言模型。|<br>|ChatGLM|ChatGLM是一个开源的、支持中英双语的对话语言模型,底座是GLM语言模型。|<br>|Baichuan|Baichuan 2是百川智能推出的新一代开源大语言模型,采用2.6万亿Tokens的高质量语料训练。|

LLM开源中文大语言模型及数据集集合

[title]LLM开源中文大语言模型及数据集集合[heading4]1.ModelChatGLM:地址:[https://github.com/THUDM/ChatGLM-6B](https://github.com/THUDM/ChatGLM-6B)简介:中文领域效果最好的开源底座模型之一,针对中文问答和对话进行了优化。经过约1T标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持VisualGLM-6B地址:[https://github.com/THUDM/VisualGLM-6B](https://github.com/THUDM/VisualGLM-6B)简介:一个开源的,支持图像、中文和英文的多模态对话语言模型,语言模型基于ChatGLM-6B,具有62亿参数;图像部分通过训练BLIP2-Qformer构建起视觉模型与语言模型的桥梁,整体模型共78亿参数。依靠来自于CogView数据集的30M高质量中文图文对,与300M经过筛选的英文图文对进行预训练。Chinese-LLaMA-Alpaca:地址:[https://github.com/ymcui/Chinese-LLaMA-Alpaca](https://github.com/ymcui/Chinese-LLaMA-Alpaca)简介:中文LLaMA&Alpaca大语言模型+本地CPU/GPU部署,在原版LLaMA的基础上扩充了中文词表并使用了中文数据进行二次预训练

LLM开源中文大语言模型及数据集集合

[title]LLM开源中文大语言模型及数据集集合[heading3][heading4]2.1垂直领域微调[heading5]医疗Med-ChatGLM:地址:[https://github.com/SCIR-HI/Med-ChatGLM](https://github.com/SCIR-HI/Med-ChatGLM)简介:基于中文医学知识的ChatGLM模型微调,微调数据与BenTsao相同。QiZhenGPT:地址:[https://github.com/CMKRG/QiZhenGPT](https://github.com/CMKRG/QiZhenGPT)简介:该项目利用启真医学知识库构建的中文医学指令数据集,并基于此在LLaMA-7B模型上进行指令精调,大幅提高了模型在中文医疗场景下效果,首先针对药品知识问答发布了评测数据集,后续计划优化疾病、手术、检验等方面的问答效果,并针对医患问答、病历自动生成等应用展开拓展。ChatMed:地址:[https://github.com/michael-wzhu/ChatMed](https://github.com/michael-wzhu/ChatMed)简介:该项目推出ChatMed系列中文医疗大规模语言模型,模型主干为LlaMA-7b并采用LoRA微调,具体包括ChatMed-Consult:基于中文医疗在线问诊数据集ChatMed_Consult_Dataset的50w+在线问诊+ChatGPT回复作为训练集;ChatMed-TCM:基于中医药指令数据集ChatMed_TCM_Dataset,以开源的中医药知识图谱为基础,采用以实体为中心的自指令方法(entity-centric self-instruct),调用ChatGPT得到2.6w+的围绕中医药的指令数据训练得到。

其他人在问
分析 ChatGLM在文生视频领域的应用产出
ChatGLM 是中文领域效果较好的开源底座模型之一,其地址为:。经过约 1T 标识符的中英双语训练,并辅以监督微调、反馈自助、人类反馈强化学习等技术进行优化,针对中文问答和对话有出色表现。 此外,还有基于 ChatGLM6B 的 VisualGLM6B,地址为:。它是一个开源的、支持图像、中文和英文的多模态对话语言模型,语言模型基于 ChatGLM6B,具有 62 亿参数。图像部分通过训练 BLIP2Qformer 构建起视觉模型与语言模型的桥梁,整体模型共 78 亿参数。依靠来自于 CogView 数据集的 30M 高质量中文图文对,与 300M 经过筛选的英文图文对进行预训练。 在文生视频领域,ChatGLM 及其相关模型可能通过对文本的理解和生成能力,为视频的脚本创作、内容描述生成等方面提供支持,但具体的应用产出还需要结合实际的开发和应用场景来进一步探索和评估。
2024-10-30
ChatGLM视频表现有何特色,优劣分析一下
ChatGLM 是中文领域效果最好的开源底座模型之一,具有以下特色: 1. 针对中文问答和对话进行了优化,能更好地处理中文语境下的任务。 2. 经过约 1T 标识符的中英双语训练,并辅以监督微调、反馈自助、人类反馈强化学习等技术的加持。 其优势包括: 1. 在处理中文相关的任务时表现出色,能提供较为准确和有用的回答。 然而,目前可能存在的不足暂未在提供的内容中有明确提及。但一般来说,与其他先进的语言模型相比,可能在某些复杂场景下的表现还有提升空间。
2024-10-30
ChatGLM在生成视频上表现如何
目前 ChatGLM 主要侧重于自然语言处理和文本生成,在生成视频方面的能力相对有限。它并非专门为视频生成而设计的模型。
2024-10-30
ChatGLM开发者团队介绍
ChatGLM 是一个开源的、支持中英双语的对话语言模型,底座是 GLM 语言模型。其相关信息如下: 地址: 简介:中文领域效果最好的开源底座模型之一,针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持。 此外,基于 ChatGLM 还有在垂直领域微调的模型,如医疗领域的 MedChatGLM,其地址为: 。
2024-10-30
ChatGLM简介
ChatGLM 是中文领域效果最好的开源底座模型之一。其地址为: 。经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持,针对中文问答和对话进行了优化。
2024-10-30
ai模型chatglm,百川大模型,通义千问,ai产品部署调用api的具体成本
以下是关于 AI 产品部署调用 API 具体成本的相关信息: 国内部分大模型有限制一定免费额度的 Token,如阿里的通义千问大模型、智谱 AI(ChatGLM)、科大讯飞(SparkDesk)都有免费接口。您可以打开相应链接创建 API key。 对于极简未来平台,使用 GPT3.5 模型的每次对话大约消耗不到 20 积分。平台提供每天签到免费领取积分的福利,用户可通过签到免费获得 50 到几百积分。此外,充值 19 元可兑换 10000 积分,能满足日常使用好几个月,实际使用成本不高。 服务器方面,腾讯云的轻量应用服务器对新用户有优惠活动,如一个 2 核 2G3M 的服务器套餐一年只需 82 元,新用户优惠过后的续费费用可能为 100 多到几百一年不等。 宝塔面板有免费和付费版本,免费版已能满足需求。Docker 是开源免费的,使用其部署和管理应用不会产生额外费用。 需要注意的是,不同模型和调用次数的具体费用可能会有所不同,建议您根据实际需求进一步了解和评估。
2024-08-20
语音开发,都要学哪个技术,可以举个案例吗
语音开发需要学习以下技术: 1. 深度学习和自然语言处理基础: 机器学习、深度学习、神经网络等基础理论。 自然语言处理基础,如词向量、序列模型、注意力机制等。 相关课程:吴恩达的深度学习课程、斯坦福 cs224n 等。 2. 理解 Transformer 和 BERT 等模型原理: Transformer 模型架构及自注意力机制原理。 BERT 的预训练和微调方法。 掌握相关论文,如 Attention is All You Need、BERT 论文等。 3. 学习 LLM 模型训练和微调: 大规模文本语料预处理。 LLM 预训练框架,如 PyTorch、TensorFlow 等。 微调 LLM 模型进行特定任务迁移。 相关资源:HuggingFace 课程、论文及开源仓库等。 4. LLM 模型优化和部署: 模型压缩、蒸馏、并行等优化技术。 模型评估和可解释性。 模型服务化、在线推理、多语言支持等。 相关资源:ONNX、TVM、BentoML 等开源工具。 5. LLM 工程实践和案例学习: 结合行业场景,进行个性化的 LLM 训练。 分析和优化具体 LLM 工程案例。 研究 LLM 新模型、新方法的最新进展。 以下是一个语音开发的案例: 要开发一个网页,一个页面可以承载离谱生物档案的网站,每个页面都是一个离谱生物的介绍,图片,头像,文字介绍,可以跟他打字和语音对话。以及展示跟他相关的离谱事件。 1. 项目初始化与配置: 选择编程语言和技术栈: 前端:React.js 或 Vue.js,适合构建动态的用户界面,有丰富的组件库支持多媒体内容展示。 后端:Node.js 加上 Express.js,可使用 JavaScript 同时开发前端和后端,简化开发过程,其非阻塞 IO 特性适合处理实时通讯需求。 数据库:MongoDB,适合存储文档形式的数据,如离谱生物档案和相关事件。 语音处理:使用 Google Cloud SpeechtoText 和 TexttoSpeech API 实现语音与文本的相互转换,支持语音对话。 开发环境配置: IDE:Visual Studio Code,免费、开源,支持大量插件,适用于前端和 Node.js 开发。 Node.js 和 NPM:安装 Node.js 时会一并安装 npm,用于管理项目依赖。 项目结构模板:项目目录可能如下所示。 此外,为您列举一些人工智能音频初创公司: 将书面内容转化为引人入胜的音频,并实现无缝分发。 专业音频、语音、声音和音乐的扩展服务。 (被 Spotify 收购) 提供完全表达的 AI 生成语音,带来引人入胜的逼真表演。 利用合成媒体生成和检测,带来无限可能。 一键使您的内容多语言化,触及更多人群。 生成听起来真实的 AI 声音。 为游戏、电影和元宇宙提供 AI 语音演员。 为内容创作者提供语音克隆服务。 超逼真的文本转语音引擎。 使用单一 AI 驱动的 API 进行音频转录和理解。 听起来像真人的新声音。 从真实人的声音创建逼真的合成语音的文本转语音技术。 生成听起来完全像你的音频内容。 为所有人提供开放的语音技术。
2024-10-28
你是一名课程开发专家,现在要以“AI技术在课程设计中的应用“为题展开培训,课程对象是企业内部培训师,时长1天。 课程要解决以下问题: 1.用AI工具做需求数据统计 2.用AI工具设计课程题目 3.用AI工具设计课程大纲。4.用AI工具制作PPT5.用AI工具画配图。 要求如下: 1.需要到三级大纲。 2、结构完整。 格式如下: 一、(一级大纲) 1、(二级大纲) 1.1(三级大纲)
一、AI 技术在课程设计中的应用 1、AI 工具与需求数据统计 1.1 Chat Excel 处理数据 1.2 让 AI 辅助编写苹果系统右键“快速操作”实现一键视频压缩、加速 1.5x 1.3 让 AI 辅助编写苹果“自动操作”实现批量统计学生作业字数 2、AI 工具与课程题目设计 3、AI 工具与课程大纲设计 4、AI 工具与 PPT 制作 5、AI 工具与配图绘制 二、生成式人工智能在教学中的应用 1、生成式人工智能的基本原理 1.1 文生文 1.2 文生图 1.3 文生音频 1.4 文生视频 2、生成式人工智能的最少必要知识 2.1 生成式 AI 原理 2.2 能力范围 2.3 性能参数 3、人工智能的学习方式 3.1 监督学习 3.2 无监督学习 3.3 强化学习 4、生成式人工智能的应用案例 4.1 根据消费者购买行为偏好分组 4.2 手机相册里的人脸识别分类 4.3 根据房屋特征面积预测价格 4.4 垃圾短信检测分类 4.5 汽车自动驾驶或路径规划导航 4.6 高级游戏人机对弈 5、AI 与教育的关系 5.1 AI 辅助教师的一天 5.2 各大模型之间的使用差异 5.3 教师使用 AI 小技巧
2024-10-28
你是一名课程开发专家,现在要以“AI技术在课程设计中的应用“为题展开培训,课程对象是企业内部培训师,时长1天。 课程要解决以下问题: 1.用AI工具做需求数据统计 2.用AI工具设计课程题目 3.用AI工具设计课程大纲。4.用AI工具制作PPT5.用AI工具画配图。 要求如下: 需要到三级大纲。 2、结构完整。 格式如下: 一级大纲) 二级大纲) (三级大纲)
以下是以“AI 技术在课程设计中的应用”为题,为企业内部培训师设计的一天培训课程大纲: 一级大纲) AI 技术在课程设计中的应用概述 二级大纲) AI 技术的基本概念与分类 三级大纲) 监督学习 三级大纲) 无监督学习 三级大纲) 强化学习 三级大纲) 生成式 AI 二级大纲) AI 技术的应用领域与案例 三级大纲) 根据消费者购买行为偏好分组 三级大纲) 手机相册里的人脸识别分类 三级大纲) 根据房屋特征面积预测价格 三级大纲) 垃圾短信检测分类 三级大纲) 汽车自动驾驶或路径规划导航 三级大纲) 高级游戏人机对弈 一级大纲) AI 工具在课程设计中的具体应用 二级大纲) 用 AI 工具做需求数据统计 三级大纲) Chat Excel 处理 Excel 数据 三级大纲) 让 AI 辅助编写苹果系统右键“快速操作”实现一键视频压缩、加速 1.5x 三级大纲) 让 AI 辅助编写苹果“自动操作”实现批量统计学生作业字数 二级大纲) 用 AI 工具设计课程题目 三级大纲) 基于数据分析生成题目 三级大纲) 利用自然语言处理优化题目表述 二级大纲) 用 AI 工具设计课程大纲 三级大纲) 依据需求分析生成大纲框架 三级大纲) 完善大纲细节与逻辑 二级大纲) 用 AI 工具制作 PPT 三级大纲) 内容排版与布局设计 三级大纲) 图表与图片的生成与插入 二级大纲) 用 AI 工具画配图 三级大纲) 选择合适的 AI 绘画工具 三级大纲) 明确配图需求与风格 一级大纲) 相关法规与注意事项 二级大纲) 国家互联网信息办公室等七部门的相关规定 三级大纲) 《生成式人工智能服务管理暂行办法》的解读 一级大纲) 总结与交流 二级大纲) 课程设计实践经验分享 二级大纲) 问题答疑与交流互动
2024-10-28
你是一名课程开发专家,现在要以“AI技术在课程设计中的应用“为题展开培训,课程对象是企业内部培训师,时长1天。 课程要解决以下问题: 1.用AI工具做需求数据统计 2.用AI工具设计课程题目 3.用AI工具设计课程大纲。4.用AI工具制作PPT5.用AI工具画配图。 要求如下: 需要到三级大纲。 2、结构完整。 格式如下: 一级大纲) 二级大纲) (三级大纲)
一级大纲) AI 技术在课程设计中的应用 二级大纲) 用 AI 工具做需求数据统计 利用 Chat Excel 处理 Excel 数据,如批量统计学生作业字数 二级大纲) 用 AI 工具设计课程题目 无 二级大纲) 用 AI 工具设计课程大纲 无 二级大纲) 用 AI 工具制作 PPT 无 二级大纲) 用 AI 工具画配图 无 二级大纲) 生成式人工智能的相关知识 生成式人工智能的基本原理、能力范围、性能参数 二级大纲) 人工智能的学习方式 监督学习、无监督学习、强化学习 二级大纲) AI 的应用场景 根据消费者购买行为偏好分组、手机相册里的人脸识别分类、根据房屋特征面积预测价格、垃圾短信检测分类、汽车自动驾驶或路径规划导航、高级游戏人机对弈
2024-10-28
AI 赋能传统应用时,针对后端开发来对接 AI 时,功能和流程设计上需要主页些什么
在 AI 赋能传统应用,后端开发对接 AI 时,功能和流程设计上需要注意以下要点: 1. 讨论需求:明确项目目标和用户需求,确保团队对产品方向有一致的理解。 2. 确定关键功能:根据需求确定产品最核心的功能,确保能实现最基本的用户价值。 3. AI 生成产品草图:利用 AI 快速生成界面草图,帮助团队更好地理解产品的外观和交互。 4. 列出功能列表:明确产品所需的功能模块,并逐一列出。 5. 选择一个功能:每次专注完成一个功能,确保质量与效率。 6. 向 AI 描述功能:详细描述功能需求,AI 会根据描述生成代码。 7. AI 编写代码:AI 根据需求编写代码,减少开发者的重复性劳动。 8. 测试代码:测试生成的代码,确保正常运行。 9. 向 AI 提出问题:若功能不正常,将问题反馈给 AI 进行调整。 10. 功能完成:功能通过测试后标记为完成。 11. 还有功能吗:若还有未完成的功能,继续开发下一个功能。 12. 发布初始版本:所有核心功能完成后发布初始版本,以获取用户体验反馈。
2024-10-22