Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

ChatGLM简介

Answer

ChatGLM 是中文领域效果最好的开源底座模型之一。其地址为:https://github.com/THUDM/ChatGLM-6B 。经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持,针对中文问答和对话进行了优化。

Content generated by AI large model, please carefully verify (powered by aily)

References

LLM开源中文大语言模型及数据集集合

[title]LLM开源中文大语言模型及数据集集合[heading4]1.ModelChatGLM:地址:[https://github.com/THUDM/ChatGLM-6B](https://github.com/THUDM/ChatGLM-6B)简介:中文领域效果最好的开源底座模型之一,针对中文问答和对话进行了优化。经过约1T标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持VisualGLM-6B地址:[https://github.com/THUDM/VisualGLM-6B](https://github.com/THUDM/VisualGLM-6B)简介:一个开源的,支持图像、中文和英文的多模态对话语言模型,语言模型基于ChatGLM-6B,具有62亿参数;图像部分通过训练BLIP2-Qformer构建起视觉模型与语言模型的桥梁,整体模型共78亿参数。依靠来自于CogView数据集的30M高质量中文图文对,与300M经过筛选的英文图文对进行预训练。Chinese-LLaMA-Alpaca:地址:[https://github.com/ymcui/Chinese-LLaMA-Alpaca](https://github.com/ymcui/Chinese-LLaMA-Alpaca)简介:中文LLaMA&Alpaca大语言模型+本地CPU/GPU部署,在原版LLaMA的基础上扩充了中文词表并使用了中文数据进行二次预训练

LLM开源中文大语言模型及数据集集合

[title]LLM开源中文大语言模型及数据集集合[heading3][heading4]2.1垂直领域微调[heading5]医疗Med-ChatGLM:地址:[https://github.com/SCIR-HI/Med-ChatGLM](https://github.com/SCIR-HI/Med-ChatGLM)简介:基于中文医学知识的ChatGLM模型微调,微调数据与BenTsao相同。QiZhenGPT:地址:[https://github.com/CMKRG/QiZhenGPT](https://github.com/CMKRG/QiZhenGPT)简介:该项目利用启真医学知识库构建的中文医学指令数据集,并基于此在LLaMA-7B模型上进行指令精调,大幅提高了模型在中文医疗场景下效果,首先针对药品知识问答发布了评测数据集,后续计划优化疾病、手术、检验等方面的问答效果,并针对医患问答、病历自动生成等应用展开拓展。ChatMed:地址:[https://github.com/michael-wzhu/ChatMed](https://github.com/michael-wzhu/ChatMed)简介:该项目推出ChatMed系列中文医疗大规模语言模型,模型主干为LlaMA-7b并采用LoRA微调,具体包括ChatMed-Consult:基于中文医疗在线问诊数据集ChatMed_Consult_Dataset的50w+在线问诊+ChatGPT回复作为训练集;ChatMed-TCM:基于中医药指令数据集ChatMed_TCM_Dataset,以开源的中医药知识图谱为基础,采用以实体为中心的自指令方法(entity-centric self-instruct),调用ChatGPT得到2.6w+的围绕中医药的指令数据训练得到。

LLM开源中文大语言模型及数据集集合

[title]LLM开源中文大语言模型及数据集集合[heading4]1.ModelLuotuo-Chinese-LLM:地址:[https://github.com/LC1332/Luotuo-Chinese-LLM](https://github.com/LC1332/Luotuo-Chinese-LLM)简介:囊括了一系列中文大语言模型开源项目,包含了一系列基于已有开源模型(ChatGLM,MOSS,LLaMA)进行二次微调的语言模型,指令微调数据集等。Linly:地址:[https://github.com/CVI-SZU/Linly](https://github.com/CVI-SZU/Linly)简介:提供中文对话模型Linly-ChatFlow、中文基础模型Linly-Chinese-LLaMA及其训练数据。中文基础模型以LLaMA为底座,利用中文和中英平行增量预训练。项目汇总了目前公开的多语言指令数据,对中文模型进行了大规模指令跟随训练,实现了Linly-ChatFlow对话模型。ChatYuan地址:[https://github.com/clue-ai/ChatYuan](https://github.com/clue-ai/ChatYuan)简介:元语智能发布的一系列支持中英双语的功能型对话语言大模型,在微调数据、人类反馈强化学习、思维链等方面进行了优化。ChatRWKV:地址:[https://github.com/BlinkDL/ChatRWKV](https://github.com/BlinkDL/ChatRWKV)简介:开源了一系列基于RWKV架构的Chat模型(包括英文和中文),发布了包括Raven,Novel-ChnEng,Novel-Ch与Novel-ChnEng-ChnPro等模型,可以直接闲聊及进行诗歌,小说等创作,包括7B和14B等规模的模型。

Others are asking
开源大模型ChatGLM 系列有哪些版本
ChatGLM 系列的开源版本包括: ChatGLM36B:第三代 ChatGLM 对话模型,采用全新设计的 Prompt 格式,原生支持工具调用、代码执行和 Agent 任务等复杂场景。 ChatGLM36Bbase:第三代 ChatGLM 基座模型,采用更多样的训练数据、更充分的训练步数和更合理的训练策略,在 10B 以下的基础模型中性能较强。 ChatGLM36B32k:第三代 ChatGLM 长上下文对话模型,在 ChatGLM36B 的基础上进一步强化了对长文本的理解能力,能处理最多 32K 长度的上下文。
2024-11-04
ChatGLM3 及相关系列产品有哪些
2023 年 10 月 27 日,智谱 AI 于 2023 中国计算机大会(CNCC)上推出了全自研的第三代基座大模型 ChatGLM3 及相关系列产品。其中,智谱清言是基于 ChatGLM 大模型的产品。 智谱清言的特点包括:在工具使用排名国内第一,在计算、逻辑推理、传统安全能力上排名国内前三。总体更擅长专业能力,但代码能力还有优化空间,知识百科与其他第一梯队模型相比稍显不足。 其适合的应用场景相对广泛,根据 SuperCLUE 测评结果,可优先推进在 AI 智能体方面相关的应用,包括任务规划、工具使用及一些长文本记忆相关的场景。在较复杂推理应用上效果不错,在广告文案、文学写作方面也是很好的选择。
2024-11-04
分析 ChatGLM在文生视频领域的应用产出
ChatGLM 是中文领域效果较好的开源底座模型之一,其地址为:。经过约 1T 标识符的中英双语训练,并辅以监督微调、反馈自助、人类反馈强化学习等技术进行优化,针对中文问答和对话有出色表现。 此外,还有基于 ChatGLM6B 的 VisualGLM6B,地址为:。它是一个开源的、支持图像、中文和英文的多模态对话语言模型,语言模型基于 ChatGLM6B,具有 62 亿参数。图像部分通过训练 BLIP2Qformer 构建起视觉模型与语言模型的桥梁,整体模型共 78 亿参数。依靠来自于 CogView 数据集的 30M 高质量中文图文对,与 300M 经过筛选的英文图文对进行预训练。 在文生视频领域,ChatGLM 及其相关模型可能通过对文本的理解和生成能力,为视频的脚本创作、内容描述生成等方面提供支持,但具体的应用产出还需要结合实际的开发和应用场景来进一步探索和评估。
2024-10-30
ChatGLM视频表现有何特色,优劣分析一下
ChatGLM 是中文领域效果最好的开源底座模型之一,具有以下特色: 1. 针对中文问答和对话进行了优化,能更好地处理中文语境下的任务。 2. 经过约 1T 标识符的中英双语训练,并辅以监督微调、反馈自助、人类反馈强化学习等技术的加持。 其优势包括: 1. 在处理中文相关的任务时表现出色,能提供较为准确和有用的回答。 然而,目前可能存在的不足暂未在提供的内容中有明确提及。但一般来说,与其他先进的语言模型相比,可能在某些复杂场景下的表现还有提升空间。
2024-10-30
ChatGLM在生成视频上表现如何
目前 ChatGLM 主要侧重于自然语言处理和文本生成,在生成视频方面的能力相对有限。它并非专门为视频生成而设计的模型。
2024-10-30
ChatGLM是谁开发的
ChatGLM 是由清华大学开发的。它是一个开源的、支持中英双语的对话语言模型,底座是 GLM 语言模型。其相关项目地址为: 。
2024-10-30
Deepseek简介
DeepSeek 是一家专注于人工智能基础技术研究的科技公司,致力于探索 AGI(通用人工智能)的实现路径。公司成立于 2023 年 9 月,总部位于中国杭州,定位是聚焦大模型研发与应用,提供高效、安全、可控的 AI 技术解决方案。 此外,DeepSeek 还有 DeepEP 相关内容,DeepEP 是一个针对混合专家(MoE)和专家并行(EP)的通信库,能提高 GPU 内核之间的吞吐量并降低延时,同时支持低精度操作(例如:FP8),但目前仅支持 Hopper GPU(例如:H100、H800 等)。
2025-03-10
关于deepseek的简介
DeepSeek(深度求索)是一家专注于人工智能基础技术研究的科技公司。 公司背景方面: 成立时间:2023 年 9 月。 总部:中国杭州。 定位:聚焦大模型研发与应用,致力于提供高效、安全、可控的 AI 技术解决方案。 关于其模型 DP 模型: 功能:能进行自然语言理解与分析、编程、绘图,如 SVG、MA Max 图表、react 图表等。 使用优势:可以用更少的词让模型做更多事,思维发散,能给出创意思路和高级内容。 存在问题:思维链长不易控制,可能输出看不懂或胡编乱造的内容,增加纠错成本。 审核方法:可以用其他大模型来解读 DP 模型给出的内容。 使用建议:使用时要有自己的思维雏形,多看思考过程,避免被模型冲刷原有认知。 使用场景:包括阅读、育儿、写作、随意交流等方面。 此外,Deepseek 相关文档在 3 群和 4 群有分享,也可在 v to a gi 的飞书知识库中搜索获取。未来活动预告包括明天后天在摩纳社区提供免费算力资源带大家学习炼丹,周一晚上学习多维表格中接入 DeepSeek。
2025-02-19
从你的知识库中总结提炼一下,形成一个表格,告诉我目前已经有哪些面向个人和面向企业的AI应用\工具\智能体,以及具体的功能简介
|应用类型|应用名称|使用技术|功能简介|示例场景| |||||| |智能体应用(Assistant)|无|基于上下文对话,自主决策并调用工具|客户服务:了解客户诉求,解决客户问题。如查询订单状态、处理退款等。个人助理:管理日程安排、提醒事项、发送邮件等。技术支持:了解技术问题,提供解决方案,帮助用户排除故障。| |工作流应用(Workflow)|无|将复杂任务拆解为若干子任务|AI 翻译:实现初步翻译、内容审校、再次优化的翻译流程,提升翻译质量。| |智能体编排应用|无|支持多智能体协作|综合调研报告:组建一个报告撰写团队,包括负责写作意图识别、大纲书写、总结摘要、智能绘图、事件研判、段落撰写、文笔润色等任务的智能体。软件开发团队:组建一个智能体开发团队,包括负责需求分析、系统设计、编码实现、测试调试、文档编写等任务的智能体。| |AI 游戏道具推荐系统|游戏内商城推荐功能|数据分析、机器学习|根据玩家需求推荐游戏道具。|在一些游戏中,利用 AI 分析玩家的游戏风格和进度,为玩家推荐合适的游戏道具,如武器、装备等。| |AI 天气预报分时服务|彩云天气分时预报|数据分析、机器学习|提供精准的分时天气预报。|彩云天气利用 AI 提供每小时的天气预报,帮助用户更好地安排出行和活动。| |AI 医疗病历分析平台|医渡云病历分析系统|数据分析、自然语言处理|分析医疗病历,辅助诊断。|医渡云利用 AI 分析医疗病历中的症状、检查结果等信息,为医生提供辅助诊断建议。| |AI 会议发言总结工具|讯飞听见会议总结功能|自然语言处理、机器学习|自动总结会议发言内容。|讯飞听见在会议中利用 AI 自动总结发言者的主要观点和重点内容,方便回顾和整理。| |AI 书法作品临摹辅助工具|书法临摹软件|图像识别、数据分析|帮助书法爱好者进行临摹。|书法临摹软件利用 AI 识别书法作品的笔画和结构,为用户提供临摹指导和评价。| |超级简历优化助手|无|自然语言处理|帮助用户优化简历提高求职成功率。|超级简历优化助手分析简历内容并提供优化建议。| |AI 室内设计方案生成|酷家乐|图像生成、机器学习|快速生成个性化室内设计方案。|酷家乐允许用户上传户型图,通过 AI 生成多种设计方案。| |AI 音乐创作辅助工具|Amper Music|机器学习、音频处理|协助音乐创作者进行创作。|Amper Music 根据用户需求生成旋律和编曲。| |AI 情感咨询助手|松果倾诉智能助手|自然语言处理、情感分析|提供情感支持和建议。|松果倾诉智能助手通过文字或语音交流为用户提供情感咨询。| |AI 宠物健康监测设备|小佩宠物智能设备|传感器数据处理、机器学习|实时监测宠物健康状况。|小佩宠物智能设备可监测宠物活动、饮食等,提供健康预警。| |AI 旅游行程规划器|马蜂窝智能行程规划|数据分析、自然语言处理|根据用户需求生成个性化旅游行程。|马蜂窝智能行程规划根据目的地、时间等因素为用户定制旅游路线。|
2025-02-06
我想用AI做一个人物访谈录发在公众号上,请帮我生成一段200字的简介
以下是为您生成的 200 字左右的人物访谈录简介: 南瓜博士首次写小说获奖,背后离不开 AI 的助力。他先让 AI 写故事概要和角色背景介绍并做修改,还采用让 AI 以表格形式输出细节描述的技巧,打破叙事习惯,方便局部调整,确保都是具体细节。之后将生成的表格串联成文,过程中偶尔给出建议。然而,因小说字数超 2000 字,修改时 GPT4 记性不好,Claude 又改丢关键情节。但最终,在与 AI 的合作与磨合中,南瓜博士成功获奖,展现了 AI 在创作中的独特作用与挑战。
2024-12-26
列出2-3个精选的比较好的文本处理类的AI工具或网站,要求尽量是国内的产品,最好是免费的。罗列时应包含以下信息:名称、简介、2-3个主要功能、横向对比的优缺点
以下为您精选的国内文本处理类 AI 工具或网站: 1. 秘塔写作猫 简介:利用 AI 技术辅助用户进行高质量写作。 主要功能:检查语法、拼写错误;提供写作改进建议;进行智能润色和内容创作辅助。 优点:功能较为全面,能有效提升写作质量。 缺点:可能存在对某些特定领域的适应性不足。 2. Lettria 简介:处理个人文本材料。 主要功能:对个人文本进行分析和处理。 优点:专注于个人文本处理,针对性较强。 缺点:功能相对较单一。
2024-11-19
ai简介
AI(人工智能)是一种能够模拟人类智能的技术,已经广泛应用于多个领域。 在医疗保健领域,AI 可用于医学影像分析辅助诊断疾病、加速药物研发、提供个性化医疗方案、控制手术机器人提高手术精度和安全性。 在金融服务领域,AI 能用于风控和反欺诈、信用评估、投资分析以及提供 24/7 客户服务等。 在零售和电子商务中,AI 可实现产品推荐、改善搜索和个性化体验、进行动态定价以及提供聊天机器人服务。 在制造业,AI 有助于预测性维护、质量控制、优化供应链、控制工业机器人提高生产效率。 在交通运输领域,AI 在汽车行业的应用包括自动驾驶技术、车辆安全系统、个性化用户体验、预测性维护、生产自动化、销售和市场分析、电动化和能源管理、共享出行服务、语音助手和车载娱乐、车辆远程监控和诊断等。 豆包 AI 是抖音旗下基于云雀大模型开发的 AI 智能助手,提供聊天机器人、写作助手、英语学习助手等功能,能回答各种问题并进行对话,网址是:https://www.doubao.com/
2024-10-03