Navigate to WaytoAGI Wiki →
Home/question.detail.breadcrumb.questionList/question.detail.breadcrumb.questionDetail

ChatGLM是谁开发的

Answer

ChatGLM 是由清华大学开发的。它是一个开源的、支持中英双语的对话语言模型,底座是 GLM 语言模型。其相关项目地址为:https://github.com/THUDM/ChatGLM-6B 。它是中文领域效果最好的开源底座模型之一,针对中文问答和对话进行了优化,经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持。此外,基于 ChatGLM 还有在医疗领域的微调模型,如 Med-ChatGLM ,地址为:https://github.com/SCIR-HI/Med-ChatGLM

Content generated by AI large model, please carefully verify (powered by aily)

References

信鑫:基于大模型 + 知识库的 Code Review 实践

[title]信鑫:基于大模型+知识库的Code Review实践[heading2]名词解释|名词|释义|<br>|-|-|<br>|CR / Code Review|越来越多的企业都要求研发团队在代码的开发过程中要进行CodeReview(简称CR),在保障代码质量的同时,促进团队成员之间的交流,提高代码水平。|<br>|llm /大规模语言模型|大规模语言模型(Large Language Models,LLMs)是自然语言处理中使用大量文本数据训练的神经网络模型,可以生成高质量的文本并理解语言。如GPT、BERT等。|<br>|AIGC|利用NLP、NLG、计算机视觉、语音技术等生成文字、图像、视频等内容。<br>全称是人工智能生成/创作内容(Artificial Intelligence Generated Content);是继UGC,PGC后,利用人工智能技术,自动生成内容的生产方式;AIGC底层技术的发展,驱动围绕不同内容类型(模态)和垂直领域的应用加速涌现。|<br>|Gemma|Gemma是一个轻量级、先进的开放模型系列,采用与创建Gemini模型相同的研究和技术构建而成。Gemma由Google DeepMind和Google的其他团队开发,以拉丁语gemma(意为“宝石”)命名。Gemma模型权重由促进创新、协作和负责任地使用人工智能(AI)的开发者工具提供支持。|<br>|LLaMA|Meta(Facebook)的大型多模态语言模型。|<br>|ChatGLM|ChatGLM是一个开源的、支持中英双语的对话语言模型,底座是GLM语言模型。|<br>|Baichuan|Baichuan 2是百川智能推出的新一代开源大语言模型,采用2.6万亿Tokens的高质量语料训练。|

LLM开源中文大语言模型及数据集集合

[title]LLM开源中文大语言模型及数据集集合[heading4]1.ModelChatGLM:地址:[https://github.com/THUDM/ChatGLM-6B](https://github.com/THUDM/ChatGLM-6B)简介:中文领域效果最好的开源底座模型之一,针对中文问答和对话进行了优化。经过约1T标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持VisualGLM-6B地址:[https://github.com/THUDM/VisualGLM-6B](https://github.com/THUDM/VisualGLM-6B)简介:一个开源的,支持图像、中文和英文的多模态对话语言模型,语言模型基于ChatGLM-6B,具有62亿参数;图像部分通过训练BLIP2-Qformer构建起视觉模型与语言模型的桥梁,整体模型共78亿参数。依靠来自于CogView数据集的30M高质量中文图文对,与300M经过筛选的英文图文对进行预训练。Chinese-LLaMA-Alpaca:地址:[https://github.com/ymcui/Chinese-LLaMA-Alpaca](https://github.com/ymcui/Chinese-LLaMA-Alpaca)简介:中文LLaMA&Alpaca大语言模型+本地CPU/GPU部署,在原版LLaMA的基础上扩充了中文词表并使用了中文数据进行二次预训练

LLM开源中文大语言模型及数据集集合

[title]LLM开源中文大语言模型及数据集集合[heading3][heading4]2.1垂直领域微调[heading5]医疗Med-ChatGLM:地址:[https://github.com/SCIR-HI/Med-ChatGLM](https://github.com/SCIR-HI/Med-ChatGLM)简介:基于中文医学知识的ChatGLM模型微调,微调数据与BenTsao相同。QiZhenGPT:地址:[https://github.com/CMKRG/QiZhenGPT](https://github.com/CMKRG/QiZhenGPT)简介:该项目利用启真医学知识库构建的中文医学指令数据集,并基于此在LLaMA-7B模型上进行指令精调,大幅提高了模型在中文医疗场景下效果,首先针对药品知识问答发布了评测数据集,后续计划优化疾病、手术、检验等方面的问答效果,并针对医患问答、病历自动生成等应用展开拓展。ChatMed:地址:[https://github.com/michael-wzhu/ChatMed](https://github.com/michael-wzhu/ChatMed)简介:该项目推出ChatMed系列中文医疗大规模语言模型,模型主干为LlaMA-7b并采用LoRA微调,具体包括ChatMed-Consult:基于中文医疗在线问诊数据集ChatMed_Consult_Dataset的50w+在线问诊+ChatGPT回复作为训练集;ChatMed-TCM:基于中医药指令数据集ChatMed_TCM_Dataset,以开源的中医药知识图谱为基础,采用以实体为中心的自指令方法(entity-centric self-instruct),调用ChatGPT得到2.6w+的围绕中医药的指令数据训练得到。

Others are asking
开源大模型ChatGLM 系列有哪些版本
ChatGLM 系列的开源版本包括: ChatGLM36B:第三代 ChatGLM 对话模型,采用全新设计的 Prompt 格式,原生支持工具调用、代码执行和 Agent 任务等复杂场景。 ChatGLM36Bbase:第三代 ChatGLM 基座模型,采用更多样的训练数据、更充分的训练步数和更合理的训练策略,在 10B 以下的基础模型中性能较强。 ChatGLM36B32k:第三代 ChatGLM 长上下文对话模型,在 ChatGLM36B 的基础上进一步强化了对长文本的理解能力,能处理最多 32K 长度的上下文。
2024-11-04
ChatGLM3 及相关系列产品有哪些
2023 年 10 月 27 日,智谱 AI 于 2023 中国计算机大会(CNCC)上推出了全自研的第三代基座大模型 ChatGLM3 及相关系列产品。其中,智谱清言是基于 ChatGLM 大模型的产品。 智谱清言的特点包括:在工具使用排名国内第一,在计算、逻辑推理、传统安全能力上排名国内前三。总体更擅长专业能力,但代码能力还有优化空间,知识百科与其他第一梯队模型相比稍显不足。 其适合的应用场景相对广泛,根据 SuperCLUE 测评结果,可优先推进在 AI 智能体方面相关的应用,包括任务规划、工具使用及一些长文本记忆相关的场景。在较复杂推理应用上效果不错,在广告文案、文学写作方面也是很好的选择。
2024-11-04
分析 ChatGLM在文生视频领域的应用产出
ChatGLM 是中文领域效果较好的开源底座模型之一,其地址为:。经过约 1T 标识符的中英双语训练,并辅以监督微调、反馈自助、人类反馈强化学习等技术进行优化,针对中文问答和对话有出色表现。 此外,还有基于 ChatGLM6B 的 VisualGLM6B,地址为:。它是一个开源的、支持图像、中文和英文的多模态对话语言模型,语言模型基于 ChatGLM6B,具有 62 亿参数。图像部分通过训练 BLIP2Qformer 构建起视觉模型与语言模型的桥梁,整体模型共 78 亿参数。依靠来自于 CogView 数据集的 30M 高质量中文图文对,与 300M 经过筛选的英文图文对进行预训练。 在文生视频领域,ChatGLM 及其相关模型可能通过对文本的理解和生成能力,为视频的脚本创作、内容描述生成等方面提供支持,但具体的应用产出还需要结合实际的开发和应用场景来进一步探索和评估。
2024-10-30
ChatGLM视频表现有何特色,优劣分析一下
ChatGLM 是中文领域效果最好的开源底座模型之一,具有以下特色: 1. 针对中文问答和对话进行了优化,能更好地处理中文语境下的任务。 2. 经过约 1T 标识符的中英双语训练,并辅以监督微调、反馈自助、人类反馈强化学习等技术的加持。 其优势包括: 1. 在处理中文相关的任务时表现出色,能提供较为准确和有用的回答。 然而,目前可能存在的不足暂未在提供的内容中有明确提及。但一般来说,与其他先进的语言模型相比,可能在某些复杂场景下的表现还有提升空间。
2024-10-30
ChatGLM在生成视频上表现如何
目前 ChatGLM 主要侧重于自然语言处理和文本生成,在生成视频方面的能力相对有限。它并非专门为视频生成而设计的模型。
2024-10-30
ChatGLM开发者团队介绍
ChatGLM 是一个开源的、支持中英双语的对话语言模型,底座是 GLM 语言模型。其相关信息如下: 地址: 简介:中文领域效果最好的开源底座模型之一,针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持。 此外,基于 ChatGLM 还有在垂直领域微调的模型,如医疗领域的 MedChatGLM,其地址为: 。
2024-10-30
主流的AI应用开发平台有哪些
以下是一些主流的 AI 应用开发平台: 1. 图虫网:这是一个 AI 摄影作品销售平台,运用图像识别、数据分析技术,市场规模达数亿美元。它为摄影爱好者提供作品销售渠道,利用 AI 技术对摄影作品进行分类和推荐。 2. 网易云音乐音乐人平台:作为 AI 音乐作品发布平台,采用音频处理、数据分析技术,市场规模达数亿美元。为音乐创作者提供作品发布、推广、版权管理等服务。 3. 好好住 APP:这是一个 AI 家居用品推荐平台,使用数据分析、自然语言处理技术,市场规模达数亿美元。能根据用户需求推荐家居用品。 4. 东方财富网投资分析工具:作为 AI 金融投资分析平台,运用数据分析、机器学习技术,市场规模达数十亿美元。分析金融市场,为投资者提供投资建议和决策支持。 5. 500px 摄影社区:这是一个 AI 摄影比赛平台,利用图像识别、数据分析技术,市场规模达数亿美元。举办摄影比赛,展示优秀摄影作品。 6. Logic Pro X 教学软件:作为 AI 音乐制作教学平台,采用机器学习、音频处理技术,市场规模达数亿美元。为用户提供个性化的音乐制作教学服务。 7. 鲁班到家 APP:这是一个 AI 家居维修服务平台,运用数据分析、自然语言处理技术,市场规模达数亿美元。为用户提供家居维修服务。 8. 雪球财经 APP:作为 AI 金融投资教育平台,使用数据分析、自然语言处理技术,市场规模达数亿美元。为用户提供个性化的金融投资教育服务。 9. 美团外卖配送系统:这是一个 AI 物流配送优化系统,运用数据分析、机器学习技术,市场规模达数十亿美元。优化物流配送路线,提高配送效率。 10. 猎聘 APP:作为 AI 招聘求职平台,采用数据分析、自然语言处理技术,市场规模达数十亿美元。连接求职者和招聘企业,促进就业。 11. 链家 APP:这是一个 AI 房地产交易平台,运用数据分析、自然语言处理技术,市场规模达数十亿美元。为买卖双方提供房地产交易平台。 12. 游戏开发工具 Unity:作为 AI 游戏关卡生成器,使用图像生成、机器学习技术,市场规模达数亿美元。为游戏开发者自动生成游戏关卡。
2024-12-24
目前最前沿的应用在游戏领域的AI技术点是什么,包括游戏开发过程中的成本降低、效率提升,包括游戏内容生成,包括游戏后期运营推广。介绍技术点的技术逻辑以及技术细节。
目前在游戏领域应用的前沿 AI 技术点主要包括以下几个方面: 1. 利用 AIGC 技术实现游戏产业的生产力革命: 降低开发成本:借助人工智能的内容创作工具,如生成新的游戏内容(地图、角色和场景)、驱动游戏中的非玩家角色(NPC)、改进游戏的图像和声音效果等,能够缩减游戏开发的成本。 缩短制作周期:例如通过程序化内容生成,包括利用人工智能生成文字、图像、音频、视频等来创作游戏剧本、人物、道具、场景、用户界面、配音、音效、配乐、动画和特效等,从而减少游戏开发时间。 提升游戏质量和带来新交互体验:AIGC 技术为游戏带来不同以往的新体验,甚至创造出新的游戏类型以及新的交互方式。 2. 游戏内容辅助生成: 生成文、生成图、生成 3D 以及生成音乐。应用场景包括游戏策划人和制作人、美术设计师等。 对于工业化的游戏公司,基于 Stable Difussion 的生成能够通过 2D 美术素材的辅助生成提高创业效率 50%,降低 20%80%的成本。 文生图:通过提示词加参数就可以形成 2D 的参考图,适配度高。 图生图:原画师或美术可以使用,用一个线稿或原画,在原画基础上加一些 Prompt 和参数,就可以形成一个效果图和二级的素材。 动画辅助渲染:用 Lora 对角色背景、关键帧进行风格渲染,例如将真人视频渲染成二次元风。 3. 游戏的智能运营: 智能 NPC 互动:保持长期记忆,保持人物个性和对话表现形式,同时满足成本平衡。 客服、攻略的问答、代码和脚本的生成。主要针对游戏的产品经理、运营经理和社区的运营经理。 游戏社区运营:如海外的 Discord,国内的 Fanbook,让更多玩家在游戏之外,在社群里面很好地互动,基于游戏的美术素材进行二创、查询攻略和使用智能客服。 这些技术的技术逻辑和技术细节如下: 1. AIGC 技术:基于大语言模型和扩散模型,通过机器学习、强化学习等先进技术进行训练,能够理解和生成各种游戏相关的内容。 2. 游戏内容辅助生成:利用深度学习算法对大量的游戏相关数据进行学习和分析,从而能够根据给定的提示或参数生成相应的游戏内容。 3. 智能运营方面:通过构建智能模型,对玩家的行为和需求进行分析和预测,从而提供个性化的服务和互动。
2024-12-22
目前最前沿的应用在游戏领域的AI技术点是什么,包括游戏开发过程中的成本降低、效率提升,包括游戏内容生成,包括游戏后期运营推广。
目前在游戏领域最前沿的 AI 技术点主要包括以下几个方面: 1. 探索将游戏环境中的成果迁移至现实世界:电子游戏作为人工智能算法的测试场,为人工智能模型的构建与训练提供了理想化的场所。但将游戏中的技术推广到现实世界应用仍面临诸多挑战。 2. 利用 AIGC 技术实现游戏产业的生产力革命: 借助人工智能的内容创作工具,降低开发成本、缩短制作周期、提升游戏质量和完成度,带来新体验,创造新游戏类型和交互方式。 应用于电子游戏开发的多个方面,如生成新的游戏内容(地图、角色和场景)、驱动游戏中的非玩家角色(NPC)、改进游戏的图像和声音效果等。 3. 为通用人工智能的孵化提供帮助:经过多个复杂游戏训练后的“玩游戏”的人工智能体。 4. 借助人工智能完成大型游戏的制作:如《微软模拟飞行》通过与 blackshark.ai 合作,利用人工智能从二维卫星图像生成无限逼真的三维世界,且模型可随时间改进。 5. 生成式人工智能模型在游戏资产中的应用:出现了用于游戏中几乎所有资产的生成式人工智能模型,包括 3D 模型、角色动画、对话和音乐等。 6. 降低游戏制作的内容成本:整合生成式 AI 可大幅降低制作游戏的时间和成本,例如为一张图片生成概念图的时间从 3 周下降到 1 小时。
2024-12-22
我自己能开发出一个AI么
自己开发 AI 是可行的,但具有一定的难度和挑战。 从相关学习资料来看,需要了解以下方面: 要知道何时需要自己开发,何时可以使用现成的人工智能。 开发过程可能存在一些负面体验,比如大模型训练时间长,通常以周为单位,且结果难以完全控制。 影响模型能力的指标众多,常规会通过参数量级来评估,其量级呈指数级增长。 同时,通过一些课程的学习,可以了解生成式 AI 背后的原理和更多可能性,体验用生成式 AI 打造应用以及训练自己的生成式 AI 模型。但这需要投入大量的时间和精力,并具备相关的技术知识和能力。
2024-12-18
可以开发一个完整的软件项目吗?可以把现有的vue2开发的uniapp项目转成vue3吗
在 AI 领域,开发一个完整的软件项目是可行的,但这需要综合考虑多个因素,如项目的规模、功能需求、技术难度以及开发团队的能力等。 关于将现有的 Vue2 开发的 Uniapp 项目转成 Vue3,理论上是可以实现的,但这是一个具有一定复杂性和挑战性的任务。需要对 Vue3 的新特性和语法有深入的了解,并且对原项目的架构和代码有清晰的把握。在转换过程中,可能需要处理诸如组件的迁移、API 的变化、依赖库的兼容性等问题。
2024-12-17
cursor好用吗?不会写代码的人可以用它来开发app吗
Cursor 是一款很好用的工具,具有以下优点: 1. 它是对话式的编程工具,集代码编写、报错调试、运行于一体,可在一个页面里丝滑实现,且以对话方式进行,能消除学习代码的恐惧感。 2. 让小白可以无压力入门代码,解决实际问题,也能提高专业程序员的效率。 3. 基于 VS code 开发,是目前使用体验最好的 AI coding IDE,不具备代码能力的人通过自然语言描述能快速开发一些项目。 4. 继承了 vscode 的强大功能和用户界面,几乎一模一样,还深度集成了 gpt 等大模型,无缝融入了包括 IntelliJ IDEA、Visual Studio Code 和 GitHub 在内的主流开发环境和代码库中。 5. 体量小,启动快,编程效率高。 然而,Cursor 也有一些局限性: 1. 比较适合简单、原型类的项目,当应用比较复杂和商业化时,会比较困难,需要考虑长期维护、用户场景和稳定性等因素。 2. 代码编写只是开发中的一环,程序员的工作还包括需求评估沟通、架构设计、调试部署等多个模块,而且大语言模型面对复杂项目可能面临改好一个 bug,产生一个新 bug 的情况。 总的来说,对于不会写代码的人,Cursor 可以帮助他们入门和开发一些简单的项目,但不能完全替代专业程序员。目前 Cursor 新账号有 2 周 pro 体验,成本为 0,值得一试。它支持多种语言,如 python、java、C等,在国内可以直接使用,还提供了 3 种订阅模式。
2024-12-16