直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

介绍一下 MiniCPM-V

回答

MiniCPM 是面壁智能于 2 月 1 日发布的旗舰端侧模型。它以小博大,性能超越了 Mistral-7B,在 MT-Bench 等榜单上表现出色。MiniCPM 是一款能说会看、具备编程能力、拥有多模态能力的端侧模型。它不仅性能优秀,而且成本极低,支持 CPU 推理,并且已经开源,在主流移动操作系统上进行了适配和测试。然而,在手机使用场景中,由于存在耗电、速度、内存卡顿等问题,如果不能提供足够的独特价值且无法关闭相关功能,可能吸引力不足。人的自然对话通常需要 10 个 tokens 每秒左右,但即使考虑到背景,像 CPM 这样的小模型在端上做出具有良好自然阅读速度的生成仍有挑战。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

质朴发言:AI Native 硬件:端侧 AI 革新将至|Z 沙龙第 7 期

但是人的自然对话需要10个tokens每秒左右,但使用场景中你需要展示出来,大家需要规划10个tokens。所以看起来,即使是CPM这样的小模型,即使在考虑到背景的情况下,也不能在端上做出非常好的自然阅读速度的生成。编者按:2月1日,面壁智能发布了旗舰端侧模型MiniCPM,它以小博大的性能超越了Mistral-7B,并在MT-Bench等榜单上表现出色。MiniCPM是一款能说会看、具备编程能力、拥有多模态能力的端侧模型。它不仅在性能上优秀,而且具有极低的成本,支持CPU推理。MiniCPM开源,并已在主流移动操作系统上进行了适配和测试。手机的使用场景方面,虽然在research paper上说可以用,但是在需要考虑耗电和速度的时候,它似乎并没有那么吸引人。所以如果厂家在手机上做这个生文功能,如果不能提供足够的不同的价值,其实还是挺没有吸引力的。因为它会快速耗尽你的电量,这是一个非常严重的问题。同时,需要的内存会变卡顿。而且,如果这个功能不能关闭,那它有什么意义呢?

其他人在问
ChatGLM开发者团队介绍
ChatGLM 是一个开源的、支持中英双语的对话语言模型,底座是 GLM 语言模型。其相关信息如下: 地址: 简介:中文领域效果最好的开源底座模型之一,针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持。 此外,基于 ChatGLM 还有在垂直领域微调的模型,如医疗领域的 MedChatGLM,其地址为: 。
2024-10-30
介绍一下智谱清言
智谱清言是由智谱 AI 和清华大学推出的大模型产品,其基础模型为 ChatGLM 大模型。 模型特点: 工具使用排名国内第一。 在计算、逻辑推理、传统安全能力上排名国内前三。 更擅长专业能力,但代码能力有优化空间,知识百科方面与其他第一梯队模型相比稍显不足。 适合应用: 场景广泛,可优先推进在 AI 智能体方面相关的应用,包括任务规划、工具使用及一些长文本记忆相关的场景。 在较复杂推理应用上效果不错。 广告文案、文学写作方面也是很好的选择。 访问方式: PC 端: 移动端: 小程序端:搜索【智谱清言】进入【清影】智能体 在中国 AI 领域,智谱 AI 的模型具有开创性,其背后技术源自清华大学研发团队的科研成果转化。产品设计对标 ChatGPT,在逻辑推理和处理复杂提示词方面表现出明显优势。
2024-10-30
能否介绍一下ai的历史
人工智能(Artificial Intelligence)的历史源远流长。 早在 19 世纪,查尔斯·巴贝奇发明了计算机,用于按照明确的程序进行数字运算,现代计算机虽更先进,但仍遵循相同的受控计算理念。 1943 年,心理学家麦卡洛克和数学家皮特斯提出机器的神经元模型,为神经网络奠定基础。 1950 年,计算机先驱图灵最早提出图灵测试,作为判别机器是否具备智能的标准。 1956 年,在美国达特茅斯学院,马文·明斯基和约翰·麦凯西等人共同发起召开了著名的达特茅斯会议,正式提出“人工智能”一词,并确立其为一门学科。 此后近 70 年,AI 的发展起伏不定,曾两次引发人类对其毁灭世界的恐慌,热度时高时低。 在发展过程中,对于一些任务,如根据照片判断一个人的年龄,由于无法明确解法,无法编写明确程序让计算机完成,这类任务正是 AI 所关注的。 2022 年 11 月 30 日,OpenAI 发布基于 GPT 3.5 的 ChatGPT,引发了全球的 AI 浪潮。
2024-10-27
AI基本介绍
以下是关于 AI 的基本介绍: 新手学习 AI: 了解 AI 基本概念:建议阅读「」部分,熟悉术语和基础概念,包括主要分支(如机器学习、深度学习、自然语言处理等)及它们之间的联系。浏览入门文章,了解其历史、应用和发展趋势。 开始学习之旅:在「」中有为初学者设计的课程,特别推荐李宏毅老师的课程。还可通过在线教育平台(如 Coursera、edX、Udacity)按自己节奏学习并获取证书。 选择感兴趣模块深入:AI 领域广泛,如图像、音乐、视频等,可根据兴趣选择特定模块,掌握提示词技巧。 实践和尝试:理论学习后通过实践巩固知识,尝试使用各种产品创作,知识库中有实践作品和文章分享。 体验 AI 产品:与 ChatGPT、Kimi Chat、智谱、文心一言等聊天机器人互动,了解其工作原理和交互方式。 AI 的应用场景: 医疗保健:包括医学影像分析、药物研发、个性化医疗、机器人辅助手术等。 金融服务:涵盖风控和反欺诈、信用评估、投资分析、客户服务等。 零售和电子商务:有产品推荐、搜索和个性化、动态定价、聊天机器人等。 制造业:包含预测性维护、质量控制、供应链管理、机器人自动化等。 AI 的基础内容: AI 背景知识:包括基础理论(人工智能、机器学习、深度学习的定义及关系)、历史发展(重要里程碑)。 数学基础:统计学基础(均值、中位数、方差等)、线性代数(向量、矩阵等)、概率论(条件概率、贝叶斯定理)。 算法和模型:监督学习(线性回归、决策树、支持向量机)、无监督学习(聚类、降维)、强化学习。 评估和调优:性能评估(交叉验证、精确度、召回率)、模型调优(网格搜索优化参数)。 神经网络基础:网络结构(前馈网络、卷积神经网络、循环神经网络)、激活函数(ReLU、Sigmoid、Tanh)。
2024-10-27
你能为我介绍一些最新的AI产品吗?能涉及变现的更好~
以下为您介绍一些最新的涉及变现的 AI 产品: 在电商领域: “电商:带货本地生活”,AI 数字人上岗带货本地生活电商,一个月多赚 3 万。 “电商:婴儿的四维彩超 AI 预测”,通过 AI 工具提前还原宝宝的四维彩超模样进行变现。 “电商:小红书 AI 绘画变现”,分享小红书最火的三种 AI 绘画类商品的变现方式。 在写作方面:“Grammarly、秘塔写作猫”是 AI 智能写作助手,利用自然语言处理技术辅助用户进行高质量写作,可检查语法、拼写错误并提供改进建议,以及进行智能润色和内容创作辅助。 在商品推荐方面:“淘宝拍照搜商品”通过图像识别为用户推荐相似商品;“大众点评智能推荐”基于用户口味偏好推荐美食。 在语音助手方面:“小爱同学、Siri”可根据语音识别和自然语言理解技术为不同需求定制专属语音助手,如控制智能家居、回答问题、进行语音交互和任务处理等。 在健身领域:“Keep 智能训练计划”利用数据分析和机器学习技术,根据用户数据制定个性化健身方案。 在客服方面:“阿里小蜜等电商客服”为企业提供智能客服解决方案,可自动回答客户问题,处理订单查询等任务。
2024-10-25
midjourney最新功能介绍
Midjourney 的最新功能包括: 1. 风格参考和个性化模型混合使用: 可以混合不同的风格参考融入到混合中,最终风格的强度取决于提示中分配给每种风格的顺序。 能混合多个sref 代码,也能将风格参考图像 URL 和 sref 随机代码混合使用,还可为单个代码或 URL 加权。 能混合多个模型个性化代码,并使用相同的符号进行加权混合。 2. 编辑器更新: 图像编辑器:允许从计算机上传图像,然后进行扩展、裁剪、重绘、添加或修改场景中的元素。还推出了“图像重纹理化模式”,会估算场景的形状,然后重新应用纹理,使所有光照、材质和表面都发生变化。所有图像编辑操作都可以通过文本提示和区域选择来控制,且编辑器兼容模型个性化、风格参考、角色参考和图像提示功能。 AI 审核系统:正在测试一个更加智能、更加细致的 V2 AI 审核系统,会从整体上检查提示、图像、绘制蒙版以及生成的输出图像。 3. 使用规则:由于这些功能非常新,在第一个发布阶段,将这些功能开放给已生成至少 10,000 张图像的用户(年度会员可用)和过去 12 个月内一直是月度订阅用户的用户。
2024-10-25
总结一下最新AI动态和新闻,各种新技术和新的应用方向
以下是最新的 AI 动态和新闻,以及新技术和新的应用方向: 技术研究方向: 数学基础:包括线性代数、概率论、优化理论等。 机器学习基础:涵盖监督学习、无监督学习、强化学习等。 深度学习:涉及神经网络、卷积网络、递归网络、注意力机制等。 自然语言处理:包含语言模型、文本分类、机器翻译等。 计算机视觉:有图像分类、目标检测、语义分割等。 前沿领域:如大模型、多模态 AI、自监督学习、小样本学习等。 科研实践:包括论文阅读、模型实现、实验设计等。 应用方向: 编程基础:如 Python、C++等。 机器学习基础:如监督学习、无监督学习等。 深度学习框架:如 TensorFlow、PyTorch 等。 应用领域:包括自然语言处理、计算机视觉、推荐系统等。 数据处理:涵盖数据采集、清洗、特征工程等。 模型部署:涉及模型优化、模型服务等。 行业实践:包含项目实战、案例分析等。 AIGC 周刊动态: 2024 年 7 月第二周:快手发布可灵网页版及大量模型更新;阶跃星辰发布多款模型;商汤打造类似 GPT4o 的实时语音演示;GraphRAG:微软开源新型 RAG 架构。 2024 年 7 月第三周:Anthropic 新增分享和后台功能;LLM 分布式训练框架 OpenDiLoCo;Odysseyml 重构 AI 视频生成技术。 2024 年 7 月第四周:Open AI 发布 GPT4omini、Mistral 发布三个小模型,还有其他一堆小模型等。 2024 年 7 月第五周:Meta 发布的 Llama3.1 405B 模型,具备 128K token 上下文窗口及对 8 种语言的改进,能与领先闭源模型竞争。评估显示其在指令遵循、代码和数学能力上表现优异。同时,还提到 AI 音乐工具 Udio 的大规模更新,以及 OpenAI 推出的 SearchGPT 搜索功能。 新手学习 AI 的方法: 了解 AI 基本概念:阅读「」部分,熟悉术语和基础概念,了解主要分支及联系,浏览入门文章。 开始学习之旅:在「」中找到为初学者设计的课程,推荐李宏毅老师的课程,通过在线教育平台按自己节奏学习。 选择感兴趣的模块深入学习:如图像、音乐、视频等,掌握提示词技巧。 实践和尝试:实践巩固知识,使用各种产品创作,分享实践成果。 体验 AI 产品:与 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人互动,了解工作原理和交互方式。
2024-10-31
ChatGLM视频表现有何特色,优劣分析一下
ChatGLM 是中文领域效果最好的开源底座模型之一,具有以下特色: 1. 针对中文问答和对话进行了优化,能更好地处理中文语境下的任务。 2. 经过约 1T 标识符的中英双语训练,并辅以监督微调、反馈自助、人类反馈强化学习等技术的加持。 其优势包括: 1. 在处理中文相关的任务时表现出色,能提供较为准确和有用的回答。 然而,目前可能存在的不足暂未在提供的内容中有明确提及。但一般来说,与其他先进的语言模型相比,可能在某些复杂场景下的表现还有提升空间。
2024-10-30
AI如何综合利用,可以高效率做哪些事情,总结一下
以下是 AI 综合利用并能高效率做事的一些方面: 在教学中: 帮助教师节省时间和提高生产力,如备课。 为学生制定个性化学习计划,分析学生表现并根据知识差距和个人学习风格创建定制的学习路径。 进行课程开发和创造学习沉浸体验,包括生成图像、文本和视频,转化为补充教育材料、作业和练习题。 与新的 AI 工具结合,为学生提供更好的口语和展示沟通准备工具。 但与优秀人类教师相比仍有差距,人机融合是趋势。 在政府工作中: 帮助政府为美国人民提供更好的结果,扩大机构的监管、治理和福利分配能力,降低成本并增强政府系统的安全性。 为机构使用 AI 发布指导,包括明确保护权利和安全的标准,改进 AI 采购,并加强 AI 部署。 帮助机构通过更快速和高效的合同获取特定的 AI 产品和服务。 加速招聘 AI 专业人员。 在工作场景中: 营销方面,如蓝色光标 X 京东探索出 AIGC 精细化作业模式,革新传统代言人 TVC 制作流程;定制营销报告,涵盖多种相关数据和分析。 办公方面,如利用 ChatGPT 生成 Markdown 语法内容,再借助 MindShow 转换为精美的 PPT。
2024-10-26
AI如何综合利用,可以高效率做哪些事情,总结一下短一点
以下是 AI 综合利用能够高效率做的一些事情: 在政府领域,帮助政府为民众提供更好的服务,如扩大机构的监管、治理和福利发放能力,降低成本并增强系统安全性。包括为机构使用 AI 发布指导,帮助机构更高效、更经济、更有效地获取特定 AI 产品和服务,加速招聘 AI 专业人员并为员工提供相关培训。 推动经济增长和繁荣,通过降低监管不确定性,鼓励对 AI 的投资和应用,及时消除创新障碍。 在教学中,帮助教师节省时间和提高生产力,如分析学生表现制定个性化学习计划,生成图像、文本和视频用于课程开发和学习沉浸,结合新的 AI 工具为学生提供更好的沟通准备。但与优秀人类教师相比仍有差距,人机融合是趋势。
2024-10-26