Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

介绍一下 MiniCPM-V

Answer

MiniCPM 是面壁智能于 2 月 1 日发布的旗舰端侧模型。它以小博大,性能超越了 Mistral-7B,在 MT-Bench 等榜单上表现出色。MiniCPM 是一款能说会看、具备编程能力、拥有多模态能力的端侧模型。它不仅性能优秀,而且成本极低,支持 CPU 推理,并且已经开源,在主流移动操作系统上进行了适配和测试。然而,在手机使用场景中,由于存在耗电、速度、内存卡顿等问题,如果不能提供足够的独特价值且无法关闭相关功能,可能吸引力不足。人的自然对话通常需要 10 个 tokens 每秒左右,但即使考虑到背景,像 CPM 这样的小模型在端上做出具有良好自然阅读速度的生成仍有挑战。

Content generated by AI large model, please carefully verify (powered by aily)

References

质朴发言:AI Native 硬件:端侧 AI 革新将至|Z 沙龙第 7 期

但是人的自然对话需要10个tokens每秒左右,但使用场景中你需要展示出来,大家需要规划10个tokens。所以看起来,即使是CPM这样的小模型,即使在考虑到背景的情况下,也不能在端上做出非常好的自然阅读速度的生成。编者按:2月1日,面壁智能发布了旗舰端侧模型MiniCPM,它以小博大的性能超越了Mistral-7B,并在MT-Bench等榜单上表现出色。MiniCPM是一款能说会看、具备编程能力、拥有多模态能力的端侧模型。它不仅在性能上优秀,而且具有极低的成本,支持CPU推理。MiniCPM开源,并已在主流移动操作系统上进行了适配和测试。手机的使用场景方面,虽然在research paper上说可以用,但是在需要考虑耗电和速度的时候,它似乎并没有那么吸引人。所以如果厂家在手机上做这个生文功能,如果不能提供足够的不同的价值,其实还是挺没有吸引力的。因为它会快速耗尽你的电量,这是一个非常严重的问题。同时,需要的内存会变卡顿。而且,如果这个功能不能关闭,那它有什么意义呢?

Others are asking
我如何给小白介绍deepseek的原理
DeepSeek 的原理主要包括以下几个方面: 1. AI 特性定位: 支持文本/代码/数学公式混合输入。 具有动态上下文,对话式连续记忆约 4K tokens 上下文窗口,换算成汉字约 8000 字左右。 任务适应性强,可切换创意生成/逻辑推理/数据分析模式。 2. 系统响应机制: 采用意图识别+内容生成双通道。 自动检测 prompt 中的任务类型、输出格式、知识范围。 对位置权重(开头/结尾)、符号强调敏感。 3. 基础指令框架: 可以套用四要素模板。 掌握格式控制语法,如强制结构使用```包裹格式要求,用{{}}标注需填充内容,使用优先级符号>表示关键要求,!表示禁止项。 4. 进阶控制技巧: 思维链引导,包括分步标记法和苏格拉底式追问。 知识库调用,如领域限定指令和文献引用模式。 支持多模态输出。 此外,DeepSeek 还具有一些设计思路,如将 Agent 封装成 Prompt 并储存在文件,通过提示词文件实现同时使用联网功能和深度思考功能,在模型默认能力基础上优化输出质量等。您可以通过搜索 www.deepseek.com 并按照相关步骤开始使用 DeepSeek。
2025-02-28
我如何给小白介绍deepseek
DeepSeek 是一个具有多种功能和特点的产品: 1. 效果对比:通过 Coze 进行了小测试,可对比查看相关结果。 2. 使用方法: 搜索 www.deepseek.com,点击“开始对话”。 将装有提示词的代码发给 DeepSeek。 认真阅读开场白后正式开始对话。 3. 设计思路: 将 Agent 封装成 Prompt 并储存在文件,减轻调试负担。 通过提示词文件让 DeepSeek 实现同时使用联网和深度思考功能。 在模型默认能力基础上优化输出质量,减轻 AI 味,增加可读性。 设计了阈值系统,可能会根据反馈修改。 用 XML 进行规范设定。 4. 完整提示词:有特定版本,如 v1.3。 5. 特别鸣谢:李继刚的【思考的七把武器】提供了思考方向,Thinking Claude 是设计灵感来源,Claude 3.5 Sonnet 是得力助手。 此外,关于 DeepSeek 还有以下信息: 1. 智能纪要: 能进行自然语言理解与分析、编程、绘图等。 使用优势是能用更少的词做更多事,思维发散,给出创意思路和高级内容。 存在问题是思维链长不易控制,可能输出错误内容,增加纠错成本。 审核方法可用其他大模型解读其内容。 使用时要有自己的思维雏形,多看思考过程,避免被冲刷原有认知。 适用于阅读、育儿、写作、交流等场景。 有案例展示,如与孩子共读时制作游戏,左脚踩右脚式的模型交互。 2. DeepSeek 只是品牌名,需搭配具体模型,如 DeepSeek V3(类 GPT4o)和 DeepSeek R1(类 OpenAI o1)。相关文档在 3 群和 4 群分享,也可在 v to a gi 的飞书知识库中搜索获取。
2025-02-28
请介绍Coze开发平台中,扣子API有什么功能?怎么用它?
在 Coze 开发平台中,扣子 API 具有以下功能和使用方法: 获取 accessToken: 在 coze 界面右侧的扣子 API 授权,或者打开链接 https://www.coze.cn/open/oauth/pats 。 添加令牌,设置 token 的名称和过期时间(为安全起见,最多 1 个月)。 设置权限,可选择会话管理和对话,拿不准可全部选择,完成后点击“确定”按钮。 最后一定要点击按钮复制下拉获取令牌,此令牌只会出现一次。 获取 botid: 从“工作空间”打开一个 bot,点击商店按钮,查看地址栏中“bot/”之后的数字。 发布为 bot api: 注意在前端使用 bot 必须发布成为 API,点击发布,选择 API,等待审核通过。 此外,智能体沟通页面在 Zion 中采用 OAuth 鉴权机制,准备工作包括: 获取 Coze bot 应用鉴权密钥:在 Coze 主页点击左下方扣子 API,选择 Oauth 授权模式,添加新令牌并配置基本信息,创建 Key 过程中会生成公钥和私钥(私钥需单独下载保存),最后勾选全部权限。 获取 Bot ID:进入自己的智能体在地址栏内复制“bot/”之后的数字,且 bot 发布时要选择 Agent as API。 在 Coze 上发布 bot:发布时记得勾选 API 及 WEB SDK,Coze bot 发布有审核周期(1 30 分钟),需确认发布成功。 在扣子中手搓插件方面: Body:用于传递请求主体部分,GET 方法中通常不使用来传递参数。 Path:定义请求路径部分,GET 方法中可编码为 URL 一部分传递参数。 Query:定义请求查询部分,是 GET 方法中常用的参数传递方式。 Header:定义 HTTP 请求头信息部分,GET 方法中通常不用于传递参数。 配置输出参数:填对信息后可点击自动解析,若成功会显示并填好输出参数,然后保存并继续,建议填写参数描述。 调试与校验:测试工具能否正常运行,运行后查看输出结果,点击 Response 可看到解析后的参数。
2025-02-27
给我一个ai介绍的ppt
以下是为您整合的关于 AI 的相关内容: 一、AI 工具在组会准备中的应用 1. 使用了 Claude 和 Gamma.app 两个工具,能够快速寻找符合条件的论文、提取精炼论文信息、找到适合的 PPT 制作工具并教会使用。 2. Claude 可解决学术网站条件搜索问题,如搜索营销领域权威期刊及其中关于 chatgpt 的最新论文,并进行相关内容的摘要和介绍。 3. 询问了哪些 AI 工具能快速制作 PPT 以及如何使用 gamma app 制作 PPT。 二、与 AI 交流的技巧 1. 给 AI 设定角色,蕴含角色背景和输出要求,让其更明确如何应对问题。 2. 举例子,能使 AI 更准确了解要求。 3. 连续提问,根据回复不断细化要求,帮助清晰想法和找到有用答案。 4. 当不知如何提问时,可先问 AI 如何提问,再用其产生的问题问它。 三、AI 发展的相关情况 1. OpenAI 公司不断推进技术路线,为人类打开新世界大门。 2. AI 发展不仅依赖软件,还需要相配的芯片算力支持。GPU 厂商在算力提升方面表现出色,其强大之处在于并行性,与 AI 人工神经网络计算原理匹配。 3. 目前大模型采用文字接龙的生成方法。 以上内容部分来源于台大李宏毅老师的人工智能课程。
2025-02-26
我是少儿编程老师,现在我需要知道编程每个语言之间的区别,并绘制出一张思维导图给我详细介绍
很抱歉,目前没有关于编程各语言区别的详细内容来为您绘制思维导图。但一般来说,不同的编程语言在语法、应用场景、性能特点等方面存在差异。例如,Python 语法简洁,常用于数据科学和人工智能;Java 应用广泛,在企业级开发中表现出色;C++ 性能高效,常用于系统编程和游戏开发等。您可以通过在线编程学习网站、相关书籍以及技术论坛获取更详细准确的信息来绘制思维导图。
2025-02-19
请介绍一下如何使用AI进行PPT生成
以下是使用 AI 进行 PPT 生成的方法: 1. 利用闪击: 访问国内网站 https://ppt.isheji.com/?code=ysslhaqllp&as=invite ,无需魔法。 选择模板。 将准备的大纲转换成适配闪击的语法,可参考官方使用指南:https://zhuanlan.zhihu.com/p/607583650 。 点击文本转 PPT,并在提示框中选择确定,得到转换后的 PPT。 可在线编辑,但导出有会员限制。 2. 以爱设计为例: 导入大纲到工具生成 PPT,其他工具操作方式大同小异,基本基于 Markdown 语法的内容来完成 PPT 生成。 优化整体结构,按照公司要求自行优化字体、图片等元素,针对下载后的 PPT 可删改内容。 3. 结合 GPT4、WPS AI 和 chatPPT: 先让 GPT4 生成 PPT 大纲。 把大纲导入到 WPS 当中,启用 WPS AI 一键生成 PPT。 让 chatPPT 添加一些动画。 手动修改细节,如字体、事实性错误等。
2025-02-18
帮我找一下学习AI的资料
以下是为您整理的学习 AI 的资料: 1. 关于 AI 生成 CAD 图: 学术论文:通过 Google Scholar、IEEE Xplore、ScienceDirect 等学术数据库搜索相关论文,了解 AI 在 CAD 领域的应用和研究成果。 专业书籍:查找与 AI 在 CAD 领域相关的专业书籍,了解应用和案例。 在线课程和教程:参加 Coursera、edX、Udacity 等平台上的 AI 和 CAD 相关课程,在 YouTube 等视频平台上查找教程和演示视频。 技术论坛和社区:加入如 Stack Overflow、Reddit 的 r/AI 和 r/CAD 等相关论坛和社区,与专业人士交流学习,关注相关博客和新闻网站,了解最新动态和案例。 开源项目和代码库:探索 GitHub 等开源平台上的 AI 和 CAD 相关项目,例如 OpenAI 的 GPT3、AutoGPT 等模型在 CAD 设计中的应用。 企业案例研究:研究 Autodesk、Siemens 等公司在 AI 在 CAD 设计中的应用案例。 2. 新手学习 AI: 了解 AI 基本概念:阅读「」部分,熟悉术语和基础概念,了解人工智能的主要分支及联系,浏览入门文章。 开始学习之旅:在「」中找到初学者课程,推荐李宏毅老师的课程,通过在线教育平台(如 Coursera、edX、Udacity)按节奏学习并获取证书。 选择感兴趣模块深入学习:AI 领域广泛,可根据兴趣选择特定模块,如掌握提示词技巧。 实践和尝试:理论学习后进行实践,巩固知识,尝试使用各种产品创作作品,在知识库分享实践成果。 体验 AI 产品:与 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人互动,了解工作原理和交互方式,获取实际应用体验。
2025-03-03
有ai产品吗? 咨询一下,能进入面试的自建ai agent项目具体要达到一个什么水准啊?
目前有一些 AI 面试官的相关产品,例如: 1. 用友大易 AI 面试产品:具有强大技术底座、高度场景贴合度、招聘全环节集成的解决方案、先进防作弊技术及严密数据安全保障。能完成面试、初筛并自动发送面试邀约。 2. 海纳 AI 面试:通过在线方式、无需人为干预完成自动面试、自动评估,精准度高达 98%,面试效率比人工方式提升 5 倍以上,候选人到面率提升最高达 30%。 3. InterviewAI:在线平台,提供面试职位相关问题及 AI 生成的推荐答案。候选人用设备麦克风回答,每个问题最多回答三次,并收到评估、建议和得分。 此外,Cognition 发布了首位 AI 软件工程师 Devin,它是一个自主 Agents,能通过使用自己的 shell、代码编辑器和网络浏览器解决工程任务,成功通过知名人工智能公司的实际工程面试,还在 Upwork 上完成了实际工作。在无辅助情况下正确解决了 13.86%的问题,远超之前最先进模型。 在其他领域,也有相关的 AI 项目和产品,如: 1. 软件层具有独特多元化行为动作生成及控制 AI Agent 的产品,能实现人类所有基本行为动作的生成及流程过渡,硬件层具有独特并行通信架构,容错率高,力矩密度前沿,深度耦合软件算法,实现 24 小时全天续航无休。 2. 百奥几何的生成式 AI 大模型赋能蛋白质设计,应用在包括生物医药、化工、医美、食品等整个生物制造领域,其生成式 AI 蛋白质大模型 GeoFlow 已达国际领先水平。 3. 行云致力于打造软件亲和、高显存规格的大模型推理芯片,用异构、白盒的硬件形态重塑大模型计算系统,解决大模型产业的算力成本和供应问题。
2025-03-02
我是一个普通本科的大二学生,学的是软件工程专业,但是我本身编程能力不是很好,我对ai拥有浓厚的兴趣,喜欢去学习并运用ai,我想未来all in ai并成为一个产品经理,我想给你分享一下我的计划,我想今年下半年考过英语四级,并且参加苹果26年的swift 学生挑战赛,我是零基础但是我愿意学习,希望你帮我制定一个包含实施策略、里程碑和最佳实践的详细框架,以帮助我有效地实现这些目标!
以下是为您制定的包含实施策略、里程碑和最佳实践的详细框架,以帮助您有效地实现目标: 一、英语四级考试 实施策略: 1. 制定学习计划,每天安排一定时间学习英语,包括词汇、语法、听力、阅读和写作。 2. 多做历年真题,熟悉考试题型和难度。 3. 参加英语学习社群或找学习伙伴,互相监督和鼓励。 里程碑: 1. 每月进行一次模拟考试,评估学习进度。 2. 两个月内完成词汇和语法的系统学习。 最佳实践: 1. 利用碎片时间背单词,如在公交车上、课间等。 2. 听力练习时,反复听同一篇材料,直到完全听懂。 3. 写作练习后请老师或同学帮忙批改,总结错误和不足。 二、参加苹果 26 年的 Swift 学生挑战赛 实施策略: 1. 从零基础开始学习 Swift 编程语言,通过在线课程、书籍等资源进行系统学习。 2. 参与相关的编程实践项目,提升实际操作能力。 3. 关注苹果官方网站和社区,了解挑战赛的最新动态和要求。 里程碑: 1. 三个月内掌握 Swift 编程语言的基础知识。 2. 半年内完成一个小型的 Swift 项目开发。 最佳实践: 1. 遇到问题及时在技术论坛或社区寻求帮助。 2. 定期回顾和总结所学知识,加深理解和记忆。 3. 参考优秀的 Swift 项目案例,学习他人的编程思路和技巧。 三、成为 AI 产品经理 实施策略: 1. 学习 AI 相关的基础知识,包括机器学习、深度学习等。 2. 了解产品经理的职责和工作流程,通过实践项目积累经验。 3. 关注行业动态,参加相关的研讨会和培训课程。 里程碑: 1. 一年内掌握 AI 基础知识和产品经理的基本技能。 2. 参与实际的 AI 项目开发,担任产品经理助理角色。 最佳实践: 1. 多与行业内的专业人士交流,获取经验和建议。 2. 不断提升自己的沟通和协调能力,以更好地推动项目进展。 3. 学会从用户需求出发,设计具有创新性和实用性的 AI 产品。 希望以上框架对您有所帮助,祝您顺利实现目标!
2025-03-01
对于物联网的智能台灯设计,你给我写一下国内外的发展现状,但不能完全抄袭,查重率百分之十
目前,在国内外物联网智能台灯的发展呈现出以下现状: 国内方面,随着物联网技术的迅速发展,智能台灯的市场逐渐扩大。许多企业纷纷投入研发,注重产品的智能化功能,如通过手机 APP 实现远程控制、亮度和色温调节等。同时,一些产品还融入了语音控制功能,提升了用户的使用体验。然而,在产品的稳定性和兼容性方面,仍存在一定的改进空间。 国外方面,智能台灯的设计更加注重人性化和创新性。例如,一些产品在外观设计上更加时尚美观,能够与不同的家居风格相融合。在技术应用上,国外的智能台灯更加注重与其他智能家居设备的互联互通,形成完整的智能家居生态系统。但部分产品价格较高,限制了其在大众市场的普及程度。
2025-02-28
给我总结一下不同的AI工具在写作时可以提供什么样的帮助,他们的优势是什么
以下是不同的 AI 工具在写作时所能提供的帮助及其优势: 邮件写作: Grammarly:提供语法检查、拼写纠正、风格建议和语气调整等功能。易于使用,支持多种平台,适用于多种语言。 Hemingway Editor:简化句子结构,提高可读性,标记复杂句和冗长句。界面简洁,重点突出,适用于改善写作风格和简洁性。 ProWritingAid:全面的语法和风格检查,提供详细的写作报告和建议。功能强大,支持多种平台和集成,特别适合专业写作者。 Writesonic:基于 AI 生成各种类型的文本,包括电子邮件、博客文章、广告文案等。生成速度快,适合需要快速创作和灵感的用户。 Lavender:专注于邮件写作优化,提供个性化建议和模板,帮助用户提高邮件打开率和回复率。 论文写作: 文献管理和搜索: Zotero:结合 AI 技术,自动提取文献信息,帮助管理和整理参考文献。 Semantic Scholar:AI 驱动的学术搜索引擎,提供文献推荐和引用分析。 内容生成和辅助写作: Grammarly:提供文本校对、语法修正和写作风格建议,提高语言质量。 Quillbot:基于 AI 的重写和摘要工具,精简和优化论文内容。 研究和数据分析: Google Colab:提供基于云的 Jupyter 笔记本环境,支持 AI 和机器学习研究,便于进行数据分析和可视化。 Knitro:用于数学建模和优化,进行复杂的数据分析和模型构建。 论文结构和格式: LaTeX:结合自动化和模板,高效处理论文格式和数学公式。 Overleaf:在线 LaTeX 编辑器,提供丰富模板库和协作功能,简化编写过程。 研究伦理和抄袭检测: Turnitin:广泛使用的抄袭检测工具,确保论文原创性。 Crossref Similarity Check:检测潜在抄袭问题。 文章润色: Wordvice AI:集校对、改写转述和翻译等功能于一体,基于大型语言模型提供全面的英文论文润色服务。 ChatGPT:由 OpenAI 开发的大型语言模型,可用于多方面写作辅助。 Quillbot:人工智能文本摘要和改写工具,可快速筛选和改写文献资料。 HyperWrite:基于 AI 的写作助手和大纲生成器,帮助写作前进行头脑风暴和大纲规划。 Wordtune:AI 驱动的文本改写和润色工具,优化文章语言表达。 Smodin:提供 AI 驱动的论文撰写功能,根据输入生成符合要求的学术论文。 总之,这些 AI 工具在写作的不同方面发挥作用,涵盖了校对、改写、大纲生成、内容生成等环节,可有效提高写作效率和质量。用户应根据自身需求选择合适的工具。但使用时需注意仔细甄别内容。
2025-02-20
调研一下AI安全治理这个方向的国内外的团队和人。包括AI安全治理的子方向,每一个子方向国内外有哪些科研院所的哪些团队在做相关方向的工作,以及这些团队有哪些骨干成员,他们有哪些观点。以及这个团队有哪些治理成果,尽量详细
以下是关于 AI 安全治理方向的国内外团队和人的相关调研: 国外团队和人员: OpenAI:首席科学家 Ilya 对模型安全较为关注,提出了通过“指令层次结构”来修复“忽略所有先前指令“攻击的方法,并已在 GPT40 Mini 中得到部署。 Anthropic:在多重越狱方面的工作表明了“警告防御”的潜力,在前面和后面添加警告文本,以警示模型不要被越狱。 Gray Swan AI 的安全专家:试用“断路器”,专注于重新映射有害表示,效果比标准拒绝训练更好。 图灵奖得主 Hinton:支持对 AI 监管,认为大模型及其驱动的 AI 必须引入安全性监管,防止其失控或对人类造成伤害,并在网上签署了联名公开信。 英国:创建了世界上第一个人工智能安全研究所 AISA,具有在部署前对高级模型进行评估、建立国家能力并开展研究、协调国际合作伙伴等核心功能,还发布了 Inspect 框架用于 LLM 安全评估,并宣布与美国等效机构签署谅解备忘录,计划在美国旧金山设立办事处。 国内团队和人员:目前调研内容中未提及国内相关团队和人员的具体信息。 在观点方面,Bengio、Hinton、姚期智等著名研究者认为大模型及其驱动的 AI 必须引入安全性监管,确保大模型是 Safety 的,防止其失控或对人类造成伤害,并签署了联名公开信表达对于 AI 失控的担忧,呼吁学术界和工业界对大模型进行监管。吴恩达和 Lecun 则认为模型的能力不足以使其脱离人类的限制。 治理成果方面,英国通过其高级研究与发明机构(ARIA)花费 5900 万英镑开发“守门员”,负责了解和减少在能源、医疗保健和电信等关键领域中其他人工智能代理的风险。英国政府还计划设立一个“AI 安全研究实验室”。美国能源部一直在利用其内部测试床评估人工智能可能对关键基础设施和能源安全带来的风险。LLM 测试初创公司 Haize Labs 与 Hugging Face 合作创建了首个红队抵抗组织基准,汇编了常用的红队数据集并根据模型评估它们的成功率。Scale 根据私人评估推出了自己的稳健性排行榜。
2025-02-20