Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

大模型企业落地方案有哪些

Answer

大模型企业落地方案主要包括以下几个方面:

  1. 提高内容可信:
    • 做具备通用能力的大模型,通过商业交付应用、反馈和评测来解决内容可信问题。
    • 不断优化数据以解决实际应用问题,如自我学习能力等。
    • 走向垂直化,结合场景用一个模型和框架提高内容精准度。
  2. 解决算力成本高、训练重复和资源紧缺的问题:
    • 以 GPT-3 模型为例,现有千卡集群训练一个月,单次训练周期一个月,总成本超过 1200 万美金,且全行业训练卡持续涨价。
    • 目前仍无人能用商业化的国产芯片做大模型训练。
  3. 降低大模型价格或使用垂直领域模型落地。
  4. 以百度智能云为例:
    • 在 IaaS 层,百舸 AI 异构计算平台解决算力问题,提供从集群创建到模型训练、推理的完整算力管理方案,提升算力管理能力和模型训练效率,确保高达 99.5%的有效训练时间,为大模型应用落地提供强大算力支撑。
    • 在 Paas 层,千帆大模型平台解决大模型的调用、开发和应用开发问题,支持调用文心大模型全系列模型,提供全面工具链,支持定制化模型开发,通过 AppBuilder 提供企业级 Agent 和企业级 RAG 开发能力,还能将企业应用数据反馈到模型中形成良性循环,持续优化模型性能。
    • 在 SaaS 层,提供丰富的常用应用供客户选择,如数字人平台曦灵、智能客服应用客悦等。

此外,大模型在实际应用中存在一些问题,如知识的局限性、幻觉问题和数据安全性问题,而 RAG 是解决上述问题的一套有效方案,它可以让大模型从权威的、预先确定的知识来源中检索、组织相关信息,更好地控制大模型生成的文本输出,并且用户可以深入了解 LLM 如何生成最终的结果。RAG 可以和微调结合使用,两者并不冲突。

Content generated by AI large model, please carefully verify (powered by aily)

References

七大行业的商业化应用

解决大模型落地问题,总结来说主要有三方面:提高内容可信;解决算力成本高、训练重复和资源紧缺的问题;大模型价格需要不断降低,或使用垂直领域模型落地。首先是提高内容可信问题。周伯文对钛媒体App表示,我们应该做一个具备通用能力的大模型,能够解决不同用户的实际问题,而且需要不断通过商业交付去应用、反馈,甚至需要评测以解决内容可信问题。中国科学院院士、清华大学人工智能研究院名誉院长张钹认为,ChatGPT没有解决的就是自我学习的能力,这是ChatGPT最致命的地方,因此需要把更多数据去优化以进一步解决实际应用问题。“不要认为ChatGPT能解决全部的人工智能问题,没有重新学习的能力,不可能应对变化。国内、国外都一样,我问美国的ChatGPT也是这样来答的,问中国的ChatGPT,有的做得比较好,有的也是错误的。这就给我们提出一个问题,我们要把它用到这些决策问题上面去,这个重大问题需要进一步解决。”张钹表示。旷视科技物流业务事业部的负责人徐庆才在最近一次交流中提到,目前大模型需要走向垂直化,可以结合场景用一个模型和一个框架下统一去提高内容精准度。“目前依然有一定差距,这个差距来自于现在技术上的不可实现,来自于现在没有找到一个好的方式实现这个东西,这就是我们现在需要来看,现在新技术到底能不能够弥合这个点,我们判断这些问题很快都会被解决。”徐庆才表示。其次是解决算力成本高、训练重复资源却紧缺的问题。一家AI算力公司联合创始人张新(化名)对钛媒体App提到,以GPT-3模型为例,现有千卡集群训练一个月,单次训练周期一个月,总成本超过1200万美金。今年上半年,全行业(训练卡)在涨价,持续涨价超过25%。但在这样一个情况下,今天仍然没有人能够用商业化的国产芯片去做大模型的训练。

国内大模型落地“狂飙”一年,各家厂商成绩如何?

目前,百度智能云拥有全栈AI技术,形成端到端的AI优化机制。在IaaS层,百度智能云百舸AI异构计算平台解决大模型应用中的算力问题。它提供了从集群创建到模型训练、推理的完整算力管理方案,显著提升了算力管理能力和模型训练效率。百舸平台通过引入自动故障预测与任务迁移技术,确保了高达99.5%的有效训练时间,大模型应用落地提供了强大的算力支撑。在Paas层,百度智能云千帆大模型平台解决大模型的调用、开发和应用开发问题,支持调用文心大模型全系列模型,还提供了全面的工具链,支持定制化的模型开发。在应用开发上,千帆大模型平台通过AppBuilder,提供企业级Agent和企业级RAG开发能力。更重要的是,千帆平台可以将企业应用中产生的数据经过评估和对齐进一步反馈到模型中,形成良性循环,持续优化模型性能。在SaaS层,百度智能云提供了丰富的常用应用供客户选择,包括数字人平台曦灵、智能客服应用客悦等等。依托百度智能云打造的大模型落地全栈生态的领先优势,百度大模型获得了最多行业企业客户的认可。IDC发布的《中国生成式AI应用开发平台市场:企业统一AI开发平台的雏形》报告显示,在战略领先、数据集成、模型调优、模型部署、加速计算能力、工程化能力、平台生态、用户体验7大评估项目中,百度智能云获得七项满分,位于所有大模型平台厂商第一名。数据来源:IDC《中国生成式AI应用开发平台市场:企业统一AI开发平台的雏形》报告

RAG提示工程(一):基础概念

大语言模型技术的本质导致了大模型的输出结果具有不可预测性,此外,静态的训练数据导致了大模型所掌握的知识存在截止日期,无法即时掌握最新信息。因此,当我们将大模型应用于实际业务场景时会发现,通用的基础大模型无法满足我们的实际业务需求。主要存在以下原因:知识的局限性:模型自身的知识完全源于它的训练数据,而现有的主流大模型(ChatGPT、文心一言、通义千问…)的训练集基本都是抓取网络公开的数据用于训练,对于一些实时性的、非公开的或离线的数据是无法获取到的,这部分知识也就无从具备。幻觉问题:大模型的底层原理是基于数学概率的文字预测,即文字接龙。因此大模型存在幻觉问题,会在没有答案的情况下提供虚假信息,提供过时或通用的信息,从可信度低非权威来源的资料中提供结果等。数据安全性:对于企业来说,数据安全至关重要,没有企业愿意承担数据泄露的风险,将自身的私域数据上传第三方平台进行训练。因此如何大模型落地应用时如何保障企业内部数据安全是一个重要问题。而RAG是解决上述问题的一套有效方案。它可以让大模型从权威的、预先确定的知识来源中检索、组织相关信息,更好地控制大模型生成的文本输出,并且用户可以深入了解LLM如何生成最终的结果。并且,RAG可以和微调结合使用,两者并不冲突。RAG类似于为模型提供教科书,允许它基于特定查询检索信息。这该方法适用于模型需要回答特定的询问或解决特定的信息检索任务。然而,RAG不适合教模型来理解广泛的领域或学习新的语言,格式或样式。微调类似于让学生通过广泛的学习内化知识。这种方法当模型需要复制特定的结构、样式或格式时非常有用。以下是RAG与微调从维度方面的比较:参考资料:《Retrieval-Augmented Generation for Large Language Models:A Survey》(https://arxiv.org/pdf/2312.10997.pdf)

Others are asking
提供给我一个agent落地的具体案例
以下为您提供几个 Agent 落地的具体案例: 彬子基于 ComfyUI 做油管封面 Agent:彬子是 ComfyUI 新人,之前更多使用 Coze 做 Agent 并调用其图像流完成绘图功能,还在 Glif 上做若干 Bot 以插件调用 API 方式完成绘图功能调用。Glif 提供的云端 ComfyUI 带来更多图像玩法,Coze 的工作流和 ComfyUI 的图像流代表了 Agent 内部两个子领域领先水平,但大多数同学专注一个领域精进,只要从擅长阵地多迈出一步,就能更好把控 Agent 中各种节点的设计和运用。 有用 Agent 产品开发:目前仍没有 Killer App 出现和 Agent 产品落地,原因一是 Agent 不靠谱,二是 Agent 开发者不靠谱。Agent 能力受 Tools 能力影响,如订机票需携程的 API 接入能力,要让模型更准确选择 Tools 及生成 api args,将非通识业务知识设计好让 Agent 直接用是当前接近“人工”智能且高性价比的方式。 【智谱 AutoGLM】:经过深度测试,AutoGLM 让开发者看到了 AI Agent 真正落地的希望。它解决了之前开发类似功能时的 API 对接难、多模态识别差、操作不精准等问题,借助 RPA 思路通过模拟人类操作实现跨应用控制。其场景理解能力出色,能根据用户意图选择合适应用场景,但仍存在语音识别偏差、复杂界面操作稳定性差、只支持安卓等问题。智谱团队选择几个高频场景深耕细作,证明了产品价值,未来发展空间大。
2025-03-12
有哪些辅助财务工作提效的AI智能体或落地应用?
以下是一些辅助财务工作提效的 AI 智能体或落地应用: 新兴的 AI 智能体公司,如 Sierra、Decagon、Maven AGI、DevRev、Gradient Labs 等,在客户服务和支持等领域发挥作用,其中 Sema4 可用于财务后勤。 RPA(流程自动化机器人)产品,如杭州分叉智能公司的 RPA 产品,可控制桌面软件,实现办公流程自动化,在财务领域可用于开票、网银流水下载等。它能够替代电脑办公中的重复有逻辑工作,为企业降本增效。 利用引刀 AP 创建网页实现智能解答税务问题,结合飞书避免信息泄露和实现自动回复等。 生成式 AI 可以帮助金融服务团队改进内部流程,简化财务团队的日常工作流程。例如,帮助编写 Excel、SQL 和 BI 工具中的公式和查询以实现分析自动化,自动创建文本、图表、图形等报告内容,为会计和税务团队综合、总结并提供税法和潜在扣除项的可能答案,以及帮助自动生成和调整采购和应付账款相关的合同、订单和发票等。
2025-03-11
AI 项目企业落地方向和案例。
以下是关于 AI 项目企业落地方向和案例的相关内容: AI 企业落地应用方面,有文章能带你快速搞懂本轮 AI 大模型革命的核心知识信息,从历史到今天,从原理到应用,从产业到趋势,以通俗易懂但不失专业严谨的方式带你走入 AI 的世界。 Anthropic 在 AI Engineer Summit 2025 上分享了企业应用 AI 的最佳实践,并总结了常见错误。核心挑战包括如何入手、如何评估效果、技术选择困惑(如是否需要微调)。关键经验是评估先行,明确“智能度、成本、延迟”之间的平衡,避免过早微调,先进行基础优化。案例方面,Intercom 通过评估优化 AI Agent Fin,使其处理 86%的客服请求,其中 51%无需人工介入。相关链接: 此外,还有用飞书+DeepSeek R1 搭建自动化 AI 工作流的相关内容。流程包括 URL 内容抓取➝DeepSeek R1 翻译➝自动改写➝生成文章。飞书提供快速启动模板,支持翻译、OCR 等任务。工作流链接: 。 宝玉 Q&A 中提到处理大规模代码,可使用 XML 包裹,超大代码可上传 GitHub 供 AI 分析,AI 还可生成代码并搜索相关库。查看内容: 。ChatGPT 免费用户可使用 GPT4o mini 语音版,免费用户可体验自然对话节奏,Plus/Pro 用户享特权。
2025-02-27
我想时刻关注Deepseek目前在电商行业应用落地的场景的信息及对应的应用APP、小程序等,可以通过什么渠道第一时间获取
目前关于 Deepseek 在电商行业应用落地的场景信息以及对应的应用 APP、小程序等,您可以通过以下渠道第一时间获取: 1. 关注 Deepseek 官方网站的动态发布和通知。 2. 订阅 Deepseek 官方的社交媒体账号,如微信公众号、微博等,获取最新消息。 3. 加入相关的电商行业论坛或社区,与其他从业者交流,获取相关信息。 4. 关注电商行业的权威媒体和资讯平台,可能会有相关报道。
2025-02-26
Deepseek目前已在电商行业应用落地的场景有哪些?
DeepSeek 在电商行业已应用落地的场景包括: 电商商品策划:如“电商商品策划 DeepSeek 大师版|一键领取同款多维表格模板”。 商品链接分析:如“商品链接分析工具”。 电商产品上架规划:如“电商产品上架规划”。 您可以通过以下链接获取更详细的信息:
2025-02-26
Deepseek目前已在电商行业应用落地的场景有哪些?
DeepSeek 目前已在电商行业应用落地的场景包括: 电商商品策划:如 。 商品链接分析:如 。 电商产品上架规划:如 。
2025-02-26
你说什么模型
以下是关于模型的相关信息: 我调用的是抖音集团的云雀大模型。 OpenAI API 由具有不同功能和价位的多种模型提供支持,包括 GPT4、GPT3.5、DALL·E、Whisper、Embeddings、Codex、Moderation、GPT3 等,您还可以通过微调针对特定用例对原始基本模型进行有限的定制。 在 Cursor 中,使用光标聊天、Ctrl/⌘K 和终端 Ctrl/⌘K 可以轻松在不同模型之间切换。在 AI 输入框下方有下拉列表,允许选择要使用的模型,默认准备好的模型有 GPT4o、GPT4、Claude 3.5 Sonnet 以及 Cursor 的自定义模型 cursorsmall,cursorsmall 不如 GPT4 智能但速度更快且用户可无限制访问,还可以在 Cursor Settings>Models>Model Names 下添加其他模型。
2025-03-12
请帮我推荐优化大模型+知识库的提示词技巧,重点是解决将知识库配置给大模型做RAG后,召回率不高或者不遵循指令。
以下是关于优化大模型+知识库的提示词技巧,以解决将知识库配置给大模型做 RAG 后召回率不高或者不遵循指令的问题: 首先,了解 LLM 应用性能优化的推荐路径: 1. 从 prompt 工程开始把 LLM 应用快速跑起来。 2. 若遇到表现性能不足等问题,如结构化提示词占用上下文过长,可尝试精简提示词长度;若指令遵循度不足,则加强指令约束。 3. 若提示工程无法满足要求,分析问题,若缺失知识,先简单做知识库 RAG。 4. RAG 之后若想让模型表现更收敛更稳定,尝试微调模型。 5. 微调模型后,若模型表现变好,使用更多高级 RAG 技术,构造输入输出样本,进一步用于微调模型,构建正向迭代循环。 需要注意的是,该路径有个隐藏前提:该 LLM 应用依赖外部知识,需要 RAG。若不需要外部知识,则不需要使用 RAG,可以直接进入 prompt 工程与微调的正向迭代循环。 对于 RAG 流程中的检索有用信息部分,有以下改进策略: 1. 优化索引: 按照子部分索引:将文本块再拆分为较小的文本(例如单句),然后对这些小块进行多次索引。适用于有多个主题、有冲突信息的复杂长文本信息,确保与查询相关的上下文。 按照文本框可以回答的问题索引:让 LLM 生成与拆分的文本块相关的假设性问题,并将这些问题用于索引,适用于用户没有提出非常明确的问题,减少模糊性。 按照文本块的摘要进行索引:适用于文本框中有多余信息或者与用户查询无关细节的情况。 2. 重排 rerank:搜到相似信息后,选择策略,大部分场景下选择最相似的即可。 在从知识库中检索出内容后利用大模型进行总结时,有两点需要注意: 1. 优化 Prompt,但此处不展开,可参考相关文章。 2. 选择合适的大模型,考虑上下文长度、聪明度和生成速度。若回答场景是很长的文档,可能更关注上下文长度;大多数情况下,大模型越聪明,生成速度可能越慢。
2025-03-12
有哪些辅助输出3d模型资源的ai工具推荐一下
以下是一些辅助输出 3D 模型资源的 AI 工具推荐: 1. @CSM_ai:可以将文本、图像或草图转换为 3D 素材。体验地址:https://cube.csm.ai 。 2. Move AI 推出的 Move API:能从 2D 视频生成 3D 运动数据,支持多种 3D 文件格式导出,为 AR 应用、游戏开发等提供高质量 3D 运动数据。网址:https://move.ai/api 。 3. ComfyUI 3D Pack:可快速将图片转换为 3D 模型,支持多角度查看,使用 3D 高斯扩散技术提升模型质量,支持多种格式导出,集成先进 3D 处理算法。网址:https://github.com/MrForExample/ComfyUI3DPack/tree/main 。 4. Medivis 的 SurgicalAR 手术应用:将 2D 医疗图像转化为 3D 互动视觉,提高手术精度,支持 3D 模型的放大、缩小、旋转,精确手术计划。网址:https://t.co/3tUvxB0L4I 。 5. Media2Face:3D 面部动画创造工具,根据声音生成同步的 3D 面部动画,允许个性化调整,如情感表达,应用于对话场景、情感歌唱等多种场合。网址:https://sites.google.com/view/media2face 、https://arxiv.org/abs/2401.15687 、https://x.com/xiaohuggg/status/1752871200303480928?s=20 。 6. SIGNeRF:在 3D 场景中快速生成和编辑对象,新增或替换场景中的物体,新生成场景与原场景无缝融合。网址:https://signerf.jdihlmann.com 、https://x.com/xiaohuggg/status/1744950363667759474?s=20 。 7. Luma AI 发布的 Genie 1.0 版本:文本到 3D 模型转换工具,生成详细逼真的 3D 模型,支持多种 3D 文件格式,获得 4300 万美元 B 轮融资。网址:https://lumalabs.ai/genie?view=create 、https://x.com/xiaohuggg/status/1744892707926122515?s=20 。 8. BakedAvatar 动态 3D 头像:从视频创建逼真 3D 头部模型,实时渲染和多视角查看,兼容多种设备,交互性编辑。网址:https://buaavrcg.github.io/BakedAvatar/ 、https://x.com/xiaohuggg/status/1744591059169272058?s=20 。 此外,在 CAD 领域,也存在一些 AI 工具和插件可以辅助或自动生成 CAD 图,例如: 1. CADtools 12:Adobe Illustrator 插件,为 AI 添加 92 个绘图和编辑工具,包括图形绘制、编辑、标注、尺寸标注、转换、创建和实用工具。 2. Autodesk Fusion 360:集成了 AI 功能的云端 3D CAD/CAM 软件,能创建复杂的几何形状和优化设计。 3. nTopology:基于 AI 的设计软件,可创建复杂的 CAD 模型,包括拓扑优化、几何复杂度和轻量化设计等。 4. ParaMatters CogniCAD:基于 AI 的 CAD 软件,可根据用户输入的设计目标和约束条件自动生成 3D 模型,适用于拓扑优化、结构设计和材料分布等领域。 5. 一些主流 CAD 软件,如 Autodesk 系列、SolidWorks 等,提供了基于 AI 的生成设计工具,能根据用户输入的设计目标和约束条件自动产生多种设计方案。 但使用这些工具通常需要一定的 CAD 知识和技能,对于 CAD 初学者,建议先学习基本的 3D 建模技巧,然后尝试使用这些 AI 工具来提高设计效率。
2025-03-11
Berkeley做了一个AI相关的模型
以下是关于 Berkeley 相关的 AI 模型信息: 1 月 11 日,UC Berkeley 的 NovaSky 团队推出了 SkyT132BPreview 推理模型。这是一款开源的推理模型,基于 Qwen2.532BInstruct 训练而成,拥有 32B 参数,在数学、编程、物理和科学等复杂任务领域表现出色。使用入口完全开源,提供训练数据集和代码。NovaSky 团队隶属于加州大学伯克利分校 Sky Computing 实验室,成立于 2020 年,致力于推动低成本、高效率的 AI 模型开发。相关链接:https://novaskyai.github.io/posts/skyt1 5 月 23 日,伯克利实验室研究了“宙斯盾”数据集,用 YOLOv8 模型训练,美军及其盟友驱逐舰关键部件的检测精度达 0.926。相关链接:https://arxiv.org/pdf/2405.12167v1
2025-03-11
AI 大模型产品经理
以下是为您整理的关于 AI 大模型产品经理的相关信息: 招聘信息: 1. 北京: 大模型效果评测:针对大模型效果的综合评估,开发、沉淀并持续优化评测方法,确立评测流程及标准化工作,执行评测任务并撰写分析报告,推进大模型优化。 协助算法及产品同学不断提高 AI 准确性,提升用户体验。 基本要求:研究生及以上学历,计算机、金融、数据分析等相关专业优先。熟悉大模型及相关 NLP 技术者优先;有 AIGC 相关实习经验者优先;代码能力强且有利用大模型解决编程问题的经验,能够熟练的使用 python、sql、java 等工具,能独立完成数据分析/处理任务优先;能够尽快到岗,每周 5 天出勤,实习时间 4 个月以上。 2. 杭州: 杭州智诊科技有限公司招聘医疗大模型的算法工程师/产品经理。 岗位职责:负责跨语言领域 embedding 模型训练,如 SimCSE 通过对比学习方式进行无监督+有监督训练;负责构建知识检索增强模块,保证相关知识信息召回工作;基于 Chat GLM 系列模型进行 LLMasAgent 的落地应用;负责搭建智能体协同决策系统,从系统层面提供诊断决策支持。 任职要求:硕士及以上学历,计算机相关专业毕业,有较强的工程能力;熟悉 Transformer 结构,对 BERT、GPT、BART、T5 等常见的模型有深入的了解,有 ChatGLM/Llama 等模型的使用/训练经验者优先;熟悉 LangChain 等 LLM 的应用框架,熟悉 prompt engineering,能有效借助提示词来充分利用大模型的能力;熟悉知识图谱,对比学习,有信息检索相关实际项目经历;熟悉 AI agent 多智能体协同,有相关领域成熟项目落地,医疗行业优先;熟悉 PyTorch、Huggingface 等深度学习工具,熟悉 Python 编程语言和 Linux 开发环境,有扎实的编程功底。 培训课程: 第一期「AI 实训营」手把手学 AI【第一期:大咖带你在阿里云百炼从零搭应用】,讲师为银海,其为 AI 产品经理,通往 AGI 之路社区共建者,5+大模型厂商资深讲师,全网粉丝量 3W+,在 AI Agent、多模态大模型、企业级 AI 应用等多领域具备丰富实战经验。
2025-03-11
AI大模型训练是什么意思
AI 大模型训练是一个复杂的过程,主要包括以下方面: 1. 数据转换:当请求输入到模型时,会从自然语言形式转化为机器可理解的格式,通常是向量。 2. 数学计算确定参数:类似于通过已知的几组(x,y)值计算方程式 y=f(x)=ax+b 中的参数 a 和 b,大语言模型通过计算确定可能多达 1750 亿个的参数。 3. 一般训练步骤: 无监督学习:分析大量文本数据,学习语言基本结构和常识,具备文本补齐能力,将人类知识向量化以获得基础语言模型。 清洗出好的数据。 指令微调:训练模型理解并执行具体指令,如翻译文本,以回答问题,此阶段数据输入量相对减少。 对齐过程:引入人类评价标准和处理特定格式要求,优化模型输出以符合人类期望,包括处理文化、道德等细节。 4. 生成式预训练:是机器学习领域由来已久的概念,如 GPT 模型基于 Transformer 模型,在大型未标记文本数据集上进行预训练,并能生成类似人类自然语言的文本。 5. 大模型特点: 强大在于庞大的参数数量,这些参数在学习过程中不断调整,帮助模型深入理解和生成数据。 训练依赖大量数据,包括文本、图像、音频等,通过对数据的学习掌握丰富知识和技能。 总之,大模型训练是一个涉及多步骤、大量数据和复杂计算的过程,旨在使模型具备强大的语言处理和生成能力。
2025-03-11
写一个技术方案,列一个基础大纲
由于您没有提供具体的技术方案主题和相关要求,以下为您提供一个通用的基础大纲模板,您可以根据实际情况进行补充和完善: 一、项目概述 1. 项目背景和目标 2. 项目范围和限制 二、技术需求分析 1. 功能需求 2. 性能需求 3. 安全需求 三、技术选型 1. 开发语言和框架 2. 数据库选择 3. 服务器和部署环境 四、系统架构设计 1. 整体架构 2. 模块划分和接口设计 五、数据管理 1. 数据来源和采集 2. 数据存储和处理 3. 数据备份和恢复 六、开发计划 1. 里程碑和时间节点 2. 任务分解和人员分配 七、测试计划 1. 测试类型和方法 2. 测试用例设计 八、运维和支持 1. 系统监控和维护 2. 故障处理和应急预案 九、预算和资源需求 1. 人力成本 2. 硬件和软件采购成本 十、风险评估和应对 1. 技术风险 2. 管理风险 3. 外部风险 希望这个大纲对您有所帮助,若您能提供更具体的信息,我可以为您生成更详细、更具针对性的技术方案大纲。
2025-03-11
我要做一个桌面宠物机器人,帮我设计软硬件和后台方案
以下是为您设计的桌面宠物机器人软硬件和后台方案: 硬件方面: 选择合适的主控芯片,如 esp32、stm32、AVR 等。 配置各类传感器,如触摸传感器、声音传感器、光线传感器等,以实现与用户的交互。 设计电机驱动模块,用于控制机器人的动作。 配备显示屏,用于显示表情和信息。 软件方面: 基于 FreeRTOS 开发系统,负责产品 MCU 各外设驱动撰写、架构维护。 开发与手机软件的通信、OTA 等通讯功能。 后台方面: 建立数据存储和处理系统,用于存储用户与机器人的交互数据,并进行分析和处理。 开发远程控制和更新功能,方便用户通过网络对机器人进行管理和升级。 人员配置: 嵌入式工程师: 职责: 1. 基于 FreeRTOS,负责产品 MCU 各外设驱动撰写、架构维护,配合手机软件工程师进行通信、OTA 等通讯功能开发、维护。 2. 负责硬件模块的调试。 3. 参与量产中产线测试程序、校准程序等代码开发。 要求: 1. 有主流嵌入式芯片(例如 esp32、stm32、AVR 等)开发经验。 2. 具有嵌入式软件架构经验。熟悉 FreeRTOS 等嵌入式系统。 3. 会使用示波器、烙铁、风枪等硬件调试工具,有基础的模拟电路知识。 4. 有一年以上嵌入式开发经验,其中有复杂嵌入式项目开发经验者优先。 5. 对嵌入式和硬件有浓厚兴趣,出于兴趣开发过硬件项目者优先。 产品经理: 职责: 1. 在深刻理解产品的基础上,定义和设计情感化桌面机器人的软硬件交互方式。 2. 规划项目周期,与工程师和设计师紧密配合,推进产品的功能迭代和上线。 3. 测试、优化产品的软硬件交互体验。 要求: 1. 情感细腻,热爱生活。 2. 本科及以上学历,人机交互、计算机、设计相关专业优先。 3. 对软/硬件产品的用户体验有深刻的洞察,追求极致体验,对糟糕的产品容忍度低。 4. 对设计学科与前沿科技有深刻的认知,可以与设计师和工程师无缝沟通。 5. 有项目实操经历,执行力强,擅长按计划推动项目落地。
2025-03-11
构建企业智能客服的方案有哪些
构建企业智能客服的方案主要包括以下几种: 1. 帮助企业快速建立产品智能客服体系,通过用户意图识别、知识库检索答案、AI 大模型总结输出答案、多轮对话沟通、对话分析打标、自动更新知识库 FAQ 以及客服效果分析,提供全面的 AI 客服解决方案,提高 AI 客服回答的准确率,降低企业商用 AI 客服的门槛。 2. 采用开源或者国内智谱、文心、百川等企业提供的 13B 级模型,本地部署在自己的内部系统中,并结合大模型企业提供的技术服务,基于大模型搭建 LangChain、RAG 框架,在智能客服上实现 RPA 自动流程。 3. 可以转化为 LLM 技术支持方,专注发力 LLM 的工程化应用方向,为企业提供更好的 LLM 本地部署和工程化,走 IBM 的企业服务道路。 4. 转变赛道,例如像智齿客服一样,借助国内出海的兴起以及中东、东南亚需求的旺盛,提供在这个方向的智能客服国内服务。 5. 转向 LMops 方向,虽然当前挺有用,比如做复杂 prompt 的多模型效果测试,做 langchain 的可视化设计,但也存在一些隐患点需要思考。 以下是一些具体的应用案例: 1. 如 Grammarly、秘塔写作猫等 AI 智能写作助手,利用自然语言处理技术辅助用户进行高质量写作。 2. 淘宝拍照搜商品,通过图像识别为用户推荐相似商品。 3. 小爱同学、Siri 等 AI 语音助手定制开发,采用语音识别、自然语言理解技术,为不同需求定制专属语音助手。 4. Keep 智能训练计划,利用数据分析、机器学习技术,根据用户数据制定个性化健身方案。 5. 大众点评智能推荐,基于数据挖掘、自然语言处理技术,基于用户口味偏好推荐美食。 6. 阿里小蜜等电商客服,通过自然语言处理、机器学习技术,为企业提供智能客服解决方案。
2025-03-11
10s的ai视频生成方案
以下是一些 10s 的 AI 视频生成方案: 1. Pika 2.2 版本:可以生成 10s 1080p 的 AI 视频,同时更新了 Pikaframes 模式,用户可通过首尾帧进行创意化自然转场的视频制作,能自由设置 1 10s 的转场时长。官方宣传视频: 地址:Pika.art 2. Storyflicks:用户输入一个故事主题,它使用大语言模型快速生成故事视频,视频中包含图片、故事内容、音频和字幕信息。地址:https://github.com/alecm20/storyflicks/blob/main/READMECN.md 在“我 AI 北京比赛&有手就行的 10s 创意视频制作”中: 出图方面: 智谱清言出图 可灵出图:第二轮出图采用可灵的参考图模式,并从百度搜索符合预期的图垫进去,城墙结构大体符合现实逻辑。 即梦出图:2.1 模型对提示词的理解更好,生成的风景画面也比 2.0pro 好些。 风格迁移:可使用 midjourney 的 Retexture 功能(有一定限制条件),平替方案可以选择即梦风格垫图或者 liblib 上面的一些风格迁移工作流。即梦风格垫图:https://www.liblib.art/modelinfo/e8e74a1540df4590b981be4ecd753dfe?from=personal_page&versionUuid=02ec32fcc5f94520b69efbc238ac5a6f 出视频方面:思考想要达到的效果,然后进行首尾帧提示词描述,一般用比较抽象化的短句式,用充足的留白让 AI 去进行随机性的填空。 此外,还有一些创意主题,如经典 icon 巡礼(长城、故宫一隅的延时拍摄,日出日落等)、宜居生活画卷(一碗豆汁里面的烟火人间等)、潮流文化新地标(国家博物馆里面的文物进行跳舞之类的趣味性互动等)、未来科技序章(创意上班场景等)。敲定的制作方案为先制作长城的日出延时摄影图片,之后采用风格迁移的方式将其变成秦朝时期的宫殿寺观壁画,利用首尾帧引导的“时间压缩”效果来体现历史演变。
2025-03-08
具身智能软硬件解决方案。
具身智能的软硬件解决方案包括以下方面: 算法层: 技术层级: 任务层级:可细分为任务级、技能级、动作级、基元级、伺服级,通常关注前四个级别。 解决方案层级:通常可拆分为大脑+小脑两个层级。大脑负责人机交互与规划决策,小脑负责运动控制及将语义信息理解转化为动作。 大脑侧:负责人机交互,能通过视觉在语义层面理解场景、任务等并进行决策。大模型的发展对大脑有促进作用,大脑的长期发展高度依赖多模态大模型。如 2024 年 3 月,有鹿机器人发布了基于 LPLM10B 的软硬件结合产品 Master 2000。 整机硬件方案:基于下游场景需求设计运动、感知、计算和通信硬件方案。具身智能厂商倾向于软硬件全流程自主控制,自己制作机体,原因包括机体和数据模式未统一,训练数据与机体构造紧密联系,以及考虑二级供应商是否成熟和整机利润。部分强大厂商如 Tesla 具备制作更底层电机、传感器的能力,软硬件一体化制造能带来更高利润。 智能类型:包括认知智能和物理智能。认知智能涉及思考、规划和决策能力,完全由大脑驱动;物理智能指机器人的感知和与环境的运动互动能力,感知环节由大脑侧算法实现,行动环节由小脑侧算法和硬件配合完成。 发展趋势: 人形化:外形向人类细部特征靠拢,功能具备真实人类运动、灵活和环境判断能力。 成本下降显著:核心零部件成本降低,人形机器人成本及售价呈下降趋势。 构成元素:包括大脑(意图理解、环境感知、规划决策)、小脑(运动控制、语义信息理解转化为动作)、整机硬件方案。
2025-03-07
适合建筑行业的应用方案
以下是一些适合建筑行业的应用方案和相关的 AI 工具: 应用方案: 1. 建筑设计效果图生成:建筑公司可以利用图片转绘功能,将建筑设计草图或实景照片转化为不同风格的建筑效果图,帮助客户快速理解设计方案的外观效果。 2. 审核规划平面图:利用 AI 工具对规划平面图进行审核,提高效率,减少错误。 AI 工具: 1. HDAidMaster:云端工具,在建筑设计、室内设计和景观设计领域表现出色,搭载自主训练的建筑大模型 ArchiMaster。 2. Maket.ai:主要面向住宅行业,能根据输入的房间面积需求和土地约束自动生成户型图。 3. ARCHITEChTURES:AI 驱动的三维建筑设计软件,在住宅设计早期阶段可引入标准和规范约束设计结果。 4. Fast AI 人工智能审图平台:形成全自动智能审图流程,将建筑全寿命周期内的信息集成,实现数据汇总与管理。 需要注意的是,每个工具都有其特定的应用场景和功能,建议根据具体需求选择合适的工具。同时,以上内容由 AI 大模型生成,请仔细甄别。
2025-03-07
企业如何培养全员AI思维,将AI融入企业文化,驱动人才转型,推动AI驱动的创新。
企业培养全员 AI 思维、将 AI 融入企业文化、驱动人才转型并推动 AI 驱动的创新,可参考以下方面: 1. 组织管理转型:参考波士顿咨询公司发布的《》报告,AI 技术将推动组织从金字塔结构向松树型转变,需要人才具备创新、持续学习、透明和协作能力,组织文化应强调人的价值和认知多样性。为加速 AI 转型,建议采取自上而下的战略推动和自下而上的创新激活,培养关键人才,并重塑员工技能。 2. 构建 AI 监督与反馈机制: 建立异常监测机制,针对 AI 决策结果进行定期回顾,设立异常情况触发预警机制,避免因 AI 错误而导致决策失误。 在关键业务决策中设置人类干预节点,在 AI 给出初步建议后由人类进行审核和判断,特别是财务预测、市场扩展策略等核心业务决策应有清晰的人工复核流程。 企业可以引入“人机协作审查委员会”,由高层管理人员、业务线负责人和技术团队组成,每月审查 AI 关键决策的结果,设定触发条件(如连续三次异常预测)来判断是否需要人工干预。 3. 保留人类的创新与主导地位: 虽然 AI 能通过数据提供创新支持,但真正的突破性创新依然需要人类的参与,企业应明确 AI 是助力而非替代。在中国市场,创新是企业保持竞争优势的关键,过度依赖 AI 可能会削弱员工的创新力和主动性。 设立创新实验室,让 AI 提供背景数据和支持,员工在此基础上进行创意开发,AI 可以生成基础创意,员工进行拓展和跨领域应用。 进行跨部门协作,创建多样化团队,整合市场、技术和创意团队的力量,让 AI 提供洞察和辅助,具体决策由团队中的人类成员作出。 企业可以设立“AI 创新月”,每月让不同部门提出与 AI 相关的创新方案,要求员工结合 AI 的分析提出创意,而非直接采用 AI 方案,以培养团队的创新能力,避免 AI 的全权主导。
2025-03-12
适合企业的AI AGENT
以下是一些适合企业的 AI Agent 相关信息: 影刀 RPA + AI Power: 功能亮点:集成丰富的 AI 组件及技能组件,如搜索引擎组件可让 AI 接入互联网获取实时信息,RPA 组件可直接调用影刀 RPA 客户端应用实现自动化操作,突破大模型的限制。 无缝多样的使用方式:提供网页分享、对话助理、API 集成等嵌入方式,方便企业在不同业务场景下灵活选择接入方式,打通分散的系统,实现便捷交互。 贴身的企业级服务支持:提供教学培训、技术答疑、场景共创等贴身服务,帮助企业把产品用起来,实现 AI 落地。 其他 Agent 构建平台: Coze:新一代一站式 AI Bot 开发平台,集成丰富插件工具拓展 Bot 能力边界。 Microsoft 的 Copilot Studio:具备外挂数据、定义流程、调用 API 和操作等功能,并能将 Copilot 部署到各种渠道。 文心智能体:百度推出的基于文心大模型的智能体平台,支持开发者打造产品能力。 MindOS 的 Agent 平台:允许用户定义 Agent 的个性、动机、知识,以及访问第三方数据和服务或执行工作流。 斑头雁:2B 基于企业知识库构建专属 AI Agent 的平台,适用于客服、营销、销售等场景,提供多种成熟模板。 钉钉 AI 超级助理:依托钉钉优势,在处理高频工作场景如销售、客服、行程安排等方面表现出色。 在智变时代,Microsoft 也推出了 Copilot 产品的升级,如 Copilot Team 与 Studio,让 Agent 融入企业内部,自动化日常工作。软件应用范式已转移,AI Agent 成为新 SaaS。您可以根据自身需求选择适合的平台。
2025-03-11
AI可以协助制造业企业做哪些工作
AI 可以协助制造业企业完成以下工作: 1. 产品设计和开发:利用 AI 生成工具如 Adobe Firefly、Midjourney 等,根据文字描述快速生成产品的 3D 模型、渲染图、插图等设计元素,提高产品设计效率。 2. 工艺规划和优化:结合大语言模型的自然语言处理能力,自动生成制造工艺流程、设备选型、质量控制等方案,优化生产过程。 3. 设备维护和故障诊断:通过分析设备运行数据,预测设备故障,并自动生成维修建议,提高设备可靠性。 4. 供应链管理:根据历史数据和市场变化,自动生成采购计划、库存预测、物流优化等内容,提高供应链管理效率。 5. 客户服务:基于对话模型的 AI 客服机器人,自动生成个性化的客户回复,提升客户体验。 此外,在制造业中,AI 还能用于预测性维护,帮助工厂避免停机;进行质量控制,检测产品缺陷以提高产品质量;优化供应链,提高效率和降低成本;控制工业机器人,提高生产效率;以及协助生产计划和供应链计划状态查询、产线预测性维保辅助、产品质量分析与溯源等工作。
2025-03-10
我是IVD企业的技术中心主任,我想构建我们技术中心的知识库,有什么AI工具可以帮我实现
以下是一些可以帮助您构建技术中心知识库的 AI 工具及相关步骤: Dify 1. 准备数据:收集需要纳入知识库的文本数据,包括文档、表格等格式,并对数据进行清洗、分段等预处理,确保数据质量。 2. 创建数据集:在 Dify 中创建新的数据集,上传准备好的文档,并为数据集编写清晰的描述,说明其包含的内容和特点。 3. 配置索引方式:Dify 提供了高质量模式、经济模式和 Q&A 分段模式三种索引方式,您可根据实际需求选择,如追求更高准确度可选高质量模式。 4. 集成至应用:将创建好的数据集集成到 Dify 的对话型应用中,作为应用的上下文知识库使用。在应用设置中,配置数据集的使用方式,如是否允许跨数据集搜索等。 5. 持续优化:收集用户反馈,对知识库内容和索引方式进行持续优化和迭代,定期更新知识库,增加新内容以保持时效性。 其他相关场景和应用 1. 提示词帮您规划 PARA 分类模式:PARA 代表项目(Projects)、领域(Areas)、资源(Resources)和档案(Archives)。AI 可通过分析您的工作模式和内容类型,自动生成提示词,帮助您将信息和知识分类到 PARA 的相应部分,简化分类过程,更快组织和检索信息。 2. 提示词帮您设计笔记标签系统:AI 能通过分析您的笔记内容和使用习惯,推荐合适的标签和标签结构,提高笔记管理和检索效率。 3. 知识助手 Bot 帮您渐进式积累领域知识:例如基于 dify.ai 将数百个思维模型整合成一个知识库,根据不同的对话和条件判断为用户选择适用的思维模型分析工具,封装成一个智能分析的 Bot,能根据您的学习进度和兴趣点,定期推送相关文章、论文和资源,持续扩展知识边界并确保知识及时更新。
2025-03-09
企业级rag系统开发框架
企业级 RAG 系统开发框架如下: 首先,通过数据预处理引擎(如 Unstructured)将企业无结构文件(如 PDF、幻灯片、文本文件)从数据孤岛(如 Google Drive 和 Notion)加载、转换为 LLM 可查询格式,并将这些文件“分块”成更小的文本块,以实现更精确的检索,然后作为向量嵌入和存储在数据库(如 Pinecone)中。 当用户提出问题时,系统会检索语义上最相关的上下文块,并将其折叠到“元提示”中,与检索到的信息一起馈送给 LLM。LLM 会从检索到的上下文中合成答复返回给用户。 在实际生产中,AI 应用程序具有更复杂的流程,包含多个检索步骤和“提示链”,不同类型的任务并行执行多个“提示链”,然后将结果综合在一起生成最终输出。 RAG 是检索增强生成(Retrieval Augmented Generation)的简称,概括起来是知识检索+内容生成,主要组成包括数据提取、embedding(向量化)、创建索引、检索、自动排序(Rerank)、LLM 归纳生成。其核心在于能否将内容检索得又快又准。 RAG 的优势在于: 大语言模型技术存在输出结果不可预测、知识有截止日期、无法满足实际业务需求等问题,而 RAG 可以让大模型从权威的、预先确定的知识来源中检索、组织相关信息,更好地控制大模型生成的文本输出,并且用户可以深入了解 LLM 如何生成最终的结果。 RAG 可以和微调结合使用,两者并不冲突。微调适用于模型需要复制特定的结构、样式或格式时,RAG 适用于模型需要回答特定的询问或解决特定的信息检索任务。但 RAG 不适合教模型来理解广泛的领域或学习新的语言、格式或样式。 同时,通用的基础大模型无法满足实际业务需求的原因包括: 知识的局限性:模型自身的知识源于训练数据,对于实时性、非公开或离线的数据无法获取。 幻觉问题:大模型基于数学概率的文字预测,存在提供虚假、过时、通用或低可信度信息的情况。 数据安全性:企业重视数据安全,不愿承担数据泄露风险将私域数据上传第三方平台训练。
2025-03-08