Chat with Wiki - 行业大模型构建

Answer

以下是关于行业大模型构建的相关信息：

优秀模型案例介绍：

SuperCLUE2.0 是通用大模型综合性测评基准 SuperCLUE1.0 的能力延展，融合行业场景属性和大模型落地特点，为行业应用及开发者构建评估框架，促进大模型供需两侧的进一步对齐。
SuperCLUE 持续构建行业测评基准，包括已发布的汽车行业测评基准，以及筹备中的金融、教育、娱乐、手机、政务、医疗等行业测评基准。
SuperCLUE 持续构建专项测评基准，已发布的有 Safety 安全测评基准、Agent 智能体测评基准，筹备中的有个性化中文测评基准、角色扮演测评基准、中文多模态测评基准、RAG 检索增强测评基准、办公场景测评基准等。

优化路径：广义上的大模型优化包括完整训练一个大模型，但从策略上建议先从提示词工程到微调开始，因为涉及大模型训练成本极高。在分析出问题所在后，可按需选用或综合运用缺失知识用 RAG、准确度或模式遵循度不足用微调等技术进行性能优化。

国内大模型落地情况：

Gartner 预测到 2028 年至少有 15%的日常工作决策将由代理型 AI（AI 智能体）自主做出。
2024 年被称为国内大模型落地元年，“百模大战”后，国内大模型行业主要玩家包括百度、阿里、字节等科技大厂和创业“AI 六小虎”。
2024 年 1 至 11 月，国内大模型中标项目数量和金额大幅增长，中标项目共 728 个，是 2023 年全年的 3.6 倍；中标金额 17.1 亿元，是 2023 年全年的 2.6 倍。中标项目数前五的行业分别是运营商、能源、教育、政务、金融。
厂商方面，百度以 40 个中标项目数、2.74 亿元的中标金额排名所有厂商之首，科大讯飞居第二。在金融行业，百度也以 14 个中标数量、3734.4 万元中标金额排名第一，科大讯飞居第二。

Content generated by AI large model, please carefully verify (powered by aily)

References

2023年度中文大模型基准测评报告.pdf

SuperCLUE2.0是通用大模型综合性测评基准SuperCLUE1.0的能力延展。在通用测评框架的基础上，融合行业场景属性和大模型落地特点，提供一个科学、准确、客观的大模型应用评估视角，为行业应用及开发者构建出大模型+业务的评估框架，促进大模型供需两侧的进一步对齐。行业基准SuperCLUE持续构建行业测评基准，多层次多维度的对行业大模型进行评价，为行业大模型的有效评估与落地应用提供指引。•汽车行业测评基准（已发布）•金融行业测评基准（筹备中）•教育行业测评基准（筹备中）•娱乐行业测评基准（筹备中）•手机行业测评基准（筹备中）•政务行业测评基准（筹备中）•医疗行业测评基准（筹备中）•......行业落地专项基准SuperCLUE持续构建专项测评基准，聚焦具体落地场景，深入专项任务大模型应用环节，辅助提升大模型应用效果。组件自动•Safety安全测评基准（已发布）调参•Agent智能体测评基准（已发布）•个性化中文测评基准（筹备中）•角色扮演测评基准（筹备中）•中文多模态测评基准（筹备中）•RAG检索增强测评基准（筹备中）•办公场景测评基准（筹备中）•......

3. 如何让 LLM 应用性能登峰造极

广义上的大模型优化还包括完整训练一个大模型，相信搞一个行业大模型出来是诸多老板梦寐以求的事情，虽然在战略上是势在必行，策略上还是建议先从提示词工程->微调开始，毕竟只要涉及大模型训练，太太烧钱了，没有足够的钱（至少几个亿？）和高质量的行业数据，建议慎重考虑。在分析出了问题所在后，我们可以考虑使用相应的技术进行性能优化，缺失知识可以考虑用RAG，准确度不足或模式遵循度不足可以考虑微调。实际应用中这些技术并不是非此即彼的关系，也不是递进关系，他们都只是解决特定问题的手段，按需选用即可，也可以综合运用以最大化性能。

国内大模型落地“狂飙”一年，各家厂商成绩如何？

Gartner《2025年十大战略技术趋势》中预测，到2028年至少有15%的日常工作决策将由代理型AI（AI智能体）自主做出。2024年，AI大模型在生产和生活中正以“狂飙猛进“的速度落地。“百模大战”过后，国内大模型行业基本跑出了以百度、阿里、字节等科技大厂和创业“AI六小虎”为主要玩家的竞争格局。2024年被称为国内大模型落地元年，经过一年时间的赛跑，各家大模型在各行各业的落地成绩究竟如何？2024年国内大模型项目增3.6倍，百度中标数量和金额双第一各厂商公布的大模型调用数据固然是一个成绩参考，但是让企业客户为大模型买单掏出的真金白银数量无疑是更为直观的成绩。根据云头条统计公开可查的大模型招投标项目数据，2024年国内大模型中标项目数量和金额都呈现大幅度增长。2024年1至11月，大模型中标项目共728个，是2023年全年的3.6倍；中标金额17.1亿元，是2023年全年的2.6倍。大模型中标项目数前五的行业分别是运营商、能源、教育、政务、金融。厂商方面，百度以40个中标项目数、2.74亿元的中标金额排名所有厂商之首，科大讯飞居第二。再看各细分行业，在金融行业，根据2024年1-11月份金融机构发起的大模型相关采购中标项目来看，百度以14个中标数量、3734.4万元中标金额排名第一；科大讯飞居第二。