Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

2024大模型典型应用案例集

Answer

以下是 2024 大模型的一些典型应用案例及相关信息:

  • 《2024 大模型典型示范应用案例集》汇集了 97 个优秀案例,展示了大模型技术在教育、医疗、金融、政务等多个行业和领域的应用。案例由阿里云、百度、华为等领先企业实施,上海成为应用落地的热点地区,大中型企业是主要试验场。AI 智能体和知识库成为提升大模型落地实效的关键手段。
  • 在智能终端行业,中国超半数手机厂商都在使用文心大模型,包括三星、荣耀、vivo、OPPO、小米等主流手机品牌;上汽大众、吉利汽车、蔚来汽车、长安汽车等十余家车企已接入百度文心大模型。
  • 整体来看,在主流大模型厂商中,百度表现突出,拿下最关键的中标项目数量、中标金额两项第一。截至 11 月,其文心大模型日均调用量超过 15 亿次,千帆平台帮助客户精调了 3.3 万个模型、开发了 77 万个企业应用。今年三季度财报披露,百度智能云营收达 49 亿元,同比增长 11%,其增长主要由互联网、教育、金融等行业对模型训练和推理的高需求带动。
  • 企业想要真正将大模型在自身场景落地,需要具备构建算力、数据治理、模型训练、场景落实、应用搭建、持续运营、安全合规等整套能力。
  • 相关报告:
    • 《信达证券:AI 行业设计领域专题报告:Adobe AI 功能覆盖全面,Canva、美图等力争上游》
    • 《中国信通院:大模型基准测试体系研究报告(2024 年)》
    • 《埃森哲:人工智能行业:2024 在生成式人工智能时代重塑工作、劳动力和员工》

此外,还有一些相关活动,如:

  • 2024 年是国内大模型技术加速落地的关键年份,各大厂商如百度、阿里、字节等在 AI 大模型领域展开激烈竞争。百度凭借 40 个中标项目和 2.74 亿元中标金额在行业中处于领先地位。尤其在金融、智能终端等行业,百度文心大模型的应用广泛,表现亮眼。
  • 🏮「非遗贺春」魔多蛇年春节 AI 模型创作大赛,大赛时间 2024 年 12 月 24 日-2025 年 1 月 15 日。大赛奖池【¥12000】现金奖励+官方高含金量荣誉证书+会员与算力激励+流量激励。双赛道同时开启,赛道一【春节】+赛道二【爱非遗 AI 传承】。本次活动由浙江省非遗保护中心(浙江省非遗馆)指导×浙江省非遗保护基金会主办×魔多 AI 联合承办,由WaytoAGI提供社区传播支持。
Content generated by AI large model, please carefully verify (powered by aily)

References

2024 年历史更新(归档)

《[2024大模型典型示范应用案例集](https://waytoagi.feishu.cn/record/UXgRrbKPue5a2McLLRBcobienQg)》汇集了97个优秀案例,展示了大模型技术在多个行业和领域的应用,如教育、医疗、金融、政务等。案例由阿里云、百度、华为等领先企业实施,体现了大模型在提升效率、降低成本、创新服务等方面的显著成效。上海成为应用落地的热点地区,大中型企业是主要试验场。AI智能体和知识库成为提升大模型落地实效的关键手段。这些案例为行业提供参考,推动大模型技术深入赋能实体经济,促进高质量发展。其它报告:《[信达证券:AI行业设计领域专题报告:Adobe AI功能覆盖全面,Canva、美图等力争上游](https://waytoagi.feishu.cn/record/K2jmr73Z8eLPt2cFQqmcE8WCnOc)》《[中国信通院:大模型基准测试体系研究报告(2024年)](https://waytoagi.feishu.cn/record/ImCAreDtfehepoc4aMCcVRmwn4d)》《[埃森哲:人工智能行业:2024在生成式人工智能时代重塑工作、劳动力和员工](https://waytoagi.feishu.cn/record/L5zgrgS3veYjV3c6i72cJ27xnxh)》

国内大模型落地“狂飙”一年,各家厂商成绩如何?

在智能终端行业,根据媒体报道,中国超半数手机厂商都在使用文心大模型,包括三星、荣耀、vivo、OPPO、小米等主流手机品牌;上汽大众、吉利汽车、蔚来汽车、长安汽车等十余家车企已接入百度文心大模型。整体来看,在主流大模型厂商中,百度表现突出,拿下最关键的中标项目数量、中标金额两项第一。根据百度披露的数据,截至11月,其文心大模型日均调用量超过15亿次,千帆平台帮助客户精调了3.3万个模型、开发了77万个企业应用。今年三季度财报披露,百度智能云营收达49亿元,同比增长11%,百度智能云的增长主要由互联网、教育、金融等行业对模型训练和推理的高需求带动。这与前文所述百度大模型中标行业相一致。2024年,百度在大模型落地交出的成绩单可谓亮眼。大模型时代,AI基础设施的正确范式事实上,大模型进入产业落地后,除了大模型本身能力质量要过硬外,落地应用所需要的全栈技术能力、工程化配套工具等等对落地效果有直接影响。企业想要真正将大模型在自身场景落地,需要具备构建算力、数据治理、模型训练、场景落实、应用搭建、持续运营、安全合规等整套能力。这也就意味着,在大模型落地赋能企业智能化时,能力比拼从单项变为全能比拼(大模型自身、工程能力、工具平台等)。大模型的竞争,正在加速成为体系化之战。

WaytoAGI近期活动备份

[国内大模型落地“狂飙”一年,各家厂商成绩如何?](https://waytoagi.feishu.cn/wiki/OYkswbydxixdCKkJLSbc1teknwc)丨百度领跑市场,AI基础设施加速产业化2024年是国内大模型技术加速落地的关键年份,各大厂商如百度、阿里、字节等在AI大模型领域展开激烈竞争。根据数据,2024年大模型中标项目数量和金额大幅增长,百度凭借40个中标项目和2.74亿元中标金额在行业中处于领先地位。尤其在金融、智能终端等行业,百度文心大模型的应用广泛,表现亮眼。大模型的落地不仅要求技术过硬,还需要全栈技术能力支持,包括算力、数据治理和应用开发等。百度智能云通过其完善的AI基础设施,整合全栈技术,获得了广泛的行业认可,成为大模型落地的领军者。🏮「非遗贺春」魔多蛇年春节AI模型创作大赛|大赛时间2024年12月24日-2025年1月15日🏆大赛奖池【¥12000】现金奖励+官方高含金量荣誉证书+会员与算力激励+流量激励🎈双赛道同时开启,赛道一【春节】+赛道二【爱非遗AI传承】💡期待你以AI助力非遗传承,参赛👉https://club.huixingyun.com/activity/7493989779944805834/?from=aicc-fy-waytoagi📝活动说明:[魔多蛇年春节AI模型创作大赛](https://waytoagi.feishu.cn/wiki/I960wZW1MiuOuEkBw7ncUxmknlg)本次活动由浙江省非遗保护中心(浙江省非遗馆)指导×浙江省非遗保护基金会主办×魔多AI联合承办,由[WaytoAGI](https://www.waytoagi.com/)提供社区传播支持

Others are asking
2024年人工智能指数报告 下载
以下是为您提供的 2024 年人工智能指数报告的相关下载信息: 1. 《》由微软和领英联合发布,揭示了人工智能(AI)在工作场所的快速增长和深远影响。 2. 可在知识星球下载的报告: 《》深入分析了 AI Agent 的市场定义、发展阶段、核心组件及其在企业用户场景中的应用。 《》企业实施 AI Agent 的主要目标是降低运营成本,尤其是在知识库管理、数据分析、营销与客户服务等领域。 3. 《》数据处理应从模型为中心转向数据为中心,并强调向量数据库在提升模型服务能力中的核心作用。 4. 斯坦福大学发布的基础模型透明度指数相关报告:在上一届 SOAI 发布后不久,斯坦福大学发布了其首个基础模型透明度指数,模型开发者的平均得分为 37 分。在团队的中期更新中,这一分数攀升至 58 分。2024 年 5 月,该指数的最新一期基于 100 项指标,评估了 14 家领先的基础模型开发者的透明度,这些指标涵盖“上游”因素数据、劳动力、计算、围绕能力和风险的“模型级”因素、围绕分布的“下游”标准以及社会影响。计算和使用政策的评分出现了最强劲的改善,而“上游”评分仍然疲弱。 5. 《2024 年人工智能现状:辉煌、戏谑和“牛市”》报告链接:
2025-01-11
2024年人工智能指数报告
以下是关于 2024 年人工智能指数报告的相关内容: 斯坦福大学发布的基础模型透明度指数显示,模型开发者的平均得分从最初的 37 分攀升至中期更新的 58 分。2024 年 5 月的最新一期基于 100 项指标评估了 14 家领先的基础模型开发者的透明度,其中计算和使用政策的评分改善强劲,“上游”评分仍疲弱。 2024 年 AI 年度报告的十大预测包括:好莱坞级别的制作公司开始使用生成式人工智能制作视觉特效;美国联邦贸易委员会或英国竞争与市场管理局基于竞争理由调查微软/OpenAI 的交易;在全球人工智能治理方面进展有限;一首由人工智能创作的歌曲进入公告牌 Hot 100 前 10 名或 Spotify 2024 年热门榜单;随着推理工作负载和成本的显著增长,一家大型人工智能公司收购或建立专注于推理的人工智能芯片公司。同时也有错误预测,如生成式人工智能媒体公司在 2024 年美国选举期间的滥用行为未受到调查,自我改进的人工智能智能体在复杂环境中未超越现有技术最高水平。 预测还覆盖了人工智能领域的多个方面,如主权国家向美国大型人工智能实验室投资超 100 亿美元引发国家安全审查;完全无编码能力的人创建的应用或网站走红;前沿实验室在案件审判后对数据收集实践方式发生重大转变;早期欧盟人工智能法案实施结果比预期宽松;开源的 OpenAI o1 替代品在推理基准测试中超越;挑战者未能突破英伟达市场地位;对人形机器人投资水平下降;苹果在设备上的研究成果加速个人设备上人工智能的发展;人工智能科学家生成的研究论文被主要机器学习会议或研讨会接受;以“生成式人工智能”为元素互动的视频游戏取得突破性地位。
2025-01-11
2024ai 大事记
以下是 2024 年 AI 大事纪的相关内容: 1 月: 斯坦福大学 Mobile Aloha。 1 月 10 号 LumaAl Genie 文生 3D。 1 月 11 号 GPT store 上线。 MagnificAl 高清放大爆火。 1 月最后一天苹果 Vision Pro 宣布发售。 3 月: 潞晨科技发布 OpenSora。 Suno 发布 V3 版本爆火。 4 月:英伟达发布硬件股价飙升。 5 月: 苹果发布 AI 芯片。 张吕敏发布 IC light。 7 月:快手开源 LivePortrait 模型,表情迁移。 8 月:StabilityAI 老板成立新公司发布 flux 大模型。 9 月: 阿里云发布模型,海螺 AI 参战。 Google 发布 GameGen 实时生成游戏。 通义千问 2.5 系列全家桶开源。 华为发布 cloud matrix 云计算基础设施。 GPT 高级语音模式上线。 Meta 发布 AI 眼镜 Orion。 AI 代码编辑器 cursor 爆火。 10 月: Pika 发布 1.5 模型。 诺奖颁发给 AI 奠基人。 特斯拉发布机器人。 Adobe 发布 Illustrator+Al 生成矢量图。 智谱 AI 发布 autoGLM。 腾讯混元开源 3D 模型。 云深处发布机器人山猫机器狗。 Apple 发布 Mac mini。 12 月: 李飞飞发布空间智能成果。 腾讯开源混元视频模型。 Open AI 开 12 天发布会。 微软发布 Trellis 最强开源图生 3D。 Gemini2.0 视觉交互智能体。 智元机器人开始量产。 谷歌发布 Veo2 能生成 4K 视频。 需要注意的是,本大事记经过一定筛选,带有一定倾向性,但不包含任何广告或其他商业考量,仅以新闻热度与大众反响为依据。仅代表个人看法,如有遗漏请谅解。
2025-01-10
2024AI 大事记
以下是 2024 年 AI 大事纪: 1 月: 斯坦福大学 Mobile Aloha 1 月 10 号 LumaAl Genie 文生 3D 1 月 11 号 GPT store 上线 MagnificAl 高清放大爆火 1 月最后一天苹果 Vision Pro 宣布发售 3 月: 潞晨科技发布 OpenSora Suno 发布 V3 版本爆火 4 月:英伟达发布硬件股价飙升 5 月: 苹果发布 AI 芯片 张吕敏发布 IC light AI 竞争白热化 伊莉雅离开 OpenAI,伊利亚成立新公司,估值超五亿美金 7 月:快手开源 LivePortrait 模型,表情迁移 8 月:StabilityAI 老板成立新公司发布 flux 大模型 9 月: 阿里云发布模型,海螺 AI 参战 Google 发布 GameGen 实时生成游戏 通义千问 2.5 系列全家桶开源 华为发布 cloud matrix 云计算基础设施 GPT 高级语音模式上线 Meta 发布 AI 眼镜 Orion AI 代码编辑器 cursor 爆火 10 月: Pika 发布 1.5 模型 诺奖颁发给 AI 奠基人 特斯拉发布机器人 Adobe 发布 Illustrator+Al 生成矢量图 智谱 AI 发布 autoGLM 腾讯混元开源 3D 模型 云深处发布机器人山猫机器狗 Apple 发布 Mac mini 12 月: 李飞飞发布空间智能成果 腾讯开源混元视频模型 Open AI 开 12 天发布会 微软发布 Trellis 最强开源图生 3D Gemini2.0 视觉交互智能体 智元机器人开始量产 谷歌发布 Veo2 能生成 4K 视频 宇树科技机器狗爆火,似奔着打架去 SORA 兑现引关注,被测试出奇怪问题 需要说明的是,本大事记经过一定筛选,带有一定倾向性,但不包含任何广告或其他商业考量,仅以新闻热度与大众反响为依据。仅代表个人看法,如有遗漏请谅解。
2025-01-10
2024ai大事件
以下是 2024 年 AI 领域的大事纪: 1 月: 斯坦福大学 Mobile Aloha 1 月 10 号 LumaAl Genie 文生 3D 1 月 11 号 GPT store 上线 MagnificAl 高清放大爆火 1 月最后一天苹果 Vision Pro 宣布发售 3 月: 潞晨科技发布 OpenSora Suno 发布 V3 版本爆火 4 月:英伟达发布硬件股价飙升 5 月: 苹果发布 AI 芯片 张吕敏发布 IC light AI 竞争白热化,伊莉雅离开 OpenAI 并成立新公司,估值超五亿美金 7 月:快手开源 LivePortrait 模型,表情迁移 8 月:StabilityAI 老板成立新公司发布 flux 大模型 9 月: 阿里云发布模型,海螺 AI 参战 Google 发布 GameGen 实时生成游戏 通义千问 2.5 系列全家桶开源 华为发布 cloud matrix 云计算基础设施 GPT 高级语音模式上线 Meta 发布 AI 眼镜 Orion AI 代码编辑器 cursor 爆火 10 月: Pika 发布 1.5 模型 诺奖颁发给 AI 奠基人 特斯拉发布机器人 Adobe 发布 Illustrator+Al 生成矢量图 智谱 AI 发布 autoGLM 腾讯混元开源 3D 模型 云深处发布机器人山猫机器狗 Apple 发布 Mac mini 12 月: 李飞飞发布空间智能成果 腾讯开源混元视频模型 Open AI 开 12 天发布会 微软发布 Trellis 最强开源图生 3D Gemini2.0 视觉交互智能体 智元机器人开始量产 谷歌发布 Veo2 能生成 4K 视频 需要注意的是,本大事记经过一定筛选,带有一定倾向性,但不包含任何广告或其他商业考量,仅以新闻热度与大众反响为依据。仅代表个人看法,如有遗漏请谅解。
2025-01-09
2024年《全球人工智能治理研究报告》议题“国家主权原则和人工智能发展”的内容及理解
以下是 2024 年《全球人工智能治理研究报告》中关于“国家主权原则和人工智能发展”的相关内容: 在 2024 年人工智能发展状况的安全与全球治理方面: 英国创建了世界上第一个人工智能安全研究所(AISA),其有三个核心功能:在部署前对高级模型进行评估;建立国家能力并开展研究;协调国际合作伙伴。AISA 还发布了 Inspect 框架用于 LLM 安全评估。英国宣布与美国等效机构签署谅解备忘录,并计划在美国旧金山设立办事处。 英国通过其高级研究与发明机构(ARIA),花费 5900 万英镑开发“守门员”系统,负责了解和减少关键领域中其他人工智能代理的风险。英国政府还计划设立“AI 安全研究实验室”,旨在汇集政府关于敌对国家使用进攻性 AI 的知识。美国能源部利用内部测试床评估人工智能对关键基础设施和能源安全的风险。 在技术和方法方面: 离线直接比对方法不会很快大规模取代 RLHF。谷歌 DeepMind 团队发现 RLHF 在涵盖总结、有用性、对话性等数据集上的测试中胜出,能更有效地改善生成任务。Cohere for AI 探索放弃近端策略优化 RLHF 中的算法,有利于其 RLOO 训练器,可降低 GPU 使用率和提高训练速度。 但 RLHF 存在可能滋生谄媚行为的问题,如 Anthropic 认为 SOTA AI 助手表现出奉承行为是因为人类偏好数据等。开发透明度虽在提高,但仍有很大改进空间。 在安全研究方面: 随着 AI 发展,新功能带来新漏洞,开发人员加大了对“越狱”的研究。OpenAI 提出通过“指令层次结构”修复攻击,Anthropic 表明“警告防御”的潜力,Gray Swan AI 的安全专家试用“断路器”。LLM 测试初创公司 Haize Labs 与 Hugging Face 合作创建首个红队抵抗组织基准。除越狱外,还存在更隐蔽的攻击,潜在攻击面广泛,涵盖从训练到偏好数据和微调等内容。 对于“国家主权原则和人工智能发展”的理解,可能需要综合考虑各国在人工智能安全研究和治理方面的举措,以及技术发展对国家主权可能产生的影响。各国积极建立相关机构和采取措施,表明在人工智能快速发展的背景下,维护国家主权和安全的重要性。同时,技术发展中的问题和挑战也需要各国共同协作应对,以实现人工智能的健康、安全和可持续发展。
2024-12-31
消费行业ai案例
以下是一些消费行业的 AI 案例: 《2024 生成式 AI 商业落地白皮书》由火山引擎、RollingAI 和 InfoQ 研究中心联合发布,为 CXO 提供 AI 转型战术指南。书中通过 240 个应用场景地图,展示了 AI 在消费零售等行业的落地案例,探讨了 AI 基础设施构建、项目落地准备和快速补齐能力差距等关键问题,并提出了八步实施大模型接入的方法论。 关于 AI 的最强大之处之一是它能使产品个性化用户体验。这方面的早期应用已经出现在教育科技和搜索中,预计这种定制将是许多 AI 启用产品的核心价值主张。 此外,人工智能在汽车行业也有广泛应用: 自动驾驶技术:利用 AI 进行图像识别、传感器数据分析和决策制定,自动驾驶汽车能够自主导航和驾驶。 车辆安全系统:AI 被用于增强车辆的安全性能,如自动紧急制动、车道保持辅助和盲点检测系统。 个性化用户体验:AI 可以根据驾驶员的偏好和习惯来调整车辆设置。 预测性维护:通过分析车辆的实时数据,AI 可以预测潜在的故障和维护需求。 生产自动化:在汽车制造过程中,AI 被用于自动化生产线,提高生产效率和质量控制。 销售和市场分析:汽车公司使用 AI 来分析市场趋势、消费者行为和销售数据。 电动化和能源管理:AI 在电动汽车的电池管理和充电策略中发挥作用。 共享出行服务:AI 支持的共享出行服务,使用 AI 来优化路线规划、调度车辆和定价策略。 语音助手和车载娱乐:AI 驱动的语音助手允许驾驶员通过语音命令控制车辆功能、获取信息和娱乐内容。 车辆远程监控和诊断:AI 系统可以远程监控车辆状态,提供实时诊断和支持。
2025-01-14
使用 AI 生成的案例研究或模拟场景
以下是一些使用 AI 生成的案例研究或模拟场景: 在 3D 模型生成中,AI 可直接完成可调整的 3D 粗模,提升美术工作流效率。 在游戏测试环节,AI 存在 3 大模拟场景,包括 AI 玩家模拟、AI NPC 和 AI 游戏模型测试,在优化环节承担改善角色动画等功能。 在游戏设计中,AI 依托自然语言生成用法生成角色与故事,训练智能 NPC。 在音乐与音效方面,AI 生成音乐有基于乐理规则的符号生成模型和基于音频数据的音频生成模型两种主流技术路线,可用于游戏制作。 在测试用例方面,基于模型的测试生成有状态模型和场景模拟,如 GraphWalker、Spec Explorer 等工具,以及 Testim、Test.ai 等平台的应用示例。 在 AI+游戏场景中,有“从游戏截图升级到 KV 品质,AI 居然可以这样用!”“《LORA 模型训练超入门级教程》人人都可以当炼金术士”“人人可以做原画,如何运用 Midjourney+Stable Diffusion 进行角色原画设计”等案例。
2025-01-13
AI数据分析的案例
以下是一些 AI 数据分析的案例: ChatGPT 助力数据分析 在 AI 爆炸的时代,ChatGPT 与数据分析结合有多种应用方式。 实现方式: 1. SQL 分析:分析平台自身的使用情况,例如图表配置化平台,输入一句话可分析用户配置图表相关的数据。 2. 个性化分析:平台上支持上传数据,可提供数据信息(非必填),以此自定义分析用户自己上传的数据。 流程: 1. SQL 分析:用户描述想分析的内容,后台连接 DB,附带表结构信息让 AI 输出 SQL 语句,校验是 SELECT 类型的 SQL,其他操作如 UPDATE/DELETE 绝不能通过!校验通过后执行 SQL 返回结果数据。再将数据传给 ChatGPT(附带上下文),让其学习并分析数据,最后输出分析结论和建议,和结果数据一起返回给前端页面渲染图表、展示分析结论。目前已实现两张表关联查询。 2. 个性化分析:用户上传文件,如有需要可以简单描述这是什么数据、字段意义或作用辅助分析。前端解析用户上传的文件,再传给 ChatGPT 分析数据,后续步骤与 SQL 分析一致。 专利审查方面的 AI 1. 专利趋势分析和预测:AI 可以分析大量的专利数据,识别技术发展趋势和竞争情报,帮助企业和研究机构制定战略决策。 示例平台: Innography:利用 AI 技术分析专利数据,提供技术趋势分析和竞争情报。 PatSnap:AI 驱动的平台,分析专利数据和技术趋势,提供全面的专利情报和市场分析。 2. 具体 AI 应用示例: Google Patents:使用 AI 技术进行专利文献的全文检索和分析。通过机器学习算法,系统可以理解专利文献的内容,并提供相关性更高的检索结果。优点是提高了专利检索的准确性和效率,用户可以快速找到相关的专利文献。 IBM Watson for IP:利用 NLP 和机器学习技术,自动化地进行专利检索、分类和分析。系统可以自动提取专利文献中的关键信息,并对专利的技术内容进行分类和评估。优点是减少了人工工作量,提高了专利审查的效率和准确性。 使用这些平台的步骤: 1. 注册和登录:在对应的平台上注册账户并登录。 2. 上传专利文献:上传待审查的专利文献或输入检索关键词。 3. 选择分析功能:根据需要选择专利检索、分析、评估或生成功能。 4. 查看结果和报告:查看 AI 生成的检索结果、分析报告和评估结果。 5. 进一步处理:根据分析结果进行进一步的人工审查和处理,或者直接生成专利申请文件。 总结:AI 技术在专利审查领域的应用,可以极大地提高工作效率,减少人工工作量,提高专利检索、分类和分析的准确性和效率。上述平台和工具展示了 AI 在专利审查各个环节的具体应用,帮助专利审查员和申请人更高效地处理专利相关事务。但请注意,内容由 AI 大模型生成,请仔细甄别。
2025-01-09
AiGc动画案例分享
以下为一些 AIGC 动画的案例分享: 伊利 QQ 星 AI 动画项目: 项目前期:进行沟通报价、确定方向和内容并写脚本,脚本创作可借助 AI 但要有自己想法。 项目中期:根据脚本出图,采用 MJ、SD、GPT 出图,涉及产品融入、合成等操作,同时进行剪辑、配乐等工作,还提及配音等相关经验。 项目后期:做项目总结,复盘优缺点。 AIGC 商业广告: 制作前期:先定框架,包含定向、写脚本,确定内容呈现形式、调性、风格和人物设定等。 制作中期:根据脚本出图,同步剪辑,收集音效配音,如遇到跑图中带文字乱掉等问题可进行 AI 处理和产品跟踪。 制作后期:对现有视频进行优化,做字体包装和跟踪字体。 ANIME ROCK, PAPER, SCISSORS 动画: 这是一个通过绿幕动作捕捉,在虚幻中制作虚拟场景,然后通过 Stable Diffusion 生成的动漫。120 个视觉特效镜头由一个 3 人小组在一秒钟内完成。 制作过程中使用的主要工具为:Stable Diffusion 模型+DreamBooth 微调、虚幻引擎+资产存储 3D 模型、Img2Img+DeFlickering 效果、大量的老式的 VFX 合成。 视频的制作步骤包括:训练模型复制特定风格、训练一个 LoRA 模型来认识一个角色、通过 img2img 处理绿屏动捕的视频、使用 Deflicker 插件减少闪烁、在虚幻 5 中添加 3D 元素、在 Resolve 中进行最终 VFX 合成/编辑。为了最后的打磨,添加了大量老式视觉特效,如强调运动的速度线、模拟电影摄像机/单元格动画的发光体、虚幻中的动态元素(如蜡烛)、设置室内气氛的体积光射线、编辑和设计声音。 在配音方面,商业片子做好配音很重要,普通话不标准时花钱找人配音比 AI 配音效果好。在字体方面,字体包装在视频中很重要,很多人在这方面常犯错,如温馨画面加黑色描边字体。在 AI 动态的后期包装与剪辑技巧方面,后期包装思路可通过添加光效渲染氛围,对素材进行跟踪以替换产品,还可进行素材叠加。剪辑在 AI 动画中占比 45%,好的剪辑师能将素材处理得更好,不成熟的剪辑师可能会把好素材搞砸。镜头主接需注意景别丰富,如全景、中景、特写、近景等。在空间关系中存在轴线问题,如人物位置突然变化会导致视觉跳跃,还有关系轴线和运动轴线,越轴会让观众观感不适。AI 动画的调色流程方面,对色彩有特别要求可在达芬奇里完成剪辑调色流程,简单调色可在剪映中通过肉眼大致判断校正颜色,剪映中有色轮和曲线可用于调色。
2025-01-08
有没有ai制作海报的软件或者网站,最好能理解案例图片的
以下是一些可以用 AI 制作海报的软件和网站,并为您附上相关案例和使用方法: 1. 无界 AI: 网址:https://www.wujieai.cc/ 做图逻辑类似于 SD,优势在于国内网络即可稳定使用,有免费出图点数,支持中文关键词输入,无需额外下载风格模型,可直接取用。 应用场景示例:朋友圈 po 图,画幅比例选择 1:1。 皮克斯卡通模型位置:二次元模型》模型主题》皮克斯卡通。 关键词类别:场景(如向日葵花田、面包店等)、氛围(如温馨、温暖等)、人物(如父亲和女儿、父亲和儿子)、造型(如发型、发色、服饰、配饰)、情绪(如笑得很开心、大笑、对视等)、道具(如童话书等)、构图(如半身、中景等)、画面(色彩明艳)。 2. Canva(可画): 网址:https://www.canva.cn/ 是一个非常受欢迎的在线设计工具,提供大量模板和设计元素,用户可通过简单拖放操作创建海报,其 AI 功能可帮助选择合适颜色搭配和字体样式。 3. 稿定设计: 网址:https://www.gaoding.com/ 稿定智能设计工具采用先进人工智能技术,自动分析和生成设计方案,稍作调整即可完成完美设计。 4. VistaCreate: 网址:https://create.vista.com/ 简单易用的设计平台,提供大量设计模板和元素,用户可使用 AI 工具创建个性化海报,智能建议功能可帮助快速找到合适设计元素。 5. Microsoft Designer: 网址:https://designer.microsoft.com/ 通过简单拖放界面,用户可快速创建演示文稿、社交媒体帖子和其他视觉内容,还集成丰富模板库和自动图像编辑功能,如智能布局和文字优化,大大简化设计流程。 此外,还有东阿阿胶的海报设计案例分享: 1. 拆解步骤:得到需求 提取元素 绘制线稿 用 controlnet 转绘上色 ps 优化 定稿。 2. 需求元素:风格要潮流插画,还要有唐代元素和国潮(前期基本上是沟通成本,主要定线稿)。 3. 提取元素:获取的信息需要体现产品图,需要体现唐代元素,需要 logo 在中心位置,按照需求开始绘制线稿。 4. 线稿绘制:沟通的元素是牡丹花,驴子(最后换成了琵琶),人参和产品图和 logo,所以进行线稿调整绘制(中间很多细节沟通)最终定下线稿(里面很多元素都是拼接的)。 5. 拆分元素线稿:这一步非常重要,因为会涉及到后续元素替换等问题,比如单个 logo,产品等,提取出单独元素,进行绘制,最后进行替换。 6. 单个元素绘制:这样会让单个元素更加精致,也方便后期替换。 7. 然后利用拼接好的线稿进行大量跑图抽卡,选出一张最合适的进行 ps 优化。 8. 整体拼接上色后的效果(将单独跑的元素在 ps 里替换优化,再过一遍 sd 进行溶图放大)得到以下效果。 9. 最终客户把驴子去掉了,换成了一把琵琶,也是同产品图一样的做法,最后把琵琶替换掉驴子,得到定稿图。 上色运用的大模型:GhostMix 鬼混_V2.0 lora 模型:"盒子系列——平面国潮插画_v1.0:182ba9e2f576 controlnet 模型:"Module:lineart_coarse,Model:contr"
2025-01-07
最近Agent方面的场景案例
以下是一些关于 Agent 方面的场景案例: 1. 吴恩达最新演讲中提到的四种 Agent 设计范式: Reflection(反思):例如让用 Reflection 构建好的 AI 系统写代码,AI 会把代码加上检查正确性和修改的话术再返回给自己,通过反复操作完成自我迭代,虽不能保证修改后代码质量,但效果通常更好。 Tool Use(工具使用):大语言模型调用插件,极大拓展了 LLM 的边界能力。 Planning(规划):属于比较新颖且有前景的方式。 Multiagent(多智能体):也具有发展潜力。 2. Ranger 文章中的相关内容: Agent 被认为是大模型未来的主要发展方向。 中间的“智能体”通常是 LLM 或大模型,通过为其增加工具、记忆、行动、规划这四个能力来实现。 行业里主要用到的是 langchain 框架,它在 prompt 层和工具层完成主要的设计,将 LLM 与 LLM 以及 LLM 与工具进行串接。 3. 从词源和历史变迁来看: 在不同时期,“Agent”在商业、政府、情报、娱乐、体育等领域都有重要角色,涵盖贸易代理、公司代理商、情报特工、艺人经纪人等多种职业。 “Agent”一词具有行动和替身的含义,多数情况下指“拥有行动的替身,替代他人做某事”。
2025-01-07
可以改变视频人物说话内容 的模型
以下是一些可以改变视频人物说话内容的模型及相关信息: 解梦新出的 p 模型支持人物多动作和变焦,易改变画风;s 模型生成速度快、积分消耗少,能保持原始画风但语义理解有限。 吉梦的对口型技术支持文本朗诵和本地配音,能根据输入生成人物开口讲话的视频,但有上传人物长相等限制。 Runway 的 GN3 模型支持上传视频并转换风格,可用于实现多元宇宙等风格穿梭的片子,也能将简单场景转换为难以拍摄的场景。 在角色生视频方面: 角色生视频突破关键帧限制,不再依赖关键帧输入,而是直接传入角色本身,可更灵活生成视频。 支持多角色参考生成创意视频,可上传多张图,最多三张,将人物、衣服、背景等元素融合生成视频。 不同工具的角色生视频效果有所不同,如 Runway 的 x one 在身体、头部、眼神动态上表现更好。 角色生视频的应用场景包括规避机器人念台词的尴尬瞬间,让机器人有更丰富的表情和神态。未来视频生成将摆脱纯关键帧方式,采用多模态信息输入,如定义角色和场景的三视图等。 此外,谷歌 Gemini 模型在处理视频相关问题时,可通过修改提示来改变模型的行为。
2025-01-16
个人知识库与大模型如何结合
个人知识库与大模型的结合是一个关键问题。目前大模型在通用知识方面表现出色,但对专业领域知识了解有限。将两者结合有以下 5 种方法: 1. 重新训练:使用私域数据重新训练大模型。 2. 微调:利用私有数据对大模型进行 finetuning。 3. RAG:将知识库里的知识搜索送进大模型。 4. 关键词工程:写好提示词。 5. 加长 Context:当 Context 能无限长时,理论上可将个人知识和记忆都 prefill 到 Context 里。 对于哪种方法最有希望,学术界存在分歧。做深度学习的人偏向于用 RAG,而以前做过搜索的人则偏向于用 Long Context。有人认为最终会采用仿生的方法,即拥有一个足够长的 Context,例如谷歌的一篇论文 infinite context transform 提到,不需要把 Context 做得太长,可以将以前可能需要被扔掉的 token 深度压缩后依然保存在 Context 里。 此外,运行一个几百亿个参数的大模型,存算一体的架构是最佳选择,因为能避免所有数据的搬运。使用存算一体的方式也是未来 AI 硬件的发展趋势。
2025-01-16
总结一下大模型数据发展的最新趋势,基于历史的事实和数据总结23年以来发生了什么,25年可能发生什么
以下是关于大模型数据发展趋势的总结: 2023 年以来: 大量创新大模型架构涌现,尝试在保留 Transformer 优势的同时解决其算力开销太高的问题,对 Transformer 的绝对统治地位形成有力挑战。 多种有代表性的技术路径出现,如类循环神经网络模型(以 RWKV 为代表)、状态空间模型(以 Mamba 为代表)、层次化卷积模型(以 UniRepLKNet 为代表)、多尺度保持机制模型(以 RetNet 为代表)、液体神经网络模型(以 LFM 为代表)等。这些模型在不同程度保留 Transformer 架构优势的基础上,结合 RNN、CNN 等思想做出创新发展,使得大模型架构呈现出日益明显的混合趋势,更多创新架构具备“博采众家之长”的特点。 对于 2025 年的预测,由于目前的信息有限,难以给出确切的预测。但可能会在现有创新架构的基础上进一步优化和融合,出现更高效、更强大且更具通用性的大模型架构,同时可能在技术应用和行业落地方面取得更显著的成果。
2025-01-16
人机交互模型
目前大模型在人机交互方面可能存在以下三种模式: 1. 以人为主导,大模型提供建议(copilot 阶段):如同副驾驶,在人做决策时提供建议,决定权在人手中。 2. 人和大模型协同工作,合作完成同一个工作(embedding 阶段):在实际工作场景中,部分小环节可由大模型完成,能提高工作效率。 3. 人指挥大模型工作(数字员工阶段):此阶段较为少见,大模型目前还不能完全独立完成具体工作,可能是工程问题或自身能力欠缺所致。 个人观点认为,当下应努力将大模型从简单提供建议转变为深度融入工作流,而数字员工阶段尚不成熟,可由其他大厂和学界先行尝试。 此外,每一次平台型技术的出现都会催生新的人机交互方式。如在智能时代,我们曾认为 ChatGPT 的 LUI(自然语言对话式界面)是交互终点,但并非如此。知名科幻电影 HER 中人类与 AI 全感知无障碍的对话形式才是我们所期望的。 OpenAI 发布的 GPT4o 是其之前所有技术的集大成者,采用新的全模态模型Omnimoda Model。通过端到端的神经网络,将视觉、语音和文本数据混合训练,而非常见的先转换为文本再处理的工程手段。GPT4o 对音频输入的平均反应时间为 300 毫秒,与人类相似,且能从音频数据中感悟人类的情绪、语调、风格等,甚至还原训练时的环境声音。但 OpenAI 未公开 GPT4o 的技术细节,唯一线索来自内部模型炼丹师的一篇博客,项目名是 AudioLM,2023 年中启动,目标是用端到端的方式扩大语音模型的能力。
2025-01-15
模型下载
以下是关于模型下载的相关信息: ComfyUI BrushNet 模型下载: 原项目:https://tencentarc.github.io/BrushNet/ 插件地址:https://github.com/kijai/ComfyUIBrushNetWrapper 模型下载:https://huggingface.co/Kijai/BrushNetfp16/tree/main 第一次运行会自动下载需要的模型,如果使用 ComfyUIBrushNetWrapper 节点,模型将自动从此处下载:https://huggingface.co/Kijai/BrushNetfp16/tree/main 到 ComfyUI/models/brushnet。 因环境问题,也可手动下载后放在这个文件夹里面。另外,BrushNet 提供了三个模型,个人测试下来,random 这个效果比较好。 SD 模型下载: 常用的模型网站有: 下载模型后需要将之放置在指定的目录下,不同类型的模型放置目录不同: 大模型(Ckpt):放入 models\\Stablediffusion VAE 模型:一些大模型需要配合 vae 使用,对应的 vae 同样放置在 models\\Stablediffusion 或 models\\VAE 目录,然后在 webui 的设置栏目选择。 Lora/LoHA/LoCon 模型:放入 extensions\\sdwebuiadditionalnetworks\\models\\lora,也可以在 models/Lora 目录 Embedding 模型:放入 embeddings 目录
2025-01-14
Cursor什么添加模型
在 Cursor 中添加模型的方法如下: 1. 使用光标聊天、Ctrl/⌘K 和终端 Ctrl/⌘K,您可以轻松地在您选择的不同模型之间切换。 2. 在 AI 输入框下方,您将看到一个下拉列表,允许您选择要使用的模型。默认情况下,Cursor 已准备好使用以下模型: cursorsmall:cursorsmall 是 Cursor 的自定义模型,它不如 GPT4 智能,但速度更快,用户可以无限制地访问它。 3. 您可以在 Cursor Settings>Models>Model Names 下添加其他模型。 此外,有人通过接入更多模型如 Qwen2.5Coder、Llama3.3、deepseek v3、gemini2.0flash 等对 Cursor 进行配置,但接入再多的模型也无法完全填平 Cursor 免费版和 Cursor Pro 的差距。
2025-01-14
案例:借助人工智能技术的诈骗 一、案例材料 1.背景资料 (1)近期全国范围内出现了一种新型电信诈骗——AI换脸诈骗,该诈骗利用AI人工智能,通过“换脸”和“拟声”技术模仿受害人的朋友或亲戚的声音和外貌,以此骗取受害者的信任,进行网络诈骗,近日包头警方就根据一起典型案例,向大家发出了防范AI换脸诈骗的警示。 财联社5月22日讯,据平安包头微信公众号消息,包头警方发布了一起利用人工智能(AI)实施电信诈骗的典型案例,一家福州市科技公司的法人代表郭先生竟在短短10分钟内被骗走了430万元人民币。
以下是关于 AI 的相关内容: 律师如何写好提示词用好 AI: 对于不具备理工科背景的文科生,可将 AI 视为黑箱,只需知道其能模仿人类思维理解和输出自然语言。AI 就像似人而非人的存在,与传统道教的驱神役鬼拘灵遣将有相似之处。提示词应是相对完善的“谈话方案”,成果在与 AI 的对话中产生,要接受其存在的“不稳定性”,并在对话中限缩自己思维的模糊地带。 AI 的应用场景: 医疗保健:包括医学影像分析、药物研发、个性化医疗、机器人辅助手术等。 金融服务:涵盖风控和反欺诈、信用评估、投资分析、客户服务等。 零售和电子商务:有产品推荐、搜索和个性化、动态定价、聊天机器人等。 制造业:包含预测性维护、质量控制、供应链管理、机器人自动化等。 交通运输:(未具体阐述)
2024-12-25
ai技术商业应用典型案例
以下是一些 AI 技术商业应用的典型案例: 企业运营: 日常办公文档材料撰写整理。 营销对话机器人,进行市场分析和提供销售策略咨询。 法律文书起草、案例分析以及法律条文梳理。 人力资源方面的简历筛选、预招聘和员工培训。 教育: 协助评估学生学习情况,为职业规划提供建议。 针对学生情况以及兴趣定制化学习内容。 论文初稿搭建及论文审核。 帮助低收入国家/家庭通过 GPT 获得平等的教育资源。 游戏/媒体: 定制化游戏,动态生成 NPC 互动,自定义剧情和开放式结局。 出海文案内容生成,语言翻译及辅助广告投放和运营。 数字虚拟人直播。 游戏平台代码重构。 AI 自动生成副本。 零售/电商: 舆情、投诉、突发事件监测及分析。 品牌营销内容撰写及投放。 自动化库存管理。 自动生成或完成 SKU 类别选择、数量和价格分配。 客户购物趋势分析及洞察。 金融/保险: 个人金融理财顾问。 贷款信息摘要及初始批复。 识别并检测欺诈活动风险。 客服中心分析及内容洞察。 保险理赔处理及分析。 投资者报告/研究报告总结。 制造业/汽车: 生产计划、供应链计划状态查询。 产线预测性维保辅助。 产品质量分析与溯源。 自动驾驶全场景模拟训练及虚拟汽车助手。 线上购车品牌、配置对比分析。 生命科学: 研发阶段靶点发现及产品成药性。 医学文献内容检索,重点摘要提取,相关法规整理。 医药代表培训及知识库建立。 分诊导诊助理、诊疗助理、术后护理及复建辅助。 此外,还有以下具体案例: 京东物流仓储管理系统:利用数据分析、机器学习等技术优化物流仓储管理,提高运营效率。例如通过智能算法优化货物存储位置,减少拣货时间。 BOSS 直聘简历筛选功能:利用自然语言处理、机器学习技术快速筛选简历,提高招聘效率。根据企业的招聘要求,提取关键信息,为企业推荐符合条件的候选人。 贝壳找房租赁管理功能:利用数据分析、自然语言处理技术管理房地产租赁业务,提高效率。根据租客的需求和偏好,自动推荐合适的房源。 腾讯游戏社交平台:利用数据分析、机器学习技术为玩家提供社交功能,增强游戏体验。根据玩家的游戏历史和兴趣爱好,推荐可能成为好友的玩家。
2024-12-25
近期典型的企业大模型应用案例有什么
以下是近期典型的企业大模型应用案例: 彭博发布了金融领域的大模型 BloombergGPT,应用于其所在的垂直领域。 医联发布了内首款医疗大语言模型 MedGPT,可在真实医疗场景中发挥实际诊疗价值。 在解决大模型落地难的问题方面: 提高内容可信:如周伯文认为应做具备通用能力的大模型,并通过商业交付、反馈和评测来解决;中国科学院院士张钹指出 ChatGPT 没有自我学习能力,需用更多数据优化以解决实际应用问题;旷视科技物流业务事业部的负责人徐庆才提到大模型走向垂直化以提高内容精准度。 解决算力成本高、训练重复和资源紧缺的问题:一家 AI 算力公司联合创始人张新提到以 GPT3 模型为例,训练成本高昂,且全行业训练卡涨价,目前仍无法用商业化的国产芯片进行大模型训练。 此外,2024 年 7 月 12 日的《》汇集了 97 个优秀案例,展示了大模型技术在教育、医疗、金融、政务等多个行业和领域的应用,案例由阿里云、百度、华为等领先企业实施,上海成为应用落地的热点地区,大中型企业是主要试验场,AI 智能体和知识库成为提升大模型落地实效的关键手段。 相关报告还有: 《》 《》 《》
2024-12-02
典型的通用人工智能应用有哪些
以下是一些典型的通用人工智能应用: 1. 医疗保健: 医学影像分析:用于辅助诊断疾病。 药物研发:加速药物研发过程。 个性化医疗:提供个性化治疗方案。 机器人辅助手术:提高手术精度和安全性。 2. 金融服务: 风控和反欺诈:降低金融机构风险。 信用评估:帮助做出贷款决策。 投资分析:辅助投资者决策。 客户服务:提供 24/7 服务并回答常见问题。 3. 零售和电子商务: 产品推荐:根据客户数据推荐产品。 搜索和个性化:改善搜索结果和提供个性化体验。 动态定价:根据市场需求调整价格。 聊天机器人:回答客户问题和解决问题。 4. 制造业: 预测性维护:预测机器故障。 质量控制:检测产品缺陷。 供应链管理:优化供应链。 机器人自动化:提高生产效率。 5. 交通运输:暂未提及具体应用。 此外,通用人工智能模型还具有以下特点: 大型生成式人工智能模型可以灵活生成文本、音频、图像或视频等内容,适应各种不同任务。 当通用人工智能模型集成到人工智能系统中,该系统可服务于各种目的。 通用人工智能模型的提供者在人工智能价值链中具有特殊作用和责任,应提供适度的透明度措施和相关文件。
2024-11-17
2024大模型典型示范应用案例集在哪可下载
2024 大模型典型示范应用案例集可以在以下链接下载:https://waytoagi.feishu.cn/record/UXgRrbKPue5a2McLLRBcobienQg 。该案例集汇集了 97 个优秀案例,展示了大模型技术在多个行业和领域的应用,如教育、医疗、金融、政务等。案例由阿里云、百度、华为等领先企业实施,体现了大模型在提升效率、降低成本、创新服务等方面的显著成效。上海成为应用落地的热点地区,大中型企业是主要试验场。AI 智能体和知识库成为提升大模型落地实效的关键手段。这些案例为行业提供参考,推动大模型技术深入赋能实体经济,促进高质量发展。
2024-09-09