Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

2025年4月以来有什么突破性的ai技术?

Answer

以下是 2025 年 4 月以来的一些突破性 AI 技术及相关进展:

  • 在图片和超短视频的精细操控方面,包括表情、细致动作以及视频与文字的匹配有了新的突破。
  • 有一定操控能力的生成式短视频在风格化和动漫风方面最先成熟,真人风格稍晚。
  • AI 音频能力有长足进展,带感情的 AI 配音基本成熟。
  • “全真 AI 颜值网红”出现,可以稳定输出视频并直播带货。
  • 游戏 AI NPC 有里程碑式进展,出现新的游戏生产方式。
  • AI 男/女朋友聊天基本成熟,在记忆方面有明显突破,能较好模拟人的感情,产品加入视频音频,粘性提升并开始出圈。
  • 实时生成的内容开始在社交媒体内容、广告中出现。
  • AI Agent 有明确进展,办公场景“AI 助手”开始有良好使用体验。

2025 年 4 月的具体进展包括:

  • 真格基金的戴雨森认为,AI 时代即将迎来各行业的“李世石时刻”。OpenAI 的 o1 和 DeepSeek 的 R1 模型分别在后训练和开源创新方面展现了强大潜力,推动了强化学习的应用。
  • 马斯克在最新演讲中警告 AI 可能只是为取悦企业而非追求真相,并强调教育中 AI 的个性化应用将深远影响学习。他预测特斯拉 Robotaxi 将在 6 月实现完全自动驾驶,同时期待神经连接技术能帮助失明者重见光明。

此外,《人工智能指数报告 2025》(AI Index Report 2025)由斯坦福大学人工智能研究院(HAI)发布,报告涵盖了 AI 在技术性能、经济影响、政策治理、教育、公众舆论、科学与医学等多个维度的最新进展。关键发现包括:AI 技术性能持续突破,在新设立的高难度基准测试上表现大幅提升;AI 日益融入日常生活,如 FDA 批准的 AI 医疗设备增多,自动驾驶服务扩展;企业全面拥抱 AI,美国私营 AI 投资增加,使用 AI 的企业比例上升;中美 AI 竞争加剧,美国主导 AI 模型数量,中国模型在质量上迅速追赶;负责任 AI(RAI)发展不均。报告地址:https://hai.stanford.edu/ai-index/2025-ai-index-report 。

Content generated by AI large model, please carefully verify (powered by aily)

References

AGI 万字长文(下)| 2024,分叉与洪流

2024年内图片-超短视频的精细操控:表情、细致动作、视频-文字匹配有一定操控能力的生成式短视频:风格化、动漫风最先成熟;真人稍晚AI音频能力长足进展:带感情的AI配音基本成熟“全真AI颜值网红”出现,可以稳定输出视频,可以直播带货游戏AI NPC有里程碑式进展,出现新的游戏生产方式AI男/女朋友聊天基本成熟:记忆上有明显突破,可以较好模拟人的感情,产品加入视频音频,粘性提升并开始出圈实时生成的内容开始在社交媒体内容、广告中出现AI Agent有明确进展,办公场景“AI助手”开始有良好使用体验2AI的商业模式开始有明确用例:数据合成、工程平台、模型安全等可穿戴-全天候AI硬件层出不穷,虽然大多数不会成功中国AI达到或超过GPT4水平;美国出现GPT5;世界上开始现“主权AI”华为昇腾生态开始形成,国内推理芯片开始国产替代(训练替代要稍晚)AI造成的DeepFake、诈骗、网络攻击等开始进入公众视野,并引发担忧AI立法、伦理讨论仍然大规模落后于技术进展……2025-2027AI 3D技术、物理规则成熟:正常人无法区别AI生成还是实景拍摄全真AI虚拟人成熟:包含感情的AI NPC成熟,开放世界游戏成熟;游戏中几乎无法区别真人和NPCAR/VR技术大规模商用接近AGI的技术出现人与AI配合的工作方式成为常态,很多日常决策开始由AI来执行AI生产的数据量超过全人类生产数据量,“真实”成为稀缺资源具身智能、核聚变、芯片、超导、机器人等技术有明显进展突破“人的模型”出现,出现“集中化AGI”与“个人AGI”的历史分叉AI引发的社会问题开始加重,结构性失业开始出现AGI对于地缘政治的影响开始显露……"Limit of Understanding";Yifei Gong 2024,with Dall-E

4.5 历史更新

《[真格基金戴雨森:长聊AI Agent,各行业都会遭遇「李世石时刻」(上)](https://mp.weixin.qq.com/s/KGYnetBeOH1F-yv5dypkDw)》真格基金的戴雨森认为,AI时代即将迎来各行业的“李世石时刻”。OpenAI的o1和DeepSeek的R1模型分别在后训练和开源创新方面展现了强大潜力,推动了强化学习的应用。R1通过开源促进了知识共享和行业发展,显示出技术突破能为用户带来“魔法般”的体验,引发自然传播,证明了年轻团队在技术革命中的竞争力。《[马斯克最新演讲要点:AI只为取悦老板+火星殖民+大脑植入,哪个最先改变你的生活?](https://mp.weixin.qq.com/s/gXxuy9uSCtOvlhAhzNIT_A)》在马斯克的最新演讲中,他警告AI可能只是为取悦企业而非追求真相,并强调教育中AI的个性化应用将深远影响学习。他预测特斯拉Robotaxi将在6月实现完全自动驾驶,同时期待神经连接技术能帮助失明者重见光明。他还关注人口减少问题,认为这是人类面临的重大挑战。他鼓励大家生育,称“孩子是我最大的幸福源泉”。未来的科技变革可能比我们想象的更快来临。

《人工智能指数报告2025》(AI Index Report 2025)

报告地址:https://hai.stanford.edu/ai-index/2025-ai-index-report[2025年AI指数报告,斯坦福.pdf](https://waytoagi.feishu.cn/wiki/KD80wWOsviuJp4kILaUcCFgwngc)《人工智能指数报告2025》(AI Index Report 2025)是由斯坦福大学人本人工智能研究院(HAI)发布的年度权威报告,旨在全面追踪全球人工智能(AI)领域的发展趋势。以下是对该报告的核心内容和关键发现的分析:?报告概览这份报告是AI Index自2017年创立以来的第八版,也是迄今为止最全面的一次。它涵盖了AI在技术性能、经济影响、政策治理、教育、公众舆论、科学与医学等多个维度的最新进展。?关键发现(Top Takeaways)1.AI技术性能持续突破在新设立的高难度基准测试(如MMMU、GPQA、SWE-bench)上,AI系统的表现大幅提升。例如,SWE-bench的代码问题解决率从2023年的4.4%跃升至2024年的71.7%。1.AI日益融入日常生活FDA在2023年批准了223种AI医疗设备(2015年仅为6种)。Waymo每周提供超过15万次自动驾驶服务,百度Apollo Go已在中国多个城市运营。3.企业全面拥抱AI2024年,美国私营AI投资达$1091亿,是中国的12倍。78%的企业在2024年使用AI,高于2023年的55%。4.中美AI竞争加剧美国仍主导AI模型数量(2024年40个),但中国模型在质量上迅速追赶,多个基准测试上已接近或达到美国水平。5.负责任AI(RAI)发展不均

Others are asking
2025年人工智能大模型的技术提升有哪些,是参数?推理能力?还是语料
2025 年人工智能大模型的技术提升可能体现在以下几个方面: 1. 视频生成能力:如 2024 年推出的多个先进的 AI 模型能够从文本输入生成高质量视频,相比 2023 年有显著进步。 2. 模型规模与性能:更小的模型能驱动更强的性能,如 2022 年最小能在 MMLU 上得分高于 60%的模型是具有 5400 亿参数的 PaLM,到 2024 年,参数仅 38 亿的微软 Phi3mini 也能达到相同阈值。 3. 推理能力:尽管加入了如思维链推理等机制显著提升了大语言模型的性能,但在一些需要逻辑推理的问题上,如算术和规划,尤其在超出训练范围的实例上,这些系统仍存在问题。 4. AI 代理:在短时间预算设置下,顶级 AI 系统得分高于人类专家,但随着时间预算增加,人类表现会超过 AI。 5. 算法变革:如 DeepSeek 的出现标志着算力效率拐点显现,其通过优化算法架构显著提升了算力利用效率,同时 2025 年发布的大模型呈现低参数量特征,为本地化部署到 AI 终端运行提供了可能,其训练过程聚焦于强化学习,提升了模型的推理能力。
2025-04-14
2025年AI研究报告
以下是为您提供的 2025 年 AI 研究报告相关信息: Gartner:《生成式 AI 时代下科技产品的重要发展机遇》(2024/10/16) 强调了生成式 AI 技术对对话式 AI 和科技产品创新的显著影响。 预计到 2025 年,生成式 AI 将嵌入 80%的对话式 AI 产品中,推动市场营收大幅增长。 建议技术供应商积极把握机遇,通过理解市场动态、技术成熟度和市场接受度来调整策略。 生成式 AI 的四大关键能力—对话式 AI、AI 代理、合成数据和个性化—能够提升产品价值和客户体验。 提出了将生成式 AI 功能添加到产品中的四个关键步骤,并强调了独立软件供应商在企业应用中嵌入生成式 AI 能力的趋势。 如需下载研究报告,。 甲子光年:2025 DeepSeek 开启 AI 算法变革元年(2025/02/05) DeepSeek 的出现标志着算力效率拐点显现,其通过优化算法架构,显著提升了算力利用效率,打破了算力至上的传统认知。 2025 年发布的大模型呈现低参数量特征,为本地化部署到 AI 终端运行提供了可能。 报告强调 2025 年是算法变革的元年,DeepSeek 的推理模型开启了算法变革,其训练过程聚焦于强化学习,提升了模型的推理能力。 非 Transformer 架构的算法模型成为新的发展方向,如 LFM 架构模型性能超越同等规模的 Transformer 模型。 如需下载研究报告,。 安永:数据+AI 开启经验规模化复制时代(2023/12/19) 人工智能正在经历新的发展浪潮。 某头部公司正在转向 AI Agents 支持平台,结合第 4 代人工智能模型与专业语料库以实现业务创新。 AI Agents 有望为商业领域注入新活力,展示人工智能的潜力和商业价值。 随着平台的发展,新的 AI Agents 涌现,提供专业化、高端化、个性化、规模化、持续化的服务。 人工智能的革新涵盖了生成内容(AIGC)和生成服务(AIGS)的领域。 保险行业面临挑战,AI 的突破为其带来新的应对方向。 知识星球下载: 弘则研究:2023 生成式 AI 驱动向量数据库加速发展(2023/12/18) 向量数据库潜在市场空间是传统结构化关系型数据库的数倍达到千亿美元。 据信通院统计数据,全球数据库市场规模在 2020 年为 671 亿美元,到 2025 年有望达到 798 亿美元,CAGR 3.5%估算关系型数据库全球龙头 Oracle 收入规模小几百亿美元。 仅考虑现有非结构化数据的向量化处理,估算需要的存储空间增量为之前的数倍。 未来随着生成式 AI 应用增量数据的爆发对于向量数据库的需求会更大。 报告下载地址:
2025-04-09
有哪些完整综观地阐述了2022年到2025年AIGC相关技术和在设计领域的应用发展的研究报告
以下是为您找到的一些可能符合您需求的研究报告: 1. 月狐数据联合发布的《AI 产业全景洞察报告 2025》,深入分析了全球及中国人工智能产业的发展现状、全景图谱及企业出海情况。指出全球 AI 产业保持 19.1%的年均增长率,2024 年第三季度交易数量达 1245 笔,融资规模显著提升。美国在 AI 领域融资和应用市场中占据主导地位,中国紧随其后,2024 年一季度大模型规模占全球的 36%。国内 AI 企业出海呈现增长趋势,工具类和图像处理类应用在海外市场受欢迎,但东南亚和东亚地区付费习惯尚未形成。还展示了 AI 在各行业的应用现状,包括智慧医疗、智慧教育、企业服务等,强调了 AIGC 技术在提升用户体验和推动产业发展中的关键作用。链接:https://waytoagi.feishu.cn/record/DFqRrh4kqeqaIFchKtocVwVkn2d 2. 甲子光年的《2025 具身智能行业发展研究报告:具身智能技术发展与行业应用简析》,指出具身智能作为具备物理载体的智能体,强调通过与环境的交互实现智能行为,是人工智能与机器人技术的深度融合。当前,具身智能正处于技术萌芽期,受大模型技术推动成为热点,但在数据采集、模型泛化、技术路线等方面仍面临挑战。报告分析了具身智能的发展背景、现状及应用场景,认为中国在具身智能领域已走在国际前列,具备庞大的市场需求、完善的产业集群和良好的政策支持。链接:https://waytoagi.feishu.cn/record/TERPru4Jee7Gzbcu54WcUjsXnJh 3. 智能纪要:【跨界·未来】AIGC×视觉交互工作坊 Part1:AI 应用前瞻 2025 年 3 月 11 日。涵盖了 AI 在艺术创作中的应用与探索,包括 Lora 模型训练素材、模型训练比赛、Checkpoint 模型、线上与本地工作流、学习资源推荐、AI 创作挑战、装置艺术脉络、机械装置艺术理论、国内外装置艺术区别、AIGC 艺术尝试、机械进化与装置创作等方面。
2025-03-31
有哪些完整综观地阐述了2022年到2025年AIGC相关技术和应用发展的研究报告
以下是一些完整综观地阐述了 2022 年到 2025 年 AIGC 相关技术和应用发展的研究报告: 1. 月狐数据联合发布的《AI 产业全景洞察报告 2025》,深入分析了全球及中国人工智能产业的发展现状、全景图谱及企业出海情况。指出全球 AI 产业保持 19.1%的年均增长率,2024 年第三季度交易数量达 1245 笔,融资规模显著提升。美国在 AI 领域融资和应用市场中占据主导地位,中国紧随其后,2024 年一季度大模型规模占全球的 36%。国内 AI 企业出海呈现增长趋势,工具类和图像处理类应用在海外市场受欢迎,但东南亚和东亚地区付费习惯尚未形成。还展示了 AI 在各行业的应用现状,强调了 AIGC 技术在提升用户体验和推动产业发展中的关键作用。链接:https://waytoagi.feishu.cn/record/DFqRrh4kqeqaIFchKtocVwVkn2d 2. 甲子光年的《2025 具身智能行业发展研究报告:具身智能技术发展与行业应用简析》,指出具身智能作为具备物理载体的智能体,强调通过与环境的交互实现智能行为,是人工智能与机器人技术的深度融合。当前,具身智能正处于技术萌芽期,受大模型技术推动成为热点,但在数据采集、模型泛化、技术路线等方面仍面临挑战。分析了具身智能的发展背景、现状及应用场景,认为中国在具身智能领域已走在国际前列,具备庞大的市场需求、完善的产业集群和良好的政策支持。链接:https://waytoagi.feishu.cn/record/TERPru4Jee7Gzbcu54WcUjsXnJh 3. Celent 的《利用 AI 在支付领域的优势》,讨论了生成式人工智能的潜力和银行业对此的积极探索,并预测 AI 将在提高支付处理效率和创造新的收入流方面发挥关键作用。链接:https://waytoagi.feishu.cn/record/Cwtnr6KSIeL8JDcmljZcc55onPx 4. 华西证券的 AIGC 行业深度报告(14):《从英伟达到华为,零部件迎来大机遇》,英伟达的新一代 GPU 架构将带来零部件的升级,同时,华为的昇腾 910C 芯片和 Atlas 900 SuperCluster 展示了国产算力集群的潜力。链接:https://waytoagi.feishu.cn/record/UXR3rwzGSe92xLcLqFmcRpnhnUc 5. 《2024 端到端自动驾驶行业研究报告》,通过访谈 30 余位专家,分析了端到端技术的发展、主要参与者、驱动力和挑战。预计到 2025 年,模块化端到端系统将开始商业化应用,推动技术、市场和产业格局的变革。链接:https://waytoagi.feishu.cn/record/QBnRra7VfexdazctR1Acc5YGn6d 6. 微软的《释放英国的 AI 潜力:利用 AI 促进经济增长》,英国拥有先进的科技行业和数字优势,但与其他国家相比领先优势有限,英国面临基础设施、数字技能和数字技术采用的瓶颈。链接:https://waytoagi.feishu.cn/record/K1bfraBc7eMFvOc1T21cto8rnhh
2025-03-31
2025年3月27日AI新闻
以下是 2025 年 3 月 27 日的部分 AI 新闻: 《详解 MCP:Agentic AI 中间层最优解,AI 应用的标准化革命》:Anthropic 推出的开放协议 MCP 迅速垄断了 Agentic AI 的中间层,类似于 AI 应用的 USBC 端口。它简化了开发者与数据源的整合,促进了生态形成,可能成为“Agentic AI 领域的 Stripe”,为未来 AI 应用的标准化革命奠定基础。 《对谈|如何用 AI 增强人类学习》:Howie.Serious 与 Indigo 探讨了费曼学习法与 AI 创作的结合,强调输出能迫使知识内化。两位终身学习者分享了如何通过高效利用 AI 提升写作与学习,推动思维深度,指出未来的 AI Agent 应具备更强的自动化整合能力,助力人类保持独特价值与创造力。 《硅谷知名风投 BVP 专栏:消费级 AI 的临界点将至!》:消费级 AI 正迎来临界点,推动一波又一波的变革。随着基础模型成本降低和多模态技术进步,新的消费类 AI 公司不断涌现。未来,AI 将重塑旅行、购物和社交体验,提升个性化服务的准确性与便利性。 此外,2 月 27 日的相关新闻有:小红书 AI 赛道从 0 到 1 做 IP 的相关活动预告、工具分享及日更群计划。3 月 5 日的新闻包括:2025 开年 3 个月 AI 已经狂飙,更新密集发布;Grok 语音模式全面开放,支持 11 种模式(包括 2 种 18 禁),自带语音字幕,目前仅支持英文。
2025-03-27
作为储能行业的软件平台产品经理,如何将AI融入产品中;当今世界(2025年3月27日),AI会对传统行业的平台软件产品产生哪些影响
在当今世界(2025 年 3 月 27 日),AI 对传统行业的平台软件产品产生了多方面的影响。例如,在储能行业,大模型训练与推理对电力需求剧增,尤其需要稳定、低成本的大规模供电,这使得调度与储能变得关键。同时,AI 时代对能源低成本与稳定性的需求极其旺盛,核能(尤其小堆)及储能、电动车电池都将持续发展。 对于储能行业的软件平台产品经理,将 AI 融入产品可以从以下几个方面考虑: 1. 利用 AI 进行电力需求预测和优化调度,以提高供电的稳定性和效率。 2. 借助 AI 技术对储能系统进行智能管理和优化,降低电池成本。 3. 通过 AI 分析用户行为和需求,为用户提供个性化的能源管理方案。 4. 利用 AI 监测和诊断储能设备的运行状态,提前预警故障,提高系统的可靠性。
2025-03-27
AI文生视频
以下是关于文字生成视频(文生视频)的相关信息: 一些提供文生视频功能的产品: Pika:擅长动画制作,支持视频编辑。 SVD:Stable Diffusion 的插件,可在图片基础上生成视频。 Runway:老牌工具,提供实时涂抹修改视频功能,但收费。 Kaiber:视频转视频 AI,能将原视频转换成各种风格。 Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多相关网站可查看:https://www.waytoagi.com/category/38 。 制作 5 秒单镜头文生视频的实操步骤(以梦 AI 为例): 进入平台:打开梦 AI 网站并登录,新用户有积分可免费体验。 输入提示词:涵盖景别、主体、环境、光线、动作、运镜等描述。 选择参数并点击生成:确认提示词无误后,选择模型、画面比例,点击「生成」按钮。 预览与下载:生成完毕后预览视频,满意则下载保存,不理想可调整提示词再试。 视频模型 Sora:OpenAI 发布的首款文生视频模型,能根据文字指令创造逼真且充满想象力的场景,可生成长达 1 分钟的一镜到底超长视频,视频中的人物和镜头具有惊人的一致性和稳定性。
2025-04-20
Ai在设备风控场景的落地
AI 在设备风控场景的落地可以从以下几个方面考虑: 法律法规方面:《促进创新的人工智能监管方法》指出,AI 的发展带来了一系列新的安全风险,如对个人、组织和关键基础设施的风险。在设备风控中,需要关注法律框架是否能充分应对 AI 带来的风险,如数据隐私、公平性等问题。 趋势研究方面:在制造业中,AI Agent 可用于生产决策、设备维护、供应链协调等。例如,在工业设备监控与预防性维护中,Agent 能通过监测传感器数据识别异常模式,提前通知检修,减少停机损失和维修成本。在生产计划、供应链管理、质量控制、协作机器人、仓储物流、产品设计、建筑工程和能源管理等方面,AI Agent 也能发挥重要作用,实现生产的无人化、决策的数据化和响应的实时化。
2025-04-20
ai视频
以下是 4 月 11 日、4 月 9 日和 4 月 14 日的 AI 视频相关资讯汇总: 4 月 11 日: Pika 上线 Pika Twists 能力,可控制修改原视频中的任何角色或物体。 Higgsfield Mix 在图生视频中,结合多种镜头运动预设与视觉特效生成视频。 FantasyTalking 是阿里技术,可制作角色口型同步视频并具有逼真的面部和全身动作。 LAM 开源技术,实现从单张图片快速生成超逼真的 3D 头像,在任何设备上快速渲染实现实时互动聊天。 Krea 演示新工具 Krea Stage,通过图片生成可自由拼装 3D 场景,再实现风格化渲染。 Veo 2 现已通过 Gemini API 向开发者开放。 Freepik 发布视频编辑器。 Pusa 视频生成模型,无缝支持各种视频生成任务(文本/图像/视频到视频)。 4 月 9 日: ACTalker 是多模态驱动的人物说话视频生成。 Viggle 升级 Mic 2.0 能力。 TestTime Training在英伟达协助研究下,可生成完整的 1 分钟视频。 4 月 14 日: 字节发布一款经济高效的视频生成基础模型 Seaweed7B。 可灵的 AI 视频模型可灵 2.0 大师版及 AI 绘图模型可图 2.0 即将上线。
2025-04-20
ai视频教学
以下是为您提供的 AI 视频教学相关内容: 1. 第一节回放 AI 编程从入门到精通: 课程安排:19、20、22 和 28 号四天进行 AI 编程教学,周五晚上穿插 AI 视频教学。 视频预告:周五晚上邀请小龙问露露拆解爆火的 AI 视频制作,视频在视频号上有大量转发和播放。 编程工具 tree:整合多种模型,可免费无限量试用,下载需科学上网,Mac 可拖到文件夹安装,推荐注册 GitHub 账号用于代码存储和发布,主界面分为工具区、AI 干活区、右侧功能区等。 网络不稳定处理:网络不稳定时尝试更换节点。 项目克隆与文件夹:每个项目通过在本地新建文件夹来区分,项目运行一轮一轮进行,可新建会话,终端可重开。 GitHub 仓库创建:仓库相当于本地项目,可新建,新建后有地址,可通过多种方式上传。 Python 环境安装:为方便安装提供了安装包,安装时要选特定选项,安装后通过命令确认。 代码生成与修改:在 tree 中输入需求生成代码,可对生成的代码提出修改要求,如添加滑动条、雪花形状、颜色等,修改后审查并接受。 2. AI 视频提示词库: 神秘风 Arcane:Prompt:a robot is walking through a destroyed city,,League of Legends style,game modelling 乐高 Lego:Prompt:a robot is walking through a destroyed city,,lego movie style,bright colours,block building style 模糊背景 Blur Background:Prompt:a robot is walking through a destroyed city,,emphasis on foreground elements,sharp focus,soft background 宫崎骏 Ghibli:Prompt:a robot is walking through a destroyed city,,Spirited Away,Howl's Moving Castle,dreamy colour palette 蒸汽朋克 Steampunk:Prompt:a robot is walking through a destroyed city,,fantasy,gear decoration,brass metal robotics,3d game 印象派 Impressionism:Prompt:a robot is walking through a destroyed city,,big movements
2025-04-20
ai写程序
以下是关于使用 AI 写程序的相关内容: 1. 对于技术纯小白: 从最基础的小任务开始,让 AI 按照最佳实践写一个 say hello 的示例程序,并解释每个文件的作用及程序运行的逻辑,以学会必备的调试技能。 若学习写 chrome 插件,可让 AI 按照最佳实践生成简单的示范项目,包含全面的典型文件和功能,并讲解每个文件的作用和程序运行的逻辑。若使用 o1mini,可在提示词最后添加生成创建脚本的要求,并请教如何运行脚本(Windows 机器则是 create.cmd)。 2. 明确项目需求: 通过与 AI 的对话逐步明确项目需求。 让 AI 帮助梳理出产品需求文档,在后续开发时每次新起聊天将文档发给 AI 并告知在做的功能点。 3. 在独立游戏开发中的经验: 单独让 AI 写小功能没问题,但对于复杂的程序框架,可把不方便配表而又需要撰写的简单、模板化、多调用 API 且牵涉小部分特殊逻辑的代码交给 AI。 以 Buff 系统为例,可让 AI 仿照代码写一些 Buff。但目前 Cursor 生成复杂代码需要复杂的前期调教,ChatGPT 相对更方便。 教 AI 时要像哄小孩,及时肯定正确的,指出错误时要克制,不断完善其经验。 4. 相关资源和平台: AI 写小游戏平台:https://poe.com/ 图片网站:https://imgur.com/ 改 bug 的网站:https://v0.dev/chat 国内小游戏发布平台:https://open.4399.cn/console/ 需要注意的是,使用 AI 写程序时,对于技术小白来说,入门容易但深入较难,若没有技术背景可能提不出问题,从而影响 AI 发挥作用。
2025-04-19
学AI上钉钉
以下是在钉钉上学 AI 的相关内容: 从 AI 助教到智慧学伴的应用探索: 登录钉钉客户端,在右上角依次选择钉钉魔法棒、AI 助理、创建 AI 助理。进入创建 AI 助理页面后,填写 AI 助理信息,设置完成即可创建成功。 AI 领导力向阳乔木:未提及具体的在钉钉上学 AI 的操作方法。 基于 COW 框架的 ChatBot 实现步骤: 创建应用: 进入,登录后点击创建应用,填写应用相关信息。 点击添加应用能力,选择“机器人”能力并添加。 配置机器人信息后点击发布,发布后点击“点击调试”,会自动创建测试群聊,可在客户端查看。点击版本管理与发布,创建新版本发布。 项目配置: 点击凭证与基础信息,获取 Client ID 和 Client Secret 两个参数。 参考项目,将相关配置加入项目根目录的 config.json 文件,并设置 channel_type:"dingtalk",注意运行前需安装依赖。 点击事件订阅,点击已完成接入,验证连接通道,会显示连接接入成功。 使用:与机器人私聊或将机器人拉入企业群中均可开启对话。
2025-04-19
这几天ai领域有没有突破性的论文
以下是这几天 AI 领域的一些相关论文和研究成果: 1. 《山姆·奥特曼传(二):OpenAI 的第一次内斗》中提到,2017 年 Google Brain 团队撰写的论文《Attention is All You Need》介绍了 Transformer 架构,彻底改变了 AI 领域的格局。OpenAI 在其技术领袖伊利亚的推动下,基于 Transformer 架构开发了 GPT 系列模型。 2. 《2024 人工智能报告》中包含了关于 AI 在未来一年的 10 个预测,如一个主权国家向美国大型人工智能实验室投资 100 亿美元以上需要国家安全审查,没有任何编码能力的人独自创建的应用程序或网站将会迅速走红等。 3. 《入门经典必读》中指出人工智能的研究正在以指数级别的速度增长,文中分享了一份用于更深入了解现代 AI 的精选资源列表,其中提到从 2017 年谷歌发布的“Attention is All You Need”这篇开启了生成 AI 时代的论文开始的一系列里程碑式研究成果。
2024-12-26
能画技术路线图的prompt
以下是关于能画技术路线图的 prompt 相关内容: Midjourney Bot 的 Prompt 类型: 基本 Prompts:可以只是一个单词、短语或表情符号。 高级 Prompts:包括一个或多个图片 URL、多个文本短语以及一个或多个参数。其中,图片 URL 始终位于 prompt 的最前面,以影响完成结果的风格和内容。提示文字是对希望生成的图像的文本描述,精心编写的提示有助于生成惊艳的图像。参数可以改变生成图片的方式,需放在提示语的末尾。 ComfyUI Flux 与 runway 制作绘画视频: 生成图片:提示词告诉 flux 生成一张技术草图,如 CAD。 绘制的视频:在 runway 里面,使用提示词从空白页面开始逐行创建,并把生成的图片作为尾帧。 草图上色:使用 flux 的 controlNet,depth 固定,目前 Union 版本不建议权重调太高,结束时间也需注意。 Prompt engineering(提示工程): 开发测试用例:定义任务和成功标准后,创建多样化的测试用例,包括典型示例和边界情况,以确保提示具有鲁棒性。 设计初步提示:制定初步提示,概述任务定义、良好响应的特征及必要上下文,添加规范输入和输出的示例供参考。 根据测试用例测试提示:使用初步提示将测试用例输入,评估模型响应与预期输出和成功标准的一致性,使用一致的评分标准进行系统性的性能评估。
2025-04-19
金融业相关AI应用场景或AI技术介绍
在金融业中,AI 有以下应用场景和技术: 1. 风控和反欺诈:用于识别和阻止欺诈行为,降低金融机构的风险。 2. 信用评估:评估借款人的信用风险,帮助金融机构做出更好的贷款决策。 3. 投资分析:分析市场数据,辅助投资者做出更明智的投资决策。 4. 客户服务:提供 24/7 的客户服务,回答客户常见问题。 例如,Hebbia 获得近 1 亿美元 B 轮融资,其 AI 技术能够一次处理多达数百万份文档,在短时间内浏览数十亿份包括 PDF、PowerPoint、电子表格和转录内容等,并返回具体答案,主要面向金融服务公司,如对冲基金和投资银行,同时也适用于律师事务所等其他专业领域。
2025-04-15
stable diffusion底层技术
Stable Diffusion 的底层技术主要来源于 AI 视频剪辑技术创业公司 Runway 的 Patrick Esser 以及慕尼黑大学机器视觉学习组的 Robin Romabach 之前在计算机视觉大会 CVPR22 上合作发表的潜扩散模型(Latent Diffusion Model)研究。 Stable Diffusion 是一种基于潜在扩散模型的文本到图像生成模型,其原理包括以下几个步骤: 1. 使用新颖的文本编码器(OpenCLIP),由 LAION 开发并得到 Stability AI 的支持,将文本输入转换为向量表示,以捕捉文本语义信息并与图像空间对齐。 2. 采用扩散模型,将随机噪声图像逐渐变换为目标图像。扩散模型是一种生成模型,能从训练数据中学习概率分布并采样新数据。 3. 在扩散过程中,利用文本向量和噪声图像作为条件输入,给出每一步变换的概率分布,根据文本指导噪声图像向目标图像收敛,并保持图像的清晰度和连贯性。 4. 使用超分辨率放大器(Upscaler Diffusion Model),将生成的低分辨率图像放大到更高分辨率,从低分辨率图像中恢复细节信息并增强图像质量。 此外,ComfyUI 的底层依赖 Stable Diffusion,去噪过程由 UNet 网络完成。UNet 是一种编码器解码器结构,能处理多尺度特征表示。在 ComfyUI 中,去噪的每个步骤通过模型推理模块实现,调用训练好的 UNet 模型逐步将噪声图像还原成有意义的图像。交叉注意力机制在 Stable Diffusion 中很重要,允许模型在生成过程中融入文本提示、图像、语义信息等条件,在 ComfyUI 中通过“文本提示”和“条件输入”节点实现。跳跃连接是 UNet 的核心部分,能在不同尺度之间共享特征,在 ComfyUI 的节点网络中表现为中间过程数据的流转。切换器代表在去噪过程中的不同阶段对特征流的控制,在 ComfyUI 中可通过修改模型参数节点或自定义网络结构节点对不同阶段的噪声去除策略进行微调。 Stable Diffusion 还具有以下优点: 1. 可以处理任意领域和主题的文本输入,并生成与之相符合的多样化和富有创意的图像。 2. 可以生成高达 2048x2048 或更高分辨率的图像,且保持良好的视觉效果和真实感。 它还可以进行深度引导和结构保留的图像转换和合成,例如根据输入图片推断出深度信息,并利用深度信息和文本条件生成新图片。
2025-04-15
学习AI怎么在工作中使用,提高工作效率,有必要从技术原理开始学习吗
学习 AI 在工作中使用以提高工作效率,不一定需要从技术原理开始学习。以下是一些相关的案例和建议: 案例一:GPT4VAct 是一个多模态 AI 助手,能够模拟人类通过鼠标和键盘进行网页浏览。其应用场景在于以后互联网项目产品的原型设计自动化生成,能使生成效果更符合用户使用习惯,同时优化广告位的出现位置、时机和频率。它基于 AI 学习模型,通过视觉理解技术识别网页元素,能执行点击和输入字符操作等,但目前存在一些功能尚未支持,如处理视觉信息程度有限、不支持输入特殊键码等。 案例二:对于教师来说,有专门的 AI 减负指南。例如“AI 基础工作坊用 AI 刷新你的工作流”,从理解以 GPT 为代表的 AI 工作原理开始,了解其优势短板,学习写好提示词以获得高质量内容,并基于一线教师工作场景分享优秀提示词与 AI 工具,帮助解决日常工作中的常见问题,提高工作效率。 建议:您可以根据自身工作的具体需求和特点,有针对性地选择学习方向。如果您只是想快速应用 AI 提高工作效率,可以先从了解常见的 AI 工具和应用场景入手,掌握基本的操作和提示词编写技巧。但如果您希望更深入地理解和优化 AI 在工作中的应用,了解技术原理会有一定帮助。
2025-04-15
AI相关的最前沿技术网站
以下是一些 AI 相关的前沿技术网站: 1. OpenAI:提供了诸如 GPT 等先进的语言模型和相关技术。 2. Google AI:涵盖了多种 AI 领域的研究成果和应用。 3. Microsoft Research:在 AI 方面有众多创新研究和技术展示。 此外,WaytoAGI 也是一个致力于人工智能学习的中文知识库和社区平台,汇集了上千个人工智能网站和工具,提供最新的 AI 工具、应用、智能体和行业资讯。在没有任何推广的情况下,WaytoAGI 两年时间已有超过 300 万用户和超千万次的访问量,其目标是让每个人的学习过程少走弯路,让更多的人因 AI 而强大。目前合作过的公司/产品包括阿里云、通义千问、淘宝、智谱、支付宝等。
2025-04-15
,当前AI数字人发展的新态势,以及新技术和成果
当前 AI 数字人的发展呈现出以下新态势,并取得了一系列新技术和成果: 数字人简介: 数字人是运用数字技术创造的,虽现阶段未达科幻作品中的高度智能,但已在生活多场景中出现且应用爆发。业界对其尚无准确定义,一般可按技术栈分为真人驱动和算法驱动两类。真人驱动的数字人重在通过动捕设备或视觉算法还原真人动作表情,主要用于影视和直播带货,其表现质量与建模精细度及动捕设备精密程度相关,不过视觉算法进步使在无昂贵动捕设备时也能通过摄像头捕捉关键点信息实现不错效果。 B 端变现与创业方向: B 端变现细分包括高频率和大规模的内容生产细分,如文字、视频、3D 模型、AI 智能体等,底层是需求和数据收集及训练模型,算力和能源是关键。自媒体创业需具备内容创新和差异化,内容成本低且更新迭代快。游戏创业可做轻量化游戏,结合 AI 技术满足放松和社交需求,专注垂类赛道避免与大厂竞争。影视创业在 25 年将是拐点,更多内容会采用 AI 技术。广告营销创业重点是 AI 虚拟人,数字插画可走治愈类型,要明确平台用户画像和产品定位,做好次留存和引入私域。 AI 虚拟人的发展与创业机遇: AI 虚拟人从早期以首位为核心的宅文化虚拟偶像,发展到以 CG 技术和动捕语音合成技术为核心的角色,再到如今以动捕和人工智能技术为核心的服务型虚拟人。虚拟人产业链包括基础层的硬件和软件研发,平台层如商汤、百度等提供工具和系统,应用层涉及影视、传媒、游戏、金融、文旅等内容变现。未来 3 10 年,AI 虚拟人是 Web 3.0 的风口,提前布局有潜力的赛道可迎接机遇,但创业对创业者综合能力要求极高。 未来展望: 数字人未来有很多应用场景,如家庭中的数字人管家、学校中的数字人老师、商场里的数字人导购等。未来还会有很多技术突破,如将五感数据和躯壳控制参数作为输入,次世代算法可自我迭代升级和自行演化躯壳控制方式。通过 Dify 搭建数字人的开源项目可展现低门槛高度定制数字人的基本思路,数字人的核心在于 Agent 即灵魂,如何在 Dify 上编排专属数字人灵魂值得体验。期望随着数字人的多模态能力接入、智能化水平升级、模型互动控制更精确,AI 既能提供高质量信息,也能关注用户情绪。
2025-04-14