Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

今天的AI新闻

Answer

以下是 3 月 4 日、3 月 12 日和 3 月 14 日的 AI 新闻汇总:

3 月 4 日:

  • 【AI 3D】
    • Meshcapade:预告可从视频/图像中捕捉面部表情并具有逼真的 3D 发丝。
    • InsTaG:通过几秒钟视频学习,快速形成逼真的 3D 说话头像效果。
    • 3D-Mem:新型 3D 场景记忆框架。
  • 【AI 绘图】
    • 智谱:开源 AI 绘图 CogView4,可以在图像中生成中文字符。
    • 海螺:推出 Image-01 多功能文本转图像模型。
  • 【AI 视频】
    • Runway:网友爆料 Runway 内测能力可根据参考图像进行 Video to Video 视频风格化。
    • Vidu:API 开放平台全面开放。
  • 【AI 模型】
    • Google Colab:推出 Data Science Agent。
    • 微软:为医疗行业提供首个统一语音 AI 助手:Dragon Copilot。
    • Opera:宣布推出网页浏览器的 AI 代理。

3 月 12 日:

  • 【AI 3D】
    • BlenderMCP:与 Claude AI 沟通,在 blender 实现快速 3D 建模。
    • MIDI:单幅图像到 3D 场景生成。
    • Move AI:更新动作捕捉能力,提出 Gen 2 Spatial Motion。
  • 【AI 写作】
    • MM-StoryAgent:AI 多模态故事生成系统。
  • 【AI 视频】
    • VACE:阿里推出一体化视频创作和编辑技术。
    • VideoPainter:腾讯开源视频编辑技术。
    • Wonder Dynamics:推出摄像机轨道(Camera Track)和清洁板(Clean Plate)功能。
  • 【其他】
    • OpenAI:为开发者推出一套 AI Agent 开发套件。
    • R1-Omni:阿里情感识别模型,通过视频识别情感。
    • Luma AI:发布一种新的预训练范式 IMM,旨在突破算法瓶颈,提高生成预训练算法的性能。
    • Manus:宣布与阿里通义千问团队达成战略合作。

3 月 14 日:

  • 【AI 模型及其他】
    • 谷歌:Gemini 应用能力升级,包含升级推理模型 gemini 2.0 Flash Thinking Experimental 等多个功能提升。
    • OpenAI:4 项更新。
    • Bolt:一键将 Figma 设计转换为可运行的 Web 应用。
    • 阿里:推出 AI 旗舰应用“新夸克”。
    • 360 智脑团队:开源推理模型 Light-R1-14B-DS,复现 Deepseek 的强化学习效果。
  • 【AI 视频】
    • Pika:更新 Pikaffects,新增多款变身特效。
    • Freepik 与 Fal 平台:引入 Topaz AI 的提升“FPS 和视频分辨率”能力。
    • Krea:上线 Veo 2 模型,支持图生视频功能,但生成成本较高。
  • 【AI 绘图】
    • LBM:用于快速图像到图像转换的潜在桥匹配方法,支持可控图像重新照明、角色去除和图像修复。
  • 【AI 语音】
    • Sesame:开源 TTS 语音模型 CSM-1B。
Content generated by AI large model, please carefully verify (powered by aily)

References

3月4日 AI资讯汇总

猫叔留言:AI资讯公众号:超时空视角猫叔个人公众号:AI替代人类小红书/抖音:EverAI B站:Ever AI酱(❤这里会有教程及AI工具界面操作)[heading2]3月4日AI资讯[content]【AI 3D】Meshcapade:预告可从视频/图像中捕捉面部表情并具有逼真的3D发丝InsTaG:通过几秒钟视频学习,快速形成逼真的3D说话头像效果3D-Mem:新型3D场景记忆框架【AI绘图】智谱:开源AI绘图CogView4,可以在图像中生成中文字符海螺:推出Image-01多功能文本转图像模型【AI视频】Runway:网友爆料Runway内测能力可根据参考图像进行Video to Video视频风格化Vidu:API开放平台全面开放【AI模型】Google Colab:推出Data Science Agent微软:为医疗行业提供首个统一语音AI助手:Dragon CopilotOpera:宣布推出网页浏览器的AI代理

3月12日 AI资讯汇总

猫叔留言:AI资讯公众号:超时空视角猫叔个人公众号:AI替代人类小红书/抖音:EverAI B站:Ever AI酱(❤这里会有教程及AI工具界面操作)[heading2]3月12日AI资讯[content]【AI 3D】BlenderMCP:与Claude AI沟通,在blender实现快速3D建模MIDI:单幅图像到3D场景生成Move AI:更新动作捕捉能力,提出Gen 2 Spatial Motion【AI写作】MM-StoryAgent:AI多模态故事生成系统【AI视频】VACE:阿里推出一体化视频创作和编辑技术VideoPainter:腾讯开源视频编辑技术Wonder Dynamics:推出摄像机轨道(Camera Track)和清洁板(Clean Plate)功能【其他】OpenAI:为开发者推出一套AI Agent开发套件R1-Omni:阿里情感识别模型,通过视频识别情感Luma AI:发布一种新的预训练范式IMM,旨在突破算法瓶颈,提高生成预训练算法的性能Manus:宣布与阿里通义千问团队达成战略合作

3月14日 AI资讯汇总

猫叔留言:AI资讯公众号:超时空视角猫叔个人公众号:AI替代人类小红书/抖音:EverAI B站:Ever AI酱(❤这里会有教程及AI工具界面操作)3月14日AI资讯【AI模型及其他】谷歌:Gemini应用能力升级,包含升级推理模型gemini 2.0 Flash Thinking Experimental等多个功能提升OpenAI:4项更新Bolt:一键将Figma设计转换为可运行的Web应用阿里:推出AI旗舰应用“新夸克”360智脑团队:开源推理模型Light-R1-14B-DS,复现Deepseek的强化学习效果【AI视频】Pika:更新Pikaffects,新增多款变身特效Freepik与Fal平台:引入Topaz AI的提升“FPS和视频分辨率”能力Krea:上线Veo 2模型,支持图生视频功能,但生成成本较高【AI绘图】LBM:用于快速图像到图像转换的潜在桥匹配方法,支持可控图像重新照明、角色去除和图像修复【AI语音】Sesame:开源TTS语音模型CSM-1B,

Others are asking
我刚解除ai,从哪里开始学习
对于刚接触 AI 的新手,以下是一些学习建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 参考「」,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛(比如图像、音乐、视频等),根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出自己的作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 6. 完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。 对于中学生学习 AI,还有以下补充建议: 1. 从编程语言入手学习: 可以从 Python、JavaScript 等编程语言开始学习,学习编程语法、数据结构、算法等基础知识,为后续的 AI 学习打下基础。 2. 尝试使用 AI 工具和平台: 可以使用 ChatGPT、Midjourney 等 AI 生成工具,体验 AI 的应用场景。 探索一些面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识: 了解 AI 的基本概念、发展历程、主要技术如机器学习、深度学习等。 学习 AI 在教育、医疗、金融等领域的应用案例。 4. 参与 AI 相关的实践项目: 参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动。 尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 5. 关注 AI 发展的前沿动态: 关注 AI 领域的权威媒体和学者,了解 AI 技术的最新进展。 思考 AI 技术对未来社会的影响,培养对 AI 的思考和判断能力。 总之,无论是新手还是中学生,学习 AI 都需要耐心和持续的努力,不要害怕犯错,每个挑战都是成长的机会。随着时间的推移,将逐渐建立起自己的 AI 知识体系,并能够在这一领域取得成就。
2025-03-15
在使用comfyUI制作ai视频时,如何减小频闪
很抱歉,您提供的内容中没有关于在使用 ComfyUI 制作 AI 视频时如何减小频闪的相关信息。建议您检查 ComfyUI 的设置选项,看是否有与视频帧率、显示刷新率相关的设置,适当调整这些参数可能有助于减小频闪。同时,确保您的硬件设备(如显卡、显示器)性能良好且驱动程序为最新版本,也可能对解决频闪问题有所帮助。
2025-03-15
AI仿写
以下是为您提供的关于 AI 仿写的相关内容: 中文的内容仿写 AI 工具推荐: 1. 秘塔写作猫:https://xiezuocat.com/ 它是 AI 写作伴侣,能推敲用语、斟酌文法、改写文风,还能实时同步翻译。支持全文改写,一键修改,实时纠错并给出修改建议,智能分析文章的各类属性,为文章的正负情感、情绪强度和易读性打分。 2. 笔灵 AI 写作:https://ibiling.cn/ 是得力的智能写作助手,在心得体会、公文写作、演讲稿、小说、论文等方面表现出色。支持一键改写/续写/扩写,智能锤炼打磨文字,满足您的需求,提升创作水平。 3. 腾讯 Effidit 写作:https://effidit.qq.com/ 智能创作助手 Effidit 由腾讯 AI Lab 开发,致力于提升写作者的写作效率和创作体验。 更多 AI 写作类工具可以查看这里:https://www.waytoagi.com/sites/category/2 需注意内容由 AI 大模型生成,请仔细甄别。 案例方面,DeepSeek 模型在输出结果中有一些出色表现,如在独白文本中“自作主张”地加入括号中的场景描述,增强了画面感,还能预判用户需求,为输出加上文学性。但值得商榷的是,其输出可能与史实存在一定偏差。 对于担忧 AI 削弱孩子思考力的问题,如果使用方法不正确,如提封闭性问题让孩子迅速得到答案结束任务,AI 可能会有负面效果。但如果改成开放性问题,或者让 AI 帮助提更多拓展思考的问题,就能激发孩子的好奇心。AI 辅助写作文时,可让孩子提交与 AI 共同完成作文的聊天记录,关注孩子能否对 AI 作文进行点评批改、让 AI 迭代出更好的文章。
2025-03-15
如何让ai帮我写短视频脚本
以下是一些让 AI 帮您写短视频脚本的方法: 1. 指令逻辑: 自己给出开头,让 AI 知道结尾,避免模糊式提问,如“小王,写一篇自律的报告给我”。 提供内容的上半部,让 AI 撰写下半部,并包含必要内容。 将生成的内容以不同写作技巧、强硬转换风格,多滚动几次,写出多样版本与风格,降低初稿修改时间。 2. 反问法:让 AI 问您问题,能发现它思考更仔细,也能了解其逻辑并修正。 3. 制作技巧: 使用 Fanbook 中的 niji6 模型及sref 指令,确定视频风格一致性,选择 16:9 尺寸。 根据主题确定风格和时长,设定故事主线和镜头。 按照场景、地点、镜号、画面描述、台词、音效等维度填充分镜头,精简人物对话,提炼重点。 借助语言大模型获取画面灵感,多提问、多尝试。 4. 故事来源: 原创(直接经验):自身或周围人的经历、做过的梦、想象的故事等。 改编(间接经验):经典 IP、名著改编、新闻改编、二创等。 5. 剧本写作: 编剧有一定门槛,不能单纯套剧作理论和模版,要多写多实践,再看书总结经验,循环往复。 短片创作可从自身或朋友经历改编入手,或对短篇故事进行改编。 多跟别人讨论故事,听取感受。
2025-03-15
ai扩图
以下是关于 AI 扩图的相关知识: 星流一站式 AI 设计工具: 智能扩图:自动提取原图信息,智能地生成新的图像内容以填充扩展区域。 使用方法:选中图像进入扩展功能界面,拖动选区边框进行扩充区域选择。智能扩图参数包括提示词框(输入生成的区域的描述)、重绘风格(选择与放大图像相对应的风格,会提升扩图效果),其余参数默认即可。 高清放大:对图像进行尺寸放大,增加更多的细节,目前支持最大尺寸为 4K(40964096)。放大参数包括放大倍率、变化幅度、风格类型、细节丰富度、清晰度、相似度和提示词。 智能去背景:支持一键去除图片的背景。使用方法为选中图像,点击一键去背景。 【SD】最强控制插件 ControlNet: 以一张图为例,将其导入到图生图界面。根据情况选择大模型,如卡通类选择“revAnimated”,真实类选择“Realistic Vision”。图生图中重要的参数有缩放模式(选择“缩放后填充空白”)、尺寸(横向扩充增加宽度,纵向扩充增加高度)、单批数量(根据需求填写)、重绘幅度(加大到“0.8”以上)。 进行 ControlNet 的设置,升级到最新版本,将图片导入。启用插件,控制类型选择“局部重绘”,预处理器选择“inpaint_only+lama”,控制模式选择“更倾向 Controlnet”,缩放模式选择“缩放后填充空白”。为了让出图更统一,还可增加一个 reference_only 的通道巩固扩图风格。设置好后点击生成,选择满意的结果。 试验不同的图时,有时可通过反推提示词的方式增加文本控制。生成的图可能存在色差,需调整各项参数修正。 Stability AI 推出基于 Discord 的媒体生成和编辑工具: (扩图):在图像中插入其他内容以向任何方向填充空间,价格为 4 积分。
2025-03-15
关于教学的ai提示词
以下是关于教学的 AI 提示词的相关内容: 遵循最简化原则: 1. 内容长度限制:确保模型输出不超过用户设定的字数或信息量。 2. 内容类型限制:避免生成不恰当或不相关内容,可通过预设过滤规则实现。 3. 逻辑和一致性限制:增强模型理解和处理逻辑关系的能力。 4. 风格和语调限制:使模型输出符合特定写作风格或语调。 未遵循最简原则的情况: 1. “理解中文语义”这类描述无意义,因这是大模型基础设定。 2. “评估和打分文本质量”目标已包含打分任务,无需再提。 3. “提供文本改进建议”在目标中重复出现。 4. Markdown 格式错误,如“Profile:Goals:”结构错误,应将 Goals 放到 Role 层级下。 5. Initialization 部分可细化,如“明白以上要求后请回复:‘请提供需要打分的提示词:’”,更清晰指代用户下一句回复信息。 此外,写 Prompt 应先分析达成任务所需模块,且模块并非一成不变,需根据任务增减。同时注意: 1. 不需要包含作者信息,如 author、version 等。 2. 避免分类错误,如将输出错误分类到 Goals 目标,像“提供改进建议,以及改进原因”与“对用户的 Prompt 进行评分 1~10 分,10 分为满分”目标相似易造成困惑,应放到达成目标后的输出模块。 3. 注意拼写正确,如 Constrains 应拼写为 Constraints,限制条件要清晰且可被大模型执行。 以下是一些提示词模板的相关网站: 1. Majinai: 2. 词图: 3. Black Lily: 4. Danbooru 标签超市: 5. 魔咒百科词典: 6. AI 词汇加速器: 7. NovelAI 魔导书: 8. 鳖哲法典: 9. Danbooru tag: 10. AIBooru:
2025-03-15
快速帮我补充下大模型的发展时间线和关键节点,以及当前最前沿的新闻
大模型的发展时间线和关键节点如下: 2017 年:发布《Attention Is All You Need》论文。 2018 年: Google 提出 BERT,创新性地采用双向预训练并行获取上下文语义信息及掩码语言建模。 OpenAI 提出 GPT,开创仅使用自回归语言建模作为预训练目标的方式。 2021 年:Meta 提出 Large LAnguage Model Approach(LLAMA),成为首个开源模型。 2022 年 11 月 30 日:ChatGPT 发布,在全球范围内掀起人工智能浪潮。 2022 年 12 月:字节云雀大模型等出现。 2023 年: 国内大模型发展大致分为准备期(国内产学研迅速形成大模型共识)、成长期(数量和质量逐渐增长)、爆发期(开源闭源大模型层出不穷,形成百模大战态势)。 关键进展包括:Meta 开源 Llama2、OpenAI 发布多模态 GPT4V 及 GPT4 Turbo、百川智能开源 Baichuan7B 及 Baichuan2、百度升级文心一言 4.0、清华&智谱 AI 开源 ChatGLM2 及清华开源 ChatGLM3、腾讯发布混元助手等。 当前最前沿的新闻包括:过去半年,国内领军大模型企业实现了大模型代际追赶的奇迹,从 7 月份与 GPT3.5 的 20 分差距,到 11 月份测评时已在总分上超越 GPT3.5。
2025-03-14
帮我总结一下最近一周值得关注的AI新闻
以下是最近一周值得关注的 AI 新闻: 2024 年 6 月,苹果发布了 AI 原生操作系统,加强了硬件和模型布局;Claude Sonnet 3.5 发布,挑战 OpenAI;视频生成领域 Runway Gen3 和快手可灵表现优秀;AI 3D 技术逐渐崭露头角;Google 和月之暗面推出长上下文缓存技术。整体趋势是技术不断进步,各领域竞争激烈。 快手发布可灵网页版及大量模型更新;阶跃星辰发布多款模型;商汤打造类似 GPT4o 的实时语音演示;GraphRAG:微软开源新型 RAG 架构。 红杉资本美国合伙人 Pat Grady 在最新访谈中表示,AI 技术将为服务行业带来变革机遇,而非取代软件公司。AI 的潜力在于赋能服务行业,但人际关系和实际执行仍需人工。对于基础模型公司,Grady 认为它们可能像数据库公司一样发展,提供开发者 API,有机会进入应用层。他认为现有模型已足够强大,关键在于工程化优化和认知架构设计。 Netflix 列出了一个年薪 90 万美元的机器学习平台产品经理的 AI 产品工作岗位。 Shopify 的 AI 助手 Sidekick 现已上线,它知道如何在 Shopify 中执行任何操作,包括提取相关数据、操作新功能或创建报告。 Artifact(Ins 创始人做的 AI 新闻浏览软件)推出了自定义内容阅读语音的功能。 OpenAI、谷歌、微软和 Anthropic 组建了前沿模型论坛,主要目的是确保 AI 模型的安全发展。 Open AI 悄咪咪下线了他们的 ChatGPT 生成内容的检测器。 2024 年 1 月,斯坦福大学 Mobile Aloha;1 月 10 号 LumaAl Genie 文生 3D;1 月 11 号 GPT store 上线;1 月 MagnificAl 高清放大爆火;1 月最后一天苹果 Vision Pro 宣布发售。
2025-03-06
最新agi新闻
以下是为您整理的最新 AGI 新闻: 2024 年 7 月: 苹果发布 AI 原生操作系统,加强硬件和模型布局;Claude Sonnet 3.5 发布,挑战 OpenAI;视频生成领域 Runway Gen3 和快手可灵表现优秀;AI 3D 技术逐渐崭露头角;Google 和月之暗面推出长上下文缓存技术。 快手发布可灵网页版及大量模型更新;阶跃星辰发布多款模型;商汤打造类似 GPT4o 的实时语音演示;GraphRAG:微软开源新型 RAG 架构。 红杉资本美国合伙人 Pat Grady 在最新访谈中表示,AI 技术将为服务行业带来变革机遇,而非取代软件公司。AI 的潜力在于赋能服务行业,但人际关系和实际执行仍需人工。对于基础模型公司,Grady 认为它们可能像数据库公司一样发展,提供开发者 API,有机会进入应用层。他认为现有模型已足够强大,关键在于工程化优化和认知架构设计。 2024 年 10 月: 《Orange AI 的 9 月小结:AI 自媒体、AI 播客、AI 酒吧…AI 浓度太高了》提到鼓励建立自媒体,推出中文版 AI 播客 Demo 并吸引大量参与者,开设 AI 酒吧 Bar2AGI,参与 Demo Inn 和云栖大会,感受到行业快速发展和乐观氛围。 《AIGC Weekly91》指出国庆节期间的重要 AI 新闻,包括 OpenAI 推出 Canvas 功能和实时 API,微软发布新版 Copilot,具备深度系统集成和实时语音功能;Meta 发布 Meta Movie Gen 视频生成模型,自动配音质量高;LiquidAI 发布非 Transformer 模型 LFMs,推理效率显著提高。此外,Sora 项目负责人离职、多个新模型和工具发布,以及 OpenAI 完成新一轮融资,估值达到 1570 亿美元。 下篇:2024,分叉与洪流中提到,如果从“AGI 已经出现”的阴谋论出发,AGI 所需要的基本资源一定无法回避,它会在能源、算力、机器人等领域全力“协助”人类。比如在能源领域,有着“永远还差 50 年”称号的可控核聚变技术在 AI 的协助下开始有了松动,普林斯顿大学等离子体物理实验室通过 AI 成功在离子体撕裂前 300ms 进行了预测。从全人类能源供给的角度,唯一有希望提升全人类能源供给数量级的就是可控核聚变。在能源即将开始成为 AI 瓶颈的今天,AGI 如果有了意识,那一定会全力“协助”人类突破核聚变技术。
2025-02-28
我是一名高校新媒体工作人员,由于文字能力一般,需要能力较强的ai文本工具,用于撰写公文,新闻稿,公众号推文,总结简报等。请推荐至少5个,并进行对比分析
以下为您推荐至少 5 个适用于高校新媒体工作人员的 AI 文本工具,并进行对比分析: Copy.ai: 功能强大,提供丰富的新闻写作模板和功能。 可快速生成新闻标题、摘要、正文等内容,节省写作时间,提高效率。 Writesonic: 专注于写作,提供新闻稿件生成、标题生成、摘要提取等功能。 智能算法能根据用户提供信息生成高质量新闻内容,适合新闻写作和编辑人员。 Jasper AI: 人工智能写作助手,写作质量较高,支持多种语言。 虽主打博客和营销文案,也可用于生成新闻类内容。 Grammarly: 不仅是语法和拼写检查工具,还提供一些排版功能,可改进文档整体风格和流畅性。 QuillBot: AI 驱动的写作和排版工具,能改进文本清晰度和流畅性,同时保持原意。 秘塔写作猫: 是 AI 写作伴侣,能推敲用语、斟酌文法、改写文风,还能实时同步翻译。 支持全文改写,一键修改,实时纠错并给出修改建议,智能分析文章属性并打分。 笔灵 AI 写作: 是智能写作助手,能应对多种文体写作,如心得体会、公文写作、演讲稿、小说、论文等。 支持一键改写/续写/扩写,智能锤炼打磨文字。 腾讯 Effidit 写作: 由腾讯 AI Lab 开发,能探索用 AI 技术提升写作者的写作效率和创作体验。 选择工具时,您可根据具体需求(如文档类型、个人偏好等)进行考虑。例如,若主要需求是生成新闻类内容,Copy.ai、Writesonic 和 Jasper AI 可能更适合;若还需兼顾排版和语法检查,Grammarly 和 QuillBot 是不错的选择;若注重中文内容的改写,秘塔写作猫、笔灵 AI 写作和腾讯 Effidit 写作可优先考虑。
2025-02-26
最近的ai新闻
以下是最近的一些 AI 新闻: 2024 年 7 月: 苹果发布了 AI 原生操作系统,加强了硬件和模型布局。 Claude Sonnet 3.5 发布,挑战 OpenAI。 视频生成领域 Runway Gen3 和快手可灵表现优秀。 AI 3D 技术逐渐崭露头角。 Google 和月之暗面推出长上下文缓存技术。 快手发布可灵网页版及大量模型更新。 阶跃星辰发布多款模型。 商汤打造类似 GPT4o 的实时语音演示。 GraphRAG:微软开源新型 RAG 架构。 2024 年 9 月: 9 月 12 日:李继刚再现神级 Prompt,玩法持续翻新;Mistral 发布首个多模态模型 Pixtral 12B。 9 月 13 日:商汤 Vimi 相机开放微博小程序;元象开源中国最大 MoE 大模型 XVERSEMoEA36B。 9 月 14 日:人工智能生成合成内容标识办法(征求意见稿);Jina AI 发布 ReaderLM、Jina Embeddings V3。 9 月 18 日:DeepSeek 发文庆祝登上 LMSYS 榜单国产第一,几小时后 Qwen 新模型表示不服。 9 月 19 日:云栖大会;通义万相 AI 生视频上线;快手可灵 1.5 模型新增运动笔刷能力。 9 月 20 日:腾讯元器智能体对外发布;秘塔科技产品经理 JD 走红 AI 圈;阶跃跃问接入 Step2 万亿参数 MoE 语言大模型。 9 月 21 日:大模型测试基准研究组正式成立。 9 月 23 日:钉钉 365 会员上线。 9 月 24 日:讯飞星火 API 全新升级;豆包大模型全系列发布&更新。 9 月 25 日:Vidu API 正式开放,加速企业级视频创作;OpenAI 发布高级语音功能;西湖心辰开源 WestlakeOmni。 2024 年 1 月: 斯坦福大学 Mobile Aloha。 1 月 10 号 LumaAl Genie 文生 3D。 1 月 11 号 GPT store 上线。 1 月 MagnificAl 高清放大爆火。 1 月最后一天苹果 Vision Pro 宣布发售。 此外,红杉资本美国合伙人 Pat Grady 在最新访谈中表示,AI 技术将为服务行业带来变革机遇,而非取代软件公司。AI 的潜力在于赋能服务行业,但人际关系和实际执行仍需人工。对于基础模型公司,Grady 认为它们可能像数据库公司一样发展,提供开发者 API,有机会进入应用层。他认为现有模型已足够强大,关键在于工程化优化和认知架构设计。
2025-02-24
2月24日ai新闻
以下是 2 月 24 日的 AI 新闻: 帆哥:2024AI 大事纪 3 月:AI 发展持续升温,潞晨科技发布 OpenSora,Suno 发布 V3 版本爆火。 4 月:英伟达发布硬件股价飙升。 5 月:苹果发布 AI 芯片,张吕敏发布 IC light,AI 竞争白热化,伊莉雅离开 OpenAI 并成立新公司,估值超五亿美金。 7 月:快手开源 LivePortrait 模型,表情迁移。 8 月:StabilityAI 老板成立新公司发布 flux 大模型。 9 月:阿里云发布模型,海螺 AI 参战,AI 新动态不断,Google 发布 GameGen 实时生成游戏,通义千问 2.5 系列全家桶开源,华为发布 cloud matrix 云计算基础设施,GPT 高级语音模式上线,Meta 发布 AI 眼镜 Orion,AI 代码编辑器 cursor 爆火。 10 月:Pika 发布 1.5 模型,诺奖颁发给 AI 奠基人,特斯拉发布机器人,Adobe 发布 Illustrator+Al 生成矢量图,智谱 AI 发布 autoGLM,腾讯混元开源 3D 模型。 2 月 24 日社区动态速览 2 月 23 日,AI 切磋大会在 23 个城市同步举行,预计有近 4000 人参与,主题围绕 DeepSeek,邀请各行业专家分享应用场和见解。 向阳乔木介绍了通过结合 VS Code、Cline 插件和 Deepseek API 等工具提升 AI 应用能力的方法,用户可实现自动发送邮件等功能,Cline 作为 AI 编程工具支持多种大模型,用户可通过火山引擎等平台获取 API,通过 MCP 协议可扩展 LLM 功能。 南瓜博士探讨了如何有效引导儿童和青少年从初级认知阶段过渡到更高级的思维模式。 通往 AGI 之路 21 个 mj 风格,105 个 prompt。 张小珺邀请 MIT 计算机科学与人工智能实验室的在读博士松琳解读 DeepSeek、Kimi、MiniMax 注意力机制新论文。 CB Insights 发布重磅报告指出 2025 年人工智能市场的六大趋势。
2025-02-24
今天有什么ai新动态
以下是近期的 AI 新动态: 2024 年 3 月:AI 发展持续升温,潞晨科技发布 OpenSora,Suno 发布 V3 版本爆火。 2024 年 4 月:英伟达发布硬件,股价飙升。 2024 年 5 月:苹果发布 AI 芯片,张吕敏发布 IC light,AI 竞争白热化,伊莉雅离开 OpenAI 并成立新公司,估值超五亿美金。 2024 年 7 月:快手开源 LivePortrait 模型,实现表情迁移。 2024 年 8 月:StabilityAI 老板成立新公司发布 flux 大模型。 2024 年 9 月:阿里云发布模型,海螺 AI 参战,Google 发布 GameGen 实时生成游戏,通义千问 2.5 系列全家桶开源,华为发布 cloud matrix 云计算基础设施,GPT 高级语音模式上线,Meta 发布 AI 眼镜 Orion,AI 代码编辑器 cursor 爆火。 2024 年 10 月:Pika 发布 1.5 模型,诺奖颁发给 AI 奠基人,特斯拉发布机器人,Adobe 发布 Illustrator+Al 生成矢量图,智谱 AI 发布 autoGLM,腾讯混元开源 3D 模型。 12 月 5 日的 AI 新动态: Clone Robotics:仿生机器人公司致力于生产高仿真产品,技术和外观的进步让人类与机器人的边界变得越来越模糊。 Humane 发布 AI 驱动操作系统 CosmOS,具有多种核心功能,支持多种输入方式,并可实时从互联网获取数据为用户提供服务。 DeepMind 发布天气预测 AI 模型 GenCast,可预测未来 15 天的天气和极端天气风险,与顶级预测系统相比表现更优,且模型代码、权重和预测数据已开源。 OpenAI 的 ChatGPT 用户突破 3 亿。 在法律法规方面: 虽然 AI 概念不新,但近期数据生成和处理的进步改变了该领域及其产生的技术。例如,生成式 AI 模型的能力发展带来机会的同时也引发了关于潜在风险的新辩论。 并非所有 AI 风险都源于不良行为者的故意行为,有些可能是意外后果或缺乏适当控制导致的。 对 AI 特定风险及其潜在危害进行了初步评估,并参考了其威胁的价值,包括安全、公平、隐私、人权、社会福祉和繁荣等。 交叉的 AI 风险评估确定了一系列高级风险,框架将寻求通过适当干预来优先处理和减轻这些风险。例如,安全风险包括对人类和财产的身体损害以及对心理健康的损害。
2025-03-12
截止今天最强的模型是哪个
目前很难确切地指出截止今天最强的模型是哪一个。以下是一些表现出色的模型: Gemini Ultra:在报告的 32 个基准测试中,在 30 个基准测试中取得了 SOTA,包括多个领域的测试。它是第一个在 MMLU 上实现人类专家水平表现的模型,在多模态推理任务方面也有显著进展。 o3 模型:在 ARCAGI 测试中达到了 87.5%的准确率,几乎与人类水平相当。OpenAI 表示下一代 o3mini 模型的推理能力很强。 Gemini 2.0 Flash:Google 发布的该模型在重要的基准能力上,直接追平甚至部分超越了 Gemini 1.5 Pro,且模型速度有极大提升。 Llama 3.1:是迄今为止最大版本,其在推理、数学、多语言和长上下文任务中能够与 GPT4 相抗衡。 需要注意的是,模型的性能评估会因不同的基准测试和应用场景而有所差异,而且技术在不断发展,最强模型的定义也可能随之变化。
2025-03-05
今天有没有新的 ai 资讯
以下是为您汇总的近期 AI 资讯: 12 月 25 日: Recraft AI :更新了 60 种新的图像风格,是 AI 平面设计工具,用户可生成和编辑插画、海报、产品周边等,对所有用户每日有免费试用点数,允许商业使用。地址:https://www.recraft.ai/ AI 公文智能体“学习强国公文助手”在文小言 APP 正式上线,可进行文汇检索、AI 公文书写、AI 公文润色等。使用方式:下载文小言 APP,找寻学习强国公文助手。 2 月 13 日: Magnific AI 的图像高清化能力已在 freepik AI 上提供,订阅用户可用。地址:https://www.freepik.com/ai 百度上线深度搜索功能,同时宣布文心一言将从 4 月 1 日起全面免费。地址:https://mp.weixin.qq.com/s/lk7g2bhjBX45NHYDxU2D3w OpenAI CEO Sam Altman 深夜透露 GPT 未来路线图,数周或数月内将推出代号“Orion”的 GPT4.5,后期将融合 o 系与 GPT 系列推出 GPT5,同时结合多项新能力。ChatGPT 的免费用户也将可用到 GPT5,订阅用户享有更高智能的 GPT5。今晨 OpenAI 又更新,Openai O1 和 O3Mini 支持 CHATGPT 中的文件和图像上传,上调 O3MiniHigh 使用限制,所有 Pro 用户可在多端使用 Deep research 能力。如有问题可联系后台,电子邮箱:alolg@163.com 12 月 24 日: DisPose :由清华大学与北京大学等组织联合发布的可控人体图像动画方法,输入动作视频参考和人物图像可形成新的角色舞蹈视频。地址:https://lihxxx.github.io/DisPose/ InvSR :开源图像超分辨率模型,提升图像分辨率的开源新工具,只需一个采样步骤即可增强图像,可高清修复图像。地址、在线试用地址:https://github.com/zsyOAOA/InvSR?tab=readmeovfilerailway_caronlinedemo 、https://huggingface.co/spaces/OAOA/InvSR
2025-02-14
今天AI 的news
以下是今日有关 AI 的一些新闻: AI 大神 Karpathy 再发 LLM 入门介绍视频,提到了 LLM 的未来能力与发展趋势,包括具备多模态能力、发展为智能体、无处不在的隐形化、测试时训练、处理长上下文等。同时还介绍了跟踪 LLM 最新进展的资源,如 LLM 排行榜、AI News Newsletter 以及在 X(Twitter)上关注相关研究者和从业者。 XiaoHu.AI 日报 1 月 02 日的内容包括:小互 AI 年度总结,涵盖 2024 AI 技术与工具盘点;AI 对招聘市场的深刻影响(ZoomInfo 研究),如自 2022 年起 AI 相关职位的增长情况,以及多家公司设立 AI 相关领导角色等;微软论文疑似透露 OpenAI 模型参数。
2025-02-10
今天有什么AI资讯
以下是为您整理的今日 AI 资讯: 近期热门融资 AI 产品速递 1 st :包括多种搜索模式且重隐私的搜索引擎 You.com、通过 Sparkpages 来满足用户个性化搜索需求的 Genspark、刚被 OpenAI 收购的提供实时搜索和分析数据库服务的 Rockset、人类与 AI 共存的社交软件 Butterflies AI、可以对销售通话进行记录和辅导的 AI 助手 MeetRecord。 宝玉日报 2 月 3 日: AI 对软件工程的影响:涵盖自动代码生成、智能调试、AI 驱动的 DevOps 和敏捷开发优化等方面。 OpenAI CEO 宣布开发 AI 设备,目标颠覆智能手机,同时表达了对自研 AI 芯片的兴趣。 OpenAI 推出全新 Deep Research,让 ChatGPT 成为您的研究助理。 AIGC Weekly32 上周精选: Netflix 列出了一个年薪 90 万美元的机器学习平台产品经理的 AI 产品工作岗位。 Shopify 的 AI 助手 Sidekick 已上线,能帮助执行相关操作。 Artifact 推出了自定义内容阅读语音的功能。 OpenAI、谷歌、微软和 Anthropic 组建了前沿模型论坛,确保 AI 模型的安全发展。 Open AI 悄咪咪下线了他们的 ChatGPT 生成内容的检测器。
2025-02-08
到今天,大语言模型还会产生“幻觉”吗
截至今天,大语言模型仍会产生“幻觉”。 大语言模型偶尔会根据输入输出一些荒谬或不符合事实的内容,目前各家大语言模型在该问题上的表现都不尽如人意。产生“幻觉”的原因包括: 1. 样本存在错误(Imitative Falsehoods):如果大语言模型学习的“教材”中有错误,它也容易给出错误回答。缓解该问题的一个办法是上采样(Up Sampling)。 2. 信息过时(Outdated Factual Knowledge):以前正确的信息现在可能过时了。 此外,大语言模型通过训练数据猜测下一个输出结果,可能因错误数据导致给出错误答案,优质数据集对其很重要。如果在其训练过程中,模型被暴露于大量知识之中,它并没有完美地记忆所见到的信息,并不十分清楚自己的知识边界,可能会尝试回答有关深奥话题的问题,并虚构听起来有道理但实际不正确的内容。 在构建应用程序时,可以使用一些技术来避免这种情况,例如要求模型先从文本中找到相关引文,然后使用引文回答问题,并将答案追溯回源文件,这通常有助于减少“幻觉”的发生。
2025-01-22