Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

今天的AI新闻

Answer

以下是 3 月 4 日、3 月 12 日和 3 月 14 日的 AI 新闻汇总:

3 月 4 日:

  • 【AI 3D】
    • Meshcapade:预告可从视频/图像中捕捉面部表情并具有逼真的 3D 发丝。
    • InsTaG:通过几秒钟视频学习,快速形成逼真的 3D 说话头像效果。
    • 3D-Mem:新型 3D 场景记忆框架。
  • 【AI 绘图】
    • 智谱:开源 AI 绘图 CogView4,可以在图像中生成中文字符。
    • 海螺:推出 Image-01 多功能文本转图像模型。
  • 【AI 视频】
    • Runway:网友爆料 Runway 内测能力可根据参考图像进行 Video to Video 视频风格化。
    • Vidu:API 开放平台全面开放。
  • 【AI 模型】
    • Google Colab:推出 Data Science Agent。
    • 微软:为医疗行业提供首个统一语音 AI 助手:Dragon Copilot。
    • Opera:宣布推出网页浏览器的 AI 代理。

3 月 12 日:

  • 【AI 3D】
    • BlenderMCP:与 Claude AI 沟通,在 blender 实现快速 3D 建模。
    • MIDI:单幅图像到 3D 场景生成。
    • Move AI:更新动作捕捉能力,提出 Gen 2 Spatial Motion。
  • 【AI 写作】
    • MM-StoryAgent:AI 多模态故事生成系统。
  • 【AI 视频】
    • VACE:阿里推出一体化视频创作和编辑技术。
    • VideoPainter:腾讯开源视频编辑技术。
    • Wonder Dynamics:推出摄像机轨道(Camera Track)和清洁板(Clean Plate)功能。
  • 【其他】
    • OpenAI:为开发者推出一套 AI Agent 开发套件。
    • R1-Omni:阿里情感识别模型,通过视频识别情感。
    • Luma AI:发布一种新的预训练范式 IMM,旨在突破算法瓶颈,提高生成预训练算法的性能。
    • Manus:宣布与阿里通义千问团队达成战略合作。

3 月 14 日:

  • 【AI 模型及其他】
    • 谷歌:Gemini 应用能力升级,包含升级推理模型 gemini 2.0 Flash Thinking Experimental 等多个功能提升。
    • OpenAI:4 项更新。
    • Bolt:一键将 Figma 设计转换为可运行的 Web 应用。
    • 阿里:推出 AI 旗舰应用“新夸克”。
    • 360 智脑团队:开源推理模型 Light-R1-14B-DS,复现 Deepseek 的强化学习效果。
  • 【AI 视频】
    • Pika:更新 Pikaffects,新增多款变身特效。
    • Freepik 与 Fal 平台:引入 Topaz AI 的提升“FPS 和视频分辨率”能力。
    • Krea:上线 Veo 2 模型,支持图生视频功能,但生成成本较高。
  • 【AI 绘图】
    • LBM:用于快速图像到图像转换的潜在桥匹配方法,支持可控图像重新照明、角色去除和图像修复。
  • 【AI 语音】
    • Sesame:开源 TTS 语音模型 CSM-1B。
Content generated by AI large model, please carefully verify (powered by aily)

References

3月4日 AI资讯汇总

猫叔留言:AI资讯公众号:超时空视角猫叔个人公众号:AI替代人类小红书/抖音:EverAI B站:Ever AI酱(❤这里会有教程及AI工具界面操作)[heading2]3月4日AI资讯[content]【AI 3D】Meshcapade:预告可从视频/图像中捕捉面部表情并具有逼真的3D发丝InsTaG:通过几秒钟视频学习,快速形成逼真的3D说话头像效果3D-Mem:新型3D场景记忆框架【AI绘图】智谱:开源AI绘图CogView4,可以在图像中生成中文字符海螺:推出Image-01多功能文本转图像模型【AI视频】Runway:网友爆料Runway内测能力可根据参考图像进行Video to Video视频风格化Vidu:API开放平台全面开放【AI模型】Google Colab:推出Data Science Agent微软:为医疗行业提供首个统一语音AI助手:Dragon CopilotOpera:宣布推出网页浏览器的AI代理

3月12日 AI资讯汇总

猫叔留言:AI资讯公众号:超时空视角猫叔个人公众号:AI替代人类小红书/抖音:EverAI B站:Ever AI酱(❤这里会有教程及AI工具界面操作)[heading2]3月12日AI资讯[content]【AI 3D】BlenderMCP:与Claude AI沟通,在blender实现快速3D建模MIDI:单幅图像到3D场景生成Move AI:更新动作捕捉能力,提出Gen 2 Spatial Motion【AI写作】MM-StoryAgent:AI多模态故事生成系统【AI视频】VACE:阿里推出一体化视频创作和编辑技术VideoPainter:腾讯开源视频编辑技术Wonder Dynamics:推出摄像机轨道(Camera Track)和清洁板(Clean Plate)功能【其他】OpenAI:为开发者推出一套AI Agent开发套件R1-Omni:阿里情感识别模型,通过视频识别情感Luma AI:发布一种新的预训练范式IMM,旨在突破算法瓶颈,提高生成预训练算法的性能Manus:宣布与阿里通义千问团队达成战略合作

3月14日 AI资讯汇总

猫叔留言:AI资讯公众号:超时空视角猫叔个人公众号:AI替代人类小红书/抖音:EverAI B站:Ever AI酱(❤这里会有教程及AI工具界面操作)3月14日AI资讯【AI模型及其他】谷歌:Gemini应用能力升级,包含升级推理模型gemini 2.0 Flash Thinking Experimental等多个功能提升OpenAI:4项更新Bolt:一键将Figma设计转换为可运行的Web应用阿里:推出AI旗舰应用“新夸克”360智脑团队:开源推理模型Light-R1-14B-DS,复现Deepseek的强化学习效果【AI视频】Pika:更新Pikaffects,新增多款变身特效Freepik与Fal平台:引入Topaz AI的提升“FPS和视频分辨率”能力Krea:上线Veo 2模型,支持图生视频功能,但生成成本较高【AI绘图】LBM:用于快速图像到图像转换的潜在桥匹配方法,支持可控图像重新照明、角色去除和图像修复【AI语音】Sesame:开源TTS语音模型CSM-1B,

Others are asking
推荐一些AI作曲工具
以下是为您推荐的一些 AI 作曲工具: 1. Udio:由前 Google DeepMind 工程师开发,通过文本提示快速生成符合用户音乐风格喜好的高质量音乐作品。网址:https://www.udio.com/ 2. Suno AI:是一款革命性的人工智能音乐生成工具,它通过先进的深度学习技术,能够将用户的输入转化为富有情感且高质量的音乐作品。网址:https://suno.com/ 需要注意的是,内容由 AI 大模型生成,请仔细甄别。在使用 AI 作曲工具时,掌握一些基本的音乐知识,如基本的节拍参数、基础乐器的描述和组合、主歌副歌的结构常识等,对于创作制作至关重要。同时,要避免一些不切实际的想法,如传一首周杰伦的歌上去复制一堆周杰伦风格的歌等。另外,对于 AI 音乐 MV 的制作,建立角色资产可以考虑使用 AI 绘画平台,如 Midjourney(条件允许时的首选)、可灵 AI、即梦 AI 等成熟的综合类工具,或者 Krea 之类的集成平台。
2025-03-18
我准备用无影云电脑部署一个独属于我们公司的AI,在大模型方面我准备用deepseek的满血版,你有什么建议吗
以下是关于您准备用无影云电脑部署公司专属 AI 并使用 deepseek 满血版大模型的一些建议: 1. 本地部署方面:如果拥有云服务器,要了解如何进行本地部署以及满血版本地部署的实际情况。 2. 免费额度:在 freely.aliyun.com 可领取 500 元免费额度,但有使用限制,不能部署满血版和较大的增流模型。 3. 平台服务差异:了解 DLC、DSW 和 EAS 等模型部署平台服务的差别。 4. 模型蒸馏微调:可以学习并实践模型的蒸馏和微调相关知识。 5. 获取 DeepSeekR1 满血版密钥: 注册并登录火山引擎,点击立即体验进入控制台。 创建一个接入点,点击在线推理创建推理接入点。 为接入点命名为 DeepSeekR1。 若有提示未开通模型,点击“立即开通”,勾选全部模型和协议一路开通。 确认无误后点击“确认接入”按钮。 复制推理点的 ID 并保存。 点击【API 调用】按钮,复制 API Key 并保存。 6. 模型选择与配置:可以参考理想的配置,如推理模型选择 gemini2.0flashthinking,代码模型选择 claude3.5sonet 或 gpt4omini,多模态模型选择 gemini2.0flash,常规模型选择 DeepSeek V3。同时,了解 OpenRouter 新发布的 BYOK 功能,它能集成第三方 Key,整合免费额度并解放更多槽位。若对现有供应商支持的模型不满意,还可考虑 simpleoneapi。
2025-03-18
在国内用什么ai生成ppt更好一些
在国内,以下两款 AI 生成 PPT 的工具值得推荐: 1. 爱设计 PPT: 拥有实力强大的团队,技术过硬且对市场需求有敏锐洞察力,能持续推动产品创新和进步。 成功把握住 AI 与 PPT 结合的市场机遇,迅速开发出产品。 已在国内 AI 生成 PPT 产品中确立市场领先地位,代表了当前国内 AI 辅助 PPT 制作的最高水平,能大大提高制作效率并保证高质量输出。 2. 闪击: 网址:https://ppt.isheji.com/?code=ysslhaqllp&as=invite ,国内网站,不需要魔法。 选择模版,输入大纲和要点(可参考官方使用指南:https://zhuanlan.zhihu.com/p/607583650 ),将大纲转换成适配闪击的语法,点击文本转 PPT 并确定,在线编辑,导出(PPT 需要会员才能导出)。
2025-03-18
ai进行需求评审
AI 进行需求评审包括以下方面: AI Review(测试版):这是一项能让您查看代码库中近期更改以捕获潜在错误的功能。您可以单击审阅项查看编辑器中的完整上下文,并与 AI 聊天获取更多信息。为让其更有利,您能提供自定义说明让 AI 专注,比如关注性能相关问题。目前有几个审核选项,如查看工作状态、查看与主分支的差异、查看上次提交。 在 AI 编程中,需求梳理极为重要: 明确要解决的问题,从用户角度出发,清晰定义痛点和期望,如用户希望通过图像识别解决的具体问题。 明确 AI 在问题中的角色和作用,评估其能力边界。 制定明确可量化的评估指标,如准确率、召回率等,衡量 AI 系统性能和效果。 规划好数据的来源、质量和数量。 要在需求梳理和界面交互上花费最多时间。 周周黑客松中关于 AI 编程的需求拆解: 让 Claude 帮忙拆解需求,如插件自动读取网页主要内容并传输给 LLM agent bot,bot 处理为 HTML 代码返回,插件渲染,提供保存为图片选项等。 进行方案设计和分工,使用 AI 编码工具开发,确保程序架构良好,分离为主要模块放在不同文件夹,定义好接口,开发完成后拼接测试,有问题或新需求修改开发文档,尽量多打印日志方便 debug。 具体分工如元子负责内容提取模块,实现网页内容提取、清理格式化和优化提取算法;lark 负责 API 通信模块,实现与 LLM agent bot 的通信及相关处理和错误处理重试机制。
2025-03-18
请推荐一个中文版的AI编程助手以及编程工具
以下为您推荐一些中文版的 AI 编程助手及编程工具: 1. AIXcoder:是 AI 驱动的编程助手,支持 Java、Python 和 JavaScript 等语言,提供自动任务处理、智能代码补全等功能,目前只有中文版,价格暂无信息。 2. Windsurf:提出了 Agent IDE 这种新的开发范式,Cascade 功能对应 Cursor Composer,在体验上有提升,包括深入理解现有代码库等,但有程序员反馈其 tab 自动补全不如 Cursor。 希望这些推荐对您有所帮助。
2025-03-18
请推荐1~2款适合初学者的AI编程助手和编程学习工具
以下是 1 2 款适合初学者的 AI 编程助手和编程学习工具: v0:适合初学者,能为编程提供一定的辅助和支持。 Bolt:对新手友好,有助于初学者在编程过程中获得帮助和指导。 此外,还有一些其他常见的适合初学者的工具,如 GitHub Copilot,它支持多种语言和 IDE,能为程序员快速提供代码建议;通义灵码,提供行级/函数级实时续写、自然语言生成代码等多种能力。您可以根据自己的需求选择最适合您的工具。
2025-03-18
我想要学习如何获取ai新闻并每天自动发送到微信等平台
以下是获取 AI 新闻并每天自动发送到微信等平台的方法: 1. 通过 Coze 实现多模态资讯的跨平台推送: 创意构思:创建 Bot 作为专属的资讯助手,通过 Coze 这样的 AI agent 流程获取最新资讯,并以多模态形式自动推送到不同平台,如微信群、企业微信群、飞书云文档多维表格等。可根据用户定制化检索需求,自动化抓取热点资讯,进行分析处理,整合成资讯文档返回 Bot 对话界面,并同步自动发送到不同平台。 效果呈现:Coze Bot 可通过不同提问触发检索功能,实现企业微信群自动同步获得资讯检索结果、与企业微信群的信息同步联动,还能获取飞书云文档多维表格中的用户需求,以及在微信群聊中调用 Coze Bot 进行对话交互检索信息。 2. 伊登:最新 Deepseek+coze 实现新闻播报自动化工作流: 工作流程: 内容获取:输入新闻链接,系统自动提取核心内容。添加网页图片链接提取插件获取网页里的图片,利用图片链接提取节点获取新闻主图,使用链接读取节点提取文字内容,接上大模型节点重写新闻成为口播稿子。 3. 用 Coze 免费打造自己的微信 AI 机器人: 搭建步骤: 组装&测试“AI 前线”Bot 机器人:返回个人空间,在 Bots 栏下找到创建的“AI 前线”,点击进入。将写好的 prompt 黏贴到【编排】模块,在【技能】模块添加需要的技能,在【预览与调试】模块输入问题与机器人对话。 发布“AI 前线”Bot 机器人:测试 OK 后,点击右上角“发布”按钮可将其发布到微信、飞书等渠道。若要发布到微信公众号,选择微信公众号渠道,点击右侧“配置”按钮,在微信公众号平台找到自己的 App ID 填入确定即可。
2025-03-17
百度的ai大模型免费的新闻?
以下是关于百度 AI 大模型免费的相关新闻: 2024 年 5 月 21 日,阿里云宣布通义千问主力模型 QwenLong 的 API 输入价格大幅下降,同时下午百度宣布文心大模型两大主力模型全面免费。 2024 年 2 月 13 日,百度宣布文心一言将全面免费,AI 价格战加剧。
2025-03-17
如何实现公众号用智能体+工作流,每天自动发《头条新闻》
要实现公众号用智能体+工作流每天自动发《头条新闻》,可以参考以下步骤: 伊登:最新 Deepseek+coze 实现新闻播报自动化工作流 工作流程详解 第一步:内容获取 1. 只需输入新闻链接,系统就能自动提取核心内容。开始节点,入参包括新闻链接和视频合成插件 api_key。 2. 添加网页图片链接提取插件,承接开始节点的新闻链接。 3. 获取网页里的图片,以 1ai.net 的资讯为例,输入新闻后提取出很多链接,其中第一条链接通常是新闻主图,其他内容多为不重要的 icon。 4. 添加图片链接提取节点,若为节省写代码时间,可直接用大模型节点提取,只拿提取的链接集合的第一条,即可搞定新闻的主要图片。 5. 接着利用调整图片的节点,将 url 属性的图片内容转化为 image 属性的图片(因为 url 节点在画板中是 string 的格式,所以必须转为 img 格式)。 6. 对于文字部分,使用链接读取节点将文字内容提取出来。 7. 在提取链接后面接上一个大模型节点,用来重写新闻成为口播稿子,可使用最强的 DeepseekR1 模型生成有吸引力的口播内容。小 tips,如果想要加上自己的特征,可以在提示词里写:“开头加上‘这里是伊登 AI’之类的个性化台词防伪”。PS:这里的 deepseekR1 基础版本是限额使用,我们可以在专业版手动接入 DeepseekR1 手动接入推理模型。 第二步:画面生成 思路是做成一帧一帧的主图+台词,配合语音合成,保证音屏同步。 1. 用批量化节点,做成一帧一帧的画面,用画板节点完成。批量处理节点输入的是格式变化后的 json 格式的文案。 2. 画面生成的重点是:在批处理中,先把一些固定内容在画板节点安排好,比如背景图片。然后引入变量元素,比如新闻图片(已经提取并转换为 img 属性)、新闻标题(来自链接读取)、口播台词(已经提取并二创)。小 tips:想要找好看的背景图推荐去可画,挑选一个好看的视频模板然后,保存为【图片】格式,然后放在画板节点,当作底图。 第三步:语音合成 使用声音合成的官方插件,引用批处理的一句一句的新闻文案内容,可调节语速和语气,多种播音风格可选。在画板和语音合成的节点后面加入图片音频合成插件。PS:这个插件需要收费,登录 https://ts.fyshark.com//userInfo,【钱包】充值获取 token,【个人中心】获取 token,放入这个节点中,不过充值 10 元可以做好久了,这个插件适合小白同学,也有不收费的插件,但是比较吃操作,如果感兴趣也可以关注后续出相关教程。这个插件的 img_audio_video 的功能是把图片+视频合成,这样就实现了一段一段的口播新闻内容。 【拔刀刘】自动总结公众号内容,定时推送到微信(附完整实操教程) 三、搭建工作流 13、循环将推送内容插入数据库 将本轮推送给用户的内容,写入数据库,下次从 rss 列表中如果再抓取到相同内容,直接跳过,避免重复推送。使用「循环」节点,输入项为第 8 步代码输出的 content_urls,这里有完整的文章内容信息。循环体设置:使用「数据库」节点,输入项为本循环节点 item 中的 url 和 suid,SQL 也是用 AI 生成的。设置循环节点的输出项:output,参数随便选,后边也用不到了。 14、结束节点 选择第 11 步输出的内容,可以在 bot 中也查看到推送的内容。 15、试运行 工作流终于搭建完了,点击右上角的试运行,选择绑定的 bot,输入数据测试。Key:输入你的 server 酱的 sendkey。rss_list:如果你没有现成的数据,可以白嫖我这个,复制下方这两条数据测试使用。试运行结果:如果工作流设置的没有问题,你会在工作流中看到这样的结果。同时,微信上也会收到这条推送,可以查看总结内容,点击链接可以查看公众号原文。点击右上角发布。
2025-03-16
请推荐最新的AI相关进展新闻
以下是一些最新的 AI 相关进展新闻: 在医疗领域: ChatGPT 和 Google Bard 等技术极大加速了医疗健康生物制药的研究,AI 在抗癌、抗衰老、早期疾病防治等方面发挥着重要作用。例如,AI 提前三年诊断胰腺癌;两名高中生与医疗技术公司合作发现与胶质母细胞瘤相关的新靶基因;AI 帮助抗衰老,筛查出高效的药物候选物;利用 AI 寻找阿尔兹海默症的治疗方法;使用神经网络分析患者体液中的生物标志物以早期诊断帕金森。 在技术应用方面: AI Agent 的突破让行业看到更多可能性,如机器人获得自主行动能力。AI 编程工具的进展预示着人机协作模式的变革。 2024 年 AI 关键进展时间线包括:2 月 OpenAI 发布视频生成模型 Sora;3 月 Suno 发布 V3 版本;4 月 Meta 发布高性能开源大模型 Llama3;5 月 GPT4 发布等。 赛博月刊显示,AI 音频公司在效果和延迟方面取得突破,3D 世界生成领域处于初级阶段但有望在明年取得巨大进步,AI 应用的更新集中在搜索、知识库、编程等领域,越来越多应用公司受到资本青睐。
2025-03-16
快速帮我补充下大模型的发展时间线和关键节点,以及当前最前沿的新闻
大模型的发展时间线和关键节点如下: 2017 年:发布《Attention Is All You Need》论文。 2018 年: Google 提出 BERT,创新性地采用双向预训练并行获取上下文语义信息及掩码语言建模。 OpenAI 提出 GPT,开创仅使用自回归语言建模作为预训练目标的方式。 2021 年:Meta 提出 Large LAnguage Model Approach(LLAMA),成为首个开源模型。 2022 年 11 月 30 日:ChatGPT 发布,在全球范围内掀起人工智能浪潮。 2022 年 12 月:字节云雀大模型等出现。 2023 年: 国内大模型发展大致分为准备期(国内产学研迅速形成大模型共识)、成长期(数量和质量逐渐增长)、爆发期(开源闭源大模型层出不穷,形成百模大战态势)。 关键进展包括:Meta 开源 Llama2、OpenAI 发布多模态 GPT4V 及 GPT4 Turbo、百川智能开源 Baichuan7B 及 Baichuan2、百度升级文心一言 4.0、清华&智谱 AI 开源 ChatGLM2 及清华开源 ChatGLM3、腾讯发布混元助手等。 当前最前沿的新闻包括:过去半年,国内领军大模型企业实现了大模型代际追赶的奇迹,从 7 月份与 GPT3.5 的 20 分差距,到 11 月份测评时已在总分上超越 GPT3.5。
2025-03-14
帮我总结一下最近一周值得关注的AI新闻
以下是最近一周值得关注的 AI 新闻: 2024 年 6 月,苹果发布了 AI 原生操作系统,加强了硬件和模型布局;Claude Sonnet 3.5 发布,挑战 OpenAI;视频生成领域 Runway Gen3 和快手可灵表现优秀;AI 3D 技术逐渐崭露头角;Google 和月之暗面推出长上下文缓存技术。整体趋势是技术不断进步,各领域竞争激烈。 快手发布可灵网页版及大量模型更新;阶跃星辰发布多款模型;商汤打造类似 GPT4o 的实时语音演示;GraphRAG:微软开源新型 RAG 架构。 红杉资本美国合伙人 Pat Grady 在最新访谈中表示,AI 技术将为服务行业带来变革机遇,而非取代软件公司。AI 的潜力在于赋能服务行业,但人际关系和实际执行仍需人工。对于基础模型公司,Grady 认为它们可能像数据库公司一样发展,提供开发者 API,有机会进入应用层。他认为现有模型已足够强大,关键在于工程化优化和认知架构设计。 Netflix 列出了一个年薪 90 万美元的机器学习平台产品经理的 AI 产品工作岗位。 Shopify 的 AI 助手 Sidekick 现已上线,它知道如何在 Shopify 中执行任何操作,包括提取相关数据、操作新功能或创建报告。 Artifact(Ins 创始人做的 AI 新闻浏览软件)推出了自定义内容阅读语音的功能。 OpenAI、谷歌、微软和 Anthropic 组建了前沿模型论坛,主要目的是确保 AI 模型的安全发展。 Open AI 悄咪咪下线了他们的 ChatGPT 生成内容的检测器。 2024 年 1 月,斯坦福大学 Mobile Aloha;1 月 10 号 LumaAl Genie 文生 3D;1 月 11 号 GPT store 上线;1 月 MagnificAl 高清放大爆火;1 月最后一天苹果 Vision Pro 宣布发售。
2025-03-06
今天有什么ai新动态
以下是近期的 AI 新动态: 2024 年 3 月:AI 发展持续升温,潞晨科技发布 OpenSora,Suno 发布 V3 版本爆火。 2024 年 4 月:英伟达发布硬件,股价飙升。 2024 年 5 月:苹果发布 AI 芯片,张吕敏发布 IC light,AI 竞争白热化,伊莉雅离开 OpenAI 并成立新公司,估值超五亿美金。 2024 年 7 月:快手开源 LivePortrait 模型,实现表情迁移。 2024 年 8 月:StabilityAI 老板成立新公司发布 flux 大模型。 2024 年 9 月:阿里云发布模型,海螺 AI 参战,Google 发布 GameGen 实时生成游戏,通义千问 2.5 系列全家桶开源,华为发布 cloud matrix 云计算基础设施,GPT 高级语音模式上线,Meta 发布 AI 眼镜 Orion,AI 代码编辑器 cursor 爆火。 2024 年 10 月:Pika 发布 1.5 模型,诺奖颁发给 AI 奠基人,特斯拉发布机器人,Adobe 发布 Illustrator+Al 生成矢量图,智谱 AI 发布 autoGLM,腾讯混元开源 3D 模型。 12 月 5 日的 AI 新动态: Clone Robotics:仿生机器人公司致力于生产高仿真产品,技术和外观的进步让人类与机器人的边界变得越来越模糊。 Humane 发布 AI 驱动操作系统 CosmOS,具有多种核心功能,支持多种输入方式,并可实时从互联网获取数据为用户提供服务。 DeepMind 发布天气预测 AI 模型 GenCast,可预测未来 15 天的天气和极端天气风险,与顶级预测系统相比表现更优,且模型代码、权重和预测数据已开源。 OpenAI 的 ChatGPT 用户突破 3 亿。 在法律法规方面: 虽然 AI 概念不新,但近期数据生成和处理的进步改变了该领域及其产生的技术。例如,生成式 AI 模型的能力发展带来机会的同时也引发了关于潜在风险的新辩论。 并非所有 AI 风险都源于不良行为者的故意行为,有些可能是意外后果或缺乏适当控制导致的。 对 AI 特定风险及其潜在危害进行了初步评估,并参考了其威胁的价值,包括安全、公平、隐私、人权、社会福祉和繁荣等。 交叉的 AI 风险评估确定了一系列高级风险,框架将寻求通过适当干预来优先处理和减轻这些风险。例如,安全风险包括对人类和财产的身体损害以及对心理健康的损害。
2025-03-12
截止今天最强的模型是哪个
目前很难确切地指出截止今天最强的模型是哪一个。以下是一些表现出色的模型: Gemini Ultra:在报告的 32 个基准测试中,在 30 个基准测试中取得了 SOTA,包括多个领域的测试。它是第一个在 MMLU 上实现人类专家水平表现的模型,在多模态推理任务方面也有显著进展。 o3 模型:在 ARCAGI 测试中达到了 87.5%的准确率,几乎与人类水平相当。OpenAI 表示下一代 o3mini 模型的推理能力很强。 Gemini 2.0 Flash:Google 发布的该模型在重要的基准能力上,直接追平甚至部分超越了 Gemini 1.5 Pro,且模型速度有极大提升。 Llama 3.1:是迄今为止最大版本,其在推理、数学、多语言和长上下文任务中能够与 GPT4 相抗衡。 需要注意的是,模型的性能评估会因不同的基准测试和应用场景而有所差异,而且技术在不断发展,最强模型的定义也可能随之变化。
2025-03-05
今天有没有新的 ai 资讯
以下是为您汇总的近期 AI 资讯: 12 月 25 日: Recraft AI :更新了 60 种新的图像风格,是 AI 平面设计工具,用户可生成和编辑插画、海报、产品周边等,对所有用户每日有免费试用点数,允许商业使用。地址:https://www.recraft.ai/ AI 公文智能体“学习强国公文助手”在文小言 APP 正式上线,可进行文汇检索、AI 公文书写、AI 公文润色等。使用方式:下载文小言 APP,找寻学习强国公文助手。 2 月 13 日: Magnific AI 的图像高清化能力已在 freepik AI 上提供,订阅用户可用。地址:https://www.freepik.com/ai 百度上线深度搜索功能,同时宣布文心一言将从 4 月 1 日起全面免费。地址:https://mp.weixin.qq.com/s/lk7g2bhjBX45NHYDxU2D3w OpenAI CEO Sam Altman 深夜透露 GPT 未来路线图,数周或数月内将推出代号“Orion”的 GPT4.5,后期将融合 o 系与 GPT 系列推出 GPT5,同时结合多项新能力。ChatGPT 的免费用户也将可用到 GPT5,订阅用户享有更高智能的 GPT5。今晨 OpenAI 又更新,Openai O1 和 O3Mini 支持 CHATGPT 中的文件和图像上传,上调 O3MiniHigh 使用限制,所有 Pro 用户可在多端使用 Deep research 能力。如有问题可联系后台,电子邮箱:alolg@163.com 12 月 24 日: DisPose :由清华大学与北京大学等组织联合发布的可控人体图像动画方法,输入动作视频参考和人物图像可形成新的角色舞蹈视频。地址:https://lihxxx.github.io/DisPose/ InvSR :开源图像超分辨率模型,提升图像分辨率的开源新工具,只需一个采样步骤即可增强图像,可高清修复图像。地址、在线试用地址:https://github.com/zsyOAOA/InvSR?tab=readmeovfilerailway_caronlinedemo 、https://huggingface.co/spaces/OAOA/InvSR
2025-02-14
今天AI 的news
以下是今日有关 AI 的一些新闻: AI 大神 Karpathy 再发 LLM 入门介绍视频,提到了 LLM 的未来能力与发展趋势,包括具备多模态能力、发展为智能体、无处不在的隐形化、测试时训练、处理长上下文等。同时还介绍了跟踪 LLM 最新进展的资源,如 LLM 排行榜、AI News Newsletter 以及在 X(Twitter)上关注相关研究者和从业者。 XiaoHu.AI 日报 1 月 02 日的内容包括:小互 AI 年度总结,涵盖 2024 AI 技术与工具盘点;AI 对招聘市场的深刻影响(ZoomInfo 研究),如自 2022 年起 AI 相关职位的增长情况,以及多家公司设立 AI 相关领导角色等;微软论文疑似透露 OpenAI 模型参数。
2025-02-10
今天有什么AI资讯
以下是为您整理的今日 AI 资讯: 近期热门融资 AI 产品速递 1 st :包括多种搜索模式且重隐私的搜索引擎 You.com、通过 Sparkpages 来满足用户个性化搜索需求的 Genspark、刚被 OpenAI 收购的提供实时搜索和分析数据库服务的 Rockset、人类与 AI 共存的社交软件 Butterflies AI、可以对销售通话进行记录和辅导的 AI 助手 MeetRecord。 宝玉日报 2 月 3 日: AI 对软件工程的影响:涵盖自动代码生成、智能调试、AI 驱动的 DevOps 和敏捷开发优化等方面。 OpenAI CEO 宣布开发 AI 设备,目标颠覆智能手机,同时表达了对自研 AI 芯片的兴趣。 OpenAI 推出全新 Deep Research,让 ChatGPT 成为您的研究助理。 AIGC Weekly32 上周精选: Netflix 列出了一个年薪 90 万美元的机器学习平台产品经理的 AI 产品工作岗位。 Shopify 的 AI 助手 Sidekick 已上线,能帮助执行相关操作。 Artifact 推出了自定义内容阅读语音的功能。 OpenAI、谷歌、微软和 Anthropic 组建了前沿模型论坛,确保 AI 模型的安全发展。 Open AI 悄咪咪下线了他们的 ChatGPT 生成内容的检测器。
2025-02-08
到今天,大语言模型还会产生“幻觉”吗
截至今天,大语言模型仍会产生“幻觉”。 大语言模型偶尔会根据输入输出一些荒谬或不符合事实的内容,目前各家大语言模型在该问题上的表现都不尽如人意。产生“幻觉”的原因包括: 1. 样本存在错误(Imitative Falsehoods):如果大语言模型学习的“教材”中有错误,它也容易给出错误回答。缓解该问题的一个办法是上采样(Up Sampling)。 2. 信息过时(Outdated Factual Knowledge):以前正确的信息现在可能过时了。 此外,大语言模型通过训练数据猜测下一个输出结果,可能因错误数据导致给出错误答案,优质数据集对其很重要。如果在其训练过程中,模型被暴露于大量知识之中,它并没有完美地记忆所见到的信息,并不十分清楚自己的知识边界,可能会尝试回答有关深奥话题的问题,并虚构听起来有道理但实际不正确的内容。 在构建应用程序时,可以使用一些技术来避免这种情况,例如要求模型先从文本中找到相关引文,然后使用引文回答问题,并将答案追溯回源文件,这通常有助于减少“幻觉”的发生。
2025-01-22