Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

今天的AI新闻

Answer

以下是 3 月 4 日、3 月 12 日和 3 月 14 日的 AI 新闻汇总:

3 月 4 日:

  • 【AI 3D】
    • Meshcapade:预告可从视频/图像中捕捉面部表情并具有逼真的 3D 发丝。
    • InsTaG:通过几秒钟视频学习,快速形成逼真的 3D 说话头像效果。
    • 3D-Mem:新型 3D 场景记忆框架。
  • 【AI 绘图】
    • 智谱:开源 AI 绘图 CogView4,可以在图像中生成中文字符。
    • 海螺:推出 Image-01 多功能文本转图像模型。
  • 【AI 视频】
    • Runway:网友爆料 Runway 内测能力可根据参考图像进行 Video to Video 视频风格化。
    • Vidu:API 开放平台全面开放。
  • 【AI 模型】
    • Google Colab:推出 Data Science Agent。
    • 微软:为医疗行业提供首个统一语音 AI 助手:Dragon Copilot。
    • Opera:宣布推出网页浏览器的 AI 代理。

3 月 12 日:

  • 【AI 3D】
    • BlenderMCP:与 Claude AI 沟通,在 blender 实现快速 3D 建模。
    • MIDI:单幅图像到 3D 场景生成。
    • Move AI:更新动作捕捉能力,提出 Gen 2 Spatial Motion。
  • 【AI 写作】
    • MM-StoryAgent:AI 多模态故事生成系统。
  • 【AI 视频】
    • VACE:阿里推出一体化视频创作和编辑技术。
    • VideoPainter:腾讯开源视频编辑技术。
    • Wonder Dynamics:推出摄像机轨道(Camera Track)和清洁板(Clean Plate)功能。
  • 【其他】
    • OpenAI:为开发者推出一套 AI Agent 开发套件。
    • R1-Omni:阿里情感识别模型,通过视频识别情感。
    • Luma AI:发布一种新的预训练范式 IMM,旨在突破算法瓶颈,提高生成预训练算法的性能。
    • Manus:宣布与阿里通义千问团队达成战略合作。

3 月 14 日:

  • 【AI 模型及其他】
    • 谷歌:Gemini 应用能力升级,包含升级推理模型 gemini 2.0 Flash Thinking Experimental 等多个功能提升。
    • OpenAI:4 项更新。
    • Bolt:一键将 Figma 设计转换为可运行的 Web 应用。
    • 阿里:推出 AI 旗舰应用“新夸克”。
    • 360 智脑团队:开源推理模型 Light-R1-14B-DS,复现 Deepseek 的强化学习效果。
  • 【AI 视频】
    • Pika:更新 Pikaffects,新增多款变身特效。
    • Freepik 与 Fal 平台:引入 Topaz AI 的提升“FPS 和视频分辨率”能力。
    • Krea:上线 Veo 2 模型,支持图生视频功能,但生成成本较高。
  • 【AI 绘图】
    • LBM:用于快速图像到图像转换的潜在桥匹配方法,支持可控图像重新照明、角色去除和图像修复。
  • 【AI 语音】
    • Sesame:开源 TTS 语音模型 CSM-1B。
Content generated by AI large model, please carefully verify (powered by aily)

References

3月4日 AI资讯汇总

猫叔留言:AI资讯公众号:超时空视角猫叔个人公众号:AI替代人类小红书/抖音:EverAI B站:Ever AI酱(❤这里会有教程及AI工具界面操作)[heading2]3月4日AI资讯[content]【AI 3D】Meshcapade:预告可从视频/图像中捕捉面部表情并具有逼真的3D发丝InsTaG:通过几秒钟视频学习,快速形成逼真的3D说话头像效果3D-Mem:新型3D场景记忆框架【AI绘图】智谱:开源AI绘图CogView4,可以在图像中生成中文字符海螺:推出Image-01多功能文本转图像模型【AI视频】Runway:网友爆料Runway内测能力可根据参考图像进行Video to Video视频风格化Vidu:API开放平台全面开放【AI模型】Google Colab:推出Data Science Agent微软:为医疗行业提供首个统一语音AI助手:Dragon CopilotOpera:宣布推出网页浏览器的AI代理

3月12日 AI资讯汇总

猫叔留言:AI资讯公众号:超时空视角猫叔个人公众号:AI替代人类小红书/抖音:EverAI B站:Ever AI酱(❤这里会有教程及AI工具界面操作)[heading2]3月12日AI资讯[content]【AI 3D】BlenderMCP:与Claude AI沟通,在blender实现快速3D建模MIDI:单幅图像到3D场景生成Move AI:更新动作捕捉能力,提出Gen 2 Spatial Motion【AI写作】MM-StoryAgent:AI多模态故事生成系统【AI视频】VACE:阿里推出一体化视频创作和编辑技术VideoPainter:腾讯开源视频编辑技术Wonder Dynamics:推出摄像机轨道(Camera Track)和清洁板(Clean Plate)功能【其他】OpenAI:为开发者推出一套AI Agent开发套件R1-Omni:阿里情感识别模型,通过视频识别情感Luma AI:发布一种新的预训练范式IMM,旨在突破算法瓶颈,提高生成预训练算法的性能Manus:宣布与阿里通义千问团队达成战略合作

3月14日 AI资讯汇总

猫叔留言:AI资讯公众号:超时空视角猫叔个人公众号:AI替代人类小红书/抖音:EverAI B站:Ever AI酱(❤这里会有教程及AI工具界面操作)3月14日AI资讯【AI模型及其他】谷歌:Gemini应用能力升级,包含升级推理模型gemini 2.0 Flash Thinking Experimental等多个功能提升OpenAI:4项更新Bolt:一键将Figma设计转换为可运行的Web应用阿里:推出AI旗舰应用“新夸克”360智脑团队:开源推理模型Light-R1-14B-DS,复现Deepseek的强化学习效果【AI视频】Pika:更新Pikaffects,新增多款变身特效Freepik与Fal平台:引入Topaz AI的提升“FPS和视频分辨率”能力Krea:上线Veo 2模型,支持图生视频功能,但生成成本较高【AI绘图】LBM:用于快速图像到图像转换的潜在桥匹配方法,支持可控图像重新照明、角色去除和图像修复【AI语音】Sesame:开源TTS语音模型CSM-1B,

Others are asking
什么ai可以帮我修改简历美化简历
以下是一些可以帮助您修改和美化简历的 AI 工具: 1. 超级简历优化助手:分析简历内容并提供优化建议,帮助用户优化简历提高求职成功率。 2. ResumeMatcher:AI 驱动的开源简历优化工具,提供智能关键词匹配、深入分析见解,提升简历通过 ATS 筛选的几率。 3. KickResume:提供 AI 简历重写服务,使用 OpenAI 的 GPT4 语言模型,能在几秒钟内修复简历错误、使其更专业,并使用行业术语和关键词优化简历,帮助用户通过 ATS 筛选,生成与求职职位匹配的求职信。
2025-03-18
AIGC 检测
以下是一些常见的 AIGC 检测相关的信息: AIGC 论文检测网站和工具: 1. Turnitin:是广泛使用的学术剽窃检测工具,增加了检测 AI 生成内容的功能。使用方法是上传论文,系统自动分析并提供详细报告,标示出可能由 AI 生成的部分。 2. Copyscape:主要用于检测网络上的剽窃行为,虽不是专门的 AIGC 检测工具,但可发现可能被 AI 生成的重复内容。输入文本或上传文档,系统扫描网络查找相似或重复内容。 3. Grammarly:提供语法检查和剽窃检测功能,剽窃检测部分可帮助识别可能由 AI 生成的非原创内容。将文本粘贴到编辑器中,选择剽窃检测功能,系统提供分析报告。 4. Unicheck:基于云的剽窃检测工具,适用于教育机构和学术研究,可检测 AI 生成内容的迹象。上传文档或输入文本,系统分析并生成报告,显示潜在的剽窃和 AI 生成内容。 5. :专门设计用于检测 AI 生成内容的工具,使用先进算法分析文本,识别是否由 GPT3 或其他 AI 模型生成。上传文档或输入文本,系统提供详细报告。 6. :提供免费的 AI 内容检测工具,可识别文本是否由 AI 生成。将文本粘贴到在线工具中,点击检测按钮,系统提供分析结果。 7. GPTZero:专门设计用于检测由 GPT3 生成内容的工具,适用于教育和出版行业。上传文档或输入文本,系统分析并提供报告,显示文本是否由 GPT3 生成。 8. Content at Scale:提供 AI 内容检测功能,帮助用户识别文本是否由 AI 生成。将文本粘贴到在线检测工具中,系统分析并提供结果。 判断一张图片是否 AI 生成: 可以使用一些网站,例如 ILLUMINARTY(https://app.illuminarty.ai/)。但在测试过程中可能存在误判,比如将结构严谨的真实摄影作品识别为 AI 作图,这是因为鉴定 AI 自身的逻辑算法不能像人类一样综合考虑各种不符合逻辑的表现。
2025-03-18
目前有哪些免费可用的 AI视频生成软件
以下是一些免费可用的 AI 视频生成软件: 1. Haiper:有免费额度,网址为 https://haiper.ai/ 。支持文生视频、图生视频、素描生视频、扩展视频,能生成 HD 超高清的视频。文生视频支持选择风格、秒数(2s 和 4s)、种子值。图生视频只能写提示词、秒数(2s 和 4s)。还支持视频重绘,包括局部重绘。 2. DynamiCrafter:免费,网址为 https://huggingface.co/spaces/Doubiiu/DynamiCrafter 及 https://github.com/Doubiiu/DynamiCrafter?tab=readmeovfile ,可生成 2 秒图生视频,还能做短视频拼长视频。 3. Morph studio:处于内测阶段,网址为 https://app.morphstudio.com/ 。暂未对外开放,可在官网提交内测申请。在 discord 上可以免费体验,支持文生视频、图生视频,英文提示词,支持运镜、运动强度、尺寸、秒数设置,默认生成 3s 视频。 此外,清影也是一款不错的 AI 视频生成工具,在首发测试期间所有用户均可免费使用。它具有不限量使用、生成速度快、提供配乐小功能等特色。生成参数包括时长 6s、清晰度 1440x960(3:2)、帧率 16fps 等,在风景、动物、超现实、人文历史类需求以及皮克斯风格、卡通风格、摄影风格、动漫风格等方面表现突出。 截至 2023 年,我们已经发现了 21 个公开的人工智能视频生成工具,大多数起初以 Discord 机器人的形式存在,随着产品成熟,越来越多的工具开始建立自己的网站甚至开发移动应用。
2025-03-18
使用ai绘图能够将带货产品批量换背景,使用在小红书社区
以下是一些能够为带货产品批量换背景并应用于小红书社区的人员信息: 卡飞猫:15692004031,擅长摄影写真、banner 生成、替换产品。 韩君奇:13060035786,能够批量出图,做小红书种草。 阿鱼:18102592057,擅长各种类型的 AI 画图,以及 AI 视频提效。 吴燕波:15766104311,可进行日常出图,视频等。
2025-03-18
使用ai绘图实现小红书笔记图片批量生成
以下是关于使用 AI 绘图实现小红书笔记图片批量生成的相关知识: Liblibai 简易上手教程: 1. 迭代步数:AI 调整图片内容的次数。步骤越多,调整越精密,出图效果理论上更好,但生图耗时越长,且效果提升并非线性,过多可能导致效果增长曲线放平并开始震荡。 2. 尺寸:图片生成的尺寸大小。太小 AI 生成内容有限,太大则可能放飞自我。如需高清图,可设置中等尺寸并用高分辨率修复。 3. 生成批次:用本次设置重复生成的批次数。 4. 每批数量:每批次同时生成的图片数量。 5. 提示词引导系数:指图像与 prompt 的匹配程度。数字增大图像更接近提示,但过高会使图像质量下降。 6. 随机数种子:生成的每张图都有随机数种子,固定种子后可对图片进行“控制变量”操作,如修改提示词、修改 clip 跳过层等。首次生成图时无种子。 7. ADetailer:面部修复插件,可治愈脸部崩坏,为高阶技能。 8. ControlNet:控制图片中特定图像,用于控制人物姿态、生成特定文字、艺术化二维码等,也是高阶技能。 利用 AI 批量生成、模仿和复刻《小林漫画》: 1. 需求分析:主要需求是国内可直接使用且能批量生产,选用扣子搭建工作流,可能需牺牲一定质量的文案和图片效果。 2. 批量生成句子:一次性生成的句子都进行生成图片处理,建议一次不要生成太多,如设置一次生成五句。 3. 句子提取:把生成的句子逐个提取,针对每个句子绘图。 4. 图片生成:根据生成的句子结合特有画风等描述绘图。 5. 图片和句子结合:扣子工作流支持 Python 代码,但环境缺少画图、图片处理所需包,可替换成搞定设计的方式处理图片,会用 PS 脚本效果也不错。 此外,还有一些人员在不同领域涉及 AI 绘图相关工作,如韩君奇从事批量出图和小红书种草工作。
2025-03-18
使用ai换背景能够实现真实的画面效果
使用 AI 换背景能够实现较为真实的画面效果,以下为您介绍几种相关方法: 在 SD 中,若要实现更精确的蒙版,如人物的眼睛或身上配饰等,可以使用 Segment Anything 中的 GroundingDINO 模型。启用该模型后,AI 会自动下载,也可从云盘下载放到指定文件目录。在检测提示词中输入相关内容,如“eye”,AI 可自动检测并设置蒙版,还能通过预览箱体获取眼睛编号进行单一调整。选择要修改的蒙版上传到重绘蒙版中,添加提示词如“闭眼”并生成。之后可给人物换背景,加载生成的背景蒙版,选择大模型和正向提示词,如“简单背景、花、国画、工笔”,并选择蒙版模式。若效果不佳,可将图片放入图生图中用 tile 模型细化,还可在 PS 中用创成式填充修复头发。 在 PS 中,可利用“创成式填充”去掉主体以外的人物,如在水面画选区并输入提示词添加渔船,选择头部区域添加棒球帽,选择草地部分输入提示词更换,选择树输入提示词更改等。但 PS 的“创成式填充”并非无所不能,生成的图可能质量不高或不匹配,需要更多尝试和后期处理。 Google 的 Gemini 文生图 AI 在抠图、换背景、打光影方面表现出色。如能无中生有地换背景,进行商业级别的背景合成与打光,通常能在短时间内取得稳定且较好的预期结果。
2025-03-18
我想要学习如何获取ai新闻并每天自动发送到微信等平台
以下是获取 AI 新闻并每天自动发送到微信等平台的方法: 1. 通过 Coze 实现多模态资讯的跨平台推送: 创意构思:创建 Bot 作为专属的资讯助手,通过 Coze 这样的 AI agent 流程获取最新资讯,并以多模态形式自动推送到不同平台,如微信群、企业微信群、飞书云文档多维表格等。可根据用户定制化检索需求,自动化抓取热点资讯,进行分析处理,整合成资讯文档返回 Bot 对话界面,并同步自动发送到不同平台。 效果呈现:Coze Bot 可通过不同提问触发检索功能,实现企业微信群自动同步获得资讯检索结果、与企业微信群的信息同步联动,还能获取飞书云文档多维表格中的用户需求,以及在微信群聊中调用 Coze Bot 进行对话交互检索信息。 2. 伊登:最新 Deepseek+coze 实现新闻播报自动化工作流: 工作流程: 内容获取:输入新闻链接,系统自动提取核心内容。添加网页图片链接提取插件获取网页里的图片,利用图片链接提取节点获取新闻主图,使用链接读取节点提取文字内容,接上大模型节点重写新闻成为口播稿子。 3. 用 Coze 免费打造自己的微信 AI 机器人: 搭建步骤: 组装&测试“AI 前线”Bot 机器人:返回个人空间,在 Bots 栏下找到创建的“AI 前线”,点击进入。将写好的 prompt 黏贴到【编排】模块,在【技能】模块添加需要的技能,在【预览与调试】模块输入问题与机器人对话。 发布“AI 前线”Bot 机器人:测试 OK 后,点击右上角“发布”按钮可将其发布到微信、飞书等渠道。若要发布到微信公众号,选择微信公众号渠道,点击右侧“配置”按钮,在微信公众号平台找到自己的 App ID 填入确定即可。
2025-03-17
百度的ai大模型免费的新闻?
以下是关于百度 AI 大模型免费的相关新闻: 2024 年 5 月 21 日,阿里云宣布通义千问主力模型 QwenLong 的 API 输入价格大幅下降,同时下午百度宣布文心大模型两大主力模型全面免费。 2024 年 2 月 13 日,百度宣布文心一言将全面免费,AI 价格战加剧。
2025-03-17
如何实现公众号用智能体+工作流,每天自动发《头条新闻》
要实现公众号用智能体+工作流每天自动发《头条新闻》,可以参考以下步骤: 伊登:最新 Deepseek+coze 实现新闻播报自动化工作流 工作流程详解 第一步:内容获取 1. 只需输入新闻链接,系统就能自动提取核心内容。开始节点,入参包括新闻链接和视频合成插件 api_key。 2. 添加网页图片链接提取插件,承接开始节点的新闻链接。 3. 获取网页里的图片,以 1ai.net 的资讯为例,输入新闻后提取出很多链接,其中第一条链接通常是新闻主图,其他内容多为不重要的 icon。 4. 添加图片链接提取节点,若为节省写代码时间,可直接用大模型节点提取,只拿提取的链接集合的第一条,即可搞定新闻的主要图片。 5. 接着利用调整图片的节点,将 url 属性的图片内容转化为 image 属性的图片(因为 url 节点在画板中是 string 的格式,所以必须转为 img 格式)。 6. 对于文字部分,使用链接读取节点将文字内容提取出来。 7. 在提取链接后面接上一个大模型节点,用来重写新闻成为口播稿子,可使用最强的 DeepseekR1 模型生成有吸引力的口播内容。小 tips,如果想要加上自己的特征,可以在提示词里写:“开头加上‘这里是伊登 AI’之类的个性化台词防伪”。PS:这里的 deepseekR1 基础版本是限额使用,我们可以在专业版手动接入 DeepseekR1 手动接入推理模型。 第二步:画面生成 思路是做成一帧一帧的主图+台词,配合语音合成,保证音屏同步。 1. 用批量化节点,做成一帧一帧的画面,用画板节点完成。批量处理节点输入的是格式变化后的 json 格式的文案。 2. 画面生成的重点是:在批处理中,先把一些固定内容在画板节点安排好,比如背景图片。然后引入变量元素,比如新闻图片(已经提取并转换为 img 属性)、新闻标题(来自链接读取)、口播台词(已经提取并二创)。小 tips:想要找好看的背景图推荐去可画,挑选一个好看的视频模板然后,保存为【图片】格式,然后放在画板节点,当作底图。 第三步:语音合成 使用声音合成的官方插件,引用批处理的一句一句的新闻文案内容,可调节语速和语气,多种播音风格可选。在画板和语音合成的节点后面加入图片音频合成插件。PS:这个插件需要收费,登录 https://ts.fyshark.com//userInfo,【钱包】充值获取 token,【个人中心】获取 token,放入这个节点中,不过充值 10 元可以做好久了,这个插件适合小白同学,也有不收费的插件,但是比较吃操作,如果感兴趣也可以关注后续出相关教程。这个插件的 img_audio_video 的功能是把图片+视频合成,这样就实现了一段一段的口播新闻内容。 【拔刀刘】自动总结公众号内容,定时推送到微信(附完整实操教程) 三、搭建工作流 13、循环将推送内容插入数据库 将本轮推送给用户的内容,写入数据库,下次从 rss 列表中如果再抓取到相同内容,直接跳过,避免重复推送。使用「循环」节点,输入项为第 8 步代码输出的 content_urls,这里有完整的文章内容信息。循环体设置:使用「数据库」节点,输入项为本循环节点 item 中的 url 和 suid,SQL 也是用 AI 生成的。设置循环节点的输出项:output,参数随便选,后边也用不到了。 14、结束节点 选择第 11 步输出的内容,可以在 bot 中也查看到推送的内容。 15、试运行 工作流终于搭建完了,点击右上角的试运行,选择绑定的 bot,输入数据测试。Key:输入你的 server 酱的 sendkey。rss_list:如果你没有现成的数据,可以白嫖我这个,复制下方这两条数据测试使用。试运行结果:如果工作流设置的没有问题,你会在工作流中看到这样的结果。同时,微信上也会收到这条推送,可以查看总结内容,点击链接可以查看公众号原文。点击右上角发布。
2025-03-16
请推荐最新的AI相关进展新闻
以下是一些最新的 AI 相关进展新闻: 在医疗领域: ChatGPT 和 Google Bard 等技术极大加速了医疗健康生物制药的研究,AI 在抗癌、抗衰老、早期疾病防治等方面发挥着重要作用。例如,AI 提前三年诊断胰腺癌;两名高中生与医疗技术公司合作发现与胶质母细胞瘤相关的新靶基因;AI 帮助抗衰老,筛查出高效的药物候选物;利用 AI 寻找阿尔兹海默症的治疗方法;使用神经网络分析患者体液中的生物标志物以早期诊断帕金森。 在技术应用方面: AI Agent 的突破让行业看到更多可能性,如机器人获得自主行动能力。AI 编程工具的进展预示着人机协作模式的变革。 2024 年 AI 关键进展时间线包括:2 月 OpenAI 发布视频生成模型 Sora;3 月 Suno 发布 V3 版本;4 月 Meta 发布高性能开源大模型 Llama3;5 月 GPT4 发布等。 赛博月刊显示,AI 音频公司在效果和延迟方面取得突破,3D 世界生成领域处于初级阶段但有望在明年取得巨大进步,AI 应用的更新集中在搜索、知识库、编程等领域,越来越多应用公司受到资本青睐。
2025-03-16
快速帮我补充下大模型的发展时间线和关键节点,以及当前最前沿的新闻
大模型的发展时间线和关键节点如下: 2017 年:发布《Attention Is All You Need》论文。 2018 年: Google 提出 BERT,创新性地采用双向预训练并行获取上下文语义信息及掩码语言建模。 OpenAI 提出 GPT,开创仅使用自回归语言建模作为预训练目标的方式。 2021 年:Meta 提出 Large LAnguage Model Approach(LLAMA),成为首个开源模型。 2022 年 11 月 30 日:ChatGPT 发布,在全球范围内掀起人工智能浪潮。 2022 年 12 月:字节云雀大模型等出现。 2023 年: 国内大模型发展大致分为准备期(国内产学研迅速形成大模型共识)、成长期(数量和质量逐渐增长)、爆发期(开源闭源大模型层出不穷,形成百模大战态势)。 关键进展包括:Meta 开源 Llama2、OpenAI 发布多模态 GPT4V 及 GPT4 Turbo、百川智能开源 Baichuan7B 及 Baichuan2、百度升级文心一言 4.0、清华&智谱 AI 开源 ChatGLM2 及清华开源 ChatGLM3、腾讯发布混元助手等。 当前最前沿的新闻包括:过去半年,国内领军大模型企业实现了大模型代际追赶的奇迹,从 7 月份与 GPT3.5 的 20 分差距,到 11 月份测评时已在总分上超越 GPT3.5。
2025-03-14
帮我总结一下最近一周值得关注的AI新闻
以下是最近一周值得关注的 AI 新闻: 2024 年 6 月,苹果发布了 AI 原生操作系统,加强了硬件和模型布局;Claude Sonnet 3.5 发布,挑战 OpenAI;视频生成领域 Runway Gen3 和快手可灵表现优秀;AI 3D 技术逐渐崭露头角;Google 和月之暗面推出长上下文缓存技术。整体趋势是技术不断进步,各领域竞争激烈。 快手发布可灵网页版及大量模型更新;阶跃星辰发布多款模型;商汤打造类似 GPT4o 的实时语音演示;GraphRAG:微软开源新型 RAG 架构。 红杉资本美国合伙人 Pat Grady 在最新访谈中表示,AI 技术将为服务行业带来变革机遇,而非取代软件公司。AI 的潜力在于赋能服务行业,但人际关系和实际执行仍需人工。对于基础模型公司,Grady 认为它们可能像数据库公司一样发展,提供开发者 API,有机会进入应用层。他认为现有模型已足够强大,关键在于工程化优化和认知架构设计。 Netflix 列出了一个年薪 90 万美元的机器学习平台产品经理的 AI 产品工作岗位。 Shopify 的 AI 助手 Sidekick 现已上线,它知道如何在 Shopify 中执行任何操作,包括提取相关数据、操作新功能或创建报告。 Artifact(Ins 创始人做的 AI 新闻浏览软件)推出了自定义内容阅读语音的功能。 OpenAI、谷歌、微软和 Anthropic 组建了前沿模型论坛,主要目的是确保 AI 模型的安全发展。 Open AI 悄咪咪下线了他们的 ChatGPT 生成内容的检测器。 2024 年 1 月,斯坦福大学 Mobile Aloha;1 月 10 号 LumaAl Genie 文生 3D;1 月 11 号 GPT store 上线;1 月 MagnificAl 高清放大爆火;1 月最后一天苹果 Vision Pro 宣布发售。
2025-03-06
今天有什么ai新动态
以下是近期的 AI 新动态: 2024 年 3 月:AI 发展持续升温,潞晨科技发布 OpenSora,Suno 发布 V3 版本爆火。 2024 年 4 月:英伟达发布硬件,股价飙升。 2024 年 5 月:苹果发布 AI 芯片,张吕敏发布 IC light,AI 竞争白热化,伊莉雅离开 OpenAI 并成立新公司,估值超五亿美金。 2024 年 7 月:快手开源 LivePortrait 模型,实现表情迁移。 2024 年 8 月:StabilityAI 老板成立新公司发布 flux 大模型。 2024 年 9 月:阿里云发布模型,海螺 AI 参战,Google 发布 GameGen 实时生成游戏,通义千问 2.5 系列全家桶开源,华为发布 cloud matrix 云计算基础设施,GPT 高级语音模式上线,Meta 发布 AI 眼镜 Orion,AI 代码编辑器 cursor 爆火。 2024 年 10 月:Pika 发布 1.5 模型,诺奖颁发给 AI 奠基人,特斯拉发布机器人,Adobe 发布 Illustrator+Al 生成矢量图,智谱 AI 发布 autoGLM,腾讯混元开源 3D 模型。 12 月 5 日的 AI 新动态: Clone Robotics:仿生机器人公司致力于生产高仿真产品,技术和外观的进步让人类与机器人的边界变得越来越模糊。 Humane 发布 AI 驱动操作系统 CosmOS,具有多种核心功能,支持多种输入方式,并可实时从互联网获取数据为用户提供服务。 DeepMind 发布天气预测 AI 模型 GenCast,可预测未来 15 天的天气和极端天气风险,与顶级预测系统相比表现更优,且模型代码、权重和预测数据已开源。 OpenAI 的 ChatGPT 用户突破 3 亿。 在法律法规方面: 虽然 AI 概念不新,但近期数据生成和处理的进步改变了该领域及其产生的技术。例如,生成式 AI 模型的能力发展带来机会的同时也引发了关于潜在风险的新辩论。 并非所有 AI 风险都源于不良行为者的故意行为,有些可能是意外后果或缺乏适当控制导致的。 对 AI 特定风险及其潜在危害进行了初步评估,并参考了其威胁的价值,包括安全、公平、隐私、人权、社会福祉和繁荣等。 交叉的 AI 风险评估确定了一系列高级风险,框架将寻求通过适当干预来优先处理和减轻这些风险。例如,安全风险包括对人类和财产的身体损害以及对心理健康的损害。
2025-03-12
截止今天最强的模型是哪个
目前很难确切地指出截止今天最强的模型是哪一个。以下是一些表现出色的模型: Gemini Ultra:在报告的 32 个基准测试中,在 30 个基准测试中取得了 SOTA,包括多个领域的测试。它是第一个在 MMLU 上实现人类专家水平表现的模型,在多模态推理任务方面也有显著进展。 o3 模型:在 ARCAGI 测试中达到了 87.5%的准确率,几乎与人类水平相当。OpenAI 表示下一代 o3mini 模型的推理能力很强。 Gemini 2.0 Flash:Google 发布的该模型在重要的基准能力上,直接追平甚至部分超越了 Gemini 1.5 Pro,且模型速度有极大提升。 Llama 3.1:是迄今为止最大版本,其在推理、数学、多语言和长上下文任务中能够与 GPT4 相抗衡。 需要注意的是,模型的性能评估会因不同的基准测试和应用场景而有所差异,而且技术在不断发展,最强模型的定义也可能随之变化。
2025-03-05
今天有没有新的 ai 资讯
以下是为您汇总的近期 AI 资讯: 12 月 25 日: Recraft AI :更新了 60 种新的图像风格,是 AI 平面设计工具,用户可生成和编辑插画、海报、产品周边等,对所有用户每日有免费试用点数,允许商业使用。地址:https://www.recraft.ai/ AI 公文智能体“学习强国公文助手”在文小言 APP 正式上线,可进行文汇检索、AI 公文书写、AI 公文润色等。使用方式:下载文小言 APP,找寻学习强国公文助手。 2 月 13 日: Magnific AI 的图像高清化能力已在 freepik AI 上提供,订阅用户可用。地址:https://www.freepik.com/ai 百度上线深度搜索功能,同时宣布文心一言将从 4 月 1 日起全面免费。地址:https://mp.weixin.qq.com/s/lk7g2bhjBX45NHYDxU2D3w OpenAI CEO Sam Altman 深夜透露 GPT 未来路线图,数周或数月内将推出代号“Orion”的 GPT4.5,后期将融合 o 系与 GPT 系列推出 GPT5,同时结合多项新能力。ChatGPT 的免费用户也将可用到 GPT5,订阅用户享有更高智能的 GPT5。今晨 OpenAI 又更新,Openai O1 和 O3Mini 支持 CHATGPT 中的文件和图像上传,上调 O3MiniHigh 使用限制,所有 Pro 用户可在多端使用 Deep research 能力。如有问题可联系后台,电子邮箱:alolg@163.com 12 月 24 日: DisPose :由清华大学与北京大学等组织联合发布的可控人体图像动画方法,输入动作视频参考和人物图像可形成新的角色舞蹈视频。地址:https://lihxxx.github.io/DisPose/ InvSR :开源图像超分辨率模型,提升图像分辨率的开源新工具,只需一个采样步骤即可增强图像,可高清修复图像。地址、在线试用地址:https://github.com/zsyOAOA/InvSR?tab=readmeovfilerailway_caronlinedemo 、https://huggingface.co/spaces/OAOA/InvSR
2025-02-14
今天AI 的news
以下是今日有关 AI 的一些新闻: AI 大神 Karpathy 再发 LLM 入门介绍视频,提到了 LLM 的未来能力与发展趋势,包括具备多模态能力、发展为智能体、无处不在的隐形化、测试时训练、处理长上下文等。同时还介绍了跟踪 LLM 最新进展的资源,如 LLM 排行榜、AI News Newsletter 以及在 X(Twitter)上关注相关研究者和从业者。 XiaoHu.AI 日报 1 月 02 日的内容包括:小互 AI 年度总结,涵盖 2024 AI 技术与工具盘点;AI 对招聘市场的深刻影响(ZoomInfo 研究),如自 2022 年起 AI 相关职位的增长情况,以及多家公司设立 AI 相关领导角色等;微软论文疑似透露 OpenAI 模型参数。
2025-02-10
今天有什么AI资讯
以下是为您整理的今日 AI 资讯: 近期热门融资 AI 产品速递 1 st :包括多种搜索模式且重隐私的搜索引擎 You.com、通过 Sparkpages 来满足用户个性化搜索需求的 Genspark、刚被 OpenAI 收购的提供实时搜索和分析数据库服务的 Rockset、人类与 AI 共存的社交软件 Butterflies AI、可以对销售通话进行记录和辅导的 AI 助手 MeetRecord。 宝玉日报 2 月 3 日: AI 对软件工程的影响:涵盖自动代码生成、智能调试、AI 驱动的 DevOps 和敏捷开发优化等方面。 OpenAI CEO 宣布开发 AI 设备,目标颠覆智能手机,同时表达了对自研 AI 芯片的兴趣。 OpenAI 推出全新 Deep Research,让 ChatGPT 成为您的研究助理。 AIGC Weekly32 上周精选: Netflix 列出了一个年薪 90 万美元的机器学习平台产品经理的 AI 产品工作岗位。 Shopify 的 AI 助手 Sidekick 已上线,能帮助执行相关操作。 Artifact 推出了自定义内容阅读语音的功能。 OpenAI、谷歌、微软和 Anthropic 组建了前沿模型论坛,确保 AI 模型的安全发展。 Open AI 悄咪咪下线了他们的 ChatGPT 生成内容的检测器。
2025-02-08
到今天,大语言模型还会产生“幻觉”吗
截至今天,大语言模型仍会产生“幻觉”。 大语言模型偶尔会根据输入输出一些荒谬或不符合事实的内容,目前各家大语言模型在该问题上的表现都不尽如人意。产生“幻觉”的原因包括: 1. 样本存在错误(Imitative Falsehoods):如果大语言模型学习的“教材”中有错误,它也容易给出错误回答。缓解该问题的一个办法是上采样(Up Sampling)。 2. 信息过时(Outdated Factual Knowledge):以前正确的信息现在可能过时了。 此外,大语言模型通过训练数据猜测下一个输出结果,可能因错误数据导致给出错误答案,优质数据集对其很重要。如果在其训练过程中,模型被暴露于大量知识之中,它并没有完美地记忆所见到的信息,并不十分清楚自己的知识边界,可能会尝试回答有关深奥话题的问题,并虚构听起来有道理但实际不正确的内容。 在构建应用程序时,可以使用一些技术来避免这种情况,例如要求模型先从文本中找到相关引文,然后使用引文回答问题,并将答案追溯回源文件,这通常有助于减少“幻觉”的发生。
2025-01-22