Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

帮我总结一下最近一周值得关注的AI新闻

Answer

以下是最近一周值得关注的 AI 新闻:

  • 2024 年 6 月,苹果发布了 AI 原生操作系统,加强了硬件和模型布局;Claude Sonnet 3.5 发布,挑战 OpenAI;视频生成领域 Runway Gen3 和快手可灵表现优秀;AI 3D 技术逐渐崭露头角;Google 和月之暗面推出长上下文缓存技术。整体趋势是技术不断进步,各领域竞争激烈。
  • 快手发布可灵网页版及大量模型更新;阶跃星辰发布多款模型;商汤打造类似 GPT-4o 的实时语音演示;GraphRAG:微软开源新型 RAG 架构。
  • 红杉资本美国合伙人 Pat Grady 在最新访谈中表示,AI 技术将为服务行业带来变革机遇,而非取代软件公司。AI 的潜力在于赋能服务行业,但人际关系和实际执行仍需人工。对于基础模型公司,Grady 认为它们可能像数据库公司一样发展,提供开发者 API,有机会进入应用层。他认为现有模型已足够强大,关键在于工程化优化和认知架构设计。
  • Netflix 列出了一个年薪 90 万美元的机器学习平台产品经理的 AI 产品工作岗位。
  • Shopify 的 AI 助手 Sidekick 现已上线,它知道如何在 Shopify 中执行任何操作,包括提取相关数据、操作新功能或创建报告。
  • Artifact(Ins 创始人做的 AI 新闻浏览软件)推出了自定义内容阅读语音的功能。
  • OpenAI、谷歌、微软和 Anthropic 组建了前沿模型论坛,主要目的是确保 AI 模型的安全发展。
  • Open AI 悄咪咪下线了他们的 ChatGPT 生成内容的检测器。
  • 2024 年 1 月,斯坦福大学 Mobile Aloha;1 月 10 号 LumaAl Genie 文生 3D;1 月 11 号 GPT store 上线;1 月 MagnificAl 高清放大爆火;1 月最后一天苹果 Vision Pro 宣布发售。
Content generated by AI large model, please carefully verify (powered by aily)

References

2024 年历史更新(归档)

《[普通人的AGI技术月评2024.06|Apple,Sonnet3.5,视频生成,AI 3D](https://mp.weixin.qq.com/s/reHLLWeDdYbfqamxdWVGTA)》2024年6月,苹果发布了AI原生操作系统,加强了硬件和模型布局;Claude Sonnet 3.5发布,挑战OpenAI;视频生成领域Runway Gen3和快手可灵表现优秀;AI 3D技术逐渐崭露头角;Google和月之暗面推出长上下文缓存技术。整体趋势是技术不断进步,各领域竞争激烈。《[AIGC Weekly#79](https://waytoagi.feishu.cn/wiki/A6TWwVPTrioyjhknjtdcjugQnHd)》歸藏老师的新一期AIGC周刊,上一周主要的AI新闻有:1.快手发布可灵网页版及大量模型更新;2.阶跃星辰发布多款模型;3.商汤打造类似GPT-4o的实时语音演示;4.GraphRAG:微软开源新型RAG架构……《[红杉美国合伙人Pat Grady最新洞察:AI不会取代软件,而是带来新的商业模式和机会,但人际关系与执行仍依赖人工](https://mp.weixin.qq.com/s/pvc4fuRKFIi5g8ispYXCGw)》红杉资本美国合伙人Pat Grady在最新访谈中表示,AI技术将为服务行业带来变革机遇,而非取代软件公司。AI的潜力在于赋能服务行业,但人际关系和实际执行仍需人工。对于基础模型公司,Grady认为它们可能像数据库公司一样发展,提供开发者API,有机会进入应用层。他认为现有模型已足够强大,关键在于工程化优化和认知架构设计。

AIGC Weekly #32

每周都有很多还挺重要但是又不需要深入分析的AI资讯,都会放在这里。Netflix列出了一个年薪90万美元的机器学习平台产品经理的AI产品工作岗位:[https://jobs.netflix.com/jobs/278437235](https://jobs.netflix.com/jobs/278437235)Shopify的AI助手现已上线。Sidekick是一个帮助机器人,它知道如何在Shopify中执行任何操作-提取相关数据、操作新功能或创建报告:[https://techcrunch.com/2023/07/26/shopify-sidekick-is-like-chatgpt-but-for-ecommerce-merchants/](https://techcrunch.com/2023/07/26/shopify-sidekick-is-like-chatgpt-but-for-ecommerce-merchants/)Artifact(Ins创始人做的AI新闻浏览软件)推出了自定义内容阅读语音的功能:[https://twitter.com/Artifact_News/status/1684631632374902784?s=20](https://twitter.com/Artifact_News/status/1684631632374902784?s=20)OpenAI、谷歌、微软和Anthropic组建了前沿模型论坛,主要目的是确保AI模型的安全发展:[https://openai.com/blog/frontier-model-forum](https://openai.com/blog/frontier-model-forum)Open AI悄咪咪下线了他们的ChatGPT生成内容的检测器:[https://techcrunch.com/2023/07/25/openai-scuttles-ai-written-text-detector-over-low-rate-of-accuracy/](https://techcrunch.com/2023/07/25/openai-scuttles-ai-written-text-detector-over-low-rate-of-accuracy/)

帆哥:2024AI大事纪

欢迎大家在评论区继续补充一些没有提到的信息,经过帆哥授权收录到了公众号:https://mp.weixin.qq.com/s/jkVCcY-YVGb5uFPuei6iOA本文档由沙粒科技@AI研究室-帆哥整理https://space.bilibili.com/2161614转载或商业用途需注明来源2024你最印象深刻的科技新闻是什么?SORA?具身机器人?还是各种AI视频轮番PK?我们总结了2024年发生的大多数AI大事,希望能够带你一起回顾这个大事频发的一年。想获得视频中的图表三联请在上面b站后台私信发送“AI”即可获得2024感谢大家!2025咱们再向星辰大海继续出发!开源时间轴大事件时间轴免责声明:本大事记经过一定筛选,带有一定倾向性,但不包含任何广告或其他商业考量,仅以新闻热、度与大众反响为依据。仅代表个人看法,如有遗漏请谅解。AI视频总结:视频回顾了2024年AI领域的重大事件,包括众多模型发布、开源竞争、科技公司动态、诺贝尔奖颁发等,总结了这一年是应用之年,未出现新算法,列出了时间轴方便总结回顾[00:00]1月AI大事件频发[00:03]回顾2024年AI大事件,1月大事件频发[01:04]1月斯坦福大学Mobile Aloha[01:11]1月10号LumaAl Genie文生3D[01:16]1月11号GPT store上线[01:26]1月MagnificAl高清放大爆火[01:37]1月最后一天苹果Vision Pro宣布发售

Others are asking
用哪个ai平台,可以识别图像户型图,给做一个三居改四居的设计方案
目前,市面上还没有专门的 AI 平台能够直接根据图像户型图为您生成三居改四居的设计方案。但是,一些与室内设计相关的软件和平台可能会对您有所帮助,例如酷家乐、三维家等,它们具有一定的户型设计和修改功能,您可以尝试使用这些平台,并结合自己的需求和创意来完成设计方案。
2025-03-06
用ai写小说
以下是关于用 AI 写小说的一些方法和建议: 1. Stuart 提出的 coze 工作流: 用 bing 搜索标题相关内容。 用程序将搜索结果结构化(不熟悉程序的可忽略或复制文中代码)。 用大模型草拟大纲,包括标题、主旨、世界观、主要角色、小说背景、情节概要。 再用大模型来写文章。 输出文章内容。 2. 陈财猫的技巧: “显式归纳与列出你想要的文本特征”,例如明确文风、文笔特点,如“几句话一换行”“以短句和对话为主,结构紧凑”“用词直白犀利”等,在调试中把握增加与删除的度。 “通过 prompt 中的描述与词语映射到预训练数据中的特定类型的文本,从而得到想要的相似样本”,直接点出文本类型,如“充满张力的女性复仇文,可能会出现在晋江文学城或者起点中文网的古代言情分类中”。 此外,还有 AI x 即兴戏剧工作坊中提到的用 midreal.ai 以「即兴喜剧」开头写短篇小说。
2025-03-06
关于AI的证书哪个比较好考
以下是关于 AI 证书的一些信息: MQ 老师是知乎的 AI 讲师,考过了国家工信部、微软、讯飞三个初级人工智能工程师证书。 阿里云提供了一些相关证书及学习资源,如大模型工程师 ACA 认证免费课程(https://edu.aliyun.com/course/3126500/?spm=5176.29043470.J_P6q6Kh9btvM4B0C3JWB96.1.2d9b8208UmzdLE&scm=20140722.S_community@@%E8%AF%BE%E7%A8%8B@@1594._.ID_1594RL_%E5%A4%A7%E6%A8%A1%E5%9E%8BACALOC_search~UND~community~UND~itemOR_serV_4P0_0 ),人工智能高级工程师 ACP 认证(https://edu.aliyun.com/certification/acp10?spm=5176.29311086.J_SnaZ2xyFQpyGfWMhLyG.3.727c3123P6zD3w )。 然而,哪个证书比较好考可能因个人的知识背景、学习能力和具体需求而异。建议您进一步了解这些证书的考试内容、要求和适用场景,结合自身情况做出选择。
2025-03-06
做PPT做好用的AI是什么
以下是一些好用的做 PPT 的 AI 工具: 1. Gamma:这是一个在线 PPT 制作网站,允许用户通过输入文本和想法提示快速生成幻灯片。它支持嵌入多媒体格式,如 GIF 和视频,以增强演示文稿的吸引力。网址:https://gamma.app/ 2. 美图 AI PPT:由知名图像编辑软件“美图秀秀”的开发团队推出。用户通过输入简单的文本描述来生成专业的 PPT 设计,包含丰富的模板库和设计元素,适用于多种场合。网址:https://www.xdesign.com/ppt/ 3. Mindshow:一款 AI 驱动的 PPT 辅助工具,提供自动布局、图像选择和文本优化等智能设计功能,还包括互动元素和动画效果。网址:https://www.mindshow.fun/ 4. 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理技术优势,提供智能文本生成、语音输入、文档格式化等功能。网址:https://zhiwen.xfyun.cn/ 此外,还有人在制作 PPT 时使用 Claude 和 Gamma.app 这两个工具,Claude 可帮助快速寻找符合条件的论文、提取精炼论文信息等,Gamma.app 用于制作 PPT。
2025-03-06
有没有能够进行会议记录的AI助手,免费的
以下是一些能够进行会议记录的免费 AI 助手: 1. 飞书妙记(https://www.feishu.cn/product/minutes):飞书的办公套件之一。 2. 通义听悟(https://tingwu.aliyun.com/home):阿里推出的 AI 会议转录工具。 3. 讯飞听见(https://www.iflyrec.com/):讯飞旗下智慧办公服务平台。 4. Otter AI(https://otter.ai/):转录采访和会议纪要。 更多会议记录工具请访问网站:https://waytoagi.com/sites/category/29 。需要注意的是,大部分工具可能有使用的时间限制,超过一定的免费时间后就需要付费了。内容由 AI 大模型生成,请仔细甄别。
2025-03-06
想要生成一张图片 用什么ai更合适
以下为您介绍几种适合生成图片的 AI 工具及相关操作流程: 1. Stable Diffusion 模型:可根据文本指令生成图片,图片的样子取决于使用者输入的提示词,非排列组合工作模式下难以出现完全相同的两张输出图片。类似于画笔,构造出的图画取决于使用者自己的设计。在当下技术背景与现实下,利用新兴智能工具,把自己的独创性思想转化为现实作品,极大地节省了创作成本。案例中法官承认这样依靠使用者的输出设计生成的图片属于美术作品,具有独创性和智力投入,受到著作权的保护。 操作流程:使用者根据自己的审美个性,通过增删提示词、修改相关参数,得出不同的图片,最后选定。 2. Tusiart: 简明操作流程: 定主题:确定生成图片的主题、风格和表达的信息。 选择基础模型 Checkpoint:根据主题选择内容贴近的模型,如麦橘、墨幽的系列模型。 选择 lora:寻找与生成内容重叠的 lora,控制图片效果及质量。 ControlNet:控制图片中特定的图像,如人物姿态、生成特定文字等,属于高阶技能。 局部重绘:下篇再教。 设置 VAE:选择 840000 。 Prompt 提示词:用英文写想要生成的内容,单词、短语之间用英文半角逗号隔开。 负向提示词 Negative Prompt:用英文写想要避免产生的内容,单词、短语之间用英文半角逗号隔开。 采样算法:一般选 DPM++2M Karras,也可参考模型作者推荐的采样器。 采样次数:选 DPM++2M Karras 时,采样次数在 30 40 之间。 尺寸:根据个人喜好和需求选择。 3. Liblibai: 简明操作流程: 定主题:确定生成图片的主题、风格和表达的信息。 选择 Checkpoint:根据主题选择内容贴近的模型,如麦橘、墨幽的系列模型。 选择 lora:寻找与生成内容重叠的 lora,控制图片效果及质量。 设置 VAE:选择 840000 。 CLIP 跳过层:设成 2 。 Prompt 提示词:用英文写想要生成的内容,单词、短语之间用英文半角逗号隔开。 负向提示词 Negative Prompt:用英文写想要避免产生的内容,单词、短语之间用英文半角逗号隔开。 采样方法:一般选 DPM++2M Karras,参考模型作者推荐的采样器更有保障。 迭代步数:选 DPM++2M Karras 时,迭代步数在 30 40 之间。 尺寸:根据个人喜好和需求选择。 生成批次:默认 1 批。
2025-03-06
如果用AI精准且快速总结视频网站的视频。
要使用 AI 精准且快速总结视频网站的视频,可参考以下步骤: 1. 对于有字幕的视频,如 B 站视频,先确认视频栏下方是否有字幕按钮,若有则说明视频作者已上传字幕或后台适配了 AI 字幕。 2. 安装油猴脚本“Bilibili CC 字幕工具”,安装后刷新浏览器,点击字幕会出现“下载”按钮。 3. 点击下载按钮,选择多种字幕格式,如带时间或不带时间的。 4. 将下载的字文字内容全选复制发送给 GPTs 进行总结。 5. 总结完视频内容后,还可继续向 AI 提问更多细节内容或与其探讨视频内容。 此外,通义千问的 Qwen2.5VL 模型在视频理解方面也有出色表现,如支持最长 1 小时视频理解,具备秒级的事件定位能力,能够对视频的不同时间段进行要点总结等。
2025-03-06
你可以帮我总结一下文本工具吗 并附上对应工具的链接
以下是为您总结的一些文本工具及对应链接: Eleven Labs:https://elevenlabs.io/ 是一款功能强大且多功能的 AI 语音软件,能生成逼真、高品质的音频,可根据上下文调整表达方式。 Speechify:https://speechify.com/ 人工智能驱动的文本转语音工具,可在多种平台使用,能将文本转换为音频文件。 Azure AI Speech Studio:https://speech.microsoft.com/portal 提供支持 100 多种语言和方言的语音转文本和文本转语音功能,还提供自定义语音模型。 Voicemaker:https://voicemaker.in/ 可将文本转换为各种区域语言的语音,并允许创建自定义语音模型。 此外,还有以下相关工具: 2txt:Image to text 转换工具,利用 AI SDK 将图片内容转换为文字,不仅限于 OCR。体验地址和开源代码链接:https://x.com/imxiaohu/status/1780101723719393780 Rewind 公司推出的 Limitless 可穿戴 AI 设备,可记录全天对话,具有记忆功能并可互动。链接:https://x.com/imxiaohu/status/1780082354226438620 Jinaai/Reader:网页内容转换工具,将任何网页 URL 转换成对大语言模型友好的输入格式,支持文本流或 JSON 输出。链接:https://x.com/imxiaohu/status/1779838323512742220 OpenAI 在日本设立办事处,发布日语 GPT4 优化模型,新模型运行速度比 GPT4 Turbo 快 3 倍。链接:https://x.com/imxiaohu/status/1779762216264466617 清华大学开发的 Taichi 光子芯片,针对通用人工智能的亿级神经元光计算芯片,适用于自动驾驶、智能制造等高级任务。链接:https://x.com/imxiaohu/status/1779685276748845189 请注意,上述内容由 AI 大模型生成,请仔细甄别。
2025-03-05
总结一下AI绘画可以用的本地工具
以下是一些可用的 AI 绘画本地工具: 1. 线上和线下结合:线上平台出图速度快,不吃本地显卡配置,无需下载大模型,但出图尺寸受限;线下部署可自己添加插件,出图质量高,但对电脑配置要求高,可能出现宕机和爆显存情况。线上可用于找参考、测试模型,线下作为主要出图工具。可在 C 站下载对应模型到本地加载部署后生图。 2. Fooocus:由 Controlnet 的作者发布的全新开源 AI 绘画工具,可和 Stable diffusion WebUI 一样部署到本地免费使用,具备便捷操作界面。 3. ComfyUI:基于节点式的 Stable Diffusion AI 绘画工具,通过将模型生成推理的 pipeline 拆分成独立节点,实现更精准工作流定制和清晰可复现性。安装框架和依赖库后即可使用。
2025-03-05
我需要一套帮我总结论文,阅读论文的最佳prompt
以下是为您提供的一套帮助总结和阅读论文的最佳 prompt 相关内容: 一、李继刚等的 prompt 最佳实践 对于给定的论文链接,总结如下: 1. 提出了基于 GPT3 的无代码聊天机器人设计工具 BotDesigner。 2. 创建了 Conversation 视图和 Error Browser 视图。 3. 观察了 10 名非专家提示设计师执行聊天机器人设计任务的行为,得出相关结论,如参与者能够进行机会性的提示迭代设计,但在生成、评估提示有效性和解释提示效果方面存在困难,倾向于过度推广和从人类交流角度过滤提示设计等。 二、小七姐的 Prompt 喂饭级系列教程小白学习指南(二) 1. 让 AI 帮您阅读文档时,可使用简单的 Prompt,如:于是这个提示词解决了你自己,和任何收到你 Prompt 的人微调几个关键信息就能自动让 GPT 或者 Kimi 帮你阅读一篇论文而且生成不错的总结啦! 2. 结合自己的生活或工作场景想一个能简单自动化的场景,例如自动给班级里的每个孩子起个昵称、自动排版微信群经常发的运营小文案等。 3. 选择一个好上手的提示词框架,如情境。 三、学术场景数据处理 1. 论文总结:GLM4Plus 结合良好的提示词能够帮助学生快速总结论文内容,提高论文梳理的效率。 2. 论文翻译:GLM 结合良好的提示词能够帮助学生快速翻译论文内容,提高论文阅读效率。 3. 论文内容扩写润色:精心设计的润色提示词可以根据特定场景进行调整,以便生成与特定平台风格相匹配的多样化润色结果。例如针对小红书的使用场景,调整提示词以匹配其特有的口语化、轻松愉快的氛围,将论文中的结论部分润色成适合在小红书上分享的生活化内容。
2025-03-05
一个可以总结文章的AI应用是怎么训练出来的?
一个可以总结文章的 AI 应用通常通过以下方式训练: 1. 数据准备:收集大量的文本数据,包括各种类型和主题的文章。 2. 模型选择:使用适合自然语言处理任务的大型语言模型,如 OpenAI 的 GPT 系列。 3. 导入相关库和加载 API 密钥:例如导入 OpenAI 并加载 API 密钥。 4. 设计提示:制定明确的提示,如要求从电子商务网站的产品评论中生成简短摘要。 5. 针对不同需求训练: 文字总结:对一般性的文字进行总结。 针对某种信息总结:例如特定领域或特定类型的信息。 尝试“提取”而不是“总结”:更侧重于关键信息的提取。 针对多项信息总结:处理多个相关的文本信息。 6. 应用拓展:不仅可以总结文章,还能总结群聊消息、B站视频等。对于 B 站视频,通过获取字幕并发送给 AI 来实现总结。 7. 与 API 配合:通过 OpenAI API 等获取有效密钥,并结合示例代码进行开发和优化。
2025-03-03
有没有这样的产品,能够通过输入X主页,获取这个人的历史所有推特的信息分析与总结
目前没有这样合法合规且普遍可用的产品。获取他人的推特信息需要遵循相关平台的规定和法律法规,未经授权获取他人的信息是不被允许的。
2025-02-28
目前我有个数据源头,可能是excle或mysql数据库。他们都含义以下字段: 发货日期 物料编号 物料描述 板块 实际已交货量 销售单位 金额(RMB) 金额(不含税RMB) 国家 品牌; 我需要创建一个智能体助手,用于分析这些数据,这个智能通助手需要能按用户需要,分析各个维度的数据,并按板块等维度汇总,并转为柱状图图表表现出现,并表现用户所有日期的近一周的变化,并阐明变化或波动是由哪些数据导致的? 结合以上需求,我需要在飞书上构建一个企业每日利润表分析与汇报助手,该选定哪种prompt框架
很抱歉,目前飞书知识库中没有关于您所描述的这种特定需求下应选定哪种 prompt 框架的相关内容。但一般来说,构建这样的企业每日利润表分析与汇报助手的 prompt 框架可以考虑以下几个方面: 1. 明确数据来源和格式:清晰描述数据来自 Excel 或 MySQL 数据库,以及包含的具体字段。 2. 定义分析维度和指标:如按板块、国家等维度汇总数据,关注利润相关的指标。 3. 设定时间范围:明确分析近一周的数据变化。 4. 描述图表要求:指定以柱状图展示数据。 5. 解释变化原因:阐明导致数据变化或波动的关键因素。 您可以根据实际情况进一步细化和完善这个框架。
2025-02-15
目前我有个数据源头,可能是excle或mysql数据库。他们都含义以下字段: 发货日期 物料编号 物料描述 板块 实际已交货量 销售单位 金额(RMB) 金额(不含税RMB) 国家 品牌; 我需要创建一个智能体助手,用于分析这些数据,这个智能通助手需要能按用户需要,分析各个维度的数据,并按板块等维度汇总,并转为柱状图图表表现出现,并表现用户所有日期的近一周的变化,并阐明变化或波动是由哪些数据导致的?
要创建这样一个智能体助手来分析您提供的数据,以下是一些建议的步骤: 1. 数据获取与预处理: 从 Excel 或 MySQL 数据库中读取数据。 对数据进行清洗和预处理,例如处理缺失值、异常值等。 2. 数据分析与计算: 按照用户需求的维度(如板块、国家、品牌等)对数据进行分组和汇总计算。 计算近一周的数据变化情况。 3. 图表生成: 使用合适的图表库(如 matplotlib、Seaborn 等)将汇总后的数据以柱状图的形式展示。 4. 变化原因分析: 通过比较不同维度的数据,找出导致变化或波动的关键因素。 在技术实现方面,您可以使用 Python 编程语言来完成上述任务。例如,使用 Pandas 库进行数据处理和分析,使用 Matplotlib 库生成图表。希望这些建议对您有所帮助,如果您在实现过程中遇到具体的技术问题,欢迎随时向我咨询。
2025-02-15
我在一周前的文章[1]里说对 DeepSeek-R1 只需要说大白话,但在三天前的文章[2]里又用了看起来还挺复杂的结构化提示词。有伙伴问我到底咋回事。这就来解释下喽。
以下是关于 DeepSeekR1 提示词的相关信息: 历史更新: 字节跳动推出新技术 OmniHuman,利用单张图片和音频生成生动视频。 DeepSeek 的出现标志着算力效率拐点显现,其优化算法架构提升算力利用效率,AI 基础大模型参数量迎来拐点,2025 年是算法变革元年,其训练过程聚焦强化学习提升推理能力。 提示词方法论: 核心原理认知:包括多模态理解、动态上下文、任务适应性等 AI 特性定位,以及采用意图识别+内容生成双通道处理等系统响应机制。 基础指令框架:包括四要素模板、格式控制语法等。 进阶控制技巧:如思维链引导、知识库调用、多模态输出。 高级调试策略:包括模糊指令优化、迭代优化法。 行业应用案例:涵盖技术开发场景、商业分析场景。 异常处理方案:如处理信息幻觉、格式偏离、深度不足等情况。 效能监测指标:包括首次响应准确率、多轮对话效率、复杂任务分解等。 在 R1 时代,使用 AI 提示词关键在于提供足够背景信息,简单大白话有效但信息量不足难达理想结果,示例和框架可助理清思路,最终影响在于思考和表达,利用乔哈里视窗分析信息需求,避免过度指令化,让 AI 自由思考以激发更高创意和效果。
2025-02-07
最近一周AI在B端有什么新闻吗
以下是最近一周 AI 在 B 端的部分新闻: 一位投资人分享了其用于深化人工智能/机器学习知识的工具和资源,包括简报(如 TLDR AI、The Sequence 等)、播客(如 No Priors podcast 等)、会议(如工业界 World AI Cannes Festival)。 AIGC Weekly32 提到:Netflix 列出年薪 90 万美元的机器学习平台产品经理岗位;Shopify 的 AI 助手 Sidekick 上线;Artifact 推出自定义内容阅读语音功能;OpenAI、谷歌、微软和 Anthropic 组建前沿模型论坛;OpenAI 下线 ChatGPT 生成内容的检测器。 XiaoHu.AI 日报中:Hebbia 获得近 1 亿美元 B 轮融资,其 AI 技术能一次处理多达数百万份文档,主要面向金融服务公司等专业领域;Character AI 推出与 AI 角色通电话的新功能,支持多种语言且可在通话和短信间无缝切换;微软文本转语音虚拟数字人上线,支持 GPT4o 的集成。
2024-12-24
2024 年值得关注的中文大模型全景图
2024 年,AI 大模型在生产和生活中落地速度迅猛,被称为国内大模型落地元年。以下是一些值得关注的情况: 国内大模型行业形成了以百度、阿里、字节等科技大厂和创业“AI 六小虎”为主要玩家的竞争格局。 2024 年 1 至 11 月,国内大模型中标项目数量和金额大幅增长,中标项目共 728 个,是 2023 年全年的 3.6 倍;中标金额 17.1 亿元,是 2023 年全年的 2.6 倍。中标项目数前五的行业分别是运营商、能源、教育、政务、金融。 厂商方面,百度以 40 个中标项目数、2.74 亿元的中标金额排名所有厂商之首,科大讯飞居第二。 在金融行业,百度以 14 个中标数量、3734.4 万元中标金额排名第一;科大讯飞居第二。 在智能终端行业,超半数手机厂商都在使用文心大模型,包括三星、荣耀、vivo、OPPO、小米等主流手机品牌;上汽大众、吉利汽车、蔚来汽车、长安汽车等十余家车企已接入百度文心大模型。 百度表现突出,截至 11 月,其文心大模型日均调用量超过 15 亿次,千帆平台帮助客户精调了 3.3 万个模型、开发了 77 万个企业应用。今年三季度财报披露,百度智能云营收达 49 亿元,同比增长 11%。 2024 年 9 月 AI 行业大事记: 9 月 12 日:李继刚再现神级 Prompt,玩法持续翻新;Mistral 发布首个多模态模型 Pixtral 12B。 9 月 13 日:商汤 Vimi 相机开放微博小程序;元象开源中国最大 MoE 大模型 XVERSEMoEA36B;OpenAI 发布 o1 模型。 9 月 14 日:人工智能生成合成内容标识办法;Jina AI 发布 ReaderLM、Jina Embeddings V3。 9 月 18 日:DeepSeek 发文庆祝登上 LMSYS 榜单国产第一,几小时后 Qwen 新模型表示不服。 9 月 19 日:云栖大会;通义万相 AI 生视频上线;快手可灵 1.5 模型新增运动笔刷能力。 9 月 20 日:腾讯元器智能体对外发布;秘塔科技产品经理 JD 走红 AI 圈;阶跃跃问接入 Step2 万亿参数 MoE 语言大模型。 9 月 21 日:大模型测试基准研究组正式成立。 9 月 23 日:钉钉 365 会员上线。 9 月 24 日:讯飞星火 API 全新升级;豆包大模型全系列发布&更新。 9 月 25 日:Vidu API 正式开放,加速企业级视频创作;OpenAI 发布高级语音功能;西湖心辰开源 WestlakeOmni。 大模型进入产业落地后,除了大模型本身能力质量要过硬外,落地应用所需要的全栈技术能力、工程化配套工具等对落地效果有直接影响。企业想要真正将大模型在自身场景落地,需要具备构建算力、数据治理、模型训练、场景落实、应用搭建、持续运营、安全合规等整套能力,大模型的竞争正在加速成为体系化之战。
2025-02-21
帮我想想三年内有争议有公众性时效性的新闻评议选题,关于无人驾驶的,贴近生活,有新意。 例子:《强制加班不应该成为企业文化》《不敢看体检报告,是我们这一代人的命吗》《理发师因听得懂话爆火,这份作业值得抄》《“网红探墓”别“自挖坟墓”》《大学生挂科8门后离奇失踪,学校有责任吗》《不招疫情班应届生,一种赤裸裸的求职歧视》
以下是为您提供的一些关于无人驾驶三年内有争议、有公众性时效性且贴近生活、有新意的新闻评议选题: 1. 《无人驾驶汽车事故频发,谁来负责?》 2. 《无人驾驶能否解决城市交通拥堵难题?》 3. 《无人驾驶普及,传统司机将何去何从?》 4. 《无人驾驶技术,是便利还是安全隐患?》 5. 《无人驾驶车辆的隐私保护,你放心吗?》 6. 《无人驾驶时代,驾照是否会成为历史?》 7. 《无人驾驶汽车的保险政策,公平吗?》 8. 《无人驾驶上路,行人安全如何保障?》 9. 《无人驾驶出租车,你敢坐吗?》 10. 《无人驾驶公交,能否改变城市出行方式?》
2024-12-05
目前有哪些值得关注的AIGC短片
以下是一些值得关注的 AIGC 短片: AIGC Weekly 76 中: Luma AI 发布的 Dream Machine 视频生成模型,图生视频表现惊艳,如美少女混剪(https://x.com/KakuDrop/status/1800928377693687890)和可爱怪物动画(https://x.com/LumaLabsAI/status/1800921393321934915)。 用已有的表情包图片生成的视频也生动搞笑,如奥斯卡合影图片(https://x.com/fofrAI/status/1801198998289608925)。 作者自己跑的测试(https://x.com/op7418/status/1801138865224454480)总结了一些要点。 Luma 官方发布的视频(https://x.com/op7418/status/1801828221996122144)介绍了模型特点和擅长内容。 AIGC Weekly 95 中: 将视频拆分为各个层级的 Demo(https://x.com/dmvrg/status/1851480809477455899)。 Midjourney 的图片编辑加上 C4D 渲染的 Framer LOGO(https://x.com/andyorsow/status/1851771716852420632)。 两个同事计划午餐约会的短片(https://x.com/iamneubert/status/1851615112878076164)。 Nicolas 这段 AI 视频素材混剪(https://x.com/iamneubert/status/1851256571856052467)。 此外,浙江在线报道了 AI 春晚,如《10 万人观看的这场 AI 春晚,有何不同》(https://china.zjol.com.cn/pinglun/202402/t20240212_26647577.shtml)提到了 Way to AGI 社区组织的相关情况。
2024-11-08
最近有什么值得关注的AI公司
以下是一些值得关注的 AI 公司: 在移动应用领域,ChatGPT 占据榜首位置,其月活跃用户数大幅领先。此外,微软 Edge、Photomath、微软基于 AI 技术全新打造的搜索引擎 Bing 以及照片美化和虚拟形象制作工具 Remini 也在移动应用前五强中。同时,有五家 AI 公司实现了“双线作战”,其网页端、移动端应用双双跻身前 50 强榜单,分别是 ChatGPT、Character.AI、chatbot 平台 Poe、图片编辑应用 Photoroom 和 Pixelcut。 AI Friendship 是令人惊讶的应用之一,其用户和使用指标显示出强烈的用户喜爱。 工作流程自动化平台 ServiceNow 通过 AI 驱动的 Now Assist 实现了近 20%的事件避免率。Palo Alto Networks 利用 AI 降低了处理费用的成本。Hubspot 利用 AI 扩大了能够支持的用户规模。瑞典金融科技公司 Klarna 通过将 AI 融入用户支持,在运行率方面节省了 4000 多万美元。
2024-10-29
人工智能训练师证书值得考吗
人工智能训练师证书是否值得考,需要综合多方面因素来判断。 从经验来看,像 MQ 老师这样在教育行业工作 15 年以上,考过了国家工信部、微软、讯飞三个初级人工智能工程师证书,并在教育场景中进行了 AI 实践的人士,能为我们提供一定的参考。 对于新手学习 AI 而言,首先要了解 AI 的基本概念,比如熟悉术语和基础概念,了解其主要分支及相互联系,还可以浏览入门文章。然后可以在相关在线教育平台上按照自己的节奏学习课程,并有机会获得证书。 在医疗保健领域,虽然 AI 具有一定的能力,如 GPT4 在美国医学执照考试中超过及格分数 20 分,但也存在不足。为了在该领域产生真正的改变,应投资创建像优秀医生和药物开发者那样学习的模型生态系统。 综合而言,人工智能训练师证书的价值取决于您的职业规划和发展需求。如果您希望在 AI 相关领域深入发展,获取相关证书可能有助于提升您的竞争力和专业认可度。但同时也要考虑证书的权威性、行业认可度以及您为获取证书所投入的时间和精力成本等因素。
2024-09-23
有哪些ai课程值得学习?
以下是一些值得学习的 AI 课程: 【野菩萨】的预习周课程,包括 AI 绘画电脑配置要求、高效 AIGC 创意者的数字人工具包、SD 插件安装方法、画静为动的 AIGC 视频制作讲解等。 基础操作课,涵盖 AI 绘画通识课、AI 摄影虚拟的真实、AI 电影穿越的大门等内容。 核心范式课程,涉及词汇的纸牌屋、核心范式应用、控制随机性等方面。 SD WebUi 体系课程,包括 SD 基础部署、SD 文生图、图生图、局部重绘等。 ChatGPT 体系课程,有 ChatGPT 基础、核心文风、格式、思维模型等内容。 ComfyUI 与 AI 动画课程,包含部署和基本概念、基础工作流搭建、动画工作流搭建等。 应对 SORA 的视听语言课程,涉及通识欢迎参加电影的葬礼、影像赏析、基础戏剧影视文学等。
2024-09-19