Navigate to WaytoAGI Wiki →
Home/question.detail.breadcrumb.questionList/question.detail.breadcrumb.questionDetail

ai最新消息

Answer

以下是 11 月 7 日的 AI 最新消息:

  • 马斯克 xAI 公司宣布推出 PromptIDE 开发工具。
  • 阿里云 A100 服务器业务暂停出租,算力价格飞涨。
  • 微软发布 7 款针对对话优化的 AI 语音,更加逼真自然。
  • 谷歌正测试 2 项 AI 功能,以改善 YouTube 观看体验。
  • 微软将 AI 引入 Xbox,可生成 AI 角色、故事剧情等。
  • 英国一学校启用人工智能担任校长,帮助教师了解学生。
  • 百度虚拟数字人「度晓晓」携文心一言入驻淘宝。
  • 美团推出 AI 产品 Wow 定位 AI 朋友社区。链接:https://x.com/xiaohuggg/status/1721876724798136544?s=20

当前 AI 前沿技术点包括:

  1. 大模型(Large Language Models):如 GPT、PaLM 等。
  2. 多模态 AI:视觉-语言模型(CLIP、Stable Diffusion)、多模态融合。
  3. 自监督学习:自监督预训练、对比学习、掩码语言模型等。
  4. 小样本学习:元学习、一次学习、提示学习等。
  5. 可解释 AI:模型可解释性、因果推理、符号推理等。
  6. 机器人学:强化学习、运动规划、人机交互等。
  7. 量子 AI:量子机器学习、量子神经网络等。
  8. AI 芯片和硬件加速。
Content generated by AI large model, please carefully verify (powered by aily)

References

XiaoHu.AI日报

🔔小互的推特11月7日更新番外✨✨✨✨✨✨✨✨9️⃣今天被OpenAI刷屏了帮你们总结下今天别的AI新闻🚀马斯克xAI公司宣布推出PromptIDE开发工具🛑阿里云A100服务器业务暂停出租算力价格飞涨🎙️微软发布7款针对对话优化的AI语音,更加逼真自然🔍谷歌正测试2项AI功能,以改善YouTube观看体验🎮微软将AI引入Xbox,可生成AI角色、故事剧情等🏫英国一学校启用人工智能担任校长,帮助教师解学生🤖百度虚拟数字人「度晓晓」携文心一言入驻淘宝👥美团推出AI产品Wow定位AI朋友社区🔗https://x.com/xiaohuggg/status/1721876724798136544?s=20

XiaoHu.AI日报

🔔小互的推特11月7日更新番外✨✨✨✨✨✨✨✨9️⃣今天被OpenAI刷屏了帮你们总结下今天别的AI新闻🚀马斯克xAI公司宣布推出PromptIDE开发工具🛑阿里云A100服务器业务暂停出租算力价格飞涨🎙️微软发布7款针对对话优化的AI语音,更加逼真自然🔍谷歌正测试2项AI功能,以改善YouTube观看体验🎮微软将AI引入Xbox,可生成AI角色、故事剧情等🏫英国一学校启用人工智能担任校长,帮助教师解学生🤖百度虚拟数字人「度晓晓」携文心一言入驻淘宝👥美团推出AI产品Wow定位AI朋友社区🔗https://x.com/xiaohuggg/status/1721876724798136544?s=20

问:AI的技术历史和发展方向,目前最前沿的技术点有哪些

1.大模型(Large Language Models):GPT、PaLM等2.多模态AI:视觉-语言模型(CLIP、Stable Diffusion)、多模态融合3.自监督学习:自监督预训练、对比学习、掩码语言模型等4.小样本学习:元学习、一次学习、提示学习等5.可解释AI:模型可解释性、因果推理、符号推理等6.机器人学:强化学习、运动规划、人机交互等7.量子AI:量子机器学习、量子神经网络等8.AI芯片和硬件加速

Others are asking
AI现阶段的成因
AI 现阶段的成因主要包括以下几个方面: 1. 在软件领域,AI 软件公司有三种起源和结果:运行在现有软件之上的 AI 工具,如为 Zoom 会议自动记录会议笔记;运行在现有软件之上且有机会取代现有软件的 AI 工具,如为 Zoom 会议记录笔记后构建视频会议并推销;成为劳动力的 AI 工具,这是一个全新的类别。平台转变促成了前两种情况。同时,软件市场与白领劳动力市场相比规模较小,许多增长最快的公司将现有的昂贵服务转化为大众的低价产品。 2. 在医疗保健和生物技术领域,AI 正在工业化生物制药和医疗保健,应用于从药物设计、诊断到医疗保健交付和后勤功能等各个方面。 3. 在教育领域,学习通常具有功利导向,“突破性新技术+垂直行业知识”的组合能为学习者带来更高投入产出比。在 AI 领域,让 AI 工程师懂行业、让行业专家懂 AI 投入产出比高,但前提是找到高价值应用场景。现阶段“AI 口嗨者众,AI 实干家寡”的主要原因是缺乏带来足够正反馈的高价值应用场景。
2024-12-26
我想借助AI帮我理解学术名词,需要如何操作?
要借助 AI 帮助您理解学术名词,您可以采取以下几种操作方式: 1. 使用在线智能语言模型工具,如 ChatGPT 等,向其清晰准确地描述您想要理解的学术名词,并提出您的疑问和需求。 2. 利用知识问答类的 APP 或网站,输入相关学术名词,获取相关的解释和说明。 3. 对于一些特定领域的学术名词,还可以查找专门针对该领域的 AI 辅助学习工具。 在与 AI 交流时,尽量详细地描述您的困惑和期望,以便获得更准确和有用的回答。
2024-12-26
AI图生视频前沿
以下是关于 AI 图生视频前沿的相关信息: 在近半年闭源产品趋势方面: 1. 服务头部创作者方面,产品将逐渐增强编辑器能力,强化视频细节可控性,并智能化后期制作任务。 2. 影视后期方向,可将动捕演员表演转化为虚拟角色,提高特效制作效率。 3. 专业领域,创作者能通过草图分镜快速验证效果,但目前效果不够成熟。 4. 随着实时生成能力提升和成本下降,AI 实验性艺术在博物馆、展览等互动应用将增多。 5. 在 C 端大众消费侧,AI 视频在小说、网文阅读、短情景剧等内容消费方向有潜力,人物识别和替换可衍生电商平台虚拟试衣间能力。 6. 模板套用能力若以低成本开放在短视频产品中,可能带来新的爆发周期。 其他动态包括: 1. Krea 用开放的 API 做了自己的 AI 视频功能,支持对任何视频输入提示词进行延长。 2. Runway 发布 ActOne 功能,支持将现实视频的人物表情和动作迁移到生成的视频上,且已全量开放。 3. Ideogram 发布 Ideogram Canvas,可在无限画布上对生成的图片进行编辑。 4. Meta 的图像分割模型 SAM 更新了 2.1,大幅加强了相似物体和小物体的分割和识别效果。 在 2024 年国内外 AI 企业竞争方面: 1. 中国开源项目赢得全球粉丝,成为积极开源贡献者。DeepSeek 在编码任务中表现出色,阿里巴巴的 Qwen2 系列视觉能力令人印象深刻,清华大学的 OpenBMB 项目催生了 MiniCPM 项目。 2. 国外 Stability AI 发布的 Stable Video Diffusion 能从文本提示生成高质量、真实视频,并在定制化方面进步显著。今年 3 月推出的 Stable Video 3D 可预测三维轨道。 3. OpenAI 的 Sora 能生成长达一分钟的视频,保持三维一致性等,还使用原始大小和纵横比的视觉数据训练。 4. Google DeepMind 的 Veo 将文本和可选图像提示与嘈杂压缩视频输入结合,创建并解码独特的压缩视频表示。
2024-12-26
AI直播主要财务假设
以下是关于 AI 直播的主要财务假设相关内容: AI 数字人直播盈利方式: 1. 直接销售数字人工具软件,实时驱动类一年价格在 4 6 万往上(标准零售价),非实时驱动类一个月 600 元,但效果差,市场价格混乱。 2. 提供数字人运营服务,按直播间成交额抽佣。 AI 直播卖货适用品类和场景: 1. 适用于不需要强展示的商品,如品牌食品饮料;不适用于服装,过品快且建模成本高。 2. 适用于虚拟商品,如门票、优惠券等。 3. 不适用于促销场景,涉及主播话术、套路和调动氛围能力等。 4. 电商直播中,数字人直播在店播方面效果较好,数据基本能保持跟真人一样。 AI 直播的壁垒和未来市场格局: 1. 长期来看技术上无壁垒,但目前仍有技术门槛,如更真实的对口型、更低的响应延迟等。 2. 不会一家独大,可能有 4 5 家一线效果的公司,大多为二三线效果公司。 3. 真正把客户服务好、能规模化扩张的公司更有价值,疯狂扩代理割韭菜、不考虑客户效果的公司售后问题麻烦。 4. 有资源、有业务的大平台下场可能带来降维打击,例如剪映若不仅提供数字人,还提供货品供应链、数据复盘分析等全环节服务,会绑定商家,竞争难度大。 RPA + 财务税务问答机器人制作教程相关: 1. 关于 AI 税务机器人的直播准备与开场,包括封面制作、声音测试、人员分工等,并进行了直播开场。 2. AI 在税务工作中的应用及实现方式,包括利用引刀 AP 创建网页实现智能解答税务问题,结合飞书避免信息泄露和实现自动回复等。 3. 使用引到 AP 创建税务 AI 智能助手及相关部署,包括搭建知识库、创建并部署 AI 工作流,还提及结合飞书功能使用的原因。 4. 飞书机器人与引到 AP 的结合及相关问题,包括操作步骤、常见问题及与其他产品的区别等。 5. RPA 产品介绍及应用场景,杭州分叉智能公司成立三四年,获几亿美金融资,其 RPA 产品可控制桌面软件,实现办公流程自动化。RPA 是流程自动化机器人,可替代电脑办公中的重复有逻辑工作,为企业降本增效,底层语言用 Python,使用界面为全中文。适用场景如开具大量发票、查询大量出租车违章、朋友圈点赞等,在财务领域可用于开票、网银流水下载等。还展示了创建 RPA 机器人的流程,通过指令控件让机器人执行任务,操作比代码更简单。公司多人多部门使用 RPA 可实现无人化办公专区,提高办公效率,节省人力时间成本。
2024-12-26
ai视频前沿
以下是关于 AI 视频前沿的相关信息: AI 视频学社: 简介:为方便大家测试学习 AI 视频相关知识和内容而建立,可通过参与每周比赛、观看高手直播分享来快速学习,涵盖 AI 视频和影视创作领域最前沿的知识。 目标: 不定期直播,AI 视频方向高手直播分享。 每周固定 1 次 video battle 视频挑战赛,周一发布主题,周日 18 点前交稿,有奖品。 不定期组织线上或者线下活动。 一起学习 AI 视频最新软件和最新知识,学习图生视频、视频生视频等技巧。 软件教程: 每周一赛: 2024 人工智能报告: 2024 年是 AI 图像视频迅速发展的一年,赛道竞争激烈。 国内:中国开源项目赢得全球粉丝,成为积极开源贡献者。几个模型在个别子领域表现出色,如 DeepSeek 在编码任务中受青睐,阿里巴巴的 Qwen2 系列视觉能力印象深刻,清华大学的 OpenBMB 项目催生了 MiniCPM 项目。 国外:Stability AI 发布的 Stable Video Diffusion 能从文本提示生成高质量、真实视频,还推出了 Stable Video 3D。OpenAI 的 Sora 能生成长达一分钟的视频,保持三维一致性等。Google DeepMind 的 Veo 将文本和图像提示与视频输入结合生成高分辨率视频。 AI 视频生成产品推荐及实践教学: Runway:年初在互联网爆火,由总部位于旧金山的 AI 创业公司制作,2023 年初推出的 Gen2 代表当前 AI 视频领域前沿模型,能通过文字、图片等生成 4s 左右视频,致力于专业视频剪辑领域的 AI 体验,同时扩展图片 AI 领域能力。目前支持网页、iOS 访问,网页端有 125 积分免费试用额度(可生成约 105s 视频),iOS 有 200 多,两端额度不同步。官方网站:https://runwayml.com/ Gen1 和 Gen2 的区别和使用方法:Gen1 的主要能力有视频生视频、视频风格化、故事版、遮罩等,仅支持视频生视频是与 Gen2 的最大差异。Gen1 使用流程: Gen1 能力介绍:https://research.runwayml.com/gen1 Gen1 参数设置:https://help.runwayml.com/hc/enus/articles/15161225169171 学习视频:https://youtu.be/I4OeYcYf0Sc
2024-12-26
AI 哪些功能可以用于运动人群
以下是 AI 在运动人群方面的相关功能和应用: 1. AI 健身:利用人工智能技术辅助或改善健身训练和健康管理。通过算法和数据分析为用户个性化地指导锻炼、提供健康建议、监测运动进度和反馈。应用于健身应用程序、智能健身设备和在线健身培训等领域,为用户提供更智能、更个性化的健身体验。 2. 健身的 AI 工具: Keep:中国最大的健身平台,提供全面的健身解决方案。网址:https://keep.com/ Fiture:由核心 AI 技术打造,集硬件、丰富课程内容、明星教练和社区于一体。网址:https://www.fiture.com/ Fitness AI:利用人工智能进行锻炼,增强力量和速度。网址:https://www.fitnessai.com/ Planfit:健身房家庭训练与 AI 健身计划,AI 教练是专门针对健身的生成式人工智能,使用 800 多万条文本数据和 ChatGPT 实时提供指导。网址:https://planfit.ai/ 此外,还有一些与运动相关的 AI 技术,如 Inworld AI 开发的角色引擎,可将游戏中的 NPC 进行 AI 化,使 NPC 能够自我学习和适应,具有情绪智能,能通过模拟人类的全方位沟通方式表达个性,其功能包括目标和行动、长期记忆、个性、情绪等。但需要注意的是,内容由 AI 大模型生成,请仔细甄别。
2024-12-26
ai最新消息
以下是 AI 领域的一些最新消息: 10 月: Gartner 发布 2025 年十大战略技术趋势。 开源多模态 LLM 框架 Janus。 开源大模型能力评估模型 CompassJudger。 Anthropic 发布新功能 computer use 以及 Claude 3.5 Haiku,更新 Claude 3.5 Sonnet。 Stability AI 发布 Stable Diffusion 3.5。 x.AI 正式推出 API。 ComfyUI V1 官方桌面版开放内测。 华为发布纯血操作系统鸿蒙 OS NEXT。 Jina AI 推出高性能分类器 Classifier API。 OpenAI 发布图像生成模型 sCM。 Midjourney 上线外部图片编辑器。 Runway 发布动画视频功能 ActOne。 Ideogram 推出 AI 画板工具 Canvas。 Genmo 开源视频生成模型 Mochi 1。 荣耀发布操作系统 MagicOS 9.0。 美国 14 岁少年与 C.AI 聊天后离世。 新华社发文表示警惕「AI 污染」乱象。 港中文&趣丸推出 TTS 模型 MaskGCT。 科大讯飞发布讯飞星火 4.0 Turbo。 阿里通义代码模式开始内测。 Anthropic Claude 新增数据分析功能。 北京市大中小学推广 AI 学伴和 AI 导学应用。 稚晖君开源「灵犀 X1」全套资料。 OpenAI 高管 Miles Brundage 离职。 3 月: 有 23 个 AI 新产品,包括来自大公司和成熟创业公司的新产品、有用的、有趣的以及华人开发者所搭建的小产品。 有关于呼吁暂停/禁止大模型训练以及研究 AI 技术发展、垂直领域应用、商业落地形态和人机共生问题的不同立场。 2024 年: 来自剑桥大学、AI 风险投资公司 Air Street Capital 创始人兼 CEO Nathan Benaich 和来自牛津大学、Air Street Capital 平台负责人 Alex Chalmers 共同发表《State of AI Report》2024 人工智能现状报告,主要围绕人工智能(AI)领域的最新进展、政治动态、安全挑战及未来预测几大方面进行说明。
2024-12-16
chatpgt有什么最新消息
以下是关于 ChatGPT 的一些最新消息: Gradio 发布了 Gradio Discord Bot,允许在 Discord 服务器中使用 Spaces 中的演示进行语言翻译、文字转语音、文字生成图像等。 Hugging Face 现在可以使用 Docker Spaces。 OpenAI 预测到 2024 年收入将达到 10 亿美元。 ChatGPT 推出了更新,现在可以查看以前的历史对话。 2024 年 1 月 27 日,ChatGPT 又更新了,推出了新的 Mention 功能,可以在聊天窗口中通过@直接召唤任何 GPTS。 2024 年 4 月 26 日,ChatGPT 更新,正式推出个性化新功能,可以记住用户过去提到的内容,用户可自行决定要记住什么。
2024-09-26
24小时内中国AI医美最新消息
以下是为您找到的关于中国 AI 医美的相关消息: 有一个将 AI 和中医结合的项目,其先是用摄像头观察患者的口腔和舌苔,再用指尖传感器号脉,然后根据观测的数据生成选择题让患者作答,最后 AI 会生成药方。该项目目前应用在辅助看诊,能够提高诊疗效率,创始人的愿景是在未来实现 24 小时独立问诊开药。 但目前没有关于 24 小时内中国 AI 医美最新消息的准确和详尽内容。要获取最新的信息,您可以查阅相关的科技新闻网站、学术论坛或关注人工智能领域的社交媒体平台。
2024-09-17
24小时内中国AI前沿科技最新消息
以下是 24 小时内中国 AI 前沿科技的最新消息: 阿里 CEO 吴泳铭表示将开源国内最大 720 亿参数模型。 京东 CEO 称正在测试 AI 自动生成营销内容。 此外,还有一些国际上的 AI 相关消息: 苹果新专利:CGR 技术生成虚拟形象,展示穿戴效果。 微软 AI 专利:充当治疗师,疏导心理问题。 苹果改造 Siri:明年或用大语言模型。 谷歌 Open Se Cura:为 Pixel 带来低功耗 AI。 微软计划:AI 助手 Copilot 将进入 Windows 10。 亚马逊成立 AI 训练团队,投资数百万美金。 ChatGPT 持续宕机,CEO 道歉。 GitHub Universe 2023 新功能:新的 Copilot 聊天功能,Copilot 支持手机应用,GitHub Copilot Workspace,产问题查询 GitHub Copilot 企业版:每月 39 美元的高级服务。GitHub Copilot 合作伙伴计划,GitHub 高级安全功能。
2024-09-17
AI 数字人最新消息
以下是关于 AI 数字人的最新消息: 目前业界对于数字人的定义尚未统一,一般可根据技术栈分为真人驱动和算法驱动两类。算法驱动数字人的相关开源代码有很多,如 ASR 语音识别方面的 openai 的 whisper(https://github.com/openai/whisper)、wenet(https://github.com/wenete2e/wenet)、speech_recognition(https://github.com/Uberi/speech_recognition,这是一个语音识别的接口集合,包含不同实现的语音识别接口)。AI Agent 大模型部分包括 ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等,Agent 部分可使用 LangChain 的模块进行自定义(https://www.langchain.com/)。TTS 方面,有微软的 edgetts(https://github.com/rany2/edgetts,只能使用里面预设的人物声音,目前接口免费)、VITS(https://github.com/jaywalnut310/vits)以及专注于唱歌的 sovitssvc(https://github.com/svcdevelopteam/sovitssvc,前段时间很火的 AI 孙燕姿就与其相关)。 4 月 25 日的消息: Synthesia 推出新型虚拟数字人 Expressive1,能通过脚本预测表情,数字人可自动解析和理解文本情绪,实现表情和声音同步。链接:https://x.com/imxiaohu/status/1783505405488054433 360 AI 浏览器新版增加了视频总结、提问、转录和翻译功能,支持本地和网络视频的内容分析,但无法提取无对白视频摘要。链接:http://browser.360.cn/ai https://x.com/imxiaohu/status/1783495437422649719 全球最大 AI 知识库“通往 AGI 之路”网站访问量突破 1000 万,网站内容丰富,旨在推动 AI 知识的普及。链接:http://WaytoAGI.com https://x.com/imxiaohu/status/1783475002815471669 日本横须贺市使用 AI 技术克隆市长,用于发布英语信息,技术应用广泛,包括灾难信息传播和旅游信息发布。
2024-09-12
AI数字人的最新消息
以下是关于 AI 数字人的最新消息: 4 月 25 日,Synthesia 推出新型虚拟数字人 Expressive1,能通过脚本预测表情,可自动解析和理解文本情绪,实现表情和声音同步。链接:https://x.com/imxiaohu/status/1783505405488054433 11 月 7 日,百度虚拟数字人“度晓晓”携文心一言入驻淘宝。链接:https://x.com/xiaohuggg/status/1721876724798136544?s=20
2024-09-12