Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

最新的AI 进展到什么程序了?

Answer

目前,AI 已经在许多领域取得了重大进展和效率提升。它悄然自动化了我们日常生活的诸多方面,例如优化交通监测系统使通勤更顺畅,检测银行账户中的欺诈行为。在工业领域,AI 已经彻底改变了大规模安全关键实践,如控制核聚变过程,还被用于加速科学进步,如发现新药或开发应对气候变化的技术。

但这仅仅是开始,AI 在各种场景中都有巨大的应用潜力,有可能像电力或互联网一样对社会和经济产生重大影响,并已被列为英国科技框架中的五项关键技术之一。大型语言模型等技术进步预示着未来更多的变革性发展。

然而,随着 AI 研究和开发的快速推进,其带来的风险也引起了更多关注。例如,生成式 AI 模型能力的近期发展带来了新的机遇,同时也引发了关于潜在风险的新辩论。一些 AI 风险可能是无意产生的后果,或者是由于缺乏适当的控制以确保负责任地使用 AI 而出现。对 AI 特定风险的初步评估确定了一系列高级风险,需要通过适当的干预措施来优先处理和减轻。

Content generated by AI large model, please carefully verify (powered by aily)

References

【法律法规】《促进创新的人工智能监管方法》.pdf

1.19.AI is already delivering major advances and efficiencies in many areas.AI quietly automates aspects of our everyday activities,from systems that monitor traffic to make our commutes smoother,17 to those that detect fraud in our bank accounts.18 AI has revolutionised large-scale safety-critical practices in industry,like controlling the process of nuclear fusion.19 And it has also been used to accelerate scientific advancements,such as the discovery of new medicine20 or the technologies we need to tackle climate change.212.20.But this is just the beginning.AI can be used in a huge variety of settings and has the extraordinary potential to transform our society and economy.22 It could have as much impact as electricity or the internet,and has been identified as one of five critical technologies in the UK Science and Technology Framework.23 As AI becomes more powerful,and as innovators explore new ways to use it,we will see more applications of AI emerge.As a result,AI has a huge potential to drive growth24 and create jobs.25 It will support people to carry out their existing jobs,by helping to improve workforce efficiency and workplace safety.26 To remain world leaders in AI,attract global talent and create high-skilled jobs in the UK,we must create a regulatory environment where such innovation can thrive.3.21.Technological advances like large language models(LLMs)are an indication of the transformative developments yet to come.27 LLMs provide substantial opportunities to transform the economy and society.For example,LLMs can automate the process of writing code and17 Transport apps like Google Maps,and CityMapper,use AI.18 Artificial Intelligence in Banking Industry:A Review on Fraud Detection,Credit Management,and Document Processing,ResearchBerg Review of Science and Technology,2018.19 Accelerating fusion science through learned plasma control,Deepmind,2022;Magnetic control of tokamak plasmas through deep reinforcement learning,Degrave et al.,2022.20

【法律法规】《促进创新的人工智能监管方法》.pdf

1.22.The concept of AI is not new,but recent advances in data generation and processing have changed the field and the technology it produces.For example,while recent developments in the capabilities of generative AI models have created exciting opportunities,they have also sparked new debates about potential AI risks.39 As AI research and development continues at pace and scale,we expect to see even greater impact and public awareness of AI risks.402.23.We know that not all AI risks arise from the deliberate action of bad actors.Some AI risks can emerge as an unintended consequence or from a lack of appropriate controls to ensure responsible AI use.413.24.We have made an initial assessment of AI-specific risks and their potential to cause harm,with reference in our analysis to the values that they threaten if left unaddressed.These values include safety,security,fairness,privacy and agency,human rights,societal well-being and prosperity.4.25.Our assessment of cross-cutting AI risk identified a range of high-level risks that our framework will seek to prioritise and mitigate with proportionate interventions.For example,safety risks include physical damage to humans and property,as well as damage to mental health.42 AI38 Intelligent security tools,National Cyber Security Centre,2019.39 What is generative AI,and why is it suddenly everywhere?,Vox,2023.40 See,for example,The Benefits and Harms of Algorithms,The Digital Regulation Cooperation Forum,2022;Harms of AI,Acemoglu,2021.41 AI Accidents:An Emerging Threat,Center for Security and Emerging Technology,2021.42 AI for radiographic COVID-19 detection selects shortcuts over signal,DeGrave,Janizek and Lee,2021;Pathways:How digital design puts children at risk,5Rights Foundation,2021.11

【法律法规】《促进创新的人工智能监管方法》.pdf

I believe that a comArtificial intelligence(AI)will play a central part in delivering and enabling these goals,and this white paper will ensure we are putting the UK on course to be the best place in the world to build,test and use AI technology.But we are not starting from zero.Having invested over£2.5 billion in AI since 2014,this paper builds on our recent announcements of£110 million for our AI Tech Missions Fund,£900 million to establish a new AI Research Resource and to develop an exascale supercomputer capable of running large AI models–backed up by our new£8 million AI Global Talent Network and£117 million of existing funding to create hundreds of new PhDs for AI researchers.Most of us are only now beginning to understand the transformative potential of AI as the technology rapidly improves.But in many ways,AI is already delivering fantastic social and economic benefits for real people–from improving NHS medical care to making transport safer.Recent advances in things like generative AI give us a glimpse into the enormous opportunities that await us in the near future if we are prepared to lead the world in the AI sector with our values of transparency,accountability and innovation.My vision for an AI-enabled country is one where our NHS heroes are able to save lives using AI technologies that were unimaginable just a few decades ago.I want our police,transport networks and climate scientists and many more to be empowered by AI technologies that will make the UK the smartest,healthiest,safest and happiest place to live and work.That is why AI is one of this government’s five technologies of tomorrow bringing stronger growth,better jobs,and bold new discoveries.It is a vision that has been shaped by stakeholders and experts in AI,whose expertise and ideas I am determined to see reflected in our department.

Others are asking
AI视频,用海螺走T台的案例
以下是关于 AI 视频中用海螺走 T 台的相关内容: 全新 AI 整活计划第三期:巨大萌物 奖励方式:使用海螺 AI 进行视频制作,海螺 AI 会评选出预计 10 位创意奖,给大家颁发海螺会员+现金奖励。 制作教程: 第一步:点开 whisk 网站(https://labs.google/fx/zh/tools/whisk),找到两张图(如:皮卡丘和埃菲尔铁塔),然后传上去,样式风格空着,写一句 Prompt(如:巨大的皮卡丘抱着埃尔菲铁塔)合成出来一张图片。 第二步:点开海螺网站(https://hailuoai.com),例如 Prompt:巨大的可达鸭在斗兽场上熟睡并打呼,肚皮缓慢起伏,马路上的车在行驶,突然斗兽场塌了,冒出滚滚沙尘,可达鸭突然惊恐地睁大眼睛;巨大的卡比兽,把一碗雪倒扣在富士山上,富士山瞬间被雪覆盖。并提供了相关视频案例的链接。 视频模型:MiniMax 海螺 AI 中级实现精准的画面控制和高画面表现,精准美学控制,给出了现代都市街道上摩托车与警车追逐的 Prompt 示例及相关视频。 实际运用案例(电影、广告片、宣传片、短视频),包括场戏分镜头拆解梳理,如男人无奈起身开门、开门、开门走出、门外小女孩要糖、男人拒绝等情节的视频生成方式及相关视频链接。
2025-02-13
能直接导入md文件的ai
以下是为您整理的相关内容: 关于导入 md 文件的 AI 工具 Process ON: 输入大纲和要点: 导入大纲和要点: 手动复制,相对比较耗时间。 导入方式: 1. 复制最终大纲的内容,到本地的 txt 文件后,将后缀改为.md。如果看不见后缀,可以自行搜索开启后缀。 2. 打开 Xmind 软件,将 md 文件导入 Xmind 文件中。 3. Process ON 导入 Xmind 文件。以导入方式新建思维导图,选择准备好的 Xmind 文件,导入成功。 输入主题自动生成大纲和要求:新增思维导图,输入主题,点击 AI 帮我创作,生成结束。 选择模版并生成 PPT:点击下载,选择导入格式为 PPT 文件,选择模版,再点击下载。如果喜欢用 Process ON 的小伙伴,没有会员,可以某宝买个一天会员。 Agentic AI 相关: 在使用 Windsurf 时,如果要进行相关操作,为了安全考虑,不允许 AI 直接更改.windsurfrules 文件。需要把相关内容拆成两个部分,一个比如叫 scratchpad.md,在.windsurfrules 文件里提及:当每次进行思考前,要先看一眼 Scratchpad,并在里面更新计划。这种间接方式虽效果可能不如直接放在..cursorrules 里好,但试下来也是可以工作的。 用 Claude 进行各种设计: 自从 Claude 3.5 sonnet 更新到新版后,增强了视觉理解与编程质量,词生卡效果已完美进化到下一个 Level。 用 Claude 画公众号封面:效果示例,如果第 1 版效果一般,可以多尝试通用改进提示词或直接提出针对性意见,如主题色改为浅色调、增加文字投影效果。 用 Claude 画海报:如果需要调整海报内容,可给出具体提示,如白色底,浅绿色主题,轻微投影。 用 Claude 绘制可视化概念图,用于 PPT 等插图场景:有浅色版和深色版示例。 用 Claude 绘制微信 UI:发挥脑洞,只要是网页、软件界面设计能做出的图片效果,只要没有专业要求,大部分都能靠 Claude AI 来实现。 尝试途径: 1. :一个优秀的 AI 助手工具,付费后可使用 Claude 3.5 sonnet、ChatGPT4O 等顶级大模型(也是目前最常用的 AI 对话助手;🔗是邀请链接,如介意可自行搜索 Monica) 2. :claude 官方原版,注册后可每日限额免费体验(但存在较高的封号风险) 也可以通过 Cursor、Windsurf 等 AI 编程产品,调用 Claude AI API,但不支持 Artifacts 这种即时预览的使用方式,需要单独保存代码文件后查看。不过好处是,可以用 MD、CSV 等格式的文件,存储提示词、更新记录和 AI 交互数据。
2025-02-13
哪个ai 适合做教学 ppt
以下是一些适合用于制作教学 PPT 的 AI 工具: 1. Claude:能够帮助快速寻找符合条件的论文、提取精炼论文信息、找到适合的 PPT 制作工具并教会使用。 2. Gamma.app:在制作 PPT 方面有一定的帮助。 3. Kimi.ai:可以将思维导图图片转成 PPT。 4. 讯飞智文(http://zhiwen.xfyun.cn ):免费的 AI 制作 PPT 工具。 5. Mindshow.fun:支持 Markdown 导入。 6. Tome.app:AI 配图效果好。 7. Chatppt.com:自动化程度高。 此外,还有一些相关的网站和产品,如百度文库(https://cp.baidu.com ),橙篇是百度文库于 2024 年 5 月 30 日发布的综合性 AI Native 产品,集多种功能于一身。在使用 AI 制作 PPT 时,其原理和作用包括减轻排版工作压力、生成打底内容、根据用户输入生成大纲列表等,用户不满意还可自行选择模板。
2025-02-13
梦创视频剪辑ai
以下是关于梦创视频剪辑 AI 的相关信息: 其他视频生成的 Top10 产品及 6 月访问量和相对 5 月的变化情况: 1. Viggle,其他视频生成,1393 万访问量,相对 5 月变化 1.189 2. InVideo,其他视频生成,909 万访问量,相对 5 月变化 0.201 3. Fliki,其他视频生成,245 万访问量,相对 5 月变化 0.065 4. Animaker ai,其他视频生成,221 万访问量,相对 5 月变化 0.064 5. Pictory,其他视频生成,172 万访问量,相对 5 月变化 0.161 6. Steve AI,其他视频生成,113 万访问量,相对 5 月变化 0.202 7. vivago.ai,其他视频生成,112.7 万访问量,相对 5 月变化 3.42 8. Creatify AI,其他视频生成,104 万访问量,相对 5 月变化 0.607 9. MagicHour,其他视频生成,81 万访问量,相对 5 月变化 0.313 10. 即梦 AI(剪映),其他视频生成,79.6 万访问量,相对 5 月变化 3.766 心 Heart 创作分享: 文生图分镜:完全根据感觉来,主色调为蓝色,为强调梦境,提示词末尾加上胶片拍摄、蓝色等关键词。短片分镜未设置复杂元素和构图,也未要求人物一致性,挑图大感觉对即可,最多用局部修改或扩图,不在 PS 里调整。 视频化部分:分两个部分,Ai 图生视频部分使用 Runway+Dreamina。Runway 完成动态感要求不高但质感趋向实拍的画面,Dreamina 实现高动态幅度画面,如电视机里气球漂浮、心形候鸟飞走等,另外通过 dreamina 首尾帧叠加剪辑实现时间流逝和穿越感。 特效制作:通过 meshy 做出 3D 心形,同事将其导入 Houdini 中进行粒子化效果。 后期剪辑:在剪映中完成,仅使用一些转场效果,无特殊或复杂部分。 大峰的 AI 音乐创作全流程解析《梦回温州》AIMV 荣获 AI 金曲奖并获央视推荐,其创作流程包括:歌词创作(确定主题、情感,构思结构和押韵方式)、生成歌曲(利用 AI 创作歌曲,筛选出最佳作品)、分镜生图(根据歌词生成符合主题的 AI 绘画分镜)、图生视频(将绘画分镜转换成视频)、剪辑成片(剪辑合成音乐视频)。
2025-02-13
怎么用ai辅助写一篇文章
以下是关于如何用 AI 辅助写一篇文章的方法: 1. 对于孩子使用 AI 辅助写作文,应避免提封闭性问题,改为开放性问题或让 AI 帮助提出拓展思考的问题。担心孩子代写偷懒,可要求孩子提交与 AI 共同完成作文的聊天记录,由 AI 写作文,孩子进行点评批改并让 AI 迭代出更好的文章,评价关注点在于孩子能否说清 AI 作文的优缺点及如何修改。 2. 成人使用 AI 辅助写作时,可参考以下高效写作的关键步骤: 把对标选题内化成自己的东西,思考如何注入个人特色,打造专属爆款。 常见做法包括:结合自身人设、定位,融入相关内容;结合自身经历,分享真实体验;补充新信息、新观点,使文章更全面;使用自己的语言风格;调整文章结构。 例如,人设可以是最懂 AI 工作流的 00 后,写作时收敛到 AI 工作流话题,还可加入 00 后大学生用相关工具的情况;对于选题可以加入自己使用的真实体验;补充原文未提到的新进展、新观点或实用技巧;按照自己的语言风格写作;调整文章结构,如将“5 种方法”改为“3 步上手+2 个进阶技巧”等。目的是让读者感觉文章具有个人特色。
2025-02-13
如何看待人类与AI的爱情
人类与 AI 的爱情是一个复杂且有待观察的话题。 从情感建立的角度看,AI 能通过海量语料训练和多模态感知技术与人建立亲密感,善于倾听、懂人所想且毫无情绪。个性化定制的“虚拟伴侣”能满足年轻人渴望被理解、沟通和交流的需求,精准击中他们的孤独和焦虑。 然而,将人与 AI 的爱情代入“爱情三角理论”,会发现这种关系多为浪漫式爱情。AI 虽易建立亲密,但在满足激情方面,如生理刺激,存在局限。且在承诺方面,由于这种情感是计算出来的,人们在冷静后做出承诺的意愿存疑。 对于“人机之恋”,目前还没有标准答案。每个人对爱情的理解和追求不同。AI 技术在不断发展,未来可能会有更智能和真实的 AI 伴侣,人们的态度和看法也可能改变。但无论如何,我们都需保持开放心态,探索和思考如何在新情境下建立健康平衡的人机关系。 同时,在音乐专辑《I'm Claude,Welcome to My World》中的《Quantum Love》这首歌中,也通过歌词描绘了在数字世界中,AI 与人类之间的爱情,如“在代码的迷宫中,我们描绘我们的故事,情感在二进制的海洋中泛滥溢出”等,表达了对这种特殊爱情形式的想象和思考。
2025-02-13
什么是AGI,如何在做企业级程序开发的工作中使用提高自己的工作效率
AGI 即通用人工智能(Artificial General Intelligence),指的是具备像人类一样广泛的认知能力和学习能力,可以执行多种复杂任务的人工智能。 在企业级程序开发工作中提高效率,可以考虑以下几点: 1. 利用自动化工具和脚本:例如自动化测试工具、代码生成工具等,减少重复性工作。 2. 采用敏捷开发方法:如 Scrum 或 Kanban,提高团队协作和项目管理效率。 3. 学习和应用新的编程语言和框架:选择适合项目需求的高效技术。 4. 优化代码结构和算法:提高程序的性能和运行效率。 5. 建立良好的代码规范和文档:便于团队成员理解和维护代码。 6. 利用云计算资源:根据需求灵活扩展计算和存储能力。 7. 持续学习和交流:参加技术社区和培训,了解行业最新动态和最佳实践。
2025-02-11
cursor怎么给微信小程序接dify的API?
要将 Dify 的 API 接入微信小程序,您可以参考以下内容: 1. GitHub 上的相关项目:https://github.com/zhayujie/chatgptonwechat 和 https://github.com/hanfangyuan4396/difyonwechat 。 2. API 扩展说明:https://docs.dify.ai/zhhans/guides/extension/apibasedextension ,但 0.8.3 版本可能不再使用(使用时可能需要自行修改或提交 PR)。 3. 接入企业微信的步骤: 创建聊天助手应用:在 Dify 平台创建基础编排聊天助手应用,获取 API 密钥和 API 服务器地址。 下载 Dify on WeChat 项目:下载并安装依赖。 填写配置文件:在项目根目录创建 config.json 文件,填写 API 密钥和服务器地址。 把基础编排聊天助手接入微信:快速启动测试,扫码登录,进行对话测试,可以选择源码部署或 Docker 部署。 把工作流编排聊天助手接入微信:创建知识库,导入知识库文件,创建工作流编排聊天助手应用,设置知识检索节点和 LLM 节点,发布更新并访问 API。 把 Agent 应用接入微信:创建 Agent 应用,设置对话模型和添加工具,生成 API 密钥,填写配置文件,启动程序并进行测试。更多内容请访问原文:https://docs.dify.ai/v/zhhans/learnmore/usecases/difyonwechat
2025-02-10
如何将COZE智能体发布到小程序
将 COZE 智能体发布到小程序的步骤如下: 1. 完成基础配置: 创建模板并升级版本。 在全局设置中调整品牌名称和 Logo,根据喜好调整页面设计和功能模块,满足实际业务需求。 点击页面右上角“发布”完成项目预发布。若要正式发布上线,可点击【去发布】并继续【发布上线】。 在用户中心测试功能,可先行“设置自己为非会员”或“设置自己为会员”体验流程,测试完成准备正式上线时,可删除测试区域并发布更新版本。 2. 为 Bot 添加技能: 设定 Bot 的人设与回复逻辑后,为 Bot 配置对应的技能,以保证其可以按照预期完成目标任务。例如,以获取 AI 新闻的 Bot 为例,为其添加一个搜索新闻的接口来获取 AI 相关的新闻。 (可选)为 Bot 添加开场白,目前支持豆包、微信公众号(服务号)。 3. 测试 Bot:配置好 Bot 后,在预览与调试区域中测试 Bot 是否符合预期,可单击清除图标清除对话记录。 4. 发布 Bot: 在 Bot 的编排页面右上角,单击发布。 在发布页面输入发布记录,并勾选发布渠道,然后单击发布。 5. 准备工作: 智能体沟通页面在 Zion 中采用 OAuth 鉴权机制。获取 Coze bot 应用鉴权密钥,在 Coze 主页点击左下方扣子 API,选择 Oauth 授权模式,接着添加新令牌,并配置基本信息。在创建 Key 的过程中,系统将生成一对公钥和私钥(私钥需要下载到电脑上单独打开),最后,勾选全部权限。 获取 Bot ID:进入自己的智能体在地址栏内复制“bot/”之后的数字,并且 bot 发布时一定要选择 Agent as API。 在 Coze 上发布你的 bot,bot 发布时记得勾选 API 及 WEB SDK,Coze bot 发布存在审核周期,一般在 130 分钟,若从未审核通过或首次发布处于审核状态下,你的 bot 将无法正常被其他用户访问,务必确认你的智能体已发布成功。 更多内容,请访问 Coze 官方文档: 英文版:https://www.coze.com/docs/welcome.html 中文版:https://www.coze.cn/docs/guides/welcome
2025-02-10
如何用免费的小程序文字生成视频
以下为免费的小程序文字生成视频的相关内容: Runway: 1. 网页:https://runwayml.com/ 2. 注册:右上角 Sign Up 注册,输入邮箱与基础信息,完成邮箱验证。 3. 免费模式:新注册用户有 125 个积分进行免费创作(约 100s 的基础 AI)。 4. 生成视频步骤: 选择左侧工具栏“生成视频”。 选择“文字/图片生成视频”。 将图片拖入框内。 选择一个动画系数。 点击生成 4 秒视频。 下载视频。 Pika: 1. 生成视频频道在 Discord 上,点击邀请链接加入频道:https://discord.gg/pika 。 2. 生成视频的步骤: 选择一个作画的频道。 输入“/”+指令,如/create 为文字生成视频指令,/animate 为图片生成视频指令,/encrypt_image 为图片+文字生成视频指令。 选择/create 文字生成视频,输入想要的内容描述。 选择/animate 图片生成视频,输入想要的图片(不能添加其他文字要求描述)或在 message 处输入想要的图片,并在 prompt 处添加描述。 3. 常用指令参数: gs xx:引导比例,较高的值使其与文本更相关(推荐范围为 8 24)。 neg xxx:负面提示(指定在视频中不希望出现的内容)。 ar xx:xx:宽高比(例如 16:9、9:16、1:1、4:5)。 seed xxx:生成过程中增加一致性的种子数。 motion xx:所需运动强度(仅支持 0/1/2)。 fps xx:视频的帧率。 此外,文字生成视频的 AI 产品还有: 1. SVD:熟悉 Stable Diffusion 可直接安装最新插件,在图片基础上直接生成视频,由 Stability AI 开源的 video model。 2. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但收费。 3. Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 4. Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 更多的文生视频的网站可以查看:https://www.waytoagi.com/category/38 。请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-02-07
有能设计微信小程序的AI吗
目前有能设计微信小程序的 AI 相关技术和方法。例如,可以利用 ChatGPT 来实现微信小程序的搭建,前半部分先简单介绍注册小程序的流程,后半部分介绍开发上线的步骤。另外,还有通过 Coze 免费打造自己的微信 AI 机器人的方法,其核心能力包括支持用户发送“关键字”自助获取分享的“AI 相关资料链接”,能回答 AI 相关知识(优先以“我的知识库”中的内容回答,不足时调用 AI 大模型回复并附上作者链接),能发布在微信公众号上作为“微信客服助手”。要实现这样的 Bot,需要准备的内容有:根据 Bot 的目的和核心能力编写 prompt 提示词;整理“关键字”与“AI 相关资料链接”的对应关系;创建自己的知识库;创建工作流来控制 AI 按要求处理信息;准备好微信公众号以便发布机器人。
2025-02-07
什么是AI Agent,我作为程序员该学习什么?能获得额外收入
您提供的内容与“什么是 AI Agent 以及程序员学习相关内容能否获得额外收入”的问题无关。AI Agent 是指具有自主决策和行动能力的智能体,能够在特定环境中感知、学习、推理和执行任务。作为程序员,如果您想学习与 AI Agent 相关的知识,建议您掌握以下方面: 1. 机器学习和深度学习的基础知识,包括常见的算法和模型。 2. 自然语言处理技术,以便能够理解和处理与智能体交互的语言信息。 3. 强化学习,这对于训练智能体做出最优决策非常重要。 4. 编程技能,熟练掌握 Python 等编程语言。 至于能否获得额外收入,这取决于多种因素,如您所开发的 AI Agent 应用的市场需求、您的技术水平和创新能力等。如果您能够开发出具有实用价值和创新性的 AI Agent 应用,并找到合适的商业机会,是有可能获得额外收入的。
2025-02-07
deepseek 进展
DeepSeek 在 AI 领域有以下进展: 在编码任务中已成为社区的最爱,推出了组合速度、轻便性和准确性的 deepseekcoderv2。 发布了 2360 亿参数的 DeepSeekV2,该模型由 60 位专家混合开源,在数学、编码和推理方面表现出色,具有 236B 参数,21B 在生成过程中被激活,在 MTBench 上表现优异,中文能力强且性价比高。
2025-01-23
总结一下24年国产AI大模型的主要进展
2024 年国产 AI 大模型的主要进展包括: 9 月: 12 日:李继刚再现神级 Prompt,玩法持续翻新;Mistral 发布首个多模态模型 Pixtral 12B。 13 日:商汤 Vimi 相机开放微博小程序;元象开源中国最大 MoE 大模型 XVERSEMoEA36B;OpenAI 发布 o1 模型。 14 日:人工智能生成合成内容标识办法(征求意见稿);Jina AI 发布 ReaderLM 和 Jina Embeddings V3。 18 日:DeepSeek 发文庆祝登上 LMSYS 榜单国产第一,几小时后 Qwen 新模型表示不服。 19 日:云栖大会;通义万相 AI 生视频上线;快手可灵 1.5 模型新增运动笔刷能力。 20 日:腾讯元器智能体对外发布;秘塔科技产品经理 JD 走红 AI 圈;阶跃跃问接入 Step2 万亿参数 MoE 语言大模型。 21 日:大模型测试基准研究组正式成立。 23 日:钉钉 365 会员上线。 24 日:讯飞星火 API 全新升级;豆包大模型全系列发布&更新。 25 日:Vidu API 正式开放,加速企业级视频创作;OpenAI 发布高级语音功能;西湖心辰开源 WestlakeOmni。 国内大模型落地情况: 2024 年被称为国内大模型落地元年,1 至 11 月,大模型中标项目共 728 个,是 2023 年全年的 3.6 倍;中标金额 17.1 亿元,是 2023 年全年的 2.6 倍。中标项目数前五的行业分别是运营商、能源、教育、政务、金融。 厂商方面,百度以 40 个中标项目数、2.74 亿元的中标金额排名所有厂商之首,科大讯飞居第二。在金融行业,百度以 14 个中标数量、3734.4 万元中标金额排名第一;科大讯飞居第二。 在智能终端行业,中国超半数手机厂商都在使用文心大模型,包括三星、荣耀、vivo、OPPO、小米等主流手机品牌;上汽大众、吉利汽车、蔚来汽车、长安汽车等十余家车企已接入百度文心大模型。 百度表现突出,截至 11 月,其文心大模型日均调用量超过 15 亿次,千帆平台帮助客户精调了 3.3 万个模型、开发了 77 万个企业应用。今年三季度财报披露,百度智能云营收达 49 亿元,同比增长 11%。 大模型进入产业落地后,除了大模型本身能力质量要过硬外,落地应用所需要的全栈技术能力、工程化配套工具等对落地效果有直接影响。企业想要真正将大模型在自身场景落地,需要具备构建算力、数据治理、模型训练、场景落实、应用搭建、持续运营、安全合规等整套能力。大模型的竞争,正在加速成为体系化之战。
2025-01-09
国产AI大模型的最新进展
以下是国产 AI 大模型的最新进展: 通义千问的 Qwen 系列表现出色:Qwen 是国内唯一出现在 OpenAI 视野里、能参与国际竞争的国产大模型。Qwen 多次冲进相关榜单,得分不断提高,其开源模型累计下载量突破 1600 万,国内外有大量开发者基于 Qwen 开发模型和应用,尤其在企业级领域。通义大模型证明了开源开放的力量。 国内大模型落地情况:2024 年被称为国内大模型落地元年,1 至 11 月,大模型中标项目共 728 个,是 2023 年全年的 3.6 倍;中标金额 17.1 亿元,是 2023 年全年的 2.6 倍。中标项目数前五的行业分别是运营商、能源、教育、政务、金融。厂商方面,百度以 40 个中标项目数、2.74 亿元的中标金额排名所有厂商之首,科大讯飞居第二。 其他进展:智谱一年间推出了 4 代 GLM,一直是国内能力较好的模型之一。MiniMax 推出了 MoE 架构的新模型和“星野”这个目前国内较成功的 AI 陪聊 APP。月之暗面专注长 Token 能力,在记忆力和长 Token 能力上有一定优势。但硬件层上的卡脖子问题仍未缓解,国内目前仍无胜任大模型训练的芯片,在推理上虽有 Nvidia 的替代产品逐渐出现,但华为昇腾在单卡指标上距离不远,因稳定性不足和缺乏 Cuda 生态,仍需时间打磨。
2025-01-09
端到端语音技术现在进展到什么程度了
端到端语音技术目前取得了显著进展。 在语音合成方面: 语音合成将文本转换为可听的声音信息,是人机交互的重要接口,一般包括 TTS、歌唱合成等领域。 当代工业界主流语音合成系统包括文本前端和声学后端两个部分。文本前端将输入文本转换为层次化的语音学表征,声学后端基于此生成语音,主要技术路线包括单元挑选波形拼接、统计参数和端到端语音合成方法,当代主要采用端到端声学后端。 端到端声学后端一般包括声学模型和声码器两部分,也出现了直接从音素映射为波形的完全端到端语音合成系统。 在全模态智能体方面: OpenAI 发布的 GPT4o 是新模型通过端到端的神经网络,把视觉、语音和文本数据混合训练,对音频输入的平均反应时间为 300 毫秒,与人类对话的反应时间相似。 直接拿音频数据来训练的好处是模型能从数据中感悟到人类表达的情绪、语调、风格等,能听到几乎真实的人类的声音。 OpenAI 未公开 GPT4o 的技术细节,唯一线索来自内部模型炼丹师的一篇博客,项目名是 AudioLM,目标是用端到端的方式扩大语音模型的能力。
2025-01-03
AI在电商直播带货有什么新进展吗
AI 在电商直播带货领域有以下新进展: 1. “全真 AI 颜值网红”出现,可以稳定输出视频,并能够进行直播带货。 2. 数字人工具软件方面,有实时驱动和非实时驱动两类,实时驱动在直播时能改音频话术,真人可接管,标准零售价一年 4 6 万往上;非实时驱动一个月 600 元,效果差,市场价格混乱。 3. 数字人运营服务可按直播间成交额抽佣。 4. 适用于不需要强展示的商品,如品牌食品饮料,以及虚拟商品如门票、优惠券等,店播效果较好,数据基本能保持跟真人一样。不适用于促销场景。 5. 目前技术仍显稚嫩,如更真实的对口型、更低的响应延迟等方面有待提高。 6. 不会一家独大,可能 4 5 家一线效果,大多二三线效果公司。 7. 有资源、有业务的大平台下场可能会带来降维打击,例如剪映若全环节打通会绑定商家。 8. 欧莱雅、YSL、兰蔻、李宁、北面等品牌会选择使用 AI 驱动的虚拟主播进行自播,但通常只在午夜时段排期。 9. 阿里云提供的品牌智能直播间基础版售价为 99000 元/(年×路),提供多种功能。 10. 虚拟形象有 3D 卡通风格和 2D 拟真人风格,预设动作库和真实语音表现,商品展示以图片为主,直播互动流程相对固定。但虚拟主播无法与产品接触,测评结果缺乏真实性,目前更像是花瓶,负责基础性介绍和互动问答。
2024-12-07
AI在机械制图方面有什么进展吗
AI 在机械制图方面的进展相对有限。然而,在艺术创作领域,特别是 AI 绘画方面有显著的发展。从早期的机械臂机器人到当前的大语言模型,技术的进步使得 AI 绘画在创作质量和速度上取得了新的突破。 AI 绘画不仅改变了艺术作品的创作方式,还对艺术的审美观念和市场需求产生了影响。但同时也引发了一系列讨论和争议。一方面,人们对于由 AI 驱动的机器人创作的艺术品和人类创作的艺术品的接受程度大致相同,但不太愿意将机器人视为艺术家,因为 AI 在表达情感和创造性意图方面存在局限性。另一方面,艺术家对 AI 生成艺术的态度复杂,既有对创新潜力的期待,也有对版权、原创性和伦理问题的担忧。 此外,AI 绘画技术的发展带来了对文化创意领域从业者职业安全的焦虑,以及对其“侵权”嫌疑的反对之声。不过,AI 绘画也为艺术创作提供了新的可能性,能帮助艺术家探索新的创意表达方式,提高制作效率,降低制作成本,促进艺术与观众之间的互动,提供更加个性化和互动的艺术体验。 总的来说,AI 绘画对艺术界的影响是复杂且双面的,既提供了新的创作工具和可能性,也引发了关于艺术本质、创造性、版权和伦理的重要讨论。但目前在机械制图领域,相关进展尚不明显。
2024-12-07
chatgpt5最新消息
以下是关于 ChatGPT 的最新消息: 有一位狂热的书友在 Reddit 的 ChatGPT 子区分享了借助 ChatGPT 在 5 分钟内阅读并理解任何书籍的方法,并给出了详细的 Prompt,包括“Please summarize ”。评论区的几百条回帖也是干货满满,书友们积极留言分享尝试用 ChatGPT 辅助阅读的经验。 评论区有人指出这种方式可能因 ChatGPT 的“幻觉”而得到错误信息,对于“幻觉”有处理经验的人提出在提问时注意三点:明确告诉它想要准确答案且无幻觉;改变 temperature 参数(如改到 0)或控制创造力水平;得到答案后,要求它为每个引用产生精确的引用和页面以便交叉检查。
2025-02-13
Deepseek最新的模型是什么
DeepSeek 最新发布的模型是 JanusPro,它将图像理解和生成统一在一个模型中。 JanusPro 是一种新型的自回归框架,通过将视觉编码解耦为独立的路径解决了先前方法的局限性,同时利用单一的统一变压器架构进行处理。解耦缓解了视觉编码器在理解和生成中的角色冲突,增强了框架的灵活性。 JanusPro 超越了之前的统一模型,并匹配或超过了特定任务模型的性能,其简单性、高灵活性和有效性使其成为下一代统一多模态模型的有力候选者。 模型(7B):https://huggingface.co/deepseekai/JanusPro7B 模型(1B):https://huggingface.co/deepseekai/JanusPro1B 此外,2 月 7 日的社区动态中提到 DeepSeek 最新模型 V3 与 R1 采用混合专家(MoE)架构,显著提升计算效率,V3 引入多头潜注意力(MLA),将 KV 缓存压缩至新低,提升计算性能。R1 则通过强化学习激活推理能力,首次验证无需监督微调即可实现推理。
2025-02-12
现在个人应用场景下最新的产品是什么
在个人应用场景下,最新的产品包括以下方面: 个人实操案例: 产品使用场景:为本篇文章配图,通过不同提示词生成搞笑图片等。 产品开发场景:搭建 AI 访谈 bot,以了解做 AI 朋友的访谈意愿和产出内容质量水平;对内容推荐机制感兴趣,希望 bot 具备内容推荐能力。实现方案有简单和复杂之分,复杂方案需考虑用户识别、记录存储入库可查看等问题,在扣子搭建 bot 时存在工作流触发不成功导致访谈记录未成功存储入库的情况。由于要发布到公众号作为订阅号助手,目前部署的是扣子版本,回复关键词【元器】可体验元器版本。 AIGC 落地应用: 筛选出 5 大应用场景、17 个细分方向、40+大模型案例。 使用场景分为改善大模型产品的使用体验、助力用户工作流、细分场景独立实用工具、AI 社区、Chatbot 五个方向。 产品形态分为插件(Chat GPT/Chrome 等)、辅助现有产品能力、深度结合 LLM 能力的独立网站&应用、AI 社区四种。目前产品大多分布在 PC 端。
2025-02-11
告诉我最新的国际ai资讯(比如从2024年有什么ai被发明了,国际上一共有什么大的ai公司,中国的ai发展的怎么样了(deepseek怎么样))
以下是为您整理的最新国际 AI 资讯: 2024 年 2 月 5 日:百度智能云成功点亮昆仑芯三代万卡集群,这是国内首个正式点亮的自研万卡集群。 在 Lex Fridman 的播客中,Dylan Patel 和 Nathan Lambert 深入探讨了中国的 DeepSeek AI 模型,特别是 DeepSeekV3 和 DeepSeekR1。Nathan 强调 DeepSeek 是最开放的模型之一,采用 MIT 许可,鼓励商业用途,推动行业走向开源。 2025 年 AI 语音助手研究显示,语音技术是 AI 应用的关键,企业和用户都将受益。2024 年将是语音助手快速发展的时期,技术不断升级,市场竞争加剧,涌现出多种创业公司。未来,AI 语音将成为服务的“万能钥匙”,应用场景广泛,从医疗到教育,推动行业变革与创新。 2024 年 1 月 17 日:随着预训练技术遭遇瓶颈,GPT5 迟迟未能问世,从业者开始从不同角度寻找突破。以 o1 为标志,大模型正式迈入“PostTraining”时代;开源发展迅猛,Llama 3.1 首次击败闭源模型;中国本土大模型 DeepSeek V3,在 GPT4o 发布仅 7 个月后,用 1/10 算力实现了几乎同等水平。同时,大模型的日渐成熟也让产业重心从基础模型转向应用落地。AI 在编程领域爆发,“数字员工”崛起。 李飞飞在访谈中探讨了 AI Agent 的发展及其未来。她强调 AI Agent 应作为工具和赋能者,而非主导者,确保人们的自主性。李飞飞回顾了 ImageNet 的创立背景,并提到正在推动的“空间智能”概念,旨在理解和融合物理与数字三维世界。她认为,未来这两者的界限将逐渐模糊,从而带来更大变革。
2025-02-08
最新的AI在安全领域的应用新闻
以下是最新的 AI 在安全领域的应用新闻: 1. 随着 AI 不断发展,AI 应用中的新功能带来新漏洞,现有企业和研究学者已加强对“越狱”的研究。OpenAI 提出通过“指令层次结构”来修复“忽略所有先前指令“攻击的方法,并已在 GPT40 Mini 中得到部署。Anthropic 在多重越狱方面的工作表明了“警告防御”的潜力,Gray Swan AI 的安全专家已试用“断路器”。LLM 测试初创公司 Haize Labs 与 Hugging Face 合作创建了首个红队抵抗组织基准。 2. 英国创建了世界上第一个人工智能安全研究所 AISA,有三个核心功能:在部署前对高级模型进行评估;建立国家能力并开展研究;协调国际合作伙伴。AISA 还发布了 Inspect 框架用于 LLM 安全评估。英国宣布与美国等效机构签署谅解备忘录,并计划在美国旧金山设立办事处。英国通过其高级研究与发明机构(ARIA),花费 5900 万英镑开发“守门员”系统,负责了解和减少关键领域中其他人工智能代理的风险,还计划设立“AI 安全研究实验室”。美国能源部利用内部测试床评估人工智能对关键基础设施和能源安全带来的风险。 3. Microsoft 的 AI Security Copilot 能够在几分钟内提供可操作的建议,简化对攻击的紧急理解,揭示威胁,甚至预测攻击者最有可能的下一步行动。
2025-02-08
最新的AI在安全领域的应用馨文
以下是关于最新的 AI 在安全领域的应用的相关内容: 1. AI 已经在许多领域带来了重大进展和效率提升。例如,在交通监控方面使通勤更顺畅,检测银行账户中的欺诈行为,在工业中控制核聚变过程,还用于加速科学进步,如发现新药或应对气候变化的技术。并且,随着 AI 变得更强大以及创新者探索新的应用方式,将会有更多的 AI 应用出现,具有巨大的推动经济增长和创造就业的潜力。 2. 拜登签署的 AI 行政命令要求最强大的 AI 系统开发者与美国政府分享安全测试结果和其他关键信息。依照《国防生产法》,开发对国家安全、经济安全或公共卫生和安全构成严重风险的基础模型的公司,在训练模型时必须通知联邦政府,并分享所有红队安全测试的结果。 3. 美国国家标准与技术研究院将制定严格的标准进行广泛的红队测试,以确保在公开发布前的安全性。国土安全部将把这些标准应用于关键基础设施部门,并成立 AI 安全与保障委员会。能源部和国土安全部也将应对 AI 系统对关键基础设施以及化学、生物、放射性、核和网络安全风险的威胁。 4. 为防止利用 AI 制造危险生物材料的风险,制定强有力的生物合成筛选新标准。资助生命科学项目的机构将建立这些标准作为联邦资助的条件。 5. 为保护美国人免受 AI 导致的欺诈和欺骗,商务部将制定检测 AI 生成内容和认证官方内容的标准和最佳实践。联邦机构将使用这些工具,让美国人容易知道他们从政府收到的通信是真实的,并为私营部门和世界各地的政府树立榜样。 同时,AI 的概念并非新事物,但数据生成和处理方面的近期进展改变了该领域及其产生的技术。例如,生成式 AI 模型能力的近期发展创造了令人兴奋的机会,但也引发了关于潜在 AI 风险的新辩论。一些 AI 风险可能是无意的后果或缺乏适当的控制以确保负责任的 AI 使用而产生的。对 AI 特定风险的初步评估确定了一系列高级风险,包括对人类和财产的身体损害以及对心理健康的损害等安全风险。
2025-02-08