目前,AI 在操控电脑方面已经有了一些进展。例如,OpenAI 发布了 Responses API 和一整套 Agent 创建工具,其中包括模拟人类操作电脑的 Computer-Using Agent (CUA),支持跨平台和本地部署。同时,OpenAI 还推出了实时监控功能,能够记录 AI 的完整操作路径,跟踪决策依据、使用工具与执行步骤,有助于调试与优化 AI 流程。
在实际应用中,普通人可以利用 AI 生成个人艺术照、证件照、绘本图像、视频,甚至创作音乐和歌曲。比如在快手的可灵 AI 网站上能看到大量视频生成的效果和相关命令词。此外,AI 数字人技术在直播和视频平台中已被大量使用,8 岁小女孩能在 AI 编程助手帮助下独立完成网站程序开发。
然而,要实现 AI 全自动操控电脑完成您的工作,还面临一些挑战和限制。一方面,AI 技术仍在不断发展和完善中,其能力和准确性可能存在一定的局限性。另一方面,法律法规对于 AI 的应用也有一定的规范和约束。
但随着技术的进步,未来 AI 在操控电脑完成工作方面有望取得更大的突破。
1.19.AI is already delivering major advances and efficiencies in many areas.AI quietly automates aspects of our everyday activities,from systems that monitor traffic to make our commutes smoother,17 to those that detect fraud in our bank accounts.18 AI has revolutionised large-scale safety-critical practices in industry,like controlling the process of nuclear fusion.19 And it has also been used to accelerate scientific advancements,such as the discovery of new medicine20 or the technologies we need to tackle climate change.212.20.But this is just the beginning.AI can be used in a huge variety of settings and has the extraordinary potential to transform our society and economy.22 It could have as much impact as electricity or the internet,and has been identified as one of five critical technologies in the UK Science and Technology Framework.23 As AI becomes more powerful,and as innovators explore new ways to use it,we will see more applications of AI emerge.As a result,AI has a huge potential to drive growth24 and create jobs.25 It will support people to carry out their existing jobs,by helping to improve workforce efficiency and workplace safety.26 To remain world leaders in AI,attract global talent and create high-skilled jobs in the UK,we must create a regulatory environment where such innovation can thrive.3.21.Technological advances like large language models(LLMs)are an indication of the transformative developments yet to come.27 LLMs provide substantial opportunities to transform the economy and society.For example,LLMs can automate the process of writing code and17 Transport apps like Google Maps,and CityMapper,use AI.18 Artificial Intelligence in Banking Industry:A Review on Fraud Detection,Credit Management,and Document Processing,ResearchBerg Review of Science and Technology,2018.19 Accelerating fusion science through learned plasma control,Deepmind,2022;Magnetic control of tokamak plasmas through deep reinforcement learning,Degrave et al.,2022.
现在,普通人可以用AI生成自己的个人艺术照和证件照,而不需要去影楼拍摄。另外,也可以按自己的想法生成有意思的绘本图像。[sora_1.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/MkclbXog1oTgIYxf9Y3c0eGVnof?allow_redirect=1)[sora_2.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/Njh8b5Pvjoz6F8xwZ4wc2EL6nze?allow_redirect=1)容易联想到,图像连起来就是视频了。确实,AI现在也可以生成视频。上面是两个典型的例子,一个是真实感的效果,另一个是不可能在真实世界中出现但是看上去真实合理的结果,这些都可以利用AI来生成。在快手的可灵AI的网站上,大家可以看到大量的视频生成的效果和他们的命令词,也可以自己注册账号去实际用一下。相信我们应该很快就会看到完全利用AI技术生成的电影。视频生成中有一个特别的应用是数字人。在视频中,郭德纲用着流利的英文在说相声,如果你仔细看会发现,他的口型也是对应的非常好,看上去非常真实。这也是用AI做到的。事实上,今天的直播和视频平台中,已经在大量使用AI数字人技术了。AI还可以创作音乐和歌曲。你可以听一下AI自动生成的不同风格的《让我们荡起双桨》,还挺是那么回事。这里有一个视频,是美国的一个8岁的小女孩在AI编程助手的帮助下独立完成了一个网站程序的开发工作,只是通过语言的沟通。未来每个人都可以通过AI程序员来实现自己的各种想法。AI也已经可以接入和控制你的手机和电脑,让我们看看未来的生活和工作可能会是怎样。
🔔Xiaohu.AI日报「3月12日」✨✨✨✨✨✨✨✨1⃣️🧠一个API让AI变身智能助手:OpenAI发布Responses API和一整套Agent创建工具。集成聊天能力与工具调用,可执行复杂任务。内置工具:🌐Web Search:实时联网搜索、结构化结果、支持私有数据结合。📄File Search:支持PDF、Word、Excel等,快速提取关键词、段落等。💻Computer-Using Agent(CUA):模拟人类操作电脑,支持跨平台、本地部署。🧰Agents SDK:可让多个AI协作,像流水线一样完成任务。🔗[https://x.com/imxiaohu/status/1899613472364843288](https://x.com/imxiaohu/status/1899613472364843288)✨亮点:支持AI操控电脑+多Agent协作+文件/网页搜索能力2⃣️🎥AI的“行车记录仪”:OpenAI推出实时监控功能,记录AI的完整操作路径。跟踪决策依据、使用工具与执行步骤有助于调试与优化AI流程🔗[https://www.xiaohu.ai/c/xiaohu-ai/api-ai-openai-agent](https://www.xiaohu.ai/c/xiaohu-ai/api-ai-openai-agent)✨亮点:每一步决策可追溯,AI行为透明可查3⃣️⚡量化版本来了,推理速度更快:OpenAI提供Quantized模型版本,适配边缘计算与移动设备。