Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

最近有什么新的AI工具或者功能出现吗?

Answer

以下是一些新出现的 AI 工具和功能:

  • 游戏方面:
    • Unity 推出了两款 AI 工具。其中,新 Copliot 工具可通过与 Muse Chat 聊天快速启动创建游戏项目,如一键生成塔防类游戏基础框架、创建人物角色动作,还能协助编码和创建 3D 材质、动画等内容。Muse Chat 现已经开放 Waiting list,可通过 https://create.unity.com/ai-beta 申请加入,官方提示这个暑假会进一步开放。
    • Unity Sentis 是第一个将 AI 模型嵌入到实时 3D 引擎中的跨平台解决方案,能在 Unity 运行时为游戏或应用程序嵌入 AI 模型,增强游戏玩法和其他功能,目前还在封测阶段。
  • AI 智能体方面:
    • 企业自动化出现新架构,工具使用或函数调用被视为从 RAG 到主动行为的第一个半步,为现代人工智能栈增加了新层。一些流行的原语如网页浏览、代码解释和授权+认证已经出现,使 LLMs 能够执行特定操作。
  • ProductHunt 2023 年度最佳产品榜单中的 AI Infra 类别:
    • Langfuse 是大模型应用的开源追踪和分析工具,提供开源可观测性和分析功能,包括可观测性的可视化界面探索和调试复杂的日志和追踪,以及分析的使用直观仪表板改善成本、降低成本、减少延迟,提高响应质量。
    • Eden AI 可将顶尖 AI API 融合为一,能为每项 AI 任务选择正确的 AI API 来提高准确性和降低成本,集中管理使用限制和成本监测,并探索新兴的 AI 能力。
    • Langdock 能在几分钟内创建、部署、测试和监控 ChatGPT 插件,将 API 连接到 Langdock 并作为插件部署到多个大模型应用中,然后使用内置测试功能确保正常工作并进行监控。
    • LLM Spark 是用于构建生产就绪大模型应用的开发平台。
Content generated by AI large model, please carefully verify (powered by aily)

References

游戏:Unity 近日推了两款 AI 工具

Unity是最受欢迎的游戏引擎之一,其高品质搭建2D和3D世界的开发能力以及跨平台输出的特性,让它这些年来不断引领游戏开发的潮流。(官方最新数据称每月活跃创作者达180万,历史里程碑级有关背景信息,见评论区)从开发视角,Unity AI提供了一个新Copliot工具;通过与Muse Chat聊天,快速启动创建一个游戏项目:例如让AI直接一键生成塔防类游戏的基础框架,或让AI创建的人物角色来个后空翻;从工具学习的角度,你也可以让Muse Chat和讨论如何一步步熟悉工程环境本身,并要求AI协助编码。(视频演示第10秒左右,列出了简要过程)从内容生产角度,让Muse Chat创建3D材质、动画等内容,现在你可以不断用自然语言输入promopts完成创建和编辑你需要的资产(Asset)。整个建构被Copliot模式驱动,这是前人无法想象的新的工作流。(如果你想我一样感觉异常兴奋,Muse Chat现已经开放Waiting list,这里申请加入https://create.unity.com/ai-beta。官方提示这个暑假会进一步开放。)第二个工具被称为Unity Sentis。它允许你在Unity运行时为你的游戏或应用程序嵌入AI模型,直接在终端用户平台上增强游戏玩法和其他功能。这是第一个将AI模型嵌入到实时3D引擎中的跨平台解决方案,你可以一次构建,然后将你的模型嵌入到多个平台上,从移动设备到PC,主机游戏。在技术层面,它将神经网络与Unity运行时连接起来,意味着Sentis解锁了无穷的可能性。(还在封测阶段)换句话说,它指向了游戏世界从有限迈向无限的重要一步。

AI 智能体:企业自动化的新架构 - Menlo Ventures

工具使用或函数调用通常被视为从RAG到主动行为的第一个半步,为现代人工智能栈增加了一个新的层。这些工具,本质上是预先编写的代码组件,执行特定的操作。流行的原语如网页浏览([Browserbase](https://www.browserbase.com/)、[Tiny Fish](https://www.tinyfish.io/))、代码解释([E2B](https://e2b.dev/))和授权+认证([Anon](https://www.anon.com/))已经出现。它们使LLMs能够导航网络、与外部软件(如CRM、ERP)交互并运行自定义代码。该系统向LLM呈现可用的工具,后者然后选择一个工具,构建必要的结构化JSON输入,并触发API执行以产生最终操作。Omni的[计算AI](https://omni.co/blog/introducing-calculations-ai)功能体现了这种方法。它利用LLM直接输出适当的Excel函数到电子表格中,然后执行计算并自动生成复杂查询供用户使用。就此而言,工具的使用是强大的,但仅凭自身并不能被视为"主动性"。逻辑控制流程仍然由应用程序预先定义。我们将在即将到来的设计中探索的真正智能体人,使LLMs能够动态地编写全部或部分自己的逻辑。

ProductHunt 2023 年度最佳产品榜单

随着越来越多的AI模型和产品的出现,帮助构建、改进和监控它们的工具变得比以往任何时候都更加重要,因此几年的奖项又出现了一个新的类别。这个类别的入围者帮助AI创作,者为他们的产品选择合适的AI API并在它们之间切换(如EdenAI)、快速创建和部署LLM插件(如Langdoc)或LLM应用程序(如LLM Spark),以及追踪和调试复杂的LLM应用程序(如Langfuse)。Langfuse(免费可用)——大模型应用的开源追踪和分析工具:Langfuse为大模型应用提供开源可观测性和分析功能。可观测性:在可视化界面中探索和调试复杂的日志和追踪。分析:使用直观的仪表板改善成本、降低成本、减少延迟,提高响应质量。Eden AI(免费可用)——将顶尖AI API融合为一:将Eden AI集成到产品中,实现以下目标:通过为每项AI任务选择正确的AI API来提高准确性和降低成本通过集中管理使用限制和成本监测,让你更加放心不断探索市场上新兴的AI能力。Langdock(免费可用)——在几分钟内创建、部署、测试和监控ChatGPT插件:将你的API连接到Langdock,并将其作为插件部署到所有大模型应用中,如ChatGPT和LangChain(Bing和Bard即将推出)。然后使用Langdock内置的测试功能来确保一切按预期工作,并在插件扩展时进行监控。LLM Spark(免费可用):用于构建生产就绪大模型应用的开发平台。

Others are asking
AI 视频创作教程
以下是为您提供的 AI 视频创作教程: 让古画动起来的教程: 1. 对于简单的图,找原图直接写提示词即可。若碰到多人多活动的复杂图,需把长图分多个模块,比如将图分成 4 个模块。 2. 智能抠图,用工具把要动的内容去除掉,用 AI 生成图片部分。若有水印,可以把图片向下拓展一部分,然后截掉。 3. 将要拿来动起来的部分抠出,放在绿幕背景里或者画的背景颜色,导出图片。 4. 用 AI 视频生成工具写入提示词让图片动起来,如即梦、海螺、混元等,不停尝试抽卡。 5. 用剪映把抽卡合格的视频放在去掉内容的背景图片,通过色度抠图调整去掉视频的背景。将多个视频放在背景图片,一起动即可。 AI 视频短片的制作技巧: 基于大语言模型和绘图模型,进行文生图到图生视频的创作实践。选择大语言模型 chatgpt、kimi 进行剧本分镜设定,文生图用 midjourney 生成视觉画面,图生视频选择即梦 dreamina 制作动态画面,suno 音乐编曲,ondoku 主角台词配音,视频剪辑使用剪映。部分音效可在网上无版权下载或使用剪映中的音效。确立时长(1 分钟左右的 AI 生成画面,加上闭幕不超过 2 分钟)和风格(如中国风)。 AI 视频号的相关教程: 1. 保持日更,起号阶段至少两天一更,每天半小时完成 20 秒的简单内容制作。 2. 选择赛道,资讯类不做,选择 AI 视觉冲击力、利他的内容,有 AI 基础可做教程。 3. 寻找对标,起号阶段找 10 个对标账号参考其内容和模式。 4. 克服心理,出镜做 IP 不要有容貌焦虑。 5. 蹭取热点,注意热点的舆论导向和合规性。 6. 可在 vtwoagi.com 网站的飞书知识库中获取视频教程。 7. 应对抄袭,在抄袭者评论区留言指出或找朋友点赞将评论顶上去引流。 8. 特效视频长度建议控制在 1 分钟内。 9. 账号限流处理,视频号限流建议重新起号,小红书限流可日更 10 天尝试。 10. 内容有商业价值的标准是甲方或品牌愿意投钱。 11. 封面素材可从堆友、吉梦、小红书等获取。 12. 做哪个平台就蹭哪个平台的热点。 13. 在小红书创作者平台的成长榜样中可找到对标账号。 14. 在小红书创作者后台可查看账号是否被打上标签。 15. 内容发布时间 8 点到 10 点、2 点到下午 5 点、7 点到 8 点较为合适。
2025-03-20
怎么搭建小程序AI平台
搭建小程序 AI 平台可以参考以下步骤: 1. 在扣子平台搭建: 创建一个 Bot: 系统默认创建个人团队,团队内创建的资源无法分享给其他成员,也可创建或加入其他团队,更多信息参考。 进入团队空间后,默认打开 Bots 页面。 在 Bots 页面,单击创建 Bot。 输入 Bot 名称和介绍,然后单击图标旁边的生成图标,自动生成一个头像,最后单击确认。 编写提示词:在 Bot 配置页面的人设与回复逻辑面板中输入内容,提示越清晰越好,可单击优化让大语言模型优化为结构化内容,更多详细信息参考。 2. 零基础模板化搭建 AI 微信聊天机器人: 容器编排模板是一种配置文件,定义了如何在 Docker 中部署和管理多个容器。通过编排模板,您可以一键部署复杂的应用环境,而不需要手动配置每个容器的细节。 配置多个前缀(如“bot”、“@bot”)可以确保只有在特定情况下机器人才会回复,避免在群聊或私聊中频繁干扰。 如果扫码登录失败,可以尝试以下步骤: 重启 Docker 容器:在宝塔面板中找到对应的容器,点击“重启”。 检查网络连接:确保服务器和微信客户端都能正常访问互联网。 重新扫描二维码:等待容器重新启动后,重新扫描日志中生成的二维码。 极简未来平台的收费按使用量计算,对于一般用户来说费用相对低廉,还提供每天签到免费领取积分的福利。 3. 安仔:不用黑魔法,小白也能做一个对接 GPT 大模型的微信聊天机器人: 配置极简未来(Link.AI)平台:按照官方教程走,补充学习:https://docs.linkai.tech/platform/quickstart 。 生成 API Key 用于后续功能对接:地址为 https://linkai.tech/console/interface ,点击创建 API Key 并记住。
2025-03-20
,使用国内的 ai 绘画工具,怎么做文章中的插图,或者四格图?
以下是使用国内的 AI 绘画工具制作文章插图或四格图的一些方法和示例: 1. 像素风格插画: 关键词:3D,16bit pixel art,Super mario,Minecraft,LEGO,pixel style,Blocksplicing,girl with long hair,Alice in Wonderland,garden background,8K–uplight–ar 9:16–v 5 生成的图片示例:像素女孩插画 2. 手机壁纸插画: 关键词:mobile wallpaper illustrations,four seasons,natural landscapes,minimalist illustrations,line illustrations–ar 9:16–niji 生成的图片示例:手机壁纸 3. 新海诚风格插画: 关键词:Makoto Shinkai animation style,a girl,4K–ar 9:16–niji 生成的图片示例:新海诚动漫海报 4. 国潮插画: 关键词:Make posters of James Jean,white deer,auspicious clouds,birds,distant mountains,Chinese ChinaChic style,colorful,light color,gradient color–ar 9:16 生成的图片示例:国潮白鹿插画 此外,在使用 AI 绘画工具时,您还可以参考以下提示: 对于不同的需求和风格,精心设计和选择合适的关键词。 不断尝试和调整关键词,以获得更满意的绘画效果。 需要注意的是,不同的国内 AI 绘画工具可能在功能和效果上有所差异,您可以根据实际情况进行选择和探索。
2025-03-20
有哪些专门针对科研人员的科学研究过程的AI工具
以下是一些专门针对科研人员科学研究过程的 AI 工具: 1. 对于需要修改医学课题的科研人员: Scite.ai:是为研究人员等打造的创新平台,提供引用声明搜索等工具,增强对科学文献的洞察。 Scholarcy:能从文档中提取结构化数据,生成文章概要,包含关键概念等板块内容。 ChatGPT:强大的自然语言处理模型,可提供有关医学课题的修改意见。 2. 在论文写作方面: 文献管理和搜索: Zotero:结合 AI 技术,自动提取文献信息,管理和整理参考文献。 Semantic Scholar:AI 驱动的学术搜索引擎,提供文献推荐和引用分析。 内容生成和辅助写作: Grammarly:提供文本校对、语法修正和写作风格建议,提高语言质量。 Quillbot:基于 AI 的重写和摘要工具,精简和优化论文内容。 研究和数据分析: Google Colab:提供基于云的 Jupyter 笔记本环境,支持 AI 和机器学习研究,便于数据分析和可视化。 Knitro:用于数学建模和优化,帮助进行复杂的数据分析和模型构建。 论文结构和格式: LaTeX:结合自动化和模板,高效处理论文格式和数学公式。 Overleaf:在线 LaTeX 编辑器,提供丰富模板库和协作功能,简化论文编写过程。 研究伦理和抄袭检测: Turnitin:广泛使用的抄袭检测工具,确保论文原创性。 Crossref Similarity Check:检测潜在抄袭问题。 3. 其他工具: Deformity.ai:创新的表单创建平台,通过人工智能技术,用户可快速制作生动的对话式表单,支持多种功能和多语言互动。 Afforai:为研究人员设计的 AI 驱动的研究助手和聊天机器人,提供多种工具简化研究流程,支持多种文档格式和不同搜索模式。 Recall:新型知识管理工具,自动总结各种在线内容并保存到知识库,自动组织分类,通过知识图谱发现信息联系,提供间隔重复学习功能。 请注意,以上内容由 AI 大模型生成,请仔细甄别。您可以根据自己的具体需求选择合适的工具进行尝试。
2025-03-20
有哪些适合科研人员的AI工具
以下是一些适合科研人员的 AI 工具: 1. 对于需要修改医学课题的科研人员: Scite.ai:是为研究人员等打造的创新平台,提供引用声明搜索等工具,能简化学术工作。 Scholarcy:可以从文档中提取结构化数据,生成文章概要,包含关键概念等板块内容。 ChatGPT:强大的自然语言处理模型,可提供修改意见。 2. 对于论文写作的科研人员: 文献管理和搜索: Zotero:结合 AI 技术,自动提取文献信息,管理和整理参考文献。 Semantic Scholar:AI 驱动的学术搜索引擎,提供文献推荐和引用分析。 内容生成和辅助写作: Grammarly:提供文本校对、语法修正和写作风格建议,提高语言质量。 Quillbot:基于 AI 的重写和摘要工具,精简和优化论文内容。 研究和数据分析: Google Colab:提供基于云的 Jupyter 笔记本环境,支持 AI 和机器学习研究,便于数据分析和可视化。 Knitro:用于数学建模和优化,帮助进行复杂的数据分析和模型构建。 论文结构和格式: LaTeX:结合自动化和模板,高效处理论文格式和数学公式。 Overleaf:在线 LaTeX 编辑器,提供丰富模板库和协作功能,简化编写过程。 研究伦理和抄袭检测: Turnitin:广泛使用的抄袭检测工具,确保论文原创性。 Crossref Similarity Check:检测潜在抄袭问题。 3. 对于文章润色的科研人员: Wordvice AI:集校对、改写转述和翻译等功能于一体,基于大型语言模型提供全面的英文论文润色服务。 ChatGPT:由 OpenAI 开发的大型语言模型,用于多方面写作辅助。 Quillbot:人工智能文本摘要和改写工具,可快速筛选和改写文献资料。 HyperWrite:基于 AI 的写作助手和大纲生成器,帮助写作前头脑风暴和大纲规划。 Wordtune:AI 驱动的文本改写和润色工具,优化文章语言表达。 Smodin:提供 AI 驱动的论文撰写功能,生成符合要求的学术论文。 这些工具可以从不同方面为科研人员提供帮助,您可以根据自己的具体需求选择合适的工具进行尝试。请注意,内容由 AI 大模型生成,请仔细甄别。
2025-03-20
我想学习ai视频相关的知识
以下是关于 AI 视频的相关知识: AI 视频学社:这是一个方便大家测试学习 AI 视频知识和内容的板块。小伙伴们可以通过参与每周举办的比赛、观看不定期的高手直播分享来快速学习,直播会分享 AI 视频和影视创作领域最前沿的知识。学社还有不定期的直播、每周固定 1 次的视频挑战赛、不定期组织的线上或者线下活动,大家一起学习 AI 视频最新软件和最新知识,学习图生视频、视频生视频等技巧。相关软件教程链接: 。 通往 AGI 之路知识库使用指南:其中包含了 AI 相关技术与应用的介绍及活动分享、AI agent 的介绍、AI 会话相关内容、AI 视频相关词汇、AI 相关活动等。 AI 视频生成|技术发展概况和应用场景思考:长期以来,人们对 AI 视频技术应用的认知停留在各种“换脸”和视频特效上。随着 AI 图像领域的技术发展,AI 视频技术逐渐取得突破。从交互方式来看,当前 AI 视频生成主要可分为文本生成视频、图片生成视频、视频生成视频三种形式。一些视频生成方法是先生成静态关键帧图像,然后构建为视频序列。也存在直接端到端生成视频的技术,无需进行多阶段处理即可生成视频,如基于 GAN、VAE、Transformer 的方法。微软 NUWAXL 通过逐步生成视频关键帧,形成视频的“粗略”故事情节,然后通过局部扩散模型(Local Diffusion)递归地填充附近帧之间的内容。
2025-03-20
ai数字人哪些工具比较好
以下是一些比较好的 AI 数字人工具: 1. aigcpanel: 特点:开源且适合小白用户,具有一键安装包,无需配置环境,简单易用。 功能:能生成数字人视频,支持语音合成和声音克隆,操作界面中英文可选。 系统兼容:支持 Windows、Linux、macOS。 模型支持:MuseTalk(文本到语音)、CosyVoice(语音克隆)。 使用步骤:下载 8G+3G 语音模型包,启动模型即可。 GitHub 链接: 官网: 2. HEYGEN: 优点:人物灵活,五官自然,视频生成很快。 缺点:中文的人声选择较少。 使用方法:点击网址注册后,进入数字人制作,选择 Photo Avatar 上传自己的照片;上传后效果在 My Avatar 处显示上传的照片;点开大图后,点击 Create with AI Studio 进入数字人制作;写上视频文案并选择配音音色,也可以自行上传音频;最后点击 Submit 得到数字人视频。 3. DID: 优点:制作简单,人物灵活。 缺点:为防止侵权,免费版下载后有水印。 使用方法:点击网址,点击右上角的 Create vedio;选择人物形象,可以点击 ADD 添加照片或使用给出的人物形象;配音时,可以选择提供文字选择音色或直接上传音频;最后点击 Generate vedio 生成视频;打开生成的视频,可以下载或直接分享给朋友。 4. KreadoAI: 优点:免费(对于普通娱乐玩家很重要),功能齐全。 缺点:音色较 AI。 使用方法:点击网址注册后获得 120 免费 k 币,选择“照片数字人口播”的功能;点击开始创作,选择自定义照片;配音时,可以选择提供文字选择音色或直接上传音频;打开绿幕按钮,点击背景,可以添加背景图;最后点击生成视频。
2025-03-20
有没有AI软件,可以生成电子相关工具,例如电路板
以下是一些可以生成与电子相关工具(如电路板)的 AI 软件: 1. CADtools 12:这是 Adobe Illustrator 的插件,添加了 92 个绘图和编辑工具,包括图形绘制、编辑、标注、尺寸标注、转换、创建和实用工具。 2. Autodesk Fusion 360:Autodesk 开发的云端 3D CAD/CAM 软件,集成了 AI 功能,能创建复杂几何形状和优化设计。 3. nTopology:基于 AI 的设计软件,可创建复杂 CAD 模型,包括拓扑优化、几何复杂度和轻量化设计等。 4. ParaMatters CogniCAD:基于 AI 的 CAD 软件,能根据输入的设计目标和约束条件自动生成 3D 模型,适用于拓扑优化、结构设计和材料分布等领域。 5. 一些主流 CAD 软件(如 Autodesk 系列、SolidWorks 等)提供的基于 AI 的生成设计工具,可根据设计目标和约束条件自动产生多种设计方案。 需要注意的是,这些工具通常需要一定的 CAD 知识和技能才能有效使用。对于 CAD 初学者,建议先学习基本的 3D 建模技巧,然后尝试使用这些 AI 工具来提高设计效率。
2025-03-20
免费的可以制作ppt的ai工具
以下是一些免费的可以制作 PPT 的 AI 工具: 1. 歌者 PPT(gezhe.com):是一款永久免费的智能 PPT 生成工具。具有话题生成、资料转换、多语言支持、海量模板和案例、在线编辑和分享、增值服务等功能。其优势包括免费使用、智能易用、海量案例、资料转 PPT 专业、AI 翻译等。推荐理由为完全免费、智能化程度高、模板和案例丰富、支持多语言、学习成本低。 2. Gamma:在线 PPT 制作网站,允许通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式。网址:https://gamma.app/ 3. 美图 AI PPT:由知名图像编辑软件“美图秀秀”的开发团队推出,通过输入简单文本描述生成专业 PPT 设计,包含丰富模板库和设计元素。网址:https://www.xdesign.com/ppt/ 4. Mindshow:AI 驱动的 PPT 辅助工具,提供自动布局、图像选择和文本优化等智能设计功能,可能包含互动元素和动画效果。网址:https://www.mindshow.fun/ 5. 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理技术优势,提供智能文本生成、语音输入、文档格式化等功能。网址:https://zhiwen.xfyun.cn/ 目前市面上大多数 AI 生成 PPT 按照以下思路完成设计和制作: 1. AI 生成 PPT 大纲 2. 手动优化大纲 3. 导入工具生成 PPT 4. 优化整体结构 推荐 2 篇市场分析的文章供参考: 1. 《》 2. 《》
2025-03-20
最近推出的排名靠前的知名AI产品,与微软竞争的是什么产品?
以下是一些与微软竞争的知名 AI 产品: 1. ChatGPT:在移动领域占据榜首位置,其月活跃用户数领先幅度明显缩小。 2. Bing:微软基于 AI 技术全新打造的搜索引擎。 3. Microsoft Security Copilot:能够在几分钟内提供可操作的建议,简化对攻击的紧急理解,揭示威胁,甚至预测攻击者最有可能的下一步行动。 4. Loop:一个协作工具,独立于 MS Office,但又与之密切相关。 5. Bard:谷歌推出的官方 ChatGPT 竞争者。 6. Dora AI:可以通过一个 prompt,借助 AI 3D 动画,生成强大网站。 7. Chat.DID:有史以来首个允许人们以人类方式与 AI 进行视频聊天的 APP。 8. Pika:一个 AI 视频平台,使任何人都能将他们的创意愿景变为现实。
2025-03-20
今天是2025-3-20日,给下最近一周的AI相关新闻
以下是最近一周(2025 年 3 月 14 日至 20 日)的 AI 相关新闻: 在 GTC 2025 大会上,黄仁勋展示了英伟达的最新芯片 Blackwell Ultra,强调其性能是 Hopper 的 40 倍,预计 2025 年将出货 360 万颗。黄仁勋反驳市场质疑,指出推理的算力需求远超预期,Dynamo 的推出将优化 GPU 利用率。尽管市场信心动摇,英伟达依然展现了其作为 AI 算力领导者的决心,“只要有 Token 就有英伟达的生意”。 本文介绍了如何通过 MCP(Model Context Protocol)将 Claude 3.7 与 Blender 连接,实现一句话生成 3D 场景的功能。Claude 作为“大脑”,MCP 为“桥梁”,Blender 则是“手脚”,三者紧密协作,使得 3D 建模变得简单而高效。随着 MCP 的崛起,AI 不再是数据孤岛,未来的 AI 智能体将能自主完成更复杂的任务,开启创作的新纪元。 AI 切磋大会第 11 期报名开启!3 月 30 日,主题是“2 小时,让 AI 将你的创意变为现实”。无论你是编程小白还是高手,欢迎来现场展示你们的案例。 Yourware 是一款强大的工具,让普通用户轻松创建和部署 AI 编程作品集。只需复制代码,即可一键部署网页,快速展示自己的创作。此外,平台提供了全球优秀作品的参考,极大激发灵感。更有一键美化功能,让网页焕然一新,分享权限也能自由控制。 谷歌以 320 亿美元收购网络安全公司 Wiz,创下其历史上最大收购案。Wiz 在 18 个月内实现 1 亿美元年收入,成为史上最快的软件公司之一。创始团队拥有近 20 年的友谊和合作,先后成立 Adallom 并被微软收购,再打造 Wiz。
2025-03-20
今天是2025年3月20日,给下最近一周的AI相关新闻
以下是最近一周(2025 年 3 月 19 日至 3 月 20 日)的 AI 相关新闻: 3 月 20 日: 在 GTC 2025 大会上,黄仁勋展示了英伟达的最新芯片 Blackwell Ultra,强调其性能是 Hopper 的 40 倍,预计 2025 年将出货 360 万颗。黄仁勋反驳市场质疑,指出推理的算力需求远超预期,Dynamo 的推出将优化 GPU 利用率。尽管市场信心动摇,英伟达依然展现了其作为 AI 算力领导者的决心,“只要有 Token 就有英伟达的生意”。 介绍了如何通过 MCP(Model Context Protocol)将 Claude 3.7 与 Blender 连接,实现一句话生成 3D 场景的功能。Claude 作为“大脑”,MCP 为“桥梁”,Blender 则是“手脚”,三者紧密协作,使得 3D 建模变得简单而高效。随着 MCP 的崛起,AI 不再是数据孤岛,未来的 AI 智能体将能自主完成更复杂的任务,开启创作的新纪元。 3 月 19 日: “回答我!Look in my eyes!Tell me why?baby why?”——最近全网都被这句魔性古风骂人视频刷屏了!古人+现代梗的爆笑碰撞,不只是娱乐玩梗,更成了宣传、带货、文旅推广的新利器。本文手把手教你 0 基础复刻这类 AI 视频,搭配爆款文案+AI 人物+鬼畜视频合成,让你也能轻松玩转流量密码,打造自己的“AI 古人爆款工厂”! 在 GTC2025 大会上,黄教主分享了十五个“饼”,涵盖数据中心的未来、强大的 CUDA、边缘计算与 6G 结合、汽车智能驾驶安全方案等多个领域。他强调,未来推理需求将暴增,并推出新款 NVL72 服务器,性价比显著提升。管推出了多项创新,黄教主仍未解答算力通缩的疑问,未来的硬件发展将面临更多挑战。延伸阅读:《[“AI 工厂时代降临”:黄仁勋 GTC2025 主旨演讲图文全文 3 万字》
2025-03-20
最近的一场deepseek AI直播是什么时候
最近的一场 DeepSeek AI 直播是 2025 年 2 月 20 日周四下午 2 点开始。您可以通过以下链接获取更多信息: 官网会议链接:https://sme.aliyun.com/live?spm=5176.29677750.J_wilqAZEFYRJvCsnM5_P7j.1.65e5154aMqiYrq&scm=20140722.M_10776450.P_117.MO_3931ID_10775537MID_10775537CID_32667ST_12908PA_se@1020146183V_1 (阿里云视频号在直播,可扫码海报上的二维码进行查看)
2025-03-20
最近的潜力AI项目是什么
以下是一些近期具有潜力的 AI 项目: 1. 《促进创新的人工智能监管方法》:其中提到了 AI 在数据生成和处理方面的进展,以及带来的机遇和风险,包括对安全、公平、隐私等方面的影响。 2. 前 Stability AI 核心成员成立新公司并获 3200 万美元融资,发布 Flux.1 开源图像生成模型,基于混合架构,结合 multimodal 和 parallel diffusion transformer。在线体验地址:https://flux1.ai 。 3. MindSearch:模仿人类在网络上寻找和整合信息的 AI 搜索引擎,能在 3 分钟内从 300+网页中收集和整合信息,相当于人类专家约 3 小时的工作量。项目地址:https://mindsearch.netlify.app 。 4. 180 度大转弯:Character AI 被 Google 收购,Character AI 首席执行官 Noam Shazeer 将带领部分员工重返谷歌。Google 以 25 亿美元的估值收购其投资者股票(每股 88 美元),但低于去年与早期投资者谈判的 50 亿美元。 5. OpenAI 的下一代 AI 模型已提交给美国 AI 安全研究所进行安全评估,OpenAI 此时与安全研究所合作,并支持增加其权力的法案,似乎试图通过影响安全研究所来控制或影响 AI 相关的法律和标准制定。
2025-03-14
最近有哪些海报设计的产品
以下是一些设计海报的 AI 产品: 1. Canva(可画):https://www.canva.cn/ 这是一个非常受欢迎的在线设计工具,提供大量模板和设计元素,用户通过简单拖放操作即可创建海报,其 AI 功能可帮助选择合适颜色搭配和字体样式。 2. 稿定设计:https://www.gaoding.com/ 稿定智能设计工具采用先进人工智能技术,自动分析和生成设计方案,稍作调整即可完成完美设计。 3. VistaCreate:https://create.vista.com/ 这是一个简单易用的设计平台,提供大量设计模板和元素,用户可使用 AI 工具创建个性化海报,其智能建议功能可帮助快速找到合适设计元素。 4. Microsoft Designer:https://designer.microsoft.com/ 通过简单拖放界面,用户可快速创建演示文稿、社交媒体帖子和其他视觉内容,还集成丰富模板库和自动图像编辑功能,如智能布局和文字优化,大大简化设计流程。 此外,Midjourney 新编辑器在电商领域也有应用,比如: 1. 产品海报设计:将产品图片导入 Midjourney 编辑器,通过简单操作生成不同风格的海报。 2. 家具材质变化:在电商家具展示中,利用 Midjourney 的图像重纹理化模式快速为家具换上各种材质。 3. 艺术字体海报:通过白底字体图,利用图像重纹理化模式变换成各种炫酷的字体海报风格。 在其他方面,还有以下海报设计相关的内容: 1. 电影和短剧海报设计:通过特定提示词,如“电影海报,电影名称在顶部文字:‘热辣滚烫 2’,中间主体沈腾热血的形象,底部文字:‘上映时间:2026 年 1 月 1 日’和‘主演:沈腾’,超高清”等,释放创意,打造视觉冲击力。 2. 营销广告创作:通过特定提示词,如“营销海报,写实风格,画面对半风格,左边是红色风格,可爱的小狗,右边是蓝色风格,可爱的小猫,中间广告字体‘双十二全场 1 折’,超高清”等,牢牢抓住目标受众的注意力。 3. 漫画制作:让每个人都能成为漫画设计师。 内容由 AI 大模型生成,请仔细甄别。
2025-03-13
AI应用赛道中top应用介绍,实现的功能和应用场景,产品Launch时间:AIGC功能 Launch时间、当前月活用户数、营收利润、一年成本投入、市场占有率、目前融资金额及估值、创始团队介绍、公司员工规模、所属国家、用户来源、用户来自于哪些国家、用户profile、转化率、ROI等等, 盈利模式,优劣势与未来发展趋势。
以下是关于 AI 应用赛道的相关介绍: 应用场景:涵盖医疗、制造业、金融风控、消费端个性化服务、办公、农业、能源优化、娱乐等领域。 关键技术: 1. 包括大语言模型作为中枢神经系统,记忆模块实现长期和短期记忆,以及规划能力中的目标设定、任务拆解、生成策略、执行与反馈、资源管理和多智能体协同。 2. 强化学习用于环境感知和决策调整,多模态融合涉及多种数据类型,低成本训练是考虑成本的重要因素。 智能体特征:包括自主性、交互性和适应性,如通过自我对弈和博弈不断进化,在金融风控领域利用大量数据提升准确率。 AI 技术路线:从有语言能力的 AI 到有推理能力,再到能使用工具、发明创新以及形成组织,共五级。 智能体框架类型:分为任务驱动型、多智能体协作、强化学习型、具身智能体、应用型智能体,每种类型都有代表性框架。 智能体与大模型的关系:大模型是中枢和基石,智能体是行动引擎,两者协同演进,智能体产生的数据可反哺大模型。 未来趋势:智能体可能在中小企业中更具效益,人机协作中人类成为监督角色,但存在算力成本、伦理风险、技术瓶颈等挑战。 B 端变现与创业方向: 1. B 端变现细分包括高频率和大规模的内容生产细分,如文字、视频、3D 模型、AI 智能体等,底层是需求和数据收集及训练模型,算力和能源是关键。 2. 自媒体创业:视频号等平台尚有蓝海空间,需具备内容创新和差异化,内容成本低且更新迭代快。 3. 游戏创业:个人或团队可做轻量化游戏,结合 AI 技术,满足放松和社交需求,专注垂类赛道,避免与大厂竞争。 4. 影视创业:25 年将是拐点,更多内容会采用 AI 技术,如哪吒 2 因前期规划未用 AI 技术。 5. 广告营销创业:重点是 AI 虚拟人,数字插画可走治愈类型,要明确平台用户画像和产品定位,做好次留存和引入私域。 AI 虚拟人的发展与创业机遇: 1. 创业难点:创业对创业者综合能力要求极高,找到志同道合且能力互补的战友是创业前期最难的事。 2. AI 虚拟人发展:从早期以首位为核心的宅文化虚拟偶像,到以 CG 技术和动捕语音合成技术为核心的角色,再到如今以动捕和人工智能技术为核心的服务型虚拟人,其发展历程不断演进。 3. 虚拟人产业链:包括基础层的硬件和软件研发,平台层如商汤、百度等提供工具和系统,应用层涉及影视、传媒、游戏、金融、文旅等内容变现。 4. 未来创业机遇:AI 虚拟人是未来 310 年 Web 3.0 的风口,提前布局未来有潜力的赛道,准备好迎接机遇。 相关案例和产品信息: 1. 10 月 26 日,AI 翻译和口型匹配技术在视频制作中的应用逐渐流行,公司如 Captions、HeyGen 和 Verbalate 通过 AI 生成字幕、配音和口型匹配等功能,帮助用户轻松实现视频翻译本地化。 2. 10 月 25 日,Perplexity 最新估值约为 5 亿美元,较 3 月宣布的 1.5 亿美元估值上涨 300%以上,当前的付费用户数量达到了 1.5 万人,截止本月,Perplexity 的 ARR 达到 300 万美元,最新估值约为 ARR 的 150 倍。 3. 《100 个有意思的 AI 应用》由国盛证券出品,分为基于 LLM 自然语言能力的对话、写作、阅读、分析等应用;多模态技术持续发展,图像、视频、音频、3D 等 AIGC 应用;企业级应用等。
2025-03-14
作为产品经理,如何完成生产级的提示词调优,保证ai功能的上线效果
作为产品经理,完成生产级的提示词调优以保证 AI 功能上线效果可参考以下内容: 1. 明确与大模型对话产品的提示词不同。对于大模型 API,要利用插件预先获取的网页内容变量、提示词和 API 请求参数,拼搭出完整的 API 提示请求,精确引导 API 返回想要的生成结果。 2. 根据 BigModel 官网给出的请求示例,在请求中传递 Model 类型、系统提示词、用户提示词、top_p、temperature 等关键参数。 3. 构建相应的 API 请求内容: 设定系统提示词,定义基础任务。 设定用户提示词,提供具体任务数据,并要求大模型按 JSON 格式返回生成结果。需注意为确保大模型能有效进行内容总结,提示词中使用${}语法动态引用插件获取的网页数据(如标题、描述、正文等),在实际发送 API 请求时,这些变量会被替换为真实的网页内容。 4. 最后,根据文本总结类任务的通常经验与实际调试情况,设定其他 API 所需关键参数。如果缺少参数设定的经验,可以先询问 AI 文本总结类的模型 API 请求,temperature 设定多少合适,再逐步调试效果。 此外,在星流一站式 AI 设计工具中: 1. 提示词用于描绘想生成的画面,支持中英文输入。不同基础模型对输入语言有不同要求。 2. 写好提示词要做到内容准确,包含人物主体、风格、场景特点、环境光照、画面构图、画质等。还可调整负面提示词,利用“加权重”功能让 AI 明白重点内容,使用预设词组、辅助功能(如翻译、删除所有提示词、会员加速等)优化提示词。启用提示词优化后,能帮您扩展提示词,更生动地描述画面内容。
2025-03-11
正在搭建客户CRM系统,对于客户拜访跟进记录表格,希望平衡销售人员的录入便捷性和信息完整性,如何通过多维表格接入的AI功能来简化信息录入,比如通过语音录音,直接解析内容。推荐我具体方法,包括怎么解析语音,输出的关键字段,以及提示词
以下是一种通过多维表格接入的 AI 功能来简化客户拜访跟进记录信息录入的方法: 1. 定义任务目标:让 AI 成为您的私人 CRM,即客户管理系统。 2. 编写指令: 定义角色:希望 AI 作为一名顶级的客户服务与销售总监,负责记住客户的爱好与信息。 提供背景信息:简单描述自己的身份,例如负责什么产品的销售。 明确任务目标和输出要求:在每次拜访客户后,把重要信息发送给 AI,要求 AI 每次接到新的客户消息后,只用回复一句“收到,知道了。” 3. 信息录入方式:可以通过语音录音的方式将拜访客户的信息传达给 AI。 4. 语音解析:利用 AI 的语音识别和自然语言处理能力,对语音内容进行解析。 5. 输出的关键字段:可能包括客户姓名、联系方式、拜访时间、拜访内容要点、客户需求、客户反馈等。 6. 提示词:例如“请整理本次拜访客户的关键信息”“提取重要内容并生成表格”等。 您可以参考以上方法,根据实际需求进行调整和优化。
2025-03-07
我想让cursor帮我编程一个能在Android studio编译的Android应用,它的主要功能是接受esp32通过websocket协议发送过来的opus数据,保存opus并把数据转换成wav,再使用sherpa-onnx语音识别成文字。我该使用什么提示词让cursor帮我写出这个Android应用?
很抱歉,目前没有适用于让 Cursor 生成您所需 Android 应用的特定提示词。编写这样一个复杂的 Android 应用需要对 Android 开发、网络通信、音频处理和语音识别等多个领域有深入的了解和专业知识。您可能需要逐步向 Cursor 描述应用的架构、各个模块的功能和实现逻辑,例如先描述如何建立与 ESP32 的 WebSocket 连接,如何接收和处理 Opus 数据,如何进行数据转换以及如何调用 Sherpaonnx 进行语音识别等。但需要注意的是,仅仅依靠提示词让 Cursor 生成完整可用的复杂应用可能具有一定的局限性,建议您在具备相关基础知识的前提下,结合 Cursor 的辅助来逐步完成开发。
2025-03-06
我想让cursor帮我编程一个能在Android studio编译的Android应用,它的主要功能是接受esp32通过websocket协议发送过来的opus数据,保存opus并把数据转换成wav,再使用sherpa-onnx语音识别成文字。我该使用什么提示词让cursor帮我写出这个Android应用?
很抱歉,目前没有关于使用 Cursor 生成您所需的这种特定 Android 应用的提示词的相关内容。一般来说,您可以向 Cursor 提供以下关键信息作为提示词的参考: 1. 明确应用的功能需求,如“编写一个在 Android Studio 中编译的 Android 应用,用于接收 ESP32 通过 WebSocket 协议发送的 Opus 数据,保存 Opus 并转换为 WAV 格式,然后使用 Sherpaonnx 进行语音识别成文字。” 2. 描述应用的技术架构和关键技术点,例如“应用需基于 Android 平台,使用合适的网络库处理 WebSocket 连接,采用有效的数据存储方式保存 Opus 数据,利用特定的音频转换库将 Opus 转换为 WAV,以及集成 Sherpaonnx 语音识别库实现文字转换。” 3. 提及开发环境和工具要求,比如“在 Android Studio 开发环境中,遵循 Android 应用开发规范和最佳实践。” 但需要注意的是,Cursor 生成的代码可能并不完全满足您的需求,还需要您进行进一步的修改和完善。
2025-03-06
产品经理在设计AI产品功能时候,需要设计意图识别吗?怎么设计呢
产品经理在设计 AI 产品功能时,需要设计意图识别。以下是关于意图识别的相关内容: 意图识别的定义:当用户输入指令,这些指令通过感知模块传递到 Brain 模块,Brain 模块需要对这些指令做出反应。这个过程在本质上是一种分类任务,即识别并区分用户的具体意图。无论是在单一智能体架构还是复杂的多智能体系统中,意图识别都扮演着至关重要的角色。 意图识别的实现方式: 1. 通过准备特定于任务的数据集,然后利用这些数据对模型进行 Finetuning,以提升其在特定意图识别任务上的表现。这个过程涉及到在预训练模型的基础上进一步训练,以调整模型参数,使其更适应特定的任务需求。 2. Prompttuning,这种方法不需要对模型的参数进行大规模调整。而是通过精心设计的提示词来引导模型,使其能够识别和响应用户的意图。这种方法的优势在于其灵活性和快速适应性,能够在不改变模型参数的情况下,迅速适应新的任务或领域。 这两种方法各有优缺点:微调能够提供更高的准确性,但需要较多的训练数据和计算资源;而提示词调优则在创造性和灵活性方面表现更为突出。 在使用大型模型进行意图识别时,需要注意一些潜在的问题: 1. 由于意图识别在智能系统中扮演着守门人的角色,如果其准确性不足,整个系统的后续环节,包括记忆、规划和反思等,都可能受到影响,无法正常发挥作用。 2. 在落地设计时,意图识别通常与特定的业务场景紧密相关,如果脱离了具体的业务需求,意图识别将失去其实际意义。因此,在设计意图识别系统时,必须将其与业务需求紧密结合,确保其能够准确地理解和响应用户的需求。如果意图识别脱离了业务背景,那么可能不如利用模型的泛化能力去执行更基本的意图识别任务。 以下是一个使用 prompt 来设计意图识别的例子:在上述使用提示词进行意图识别的例子中,提示词对用户的指令进行了分类,以识别不同的意图。然后,根据这些识别出的意图,系统执行相应的动作。最终,系统会输出一个 JSON 格式的结果,这通常包含了对用户指令的解析和响应。 在未来的 AI 学习产品中,除了拥有大模型之外,还需要拥有其他的基础设施,包括但不仅限于具备学习任务规划能力的小参数规模模型、意图识别模型、多模态交互模型、搜索引擎、既有的知识库等等。
2025-03-06