Navigate to WaytoAGI Wiki →

Home/Question List/Question Detail

海外的AI agent平台

Answer

海外已经出现了多个AI Agent平台和产品:

OpenAI GPTs：一个允许任何人都可以创建量身定制的GPTs，用于日常生活、特定任务、工作或家庭中获得更多便利以及提升效率。
Cognosys：一款基于Web的AI Agent平台，提供自主执行任务的能力。
AutoGPT和BabyAGI：这两款Autonomous Agent产品是完全由LLM自主规划工作流并执行任务的代表，引发了巨大的兴趣和影响。
其他海外项目：据报道，至少有100个项目正致力于将AI代理商业化。

总的来说，海外AI Agent领域已经出现了多种不同类型的平台和产品，涉及自主执行任务、个性化Chatbot、Autonomous Agent等，正在成为大语言模型应用的重要方向之一。

Content generated by AI large model, please carefully verify (powered by aily)

References

Coze 全方位入门剖析 - 免费打造自己的 AI Agent (国内版)

效率工具篇-5000+个AI 项目详解

质朴发言：人人都想做出下一代拟人/情感/社交网络的 AI Native 产品｜Z 沙龙第 3 期

Others are asking

本周最新的AI资讯

以下是本周最新的 AI 资讯： 3 月 12 日：【AI 3D】：BlenderMCP 与 Claude AI 沟通，在 Blender 实现快速 3D 建模；MIDI 可实现单幅图像到 3D 场景生成；Move AI 更新动作捕捉能力，提出 Gen 2 Spatial Motion。【AI 写作】：MMStoryAgent 是 AI 多模态故事生成系统。【AI 视频】：VACE 是阿里推出的一体化视频创作和编辑技术；VideoPainter 是腾讯开源的视频编辑技术；Wonder Dynamics 推出摄像机轨道（Camera Track）和清洁板（Clean Plate）功能。【其他】：OpenAI 为开发者推出一套 AI Agent 开发套件；R1Omni 是阿里情感识别模型，通过视频识别情感；Luma AI 发布一种新的预训练范式 IMM，旨在突破算法瓶颈，提高生成预训练算法的性能；Manus 宣布与阿里通义千问团队达成战略合作。 3 月 4 日：【AI 3D】：Meshcapade 预告可从视频/图像中捕捉面部表情并具有逼真的 3D 发丝；InsTaG 通过几秒钟视频学习，快速形成逼真的 3D 说话头像效果；3DMem 是新型 3D 场景记忆框架。【AI 绘图】：智谱开源 AI 绘图 CogView4，可以在图像中生成中文字符；海螺推出 Image01 多功能文本转图像模型。【AI 视频】：Runway 网友爆料其内测能力可根据参考图像进行 Video to Video 视频风格化；Vidu 的 API 开放平台全面开放。【AI 模型】：Google Colab 推出 Data Science Agent；微软为医疗行业提供首个统一语音 AI 助手：Dragon Copilot；Opera 宣布推出网页浏览器的 AI 代理。 AIGC Weekly32： Netflix 列出了一个年薪 90 万美元的机器学习平台产品经理的 AI 产品工作岗位： Shopify 的 AI 助手现已上线。Sidekick 是一个帮助机器人，它知道如何在 Shopify 中执行任何操作提取相关数据、操作新功能或创建报告： Artifact（Ins 创始人做的 AI 新闻浏览软件）推出了自定义内容阅读语音的功能： OpenAI、谷歌、微软和 Anthropic 组建了前沿模型论坛，主要目的是确保 AI 模型的安全发展： Open AI 悄咪咪下线了他们的 ChatGPT 生成内容的检测器：

最新的Ai资讯

以下是 3 月 4 日、10 日、12 日的 AI 资讯汇总： 3 月 4 日：【AI 3D】 Meshcapade：预告可从视频/图像中捕捉面部表情并具有逼真的 3D 发丝。 InsTaG：通过几秒钟视频学习，快速形成逼真的 3D 说话头像效果。 3DMem：新型 3D 场景记忆框架。【AI 绘图】智谱：开源 AI 绘图 CogView4，可以在图像中生成中文字符。海螺：推出 Image01 多功能文本转图像模型。【AI 视频】 Runway：网友爆料 Runway 内测能力可根据参考图像进行 Video to Video 视频风格化。 Vidu：API 开放平台全面开放。【AI 模型】 Google Colab：推出 Data Science Agent。微软：为医疗行业提供首个统一语音 AI 助手：Dragon Copilot。 Opera：宣布推出网页浏览器的 AI 代理。 3 月 10 日：【AI 3D】 MeshPad：草图创建 3D 网格，支持编辑修改，实现直观和交互式的 3D 建模。【AI 写作】 Muse：专门为小说创作训练的 AI 模型工具，可实现在线的小说续写修改，创意头脑风暴以及同时基于画布形式的故事创作。可免费试用。【AI 视频】 Luma：发布 Ray2 Flash 视频模型，生成速度快 3 倍，成本便宜三倍。【其他】 OpenAI：为旗下模型推出模型对比页面，可对于模型基础能力进行直观对比了解。谷歌：为开发者推出 Gemini 嵌入模型 Gemini Embedding。中国成功研制“祖冲之三号”量子计算原型机。 3 月 12 日：【AI 3D】 BlenderMCP：与 Claude AI 沟通，在 blender 实现快速 3D 建模。 MIDI：单幅图像到 3D 场景生成。 Move AI：更新动作捕捉能力，提出 Gen 2 Spatial Motion。【AI 写作】 MMStoryAgent：AI 多模态故事生成系统。【AI 视频】 VACE：阿里推出一体化视频创作和编辑技术。 VideoPainter：腾讯开源视频编辑技术。 Wonder Dynamics：推出摄像机轨道（Camera Track）和清洁板（Clean Plate）功能。【其他】 OpenAI：为开发者推出一套 AI Agent 开发套件。 R1Omni：阿里情感识别模型，通过视频识别情感。 Luma AI：发布一种新的预训练范式 IMM，旨在突破算法瓶颈，提高生成预训练算法的性能。 Manus：宣布与阿里通义千问团队达成战略合作。

有没有参照pdf模仿生成一个类似的word的ai

以下是关于将 PDF 转换为类似 Word 或生成可视化网页的相关内容：用 AI 把 PDF 一键变成能玩的可视化网页是可行的。如果想插入视频，需找到公网的视频地址（本地视频先上传到公网，如 Youtube 或 B 站），在视频页面寻找“分享”按钮，点击“嵌入”或“嵌入代码”选项，把复制下来的 HTML 代码粘贴到媒体资源处。对于其他渠道没有代码预览功能的，可把生成的代码复制到 https://www.yourware.so/ ，点 deploy code 稍等就有预览，点 copy link 可分享给朋友。基于深度学习的 ChatDOC PDF 解析器在超过一千万份文档页面的语料库上进行了训练，包含一系列复杂步骤，如 OCR 进行文字定位和识别、物理文档对象检测、跨列和跨页调整、阅读顺序确定、表格结构识别、文档逻辑结构识别等。解析后会以 JSON 或 HTML 格式提供结果，像一个结构清晰的 Word 文件。而将 PDF 转换为可视化网页这种方式在 AI 加持下门槛很低，人人都可操作。整体思路来自归藏，按此修改的 Prompt 目前在 Claude 3.7 Sonnet 效果最好，其他大模型生成的审美稍差。Prompt 基本复制可用，但细节部分如作者信息和媒体资源要改成自己的内容。媒体资源方面，图片尽量用公链，网上现成图片可右键复制图像链接，自己的图片可使用图床服务托管生成公链，然后用 Markdown 格式贴到媒体资源处。

有没有参照pdf模仿生成一个类似的ai

以下是关于参照 PDF 模仿生成类似内容的相关信息：可以用 AI 把 PDF 一键变成能玩的可视化网页。若想插入视频，需找到公网视频地址（如上传本地视频至 Youtube 或 B 站），在视频页面寻找“分享”按钮，点击“嵌入”或“嵌入代码”选项，将复制的 HTML 代码粘贴到媒体资源处。对于没有代码预览功能的渠道，可将生成的代码复制到 https://www.yourware.so/ 网站，点 deploy code 稍等即可预览，点 copy link 能分享给朋友。让 AI 像人类一样思考的步骤包括：输入章鱼哥，把情绪体感构建轮子的 prompt3 粘进去拼到章鱼哥下面，点击发送按钮让模型完成人物解构建构，复制章鱼哥 prompt 给到模型，和章鱼哥聊天看其反应。AI 拟人化的核心在于“体感”的重现，通过解构建构得到四种类型的轮子并合理使用，能让 AI 语言表达重现人类的体感，使其在不同场景中展现像人类一样的思维、情感和行动。关于教师使用 AI 减负，可先输入讲义 PDF 让 AI 提取知识点，例如在对话框输入“请提取以下 PDF 中的主要知识点”并上传讲义 PDF 文件。

AIGC是什么意思

AIGC 是 AI generated content 的缩写，又称为生成式 AI，指利用人工智能技术生成的内容，例如 AI 文本续写、文字转图像的 AI 图、AI 主持人等。 AIGC 工具通常使用机器学习算法，以自然语言处理为基础，分析大型文本数据集，并学习如何生成风格和语气相似的新内容。其应用领域广泛，包括内容创作、广告、媒体等。能进行 AIGC 的产品项目和媒介众多。语言文字类有 OpenAI 的 GPT、Google 的 Bard、百度的文心一言等；语音声音类有 Google 的 WaveNet、微软的 Deep Nerual Network、百度的 DeepSpeech 等；图片美术类有早期的 GEN 等图片识别/生成技术，去年大热的扩散模型又带火了 Midjourney、谷歌的 Disco Diffusion、OpenAI 的 Dalle·2 以及 stability ai 和 runaway 共同推出的 Stable Diffusion 等。 AIGC、UGC（普通用户生产）和 PGC（专业用户生产）都是内容生成的不同方式。AIGC 由人工智能生成内容，可快速大规模生成，适用于自动化新闻、广告创作等；UGC 由用户生成，内容丰富多样，适用于社交媒体、社区论坛等；PGC 由专业人士或机构生成，内容质量高、专业性强，适用于新闻媒体、专业网站等。在国内，AIGC 主要在《网络安全法》《数据安全法》《个人信息保护法》的框架下，由《互联网信息服务算法推荐管理规定》《互联网信息服务深度合成管理规定》《生成式人工智能服务管理暂行办法》《科技伦理审查办法（试行）》共同监管。

有没有使用AI炒股的相关内容

以下是关于使用 AI 炒股的相关内容： 1. Stocked AI 是一个投资服务，提供每日股票推荐。其推荐由机器学习模型生成，使用人工智能预测下一天的股票收盘价。 2. 博主林亦 LYi 的《AI 炒股？我开了一家员工全是 AI 的公司，自动帮我炒股》在某种程度上实现了多 Agent 协作的能力。 3. 有摊位提出“AI+交易：来定制专属于你的私人高级交易顾问吧！”的思路，期望借助 AI 分析行情，提高资金使用效率。目前 AI Agent 应用大多集中在 2B 场景，面向个人消费者的产品较少。一方面高度智能化的 Agent 能力需要打磨，概念落地还有距离；另一方面 AI 和娱乐消费诉求的结合几乎没有，其主要带来的是生产方式变革和效率变革。个人消费者方向，目前只看到“私人助理”场景。

OpenAl 发布 Agent 工具包

OpenAI 刚发布了全新的 Agent 工具包，这标志着 AI 智能体进入了新时代。新推出的 Responses API 及相关工具，简化了开发者构建多功能 AI Agent 的流程，实现了自动化任务处理。其中，网络搜索、文件搜索及计算机使用工具相结合，使 AI 不仅能获取实时信息，还能执行复杂操作。这不仅是对 Assistants API 的全面升级，也意味着智能体进入统一接口、标准化开发的新阶段。OpenAI 表示，2025 年将是 Agent 的元年，让 AI 超越聊天框，成为工作中的“数字助理”与“数字同事”。开发智能体不再需要拼凑繁杂代码，只需 4 行代码即可实现。

agent和agi的区别

Agent 和 AGI 的区别主要体现在以下几个方面： Agent（智能体）：是执行特定任务的 AI 实体。拥有复杂的工作流程，可以自我对话，无需人类驱动每一部分的交互。由大型语言模型、记忆、任务规划以及工具使用等部分组成。例如在斯坦福 25 人小镇案例中有所应用。 AGI（人工通用智能）：强调的是具备像人类一样广泛和通用的智能能力。追求能够在各种不同的任务和领域中表现出高度智能的水平。总的来说，Agent 更侧重于特定任务的执行和特定功能的实现，而 AGI 则是一个更宏观和全面的概念，旨在实现广泛的通用智能。

agent和workflow的区别

智能体（Agent）和工作流（Workflow）的区别主要体现在以下几个方面： 1. 定义和功能：智能体是由 LLM 动态指导自身流程和工具使用的系统，能够自主控制任务完成方式。工作流是通过预定义代码路径来编排 LLM 和工具的系统。 2. 运行方式：智能体可以长期独立运行，是全自动的系统，能使用各种工具完成复杂任务。工作流中的子任务是人为编排的，属于手动编排。 3. 组成和特点：工作流中的每个组块可以看成是一个函数，包括传统函数、调用第三方服务的函数和基于 LLM 的函数。由这三类函数组合而成的工作流被称为超函数，它不同于传统函数，形式上是用自然语言编写的程序，功能上可以模拟人的高阶思维。智能体在架构上与工作流有所区分，其更强调自主性和动态性。在实际应用中，工作流的灵活性和可控性能够将智能体能力的天花板往上顶一大截，例如可以在流程中加入人类 Knowhow、进行专家测试试跑、引入图的概念灵活组织节点等。评价一个 Agent 平台好不好用，可以从基座模型的 function calling 能力、workflow 的灵活性以及平台创作者的 workflow 编写水平等方面考量。

智能体（Agent）在人工智能和计算机科学领域是一个重要概念，指能够感知环境并采取行动以实现特定目标的实体，既可以是软件程序，也可以是硬件设备。在 LLM 支持的自主 Agent 系统中，LLM 充当 Agents 的大脑，并具有以下关键组成部分： 1. 规划：包括子目标和分解，将大型任务分解为更小、可管理的子目标，以有效处理复杂任务。 2. 反思和完善：能够对过去的行为进行自我批评和反思，从错误中吸取教训，完善未来步骤，提高最终结果质量。 3. 记忆：包含短期记忆，用于所有的上下文学习；长期记忆，通过利用外部向量存储和快速检索，为 Agents 提供长时间保留和回忆（无限）信息的能力。 4. 工具使用：Agents 学习调用外部 API 来获取模型权重中缺失的额外信息，包括当前信息、代码执行能力、对专有信息源的访问等。以下是一些关于智能体 Agent 的相关目录： 1. 2. 3. 4. 5. 6. 从产品角度思考 Agent 设计： 1. Agent 可以是一个历史新闻探索向导。身份：历史新闻探索向导性格：知识渊博、温暖亲切、富有同情心角色：主导新闻解析和历史背景分析为使角色更生动，可为其设计简短背景故事，如曾是一位历史学家，对重大历史事件了如指掌，充满热情，愿意分享知识。 2. 写好角色个性的方法：角色背景和身份：编写背景故事，明确起源、经历和动机。性格和语气：定义性格特点，如友好、幽默、严肃或神秘；确定说话方式和风格。角色互动方式：设计对话风格，从基本问答到深入讨论。角色技能：明确核心功能，如提供新闻解析、历史背景分析或心理分析；增加附加功能以提高吸引力和实用性。正如《》所写：个性化定制的“虚拟伴侣”能得到用户认可，因为精准击中许多年轻人的孤独和焦虑。美国心理学家 Robert Jeffrey Sternberg 提出的“爱情三角理论”认为爱情包含“激情”“亲密”“承诺”三个要素。激情是生理上或情绪上的唤醒；亲密是一种相互依恋的感觉，通过相互联结带来的喜爱和相互沟通分享体现；承诺是决定建立长期稳定关系，融入对方生活，形成互助互惠的关系，代表着一种长相厮守的责任。

在人工智能和计算机科学领域，“Agent（智能体）”是一个重要概念：它是一种能够感知环境并采取行动以实现特定目标的实体，可以是软件程序或硬件设备。从产品角度看，比如作为历史新闻探索向导，具有知识渊博、温暖亲切、富有同情心等性格特点，有明确的身份、角色和背景故事。在 LLM 支持的自主 Agent 系统中，LLM 充当 Agents 的大脑，并包括规划（将大型任务分解为子目标、反思和完善）、记忆（短期记忆和长期记忆）、工具使用（调用外部 API 获取额外信息）等关键组成部分。 LLM Agent 是结合大型语言模型和自主智能体特性的系统，能够利用大型语言模型的自然语言处理能力进行智能决策和行动。其组成部分包括规划（负责任务分解和策略评估）、记忆（信息存储与回忆，包括短期和长期）、工具（感知环境和执行决策的辅助手段）和行动（将规划和记忆转换为具体输出）。

在人工智能和计算机科学领域，“Agent（智能体）”是一个重要概念，指能够感知环境并采取行动以实现特定目标的实体，可以是软件程序或硬件设备。从产品角度来看，Agent 可以有特定的身份、性格和角色。例如，它可以是一个历史新闻探索向导，具有知识渊博、温暖亲切、富有同情心的性格，主导新闻解析和历史背景分析。为使角色更生动，可设计背景故事。写好角色个性需考虑角色背景和身份、性格和语气、角色互动方式以及角色技能等方面。在 LLM 支持的自主 Agent 系统中，LLM 充当 Agents 的大脑，并辅以规划、子目标和分解、反思和完善、记忆（包括短期记忆和长期记忆）、工具使用等关键组成部分。 LLM Agent 是结合大型语言模型（LLM）和自主智能体（Agent）特性的系统，能够利用大型语言模型的自然语言处理能力，理解用户输入，并进行智能决策和行动。其组成部分包括规划（负责将复杂任务分解成可执行的子任务，并评估执行策略）、记忆（包括短期记忆用于存储对话上下文和长期记忆存储用户特征和业务数据）、工具（如 API 调用、插件扩展等辅助感知环境和执行决策）、行动（将规划和记忆转换为具体输出，包括与外部环境的互动或工具调用）。

我是小白，想做一个自媒体全媒体一键管理AI，帮助自媒体创业者一键管理全媒体平台的数据，内容，客户以及产品，怎么实现

要实现自媒体全媒体一键管理 AI 帮助自媒体创业者管理全媒体平台的数据、内容、客户以及产品，可以参考以下思路：首先，对于将 PDF 一键变成能玩的可视化网页，整体思路来自于归藏。在藏师傅的基础上稍作修改的 prompt，目前在 Claude 3.7 Sonnet 效果最佳，其他大模型生成的审美可能稍差。可以将 prompt 用于 Claude 自己的官网、trea 海外版、cursor 等能使用 Claude 3.7 的产品。使用时，prompt 整体基本可复制，但细节部分需修改： 1. 作者信息部分改成自己的内容。 2. 媒体资源部分，可加上自己特定要出现的图片/视频。不需要的直接删掉这一块。若使用网上现成的图片，直接右键复制图像链接；若是自己的图片，可使用图床服务（如 https://sm.ms/）托管图片生成公链，然后用 Markdown 格式贴到媒体资源处。注意文档上传时，图片不要跟着文档一起上传，可能会有显示错误，尽量用公链。虽然上述是关于将 PDF 变成可视化网页的方法，但其中的思路和技术或许能为您实现自媒体全媒体一键管理 AI 提供一些启发和借鉴。

一个尽可能完美的AGI时代的多Agents协同工作平台应该具备怎样的能力设计？

一个尽可能完美的 AGI 时代的多 Agents 协同工作平台通常应具备以下能力设计： 1. 融合 RL（强化学习）与 LLM（大型语言模型）思想：在多 Agent 情境下，形成复杂多轮会话及协作行动过程，为系统二进行大规模的过程学习提供路径。同时，LLM 能从 RL 过程中习得新的、足够新颖的策略，例如像 AlphaGO 那样通过自博弈创新策略并快速反馈奖励，最终达成任务目标。 2. 具备多项优势：适配国内外主流开源及闭源大语言模型，支持多模型混合使用，构建企业级场景服务生态，提供场景化解决方案。拥有灵活可视化无代码应用构建、TexttoAgent 技术，构建便捷，上手简单，操作高效。能够即时发布上线，支持发布为网页/小程序/API 等多种形态，快速部署 Agent 应用。提供企业级安全访问控制，依据 Agent 权限控制数据访问，通信过程加密，防止数据泄露风险。支持多 Agents 协作，构建知识工作者的人机协作流水线，满足复杂业务场景需求。 3. 允许使用自然语言制定 Agent 及其交互规则，并引入低延时的 Realtime API：即使没有专业编程技能，只要能用清晰的自然语言描述出各个 Agents 具备的行为和功能，就可以快速制作多 Agents 应用或创建代理式工作流。例如在一个简单场景中，可设置接待员和写诗的 Agents 并实现交互。

怎么搭建自己的直播数字人平台

搭建自己的直播数字人平台可以参考以下步骤： 1. 了解相关技术和场景：熟悉企业端 AI 实践经验，包括 AI 生成爆款内容、公域阵地场景（如视频号、抖音、小红书、公众号等平台的营销推广，涉及矩阵号工具、内容抓取分析、脚本创作、AI 剪辑、自动回复评论、无人直播工具等）、私域阵地场景（朋友圈、小红书、社群、个人 IP 的获客转化，销售企微 SCRM 工具、企业智能体进行 AI 内容抓取和自动回复）、服务自动化工具、快速搭建数据分析看板、跨境电商场景（如 tiktok 视频制作及投放、电商图片设计、精准营销、语言翻译、AI 独立站建设、社媒私域、批量混剪、海外达人直播、无人直播等）。 2. 构建数字人躯壳：可以使用 web 前端页面（Live2D 提供了 web 端的 SDK）或者 Native 的可执行程序进行部署。例如开源数字人项目选择 live2d 作为数字人躯壳，其驱动方式相比 AI 生成式更加可控和自然，相比虚幻引擎更加轻量和简单，卡通二次元形象接受度更高。可参考 Live2D 官方示例：https://github.com/Live2D 。 3. 延伸阅读相关资料：参考政策如《互联网信息服务深度合成管理规定》（http://www.gov.cn/zhengce/zhengceku/202212/12/content_5731431.htm ）、《北京市促进数字人产业创新发展行动计划》（https://www.ncsti.gov.cn/kjdt/scyq/zcwj_47/202209/P020220906666181884578.pdf ）等。了解应用如《一键拥有自己的 AI 虚拟人合成平台》（https://mp.weixin.qq.com/s/EhukdKOlHYJGwHBldGi4Q ）、《使用 AI 工具生成虚拟数字人（视频）》（https://www.bilibili.com/video/BV1Tb411D7fo/?spm_id_from=333.337.searchcard.all.click&vd_source=2c5fdcdac5fea78671c3a8ebd9a134d3 ）等。

不能用APP思维、传统数字平台思维去做大模型创业和人工智能创业，二者在底层逻辑和商业模式等方面完全不同

大模型创业和人工智能创业与 APP 思维、传统数字平台思维在底层逻辑和商业模式等方面存在显著差异。大模型和人工智能创业更注重数据的深度处理、算法的优化创新以及对复杂问题的解决能力。相比之下，APP 思维通常侧重于用户界面和功能的设计，以满足特定的用户需求；传统数字平台思维则更多关注平台的搭建和用户流量的获取与运营。在大模型和人工智能领域，技术的突破和创新是关键，需要投入大量资源进行研发，并且要面对更高的技术门槛和不确定性。而 APP 和传统数字平台的创业相对更侧重于市场推广和用户体验的优化。总之，不能简单地用 APP 思维和传统数字平台思维来指导大模型和人工智能创业。

哪个平台可以教我如何给deepseek发指令？

以下是关于如何给 DeepSeek 发指令的相关信息：访问网址：www.deepseek.com，点击“开始对话”。操作步骤：第一步：搜索 www.deepseek.com，点击“开始对话”。第二步：将装有提示词的代码发给 DeepSeek。第三步：认真阅读开场白之后，正式开始对话。此外，还为您提供了一些关于 DeepSeek 的其他知识：设计思路：将 Agent 封装成 Prompt，将 Prompt 储存在文件，保证最低成本的人人可用的同时，减轻自己的调试负担。通过提示词文件，让 DeepSeek 实现同时使用联网功能和深度思考功能。在模型默认能力的基础上优化输出质量，并通过思考减轻 AI 味，增加可读性。照猫画虎参考大模型的 temperature 设计了阈值系统，但是可能形式大于实质，之后根据反馈可能会修改。用 XML 来进行更为规范的设定，而不是用 Lisp（对作者来说有难度）和 Markdown（运行下来似乎不是很稳定）。完整提示词：v 1.3 特别鸣谢：李继刚的【思考的七把武器】在前期为作者提供了很多思考方向；Thinking Claude 这个项目是作者现在最喜欢使用的 Claude 提示词，也是设计 HiDeepSeek 的灵感来源。同时，为您介绍一些其他相关内容：集合·DeepSeek 提示词方法论：核心原理认知：包括 AI 特性定位（多模态理解、动态上下文、任务适应性）和系统响应机制（采用意图识别+内容生成双通道、自动检测 prompt 中的任务类型/输出格式/知识范围、反馈敏感度）。基础指令框架：如果不知道如何表达，还是可以套用框架指令，如四要素模板、格式控制语法（强制结构、占位符标记、优先级符号）。进阶控制技巧：包括思维链引导（分步标记法、苏格拉底式追问）、知识库调用（领域限定指令、文献引用模式）、多模态输出。

用哪个ai平台，可以识别图像户型图，给做一个三居改四居的设计方案

目前，市面上还没有专门的 AI 平台能够直接根据图像户型图为您生成三居改四居的设计方案。但是，一些与室内设计相关的软件和平台可能会对您有所帮助，例如酷家乐、三维家等，它们具有一定的户型设计和修改功能，您可以尝试使用这些平台，并结合自己的需求和创意来完成设计方案。

海外比较好的图片生成工具

以下是一些海外比较好的图片生成工具： 1. 谷歌图像生成工具：特点：理解能力强，有使用门槛，不能输入中文，每日免费 500 次，生成速度快，可调整提示词和选项，能根据提示词生成不同风格和复杂程度的图像，随机种子影响生成结果，可提供参考图设置主题场景样式。 2. 纳米搜索反推提示词：可上传图片让其反推 midjourney 提示词，输出效果好，能调用多种模型，查阅资料也可用，会搜索全网并精选资料，还能看到调用的内容和参考资料。 3. ideogram：是一个海外生图平台，早期以能够准确生成图片中的文字而出名，目前该平台仍然有大量创作者生成各类创意 Logo，对于英文字母的生成非常友好，也非常方便，输入支持中文。使用方法：最简单的方法就是直接在首页信息流中找到中意的 Logo 款式，点进去 retry，替换掉提示词中字母的部分。目前支持主流的图片比例，以及输入框下方有一些主流风格可以选择。

海外手机AI怎么变化

海外手机 AI 的变化情况如下：《平安证券：AI 系列深度报告（五）AI 手机》指出，AI 手机的发展重心正逐步向端侧转移，全球出货量将呈现指数级增长。关于海外 AI 的其他相关信息：《》显示，上周，Ideogram 推出功能强大的 2.0 图像生成模型，同时 Jamba 1.5 系列在非 Transformer 架构上取得突破。AI 工具如 ComfyUI 和 Cluade 更新，Cursor 获巨资融资。Google 的 Gemini AI 项目新增技术领导，亚马逊通过 AI 工具极大提升代码开发效率。《》由垦丁律师事务所联合 WEEE Consulting 和 Boosterhub 撰写，深入分析了东南亚地区生成式人工智能（AI）的产业现状、监管框架及合规要求。报告涵盖了新加坡、越南、泰国、马来西亚、印度尼西亚和菲律宾六国，探讨了 AI 产品合规性、数据本地化、跨境数据传输、内容安全和知识产权等关键问题。报告指出，尽管东南亚国家在 AI 发展上展现出潜力，但各国法规和伦理标准存在差异，对 AI 的法律监管和合规要求也各不相同。此外，还有全球 AI APP 增长榜中虚拟角色相关的数据： |排行|产品名|分类 aiwatch.ai|6 月 APP 下载量 k|相对 5 月变化| |||||| |18|Crushon AI|虚拟角色|83|0.186| |19|Pocket Girl|虚拟角色|75|0.038| |20|SynClub|虚拟角色|72|0.25| |21|AI Fantasy|虚拟角色|69|0.242| |22|Jupi|虚拟角色|56|0.164| |23|HiChat|虚拟角色|56|0.176| |24|Planet J|虚拟角色|51|50| |25|Wow|虚拟角色|49|2.356| |26|AI Dungeon|虚拟角色|48|0.314| |27|Charstar|虚拟角色|44|0.12| |28|Monaland|虚拟角色|35|0.255| |29|Sakura|虚拟角色|35|0| |30|MeetAI|虚拟角色|30|0.483| |31|Spicy Chat AI|虚拟角色|29|0.356| |32|Call annie|虚拟角色|24|0.455| |33|筑梦岛|虚拟角色|22|0.043| |34|Koko AI|虚拟角色|21|0.447| |35|BALA AI|虚拟角色|20|0.375| 在图像 AI 领域，国内的图像 AI 产品发展迅速，如快手团队开发的“可灵”，主要用于生成高质量的图像和视频，图像质量高，但价格相对较高；阿里的“通义万相”在中文理解和处理方面表现出色，操作界面简洁直观，用户友好度高，重点是现在免费，每天签到获取灵感值就可以，但也存在一些局限性，如某些类型的图像可能无法生成，在处理非中文语言或国际化内容方面可能不如一些国际 AI 图像生成工具出色，在处理多元文化内容时可能存在偏差。

2024年生成式人工智能-海外合规白皮书

以下是为您找到的与 2024 年生成式人工智能相关的内容：《2024 年生成式人工智能海外合规白皮书（东南亚篇）》由垦丁律师事务所联合 WEEE Consulting 和 Boosterhub 撰写，深入分析了东南亚地区生成式人工智能（AI）的产业现状、监管框架及合规要求。报告涵盖了新加坡、越南、泰国、马来西亚、印度尼西亚和菲律宾六国，探讨了 AI 产品合规性、数据本地化、跨境数据传输、内容安全和知识产权等关键问题。报告指出，尽管东南亚国家在 AI 发展上展现出潜力，但各国法规和伦理标准存在差异，对 AI 的法律监管和合规要求也各不相同。 2024 年 8 月 26 日的《》，其中提到上周，Ideogram 推出功能强大的 2.0 图像生成模型，同时 Jamba 1.5 系列在非 Transformer 架构上取得突破。AI 工具如 ComfyUI 和 Cluade 更新，Cursor 获巨资融资。Google 的 Gemini AI 项目新增技术领导，亚马逊通过 AI 工具极大提升代码开发效率。此外，还有其他一些相关研究报告，如：《爱分析：2024 智能办公厂商全景报告》强调智能办公系统在企业数字化转型中的关键作用。《平安证券：AI 系列深度报告（五）AI 手机》指出 AI 手机的发展重心正逐步向端侧转移，全球出货量将呈现指数级增长。关于 2024 年人工智能的报告还包括： 2024 人工智能报告中提到，欧盟人工智能法案获得批准并正式生效，欧洲成为世界上第一个全面采用人工智能监管框架的地区。美国大型实验室努力应对欧洲监管，中国人工智能监管进入执行时代，美国对中国实施更严格的出口管制和投资限制。《生成式 AI 季度数据报告 2024 月 13 月》，作者为郎瀚威 Will、张蔚 WeitoAGI、江志桐 Clara ，报告包含总体流量概览、分类榜单等内容。您可在知识星球下载其它一些研究报告：。公众号回复“2024 一季度”，可以获得《生成式 AI 季度数据报告 2024 月 13 月》的 PDF 。