Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

sora教程

Answer

以下是关于 Sora 及相关的教程信息:

  • AI 视频方面:
  • Python + AI 方面:
    • 对于不会代码的人,有 20 分钟上手的教程,包括通过 OpenAI 的 API 生成文章缩略信息的代码重写及相关操作步骤。同时提醒妥善保管 API Key,OpenAI 的综合文档、API 使用、API Playground、API 案例与答疑的相关网址为:https://platform.openai.com/docs/overview 、https://platform.openai.com/docs/api-reference 、https://platform.openai.com/playground 、https://cookbook.openai.com/ 。
  • 工具教程:
    • StableVideo开放公测,群友有实测案例。可参考卡兹克的教程介绍:https://mp.weixin.qq.com/s/YGEnIzfYA3xGpT9_qh56RA 以及 zho 总结的官方网站的案例。目前除每日 150 个赠送积分外,还新增积分购买选项,可操作固定种子、步数、运动幅度,交互也很有意思,在生成过程中会有案例标注。

此外,还有几个视频 AIGC 工具:Opusclip 可将长视频剪成短视频,Raskai 能将短视频素材直接翻译至多语种,invideoAI 输入想法后可自动生成脚本和分镜描述进而生成视频再人工二编合成长视频,descript 可对屏幕/播客录制并以 PPT 方式做视频,veed.io 能自动翻译自动字幕,clipchamp 是微软的 AI 版剪映,typeframes 类似 invideoAI 但内容呈现文本主体比重更多,google vids 是一款相关工具。Sora 是 OpenAI 发布的超强视频生成 AI,能通过处理各种视觉数据生成视频,使用视频压缩网络和空间时间补丁统一不同来源数据,并借助文本条件化的 Diffusion 模型生成与文本提示匹配的视觉作品。

Content generated by AI large model, please carefully verify (powered by aily)

References

AI视频:软件教程

[视频模型:Sora](https://waytoagi.feishu.cn/wiki/S5zGwt5JHiezbgk5YGic0408nBc)[工具教程:Hedra](https://waytoagi.feishu.cn/wiki/PvBwwvN36iFob7kqZktcCzZFnxd)[应用教程:视频转绘](https://waytoagi.feishu.cn/wiki/ZjKpwSd5hiy6ZhkiBVHcOBb6n9r)[应用教程:视频拆解](https://waytoagi.feishu.cn/wiki/WeKMwHRTmiVpYjkVdYpcFjqun6b)[应用教程:图片精修](https://waytoagi.feishu.cn/wiki/CfJLwknV1i8nyRkPaArcslWrnle)[heading2][content]几个视频AIGC工具:Opusclip利用长视频剪成短视频Raskai短视频素材直接翻译至多语种invideoAI输入想法-->自动生成脚本和分镜描述-->生成视频-->人工二编-->合成长视频descript屏幕/播客录制-->PPT方式做视频veed.io自动翻译自动字幕clipchamp微软的AI版剪映typeframes类似invideoAI,内容呈现文本主体比重更多google vids一口大饼

写给不会代码的你:20分钟上手 Python + AI

帮我升级一下这个代码,完整重写:你不需要输出这篇文章的原始内容,而是通过OpenAI的API,生成这篇文章的缩略信息,并打印你假定我的OpenAI API key是(我这是一个假的Key):Craze-Thursday-Vivo-50这是示例代码:[heading1]ChatGPT[content]为了满足你的要求,我们需要重写上述代码,以便首先抓取文章内容,然后使用假设的OpenAI API key(注意实际操作中需要替换为真实的API key)来生成文章的缩略信息。以下是整个过程的代码:首先,安装必要的库:接下来,使用以下代码:[heading3]运行看看效果[content]先复制第一段,运行试试然后是第二段,记得把Key改一下😊截图的时候我把key换成了疯四😊看一下生成结果:Sora是OpenAI发布的超强视频生成AI,通过处理各种视觉数据生成视频。它使用视频压缩网络和空间时间补丁来统一不同来源的数据,然后借助文本条件化的Diffusion模型生成与文本提示匹配的视觉作品。这种方法使Sora能够创造出高度创新和多样化的视频内容,跨越语言和视觉障碍,展现出AI在理解语言和创作视觉方面的强大实力。[heading3]Tips[content]API Key是你的扣费凭证,请永远妥善保管你的Key,不要泄漏各家AI最细致的教程,几乎都在他们的官网上,对于OpenAI来说:综合文档:https://platform.openai.com/docs/overviewAPI使用:https://platform.openai.com/docs/api-referenceAPI Playground:https://platform.openai.com/playgroundAPI案例与答疑:https://cookbook.openai.com/

工具教程:StableVideo

stablevideo.com开放公测!!群友实测案例目前市面上非常优秀的AI视频工具,只有几家都试过之后才知道各家的擅长。(因为最近在搞离谱村项目,把所有图生视频工具都用了个遍,能感受到每个产品背后差别)先看卡兹克的教程介绍:https://mp.weixin.qq.com/s/YGEnIzfYA3xGpT9_qh56RA再看看zho总结的官方网站的案例[heading3]现在还能白嫖[content]当大家都沉浸在Sora的惊艳中时,昨天(2.21)SVD1.1官网正式开放了公测!快去玩!除了每日150个赠送积分外,还新增了积分购买选项,目前提供两种积分包(积分永久有效):500积分/$10,约50段视频3000积分/$50,约300段视频期待各位的大作!另外之前emad提到过SVD本身是基于2.1模型的然后也说到与sora差距是gpt2和3的样子应该是未来估计会有基于SDXL的视频模型,他也说到过或许需要一些小微调模型来弥补差距[heading3]可以操作固定种子,步数,运动幅度[heading3]交互也很有意思,在生成的过程中,会给一些案例让你帮忙做标注[content]用了歸藏的截图示意

Others are asking
sora现在能生成多长时间视频
Sora 是由 OpenAI 开发的文生视频模型,能够根据文字指令创造出逼真且充满想象力的场景,并生成长达 1 分钟的高质量视频,且具有一镜到底的特点,视频中的人物和背景能保持惊人的一致性和稳定性。与之前的视频生成模型相比,Sora 在生成时长和视频质量上有显著进步。同时,还有其他一些文字生成视频的 AI 产品,如 Pika 擅长动画制作且支持视频编辑,SVD 是基于 Stable Diffusion 的插件,Runway 是老牌的收费 AI 视频生成工具且提供实时涂抹修改视频功能,Kaiber 是视频转视频 AI,能将原视频转换成各种风格的视频。更多相关网站可查看:https://www.waytoagi.com/category/38 。
2025-01-15
如何使用sora生成一段视频
使用 Sora 生成一段视频的步骤如下: 1. 文本提示优化:类似于 DALLE3,Sora 在处理用户提供的文本提示时,可以利用 GPT 模型来扩展或优化提示。GPT 模型能将简短的用户提示转化为更详细、更富有描述性的文本,有助于 Sora 更准确地理解并生成符合用户意图的视频。 2. 生成视频:用户提供文本提示,Sora 根据提示在潜在空间中初始化视频的生成过程。利用训练好的扩散模型,Sora 从这些初始化的时空潜伏斑块开始,逐步生成清晰的视频内容。 3. 视频解码和后处理:使用与视频压缩相对应的解码器将潜在空间中的视频转换回原始像素视频。对生成的视频进行可能的后处理,如调整分辨率、裁剪等,以满足发布或展示的需求。 此外,Sora 采用了一些相关技术和原理: 1. 视频压缩网络:训练一个降低视觉数据维度的网络,接受原始视频作为输入,并输出在时间和空间上都被压缩的潜在表示。Sora 在这个压缩的潜在空间上进行训练,并随后生成视频。同时还训练了一个相应的解码器模型,将生成的潜在表示映射回像素空间。 2. 时空潜空间块:给定一个压缩的输入视频,提取一序列的时空分块作为 Transformer 变换器的 Token。这个方案也适用于图像,基于分块的表示使 Sora 能够训练具有不同分辨率、持续时间和纵横比的视频和图像。在推理时,可以通过在适当大小的网格中随机初始化分块来控制生成视频的大小。 3. 调整图像模型来生成视频:通过插入时间层来“扩增”预训练的文生图扩散模型,然后选择仅在视频上对新的层进行微调或完全避免进行额外的训练。新模型会继承文本 图像对的先验知识,有助于缓解对文本 视频对数据的需求。 4. 扩散视频建模:如 Singer et al. 在 2022 年提出的 MakeAVideo,在一个预训练扩散图像模型的基础上扩展一个时间维度,包含三个关键组件:一个在文本 图像对数据上训练的基础文生图模型;时空卷积和注意力层,使网络覆盖时间维度;一个帧插值网络,用于高帧率生成。
2025-01-10
sora和lora是什么
LoRA(LowRank Adaptation)是一种低阶自适应模型,您可以将其理解为基础模型(Checkpoint)的小插件。在生图时,LoRA可有可无,但它具有明显的价值,常见于对一些精细的控制,如面部、材质、物品等细节的控制。其权重在相关界面会有显示。 Sora 并非常见的 AI 领域特定术语,上述知识库中未提及相关内容。
2025-01-02
openai 发布的sora最新模型中,生成视频的提示词与一般问答提示词有什么区别或者注意事项?
Sora 是 OpenAI 于 2024 年 2 月发布的文本到视频的生成式 AI 模型。 生成视频的提示词与一般问答提示词的区别和注意事项如下: 1. 对于视频生成,神经网络是单射函数,拟合的是文本到视频的映射。由于视频的动态性高,值域大,因此需要丰富且复杂的提示词来扩大定义域,以学好这个函数。 2. 详细的文本提示能迫使神经网络学习文本到视频内容的映射,加强对提示词的理解和服从。 3. 和 DALL·E 3 一样,OpenAI 用内部工具(很可能基于 GPT4v)给视频详尽的描述,提升了模型服从提示词的能力以及视频的质量(包括视频中正确显示文本的能力)。但这会导致在使用时的偏差,即用户的描述相对较短。OpenAI 用 GPT 来扩充用户的描述以改善这个问题,并提高使用体验和视频生成的多样性。 4. 除了文本,Sora 也支持图像或者视频作为提示词,支持 SDEdit,并且可以向前或者向后生成视频,因此可以进行多样的视频编辑和继续创作,比如生成首尾相连重复循环的视频,甚至连接两个截然不同的视频。 以下是一些 Sora 的案例提示词,如:“小土豆国王戴着雄伟的王冠,坐在王座上,监督着他们广阔的土豆王国,里面充满了土豆臣民和土豆城堡。”“咖啡馆的小地图立体模型,装饰着室内植物。木梁在上方纵横交错,冷萃咖啡站里摆满了小瓶子和玻璃杯。”“一张写有‘SORA’的写实云朵图像。”“一群萨摩耶小狗学习成为厨师的电影预告片‘cinematic trailer for a group of samoyed puppies learning to become chefs’”
2024-12-27
ChatGPT与Sora 是不是只有苹果手机或苹果电脑才能注册与登入?
ChatGPT 注册与登录: 苹果系统: 中国区正常无法在 AppleStore 下载 ChatGPT,需切换到美区。美区 AppleID 注册教程可参考知乎链接:https://zhuanlan.zhihu.com/p/696727277 。 最终在 AppleStore 搜到 ChatGPT 下载安装,注意别下错。 打开支付宝,地区切换到美区任意区,购买【App Store&iTunes US】礼品卡,按需要金额购买(建议先买 20 刀),然后在 apple store 中兑换礼品卡,在 chatgpt 中购买订阅 gpt plus,中途不想继续订阅可到订阅列表中取消。 会员不管在苹果还是安卓手机上购买的,电脑上都能登录。 注册美区 ID 详细步骤: 1. 电脑上打开 Apple ID 的注册页面:https://appleid.apple.com/ac 。 2. 填写验证码后点继续。 3. 到谷歌邮箱接收邮箱验证码。 4. 接着验证手机号码。 5. 验证完后会出现页面,此时美区 ID 已注册但未激活,切换到手机操作。 6. 打开 App Store,点击右上角人形头像。 7. 拉到最底下,点击退出登录,先退出国内的 ID。 8. 之后再点击右上角人形头像。 9. 手动输入美区 ID,会收到短信进行双重验证。 10. 之后完成美区的 ID 登录。 11. 随便找个软件下载,会弹出提示,点击“检查”进行激活。 12. 点击同意,进入下一页填写美国地址。 13. 若付款方式中没有“无”或“none”选项,输入街道地址和电话。 14. 至此,通过中国 IP、中国手机号、免信用卡成功注册一个美区 ID,可用于下载例如小火箭、ChatGPT、Discord、X、TikTok 等软件。 关于 Sora 的注册与登录相关信息未提及。
2024-12-16
Sora是什么
Sora 是 OpenAI 发布的一个文本到视频的生成模型。 它具有以下特点和能力: 1. 能够根据描述性的文本提示生成高质量的视频内容。 2. 其生成的视频不仅逼真且充满想象力,能创造出各种场景。 3. 可以生成长达 1 分钟的超长视频,且是一镜到底的,视频中的人物和背景等具有惊人的一致性和稳定性。 4. 虽然在技术界引起广泛关注和讨论,但目前 OpenAI 未公开发布,仅向少数研究人员和创意人士提供有限访问权限以获取使用反馈并评估技术安全性。 在图像生成能力方面,Sora 能生成图像,虽不及 Midjourney,但优于 Dalle 3。此外,Sora 在视频游戏模拟中也具有一定的能力。
2024-12-16
AI教程
以下为为您提供的 AI 教程相关内容: 1. 五步学会用 AI 制作动画视频播客:五个步骤教您从零到一制作动画版视频播客,适合有一定技术基础的朋友,轻松上手创作动画视频!相关链接: 2. Poe AI 平台:这是一个支持与多个智能 AI 机器人(如 GPT4 等)进行实时在线交流的聊天网站。注册账号后可免费使用,部分功能需付费订阅。不同 AI 机器人有不同特点,可按需选择。官网地址是:https://poe.com/ ,可在官网帮助中心找到具体教程。
2025-02-26
有没有coze玩的很好的up主或者教程
以下是一些玩 Coze 很好的 UP 主和相关教程: 大圣:胎教级教程:万字长文带你使用 Coze 打造企业级知识库,链接:https://waytoagi.feishu.cn/wiki/CT3UwDM8OiVmOOkohPbcV3JCndb 大聪明:保姆级教程:Coze 打工你躺平,链接:https://waytoagi.feishu.cn/wiki/PQoUwXwpvi2ex7kJOrIcnQTCnYb 安仔:Coze 全方位入门剖析免费打造自己的 AI Agent,链接:https://waytoagi.feishu.cn/wiki/SaCFwcw9xi2qcrkmSxscxTxLnxb 基础教程:Coze“图像流”抢先体验,链接:https://waytoagi.feishu.cn/wiki/AHs2whOS2izNJakGA1NcD5BEnuf YoYo:Coze 图像流小技巧:探索视觉艺术的隐藏宝藏,链接:https://waytoagi.feishu.cn/wiki/CTajwJnyZizxlJk8a4AcJYywnfe 【智能体】让 Coze 智能体机器人连上微信和微信群详细配置文档,链接:https://waytoagi.feishu.cn/wiki/ExHMwCDZ7i6NA7knCWucFvFvnvJ 此外,梦飞在 6 月底的微信机器人共建中教了大家通过 COW 玩微信机器人,包括直接对接 llm key 的玩法、coze 的玩法、fastgpt 的玩法等,是喂饭甚至喂奶级别的教程。
2025-02-26
coze开发教程
以下是关于 Coze 开发的相关教程: 1. Coze AI 应用开发教学: 背景:智能体开发从最初的 chatbot 只有对话框,到有了更多交互方式,因用户需求扣子推出了 AI 应用,其低代码或零代码的工作流等场景做得较好。 现状:AI CODING 虽强,但目前适用于小场景和产品的第一个版本,复杂应用可能导致需求理解错误从而使产品出错。 案例:以证件照为例,说明以前实现成本高,现在有客户端需求并做了相关智能体和交互。 学习过程:创建 AI 应用,学习操作界面、业务逻辑和用户界面,包括布局、搭建工作流、用户界面及调试发布,重点熟悉桌面网页版的用户界面。 2. Coze 使用教程: 概述:字节的官方解释为 Coze 是新一代一站式 AI Bot 开发平台。无论是否有编程基础,都可以在 Coze 平台上快速搭建基于 AI 模型的各类问答 Bot,从解决简单的问答到处理复杂逻辑的对话。并且,可以将搭建的 Bot 发布到各类社交平台和通讯软件上,与这些平台/软件上的用户互动。个人认为 Coze 是字节针对 AI Agent 这一领域的初代产品,在 Coze 中将 AI Agent 称之为 Bot。字节针对 Coze 这个产品部署了两个站点,分别是国内版和海外版。 国内版: 网址:https://www.coze.cn 官方文档教程:https://www.coze.cn/docs/guides/welcome 大模型:使用的是字节自研的云雀大模型,国内网络即可以正常访问。 海外版: 网址:https://www.coze.com 官方文档教程:https://www.coze.com/docs/guides/welcome 大模型:GPT4、GPT3.5 等大模型(可以在这里白嫖 ChatGPT4,具体参考文档:),访问需要突破网络限制的工具,参考文档:https://www.coze.com/docs/zh_cn/welcome.html AI Agent 的开发流程:Bot 的开发和调试页面布局主要分为如下几个区块,包括提示词和人设的区块、Bot 的技能组件、插件、工作流、Bot 的记忆组件、知识库、变量、数据库、长记忆、文件盒子、一些先进的配置、触发器(例如定时发送早报)、开场白(用户和 Bot 初次对话时,Bot 的招呼话语)、自动建议(每当和 Bot 一轮对话完成后,Bot 给出的问题建议)、声音(和 Bot 对话时,Bot 读对话内容的音色)。 3. Coze 应用技巧: 操作步骤: 创建一个 Coze。 在“用户界面”拖入一个 markdown 组件。 在 markdown 中写入 html(对于了解前端页面的同学来说可能不难理解,用 html 写一个音乐播放器。不懂前端、不会写前端代码可问 AI,习惯使用智谱清言,大家可以选择自己习惯的 AI 工具)。 调整代码获取在线音乐:将 markdown 自带的内容全部删除,将生成的代码写入进 markdown 组件的内容中。此时的播放器还无法正常播放音乐,需要找一个在线音乐播放平台,获取到歌曲的 url,再将 url 复制进上面的代码。网上很多在线音乐的网站,随便找一个,打开浏览器的控制台(按 F12)找到 network(网络),选择播放的请求,将带有.mp3 格式的 url 复制出来。找到上面代码中的<source src=\"song.mp3\"type=\"audio/mpeg\">部分,将 song.mp3 换成复制的音乐地址。刷新开发页面,播放器即可使用。
2025-02-25
coze教程
以下是关于 Coze 教程的相关内容: 可能是全网最好的 Coze 教程(之一),带你一次性入门 Coze 工作流。即使是非技术出身的爱好者,也能上手跟学,一站式学会 AI Agent 从设计到落地的全流程方法论。 阅读指南: 长文预警,请视情况收藏保存。 核心看点: 通过实际案例逐步演示,用 Coze 工作流构建一个能够稳定按照模板要求,生成结构化内容的 AI Agent。 开源 AI Agent 的设计到落地的全过程思路。 10+项常用的 Coze 工作流的配置细节、常见问题与解决方法。 适合人群: 任何玩过 AI 对话产品的一般用户(如果没用过,可以先找个国内大模型耍耍)。 希望深入学习 AI 应用开发平台(如 Coze、Dify),对 AI Agent 工作流配置感兴趣的爱好者。 注:本文不单独讲解案例所涉及 Prompt 的撰写方法。文末「拓展阅读」中,附有相关 Prompt 通用入门教程、Coze 其他使用技巧等内容,以供前置或拓展学习。 Coze 概述: 字节的官方解释如下:Coze 是新一代一站式 AI Bot 开发平台。无论你是否有编程基础,都可以在 Coze 平台上快速搭建基于 AI 模型的各类问答 Bot,从解决简单的问答到处理复杂逻辑的对话。并且,你可以将搭建的 Bot 发布到各类社交平台和通讯软件上,与这些平台/软件上的用户互动。 个人认为:Coze 是字节针对 AI Agent 这一领域的初代产品,在 Coze 中将 AI Agent 称之为 Bot。字节针对 Coze 这个产品部署了两个站点,分别是国内版和海外版。 国内版: 网址:https://www.coze.cn 官方文档教程:https://www.coze.cn/docs/guides/welcome 大模型:使用的是字节自研的云雀大模型,国内网络即可以正常访问。 海外版: 网址:https://www.coze.com 官方文档教程:https://www.coze.com/docs/guides/welcome 大模型:GPT4、GPT3.5 等大模型(你可以在这里白嫖 ChatGPT4,具体参考文档:),访问需要突破网络限制的工具。 参考文档:https://www.coze.com/docs/zh_cn/welcome.html AI Agent 的开发流程: Bot 的开发和调试页面布局如下,主要分为如下几个区块: 提示词和人设的区块。 Bot 的技能组件。 插件。 工作流。 Bot 的记忆组件。 知识库。 变量。 数据库。 长记忆。 文件盒子。 一些先进的配置。 触发器:例如定时发送早报。 开场白:用户和 Bot 初次对话时,Bot 的招呼话语。 自动建议:每当和 Bot 一轮对话完成后,Bot 给出的问题建议。 声音:和 Bot 对话时,Bot 读对话内容的音色。 下面会逐一讲解每个组件的能力以及使用方式。
2025-02-25
即梦ai的详细教程
以下是即梦 AI 的详细教程: 1. 图片生成: 打开即梦 AI 官网:https://jimeng.jianying.com/aitool/home 。 点击 AI 作图中的图片生成。 填写绘图提示词,选择生图模型 2.1,点击立刻生成。 2. 视频生成 V1.2 教程: 新版本可控性增强不少。 时长:增加了时长,最长可达 12s 。 首尾帧:首尾帧权重超强优化,输入 prompt 可精准控制过渡效果。 运镜控制:新增移镜、摇镜,并支持三档运镜幅度设定。 模式:标准模式,流畅模式。 即梦 AI 是剪映旗下类 Sora 的工具,原名 Dreamina,已于 2024 年 5 月正式改名为“即梦”。其优点包括在动效方面采取激进策略,对画面识别准确,人物微表情、汽车行驶等画面表现出色,首尾帧相连功能优秀,对简单画面有不错的表现力,人物面部特写惊艳等。缺点有精度不够,后期需用超分工具放大,画面稳定性不足,动效丰富导致画面易“出轨”,输出视频存在掉帧问题,运动幅度不能过大等。总体 3 6s 的生成长度一般。 相关文章报道: AI 产品评测|字节剪映 Dreamina 一手测评 https://mp.weixin.qq.com/s/2fSEEZtS5DGnZ7RmW4hiA Dreamina,字节的 Sora 时刻要来了! https://mp.weixin.qq.com/s/E1D0uG_Bk0fNkCK70ANzg 关注「烧拍 AI」可了解更多 AI 资讯。
2025-02-25
AI产品经理教程
以下是为您提供的 AI 产品经理教程: 一、AI 市场与 AI 产品经理分析 个人对 AI 产品经理做了以下划分,仅供娱乐和参考: 1. 入门级 能通过 WaytoAGI 等开源网站或一些课程了解 AI 的概念,使用 AI 产品并尝试动手实践应用搭建。对应的画像可能是喜欢听小宇宙 APP 的播客或浏览 AI 相关的文章。 以前互联网刚兴起的时候,部分用谷歌的人会比用百度的有优越感,现在可能用 AI 搜索的更有优越感。 2. 研究级 有两个路径,一个是技术研究路径,一个是商业化研究路径;对应传统互联网偏功能实现的产品经理和偏商业运营的产品经理,当然最好是同一个人,产品运营不分家。 这个阶段对应的画像可能是对某一领域有认知,可以根据需求场景选择解决方案,或利用 Hugging face 等工具手搓出一些 AI 应用来验证想法。 3. 落地应用 这一阶段的画像就是有一些成功落地应用的案例,如产生商业化价值。 对应传统互联网 PM 也有三个层级: 负责功能模块与执行细节。 负责整体系统与产品架构。 熟悉行业竞争格局与商业运营策略。 总结来说,对 AI 产品经理要求懂得技术框架,不一定要了解技术细节,而是对技术边界有认知,最好能知道一些优化手段和新技术的发展。AI 是工具和手段,产品经理要关注的还是场景、痛点、价值。 二、超越贪吃蛇——技术纯小白如何用 AI 开发真正的应用 1. 基础小任务 推荐从一个最最基础的小任务开始,让 AI 先帮您按照 best practice 写一个 say hello 的示例程序,并解释每个文件的作用及程序运行的逻辑。这样,您可以通过最基础的绝对不会出错的小任务,来学会必备的调试技能。 您可以这样要求 AI:“我在学习写 chrome 插件。请选择最适合小白上手的技术栈,按照 best practice 为我生成一个简单的示范项目,但要包含尽可能全面的典型文件和功能。请为我讲解每个文件的作用和程序运行的逻辑。” 此处要求 AI 按照 best practice 来写非常重要:文件一开始就有良好的组织,后续功能复杂了才不会乱套。 还有一个偷懒小妙招:如果您用的是 o1mini,您可以在 prompt 最后添加这句:“请生成 create.sh 脚本,运行脚本就能直接创建插件所需要的所有文件。请教我如何运行脚本。”(如果 windows 机器则是 create.cmd)足够勤勉的 o1mini 会为您生成一段超级长的代码,并给出提示,您只需要复制粘贴并执行,一次性生成十多个目录和文件,超方便。 2. 明确项目需求 您可以通过和 AI 的对话,来逐步明确项目需求。(如果您是训练有素的产品经理,可以忽略这一步) 您可以这样要求 AI:“我想要开发一个 XXX。你能否像一个高级别的还懂技术的产品经理指导初级产品经理那样,向我提问,帮我梳理清产品功能,尤其要注意可能会涉及到技术方案选择的关键点。请一问一答,帮我由全局到细节逐步梳理。不要一口气问我太多问题。” 来来回回的对话后,您可以让 AI 帮助您梳理出产品需求文档。这样的文档会包含影响技术方案选择的细节,比直接给 AI 一段口头的需求描述要准确得多。在后续开发的时候每次新起一个聊天就把文档发给 AI 并告知您现在在做第几点功能,会非常方便。 三、2024 年历史更新(归档) 1. 2024 年 7 月 22 日 《》今日是二十四节气的大暑,SD 的教程奉上。 《》Agent 共学活动新一期“谁是人类”全新开启!本次活动获得了阿里云☁️百炼和通义千问大模型的大力支持,为大家准备了丰厚的比赛奖品,不过切记:“奖品不是目的,目的是共同学习,享受学习过程带来的成长。”本次活动是一个基于通义千问模型的 Bot 拟人化竞赛,通过多轮问答和投票,旨在识别最模仿人类交流最像人类的 Bot。 《》,作者 ElliotBai,本文探讨了 AI Agent 产品经理在工具(Tools)方面的经验。尽管大模型不断进化,接口依然是基础。通过 AI 模型,可以将非结构化数据转化为结构化信息,实现自动化。引入 Function Calling 和 Tools 后,开发流程变得更高效、维护成本降低。推荐放弃不稳定的 JSON 模式,减少系统提示依赖,增强 API 响应提示,以及提供选项而非填空,以提升 Agent 的可控性和准确性。
2025-02-24