Navigate to WaytoAGI Wiki →
Home/question.detail.breadcrumb.questionList/question.detail.breadcrumb.questionDetail

openai 发布的sora最新模型中,生成视频的提示词与一般问答提示词有什么区别或者注意事项?

Answer

Sora 是 OpenAI 于 2024 年 2 月发布的文本到视频的生成式 AI 模型。

生成视频的提示词与一般问答提示词的区别和注意事项如下:

  1. 对于视频生成,神经网络是单射函数,拟合的是文本到视频的映射。由于视频的动态性高,值域大,因此需要丰富且复杂的提示词来扩大定义域,以学好这个函数。
  2. 详细的文本提示能迫使神经网络学习文本到视频内容的映射,加强对提示词的理解和服从。
  3. 和 DALL·E 3 一样,OpenAI 用内部工具(很可能基于 GPT4-v)给视频详尽的描述,提升了模型服从提示词的能力以及视频的质量(包括视频中正确显示文本的能力)。但这会导致在使用时的偏差,即用户的描述相对较短。OpenAI 用 GPT 来扩充用户的描述以改善这个问题,并提高使用体验和视频生成的多样性。
  4. 除了文本,Sora 也支持图像或者视频作为提示词,支持 SDEdit,并且可以向前或者向后生成视频,因此可以进行多样的视频编辑和继续创作,比如生成首尾相连重复循环的视频,甚至连接两个截然不同的视频。

以下是一些 Sora 的案例提示词,如:“小土豆国王戴着雄伟的王冠,坐在王座上,监督着他们广阔的土豆王国,里面充满了土豆臣民和土豆城堡。”“咖啡馆的小地图立体模型,装饰着室内植物。木梁在上方纵横交错,冷萃咖啡站里摆满了小瓶子和玻璃杯。”“一张写有‘SORA’的写实云朵图像。”“一群萨摩耶小狗学习成为厨师的电影预告片‘cinematic trailer for a group of samoyed puppies learning to become chefs’”

Content generated by AI large model, please carefully verify (powered by aily)

References

Sora:大型视觉模型的背景、技术、局限性和机遇综述 【官方论文】

自从2022年11月ChatGPT发布以来,人工智能技术的出现标志着一个重大的转变,重塑了交互方式,并深入融入日常生活和行业的各个方面[1,2]。基于这一势头,OpenAI在2024年2月发布了Sora,一个文本到视频的生成式AI模型,能够根据文本提示生成现实或想象场景的视频。与之前的视频生成模型相比,Sora的特点是能够在遵循用户文本指令的同时,生成长达1分钟的高质量视频[3]。Sora的进步体现了长期以来人工智能研究任务的实质,即赋予AI系统(或AI代理)理解和与运动中的物理世界互动的能力。这涉及到开发不仅能解释复杂用户指令,而且能将这种理解应用于通过动态和富有上下文的模拟解决现实世界问题的AI模型。图2:Sora在文本到视频生成中的示例。文本指令被给予OpenAI Sora模型,它根据指令生成三个视频。Sora展示了准确解释和执行复杂人类指令的显著能力,如图2所示。该模型能生成包含多个执行特定动作的角色以及复杂背景的详细场景。研究人员将Sora的熟练程度归因于不仅处理用户生成的文本提示,而且还能辨别场景内元素之间复杂的相互作用。Sora最引人注目的方面之一是其生成长达一分钟的视频的能力,同时保持高视觉质量和引人入胜的视觉连贯性。与只能生成短视频片段的早期模型不同,Sora的一分钟长视频创作具有进展感和从第一帧到最后一帧的视觉一致性之旅。此外,Sora的进步在于其生成具有细腻运动和互动描绘的扩展视频序列的能力,克服了早期视频生成模型所特有的短片段和简单视觉呈现的限制。这一能力代表了AI驱动创意工具向前的一大步,允许用户将文本叙述转换为丰富的视觉故事。总的来说,这些进步展示了Sora作为世界模拟器的潜力,为描绘场景的物理和上下文动态提供了细腻的见解。[3]。

Sora 案例大全

|名称|prompt|作者|日期|附件||-|-|-|-|-||Sora可以根据文本创建逼真且富有想象力的视频,但Sora也可以带来静态图像,例如这些创作,走向生活。提示:“小土豆国王戴着雄伟的王冠,坐在王座上,监督着他们广阔的土豆王国,里面充满了土豆臣民和土豆城堡。”提示2:“咖啡馆的小地图立体模型,装饰着室内植物。木梁在上方纵横交错,冷萃咖啡站里摆满了小瓶子和玻璃杯。”提示3:“一张写有“SORA”的写实云朵图像。”|提示:“小土豆国王戴着雄伟的王冠,坐在王座上,监督着他们广阔的土豆王国,里面充满了土豆臣民和土豆城堡。”提示2:“咖啡馆的小地图立体模型,装饰着室内植物。木梁在上方纵横交错,冷萃咖啡站里摆满了小瓶子和玻璃杯。”提示3:“一张写有“SORA”的写实云朵图像。”|openAI工作人员|2024/02/21|||可以根据提示词改编场景||openAI工作人员|2024/02/21|||2月21日下午最新sora狗片,由OpenAI Sora工作人员发布|一群萨摩耶小狗学习成为厨师的电影预告片"cinematic trailer for a group of samoyed puppies learning to become chefs"|openAI工作人员|2024/02/21||"a giant cathedral i

GPT、DALL·E、Sora,为什么 OpenAI 可以跑通所有 AGI 技术栈?

和DALL·E 3一样,OpenAI用内部工具(很可能基于GPT4-v)给视频详尽的描述,提升了模型服从prompt的能力,以及视频的质量(还有视频中正确显示文本的能力)。我认为这是非常关键的一点,是OpenAI的杀手锏,对于视频尤其重要。原因很简单,可以从两个角度解释:(1)神经网络是个单射函数,拟合的是文本到视频的映射。视频的动态性非常高,也就是有很大的值域,为了把这个函数学好,需要定义域也很大很丰富,这就需要复杂的prompt了。(2)详细的文本也迫使神经网络学习文本到视频内容的映射,加强对于prompt的理解和服从。另外一个细节:这种详尽的描述会导致在使用时的bias——用户的描述都相对较短。和DALL·E 3一样,OpenAI用GPT来扩充用户的描述来改善这个问题,并提高使用体验和视频生成的多样性。除了文本以外,Sora也支持图像或者视频作为prompt,支持SDEdit,并且可以向前或者向后生成视频,因此可以进行多样的视频的编辑和继续创作,比如生成一个首尾相连重复循环的视频:[0bc3eeacsaaa2qaajcothbsvaiodfeqqakia.f10002.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/Hi3qbRbHBoC4s6x0YshcE4iNnNd?allow_redirect=1)甚至可以连接两个截然不同的视频:

Others are asking
提示词
以下是关于提示词的相关知识: 艺术字生成: 模型选择图片 2.1,输入提示词(可参考案例提示词)。 案例参考: 金色立体书法,“立冬”,字体上覆盖着积雪,雪山背景,冬季场景,冰雪覆盖,枯树点缀,柔和光影,梦幻意境,温暖与寒冷对比,静谧氛围,传统文化,唯美中国风。 巨大的春联,金色的书法字体,线条流畅,艺术美感,“万事如意”。 巨大的字体,书法字体,线条流畅,艺术美感,“书法”二字突出,沉稳,大气,背景是水墨画。 巨大的奶白色字体“柔软”,字体使用毛绒材质,立在厚厚的毛绒面料上,背景是蓝天。 星流一站式 AI 设计工具: 在 prompt 输入框中可输入提示词,使用图生图功能辅助创作。 提示词相关: 什么是提示词:用于描绘画面,支持中英文输入,星流通用大模型与基础模型 F.1、基础模型 XL 使用自然语言(如一个长头发的金发女孩),基础模型 1.5 使用单个词组(如女孩、金发、长头发)。 如何写好提示词: 预设词组:小白用户可点击提示词上方官方预设词组进行生图。 提示词内容准确:包含人物主体、风格、场景特点、环境光照、画面构图、画质,如一个女孩抱着小猫,背景是一面红墙,插画风格、孤独感,高质量。 调整负面提示词:点击提示框下方的齿轮按钮,弹出负面提示词框,负面提示词可帮助 AI 理解不想生成的内容,如不好的质量、低像素、模糊、水印。 利用“加权重”功能:可在功能框增加提示词,并进行加权重调节,权重数值越大,更优先,也可对已有的提示词权重进行编辑。 辅助功能:翻译功能可一键将提示词翻译成英文;删除所有提示词可清空提示词框;会员加速可加速图像生图速度,提升效率。 提示词要素: 提示词由一些要素组成,包括指令(想要模型执行的特定任务或指令)、上下文(包含外部信息或额外的上下文信息,引导语言模型更好地响应)、输入数据(用户输入的内容或问题)、输出指示(指定输出的类型或格式)。 示例:在文本分类任务的提示示例中,指令是“将文本分类为中性、否定或肯定”,输入数据是“我认为食物还可以”部分,使用的输出指示是“情绪:”。提示词所需的格式取决于想要语言模型完成的任务类型,并非所有要素都是必须的。
2024-12-27
专业英文文章润色提示词
以下是关于专业英文文章润色提示词的相关内容: 在学术场景数据处理方面: 论文总结:大模型结合良好的提示词,如 GLM4Plus ,能够帮助学生快速总结论文内容,提高梳理效率。 论文翻译:市面上的翻译软件存在字数限制,大模型可弥补不足,如 GLM 结合良好提示词能快速翻译论文内容,提高阅读效率。 论文内容扩写润色:将论文内容转化为社交媒体的科普内容,如针对小红书使用场景,调整提示词以匹配其口语化、轻松愉快的氛围。 优化和润色提示词(Prompt)的方法: 明确具体的描述,使用更具体、细节的词语和短语。 添加视觉参考,插入相关图片。 注意语气和情感,用合适的形容词、语气词等调整。 优化关键词组合,尝试不同搭配和语序。 增加约束条件,如分辨率、比例等。 分步骤构建 Prompt ,将复杂需求拆解为子 Prompt 。 参考优秀案例,借鉴写作技巧和模式。 反复试验、迭代优化,根据输出效果反馈完善。 在蓝衣剑客的四万字长文中: 文章润色任务首先要构建包含数据结构的数据库,设计包含润色风格名称、风格描述、适用文章类型和风格示例四个关键字段。 文章风格提取部分,存库的 SQL 需搭配数据库插件使用。 文章润色部分可做成 Bot 形式,若如此,风格抽取的 SQL 将被替代成自然语言。
2024-12-27
chatgpt提示词结构
ChatGPT 提示词结构主要包括以下方面: 1. DALL·E 自动优化提示词结构: 结构为“一个”。 其中,媒介需考虑图像应模仿的艺术形式;主题包括颜色、姿势、视角等;背景要考虑环境如何补充主题,以及环境的类型、颜色、光线等;风格特点涵盖独特的艺术特点、影响、技术等,还包括照片、绘画、数字等方面的具体描述。 生成提示词时要遵循指南,保持简短、精确且令人惊叹,使用精确、视觉化的描述。 2. 写好 ChatGPT 提示词的技巧: 提问的几要素:包含思考问题需要的前置信息、主要解决的主客体和关系、回答的要求、类似问题的参考样例,并编辑问题模板,如相似问题的问题与答案(不一定需要)+问题主体+前置条件+回答要求。 举例法:通过举例让其模仿写,并变更主题。 3. 12 种 Prompt 框架: Instruction:指令,即希望 AI 执行的具体任务。 Context:背景信息,提供更多背景引导回复。 Input Data:输入数据,告知处理的数据。 Output Indicator:输出引导,说明输出的类型或风格。 Capacity and Role:能力和角色,确定应扮演的角色。 Insight:见解,提供请求背后的见解、背景和上下文。 Statement:声明,明确要求做什么。 Personality:个性,设定回应的风格、个性或方式。 Experiment:实验,请求回复多个示例。 Background:背景,说明背景提供充足信息。 Role:角色,指定扮演的角色。 Objectives:目标,明确希望实现的目标。
2024-12-27
请问如何学习AI提示词
以下是关于如何学习 AI 提示词的建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,可根据自己的兴趣选择特定的模块进行深入学习,建议掌握提示词的技巧,因其上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品(如 ChatGPT、Kimi Chat、智谱、文心一言等)进行互动,了解它们的工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 6. 关于提示词运用的具体建议: 理解提示词的作用:提示词向模型提供上下文和指示,其质量直接影响模型输出的质量。 学习提示词的构建技巧:明确任务目标,用简洁准确的语言描述;给予足够的背景信息和示例,帮助模型理解语境;使用清晰的指令,如“解释”“总结”“创作”等;对特殊要求应给予明确指示,如输出格式、字数限制等。 参考优秀案例:研究和学习已有的优秀提示词案例,了解行之有效的模式和技巧,可在领域社区、Github 等资源中找到大量案例。 实践、迭代、优化:多与语言模型互动,根据输出提高提示词质量。尝试各种变体,比较分析输出差异,持续优化提示词构建。 活用提示工程工具:目前已有一些提示工程工具可供使用,如 Anthropic 的 Constitutional AI。 跟上前沿研究:提示工程是当前最前沿的研究领域之一,持续关注最新的研究成果和方法论。 精心设计的提示词能最大限度发挥语言模型的潜力,是高效使用大模型的关键技能。多实践、多学习、多总结,终可掌握窍门。需要注意的是,内容由 AI 大模型生成,请仔细甄别。
2024-12-27
ai提示词
以下是关于 AI 提示词的相关内容: 在舞蹈音乐方面,有 108 个用于生成 AI 舞曲的提示词,例如“Punchy 4/4 beats,electro bass,catchy synths,pop vocals,bright pads,clubready mixes,energetic drops”,每个提示词都精心制作,以有效地封装各种舞蹈音乐流派的具体特点和大气质量,同时确保适应不同的聆听环境。这些提示词涵盖了各种舞曲子流派,如节奏感强的四四拍鼓点、电子低音、易于记住的合成器旋律、流行音乐风格的主唱、明亮的和弦音效、适合在夜店播放的混音以及高潮部分等。 对于 SD 新手入门的提示词,有以下相关资源: Majinai: 词图: Black Lily: Danbooru 标签超市: 魔咒百科词典: AI 词汇加速器: NovelAI 魔导书: 鳖哲法典: Danbooru tag: AIBooru:
2024-12-26
有哪些提示词汇集网站
以下是一些提示词汇集网站: 文本类 Prompt 网站: Learning Prompt:授人以渔,非常详尽的 Prompt 学习资源,包括 ChatGPT 和 MidJourney,网址: FlowGPT:国外做的最大的 prompt 站,内容超全面,更新快,网址: LangChain Hub:提示词管理工具,LangChain 推出了 LangChain Hub,一个提示词上传、浏览、拉取和管理的工具,网址: 微软 Prompt Flow:微软发布开源的 LLM 开发工具集 Prompt flow,它简化了基于 LLM 的人工智能应用程序的端到端开发周期,从构思、原型设计、测试、评估到生产部署和监控,对于简单工作流非常实用,网址: PromptPort(支持中文):AI Prompt 百科辞典,其中 prompts 是聚合了市场上大部分优质的 prompt 的词库,快速的寻找到用户需求 prompt,网址: PromptKnit:The best playground for prompt designers,网址: ChatGPT Shortcut:ChatGPT 提示词网站,提供了非常多使用模板,简单修改即可指定输出,网址: ClickPrompt:轻松查看、分享和一键运行模型,创建 Prompt 并与其他人分享,网址: Prompt Extend:让 AI 帮你自动拓展 Prompt,网址: 图像类 Prompt 网站: MidLibrary:Midjourney 最全面的流派、艺术技巧和艺术家风格库,网址: MidJourney Prompt Tool:类型多样的 promot 书写工具,点击按钮就能生成提示词修饰部分,网址: OPS 可视化提示词:这个网站有 Mid Journey 的图片风格、镜头等写好的词典库,方便你快速可视化生成自己的绘画提示词,网址: AIart 魔法生成器:中文版的艺术作品 Prompt 生成器,网址: IMI Prompt:支持多种风格和形式的详细的 MJ 关键词生成器,网址: Prompt Hero:好用的 Prompt 搜索,Search prompts for Stable Diffusion,ChatGPT&Midjourney,网址: OpenArt:AI 人工智能图像生成器,网址: img2prompt:根据图片提取 Prompt,网址: MidJourney 提示词工具:专门为 MidJourney 做的提示词工具,界面直观易用,网址: PromptBase:Prompt 交易市场,可以购买、使用、销售各种对话、设计 Prompt 模板,网址: AiTuts Prompt:AiTuts Prompt 是一个精心策划的高质量 Midjourney 提示数据库,提供了广泛的不同风格供你选择,网址: 其他图像类 Prompt 网站: NovelAI tag 生成器:设计类 Prompt 提词生成器,网址: 魔咒百科词典:魔法导论必备工具,简单易用的 AI 绘画 tag 生成器,网址: KREA:设计 AI 的 Prompt 集合站,create better prompts,网址: Public Prompts:免费的 prompt 合集,收集高质量的提示词,网址: AcceleratorI Prompt:AI 词汇加速器,加速 Prompt 书写,通过按钮帮助优化和填充提示词,网址:
2024-12-26
写施工方案的提示词有没有
以下是一些常见的提示词技巧,可用于写施工方案: 类比:要求 AI 用类比或示例阐明概念,例如“请用一个类比解释施工中的关键技术”。 引述:要求包含专家的相关引言或陈述,比如“在施工方案中引用著名建筑专家的观点来支持关键施工步骤”。 幽默:表明是否应融入幽默,例如“在施工方案的安全注意事项部分加入一些幽默元素,以增强记忆”。 轶事:要求包含相关轶事,比如“在关于大型建筑施工的方案中,分享一则有趣的施工过程中的轶事”。 隐喻:鼓励使用隐喻使复杂观点更具亲和力,例如“在描述施工流程的复杂性时,用‘施工像搭积木一样需要有序进行’这样的隐喻”。 趣闻:鼓励包含有趣或令人惊讶的事实,比如“在谈论新型建筑材料时,分享一些有趣的材料特性的事实”。 关键词:列出需要包含的重要关键词或短语,例如“请在施工方案中包含‘施工进度’‘质量控制’和‘安全保障’”。 小贴士:鼓励 AI 分享与主题相关的小窍门和技巧,比如“分享几个关于提高施工效率的小贴士”。 保密性:说明保密要求或限制,比如“在施工方案涉及商业机密的部分,不要泄露相关信息”。 格式化:指定所需的格式元素(如标题、副标题、列表),例如“在写施工方案时,使用列表来呈现施工步骤”。 概括:要求对较长内容进行简要概括,比如“请为这个复杂的施工方案提供一个简短的概要”。 讲故事:要求使用讲故事或叙事技巧,例如“请用一个成功的施工案例故事来展示优秀的施工管理”。 优缺点:要求 AI 评估主题的优缺点,比如“分析这种新型施工方法的优缺点”。 利弊分析:要求对主题的利弊进行分析,例如“分析使用预制构件施工的利与弊”。 问题解决:要求针对特定问题提供解决方案或建议,比如“请提供几个有效的解决施工中遇到的技术难题的方法”。 最佳实践:要求 AI 提供关于某主题的最佳实践或指南,比如“请提供一份关于如何确保施工质量的最佳实践指南”。 时间线:要求 AI 提供事件或发展的时间线,比如“请为这个建筑项目的施工进程提供一个简要的时间线”。 行动呼吁:要求明确的行动呼吁或后续步骤,比如“在施工方案结尾提出具体的施工推进行动建议”。 分步指南:要求提供过程的分步指南或说明,比如“提供一个关于如何进行基础施工的分步指南”。 历史背景:要求考虑历史背景或背景,比如“在写关于高层建筑施工的方案时,谈论高层建筑施工的历史发展”。 对比:要求 AI 比较和对照不同的观点或概念,比如“请比较传统施工方法和现代施工方法的优缺点”。 敏感性:提及需要谨慎处理或避免的敏感主题或问题,比如“请谨慎讨论施工中的环保敏感问题”。 伦理考虑:提及要遵循的道德准则,比如“在施工方案中探讨施工过程中的伦理和道德问题”。 修订要求:提及修订或编辑指南,比如“请根据行业标准对施工方案进行编辑和修订”。 未来影响:鼓励讨论潜在的未来影响或趋势,比如“在谈论建筑施工技术的发展时,探讨其未来在城市建设中的应用前景”。 视觉元素:询问是否包括图表、图形或图像,比如“请在施工方案中包含相关的施工图纸和进度图表”。 截止日期:提及时间敏感回应的截止日期或时间范围,比如“请在一周内给我一份完整的施工方案”。 文化参考:鼓励包含相关的文化参考,比如“在关于古建筑修复的施工方案中谈论当地的建筑文化特色”。
2024-12-22
sd的提示词有哪些语法
以下是关于 SD 提示词的语法: 1. 多个提示词之间使用英文半角符号“,”分隔,例如:masterpiece,best quality,ultradetailed,illustration,closeup,straight on,face focus,1girl,white hair,golden eyes,long hair,halo,angel wings,serene expression,looking at viewer。 2. 一般而言,概念性、大范围、风格化的关键词写在前面,叙述画面内容的关键词其次,最后是描述细节的关键词。大致顺序为:。 3. 每个词语本身自带的权重可能不同,模型训练集中较多出现的关键词,输入一个词就能极大影响画面;较少出现的关键词,输入多个相关词汇对画面影响效果可能有限。提示词的顺序很重要,越靠后的权重越低。关键词最好具有特异性,措辞越具体越好,避免抽象和有解释空间的措辞。 4. 可以使用括号人工修改提示词的权重,例如: 将权重减少为原先的 25%。 5. 可以通过 Prompt Editing 使得 AI 在不同的步数生成不一样的内容,语法为:例如:a,100 步采样,一开始。提示词为:fantasy landscape with a mountain and an oak in foreground shoddy 在第 25 步后,提示词为:fantasy landscape with a lake and an oak in foreground in background shoddy 在第 50 步后,提示词为:fantasy landscape with a lake and an oak in foreground in background masterful 在第 60 步后,提示词为:fantasy landscape with a lake and an oak in background masterful 在第 75 步后,提示词为:fantasy landscape with a lake and a christmas tree in background masterful。 6. 提示词还可以轮转,比如:在第一步时,提示词为“cow in a field”;在第二步时,提示词为"horse in a field.";在第三步时,提示词为"cow in a field",以此类推。 7. 交替词:in a field 可以支持多个词交替。 8. 可组合扩散(AND 语法):a cat AND a dog 比如想画一个猫和狗的混合物种,每一个要混合的东西支持加权重,比如 a cat:1.2 AND dog AND a benguin:2.2。通过继续向总数添加更多提示,这可以方便地生成微调的递归变化,比如 log AND frog:0.13 AND yellow eyes:0.08 。 请注意,权重值最好不要超过 1.5。
2024-12-19
Prompts提示词有哪些写作框架?
以下是一些常见的 Prompts 提示词写作框架: 1. 情境:先描述所处的情境,明确要完成的任务,阐述采取的行动,最后说明期望得到的结果。 2. 假设情景:鼓励探讨假设性场景,例如“假设全球变暖持续恶化,我们需要采取哪些措施应对?” 3. 数据:鼓励使用统计数据或数据支持主张,比如“在关于电动汽车的文章中提供销售数据和环境影响数据。” 4. 个性化:根据用户偏好或特点要求个性化,像“请根据用户对喜剧电影的喜好推荐几部好看的电影。” 5. 语气:指定所需语气,如正式、随意、信息性、说服性,例如“请用正式语气编写一篇关于气候变化的文章。” 6. 格式:定义格式或结构,如论文、要点、大纲、对话,比如“请为我提供一个关于健康饮食的要点清单。” 7. 限制:指定约束条件,如字数或字符数限制,例如“请提供一个关于太阳能的 100 字简介。” 8. 引用:要求包含引用或来源以支持信息,比如“请在关于全球变暖的文章中引用权威研究。” 9. 语言:如果与提示不同,请指明回应的语言,例如“请用法语回答关于巴黎旅游景点的问题。” 10. 反驳:要求解决潜在的反驳论点,比如“针对抵制疫苗接种的观点提出反驳。” 11. 术语:指定要使用或避免的行业特定或技术术语,例如“请用通俗易懂的语言解释区块链技术。” 您可以根据具体需求选择适合的框架来编写提示词。如果您觉得这些框架过于复杂,还可以结合自己的生活或工作场景,想一个能帮助简单自动化的场景,比如自动给班级里的每个孩子起个昵称、自动排版微信群经常发的运营小文案、自动帮您安排周一到周日的减脂餐、帮您列一个清晰的学习计划等。
2024-12-09
AI提示词有什么免费的学习课程
以下是一些关于 AI 提示词的免费学习课程: 1. 吴恩达和 OpenAI 合作推出的 Prompt Engineering(提示工程师)课程: 原版网址:https://www.deeplearning.ai/shortcourses/chatgptpromptengineeringfordevelopers/ B 站版本:【合集·AI Course哔哩哔哩】https://b23.tv/ATc4lX0 、https://b23.tv/lKSnMbB 翻译版本: 推荐直接使用 Jupyter 版本学习,效率更高:https://github.com/datawhalechina/promptengineeringfordevelopers/ 视频下载地址:https://pan.quark.cn/s/77669b9a89d7 OpenAI 开源了教程:https://islinxu.github.io/promptengineeringnote/Introduction/index.html 纯文字版本 2. 小七姐的 Prompt 喂饭级系列教程小白学习指南(五): 如果学习提示词有具体小目标,如 AI 写作优化、职场提升效率等,需求不高,可不买贵的课程,考虑相关 AI 课,提示词作为工具掌握。 若为变现,先思考能力和资源优势,有清晰方案可深度学习,还能结识同行。 自学能力强,可不付费,多交流;自学能力不足且有清晰目的,建议选择靠谱课程系统化学习。 3. 藏经阁的个人专栏:
2024-12-05
提示词有没有规律可循
提示词是有规律可循的。 提示工程是人工智能领域中,特别是在自然语言处理和大型语言模型的上下文中一个相对较新的概念,它涉及设计和优化输入提示以引导 AI 模型生成特定类型的输出或执行特定的任务。提示工程的关键点包括精确性、创造性、迭代和上下文理解。提示词通常指直接输入到 AI 模型中的问题、请求或指示,是提示工程的一部分。 在 Stable Diffusion 中,Embedding 相当于提示词打包的功能,能把很多提示词汇总到一个文件里,负向提示词在某些情况下会有大量且固定不变的文本量,此时可使用打包好的负向提示词 Embedding,达到一词顶一百词的效果。 从应用者角度看,提示词应客观对待,它可能只是一个中间阶段。对于企业,追求稳定性和确定性,提示词可能并非可靠工具。提示词技巧具有阶段性和时效性,普通人不必花费过多时间,因为其变化很快。对于大部分人,追求所谓技巧可能意义不大。是否使用提示词框架,应视具体情况而定。
2024-10-01
知识相关的提示词有哪些?
以下是一些与知识相关的提示词示例: 知识图谱自动生成:能够帮助使用者快速提升认知并帮助建立知识图谱,用户提供问题或指定领域,引导并带领用户进行深度分析。 知识探索专家(李继刚):专门用于提问并解答有关特定知识点的 AI 角色,提出并尝试解答有关用户指定知识点的三个关键问题:其来源、其本质、其发展。
2024-09-22
openai
以下是关于 OpenAI 的相关信息: AGI 的 5 个等级: 聊天机器人(Chatbots):具备基本对话能力,主要依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。 推理者(Reasoners):具备人类推理水平,能解决复杂问题,如 ChatGPT,可根据上下文和文件提供详细分析和意见。 智能体(Agents):不仅具备推理能力,还能执行全自动化业务,但目前许多 AI Agent 产品执行任务后仍需人类参与,尚未达到完全智能体水平。 创新者(Innovators):能够协助人类完成新发明,如谷歌 DeepMind 的 AlphaFold 模型,可预测蛋白质结构,加速科学研究和新药发现。 组织(Organizations):最高级别的 AI,能够自动执行组织的全部业务流程,如规划、执行、反馈、迭代、资源分配和管理等。 模型: GPT4(Beta):一组改进 GPT3.5 的模型,可理解和生成自然语言或代码。 GPT3.5:一组改进 GPT3 的模型,可理解并生成自然语言或代码。 DALL·E(Beta):可以在给定自然语言提示的情况下生成和编辑图像的模型。 Whisper(Beta):可以将音频转换为文本的模型。 Embeddings:一组可以将文本转换为数字形式的模型。 Codex(Limited Beta):一组可以理解和生成代码的模型,包括将自然语言转换为代码。 Moderation:可以检测文本是否敏感或不安全的微调模型。 GPT3:一组可以理解和生成自然语言的模型。 GPT、DALL·E、Sora 相关:Sora 的出现证明了 OpenAI 试图让计算机模拟真实物理世界的野心及对自身技术路线的坚持。从 OpenAI 发布的 Sora 的技术报告中可看到对过往大语言模型训练成功经验的复用。加州大学伯克利分校计算机科学 PHD、知乎作者 SIY.Z 从技术实现上分析了 Sora 成功的部分原因,以及从商业和技术趋势上分析了 OpenAI 能跑通全部技术栈的原因,并尝试预测了 OpenAI 下一步的进展。
2024-12-27
openai
OpenAI 的相关信息如下: 模型: OpenAI API 由多种具有不同功能和价位的模型提供支持,还可通过微调针对特定用例对原始基本模型进行有限定制。 具体模型包括:GPT4(Beta),是一组改进 GPT3.5 的模型,能理解和生成自然语言或代码;GPT3.5,是一组改进 GPT3 的模型,能理解并生成自然语言或代码;DALL·E(Beta),能在给定自然语言提示的情况下生成和编辑图像;Whisper(Beta),能将音频转换为文本;Embeddings,能将文本转换为数字形式;Codex(Limited Beta),能理解和生成代码,包括将自然语言转换为代码;Moderation,能检测文本是否敏感或不安全的微调模型;GPT3,能理解和生成自然语言。 为何能跑通所有 AGI 技术栈: 方法论明确:通用模型能用到更多数据,减少技术栈,OpenAI 未来可能会继续走通用模型的道路,降低微调等特化的需求,继续增加模型的上下文长度。 用一个模型为另一个模型提供标注:OpenAI 的 Dall E 和 Sora 都用到了大量可能来自于 GPT vision 的数据标注,未来可能会继续加强各个模型的连接。 Transformer 架构:其在各个模态和技术栈具有优势,能复用模型参数和使用一套基础设施框架训练不同模型,新模型若要取代,需通过缩放定律的检验。 稀疏模型。
2024-12-25
openai 12天都有哪些内容
以下是 OpenAI 12 天相关的内容: 12 月 18 日: API 正式版:速度更快,成本降低 60%,支持视觉识别、函数调用、结构化输出等功能。 语音交互升级:引入 WebRTC 支持,12 行代码即可实现实时语音交互,音频处理费用降低 60%。 偏好微调功能:让 AI 回答更具个性化,企业 AI 准确率提升显著。 新增 Go 和 Java 工具包,简化 API 密钥申请流程。 12 月 12 日: 苹果设备深度集成 ChatGPT,可通过 Siri 实现文档总结、任务分配、节日创意等操作。 多平台无缝衔接:支持 iPhone、iPad 和 Mac,涵盖 Siri 集成、写作工具增强、视觉智能分析等多种应用场景。 实用场景:圣诞派对策划、PDF 总结、歌单生成、视觉智能评选毛衣创意等功能演示,体现全新交互体验。 12 月 5 日: OpenAI 近日宣布将举行为期 12 天的活动,期间每天直播展示新功能或工具。 DeepMind 发布了基础世界模型 Genie 2,可以通过一张图片生成可操作的 3D 环境,实现智能体的实时交互与行为预测。 真格基金投资副总裁 Monica 在其播客「OnBoard!」发布的最新一期对谈中,与在一线大模型机构有实际训练大语言模型(LLM)经验的研究员针对 OpenAI o1 模型进行了三个多小时的拆解与解读。强化学习如何给大语言模型带来新的逻辑推理能力?这种能力的来源、实现方式和未来潜力又是怎样的?o1 带来的「新范式」会对行业有怎样的影响?
2024-12-20
openai发布会内容
以下是关于 OpenAI 发布会的相关内容: 1. 12 月 20 日,OpenAI 发布 AI 大模型风险防范框架文件,OpenAI 董事会有权决定发布新 AI 模型,框架文件提出防范 AI 大模型灾难性风险的路线图,董事会可推翻领导团队关于 AI 模型发布的决策。相关链接:https://openai.com/safety/preparedness 2. 12 月 12 日,OpenAI 连续 12 天 AI 发布会的第五天完整视频(中英文双语字幕),亮点功能包括苹果设备深度集成 ChatGPT,可通过 Siri 实现文档总结、任务分配、节日创意等操作,多平台无缝衔接,涵盖多种应用场景,实用场景包括圣诞派对策划、PDF 总结、歌单生成、视觉智能评选毛衣创意等功能演示,体现全新交互体验。相关链接: 3. OpenAI 将在 11 月 6 日举办首次开发者大会,会上将发布重要更新,目标是让开发者能够更快捷和廉价地开发基于大模型的应用。此次更新最让人期待的部分是将推出 Stateful API,理论上可将大模型应用的开销削减为原来的二十分之一。相关链接:https://mp.weixin.qq.com/s/NPqAeSl3NQ0_wbHzsJSw
2024-12-19
openai 的偏好微调
偏好微调(Direct Preference Optimization)是 OpenAI 的一种新的微调方式。其操作方式是通过向模型展示两个不同的输出结果并指出哪个更好,模型将倾向于生成类似更“好”的结果。这种微调方式可以调整模型输出的风格,增加某种类型输出的权重,减少其他类型的权重。
2024-12-18
OpenAI前六场发布会的内容提炼
以下是 OpenAI 前六场发布会的部分内容提炼: OpenAI 第六天发布会:ChatGPT 的高级语音模式获得公开访问权限,能通过自然语音与用户对话并理解屏幕内容,降低使用门槛,展示多模态能力和个性化发展潜力。 相关报告:甲子光年发布的《2024 人工智能产业 30 条判断——万千流变,一如既往》涵盖 AI 技术历史发展、当前趋势和未来预测,提到 Transformer 模型和 GPT 系列发展及在多行业应用,探讨了 AI 芯片进步、在科学研究中的角色和对社会的广泛影响,还预测了 AI 产业增长。中信建投证券的海外 AI 应用行业专题《旧金山草根调研与海外 AI 应用进展》长达 100 多页,聚焦旧金山草根调研及海外 AI 应用进展,显示旧金山及硅谷地区 AI 企业众多,AI 应用在 To B 场景如广告、助手、数据分析等领域受关注,长期看好,尤其是 C 端应用潜力,列举了多家公司及其业务领域、功能进展,并提供相关上市公司数据。 OpenAI 首届开发者大会:短短 45 分钟发布会,Sam Altman 表示团队对开发者关注的问题做了六大升级,包括更长的上下文长度、更强的控制、模型的知识升级、多模态、模型微调定制和更高的速率限制,前四条主要关于新模型性能提升,后两点针对企业开发者痛点,同时宣布 API 价格下调。
2024-12-17
sora教程
以下是关于 Sora 及相关的教程信息: AI 视频方面: 软件教程: 工具教程: 应用教程: Python + AI 方面: 对于不会代码的人,有 20 分钟上手的教程,包括通过 OpenAI 的 API 生成文章缩略信息的代码重写及相关操作步骤。同时提醒妥善保管 API Key,OpenAI 的综合文档、API 使用、API Playground、API 案例与答疑的相关网址为:https://platform.openai.com/docs/overview 、https://platform.openai.com/docs/apireference 、https://platform.openai.com/playground 、https://cookbook.openai.com/ 。 工具教程: 开放公测,群友有实测案例。可参考卡兹克的教程介绍:https://mp.weixin.qq.com/s/YGEnIzfYA3xGpT9_qh56RA 以及 zho 总结的官方网站的案例。目前除每日 150 个赠送积分外,还新增积分购买选项,可操作固定种子、步数、运动幅度,交互也很有意思,在生成过程中会有案例标注。 此外,还有几个视频 AIGC 工具:Opusclip 可将长视频剪成短视频,Raskai 能将短视频素材直接翻译至多语种,invideoAI 输入想法后可自动生成脚本和分镜描述进而生成视频再人工二编合成长视频,descript 可对屏幕/播客录制并以 PPT 方式做视频,veed.io 能自动翻译自动字幕,clipchamp 是微软的 AI 版剪映,typeframes 类似 invideoAI 但内容呈现文本主体比重更多,google vids 是一款相关工具。Sora 是 OpenAI 发布的超强视频生成 AI,能通过处理各种视觉数据生成视频,使用视频压缩网络和空间时间补丁统一不同来源数据,并借助文本条件化的 Diffusion 模型生成与文本提示匹配的视觉作品。
2024-12-17
ChatGPT与Sora 是不是只有苹果手机或苹果电脑才能注册与登入?
ChatGPT 注册与登录: 苹果系统: 中国区正常无法在 AppleStore 下载 ChatGPT,需切换到美区。美区 AppleID 注册教程可参考知乎链接:https://zhuanlan.zhihu.com/p/696727277 。 最终在 AppleStore 搜到 ChatGPT 下载安装,注意别下错。 打开支付宝,地区切换到美区任意区,购买【App Store&iTunes US】礼品卡,按需要金额购买(建议先买 20 刀),然后在 apple store 中兑换礼品卡,在 chatgpt 中购买订阅 gpt plus,中途不想继续订阅可到订阅列表中取消。 会员不管在苹果还是安卓手机上购买的,电脑上都能登录。 注册美区 ID 详细步骤: 1. 电脑上打开 Apple ID 的注册页面:https://appleid.apple.com/ac 。 2. 填写验证码后点继续。 3. 到谷歌邮箱接收邮箱验证码。 4. 接着验证手机号码。 5. 验证完后会出现页面,此时美区 ID 已注册但未激活,切换到手机操作。 6. 打开 App Store,点击右上角人形头像。 7. 拉到最底下,点击退出登录,先退出国内的 ID。 8. 之后再点击右上角人形头像。 9. 手动输入美区 ID,会收到短信进行双重验证。 10. 之后完成美区的 ID 登录。 11. 随便找个软件下载,会弹出提示,点击“检查”进行激活。 12. 点击同意,进入下一页填写美国地址。 13. 若付款方式中没有“无”或“none”选项,输入街道地址和电话。 14. 至此,通过中国 IP、中国手机号、免信用卡成功注册一个美区 ID,可用于下载例如小火箭、ChatGPT、Discord、X、TikTok 等软件。 关于 Sora 的注册与登录相关信息未提及。
2024-12-16
Sora是什么
Sora 是 OpenAI 发布的一个文本到视频的生成模型。 它具有以下特点和能力: 1. 能够根据描述性的文本提示生成高质量的视频内容。 2. 其生成的视频不仅逼真且充满想象力,能创造出各种场景。 3. 可以生成长达 1 分钟的超长视频,且是一镜到底的,视频中的人物和背景等具有惊人的一致性和稳定性。 4. 虽然在技术界引起广泛关注和讨论,但目前 OpenAI 未公开发布,仅向少数研究人员和创意人士提供有限访问权限以获取使用反馈并评估技术安全性。 在图像生成能力方面,Sora 能生成图像,虽不及 Midjourney,但优于 Dalle 3。此外,Sora 在视频游戏模拟中也具有一定的能力。
2024-12-16
Sora怎么使用
Sora 是一个强大的视频生成模型,具有以下特点和使用方式: 1. 可作为世界模拟器,能够在两个输入视频之间逐渐插值,创建在完全不同的主题和场景构成之间的无缝过渡。 2. 它使用视频压缩网络和空间时间补丁来统一不同来源的数据,然后借助文本条件化的 Diffusion 模型生成与文本提示匹配的视觉作品。 3. 从核心本质上看,Sora 是一个具有灵活采样维度的扩散变压器,有三个部分: 时空压缩器首先将原始视频映射到潜在空间。 ViT 然后处理标记化的潜在表示,并输出去噪的潜在表示。 类似 CLIP 的条件机制接收 LLM 增强的用户指令和可能的视觉提示,以指导扩散模型生成风格化或主题化的视频。经过多次去噪,生成视频的潜在表示被获得,然后通过相应的解码器映射回像素空间。 此外,关于 Sora 的使用,各家 AI 最细致的教程几乎都在其官网上,例如 OpenAI 的综合文档:https://platform.openai.com/docs/overview ,API 使用:https://platform.openai.com/docs/apireference ,API Playground:https://platform.openai.com/playground ,API 案例与答疑:https://cookbook.openai.com/ 。同时,请注意妥善保管 API Key,它是扣费凭证,不要泄漏。
2024-12-13
Sora实测效果如何
Sora 是 OpenAI 推出的革命性模型,于 2024 年 12 月 10 日正式登场。它具有以下特点和实测情况: 功能: 文生视频、图生视频、视频生视频,支持多种视频定制选项,如分辨率(从 480p 到 1080p)、视频长度(从 5 秒到更长时间)和视频风格。 故事板功能,允许用户通过时间线指导视频中的多个动作,创建更加复杂的视频序列。 混音和编辑功能,提供视频混音,支持视频的延伸和剪辑,以及创建循环视频。 高级功能包括混合功能,可以将两个视频场景合并成一个新的场景。 费用和订阅套餐: 对于已经拥有 OpenAI Plus 或 Pro 账户的用户,Sora 的使用包含在现有订阅中。 OpenAI Plus 订阅每月有 50 次视频生成次数。 OpenAI Pro 订阅有无限次慢速队列生成和 500 次正常速度的视频生成次数。 选择更高分辨率的视频生成可能会减少每月的使用次数。 实测案例: 有正面报道,如《》等。 也有负面报道,如《》。 有博主已经做了提前测试,如 This Video is AI Generated!SORA Review(https://www.youtube.com/watch?v=OY2x0TyKzIQ )。 大家的测试和创意包括:能够识别一段长内容并且文字形体不变形,根据新闻创建适合在 tiktok 上传播的短视频等。 体验 Sora 的魔力可访问: 。2 点直播链接:https://www.youtube.com/watch?v=2jKVx2vyZOY 。Sora 发布初期,某些地区(如欧洲和英国)可能会有延迟。
2024-12-13
sora优势
Sora 是 OpenAI 于 2024 年 2 月发布的文本到视频的生成式 AI 模型,具有以下优势: 1. 核心技术:Sora 的核心是一个预训练的扩散变换器,能够解析文本并理解复杂的用户指令。它将原始输入视频压缩成时空潜在表示,提取时空潜在补丁作为构建块,通过多步精炼生成视频。 2. 模拟能力:Sora 进行大规模训练,展现出模拟物理世界各方面的显著能力,包括具有动态相机运动、长距离连贯性、对象持久性和模拟与世界的简单互动,还能模拟数字环境。 3. 促进创造力:能根据文本提示快速生成现实或高度风格化的视频,加速设计过程,提高艺术家、电影制作人和设计师的创造力。 4. 数据预处理:Sora 能够在原始尺寸上训练、理解和生成视频及图像,拥抱视觉数据多样性,在各种格式上采样而不损害原始尺寸,显著改善生成视频的构图和框架,实现更自然和连贯的视觉叙事。 5. 生成能力:能根据用户文本指令生成长达 1 分钟的高质量视频,包含多个执行特定动作的角色以及复杂背景的详细场景,具有高视觉质量和引人入胜的视觉连贯性,能生成细腻运动和互动描绘的扩展视频序列。
2024-12-11