直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

Sora实测效果如何

回答

Sora 是 OpenAI 推出的革命性模型,于 2024 年 12 月 10 日正式登场。它具有以下特点和实测情况:

  • 功能:
    • 文生视频、图生视频、视频生视频,支持多种视频定制选项,如分辨率(从 480p 到 1080p)、视频长度(从 5 秒到更长时间)和视频风格。
    • 故事板功能,允许用户通过时间线指导视频中的多个动作,创建更加复杂的视频序列。
    • 混音和编辑功能,提供视频混音,支持视频的延伸和剪辑,以及创建循环视频。
    • 高级功能包括混合功能,可以将两个视频场景合并成一个新的场景。
  • 费用和订阅套餐:
    • 对于已经拥有 OpenAI Plus 或 Pro 账户的用户,Sora 的使用包含在现有订阅中。
    • OpenAI Plus 订阅每月有 50 次视频生成次数。
    • OpenAI Pro 订阅有无限次慢速队列生成和 500 次正常速度的视频生成次数。
    • 选择更高分辨率的视频生成可能会减少每月的使用次数。
  • 实测案例:

体验 Sora 的魔力可访问:Sora.com 。2 点直播链接:https://www.youtube.com/watch?v=2jKVx2vyZOY 。Sora 发布初期,某些地区(如欧洲和英国)可能会有延迟。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

Sora实测案例

🎉在等待了整整300天后,终于等到Sora的重磅发布!今天,2024年12月10日,Sora正式登场啦!这是OpenAI推出的革命性模型,它不仅能根据文字描述生成视频,还能创造出长达一分钟的高质量视频!🤯无长毛猛犸象在沙漠中悠然漫步,还是水獺玩耍时的可爱瞬间,Sora都能根据你的需求,生成出无缝连接、超逼真的视频内容!🎬🔗体验Sora的魔力:[Sora.com](https://sora.com)部分报道有正面《[OpenAI正式上线Sora-](http://www.citnews.com.cn/news/202412/190665.html)[](http://www.citnews.com.cn/news/202412/190665.html)[王者归航。](http://www.citnews.com.cn/news/202412/190665.html)》有负面《[别吹Sora了,实测一言难尽。甚至分不清人脸和猪??](https://mp.weixin.qq.com/s/FmtMsPJWeQ3z8NBrLdSg9g)》《[刚刚,OpenAI Sora正式炸裂登场,网页挤爆了!](https://mp.weixin.qq.com/s/_cm8Sw50XF0P2JtHGDAKKA)》[OpenAI新货详解:Sora发布,附各种案例](https://mp.weixin.qq.com/s/CR7dLLWN2XmTNHuxEKm66A)[中学生能看懂:Sora原理解读](https://mp.weixin.qq.com/s/YN4zJjLr66TBW40tePsrRQ)[小学生都能看懂的:生成式AI和Sora原理](https://mp.weixin.qq.com/s/0uGQ1m1bj-pep1cjBNA5LQ)

视频模型:Sora

最新消息sora.com域名已经部署好[Sora实测案例](https://waytoagi.feishu.cn/wiki/MKgKw9hg8iZZp1kKYQ4c0B6unWg)2点直播链接:https://www.youtube.com/watch?v=2jKVx2vyZOY有博主已经做了提前测试This Video is AI Generated!SORA Reviewhttps://www.youtube.com/watch?v=OY2x0TyKzIQ12月10日已上线[heading2]Sora功能:[content]文生视频,图生视频,视频生视频1.视频生成:文生视频,图生视频,视频生视频支持多种视频定制选项,如分辨率(从480p到1080p)、视频长度(从5秒到更长时间)和视频风格。用户可以浏览社区共享的视频,获取灵感和学习技巧(直接抄别人prompt)2.故事板:允许用户通过时间线指导视频中的多个动作,创建更加复杂的视频序列。3.混音和编辑:提供视频混音功能,允许用户将视频转换成新的风格。支持视频的延伸和剪辑,以及创建循环视频。4.高级功能:包括混合功能,可以将两个视频场景合并成一个新的场景。[heading2]费用和订阅套餐:[content]对于已经拥有OpenAI Plus或Pro账户的用户,Sora的使用是包含在现有订阅中的,无需额外支付费用。OpenAI Plus订阅:每月50次视频生成次数。OpenAI Pro订阅:无限次慢速队列生成。500次正常速度的视频生成次数。额外信息:用户可以根据需要选择更高分辨率的视频生成,但这可能会减少每月的使用次数。Sora的发布初期,对于某些地区(如欧洲和英国)可能会有延迟。

Sora实测案例

|作者|类型和亮点|测试样例|提示词|||-|-|-|-|-|||一段长内容可以识别并且文字形体不变形|[55459_1733800399_raw.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/G78EbYb6DoHaMRxQfJacPl7NnJd?allow_redirect=1)|你需要根据下面的新闻,创建一个适合在tiktok上传播的短视频:#美团股价大涨4.68%,创近期新高![美团股价走势图](https://i-invdn-com.investing.com/news/LYNXMPEAA60AX_L.jpg)香港恒生科技指数12月9日尾盘快速拉升,美团-W(03690.HK)股价大涨4.68%,报170港元,创近期新高。美团股价的强劲表现主要受两方面因素推动。一是中共中央政治局会议提出明年要大力提振消费,提高投资效益,全方位扩大国内需求,这一政策利好刺激了消费类股票上涨。二是美团近期业绩表现亮眼,三季度财报显示净利润同比增长307.5%,达137亿元,超出市场预期。值得注意的是,美团不仅在核心业务上保持增长,新业务板块也呈现强劲势头。三季度新业务大幅减亏,从去年同期的51亿元收窄至10亿元。即时配送业务快速增长,美团闪购日均单量突破1000万单。此外,美团还在积极布局新领域,近日在成都成立了注册资本500万美元的酒店管理公司。分析人士认为,美团作为科网股具有顺周期属性,且受益于人工智能趋势,在政策利好和行业发展趋势的共同作用下,有望继续保持良好增长态势。不过,投资者仍需关注市场波动风险,谨慎投资。|||trader|engineer|[55468_1733800667.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/FXwAbaMCrogenxxvEyRcHCAsnFg?allow_redirect=1)|一个程序员||

其他人在问
sora教程
以下是关于 Sora 及相关的教程信息: AI 视频方面: 软件教程: 工具教程: 应用教程: Python + AI 方面: 对于不会代码的人,有 20 分钟上手的教程,包括通过 OpenAI 的 API 生成文章缩略信息的代码重写及相关操作步骤。同时提醒妥善保管 API Key,OpenAI 的综合文档、API 使用、API Playground、API 案例与答疑的相关网址为:https://platform.openai.com/docs/overview 、https://platform.openai.com/docs/apireference 、https://platform.openai.com/playground 、https://cookbook.openai.com/ 。 工具教程: 开放公测,群友有实测案例。可参考卡兹克的教程介绍:https://mp.weixin.qq.com/s/YGEnIzfYA3xGpT9_qh56RA 以及 zho 总结的官方网站的案例。目前除每日 150 个赠送积分外,还新增积分购买选项,可操作固定种子、步数、运动幅度,交互也很有意思,在生成过程中会有案例标注。 此外,还有几个视频 AIGC 工具:Opusclip 可将长视频剪成短视频,Raskai 能将短视频素材直接翻译至多语种,invideoAI 输入想法后可自动生成脚本和分镜描述进而生成视频再人工二编合成长视频,descript 可对屏幕/播客录制并以 PPT 方式做视频,veed.io 能自动翻译自动字幕,clipchamp 是微软的 AI 版剪映,typeframes 类似 invideoAI 但内容呈现文本主体比重更多,google vids 是一款相关工具。Sora 是 OpenAI 发布的超强视频生成 AI,能通过处理各种视觉数据生成视频,使用视频压缩网络和空间时间补丁统一不同来源数据,并借助文本条件化的 Diffusion 模型生成与文本提示匹配的视觉作品。
2024-12-17
ChatGPT与Sora 是不是只有苹果手机或苹果电脑才能注册与登入?
ChatGPT 注册与登录: 苹果系统: 中国区正常无法在 AppleStore 下载 ChatGPT,需切换到美区。美区 AppleID 注册教程可参考知乎链接:https://zhuanlan.zhihu.com/p/696727277 。 最终在 AppleStore 搜到 ChatGPT 下载安装,注意别下错。 打开支付宝,地区切换到美区任意区,购买【App Store&iTunes US】礼品卡,按需要金额购买(建议先买 20 刀),然后在 apple store 中兑换礼品卡,在 chatgpt 中购买订阅 gpt plus,中途不想继续订阅可到订阅列表中取消。 会员不管在苹果还是安卓手机上购买的,电脑上都能登录。 注册美区 ID 详细步骤: 1. 电脑上打开 Apple ID 的注册页面:https://appleid.apple.com/ac 。 2. 填写验证码后点继续。 3. 到谷歌邮箱接收邮箱验证码。 4. 接着验证手机号码。 5. 验证完后会出现页面,此时美区 ID 已注册但未激活,切换到手机操作。 6. 打开 App Store,点击右上角人形头像。 7. 拉到最底下,点击退出登录,先退出国内的 ID。 8. 之后再点击右上角人形头像。 9. 手动输入美区 ID,会收到短信进行双重验证。 10. 之后完成美区的 ID 登录。 11. 随便找个软件下载,会弹出提示,点击“检查”进行激活。 12. 点击同意,进入下一页填写美国地址。 13. 若付款方式中没有“无”或“none”选项,输入街道地址和电话。 14. 至此,通过中国 IP、中国手机号、免信用卡成功注册一个美区 ID,可用于下载例如小火箭、ChatGPT、Discord、X、TikTok 等软件。 关于 Sora 的注册与登录相关信息未提及。
2024-12-16
Sora是什么
Sora 是 OpenAI 发布的一个文本到视频的生成模型。 它具有以下特点和能力: 1. 能够根据描述性的文本提示生成高质量的视频内容。 2. 其生成的视频不仅逼真且充满想象力,能创造出各种场景。 3. 可以生成长达 1 分钟的超长视频,且是一镜到底的,视频中的人物和背景等具有惊人的一致性和稳定性。 4. 虽然在技术界引起广泛关注和讨论,但目前 OpenAI 未公开发布,仅向少数研究人员和创意人士提供有限访问权限以获取使用反馈并评估技术安全性。 在图像生成能力方面,Sora 能生成图像,虽不及 Midjourney,但优于 Dalle 3。此外,Sora 在视频游戏模拟中也具有一定的能力。
2024-12-16
Sora怎么使用
Sora 是一个强大的视频生成模型,具有以下特点和使用方式: 1. 可作为世界模拟器,能够在两个输入视频之间逐渐插值,创建在完全不同的主题和场景构成之间的无缝过渡。 2. 它使用视频压缩网络和空间时间补丁来统一不同来源的数据,然后借助文本条件化的 Diffusion 模型生成与文本提示匹配的视觉作品。 3. 从核心本质上看,Sora 是一个具有灵活采样维度的扩散变压器,有三个部分: 时空压缩器首先将原始视频映射到潜在空间。 ViT 然后处理标记化的潜在表示,并输出去噪的潜在表示。 类似 CLIP 的条件机制接收 LLM 增强的用户指令和可能的视觉提示,以指导扩散模型生成风格化或主题化的视频。经过多次去噪,生成视频的潜在表示被获得,然后通过相应的解码器映射回像素空间。 此外,关于 Sora 的使用,各家 AI 最细致的教程几乎都在其官网上,例如 OpenAI 的综合文档:https://platform.openai.com/docs/overview ,API 使用:https://platform.openai.com/docs/apireference ,API Playground:https://platform.openai.com/playground ,API 案例与答疑:https://cookbook.openai.com/ 。同时,请注意妥善保管 API Key,它是扣费凭证,不要泄漏。
2024-12-13
sora优势
Sora 是 OpenAI 于 2024 年 2 月发布的文本到视频的生成式 AI 模型,具有以下优势: 1. 核心技术:Sora 的核心是一个预训练的扩散变换器,能够解析文本并理解复杂的用户指令。它将原始输入视频压缩成时空潜在表示,提取时空潜在补丁作为构建块,通过多步精炼生成视频。 2. 模拟能力:Sora 进行大规模训练,展现出模拟物理世界各方面的显著能力,包括具有动态相机运动、长距离连贯性、对象持久性和模拟与世界的简单互动,还能模拟数字环境。 3. 促进创造力:能根据文本提示快速生成现实或高度风格化的视频,加速设计过程,提高艺术家、电影制作人和设计师的创造力。 4. 数据预处理:Sora 能够在原始尺寸上训练、理解和生成视频及图像,拥抱视觉数据多样性,在各种格式上采样而不损害原始尺寸,显著改善生成视频的构图和框架,实现更自然和连贯的视觉叙事。 5. 生成能力:能根据用户文本指令生成长达 1 分钟的高质量视频,包含多个执行特定动作的角色以及复杂背景的详细场景,具有高视觉质量和引人入胜的视觉连贯性,能生成细腻运动和互动描绘的扩展视频序列。
2024-12-11
sora是stable diffusion中的一部分吧
Sora 与 Stable Diffusion 有关联。自 2021 年以来,AI 领域出现了能解释人类指令的生成式语言和视觉模型,如 CLIP 和 Stable Diffusion。Stable Diffusion 采用变压器架构和潜在扩散技术解码文本输入生成图像。2023 年出现了商业文本到图像产品,如 Stable Diffusion 等。Sora 是一个重大突破,能根据人类指令生成长达一分钟的视频。从技术架构上,Stable Diffusion 3 后续版本有希望成为 Sora 的开源平替。此外,在一些观点中,Sora 就在 Stable Diffusion 这样的文生图模型之外加了一个时间维度,虽然方法类似,但数据高维很多,实现工程难度大。
2024-12-03
哪个ai工具做PPT的效果最好
以下是一些效果较好的 AI 工具可用于制作 PPT: 1. MindShow:提供一系列智能设计功能,如自动布局、图像选择和文本优化等,还有可能包含互动元素和动画效果。网址:https://www.mindshow.fun/ 2. 爱设计:拥有多种精美的 PPT 模板,能为不同行业提供合适的幻灯片设计。 3. 闪击:能助您快速、高效地完成 PPT 设计。 4. Process ON:可辅助制作 PPT。 5. WPS AI:通过输入相关指令可添加动画等效果。 6. Gamma:在线 PPT 制作网站,支持输入文本和想法提示快速生成幻灯片,还支持嵌入多媒体格式。网址:https://gamma.app/ 7. 美图 AI PPT:由美图秀秀开发团队推出,通过输入简单文本描述生成专业 PPT 设计,有丰富模板库和设计元素。网址:https://www.xdesign.com/ppt/ 8. 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理技术优势,提供智能文本生成、语音输入、文档格式化等功能。网址:https://zhiwen.xfyun.cn/ 需要注意的是,每款工具都有其独特优势,您可以根据自身需求和使用习惯进行选择。
2024-12-18
有没有根据布料照片和模特照片生成衣服上身效果的工具或 comfyUI 工作流
以下是一些与根据布料照片和模特照片生成衣服上身效果相关的工具和工作流: 1. 藏师傅的方法:将第二步的提示词和 Logo 图片放到 Comfyui 工作流就行。Lora 需要用到 InContext LoRA 中的 visualidentitydesign,可从以下地址下载:https://huggingface.co/alivilab/InContextLoRA/tree/main 。工作流下载:https://github.com/op7418/Comfyuiworkflow/blob/main/FLUX/Logo%20%E5%91%A8%E8%BE%B9%E7%94%9F%E6%88%90.json 。 2. 彭青云分享的内容:本地部署 Comfyui 有多种方式,如官方的本地部署包、秋叶整合包和二狗子老师制作的通往 AGI 之路黑猴子流专属包。处理好软件和模型后,打开一键启动,稍等片刻就会进入工作界面。通过正反提示词、文本链接图像,点击右侧队列即可生成图像。 3. ComfyUI BrushNet:原项目 https://tencentarc.github.io/BrushNet/ ,插件地址 https://github.com/kijai/ComfyUIBrushNetWrapper ,模型下载 https://huggingface.co/Kijai/BrushNetfp16/tree/main 。第一次运行会自动下载需要的模型,如果是用的 ComfyUIBrushNetWrapper 节点,模型将自动从此处下载:https://huggingface.co/Kijai/BrushNetfp16/tree/main 到 ComfyUI/models/brushnet,也可手动下载放在这个文件夹里面。另外,BrushNet 提供了三个模型,个人测试下来,random 这个效果比较好。工作流方面,可配合 mj 出底图,在底图不变的基础上,添加文字或者图片内容。还可以使用 GDinoSAm(GroundingDino+Sam),检测和分割底图上的内容,做针对性的修改。
2024-12-13
能到达图片重绘效果的软件
以下是一些能够实现图片重绘效果的软件及相关信息: Stable Diffusion: 将照片放入后期处理中,使用 GFPGAN 算法使人脸变清晰。可参考文章。 将图片发送到图生图中,打开 stableSR 脚本,放大两倍。此放大插件是所有插件中对原图还原最精准、重绘效果最好的。可参考文章。切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可以不写以免对原图产生干扰。 Midjourney: 最新编辑器更新,可上传图片重新绘制。允许从计算机上传图像,然后扩展、裁剪、重绘、添加或修改场景中的元素。还推出了“图像重纹理化模式”,会估算场景的形状,然后重新应用纹理,使得所有光照、材质和表面都发生变化。所有图像编辑操作都可以通过文本提示和区域选择来控制。编辑器兼容模型个性化、风格参考、角色参考和图像提示功能。 常见问题:如果提出极其不合适的请求,或者要求修改一个非常小的区域,可能无法得到预期的结果;如果在场景中放了一个很小的头部并要求进行外绘,生成的身体可能会太大(所以请将头部放大一些)。 重纹理化:是一种通过使用另一张图像来引导图像结构或构图的方法。从构图引导图像开始(在全功能编辑器中上传或链接的基础或母图像),然后使用提示词和参数来添加所需的细节。 右侧显示的缩略图:显示器右侧的缩略图显示的是最近几次编辑会话的记录。左边稍大一点的缩略图是上传或链接的图像。其他四张缩略图是子图像,展示了 Midjourney 根据提示生成的四种不同表达方式。 按钮:用于查看更多相关内容。 使用规则:由于这些功能非常新,Midjourney 希望给社区和人工审核团队一个缓慢适应的时间,因此在第一个发布阶段,将这些功能开放给以下社区群体:已生成至少 10,000 张图像的用户,年度会员可用;过去 12 个月内一直是月度订阅用户的用户(MJ 尝试做得更细致一些,但数据库处理起来有些复杂,抱歉!)
2024-12-05
有制作果园设计效果图的AI工具推荐吗?
以下是一些可以制作果园设计效果图的 AI 工具推荐: 1. CADtools 12:这是一个 Adobe Illustrator(AI)插件,为 AI 添加了 92 个绘图和编辑工具,包括图形绘制、编辑、标注、尺寸标注、转换、创建和实用工具。 2. Autodesk Fusion 360:Autodesk 开发的一款集成了 AI 功能的云端 3D CAD/CAM 软件,能够帮助用户创建复杂的几何形状和优化设计。 3. nTopology:基于 AI 的设计软件,可以帮助用户创建复杂的 CAD 模型,包括拓扑优化、几何复杂度和轻量化设计等。 4. ParaMatters CogniCAD:基于 AI 的 CAD 软件,可以根据用户输入的设计目标和约束条件自动生成 3D 模型,适用于拓扑优化、结构设计和材料分布等领域。 5. 一些主流 CAD 软件,如 Autodesk 系列、SolidWorks 等,提供了基于 AI 的生成设计工具,这些工具可以根据用户输入的设计目标和约束条件自动产生多种设计方案。 需要注意的是,这些工具通常需要一定的 CAD 知识和技能才能有效使用。对于 CAD 初学者,建议先学习基本的 3D 建模技巧,然后尝试使用这些 AI 工具来提高设计效率。
2024-12-04
ai绘画的最前沿技术以及效果
AI 绘画的最前沿技术及效果包括以下方面: 技术融合:将艺术与先进的机器学习、深度学习等技术完美结合,如利用卷积神经网络等算法模拟人类创作过程。 打破局限:不再局限于传统手工绘画技巧,通过编程、算法和数据分析等开拓全新创作领域,为艺术家提供灵感,为缺乏绘画技巧的人提供创作机会,使艺术更具民主化和包容性。 效果提升:能够生成更加复杂、逼真和富有创意的图像,涵盖各种风格和题材,从写实到抽象,从风景到人物。 应用广泛:在广告设计、游戏开发、影视制作、建筑设计等领域发挥作用,可快速生成创意概念图、创建场景和角色形象、辅助特效场景和概念设计、帮助构想建筑外观和内部布局等。 色彩与情感表达:着色画通过色彩的丰富性、情感表达、细节和纹理的突出以及创意发挥,增加作品的表现力和独特性。 关键词结构思路:包括基础描述、风格指定、色彩要求和细节强调等方面。 进阶玩法:如使用 MJ 的 Retexture 功能或即梦参考功能,通过写提示词或垫图功能给着色画上色。
2024-12-03
效果最好的图片AI换脸工具
以下为一些效果较好的图片 AI 换脸工具及相关信息: 星流一站式 AI 设计工具: 选中图像进入扩展功能界面,自动提取面部信息。 上传想要替换到图像的图片。 参数方面,提示词框会自动根据图像进行填充,无需手动填写。重绘风格选择与放大图像相对应的风格,会提升换脸效果,其余参数默认即可。 【TecCreative】帮助手册: 仅需上传原始图片和换脸图片,即可一键实现素材换脸。图片大小上限 5M,支持 JPG、PNG 格式。 实战中的方法: 点击快捷工具中顶部的 JupyterLab,打开工具。 新打开一个终端窗口,在终端区域输入命令:查看文件列表(输入 ls 并按回车)、进入 facefusion 目录(输入 cd facefusion 并按回车)、启动 facefusion(输入:python./run.py executionproviders cuda cpu)。 打开 facefusion 软件,返回实例列表,点击自定义服务按钮,通过新的浏览器窗口访问其 UI 界面,上传准备好的图片、视频,在右侧查看预览效果,点击开始按钮执行换脸处理,处理完成后可导出视频到本地。
2024-11-30