AI 生图和生视频与电脑算力密切相关。
在生成图像和视频的过程中,需要强大的算力来处理复杂的计算任务。例如,像 PIKA1.0 这样的模型,在文生图和文生视频方面表现出色,其高质量和稳定性的输出依赖于足够的算力支持。
拥有大规模 GPU 集群、超算集群、云渲染平台等强大算力资源的企业或个人,能够更高效地完成生图和生视频的任务。
同时,未来算力的重点将从训练模型转向增强推理能力,这也将对 AI 生图和生视频的发展产生重要影响。
此外,一些新的模型和技术不断涌现,如 o1 推理模型,其在给出最终结果前会反复推演和验证,以提供更准确的结果。而像 OpenAI 发布会公布的 Sora v2 功能,能够生成 1 分钟长度的视频,并支持多种形式的转换,提升了多媒体创作的灵活性。
总之,电脑算力是实现高质量 AI 生图和生视频的重要支撑和保障。
OhTqYuth1rLcr92InIh)|序号|昵称|技能与经验|职业与工作领域|兴趣爱好与活动|坐标||-|-|-|-|-|-||48|Y c奕霖|艺术学博士,清华EMBA,熟悉传统电视媒体及新型主流媒体平台,关注AI技术在视听领域的应用与创新|央媒十几年从业经验|爱好徒步,掼蛋等|||49|彤哥|经营算力行业业务十多年,有大规模GPU集群,超算集群,云渲染平台。智算平台[ai.spacehpc.com](http://ai.spacehpc.com),图像渲染平台[renderg.com](http://renderg.com)。|旗下有三维动画生产团队||五道口||50|张书画|教培从业者,目前从事高校职规培训相关工作,能够使用AI基础工具生图和生视频,对AI创作很感兴趣|高校职规培训||东三环||51|朱海锋|初入ai领域|旅游行业||房山||52|.|浙西龙游星海超算是一家非盈利非民营企业算力云服务商有多家分公司和办事处,拥有稳定合作的客户500多家,有的公司已稳定合作近10年。[beta.spacehpc.com](http://beta.spacehpc.com)|算力提供方||杭州||53|雷子|视频行业7年,AI降临派,近一个月狂啃视频生成工具,能够完成基础的图片视频制作,高阶工作流、视频内容生成正在学习中|导演||西红门|
亮点:AI生成图片时可加入中文文字,提升应用场景多样性。示例场景:教孩子古诗时生成配图加文字,让学习更有趣。春节生成春联配图,增加节日氛围。制作漫画、梗图等内容,释放创意潜力。**关键点:**文生图支持文字后,AI创作更关注想象力而非技术。🔗[https://x.com/dotey/status/1864975649430966362](https://x.com/dotey/status/1864975649430966362)5⃣️🤖o1推理模型:从“快思考”到“慢思考”特性:o1模型在给出最终结果前会反复推演和验证,就像围棋高手在算棋。区别:GPT-4o:快速返回答案,但可能错误,且无法自动纠错。o1:支持回溯推理,耗时更长但结果更准确。o1 Pro:计算时间更长,推理能力更强,适合复杂问题。应用案例:o1 Pro成功完成《纽约时报》“Connections”文字游戏,这曾是GPT-4o无法解决的任务。**趋势:**未来算力的重点将从训练模型转向增强推理能力。🔗[https://x.com/dotey/status/1865890371722440734](https://x.com/dotey/status/1865890371722440734)6⃣️🎥OpenAI发布会:Sora v2功能公布新版亮点:生成1分钟长度的视频。支持文字转视频、文字加图片转视频、文字加视频转视频。提升多媒体创作灵活性,为用户提供更多创意选择。
能明显感受到,PIKA1.0是启用了一个全新的模型,甚至我感觉不是基于旧有的迭代,而是完全重新做的一个全新的模型。强非常非常多。3D和2D的动画效果更是吊炸天。所以他们的新模型,我会多花一些篇幅和笔墨,来展现一下。首先,文生视频的质量得到了大幅度的提升。我直接写了一段:Prompt:Cinematic,happy laughing girl in office,Pixar style瞬间,匹配皮克斯水平的镜头就出来了。要知道,我只花了1分钟。这效果,我说实话,太特么吓人了。。。。。。而且,这稳定性,这神情。。。爆杀市面上所有的AI视频。再来!A cat flying a plane,Cartoon style在文生图这块,PIKA1.0的新模型稳定的令人害怕。Cinematic,extreme close-up of cars on the road in a jungle,3D rendering不规则构图的汽车行驶在道路上,这个前进的镜头依然稳定的可怕,车上的光影更是表现的极好。无敌。真的无敌。同时,有两个小技巧是,右下角第三个设置里,负面提示(Negative prompt)可以常驻:blurry,out of focus,twisted,deformed。提示词相关性别设太高,可以5~15之间,自己实测下来效果最好。再来说图生视频。图生视频这块,效果也依旧棒。放几个case。(这里因为GIF图比较大所以只能放了每秒10帧的GIF,所以看起来可能有一些卡,这并不是PIKA的原因。)说实话,Runway原本剩的唯一优势就画质好+一致性强点了。。。但是你看看现在的PIKA1.0。。。。。。人的一致性已经逆天了,再加上它强到爆的语义理解,以及幅度巨大的动作。。。。咋比啊。。。这PIKA1.0新模型的质量,特别是它最擅长的3D和3D的动画的质量,真的让人激动到无以复加。