Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

那款AI可以让静态变动态I

Answer

以下是一些可以让静态变动态的 AI 工具和方法:

  1. Hailuo AI 推出的 I2V-01-Live 新功能,能够为静态 2D 插画加入流畅动画,赋予角色生命力,支持多种艺术风格,动作细节表现真实流畅。相关链接:https://x.com/imxiaohu/status/1863968974612091125
  2. 腾讯 Hunyuan 是 130 亿参数开源视频模型,能生成高质量视频,动作连贯自然,镜头切换灵活,具备强大语义跟随能力。官网:https://aivideo.hunyuan.tencent.com 代码:https://github.com/Tencent/HunyuanVideo
  3. 可以通过教程学习用 AI 制作动画视频播客,比如五步学会的方法。相关链接:https://youtu.be/-fj81cg5bf0 https://x.com/imxiaohu/status/1864157642605953268
  4. 可以使用即梦、runway 等工具,比如在剪映里添加 PNG 透明底图并导出。
Content generated by AI large model, please carefully verify (powered by aily)

References

XiaoHu.AI日报

🔔Xiaohu.AI日报「12月04日」✨✨✨✨✨✨✨✨1⃣️📚AI教程:五步学会用AI制作动画视频播客五个步骤教你从零到一制作动画版视频播客。适合有一定技术基础的朋友,轻松上手创作动画视频!🔗[https://youtu.be/-fj81cg5bf0](https://youtu.be/-fj81cg5bf0)🔗[https://x.com/imxiaohu/status/1864157642605953268](https://x.com/imxiaohu/status/1864157642605953268)2⃣️🤯Hailuo AI推出I2V-01-Live新功能:让静态2D插画“活”起来!从静态到动态:为2D插画加入流畅动画,赋予角色生命力。多风格支持:适配漫画、卡通等多种艺术风格,创作更自由。细腻自然:捕捉细微动作细节,表情、眨眼等表现更加真实流畅。🔗[https://x.com/imxiaohu/status/1863968974612091125](https://x.com/imxiaohu/status/1863968974612091125)3⃣️🎥腾讯Hunyuan:130亿参数开源视频模型高质量视频生成,动作连贯自然,镜头切换灵活。具备强大语义跟随能力,适配新一代语言模型作为文本编码器。采用类似Sora的DiT架构,显著提升影视级动态表现力。🔗[https://x.com/imxiaohu/status/1863885812888433035](https://x.com/imxiaohu/status/1863885812888433035)🔗官网:[https://aivideo.hunyuan.tencent.com](https://aivideo.hunyuan.tencent.com)🔗代码:[https://github.com/Tencent/HunyuanVideo](https://github.com/Tencent/HunyuanVideo)

XiaoHu.AI日报

🔔Xiaohu.AI日报「12月04日」✨✨✨✨✨✨✨✨1⃣️📚AI教程:五步学会用AI制作动画视频播客五个步骤教你从零到一制作动画版视频播客。适合有一定技术基础的朋友,轻松上手创作动画视频!🔗[https://youtu.be/-fj81cg5bf0](https://youtu.be/-fj81cg5bf0)🔗[https://x.com/imxiaohu/status/1864157642605953268](https://x.com/imxiaohu/status/1864157642605953268)2⃣️🤯Hailuo AI推出I2V-01-Live新功能:让静态2D插画“活”起来!从静态到动态:为2D插画加入流畅动画,赋予角色生命力。多风格支持:适配漫画、卡通等多种艺术风格,创作更自由。细腻自然:捕捉细微动作细节,表情、眨眼等表现更加真实流畅。🔗[https://x.com/imxiaohu/status/1863968974612091125](https://x.com/imxiaohu/status/1863968974612091125)3⃣️🎥腾讯Hunyuan:130亿参数开源视频模型高质量视频生成,动作连贯自然,镜头切换灵活。具备强大语义跟随能力,适配新一代语言模型作为文本编码器。采用类似Sora的DiT架构,显著提升影视级动态表现力。🔗[https://x.com/imxiaohu/status/1863885812888433035](https://x.com/imxiaohu/status/1863885812888433035)🔗官网:[https://aivideo.hunyuan.tencent.com](https://aivideo.hunyuan.tencent.com)🔗代码:[https://github.com/Tencent/HunyuanVideo](https://github.com/Tencent/HunyuanVideo)

教程:端午节动态视频

我这用的即梦,也可以用runway等(如果要字不动,可以先去在剪印里添加文字logo素材)先什么关键词都不写,如果效果不满意,再添加关键词即梦runway画笔[heading2]5、剪映里把视频放进去(AJ操作)[content]PNG透明底图放上导出[heading2]可以把你的美图交在评论区哦💗~祝大家端午节快乐~

Others are asking
小白如何用ai开始学习图片设计
对于小白如何用 AI 开始学习图片设计,以下是一些建议: 1. 图像流搭建 创建第一个图像流:由于文本类型大语言模型无法直接生成图片,需要通过【技能】部分的图像流为文本大模型提供图像生成能力。为 bot 加入图像流时,要设定图像流名称以及描述(名称只能是英文)。 了解图像流节点的意义:图像流编辑界面左侧的工具栏集合了所有可能用到的功能,大致可分为智能处理工具(如“智能生成”“智能抠图”“画质提升”等)、基础编辑工具(如画板、裁剪、调整、添加文字等)和风格处理类工具(如风格迁移、背景替换等)。从基础编辑工具开始尝试,熟悉后再探索其他功能。右侧类似画布,可拖拽左侧工具或点击“+”拖放各种工具模块,工具之间可连接形成工作流程。 根据需求进行图像流设计:例如生成海报功能,在总结故事后,将完整的故事作为输入,对输入的故事进行一轮提示词优化,从自然语言转变为更符合文生图大模型的提示词,将优化后的提示词输入生图大模型,调整生图的基础风格和信息,输出最终的配图海报。 测试图像流。 2. 利用即梦 AI 生成海报 提示词:皮克斯风格,三宫格漫画:一只小狗,坐在办公桌前,文字“KPI 达标了吗?”。一只小狗,拿着一个写满计划的大本子,微微皱着眉头,文字“OKR 写好了吗?”。一只小狗坐在电脑前,文字“PPT 做好了吗?”。 实操教程: 打开即梦 AI:https://jimeng.jianying.com/aitool/home 。 点击 AI 作图中的图片生成。 填写绘图提示词,选择生图模型 2.1,点击立刻生成。 3. 进阶技巧和关键词 图片内容一般分为二维插画以及三维立体两种主要表现形式。 主题描述:可以描述场景、故事、元素、物体或人物细节、搭配等。描述场景中的人物时,最好独立描述,不要用一长串文字,否则 AI 可能识别不到。 设计风格:可找风格类关键词参考或垫图/喂图,让 AI 根据给出的图片风格结合主题描述生成图片。对于某些材质的描述,关键词的运用有很多门道,需要针对某一种风格单独进行“咒语测试”。
2025-02-26
AI生成PPT
以下是关于 AI 生成 PPT 的相关内容: 卓 sir 的制作流程:先让 GPT4 生成 PPT 大纲,然后将大纲导入 WPS 启用 WPS AI 一键生成 PPT,再让 chatPPT 添加动画,最后手动修改细节。其中,生成符合要求的大纲最费时间。 市面上大多数 AI 生成 PPT 的思路:AI 生成 PPT 大纲、手动优化大纲、导入工具生成 PPT、优化整体结构。 相关推荐:gamma、AIPPT、islide AI 等产品,其中 gamma 被认为在审美方面表现较好。 扩展阅读:《AI 生成 PPT 工具红黑榜,这三款千万别用》《AI+PPT 等效率工具的研报》 您可以根据自己的需求和喜好选择合适的方法和工具来生成 PPT。
2025-02-26
文生营销图AI
以下是关于文生营销图 AI 的相关教程: Liblibai 简易上手教程: 1. 定主题:确定您需要生成的图片的主题、风格和要表达的信息。 2. 选择 Checkpoint:根据主题选择内容贴近的 Checkpoint,如麦橘、墨幽的系列模型。 3. 选择 lora:寻找与生成内容重叠的 lora,以控制图片效果和质量。 4. 设置 VAE:选择 840000 那一串。 5. CLIP 跳过层:设为 2。 6. Prompt 提示词:用英文写需求,使用单词和短语组合,用英文半角逗号隔开,无需语法和长句。 7. 负向提示词 Negative Prompt:用英文写要避免的内容,同样是单词和短语组合,用英文半角逗号隔开。 8. 采样方法:一般选 DPM++2M Karras,也可参考模型作者推荐的采样器。 9. 迭代步数:选 DPM++2M Karras 时,在 30 40 之间,多了意义不大且慢,少了效果差。 10. 尺寸:根据喜好和需求选择。 11. 生成批次:默认 1 批。 Tusiart 简易上手教程: 1. 定主题:确定图片的主题、风格和要表达的信息。 2. 选择基础模型 Checkpoint:根据主题选择贴近的 Checkpoint,如麦橘、墨幽的系列模型。 3. 选择 lora:寻找与生成内容重叠的 lora,以控制图片效果和质量。 4. ControlNet:用于控制图片中特定的图像,如人物姿态等,属于高阶技能。 5. 局部重绘:下篇再教。 6. 设置 VAE:选择 840000 那一串。 7. Prompt 提示词:用英文写需求,使用单词和短语组合,用英文半角逗号隔开,无需语法和长句。 8. 负向提示词 Negative Prompt:用英文写要避免的内容,同样是单词和短语组合,用英文半角逗号隔开。 9. 采样算法:一般选 DPM++2M Karras,也可参考模型作者推荐的采样器。 10. 采样次数:选 DPM++2M Karras 时,在 30 40 之间,多了意义不大且慢,少了效果差。 11. 尺寸:根据喜好和需求选择。 关于【SD】文生图提示词: 1. 避免使用太大的数值,如 1920x1080,可能导致奇怪构图,可使用高清修复放大图像倍率,记住高宽比主要控制画面比例。 2. 调整好参数后生成图片,若质感不足,可添加标准化提示词,如:,绘图,画笔等,让画面更趋近于固定标准。
2025-02-26
AI LOGO工具
以下是一些生成 Logo 的 AI 产品: 1. Looka:这是一个在线 Logo 设计平台,使用 AI 理解用户的品牌信息和设计偏好,生成多个设计方案供选择和定制。 2. Tailor Brands:AI 驱动的品牌创建工具,通过用户回答问题生成 Logo 选项。 3. Designhill:其 Logo 制作器利用 AI 技术创建个性化设计,用户可选择元素和风格。 4. LogoMakr:提供简单易用的设计工具,用户能拖放设计,利用 AI 建议的元素和颜色方案。 5. Canva:广受欢迎的在线设计工具,提供 Logo 设计模板和元素,有 AI 辅助设计建议。 6. LogoAI by Tailor Brands:Tailor Brands 推出的 AI Logo 设计工具,根据输入快速生成方案。 7. 标小智:中文 AI Logo 设计工具,利用人工智能技术帮助创建个性化 Logo。 这些 AI 产品让无设计背景的用户也能轻松创建专业 Logo。使用时,用户可根据品牌理念和视觉偏好,通过简单交互获得系列方案,并进一步定制优化至满意。 此外,您还可以访问网站的 AI 生成 Logo 工具版块获取更多好用的工具:https://waytoagi.com/category/20 。 在第六期“一起做个 LOGO 吧”活动中,活动时间为 2024 年 6 月 9 日至 2024 年 6 月 16 日。活动目标包括探索制作 LOGO 方法、创造独特生成技巧、制作代表学习成果的作品。参与方式为使用 SD 等 AI 工具出图并将作品发送至 SD 学社微信群。会创建在线文档收集作品,6 月 16 日举行群内投票选出前三名,注意事项包括确保设计原创、允许作品公开展示以及在截止日期前提交。 在 AI 制作游戏 PV《追光者》中,故事背景创作阶段结合 chatGPT 发散制作游戏世界观,引导 ChatGPT 用分镜形式描述,使用 new bing 共创细致的故事分镜。生图阶段利用 ChatGPt 制作 midjourney 提示词工具,进入 midjourney 绘图包括制作 logo。还统一了 MJ 风格描述词,建立 AI 描述词模板,运用 midjourney 尝试制作不同风格 logo,最后用 PS 合成。
2025-02-26
我想知道ai学习路径
以下是为您提供的 AI 学习路径: 一、了解 AI 基本概念 建议阅读「」部分,熟悉 AI 的术语和基础概念,包括人工智能的定义、主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。同时,浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 二、开始 AI 学习之旅 在「」中,您可以找到为初学者设计的课程,特别推荐李宏毅老师的课程。您还可以通过在线教育平台(如 Coursera、edX、Udacity)按照自己的节奏学习,并争取获得证书。 三、选择感兴趣的模块深入学习 AI 领域广泛,涵盖图像、音乐、视频等。您可以根据自身兴趣选择特定模块深入学习,比如掌握提示词的技巧,这上手容易且实用。 四、实践和尝试 理论学习后,实践是巩固知识的关键。您可以尝试使用各种产品进行创作,知识库中也有很多实践后的作品和文章分享,欢迎您在实践后进行分享。 五、体验 AI 产品 与现有的 AI 产品互动,如 ChatGPT、Kimi Chat、智谱、文心一言等聊天机器人,了解其工作原理和交互方式,获得对 AI 实际应用表现的第一手体验。 六、技术研究方向 1. 数学基础:线性代数、概率论、优化理论等。 2. 机器学习基础:监督学习、无监督学习、强化学习等。 3. 深度学习:神经网络、卷积网络、递归网络、注意力机制等。 4. 自然语言处理:语言模型、文本分类、机器翻译等。 5. 计算机视觉:图像分类、目标检测、语义分割等。 6. 前沿领域:大模型、多模态 AI、自监督学习、小样本学习等。 7. 科研实践:论文阅读、模型实现、实验设计等。 七、应用方向 1. 编程基础:Python、C++等。 2. 机器学习基础:监督学习、无监督学习等。 3. 深度学习框架:TensorFlow、PyTorch 等。 4. 应用领域:自然语言处理、计算机视觉、推荐系统等。 5. 数据处理:数据采集、清洗、特征工程等。 6. 模型部署:模型优化、模型服务等。 7. 行业实践:项目实战、案例分析等。 无论是技术研究还是应用实践,数学和编程基础都是必不可少的。同时需要紧跟前沿技术发展动态,并结合实际问题进行实践锻炼。 希望以上内容对您有所帮助。
2025-02-26
AI 自动化和工作流编排有什么好的工具和方案
以下是一些关于 AI 自动化和工作流编排的工具和方案: 1. RPA 软件:很早就出现在工作流编排领域,目标是使基于桌面的业务流程和工作流程实现自动化,现在越来越多的 RPA 软件带上了 LLM。 2. ComfyUI:将开源绘画模型 Stable Diffusion 进行工作流化操作模式,用户在流程编辑器中配置 pipeline,通过不同节点和连线完成模型操作和图片生成,其 DSL 配置文件支持导出导入,提高了流程的可复用性,降低了时间成本。 3. Dify.AI:工作流设计语言与 ComfyUI 有相似之处,定义了一套标准化的 DSL 语言,方便使用导入导出功能进行工作流复用。 4. Large Action Model:采用“通过演示进行模仿”的技术,检查人们与界面的互动并模仿操作,从用户提供的示例中学习。 5. Auto GPT/Agent/Baby AGI:基于 GPT4 语言模型的开源应用程序,用户输入目标后可自主执行任务、递归地开发和调试代码。能用于自动化任务、创建自主的 AI 代理、完成各种任务等,访问地址为: 。 此外,在工作流编排中还涉及到一些概念和技术: 1. 短期记忆和长期记忆:短期记忆将所有的上下文学习看成是利用模型的短期记忆来学习;长期记忆通过外部的向量存储和快速检索来存储和召回信息。 2. 工具:学会调用外部不同类型 API 来获取模型缺少的额外信息、代码执行能力、访问专有信息源等。 3. 动作:大模型结合问句、上下文的规划、各类工具,最终决策出需要执行的动作。 4. Agentic Workflow 可以从提升效率、提高质量、节省时间的角度思考,通过将复杂任务分解成较小步骤,融入更多人类参与到流程中的规划与定义,减少对 Prompt Engineering 和模型推理能力的依赖,提高 LLM 应用面向复杂任务的性能。 但需要注意的是,Agentic Workflow 虽然美好,但使用的用户目前较少,可能是出现周期、工作流使用的上手难度等因素导致,并且在复杂流程上的开发并不是那么稳定可靠。
2025-02-26
那款工具提供了风格迁移
以下是一些提供风格迁移功能的工具: 1. Comfyui flatten 光流重绘:通过改变参数可生成不同视频效果。在使用中,如果遇到人物不能变化,可以加入对应的提示词增强和调整 cfg 的权重。负面提示词一般不填,由 Unsampler 完成。old_qk 参数控制生成过程中保留原始内容的程度,设置为 1 时更多保留原始内容,更贴合提示词;设置为 0 时允许更大变化。add_noise 有助于使用像 IPAdapter 这样的风格迁移工具,因为额外的噪声可提供更多变化空间,使风格转换更显著。采样器选择方面,dpmpp_2m 适合保持视频一致性,LCM(Latent Consistency Model)采样器更适合大幅度的场景改变。 2. 辅助工具:ICLight“重打光”: 体验链接: 控制网作者张吕敏刚放出来的大杀器:https://github.com/lllyasviel/ICLight 体验地址:https://huggingface.co/spaces/lllyasviel/ICLight 可以传一张图,选择光源位置,填上提示词,一张新的有光源角度的融合背景的图就产生了。 【Zho】做好了敏神刚放出的打光模型 ICLight 的 Colab 方案:https://colab.research.google.com/drive/1pXSpTHzNhaAKFmMvhxj7Zp9781L2f?usp=sharing 。敏神这些内容都是开源的,可以在各种 UI 里用(只要有人做插件就行),当然也可以自己做成产品加上自己的一些独门绝技放大、风格迁移、动态变化等。 3. 晨然提到的 IpAdapter:IpAdapter 是风格迁移神器,一张图就可以学到草图。但不建议 weight 开太高,否则生图颜色会太像参考图。noise 可以理解为对 Prompt 放行的程度,noise 越大,提示词的比例越大。
2025-02-25
PPT那款AI做的好
以下是一些好用的制作 PPT 的 AI 工具: 1. Gamma:在线 PPT 制作网站,可通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式,如 GIF 和视频,网址:https://gamma.app/ 2. 美图 AI PPT:由美图秀秀团队推出,通过输入简单文本描述生成专业 PPT 设计,包含丰富模板库和设计元素,适用于多种场合,网址:https://www.xdesign.com/ppt/ 3. Mindshow:AI 驱动的 PPT 辅助工具,提供智能设计功能,如自动布局、图像选择和文本优化等,网址:https://www.mindshow.fun/ 4. 讯飞智文:科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理技术,提供智能文本生成、语音输入、文档格式化等功能,网址:https://zhiwen.xfyun.cn/ 此外,还有以下相关的 PPT 生成工具(网站): 1. https://zhiwen.xfyun.cn/ 讯飞智文 2. http://Mindshow.fun Markdown 导入 3. http://kimi.ai 选 PPT 助手,暂时免费效果好 4. http://Tome.app ,AI 配图效果好 5. http://Chatppt.com ,自动化程度高 6. https://wenku.baidu.com ,付费效果好 AI 辅助 PPT 的原理和作用包括: 1. 减轻排版工作的压力。 2. 生成打底的内容,减轻人写内容的工作。例如文章生成 PPT 时,让 AI 帮忙摘要内容,生成大纲列表;主题生成 PPT 时,让 AI 根据主题扩充成大纲列表,乃至具体内容。在特定场景下,如学生快速为小组展示配 PPT 时,可能不用修改直接使用。 网站把 AI 输出的文本丢给 LLM,让其根据内容在已有的 UI 组件中选择更适合的组件,按时间线为每页 PPT 的文字选出整个 PPT 中每一页的 UI 组件。有的网站,如 tome、gamma,配图也是由 GenAI 根据页面内容生成的。呈现 AI 生成的 PPT 结果后,用户不满意可以自行选择模版。 WPS AI 也能对 PPT 大纲进行优化和二次修改。
2025-02-19
现在作为生产工具那款AI更好用?
目前,在生产力工具方面,不同的 AI 应用各有特点和优势。 周鸿祎认为,中国互联网在娱乐和生活应用上基本转到手机,但国外重视生产力工具,大小企业的生产力工具多基于 PC 和 SaaS 化。AI 作为生产力工具,在 PC 上使用可能更方便,且从隐私保护角度,大企业可能将大模型私有化并在 PC 上落地。同时,手机在生活和娱乐方面有优势,但未来手机商店模式可能改变。 有人分享了自己固定和优化的 AI 工作流,包括起床让 AI 排 TODO 优先级、工作中有傲娇 AI 小助理加油、重点事项由 bot 团队处理、优化 bot 以及将相关资产放入飞书知识库等,还提及了备选的生产力 AI 和未来的规划。 在 A16ZTOP 100 生成式 AI 应用中,生产力工具是引人注目的新类别,如 Liner、Eightify、Phind、MaxAI、Blackbox AI、Otter.ai、ChatPDF 等公司,它们通过内置功能帮助提高工作效率,且多依托 Google Chrome 浏览器扩展程序运行,未来有望与用户工作流程无缝对接并开发全新工作流程。 总之,选择哪款 AI 作为生产力工具更好用,取决于您的具体需求和使用场景。
2025-02-13
目前最好用的AI是那款
目前,在 AI 领域没有绝对意义上“最好用”的单一产品,不同的 AI 模型和工具在不同方面各有优势。 像 GPT4 这样的高级模型功能全面,还具备代码解释器等特色功能。Anthropic 公司开发的 Claude 3 Opus 在写作和深度洞察方面备受好评。Google 的 Gemini Advanced 擅长提供清晰的解释。 此外,国产的 Kimi 智能助手也是一个不错的选择,它不用科学上网、不用付费、支持实时联网,是国内最早支持 20 万字无损上下文的 AI,对长文理解表现出色。 在笔记本电脑方面,截止 2024 年 5 月,主流的 AI 笔记本电脑主要是一些专门为人工智能和深度学习设计的高性能移动工作站。一些知名品牌包括微软第 11 代 Surface Pro、微星 Creator/Workstation 系列、技嘉 Aero/Aorus 系列、戴尔 Precision 移动工作站、惠普 ZBook 移动工作站、联想 ThinkPad P 系列等。这些笔记本通常配备强大的 GPU(如 NVIDIA RTX 系列)、大容量内存和高速固态硬盘,还预装了相关深度学习框架和开发工具,但价格相对较高,通常在 2000 美元以上,用户可根据自身需求和预算选择合适型号,并关注散热、续航等实际使用体验。 需要注意的是,以上内容由 AI 大模型生成,请仔细甄别。
2025-02-03
请问有那款ai是能通过Lisp 语言实现一些输出操作的呢?
以下是一些能够通过 Lisp 语言实现输出操作的 AI 示例: 在“AI‘词生卡’的蝴蝶效应:从文字到视觉盛宴跨界蝶变”中提到,古早的 Lisp 语言在 Claude3.5 强大的理解力和绘图支持下焕发了新生,制造了新卡。 在“艾木:提示词编程|有必要用 Lisp 语言写提示词吗?”中,将提示词用 Lisp 语言编写后丢给 Claude,例如输入文本,Claude 大概率会直接输出 SVG 代码。但对于复杂的函数调用,大语言模型处理起来较困难。
2025-01-23
那款搜索ai最好用
以下是一些好用的 AI 搜索引擎推荐: 1. 必应:通常是付费选项中的最佳选择。对于儿童,可汗学院的 Khanmigo 提供由 GPT4 驱动的良好的人工智能驱动辅导。 2. 秘塔 AI 搜索:由秘塔科技开发,提供多模式搜索、无广告干扰、结构化展示和信息聚合等功能,旨在提升用户的搜索效率和体验。 3. Perplexity:一款聊天机器人式的搜索引擎,允许用户用自然语言提问,使用生成式 AI 技术从各种来源收集信息并给出答案。 4. 360AI 搜索:360 公司推出的 AI 搜索引擎,通过 AI 分析问题,生成清晰、有理的答案,并支持增强模式和智能排序。 5. 天工 AI 搜索:昆仑万维推出的搜索引擎,采用生成式搜索技术,支持自然语言交互和深度追问,未来还将支持图像、语音等多模态搜索。 6. Flowith:一款创新的 AI 交互式搜索和对话工具,基于节点式交互方式,支持多种 AI 模型和图像生成技术,提供插件系统和社区功能。 7. Devv:面向程序员的 AI 搜索引擎,专注于提供编程、软件开发和人工智能等领域的专业建议和指导。 8. Phind:专为开发者设计的 AI 搜索引擎,利用大型语言模型提供相关的搜索结果和动态答案,特别擅长处理编程和技术问题。 需要注意的是,在使用人工智能作为搜索引擎时,存在幻觉的风险,大多数人工智能没有连接到互联网。在某些情况下,如技术支持、决定在哪里吃饭或获得建议,必应通常比谷歌更好。这是一个正在迅速发展的领域,使用时应小心。
2024-12-30
静态图片如何通过ai生成动图
以下是将静态图片生成动图的两种方法: 方法一:使用 LivePortrait 1. LivePortrait 可以精确控制眼睛和嘴唇的动作,还能无缝拼接多个肖像,将不同人物特征合并成一个视频,确保过渡自然流畅。 2. 它使用了一种不同于主流扩散方法的隐式关键点框架,在计算效率和可控性之间取得了有效的平衡。生成的动画质量优于现有的非扩散和扩散模型方法。在 RTX 4090 GPU 上,生成速度为每帧 12.8 毫秒,效率显著高于现有的扩散模型。 3. 支持各种风格的图片,常见的动物面部迁移,并可以微调面部运动幅度。 4. 工作流与模型地址: https://pan.baidu.com/s/1FkGTXLmM0Ofynz04NfCaQ?pwd=cycy https://pan.quark.cn/s/8dfd7ace4f05 5. 教程: 在 comfyui 里使用工作流、模型:https://pan.baidu.com/s/1FkGTXLmM0Ofynz04NfCaQ?pwd=cycy 安装包解压即用链接:https://pan.baidu.com/s/1fh9vvLk8OHuIlCJxD7jiBg?pwd=282n 提取码:282n 项目地址:https://github.com/KwaiVGI/LivePortrait 节点地址:https://github.com/kijai/ComfyUILivePortraitKJ 方法二:使用星流一站式 AI 设计工具的图生图功能 1. 图生图功能允许用户上传一张图像,并基于该图像生成新的视觉内容。 2. 应用图生图: prompt 输入框下,点击“图生图”上传本地文件。 无限画布中,在图片功能区进行选择。 3. 调整“图生图”功能区参数: 参考程度: 更像原图:小幅度修改基底图像,有限的增加元素。 更创意:大幅度修改基底图像,可搭配增强模型加入更多的元素。 自定义:可自定义修改重绘幅度。 增加参考纬度:点击添加按钮,会自动的应用并打开“生成器”的图片参考功能。 替换图像:鼠标滑动到图像,点击“选择参考图”即可重新选择图片。 转换提示词:反推参考图信息填入进提示词框中。 同步生图尺寸:同步参考图尺寸到“生成器”的生图尺寸中。
2025-01-20
静态图生成动态图的工具有吗
以下是一些可以将静态图生成动态图的工具: 1. Comfyui LivePortrait: 可以精确控制眼睛和嘴唇的动作,无缝拼接多个肖像,将不同人物特征合并成一个视频,确保过渡自然流畅。 使用了不同于主流扩散方法的隐式关键点框架,在计算效率和可控性之间取得有效平衡。 生成的动画质量优于现有的非扩散和扩散模型方法,在 RTX 4090 GPU 上,生成速度为每帧 12.8 毫秒。 支持各种风格的图片,常见的动物面部迁移,并可以微调面部运动幅度。 工作流与模型地址: https://pan.baidu.com/s/1FkGTXLmM0Ofynz04NfCaQ?pwd=cycy https://pan.quark.cn/s/8dfd7ace4f05 内容依技术发展更新,请以文档为准 https://xiaobot.net/post/74238a84d2734b2ca195ed2858b24ffe 2. 视频工具 VIGGLE: Mix(让视频的动作映射到图片人物身上):先上传一个视频和一张角色图像,Viggle 会自动将视频的动态赋予给这个角色,形成一段新视频。能模拟出角色的 3D 状态,准确还原处理原视频中身体旋转、四肢交叠等动作。(也可以利用现有的模版视频作为动作获取来源) Multi(多人模式):通过视频的动作,将上传的多个角色进行识别并赋予给这个角色,形成一段新视频。 Move(将视频的动作直接映射在图片人物身上):不同于 Mix 的图片元素替换原视频内容,Move 主要是通过将动作映射在图像里面的人物身上,实现“让静态图动起来”。 案例: 评价: :https://x.com/imxiaohu/status/1771173928591093940 兄弟们,又出来个牛 P 玩意阿里那个被截胡了,这个直接能用可以直接通过文字描述让任何静态图动起来,而且能做各种动作,跳舞什么的都是小 case...最牛 P 的是,他们的模型能能理解真实世界的物理运动原理,所以出来的视频很真实。不仅如此,它还能直接文字生成视频,进行各种角色混合和动作替换...其核心技术基于 JST1 模型。JST1 是首个具有实际物理理解能力的视频3D 基础模型,能够根据用户的需求,让任何角色按照指定的方式进行运动。核心功能: 可控制的视频生成:用户可以通过文字描述指定角色的动作和场景的细节,Viggle 将根据这些指示生成视频。 基于物理的动画:JST1 模型的一个显著特点是其对物理原理的理解,这意味着生成的视频不仅看起来真实,而且角色的动作和互动符合实际物理规律。这提高了视频的质量和真实感。 3D 角色和场景创建:Viggle 不仅限于传统的 2D 视频制作,它还能够创建 3D 角色和场景。
2025-01-11
如何把静态的图片动起来
以下是一些可以将静态图片动起来的方法和工具: 1. 使用 VIGGLE 工具: Mix 模式:先上传一个视频和一张角色图像,Viggle 会自动将视频的动态赋予给这个角色,形成新视频。它能模拟出角色的 3D 状态,准确还原身体旋转、四肢交叠等动作,也可以利用现有的模版视频作为动作获取来源。 Multi 模式:通过视频的动作,将上传的多个角色进行识别并赋予动作,形成新视频。 Move 模式:将视频的动作直接映射在图片人物身上,实现“让静态图动起来”。 案例:,结合 Midjourney 制作图片。 2. LiveSketch:为素描“注入生命”,通过文本提示将静态素描动画化。 应用场景:FlipaClip 提供的服务方向+LiveSketche 可更便捷生成动画;简笔画替换成骨骼图+controlnet+帧图可生成动态漫;简笔画替换成骨骼图+runway 控制可生成动态视频。 技术特点:能够将单一主题的静态素描转换成动画,用户只需提供描述所需动作的文本提示,系统就会生成短动画。通过修改描述运动的提示文本,还可以控制生成结果的程度。 3. 使用 Camera Motion: 上传图片:点击“AddImage”上传图片。 输入提示词:在“Prompt”中输入提示词。 设置运镜方向:选择想要的运镜方向,输入运镜值。 设置运动幅度:运动幅度和画面主体运动幅度有关,与运镜大小无关,可设置成任意值。 其它设置:选择好种子(seed),是否高清(HD Quality),是否去除水印(Remove Watermark)。 生成视频:点击“create”生成视频。
2024-12-03
静态动物图片,生成说话视频
以下是一些能够将静态动物图片生成说话视频的技术和相关信息: VividTalk:单张照片和一段音频可生成看似真实的说话视频,支持多种语言和风格,如真实和卡通风格,由南京大学、阿里巴巴、字节跳动和南开大学合作开发。链接:https://x.com/xiaohuggg/status/1732026172509421697?s=20 腾讯 AniPortrait:根据音频和静态人脸图片生成逼真的动态视频,支持多种语言、面部重绘、头部姿势控制,比阿里 EMO 项目先开源。链接:https://github.com/ZejunYang/AniPortrait 、https://arxiv.org/abs/2403.17694 、https://x.com/imxiaohu/status/1772965256220045659?s=20
2024-11-13
最新的AI行业动态和进展有哪些,包含2025年
以下是关于最新的 AI 行业动态和进展(包含 2025 年)的内容: 2024 年: 图片超短视频的精细操控:包括表情、细致动作、视频文字匹配。 有一定操控能力的生成式短视频:风格化、动漫风最先成熟,真人稍晚。 AI 音频能力长足进展:带感情的 AI 配音基本成熟。 “全真 AI 颜值网红”出现,可以稳定输出视频,可以直播带货。 游戏 AI NPC 有里程碑式进展,出现新的游戏生产方式。 AI 男/女朋友聊天基本成熟:记忆上有明显突破,可以较好模拟人的感情,产品加入视频音频,粘性提升并开始出圈。 实时生成的内容开始在社交媒体内容、广告中出现。 AI Agent 有明确进展,办公场景“AI 助手”开始有良好使用体验。 AI 的商业模式开始有明确用例:数据合成、工程平台、模型安全等。 可穿戴全天候 AI 硬件层出不穷,虽然大多数不会成功。 中国 AI 达到或超过 GPT4 水平;美国出现 GPT5;世界上开始现“主权 AI”。 华为昇腾生态开始形成,国内推理芯片开始国产替代(训练替代要稍晚)。 AI 造成的 DeepFake、诈骗、网络攻击等开始进入公众视野,并引发担忧。 AI 立法、伦理讨论仍然大规模落后于技术进展。 2025 2027 年: AI 3D 技术、物理规则成熟:正常人无法区别 AI 生成还是实景拍摄。 全真 AI 虚拟人成熟:包含感情的 AI NPC 成熟,开放世界游戏成熟;游戏中几乎无法区别真人和 NPC。 AR/VR 技术大规模商用。 接近 AGI 的技术出现。 人与 AI 配合的工作方式成为常态,很多日常决策开始由 AI 来执行。 AI 生产的数据量超过全人类生产数据量,“真实”成为稀缺资源。 具身智能、核聚变、芯片、超导、机器人等技术有明显进展突破。 “人的模型”出现,出现“集中化 AGI”与“个人 AGI”的历史分叉。 AI 引发的社会问题开始加重,结构性失业开始出现。 AGI 对于地缘政治的影响开始显露。 此外,还有以下相关动态: 算力瓶颈不只是单纯的技术和建设问题,而是影响整个行业竞争格局的重要变量。 逐渐进入多模态灵活转换的新时代,实现文本、图像、音频、视频及其他更多模态之间的互相理解和相互转换。 人类劳动形式逐步“软件化”,复杂劳动被抽象为可调用的软件服务,劳动流程被大幅标准化和模块化,劳动能力像“即插即用”的工具一样易于获取。 AI 行业目前仍处于严重亏损的阶段,商业化进程仍有巨大提升空间。 云厂商是产业链中毋庸置疑的“链主”。 2024 年,头部 AI 应用的品类变化并不显著。创意工具(如图像和视频内容创作)依然占据最大比重。To P(面向专业用户)应用展现出强大的市场潜力,ToB(面向企业)应用发展路径相对复杂,ToC 应用面临较大的挑战。 在 AI 应用领域,Copilot 和 AI Agent 是两种主要的技术实现方式。 北美和欧洲贡献了 AI 移动应用市场三分之二的份额,众多中国 AI 公司积极出海。 2024 年 10 月的大事记包括: Gartner 发布 2025 年十大战略技术趋势。 DeepSeek 开源多模态 LLM 框架 Janus。 司南开源大模型能力评估模型 CompassJudger。 Anthropic 发布新功能 computer use,发布 Claude 3.5 Haiku,更新 Claude 3.5 Sonnet。 Stability AI 发布 Stable Diffusion 3.5。 x.AI 正式推出 API。 ComfyUI V1 官方桌面版开放内测。 华为发布纯血操作系统鸿蒙 OS NEXT。 Jina AI 推出高性能分类器 Classifier API。 OpenAI 发布图像生成模型 sCM。 Midjourney 上线外部图片编辑器。 Runway 发布动画视频功能 ActOne。 Ideogram 推出 AI 画板工具 Canvas。 Genmo 开源视频生成模型 Mochi 1。 荣耀发布操作系统 MagicOS 9.0。 美国 14 岁少年与 C.AI 聊天后离世。 新华社发文表示警惕「AI 污染」乱象。 港中文&趣丸推出 TTS 模型 MaskGCT。 科大讯飞发布讯飞星火 4.0 Turbo。 阿里通义代码模式开始内测。 Anthropic Claude 新增数据分析功能。 北京市大中小学推广 AI 学伴和 AI 导学应用。 稚晖君开源「灵犀 X1」全套资料。 OpenAI 高管 Miles Brundage 离职。
2025-02-17
最新的AI行业动态和进展有哪些
以下是最新的 AI 行业动态和进展: 1. 《2024 年度 AI 十大趋势报告》发布,其中提到大模型创新方面,架构优化加速涌现,融合迭代大势所趋;Scaling Law 泛化方面,推理能力成皇冠明珠,倒逼计算和数据变革;AGI 探索方面,视频生成点燃世界模型,空间智能统⼀虚拟和现实;AI 应用格局方面,第⼀轮洗牌结束,聚焦 20 赛道 5 大场景;AI 应用竞争方面,多领域竞速运营大于技术,AI 助手兵家必争;AI 应用增长方面,AI+X 赋能类产品大干快上,原生 AI 爆款难求;AI 产品趋势方面,多模态上马,Agent 席卷⼀切,高度个性化呼之欲出;AI 智变千行百业,左手变革生产力,右手重塑行业生态;AI 行业渗透率方面,数据基础决定初速度,用户需求成为加速度;AI 创投方面,投融资马太效应明显,国家队出手频率提升。 2. 2024 年 9 月的 AI 行业大事记: 9 月 12 日:李继刚再现神级 Prompt,玩法持续翻新;Mistral 发布首个多模态模型 Pixtral 12B。 9 月 13 日:商汤 Vimi 相机开放微博小程序;元象开源中国最大 MoE 大模型 XVERSEMoEA36B;OpenAI 发布 o1 模型。 9 月 14 日:人工智能生成合成内容标识办法(征求意见稿);Jina AI 发布 ReaderLM 和 Jina Embeddings V3。 9 月 18 日:DeepSeek 发文庆祝登上 LMSYS 榜单国产第一,几小时后 Qwen 新模型表示不服。 9 月 19 日:云栖大会;通义万相 AI 生视频上线;快手可灵 1.5 模型新增运动笔刷能力。 9 月 20 日:腾讯元器智能体对外发布;秘塔科技产品经理 JD 走红 AI 圈;阶跃跃问接入 Step2 万亿参数 MoE 语言大模型。 9 月 21 日:大模型测试基准研究组正式成立。 9 月 23 日:钉钉 365 会员上线。 9 月 24 日:讯飞星火 API 全新升级;豆包大模型全系列发布&更新。 9 月 25 日:Vidu API 正式开放,加速企业级视频创作;OpenAI 发布高级语音功能;西湖心辰开源 WestlakeOmni。 3. 2024 年,国内 AI 行业融资总金额增加,但事件数同比下降,马太效应越发明显,资本更青睐热点和高成熟度赛道。智能驾驶在各细分赛道中独占鳌头,AI+教育、AI+游戏、AI+医疗等赛道投资总额也有增长。政府积极推进 AI 原生行业发展,北京、上海、武汉等城市出台系列政策吸引人才和企业,国家队频繁投资体现政策支持。
2025-02-17
最新的AI行业动态和进展有哪些
以下是最新的 AI 行业动态和进展: 1. 《2024 年度 AI 十大趋势报告》发布,其中提到: 大模型创新方面,架构优化加速涌现,融合迭代大势所趋。 Scaling Law 泛化,推理能力成皇冠明珠,倒逼计算和数据变革。 AGI 探索中,视频生成点燃世界模型,空间智能统⼀虚拟和现实。 AI 应用格局方面,第一轮洗牌结束,聚焦 20 赛道 5 大场景。 AI 应用竞争中,多领域竞速运营大于技术,AI 助手兵家必争。 AI 应用增长方面,AI+X 赋能类产品大干快上,原生 AI 爆款难求。 AI 产品趋势为多模态上马,Agent 席卷一切,高度个性化呼之欲出。 AI 智变千行百业,左手变革生产力,右手重塑行业生态。 AI 行业渗透率方面,数据基础决定初速度,用户需求成为加速度。 AI 创投方面,投融资马太效应明显,国家队出手频率提升。 2. 2024 年 9 月的 AI 行业大事记: 9 月 12 日:李继刚再现神级 Prompt,玩法持续翻新;Mistral 发布首个多模态模型 Pixtral 12B。 9 月 13 日:商汤 Vimi 相机开放微博小程序;元象开源中国最大 MoE 大模型 XVERSEMoEA36B;OpenAI 发布 o1 模型。 9 月 14 日:人工智能生成合成内容标识办法(征求意见稿);Jina AI 发布 ReaderLM 和 Jina Embeddings V3。 9 月 18 日:DeepSeek 发文庆祝登上 LMSYS 榜单国产第一,几小时后 Qwen 新模型表示不服。 9 月 19 日:云栖大会;通义万相 AI 生视频上线;快手可灵 1.5 模型新增运动笔刷能力。 9 月 20 日:腾讯元器智能体对外发布;秘塔科技产品经理 JD 走红 AI 圈;阶跃跃问接入 Step2 万亿参数 MoE 语言大模型。 9 月 21 日:大模型测试基准研究组正式成立,国家队来了。 9 月 23 日:钉钉 365 会员上线。 9 月 24 日:讯飞星火 API 全新升级;豆包大模型全系列发布&更新。 9 月 25 日:Vidu API 正式开放,加速企业级视频创作;OpenAI 发布高级语音功能;西湖心辰开源 WestlakeOmni。 3. 从行业视角来看,2024 年国内 AI 行业融资总金额增加,但事件数同比下降,马太效应越发明显,资本更青睐热点和高成熟度赛道。智能驾驶在各细分赛道中独占鳌头,AI+教育、AI+游戏、AI+医疗等赛道投资总额也有增长。在政策方面,政府积极推进 AI 原生行业发展,北京、上海、武汉等城市出台系列政策吸引人才和企业,国家队频繁出手投资体现政策支持。
2025-02-17
想在手机上通过宠物照片给宠物建模,是宠物可以有一些动态性,需要怎么做?利用 AIGC 能快速的实现吗?
在手机上通过宠物照片给宠物建模并实现一定的动态性,可以考虑以下几种方式: 1. 利用 3D 引擎:目前有一些公司提供通过手机摄像头快速创建虚拟人身体的服务,例如 NextHuman。不过,3D 引擎在拟真程度高的同时,定制化成本也较高。 2. 借助 AIGC:虽然 AIGC 省去了建模流程,能直接生成数字人的展示图片,但可能存在数字人难以保持 ID 一致性、帧与帧连贯性不佳等问题。典型的相关项目有 wav2lip等。但需要注意的是,如果对模型真实度要求较高,AIGC 方式可能不太理想,因为算法发展很快,未来可能会有更好的连贯度生成方式。 目前利用 AIGC 来快速实现可能存在一些挑战,但随着技术的发展,未来有可能更便捷高效地达成您的需求。
2025-02-13
AI的最新动态
以下是 AI 的一些最新动态: 《2024 年度 AI 十大趋势报告》发布,其中包括大模型创新,架构优化加速涌现,融合迭代大势所趋;Scaling Law 泛化,推理能力成皇冠明珠,倒逼计算和数据变革;AGI 探索,视频生成点燃世界模型,空间智能统⼀虚拟和现实;AI 应用格局,第⼀轮洗牌结束,聚焦 20 赛道 5 大场景;AI 应用竞争,多领域竞速运营大于技术,AI 助手兵家必争;AI 应用增长,AI+X 赋能类产品大干快上,原生 AI 爆款难求;AI 产品趋势,多模态上马,Agent 席卷⼀切,高度个性化呼之欲出;AI 智变千行百业,左手变革生产力,右手重塑行业生态;AI 行业渗透率,数据基础决定初速度,用户需求成为加速度;AI 创投,投融资马太效应明显,国家队出手频率提升。 对于新手学习 AI,要持续学习和跟进,AI 是快速发展的领域,新的研究成果和技术不断涌现。关注 AI 领域的新闻、博客、论坛和社交媒体,保持对最新发展的了解。考虑加入 AI 相关的社群和组织,参加研讨会、工作坊和会议,与其他 AI 爱好者和专业人士交流。 《2024 年度 AI 十大趋势报告》从技术、产品、行业三个维度勾勒 AI 现状、展望未来走势。区别于其他智库和研究机构,量子位智库基于长期理解把握和深厚积淀,持续跟踪领域在产学研届的创新、洗牌、动态,结合对近百家初创公司、研究院、投资机构的深度交流。报告不仅深入剖析前沿科技如何迭代技术能力、重塑商业版图、引领产业升级,还敏锐洞察变革趋势,对未来路径进行前瞻性展望。该报告得到了产学研领域众多机构的支持。
2025-02-04
我怎么知道ai的最新发展动态
以下是了解 AI 最新发展动态的一些方法: 1. 持续学习和跟进:AI 是快速发展的领域,新的研究成果和技术不断涌现。您可以关注 AI 领域的新闻、博客、论坛和社交媒体,保持对最新发展的了解。 2. 加入相关社群和组织:考虑加入 AI 相关的社群和组织,参加研讨会、工作坊和会议,与其他 AI 爱好者和专业人士交流。 3. 阅读权威报告:例如《2024 年度 AI 十大趋势报告》,此类报告通常会从技术、产品、行业等多个维度呈现 AI 的现状和未来走势,深入剖析前沿科技如何迭代技术能力、重塑商业版图、引领产业升级,并对未来路径进行前瞻性展望。 4. 关注权威媒体和学者:关注 AI 领域的权威媒体和学者,了解 AI 技术的最新进展,思考 AI 技术对未来社会的影响,培养对 AI 的思考和判断能力。
2025-01-29