Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

多图生成视频方案

Answer

以下是关于多图生成视频的几种方案:

  1. 方法一:
    • 利用 MJ 画图,先画出来一张想要的底图。
    • 使用 InsightFaceSwap 这个插件来换脸或者让脸部更像,但因该插件对多人脸部同时处理效果不好,所以先需要进行图片的分割裁剪,分别利用插件处理后,再把图片重新缝合。
    • 最后利用可灵或者其他软件来让图片动起来。
  2. 方法二:
    • 直接在网上寻找能够融合两张照片的软件或者项目,直接对图片进行融合。如果没有,就纯 P 图,然后利用图生视频的项目完成内容。
  3. 利用现有的知识和工具,如具备 DiT(能够进行图片生成),把视频生成看作独立的图片生成,使用 DiT 生成多帧图片然后串起来就是视频,但这样可能会导致生成的多帧图像不连贯。
  4. 使用视频工具 VIGGLE:
    • Mix 模式:先上传一个视频和一张角色图像,Viggle 会自动将视频的动态赋予给这个角色,形成一段新视频,能模拟出角色的 3D 状态,准确还原复杂动作。
    • Multi 模式:通过视频的动作,将上传的多个角色进行识别并赋予动作,形成一段新视频。
    • Move 模式:将视频的动作直接映射在图片人物身上,实现“让静态图动起来”。

您可以根据实际需求和操作难度选择适合您的方案。

Content generated by AI large model, please carefully verify (powered by aily)

References

AI 带你穿越时空,去拥抱儿时的自己

需求分析方法一方法二总结[heading2]一、需求分析[content]其实关于现在的图转视频,很容易做到让图片中的人物动起来,甚至做一些互动性的动作。不只是可灵很多图转视频的软件都可以做到。所以关键点其实是怎么让AI把两张照片更好的结合起来。那我们现在来思考下怎么样实现这个需求,其实一下子就想到了大概两种做法。下面我们分别尝试一下,看看效果。[heading3]一)方法一[content]利用MJ画图,先画出来一张想要的底图。然后使用InsightFaceSwap这个插件来换脸或者说让脸部更像。但是因为这个插件对多人脸部同时处理的效果并不好,所以我们先需要进行图片的分割裁剪,分别利用插件处理后,再把图片重新缝合。最后利用可灵或者其他软件来让图片动起来。流程如下[heading3]二)方法二[content]这个方法必要依赖于现有的项目,就是直接在网上寻找有没有直接能够融合两张照片的软件或者项目。直接对图片进行融合。如果没有那就是纯P图了...然后利用图生视频的项目完成内容。因为这个没什么操作感~我们先放在后面,大家想要简单点的处理办法可以直接翻到后面。

Sora的前世今生:从文生图到文生视频

假如我们具备前面的知识了,或者说给你一个DiT(能够进行图片生成),如何能够实现视频的生成呢?视频的每一帧(frame)本质上就是一张图片。在视频播放时,这些连续的图片以一定的速率(帧率,通常以每秒帧数FPS表示)快速播放,由于人眼的视觉暂留效应,这些连续的静态图片在观众眼中形成了动态效果,从而产生了视频的流畅运动感。那要实现视频生成是不是可以看作是多帧图片的生成,因此最low的做法就是把视频生成看作独立的图片生成,使用DiT生成多帧图片然后串起来就是视频了。当然,这样做的问题显然很大,因为没有考虑视频不同帧图片之间的关联,可能会导致生成的多帧图像很不连贯,串起来看就不像是视频了。

视频工具:VIGGLE

先上传一个视频和一张角色图像,Viggle会自动将视频的动态赋予给这个角色,形成一段新视频。而且Viggle并非只能生成简单的正面动作,它能模拟出角色的3D状态,这样即使原视频中有身体旋转、四肢交叠等动作,Viggle也能准确进行还原处理。(也可以利用现有的模版视频作为动作获取来源)[heading2]2、Multi(多人模式)[content]同样通过视频的动作,将上传的多个角色进行识别并赋予给这个角色,形成一段新视频。[heading2]3、Move(将视频的动作直接映射在图片人物身上)[content]不同于Mix的图片元素替换原视频内容,Move主要是通过将动作映射在图像里面的人物身上,实现“让静态图动起来”。[heading2]案例:[content][Rane.m4v](https://bytedance.feishu.cn/space/api/box/stream/download/all/Y26ybfOKGo7K3JxVfQScWmaCnre?allow_redirect=1)结合Midjourney制作图片再

Others are asking
有哪些可以多图融合的图片生成AI工具
以下是一些可以多图融合的图片生成 AI 工具: 1. Google Whisk:支持多主体一致,包括主题、场景和风格等元素。用户上传多张图片后,Gemini 模型会自动为图片生成详细描述,并将其输入到最新版本的 Imagen 3 模型中。生成的图片在遵循提示词的同时,与给定的多个主体能保持一致。网站:https://www.vidu.cn 教程:https://pkocx4o26p.feishu.cn/docx/Mb77dt8VxoskqvxgFiMcfwwsnNe 发布:https://x.com/pika_labs/status/1867651381840040304 国内:https://hailuoai.com/video/create 海外:https://hailuoai.video/create 网站:https://labs.google/fx/tools/whisk 发布:https://blog.google/technology/googlelabs/whisk 2. Vidu:2024 年 9 月发布时只支持单主体一致(只能上传一张图片),目前官网已经支持多主体一致(可以上传三张图片),即可以指定生成图片中的人物、物体、场景等。 3. Pika 2.0:支持多主体一致,Scene Ingredient(场景元素)系统能将多个输入图像(如场景、人物、物品)智能整合为连贯的动态场景。此外,模型也具备多图像融合能力,可实现复杂交互场景的视频合成,如两人在视频中实现合影或拥抱。 在进行图片融合时,有一些技巧: 1. 上传多种图片进行融合生成时,一张图片最好只有一种特征,比如合并 2 张图,一张是有人物,另一张是只有背景,那么合并起来的效果会更精确。 2. 写普通关键词时用逗号分开,还可以写多重关键词,让 AI 不需要考虑单词的前后关系,而只把它们当成独立的单词。也可以给不同的单词赋予不同的权重,比如 hot::2 dog,这样 hot 这个词对结果的影响更大。有增加权重,也可以减弱权重,比如在关键词后面加上 red::.5,大红色就会少很多。 3. 除了用数值降低某个元素的权重,还可以直接用no 这个参数让某个元素尽量弱化,比如no hands 跟 hands:0.5 是等价的。
2025-02-25
视频拍摄中如何用更准确的提示词
在视频拍摄中,以下是一些更准确的提示词使用技巧: 1. 清晰定义动作:如果想让视频中包含角色的动作,用具体的动词和副词来描述,如奔跑、飞翔、游泳或跳舞,并包含动作的速度,如缓慢、快速或逐渐。示例提示词:“一只狗欢快地在海滩上冲刺,跃起接住空中的球。” 2. 使用描述性形容词:准确传达视频的氛围至关重要,使用能唤起想要传达的感觉的形容词,如宁静、神秘或充满活力。示例提示词:“海滩上一个宁静、雾蒙蒙的早晨,柔和的阳光透过沙滩椅洒下。” 3. 提供背景故事或上下文:对于更复杂的视频项目,融入特定的情节元素或角色,提供背景或上下文有助于生成连贯且引人入胜的视频序列。 4. 使用相机角度和运动:Firefly 通常可以模拟真实世界的摄像工作,通过指定希望相机采用的角度或运动,如推镜头、拉镜头、平移、倾斜、固定镜头,为视频增添个性化的触感。 不同的视频模型和工具在提示词方面也有各自的特点: 1. Vidu 模型:其 Prompt 基本构成包括主体/场景、场景描述、环境描述、艺术风格/媒介。要调整句式和语序,避免主体物过多/复杂、主体物分散的句式描述,避免模糊的术语表达,使用更加流畅准确的口语化措辞,丰富、准确和完整的描述才能生成特定艺术风格、满足需求的视频。 2. 星流一站式 AI 设计工具:在其 prompt 输入框中可以输入提示词、使用图生图功能辅助创作。提示词用于描绘想要的画面,输入语言方面,星流通用大模型与基础模型 F.1、基础模型 XL 使用自然语言,基础模型 1.5 使用单个词组,支持中英文输入。写好提示词要做到内容准确,包含人物主体、风格、场景特点、环境光照、画面构图、画质等。还可以调整负面提示词,利用“加权重”功能让 AI 明白重点内容,使用辅助功能如翻译、删除所有提示词、会员加速等。
2025-02-26
有没有制作机器人的详细视频?
以下为您提供一些制作机器人相关的视频资源: Adobe MAX 2024 全球创意大会:一个可爱的机器人举着一颗红色发光心形,电影般逼真的详细镜头。灯光绚丽,阳光明媚,机器人脸上有斑驳的灯光,背光强烈。逼真的细节和纹理。色彩等级梦幻、阳光、温暖的色调。浅景深。胶片颗粒。用 35 毫米胶片拍摄。阳光透过窗户轻轻地照进来,营造出一种微妙而空灵的氛围。前景中失焦的绿色植物。慢动作,轻柔的动作。相机静止且锁定。 扣子案例合集 社区内容分享: 【Agent 共学第二期】制作一个新闻鉴别相关的 bot:https://www.bilibili.com/video/BV1QJ4m1M7ti/ 用 Coze 搭建智能机器人并挖掘销售线索:https://wap.peopleapp.com/video/rmh41227880/rmh41227880 coze 实战系列(一)| 天天小管家:https://www.bilibili.com/video/BV1nRMQexER7/ 毕业加速器:如何用 AI 爆肝论文?:https://www.bilibili.com/video/BV12z421m7YV 不写代码,如何用 Coze 做专属的对话机器人:https://www.bilibili.com/video/av1603694358 用 coze 一键生成朋友圈文案:https://www.xiaohongshu.com/explore/65c1d0ae000000001100d442 COZE:中小企业均可 0 门槛创建业务 agent,支持接入微信公众号、微信客服、discord、tele 等各种终端,实现公司 AI 客服、销售机器人等触达客户:https://www.bilibili.com/video/BV1DA4m1w72p/ 【Agent 共学第二期】许键分享|拆解“离谱村捏剧本”coze bot 思路:https://www.bilibili.com/video/BV1Cx4y1n7yU/ 【Agent 共学第二期】银海分享|用 AI 重塑我的工作流:https://www.bilibili.com/video/BV1sr421L7Hj/ 【Agent 共学第二期】大家一起捏 Bot,Coze 作品分享会:https://www.bilibili.com/video/BV1hT421v7YD/ 工具教程:morphstudio Morphstudio 官方 discord 使用教程 MorphVideo 机器人的使用: 文生视频:提示词指令:/video。举例:/video 你好世界比例 16:9动作幅度为 5镜头拉近每秒 30 帧秒数为 5 秒 Morph 机器人的使用: 图生视频:提示词指令:/animate 参数说明: ar(只针对 MorphVideo 机器人):这个参数用来设置视频的画面比例(比如 16:9,4:3,1:1,3:4,9:16)。 motion:这个参数用来调整视频中的运动强度。数值越低,运动越微妙,数值越高,运动越夸张。 camera:这个参数用来控制摄像头移动。Zoom:镜头拉近/拉远;Pan:摄像机向上/向下/向左/向右移动;Rotate:相机顺时针旋转或逆时针旋转;Static:相机静态。 fps:视频的帧率是指每秒钟播放的图片帧数。默认的帧率是每秒 24 帧。 s(只针对 MorphVideo 机器人):设置视频的时长,单位是秒。 提示:使用更加详细和描述性的提示可能会导致您生成的视频效果更好。可以试着调整不同的设置来达到想要的效果!
2025-02-26
国内的AI做视频工具
以下是一些国内的 AI 做视频工具: 1. Hidreamai(国内,有免费额度) 网址:https://hidreamai.com//AiVideo 支持文生视频、图生视频。 提示词使用中文、英文都可以。 文生视频支持正向提示词、反向提示词、运镜控制、运动强度控制,支持多尺寸,可以生成 5s 和 15s 的视频。 2. ETNA(国内) 网址:https://etna.7volcanoes.com/ 由七火山科技开发的文生视频 AI 模型,能根据用户简短的文本描述生成相应的视频内容。 生成的视频长度在 8 15 秒,画质可达 4K,最高 38402160,画面细腻逼真,帧率 60fps。支持中文,有时空理解。 3. Dreamina(国内内测,有免费额度) 网址:https://jimeng.jianying.com/aitool/video/generate 支持文生视频、图生视频,视频生视频。 支持图生视频首尾帧功能。 提示词使用中文、英文都可以。 文生视频支持正向提示词、运镜控制、运动强度控制、帧数选择,支持 16:9、9:16、1:1、3:4、4:3 尺寸。 图生视频、视频生视频除尺寸不可选外,其他与文生视频基本相同。默认生成 3s 的视频。 4. 可灵(免费) 网址:https://klingai.kuaishou.com/ 支持文生视频、图生视频。 支持图生视频首尾帧功能。 提示词可使用中文。 文生视频支持正向提示词、反向提示词、运镜控制、时长选择(5s、10s),支持 16:9、9:16、1:1 尺寸。 图生视频除不可运镜控制外,其他与文生视频基本相同。默认生成 5s 的视频。 此外,在视频制作方面,国内还可以使用出门问问的魔音工坊来调节声音情绪。在剪辑方面,对于 1 3 分钟的短片,剪映比较方便,因其有人性化设计及简单的音效库/小特效;但对于更长篇幅或追求更好效果的视频,可能需要使用 PR/FCP/达芬奇等传统剪辑软件。剪辑流程通常为:视频粗剪 视频定剪 音效/音乐 特效 包装(如字幕)。
2025-02-26
免费的图生视频软件
以下为一些免费的图生视频软件: Runway:可将图片拖进去生成 4 秒视频,但它是收费的,您也可以在闲鱼或淘宝找号。进入官网首页点击“start with image”,直接拖图片进来,动画幅度用 3,5 有时会乱跑,无需等进度条转完可继续放图。 Haiper:有免费额度,网址为 https://haiper.ai/ 。能生成文生视频、图生视频、素描生视频、扩展视频,还能生成 HD 超高清的视频。文生视频支持选择风格、秒数(2s 和 4s)、种子值,图生视频只能写提示词、秒数(2s 和 4s)、种子值。 DynamiCrafter:免费,网址为 https://huggingface.co/spaces/Doubiiu/DynamiCrafter ,可生成 2 秒图生视频,还能做短视频拼长视频。 此外,还有一些相关模型的特点供您参考: |排序(从高到低)|模型|特点(优缺)| |||| |1|pd 2.0 pro|生成的画面有点颗粒感,p2.0 模型很能打,适合做一些二次元动漫特效,理解能力更强,更适合连续运镜| |2|luma 1.6|画面质量挺好,但太贵| |3|可灵 1.6 高品质|YYDS!| |4|海螺01live|文生视频比图生视频更有创意,图生也还可以,但大幅度动作下手部会出现模糊的情况,整体素质不错,就是太贵| |5|runway|画面质量不算差,适合做一些超现实主义的特效、经特殊就容镜头| |6|智谱 2.0|做的一些画面特效挺出圈,适合整过,但是整体镜头素质还差点,好处就是便宜,量大,管饱,还能给视频加音效| |7|vidu1.5|二维平面动画的快乐老家,适合做特效类镜头,单镜头很惊艳,大范围运镜首尾帧 yyds! 就是太贵| |8|seaweed 2.0 pro|适合动态相对小的,更适合环绕旋转运镜动作小的| |9|pixverse v3 高品质|首尾帧能打,就是画面美学风格还有待提升| |10|sora|不好用,文生视频挺强,但图生视频抽象镜头太多,半成品都算不上,不建议使用|
2025-02-26
什么工具可以帮忙总结课程视频的知识点
以下是一些可以帮忙总结课程视频知识点的工具: 1. 剪映:只需提供文案,能够自动配图配音,帮助优化线上课程,为微课总结内容和知识点。 2. BibiGPT:支持小红书、B 站等网站视频的归纳总结,还可以提问互动,答案会附上对应的视频节点,是融合课程备课的好助手,网址为 https://bibigpt.co/ 。 3. 飞书妙记:可以先从视频网站上提取出视频的音频部分,利用其免费语音转文字功能将音频转换成文本,下载文本后上传至其他工具进行总结。 此外,可汗学院出品的 AI Tutor Khanmigo 也具有一定的辅助作用,它可以为学生总结视频内容,并以苏格拉底式教学法引导学生思考和学习。
2025-02-26
怎么用comfyUI中的视频IC-light
使用 ComfyUI 中的视频 IClight 的步骤如下: 1. 在管理器中的节点管理中搜索 ComfyUIICLight 进行安装,安装后重启 ComfyUI。 2. 模型可以在网盘里下载,然后放入 ComfyUI/models/unet 文件夹。 3. IC Light 用于处理原视频和新背景之间的光影效果。 4. 辅助工具 ICLight 的打光方式有两种: 文本方式:上传 1 张前景图片,自动抠图,填写详细文本提示词,并在几种给定的光源方向选择。 背景+前景方式:上传 1 张背景图+1 张前景图,自动融合,填写简单文本提示词,并在几种给定的光源方向选择。 需要注意的是,IC Light 处理过的图片可能会颜色发黄偏色,不是处理过的就是好的,有时可能会负优化。另外,在进行背景替换时,不同图片合并要考虑光线、色调、边缘细节等问题。
2025-02-26
AI生成PPT
以下是关于 AI 生成 PPT 的相关内容: 卓 sir 的制作流程:先让 GPT4 生成 PPT 大纲,然后将大纲导入 WPS 启用 WPS AI 一键生成 PPT,再让 chatPPT 添加动画,最后手动修改细节。其中,生成符合要求的大纲最费时间。 市面上大多数 AI 生成 PPT 的思路:AI 生成 PPT 大纲、手动优化大纲、导入工具生成 PPT、优化整体结构。 相关推荐:gamma、AIPPT、islide AI 等产品,其中 gamma 被认为在审美方面表现较好。 扩展阅读:《AI 生成 PPT 工具红黑榜,这三款千万别用》《AI+PPT 等效率工具的研报》 您可以根据自己的需求和喜好选择合适的方法和工具来生成 PPT。
2025-02-26
有哪些AI可以协助生成PPT?
以下是一些可以协助生成 PPT 的 AI 工具: 1. Gamma:在线 PPT 制作网站,通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式,如 GIF 和视频,网址:https://gamma.app/ 2. 美图 AI PPT:由美图秀秀开发团队推出,通过输入简单文本描述生成专业 PPT 设计,包含丰富模板库和设计元素,网址:https://www.xdesign.com/ppt/ 3. Mindshow:AI 驱动的 PPT 辅助工具,提供自动布局、图像选择和文本优化等智能设计功能,网址:https://www.mindshow.fun/ 4. 讯飞智文:科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理技术优势,提供智能文本生成、语音输入、文档格式化等功能,网址:https://zhiwen.xfyun.cn/ 此外,还有以下相关网站: 1. https://kimi.ai 选 PPT 助手,暂时免费效果好。 2. https://tome.app ,AI 配图效果好。 3. https://chatppt.com ,自动化程度高。 4. https://wenku.baidu.com ,付费效果好。
2025-02-26
我想要能够生成音乐的ai工具
以下为您推荐一些能够生成音乐的 AI 工具: 1. Udio:由前 Google DeepMind 工程师开发,通过文本提示快速生成符合用户音乐风格喜好的高质量音乐作品。网址:https://www.udio.com/ 2. Suno AI:是一款革命性的人工智能音乐生成工具,它通过先进的深度学习技术,能够将用户的输入转化为富有情感且高质量的音乐作品。网址:https://suno.com/ 3. Lemonaide Music:与 DAW 集成的生成音乐工具,100%免版权费。网址:https://www.lemonaide.ai/ 4. tuney.io:为创意媒体提供的伦理音乐 AI。网址:https://csteinmetz1.github.io/aiaudiostartups/tuney.io 5. KORUS AI:AI 音乐创作平台和探索声音宇宙的个人音乐制作人。网址:https://play.korus.co/ 6. TRINITI:通过音乐赋予您新的创作和表达方式。网址:https://triniti.plus/ 7. voice swap:使用 AI 改变您的歌唱声音。网址:https://www.voiceswap.ai/ 8. mix audio:为您的创造力和生产力提供 AI 音乐。网址:https://mix.audio/ 9. Audiogen:使用 AI 生成声音、音效、音乐、样本、氛围等。网址:https://www.audiogen.co/ 10. Wavtool:带有 AI 助手并支持本地 VST 插件的网页 DAW。网址:https://wavtool.com/ 11. Wavacity:Audacity®音频编辑器的网页版。网址:https://wavacity.com/ 内容由 AI 大模型生成,请仔细甄别。
2025-02-26
我需要一个能够生成适合初中生的个性化的英语单词清单,用什么工具比较合适
以下为您推荐几种适合生成适合初中生个性化英语单词清单的工具: 1. DeepSeek:您可以输入单词主题、图片风格、单词数量等,它会为您输出指定数量的相关单词,并以数组形式呈现,包括单词、中文、美式音标以及相关的英文句子和中文翻译。 2. Claude:您可以输入任意三个中文词语或一个主题让其随机生成 Word Search 表格,有助于提升初中生的语言能力、专注力、认知能力等。 3. 利用搞定设计结合 ChatGPT:通过搞定设计制作单词卡模板,然后使用 ChatGPT 生成单词内容并整理放入 Excel 文件中,实现批量制作单词卡片。
2025-02-26
免费生成ppt的ai
以下是为您提供的免费生成 PPT 的 AI 相关信息: 目前市面上大多数 AI 生成 PPT 按照以下思路完成设计和制作: 1. AI 生成 PPT 大纲 2. 手动优化大纲 3. 导入工具生成 PPT 4. 优化整体结构 为您推荐以下工具: 1. 歌者 PPT(gezhe.com):是一款永久免费的智能 PPT 生成工具。具有话题生成、资料转换、多语言支持、海量模板和案例、在线编辑和分享、增值服务等功能。其产品优势包括免费使用、智能易用、海量案例、资料转 PPT 专业、AI 翻译等。推荐理由为完全免费、智能化程度高、模板和案例库丰富、支持多语言、学习成本低。 2. Gamma:在各种交流群中被频繁推荐,免费版本也能生成高质量的 PPT,不断优化改进,个人使用体验良好,生成效果在内容组织、设计美观度和整体专业感方面表现卓越。 此外,推荐 2 篇市场分析的文章供您参考: 1. 《》 2. 《》 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-02-25
生成 ppt 内容的 prompt
以下是关于生成 PPT 内容的 prompt 相关信息: 角色方面包括专业推特新闻小编、好评生成器、PPT 生成器、周报生成器、文章打分器、英文日文翻译员、分享卡片生成器、邮件优化大师、专业书评人等。 周三【workshop】一起写 Prompts 成果展示小组 1 中,作者夙愿提到: 该 prompt 主要解决输入一个主题帮老师生成 PPT(场景不定)的问题。 使用该 prompt 的是教师(生成)和学生(阅读)。 目前的最好解决方案包括:提炼教学内容的核心概念确定主题;确定主题后增加提纲;对提纲进行关键词描述;根据关键词书写提纲下的摘要;生成的课件提纲、内容让用户确认是否需要修改。 成熟的案例参考: step 1(根据 PPT 大纲助手 GPTs 生成 PPT 大纲):https://chat.openai.com/g/gOKorMBxxUpptdagangzhushou step 2(根据输入文本生成 PPT 内容 GPTs 生成 PPT 内容):https://chat.openai.com/g/gYJs9jxVBHshuruwenbenshengchengpptneirong step 3(将生成的内容复制到 Marp Web 渲染简洁的 PPT):https://web.marp.app/
2025-02-25
AI 自动化和工作流编排有什么好的工具和方案
以下是一些关于 AI 自动化和工作流编排的工具和方案: 1. RPA 软件:很早就出现在工作流编排领域,目标是使基于桌面的业务流程和工作流程实现自动化,现在越来越多的 RPA 软件带上了 LLM。 2. ComfyUI:将开源绘画模型 Stable Diffusion 进行工作流化操作模式,用户在流程编辑器中配置 pipeline,通过不同节点和连线完成模型操作和图片生成,其 DSL 配置文件支持导出导入,提高了流程的可复用性,降低了时间成本。 3. Dify.AI:工作流设计语言与 ComfyUI 有相似之处,定义了一套标准化的 DSL 语言,方便使用导入导出功能进行工作流复用。 4. Large Action Model:采用“通过演示进行模仿”的技术,检查人们与界面的互动并模仿操作,从用户提供的示例中学习。 5. Auto GPT/Agent/Baby AGI:基于 GPT4 语言模型的开源应用程序,用户输入目标后可自主执行任务、递归地开发和调试代码。能用于自动化任务、创建自主的 AI 代理、完成各种任务等,访问地址为: 。 此外,在工作流编排中还涉及到一些概念和技术: 1. 短期记忆和长期记忆:短期记忆将所有的上下文学习看成是利用模型的短期记忆来学习;长期记忆通过外部的向量存储和快速检索来存储和召回信息。 2. 工具:学会调用外部不同类型 API 来获取模型缺少的额外信息、代码执行能力、访问专有信息源等。 3. 动作:大模型结合问句、上下文的规划、各类工具,最终决策出需要执行的动作。 4. Agentic Workflow 可以从提升效率、提高质量、节省时间的角度思考,通过将复杂任务分解成较小步骤,融入更多人类参与到流程中的规划与定义,减少对 Prompt Engineering 和模型推理能力的依赖,提高 LLM 应用面向复杂任务的性能。 但需要注意的是,Agentic Workflow 虽然美好,但使用的用户目前较少,可能是出现周期、工作流使用的上手难度等因素导致,并且在复杂流程上的开发并不是那么稳定可靠。
2025-02-26
通义千问私有化部署方案
以下是关于通义千问私有化部署的相关方案: 1. 在 FastGPT+OneAPI+COW 框架下的部署: 回到宝塔,选择 Docker(若显示“当前未安装”则进行安装,否则无需此步)。 点击确定,等待安装完成,完成后刷新页面确认安装成功。 打开左侧【终端】,粘贴两行命令验证 Docker 是否可用。 一条一条复制并粘贴相关命令完成安装。 访问 OneAPI,地址为:http://这里改成你自己宝塔左上角的地址:3001/(举例:http://11.123.23.454:3001/),账号默认 root,密码 123456。 点击【渠道】,类型选择阿里通义千问,名称随意。 将千问里创建的 API Key 粘贴到秘钥里,点击确认。 点击【令牌】【添加新令牌】,名称随意,时间设为永不过期、额度设为无限额度,点击【提交】。 点击【令牌】,复制出现的 key 并保存。 2. 在 Langchain+Ollama+RSSHub 框架下的部署: Ollama 支持包括通义千问在内的多种大型语言模型,适用于多种操作系统,同时支持 cpu 和 gpu。 可通过 https://ollama.com/library 查找模型库,通过简单步骤自定义模型,还提供了 REST API 用于运行和管理模型及与其他应用程序的集成选项。 访问 https://ollama.com/download/ 进行下载安装,安装完之后确保 ollama 后台服务已启动。 3. 在 0 基础手搓 AI 拍立得框架下的部署: 可以选择通义千问作为模型供应商,其指令灵活性比较丰富,接口调用入门流程长一些,密钥安全性更高。接口调用费用为:调用:¥0.008/千 tokens,训练:¥0.03/千 tokens。可参考 。
2025-02-26
户型方案布局AI软件有哪些
以下是一些户型方案布局的 AI 软件: 1. HDAidMaster:云端工具,在建筑、室内和景观设计领域表现出色,搭载自主训练的建筑大模型 ArchiMaster,软件 UI 和设计成果颜值高。 2. Maket.ai:主要面向住宅行业,设计师输入房间面积需求和土地约束,软件能自动生成户型图。 3. ARCHITEChTURES:AI 驱动的三维建筑设计软件,在住宅设计早期可引入标准和规范约束设计结果。 4. Fast AI 人工智能审图平台:形成全自动智能审图流程,将建筑全寿命周期内的信息集成,实现数据汇总与管理。 每个工具都有特定应用场景和功能,建议根据具体需求选择合适的工具。
2025-02-24
如何权构建个人AI知识库,请提供详尽的方案,并提供相关工具应用案例。
以下是构建个人 AI 知识库的详尽方案及相关工具应用案例: 方案: 1. 知识收集:学习如何有效地收集、整理和检索信息,例如分新闻、观点、访谈、论文翻译来进行提炼。 2. 知识管理:通过实际操作,体验工具在知识管理方面的应用。 3. 数据处理:使用工具对数据进行转换、提取和呈现,如从图像和图形中提取数据。 4. 内容总结:总结视频内容、翻译和改换风格等。 工具应用案例: 1. 知识收集与整理: 通义听悟整理录音笔记:https://tingwu.aliyun.com 用 React 实现选中即解释 本机跑大语言模型工具:https://ollama.com 选词翻译、解读、拓展:https://snapbox.app 与各种 AI 机器人聊天:https://opencat.app 、https://chathub.gg/ 、https://www.elmo.chat/ 定义提示语,根据不同类型提取有用信息:https://memo.ac/zh/ 2. 数据获取与处理: 下载视频:Mac 用 Downie,Windows 推荐 IDM 淘宝数码荔枝店购买 开源免费屏幕录制工具 OBS:https://obsproject.com/ 用 losslessCut 快速切块 3. 构建知识库: 将文本转换成向量(如使用 embeddings API),先把大文本拆分成若干小文本块(chunk),将小文本块转换成 embeddings 向量并在向量储存库中保存,当用户提问时,通过比对向量提取关联度最高的文本块与问题组合成新的 prompt 发送给 GPT API。 例如对于一篇包含多个文本块的文章,如“文本块 1:本文作者:越山。xxxx。”“文本块 2:公众号越山集的介绍:传播效率方法,分享 AI 应用,陪伴彼此在成长路上,共同前行。”等,当提问“此文作者是谁?”时,可通过比较 embeddings 向量找出关联度最高的文本块。 4. 工具入门: 提示词:现成好用的 Prompt: AI Agent:Agent 工具 小白的 Coze 之旅: AI Pic:现在主流的 AI 绘图工具网站:
2025-02-22
养老场景实时健康监测与风险预警在技术上怎么实现,用AI大模型实现,请给出一个可行的方案
以下是一个利用 AI 大模型实现养老场景实时健康监测与风险预警的可行方案: 首先,需要明确相关的概念和技术名词。AI 即人工智能,机器学习是电脑找规律学习,包括监督学习、无监督学习和强化学习。监督学习是基于有标签的训练数据,学习输入和输出之间的映射关系,包括分类和回归。无监督学习是在无标签数据中自主发现规律,例如聚类。强化学习是从反馈中学习以最大化奖励或最小化损失,类似训小狗。深度学习参照人脑,具有神经网络和神经元,因层数多被称为深度,神经网络可用于多种学习方式。生成式 AI 能生成文本、图片、音频、视频等内容形式,LLM 是大语言模型,生成图像的扩散模型不属于大语言模型,像谷歌的 BERT 模型可用于语义理解,如上下文理解、情感分析、文本分类。 在技术里程碑方面,2017 年 6 月谷歌团队发表的《Attention is All You Need》论文首次提出了 Transformer 模型,其完全基于自注意力机制处理序列数据,不依赖循环神经网络或卷积神经网络。 对于养老场景的实时健康监测与风险预警,可利用传感器收集老人的生理数据,如心率、血压、血糖等。这些数据通过物联网传输到服务器,利用深度学习算法对数据进行分析和处理。例如,使用基于 Transformer 模型的大模型,对历史健康数据和当前实时数据进行学习和分析,建立老人的健康模型。通过与正常健康指标的对比,及时发现异常情况,并结合无监督学习中的聚类算法,对不同健康状况的老人进行分类,以便提供个性化的预警和建议。同时,利用强化学习不断优化模型的预警准确性和及时性。 总之,通过整合传感器数据采集、物联网传输、深度学习算法分析和模型优化等环节,借助 AI 大模型实现养老场景的实时健康监测与风险预警。
2025-02-20
deepseek经常服务器繁忙的解决方案?
以下是一些解决 DeepSeek 服务器繁忙的方案: 1. 尝试以下搜索网站: 秘塔搜索:https://metaso.cn 360 纳米 AI 搜索:https://www.n.cn/ 硅基流动:https://siliconflow.cn/zhcn/ 字节跳动火山擎:https://console.partner.volcengine.com/auth/login?redirectURI=%2Fpartner%2F 百度云千帆:https://login.bce.baidu.com/ 英伟达:https://build.nvidia.com/deepseekai/deepseekr1 Groq:https://groq.com/ Chutes:https://chutes.ai/app 阿里云百炼:https://api.together.ai/playground/chat/deepseekai/DeepSeekR1 Github:https://github.com/marketplace/models/azuremldeepseek/DeepSeekR1/playground POE:https://poe.com/DeepSeekR1 Cursor:https://cursor.sh/ Monica:https://monica.im/invitation?c=ACZ7WJJ9 Lambda:https://lambdalabscom/6 Cerebras:https://cerebras.ai Perplexity:https://www.perplexity.ai 阿里云百炼:https://api.together.ai/playground/chat/deepseekai/DeepSeekR1 2. 可以通过以下步骤使用网页聊天解决: 安装插件:使用 Chrome 或 Microsoft Edge 浏览器,点击此链接,安装浏览器插件,添加到拓展程序:https://chromewebstore.google.com/detail/pageassist%E6%9C%AC%E5%9C%B0ai%E6%A8%A1%E5%9E%8B%E7%9A%84web/jfgfiigpkhlkbnfnbobbkinehhfdhndo 打开聊天页面:点击右上角的插件列表,找到 Page Assist 插件,点击打开。 配置“DeepSeekR1”模型的 API key:基础 URL:https://ark.cnbeijing.volces.com/api/v3 ,填好之后,点击保存,关掉提醒弹窗。 添加“DeepSeekR1”模型。 3. 还可以使用以下网站(部分需要魔法,不做教学支持): 秘塔搜索:https://metaso.cn 360 纳米 AI 搜索:https://www.n.cn/(bot.n.cn) 硅基流动:https://cloud.siliconflow.cn/i/RjJgQqae AskManyAI:https://dazi.co/login?i=7db38e6e 字节跳动火山引擎:https://console.volcengine.com/ark/region:ark+cnbeijing/experience 百度云千帆:https://console.bce.baidu.com/qian3an/modelcenter/model/buildIn/list 英伟达 NIM Groq:https://groq.com/ Fireworks:https://fireworks.ai/models/fireworks/deepseekr1 Chutes:https://chutes.ai/app/chute/ Github:https://github.com/marketplace/models/azuremldeepseek/DeepSeekR1/playground POE:https://poe.com/DeepSeekR1 Cursor:https://cursor.sh/ Monica:https://monica.im/invitation?c=ACZ7WJJ9 Lambda:https://lambdalabs.com/ Cerebras:https://cerebras.ai Perplexity:https://www.perplexity.ai 阿里云百炼:https://api.together.ai/playground/chat/deepseekai/DeepSeekR1
2025-02-20