Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

如何用大模型做mv

Answer

要用大模型做 MV,您可以按照以下步骤进行:

  1. 模型下载:
  2. 模型安装:
    • 下载模型后放置在指定目录:
      • 大模型(Ckpt):放入 models\Stable-diffusion
      • VAE 模型:一些大模型需要配合 vae 使用,对应的 vae 放置在 models\Stable-diffusion 或 models\VAE 目录,然后在 webui 的设置栏目选择。
      • Lora/LoHA/LoCon 模型:放入 extensions\sd-webui-additional-networks\models\lora,也可以在 models/Lora 目录
      • Embedding 模型:放入 embeddings 目录
    • 若不知道下载的模型类型,可使用秋叶的模型解析工具 https://spell.novelai.dev/,将模型拖动到空白处查看模型信息。
    • 不会科学上网的,也可在启动器界面直接下载模型,大模型放在根目录的【……\models\Stable-diffusion】文件夹,VAE 放在根目录的【……\models\VAE】文件夹,Embedding 放在根目录下的 embeddings 文件夹。
Content generated by AI large model, please carefully verify (powered by aily)

References

SD新手:入门图文教程

模型能够有效地控制生成的画风和内容。常用的模型网站有:[Civitai | Stable Diffusion models,embeddings,hypernetworks and more](https://link.zhihu.com/?target=https%3A//civitai.com/)>[Models - Hugging Face](https://link.zhihu.com/?target=https%3A//huggingface.co/models)>[SD - WebUI资源站](https://link.zhihu.com/?target=https%3A//www.123114514.xyz/models/ckpt)>[元素法典AI模型收集站- AI绘图指南wiki(aiguidebook.top)](https://link.zhihu.com/?target=https%3A//aiguidebook.top/index.php/model/)>[AI绘画模型博物馆(subrecovery.top)](https://link.zhihu.com/?target=https%3A//aimodel.subrecovery.top/)[heading3]模型安装[content]下载模型后需要将之放置在指定的目录下,请注意,不同类型的模型应该拖放到不同的目录下。模型的类型可以通过[Stable Diffusion法术解析](https://link.zhihu.com/?target=https%3A//spell.novelai.dev/)检测。大模型(Ckpt):放入models\Stable-diffusionVAE模型:一些大模型需要配合vae使用,对应的vae同样放置在models\Stable-diffusion或models\VAE目录,然后在webui的设置栏目选择。Lora/LoHA/LoCon模型:放入extensions\sd-webui-additional-networks\models\lora,也可以在models/Lora目录Embedding模型:放入embeddings目录

教程:超详细的Stable Diffusion教程

除了链接里面给大家分享的模型,大家肯定还想去找更多更好看的模型而大多数的模型都是在Civitai(C站)这个网站里面https://civitai.com/现在就给大家说一下C站的使用方法:01.科学上网这个没法教,大家只能自己想办法了02.点击右上角的筛选按钮,在框框里面找到自己需要的模型类型Checkpoint=大模型LoRA=Lora常用的就是这两个03.看照片,看到感兴趣的就点进去点击右边的“Download”,也就是下载,保存到电脑本地,文件保存到哪里在这一节的第二部分另外,我们还可以点击左上角的“Images”这里就是看别人已经做好的图片,找到喜欢的点进去点进去之后的页面我们就可以看到这张图的全部信息,直接点击Lora和大模型,可以直接跳转到下载页面下面的就是照片关键词和其他信息点击最下面的“Copy...Data”就可以复制图片的所有信息回到SD,粘贴到关键词的文本框,点击右边的按钮这些信息就会自动分配要注意的就是,大模型是需要我们手动去换的!这样我们就可以生成出跟大神几乎一样的照片了!(电脑网络配置的不同,出来的照片有细微差别)[heading2]2.模型下载到哪里[content]这里大家就直接看我文件的保存地址,找到自己电脑里的01.大模型这里的SD根目录就是大家在下载时,存放SD的那个文件夹02.Lora03.VAE[heading2]3.如何分辨模型[content]如果我们下载了一个模型,但不知道它是哪个类型的,不知道要放到哪个文件夹我们就可以用到这个秋叶的模型解析工具https://spell.novelai.dev/把模型拖动到空白处接着就会自动弹出模型的信息在模型种类里面就可以看到是什么模型啦!

【SD】软件原理傻瓜级理解

如果不会科学上网,也可以去启动器的界面直接下载模型,当然这里是看不见预览图的,但从名字你可能看不出这个模型是什么风格。将下载的大模型放在根目录的这个文件夹下【……\models\Stable-diffusion】,我们就可以在左上角的模型列表中进行选择了。(看不到就点旁边的蓝色按钮刷新一下)。旁边这个VAE,相当于是给模型增加一个提高饱和度的滤镜和一些局部上的细节微调。当然有的大模型本身就自带VAE,所以就不用再加了。VAE可以直接在启动器里面下载,下载的VAE放在根目录的这个文件夹下【……\models\VAE】。接下来要理解的一个概念是Embedding,这个功能相当于是一个提示词打包的功能。比如你想画一个娜美的人物形象,但是想要固定一个人物形象往往要几十条什么上百条提示词,比如性别、头发、脸型、眼睛、身材等等一大堆精确指向的词汇。那这个时候,就有人将这些提示词整合到一起做成了一个Embedding文件,你只需要使用一个提示词,就可以直接引入这个人物形象进行创作了。下载Embedding的地方同样是在C站,通过右上角的筛选Textual Inversion就可以找到,放在根目录下的embeddings文件夹里即可。接下来,讲一讲最重要的这个LORA,有了LORA就可以将人物或者物品接近完美地复刻进图像中,这就有了极大的商用价值。比如这个“墨心”的LORA,就可以把你的图片变成水墨风格。这个盲盒LORA可以生成这种2.5D的卡通小人角色。或者是一些明星角色的LORA,直接生成真人形象。还有知名的动漫角色,由于LORA其极其强大的功能,所以在使用上,大家需要有很强的版权和法律意识,所谓能力越大、责任越大,玩得太花,小心律师函到你家。

Others are asking
怎么用大模型构建一个属于我自己的助手
以下是用大模型构建属于自己的助手的几种方法: 1. 在网站上构建: 创建百炼应用获取大模型推理 API 服务: 进入百炼控制台的,在页面右侧点击新增应用,选择智能体应用并创建。 在应用设置页面,模型选择通义千问Plus,其他参数保持默认,也可以输入一些 Prompt 来设置人设。 在页面右侧提问验证模型效果,点击右上角的发布。 获取调用 API 所需的凭证: 在我的应用>应用列表中查看所有百炼应用 ID 并保存到本地。 在顶部导航栏右侧,点击人型图标,点击 APIKEY 进入我的 APIKEY 页面,创建新 APIKEY 并保存到本地。 2. 微信助手构建: 搭建,用于汇聚整合多种大模型接口,并获取白嫖大模型接口的方法。 搭建,作为知识库问答系统,将大模型接入用于回答问题,若不接入微信,搭建完成即可使用其问答界面。 搭建接入微信,配置 FastGpt 将知识库问答系统接入微信,建议先用小号以防封禁风险。 3. 基于 COW 框架构建: COW 是基于大模型搭建的 Chat 机器人框架,可将多模型塞进微信。 基于张梦飞同学的更适合小白的使用教程:。 实现功能包括打造属于自己的 ChatBot(文本对话、文件总结、链接访问、联网搜索、图片识别、AI 画图等)、常用开源插件的安装应用。 注意事项: 微信端因非常规使用有封号危险,不建议主力微信号接入。 只探讨操作步骤,请依法合规使用。 大模型生成的内容注意甄别,确保操作符合法律法规要求。 禁止用于非法目的,处理敏感或个人隐私数据时注意脱敏,以防滥用或泄露。 支持多平台接入,如微信、企业微信、公众号、飞书、钉钉等。 支持多模型选择,如 GPT3.5/GPT4.0/Claude/文心一言/讯飞星火/通义千问/Gemini/GLM4/LinkAI 等。 支持多消息类型,能处理文本、语音和图片,以及基于自有知识库进行定制的企业智能客服功能。 支持多部署方法,如本地运行、服务器运行、Docker 的方式。
2025-02-17
怎么用大模型构建一个属于我自己的助手
以下是用大模型构建属于自己的助手的几种方法: 1. 在网站上构建: 创建百炼应用获取大模型推理 API 服务: 进入百炼控制台的,在页面右侧点击新增应用,选择智能体应用并创建。 在应用设置页面,模型选择通义千问Plus,其他参数保持默认,也可以输入一些 Prompt 来设置人设。 在页面右侧提问验证模型效果,点击右上角的发布。 获取调用 API 所需的凭证: 在我的应用>应用列表中查看所有百炼应用 ID 并保存到本地。 在顶部导航栏右侧,点击人型图标,点击 APIKEY 进入我的 APIKEY 页面,创建新 APIKEY 并保存到本地。 2. 微信助手构建: 搭建,用于汇聚整合多种大模型接口,并获取白嫖大模型接口的方法。 搭建,作为知识库问答系统,将大模型接入用于回答问题,若不接入微信,搭建完成即可使用其问答界面。 搭建接入微信,配置 FastGpt 将知识库问答系统接入微信,建议先用小号以防封禁风险。 3. 基于 COW 框架构建: COW 是基于大模型搭建的 Chat 机器人框架,可将多模型塞进微信。 基于张梦飞同学的更适合小白的使用教程:。 实现功能包括打造属于自己的 ChatBot(文本对话、文件总结、链接访问、联网搜索、图片识别、AI 画图等)、常用开源插件的安装应用。 注意事项: 微信端因非常规使用有封号危险,不建议主力微信号接入。 只探讨操作步骤,请依法合规使用。 大模型生成的内容注意甄别,确保操作符合法律法规要求。 禁止用于非法目的,处理敏感或个人隐私数据时注意脱敏,以防滥用或泄露。 支持多平台接入,如微信、企业微信、公众号、飞书、钉钉等。 支持多模型选择,如 GPT3.5/GPT4.0/Claude/文心一言/讯飞星火/通义千问/Gemini/GLM4/LinkAI 等。 支持多消息类型,能处理文本、语音和图片,以及基于自有知识库进行定制的企业智能客服功能。 支持多部署方法,如本地运行、服务器运行、Docker 的方式。
2025-02-17
语文教学如何使用大模型
在语文教学中使用大模型,可以参考以下方面: 1. 提示词设置: Temperature:参数值越小,模型返回结果越确定;调高参数值,可能带来更随机、多样化或具创造性的产出。对于质量保障等任务,可设置低参数值;对于诗歌生成等创造性任务,可适当调高。 Top_p:与 Temperature 类似,用于控制模型返回结果的真实性。需要准确答案时调低参数值,想要更多样化答案时调高。一般改变其中一个参数即可。 Max Length:通过调整控制大模型生成的 token 数,有助于防止生成冗长或不相关的响应并控制成本。 Stop Sequences:指定字符串来阻止模型生成 token,控制响应长度和结构。 Frequency Penalty:对下一个生成的 token 进行惩罚,减少响应中单词的重复。 2. 了解大模型: 大模型通俗来讲是输入大量语料,让计算机获得类似人类的“思考”能力,能进行文本生成、推理问答、对话、文档摘要等工作。 训练和使用大模型可类比上学参加工作:找学校(需要大量 GPU 计算)、确定教材(大量数据)、找老师(算法)、就业指导(微调)、搬砖(推导)。 Token 是模型处理和生成的文本单位,在将输入进行分词时会形成词汇表。 需要注意的是,在实际应用中,可能需要根据具体的教学需求和场景进行调整和实验,以找到最适合的设置和方法。
2025-02-17
如何利用大模型写教案
利用大模型写教案可以参考以下要点: 1. 输入的重要性:要输出优质的教案,首先要有高质量的输入。例如,写商业分析相关的教案,如果没有读过相关权威书籍,输入的信息缺乏信息量和核心概念,大模型给出的结果可能就很平庸。所以,脑海中先要有相关的知识概念,这来自于广泛的阅读和学习。 2. 对大模型的理解:大模型通过输入大量语料获得类似人类的“思考”能力,能够进行文本生成、推理问答、对话、文档摘要等工作。其训练和使用过程可以类比为上学参加工作,包括找学校(需要大量计算资源)、确定教材(大量数据)、找老师(合适的算法)、就业指导(微调)、搬砖(推导)等步骤。 3. 与大模型的交互: 提示词工程并非必须学习,不断尝试与大模型交互是最佳方法。 交互时不需要遵循固定规则,重点是是否达成目的,未达成可锲而不舍地尝试或更换模型。 用 Markdown 格式清晰表达问题,它具有结构清晰、能格式化强调关键部分、适用性广等优点,有助于大模型更好地理解用户意图。
2025-02-17
deepseek是不是国内通用大模型第一名
DeepSeek 是在国内表现出色的模型之一。它发布的大一统模型 JanusPro 将图像理解和生成统一在一个模型中,具有统一 Transformer 架构,提供 1B 和 7B 两种规模,全面开源,支持商用,部署使用便捷,Benchmark 表现优异,能力更全面。同时,在 LMSYS 排行榜上,由 DeepSeek 等开发的模型取得了优异成绩,尤其在数学和编程方面表现出色。DeepSeek 在推理过程中通过多头隐式注意力减少内存需求,并且改进了 MoE 架构。但不能简单地说 DeepSeek 就是国内通用大模型第一名,其在不同方面的表现还需综合评估。
2025-02-08
Coze + 飞书 + 飞书多维表格:通过飞书机器人与 Coze 搭建的智能体进行对话,在聊天窗口中完成链接输入和阅读计划输出。由 Coze 调用大模型、插件完成内容的整理、推荐,利用飞书多维表格存储和管理稍后读数据,无需开发任何插件、APP,能实现跨平台的稍后读收集与智能阅读计划的推荐。其设计思路包括简化“收集”,实现跨平台收集和通过输入 URL 完成收集;自动化“整理入库”,自动整理关键信息并支持跨平台查看;智能“选择”推荐,根据收藏记录和用户兴趣生成阅读计划——这个方法具体如何操作?
以下是关于通过飞书机器人与 Coze 搭建的智能体进行对话,并利用飞书多维表格存储和管理稍后读数据,实现跨平台的稍后读收集与智能阅读计划推荐的具体操作方法: 前期准备: 1. 简化“收集”: 实现跨平台收集功能,支持电脑(web 端)、安卓、iOS 多端操作。 输入一个 URL 即可完成收集,借鉴微信文件传输助手的方式,通过聊天窗口完成收集输入。 2. 自动化“整理入库”: 系统在入库时自动整理每条内容的关键信息,包括标题、摘要、作者、发布平台、发布日期、收集时间和阅读状态。 阅读清单支持跨平台查看。 3. 智能“选择”推荐: 根据当前收藏记录和用户阅读兴趣进行相关性匹配,生成阅读计划。 使用飞书·稍后读助手: 1. 设置稍后读存储地址: 首次使用,访问。 点击「更多创建副本」,复制新表格的分享链接。 将新链接发送到智能体对话中。 还可以发送“查询存储位置”、“修改存储位置”来更换飞书多维表格链接,调整稍后读存储位置。 2. 收藏待阅读的页面链接: 在对话中输入需要收藏的页面链接,第一次使用会要求授权共享数据,授权通过后再次输入即可完成收藏。但目前部分页面链接可能小概率保存失败。 3. 智能推荐想看的内容: 在对话中发送“我想看 xx”、“xx 内容”,即可按个人兴趣推荐阅读计划。 至此,专属 AI 稍后读智能体大功告成,您可以尽情享受相关服务。
2025-01-27
哪些AI工具可以将歌曲MP3改成MV
目前尚未有直接将歌曲 MP3 转换为 MV 的成熟 AI 工具。通常,制作 MV 需要涉及视频编辑、特效处理、画面设计等多个复杂的环节,需要借助专业的视频编辑软件,如 Adobe Premiere Pro、Final Cut Pro 等,并结合创意和素材来完成。
2025-01-18
我想拍MV
以下是关于用 AI 制作 MV 的相关信息: AI 音乐生成可用于制作 MV。在制作 MV 时,若曲库里的歌曲无法满足对歌词内容、歌曲风格和长度的要求,AI 音乐生成工具能发挥价值。比如,在春节期间围绕“过年”主题制作 AI 音乐视频时,先确定期望的歌曲特点,如歌词描绘“过年”故事、措辞风格为悠扬温馨的中国风、时长 50 秒左右等。若在音乐素材网站未找到合适歌曲,可借助 AI 生成音乐,如使用 Suno 并通过订阅会员获得商业使用权。 在歌词创作方面,若 Suno 内置的歌词生成功能不支持多轮对话修改,可借助 ChatGPT 生成歌词。 在视频制作方面,歌曲选定后,可通过 AI 绘图工具如 SD、Midjourney 制作静态分镜,参考影视行业分镜表写提示词。再通过 AI 视频生成工具如 Runway 把图片制作成动态分镜,最后在剪映里进行视频和音乐剪辑、添加音效和画面特效等。 以下为两个案例: 1. 春节期间围绕“过年”主题的 AI 音乐视频案例,通过上述流程制作完成。 2. 小田用 AI 制作 MV 的案例,其中包括镜头管理,如中景展现一群孩子在海边奔跑,全景展现一家人在油菜花田享受午后阳光等。
2025-01-04
有没有输入歌曲,自动生成mv的
目前存在输入歌曲自动生成 MV 的相关方法和案例: 大峰的案例中,先使用 Suno 生成歌曲,选择中国风风格,凭借音乐审美选出中意的歌曲。然后将歌词发给 GPT,让其以英文 AI 绘画提示词的形式提供每句歌词的每个分镜,再将生成的图片丢入 Midjourney 进行图片生成,最后用 Midjourney 生成的图片丢入 Runway 进行图生视频。 专业的歌曲分析师可以根据用户输入的歌词完成基本的歌曲 MV 构思部分。 在爆肝 60 小时的案例中,音乐制作方面一开始想抽三个不同的曲子拼接,但因节拍、风格、情绪不同难以剪辑,最后用了一首完整的曲子。团队成员上传推荐歌曲到多维表格,附上推荐理由,由相关人员审核通过。还有一些技巧,如在前奏部分重复第一句以解决发音不清晰问题。
2024-11-06
有什么工具可以帮助用户用okr的方式,分解成mvp
将OKR(目标与关键结果)分解成MVP(最小可行产品)的过程需要一些工具和方法来帮助用户进行有效的规划和执行。以下是一些常用的工具和方法,可以帮助用户实现这一目标: 工具 1. Trello: 功能:Trello 是一个基于看板的项目管理工具,可以帮助团队将OKR分解成具体的任务和MVP。 使用方法:创建一个看板,添加列表如“目标(Objectives)”、“关键结果(Key Results)”、“任务(Tasks)”、“MVP”等,将OKR逐步细化为具体的任务和MVP。 2. Asana: 功能:Asana 是一个强大的任务管理和项目管理工具,适合进行OKR到MVP的分解。 使用方法:在Asana中创建项目,设置目标和关键结果,然后将这些目标进一步分解成具体的任务,确定哪些任务构成MVP。 3. Notion: 功能:Notion 提供灵活的笔记、数据库和任务管理功能,可以用来管理OKR和MVP。 使用方法:创建一个数据库用于管理OKR,设置不同的视图(如任务视图、看板视图等)来跟踪目标的进展,并将关键结果细化为可执行的MVP。 4. Jira: 功能:Jira 是一个广泛使用的项目和问题跟踪工具,特别适合软件开发团队。 使用方法:在Jira中创建项目和用户故事,将OKR分解为具体的故事和任务,确定哪些故事构成MVP,使用sprint和看板视图来管理和跟踪进展。 5. Microsoft Planner: 功能:Planner 是微软提供的一个简单易用的任务管理工具,集成在Office 365中。 使用方法:创建计划板,设置OKR和相应的任务,将这些任务分配到团队成员,并标记出构成MVP的关键任务。 方法 1. SMART原则: 描述:确保每个目标都是具体的(Specific)、可衡量的(Measurable)、可实现的(Achievable)、相关的(Relevant)和有时间限制的(Timebound)。 应用:在定义OKR时,使用SMART原则确保目标清晰明确,有助于进一步分解为MVP。 2. 价值流映射: 描述:一种分析和设计流程的方法,旨在识别和减少浪费,提高效率。 应用:绘制从OKR到交付MVP的整个流程图,识别每一步的价值和瓶颈,将OKR有效地转化为MVP。 3. MoSCoW法则: 描述:一种需求优先级排序的方法,将任务分为必须(Must have)、应该(Should have)、可以(Could have)和不会(Won't have)。 应用:在分解OKR时,使用MoSCoW法则来确定哪些任务是MVP的一部分,确保优先完成关键任务。 4. 用户故事映射: 描述:一种用于管理产品功能和用户故事的技术,帮助团队了解和安排产品的工作。 应用:将OKR转化为用户故事,创建故事地图,确定哪些故事和功能构成MVP,确保MVP能实现核心目标。 这些工具和方法可以帮助团队有效地将高层次的OKR分解为具体的MVP,确保目标的实现和产品的快速迭代。
2024-05-28
大模型评测
以下是关于大模型评测的相关信息: FlagEval(天秤)大模型评测体系及开放平台: 地址: 简介:旨在建立科学、公正、开放的评测基准、方法、工具集,协助研究人员全方位评估基础模型及训练算法的性能,同时探索利用 AI 方法实现对主观评测的辅助,大幅提升评测的效率和客观性。创新构建了“能力任务指标”三维评测框架,细粒度刻画基础模型的认知能力边界,可视化呈现评测结果。 CEval:构造中文大模型的知识评估基准: 地址: 简介:构造了一个覆盖人文,社科,理工,其他专业四个大方向,52 个学科(微积分,线代…),从中学到大学研究生以及职业考试,一共 13948 道题目的中文知识和推理型测试集。此外还给出了当前主流中文 LLM 的评测结果。 SuperCLUElyb:SuperCLUE 琅琊榜 地址: 简介:中文通用大模型匿名对战评价基准,这是一个中文通用大模型对战评价基准,它以众包的方式提供匿名、随机的对战。他们发布了初步的结果和基于 Elo 评级系统的排行榜。 此外,还有小七姐对文心一言 4.0、智谱清言、KimiChat 的小样本测评,测评机制包括: 测评目标:测评三家国产大模型,以同组提示词下 ChatGPT 4.0 生成的内容做对标参照。 能力考量:复杂提示词理解和执行(结构化提示词)、推理能力(CoT 表现)、文本生成能力(写作要求执行)、提示词设计能力(让模型设计提示词)、长文本归纳总结能力(论文阅读)。 测评轮次:第一轮是复杂提示词理解和执行,包括 Markdown+英文 title 提示词测试、Markdown+中文 title 提示词测试、中文 title+自然段落提示词测试;第二轮是推理能力(CoT 表现);第三轮是文本生成能力(写作要求执行);第四轮是提示词设计能力(让模型设计提示词);第五轮是长文本归纳总结能力(论文阅读)。 测试大模型质量好坏时,常用的问题包括检索和归纳、推理性、有日期相关历史事件等。以下是几个专业做模型测评的网站:
2025-02-17
ai大模型
AI 大模型是一个复杂但重要的概念。以下为您详细介绍: 1. 概念:生成式 AI 生成的内容称为 AIGC。 2. 概念与关系: AI 即人工智能。 机器学习是电脑找规律学习,包括监督学习、无监督学习、强化学习。 监督学习使用有标签的训练数据,目标是学习输入和输出之间的映射关系,包括分类和回归。 无监督学习的数据没有标签,算法自主发现规律,经典任务如聚类。 强化学习从反馈中学习,以最大化奖励或最小化损失,类似训小狗。 深度学习是一种参照人脑有神经网络和神经元的方法(因层数多而称深度),神经网络可用于监督学习、无监督学习、强化学习。 生成式 AI 可以生成文本、图片、音频、视频等内容形式。 LLM 是大语言模型,对于生成式 AI,生成图像的扩散模型不是大语言模型;对于大语言模型,生成只是其中一个处理任务,如谷歌的 BERT 模型可用于语义理解(不擅长文本生成),像上下文理解、情感分析、文本分类。 3. 技术里程碑:2017 年 6 月,谷歌团队发表论文《Attention is All You Need》,首次提出 Transformer 模型,它完全基于自注意力机制处理序列数据,不依赖循环神经网络或卷积神经网络。
2025-02-17