直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

怎么训练自己的小说大纲模型

回答

训练自己的小说大纲模型可以参考以下步骤:

步骤一:创建数据集

  1. 进入厚德云-模型训练-数据集,网址为:https://portal.houdeyun.cn/sd/dataset 。
  2. 在数据集一栏中,点击右上角创建数据集。
  3. 输入数据集名称。
  4. 可以上传包含图片+标签的 zip 文件,也可以只有图片没有打标文件(之后可在 c 站使用自动打标功能)。
  5. 也可以一张一张单独上传照片,但建议提前把图片和标签打包成 zip 上传。
  6. Zip 文件里图片名称与标签文件应当匹配,例如:图片名“1.png”,对应的达标文件就叫“1.txt”。
  7. 上传 zip 以后等待一段时间。
  8. 确认创建数据集,返回到上一个页面,等待一段时间后上传成功,可以点击详情检查,可预览到数据集的图片以及对应的标签。

步骤二:Lora 训练

  1. 点击 Flux,基础模型会默认是 FLUX 1.0D 版本。
  2. 选择数据集,点击右侧箭头,会跳出所有上传过的数据集。
  3. 触发词可有可无,取决于数据集是否有触发词。
  4. 模型效果预览提示词则随机抽取一个数据集中的标签填入即可。
  5. 训练参数这里可以调节重复次数与训练轮数,厚德云会自动计算训练步数。如果不知道如何设置,可以默认 20 重复次数和 10 轮训练轮数。
  6. 可以按需求选择是否加速,点击开始训练,会显示所需要消耗的算力。
  7. 然后等待训练,会显示预览时间和进度条。训练完成的会显示出每一轮的预览图。
  8. 鼠标悬浮到想要的轮次模型,中间会有个生图,点击会自动跳转到使用此 lora 生图的界面。点击下方的下载按钮则会自动下载到本地。

步骤三:Lora 生图

  1. 点击预览模型中间的生图会自动跳转到这个页面。
  2. 模型上的数字代表模型强度,可以调节大小,正常默认为 0.8,建议在 0.6 - 1.0 之间调节。
  3. 也可以自己添加 lora 文件,点击后会显示训练过的所有 lora 的所有轮次。
  4. VAE 不需要替换。
  5. 正向提示词输入写的提示词,可以选择基于这个提示词一次性生成几张图。
  6. 选择生成图片的尺寸,横板、竖版、正方形。
  7. 采样器和调度器新手小白可以默认不换。
  8. 迭代步数可以按照需求在 20 - 30 之间调整。
  9. CFG 可以按照需求在 3.5 - 7.5 之间调整。
  10. 随机种子 - 1 代表随机生成图。
  11. 所有设置都好了以后,点击开始生态,生成的图会显示在右侧。
  12. 如果有哪次生成结果觉得很不错,想要微调或者高分辨率修复,可以点开那张图,往下滑,划到随机种子,复制下来,粘贴到随机种子这里,这样下次生成的图就会和这次的结果近似。
  13. 如果确认了一张很合适的种子和参数,想要高清放大,则点开高清修复,可以选择想放大的倍数。新手小白可以就默认这个算法,迭代步数也是建议在 20 - 30 之间,重回幅度根据需求调整,正常来说在 0.3 - 0.7 之间调整。

今日作业 按照比赛要求,收集六个主题中一个主题的素材并且训练出 lora 模型后提交 lora 模型与案例图像。提交链接:https://waytoagi.feishu.cn/share/base/form/shrcnpJAtTjID7cIcNsWB79XMEd 。

另外,直接在 Comfy UI 中训练 LoRA 模型的步骤如下:

  1. 确保后面有一个空格。然后将 requirements_win.txt 文件拖到命令提示符中(如果在 Windows 上;否则,选择另一个文件 requirements.txt)。拖动文件将在命令提示符中复制其路径。
  2. 按 Enter 键,这将安装所有所需的依赖项,使其与 ComfyUI 兼容。请注意,如果为 Comfy 使用了虚拟环境,必须首先激活它。
  3. 教程:
    • 图像必须放在一个以[number]_[whatever]命名的文件夹中。那个数字很重要:LoRA 脚本使用它来创建一些步骤(称为优化步骤…但别问我是什么^^’)。它应该很小,比如 5。然后,下划线是必须的。
    • 对于 data_path,必须写入包含数据库文件夹的文件夹路径。例如:C:\database\5_myimages ,必须写 C:\database 。
    • 对于参数,在第一行,可以从 checkpoint 文件夹中选择任何模型。据说必须选择一个基本模型进行 LoRA 训练。但也可以尝试使用微调。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

10-0基础训练大模型

进入厚德云-模型训练-数据集https://portal.houdeyun.cn/sd/dataset[heading2]步骤一·创建数据集[content]在数据集一栏中,点a击右上角创建数据集输入数据集名称这个zip文件可以是包含图片+标签txt,也可以只有图片没有打标文件(之后你可以在c站使用它的自动打标功能)你也可以一张一张单独上传照片,但还是建议提前把图片和标签打包成zip上传Zip文件里图片名称与标签文件应当匹配例如:图片名"1.png",对应的达标文件就叫"1.txt"。上传zip以后等待一段时间确认创建数据集返回到上一个页面,等待一段时间后就会上传成功,可以点击详情检查可以预览到数据集的图片以及对应的标签[heading2]步骤二· Lora训练[content]点击Flux,基础模型会默认是FLUX 1.0D版本选择数据集,点击右侧箭头,会跳出你所有上传过的数据集触发词可有可无,取决于你的数据集是否有触发词模型效果预览提示词则随机抽取一个你数据集里的标签填入即可训练参数这里可以调节重复次数与训练轮数,厚德云会自动计算训练步数如果不知道如何设置,可以默认20重复次数和10轮训练轮数可以按需求选择是否加速,点击开始训练,会显示所需要消耗的算力然后就可以等待训练了,会显示预览时间和进度条训练完成的会显示出每一轮的预览图鼠标悬浮到你想要的轮次模型,中间会有个生图,点击会自动跳转到使用此lora生图的界面。点击下方的下载按钮则会自动下载到本地

10-0基础训练大模型

上图中,点击预览模型中间的生图会自动跳转到这个页面模型上的数字代表模型强度,可以调节大小,正常默认为0.8,建议在0.6-1.0之间调节当然,你也可以自己添加lora文件点击后会显示你训练过的所有lora的所有轮次VAE不需要替换正向提示词输入你写的提示词可以选择基于这个提示词一次性生成几张图选择生成图片的尺寸,横板、竖版、正方形采样器和调度器新手小白可以默认这个不换迭代步数可以按照需求在20-30之间调整CFG可以按照需求在3.5-7.5之间调整随机种子-1代表随机生成图所有设置都好了以后,点击开始生态,生成的图会显示在右侧如果有哪次生成结果你觉得很不错,想要微调或者高分辨率修复,可以点开那张图往下滑,划到随机种子,复制下来粘贴到i机种子这里,这样下次生成的图就会和这次的结果近似如果确认了一张很合适的种子和参数,想要搞清放大则点开高清修复,可以选择你想放大的倍数新手小白可以就默认这个算法迭代步数也是建议在20-30之间重回幅度根据需求调整,正常来说在0.3-0.7之间调整[heading1]今日作业[content]按照比赛要求,收集六个主题中一个主题的素材并且训练出lora模型后提交lora模型与案例图像提交链接:https://waytoagi.feishu.cn/share/base/form/shrcnpJAtTjID7cIcNsWB79XMEd

直接在Comfy UI中训练LoRA模型

确保后面有一个空格。然后将requirements_win.txt文件拖到命令提示符中(如果你在Windows上;否则,我假设你应该选择另一个文件requirements.txt)。拖动文件将在命令提示符中复制其路径。按Enter键,这将安装所有所需的依赖项,使其与ComfyUI兼容。请注意,如果你为Comfy使用了虚拟环境,必须首先激活它。教程在使用自定义节点之前,有一些要注意的事项:你的图像必须放在一个以[number]_[whatever]命名的文件夹中。那个数字很重要:LoRA脚本使用它来创建一些步骤(称为优化步骤…但别问我是什么^^’)。它应该很小,比如5。然后,下划线是必须的。其余部分不重--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------p/对于data_path,你必须写入包含数据库文件夹的文件夹路径。因此,在这种情况下:C:\database\5_myimages你必须写C:\database至于终极问题:“斜杠还是反斜杠?”…不用担心!Python在这里需要斜杠,但节点会自动将所有反斜杠转换为斜杠。文件夹名称中的空格也不是问题。参数在第一行,你可以从checkpoint文件夹中选择任何模型。然而,据说你必须选择一个基本模型进行LoRA训练。这是为什么我不得而知。但你完全可以尝试使用微调,没有任何阻碍。但如果你想遵循规则,请确保在checkpoint文件夹中有一个基本模型!

其他人在问
AI 辅助课程大纲编写与优化
利用 AI 辅助课程大纲编写与优化可以按照以下步骤进行: 1. 确定课程大纲主题:明确研究兴趣和目标,选择具有研究价值和创新性的主题。 2. 收集背景资料:使用 AI 工具如学术搜索引擎和文献管理软件来搜集相关研究文献和资料。 3. 分析和总结信息:利用 AI 文本分析工具来分析收集到的资料,提取关键信息和主要观点。 4. 生成大纲:使用 AI 写作助手生成课程大纲,包括引言、文献综述、方法论、结果和讨论等部分。 5. 撰写文献综述:利用 AI 工具来帮助撰写文献综述部分,确保内容的准确性和完整性。 6. 构建方法论:根据研究需求,利用 AI 建议的方法和技术来设计研究方法。 7. 数据分析:如果课程大纲涉及数据收集和分析,可以使用 AI 数据分析工具来处理和解释数据。 8. 撰写和编辑:利用 AI 写作工具来撰写课程大纲的各个部分,并进行语法和风格的检查。 9. 生成参考文献:使用 AI 文献管理工具来生成正确的参考文献格式。 10. 审阅和修改:利用 AI 审阅工具来检查课程大纲的逻辑性和一致性,并根据反馈进行修改。 11. 提交前的检查:最后,使用 AI 抄袭检测工具来确保课程大纲的原创性,并进行最后的格式调整。 需要注意的是,AI 工具可以作为辅助,但不能完全替代研究者的专业判断和创造性思维。在使用 AI 进行课程大纲编写与优化时,应保持批判性思维,并确保研究的质量和学术诚信。 此外,还可以参考以下思路: 调整结构:在大纲开头增加一个“快速选择指南”,帮助读者快速定位最适合自己的方法。 补充新信息、新观点:增加一个章节,比较不同 AI 模型在相关工作场景中的优劣。 对于教师,还可以借助 AI 作为教学助理来规划课程。AI 教学助理应先向老师介绍自己,询问教学科目以及面向的学生层次(高中、大学还是职业教育),以便更精准地提供建议。若老师有教学大纲,应认真研读并根据需求提出修改建议;若没有大纲,让老师尽可能详细描述课程内容。
2024-10-29
你是一名课程开发专家,现在要以“AI技术在课程设计中的应用“为题展开培训,课程对象是企业内部培训师,时长1天。 课程要解决以下问题: 1.用AI工具做需求数据统计 2.用AI工具设计课程题目 3.用AI工具设计课程大纲。4.用AI工具制作PPT5.用AI工具画配图。 要求如下: 1.需要到三级大纲。 2、结构完整。 格式如下: 一、(一级大纲) 1、(二级大纲) 1.1(三级大纲)
一、AI 技术在课程设计中的应用 1、AI 工具与需求数据统计 1.1 Chat Excel 处理数据 1.2 让 AI 辅助编写苹果系统右键“快速操作”实现一键视频压缩、加速 1.5x 1.3 让 AI 辅助编写苹果“自动操作”实现批量统计学生作业字数 2、AI 工具与课程题目设计 3、AI 工具与课程大纲设计 4、AI 工具与 PPT 制作 5、AI 工具与配图绘制 二、生成式人工智能在教学中的应用 1、生成式人工智能的基本原理 1.1 文生文 1.2 文生图 1.3 文生音频 1.4 文生视频 2、生成式人工智能的最少必要知识 2.1 生成式 AI 原理 2.2 能力范围 2.3 性能参数 3、人工智能的学习方式 3.1 监督学习 3.2 无监督学习 3.3 强化学习 4、生成式人工智能的应用案例 4.1 根据消费者购买行为偏好分组 4.2 手机相册里的人脸识别分类 4.3 根据房屋特征面积预测价格 4.4 垃圾短信检测分类 4.5 汽车自动驾驶或路径规划导航 4.6 高级游戏人机对弈 5、AI 与教育的关系 5.1 AI 辅助教师的一天 5.2 各大模型之间的使用差异 5.3 教师使用 AI 小技巧
2024-10-28
你是一名课程开发专家,现在要以“AI技术在课程设计中的应用“为题展开培训,课程对象是企业内部培训师,时长1天。 课程要解决以下问题: 1.用AI工具做需求数据统计 2.用AI工具设计课程题目 3.用AI工具设计课程大纲。4.用AI工具制作PPT5.用AI工具画配图。 要求如下: 需要到三级大纲。 2、结构完整。 格式如下: 一级大纲) 二级大纲) (三级大纲)
以下是以“AI 技术在课程设计中的应用”为题,为企业内部培训师设计的一天培训课程大纲: 一级大纲) AI 技术在课程设计中的应用概述 二级大纲) AI 技术的基本概念与分类 三级大纲) 监督学习 三级大纲) 无监督学习 三级大纲) 强化学习 三级大纲) 生成式 AI 二级大纲) AI 技术的应用领域与案例 三级大纲) 根据消费者购买行为偏好分组 三级大纲) 手机相册里的人脸识别分类 三级大纲) 根据房屋特征面积预测价格 三级大纲) 垃圾短信检测分类 三级大纲) 汽车自动驾驶或路径规划导航 三级大纲) 高级游戏人机对弈 一级大纲) AI 工具在课程设计中的具体应用 二级大纲) 用 AI 工具做需求数据统计 三级大纲) Chat Excel 处理 Excel 数据 三级大纲) 让 AI 辅助编写苹果系统右键“快速操作”实现一键视频压缩、加速 1.5x 三级大纲) 让 AI 辅助编写苹果“自动操作”实现批量统计学生作业字数 二级大纲) 用 AI 工具设计课程题目 三级大纲) 基于数据分析生成题目 三级大纲) 利用自然语言处理优化题目表述 二级大纲) 用 AI 工具设计课程大纲 三级大纲) 依据需求分析生成大纲框架 三级大纲) 完善大纲细节与逻辑 二级大纲) 用 AI 工具制作 PPT 三级大纲) 内容排版与布局设计 三级大纲) 图表与图片的生成与插入 二级大纲) 用 AI 工具画配图 三级大纲) 选择合适的 AI 绘画工具 三级大纲) 明确配图需求与风格 一级大纲) 相关法规与注意事项 二级大纲) 国家互联网信息办公室等七部门的相关规定 三级大纲) 《生成式人工智能服务管理暂行办法》的解读 一级大纲) 总结与交流 二级大纲) 课程设计实践经验分享 二级大纲) 问题答疑与交流互动
2024-10-28
你是一名课程开发专家,现在要以“AI技术在课程设计中的应用“为题展开培训,课程对象是企业内部培训师,时长1天。 课程要解决以下问题: 1.用AI工具做需求数据统计 2.用AI工具设计课程题目 3.用AI工具设计课程大纲。4.用AI工具制作PPT5.用AI工具画配图。 要求如下: 需要到三级大纲。 2、结构完整。 格式如下: 一级大纲) 二级大纲) (三级大纲)
一级大纲) AI 技术在课程设计中的应用 二级大纲) 用 AI 工具做需求数据统计 利用 Chat Excel 处理 Excel 数据,如批量统计学生作业字数 二级大纲) 用 AI 工具设计课程题目 无 二级大纲) 用 AI 工具设计课程大纲 无 二级大纲) 用 AI 工具制作 PPT 无 二级大纲) 用 AI 工具画配图 无 二级大纲) 生成式人工智能的相关知识 生成式人工智能的基本原理、能力范围、性能参数 二级大纲) 人工智能的学习方式 监督学习、无监督学习、强化学习 二级大纲) AI 的应用场景 根据消费者购买行为偏好分组、手机相册里的人脸识别分类、根据房屋特征面积预测价格、垃圾短信检测分类、汽车自动驾驶或路径规划导航、高级游戏人机对弈
2024-10-28
我计划编写一本关于生成式人工智能的书籍,但是在开始前,我需要确定一个合适的大纲框架来组织我的思路。这个框架应该包括那些部分,以及如何将各个部分连接起来,以便读者能够理解掌握AIGC的概念和应用
以下是为您编写关于生成式人工智能书籍提供的大纲框架建议: 一、引言 介绍编写本书的目的和背景,引导读者进入生成式人工智能的世界。 二、基础概念 1. 什么是生成式人工智能(AIGC) 定义和特点 与传统人工智能的区别 2. 相关技术名词 AI(人工智能) 机器学习(包括监督学习、无监督学习、强化学习) 深度学习(神经网络、神经元) 生成式 AI(可生成文本、图片、音频、视频等内容形式) LLM(大语言模型) 三、AIGC 的应用领域 1. 文字生成(如使用大型语言模型生成文章、故事、对话等) 2. 图像生成(如使用 Stable Diffusion、DALLE 等模型生成艺术作品、照片等) 3. 视频生成(如使用 Runway、KLING 等模型生成动画、短视频等) 四、AIGC 与其他内容生成方式的关系 1. AIGC 与 UGC(用户生成内容) 区别与联系 各自的优势和适用场景 2. AIGC 与 PGC(专业生成内容) 区别与联系 相互的影响和融合 五、技术原理 1. Transformer 模型 自注意力机制 处理序列数据的优势 2. 技术里程碑(如谷歌团队发表的《Attention is All You Need》论文) 六、实际案例分析 展示不同领域中成功的 AIGC 应用案例,分析其实现过程和效果。 七、挑战与展望 1. 面临的挑战(如数据隐私、伦理问题等) 2. 未来发展趋势和前景 八、结论 总结全书重点内容,对 AIGC 的未来发展进行展望。 各个部分之间可以通过逻辑递进、案例引用、对比分析等方式进行连接,使读者能够逐步深入理解掌握 AIGC 的概念和应用。
2024-10-23
请问哪个AI可以投入英语六级大纲词汇呢
目前市面上有一些 AI 工具可以辅助您学习英语六级大纲词汇,例如豆包。您可以通过输入相关指令,让其为您提供词汇的释义、例句、记忆方法等内容。但不同的 AI 工具在功能和效果上可能会有所差异,您可以根据自己的需求和使用体验进行选择。
2024-10-16
现在哪几家的大模型支持通过手机视频多模态实时交流?
以下几家的大模型支持通过手机视频多模态实时交流: 1. PandaGPT:能够理解不同模式的指令并根据指令采取行动,包括文本、图像/视频、音频、热、深度和惯性测量单位。 2. VideoLLaMA:引入了多分支跨模式 PT 框架,使语言模型能够在与人类对话的同时处理给定视频的视觉和音频内容。 3. 视频聊天 GPT:专门为视频对话设计,能够通过集成时空视觉表示来生成有关视频的讨论。 4. NExTGPT:端到端、通用的 anytoany 多模态语言模型,支持图像、视频、音频、文本的自由输入输出。
2024-11-22
siri是不是使用大模型技术
Siri 目前并非使用大模型技术。苹果公司的 Siri 概念虽好,但由于技术限制,其表现未达到人工智能的水平,常被称为“人工智障”。不过,随着技术发展,未来可能会用大模型重新改造 Siri,将手机上的所有功能控制起来,使其成为真正的智能助理。例如,苹果公司在手机算力的芯片发展到能够支撑大模型上手机的情况下,可能会推出大模型的小数据量、专业的版本来替代 Siri。同时,苹果公司若 All in 手机,其大模型可能会是本地化的,以重视个人数据保护和隐私。
2024-11-21
sairi是不是使用大模型技术
Sora 是使用大模型技术的。周鸿祎认为 Open AI 训练这个模型会阅读大量视频,大模型加上 Diffusion 技术需要对世界进一步了解,学习样本以视频和摄像头捕捉到的画面为主。Sora 在训练数据上采用在原始尺寸上进行训练的策略,避免了传统 AI 对人为抽象的依赖。此外,Sora 还采用了一些数据预处理技术,如将视觉图块压缩成低维潜在表示,并将其排列成序列,注入噪声后输入扩散变换器的输入层,同时采用时空分块化来降低后续对时间信息建模的复杂性。这种对原始视频和图像特征的细腻处理标志着生成模型领域的重大进步。
2024-11-21
模型微调怎么解决多轮对话容易受到上轮对话的影响问题
在解决模型微调中多轮对话容易受到上轮对话影响的问题时: 对于多轮对话,现实中常伴随指代问题,如使用“它”“他们”“我们”等代词。若仅依据原始提问检索知识片段,可能导致结果不精确或无法检索到信息。同时,对模型回复内容的限制可能影响多轮对话流畅性甚至中断。 为提升对话系统性能和用户体验,需开发提示词解决多轮对话中的指代消解问题,确保模型能在连续交流中提供准确连贯回答。但由于“指代消解”需多轮对话完成,单次交互无法达成,所以要转换测试形式,先解决“指代消解”问题再进行下一轮答复。 首先准备指代消解所需提示词,这里使用的“指代消解”提示词是用 CoT 写出的思维链,列举不同推理情景,让模型适应并推理出需消解的代词,再根据结果重新组织问题。 接着复现指代消解步骤,如进行第一轮对话,提出问题“尼罗河是什么?”,系统召回相关知识片段并回复,然后开始指代消解。 另外,聊天模型通过一串聊天对话输入并返回生成消息输出。聊天格式虽为多轮对话设计,但对单轮任务也有用。会话通过 messages 参数输入,包含不同角色和内容的消息对象数组。通常会话先有系统消息设定助手行为,再交替使用用户和助手消息。当指令涉及之前消息时,包含聊天历史记录有帮助,若超出模型限制需缩减会话。
2024-11-21
企业做自己的小模型,需要用到的工具及工具背后的公司都有哪些?
企业做自己的小模型,可能会用到以下工具及背后的公司: 1. 在编排(Orchestration)方面,涉及的公司如 DUST、FIAVIE、LangChain 等,其提供的工具可帮助管理和协调各部分及任务,确保系统流畅运行。 2. 部署、可扩展性和预训练(Deployment, Scalability, & PreTraining)类别中,像 UWA mosaicm、NMAREL、anyscale 等公司提供的工具,有助于部署模型、保证可扩展性及进行预训练。 3. 处理上下文和嵌入(Context & Embeddings)的工具,相关公司有 TRUDO、Llamalndex、BerriAI 等,能帮助模型处理和理解语言上下文,并将词语和句子转化为计算机可理解的形式。 4. 质量保证和可观察性(QA & Observability)方面,例如 Pinecone、drant、Vald 等公司提供的工具,可确保模型表现并监控其性能和状态。 此外,还有以下工具和相关公司: 1. 图片生成 3D 建模工具,如 Tripo AI(由 VAST 发布)、Meshy、CSM AI(Common Sense Machines)、Sudo AI、VoxCraft(由生数科技推出)等。 企业还可能涉及具身智能、3D 眼镜、AI 绘本、AI 图书、学习机、飞书的多维表格、蚂蚁的智能体、Coze 的智能体、Zeabur 等云平台、0 编码平台、大模型(通义、智谱、kimi、deepseek 等)、编程辅助、文生图(可灵、即梦等)等方面,可能需要相应资质。
2024-11-20
你认为目前最好用的大模型有哪些?
目前最好用的大模型包括: 1. OpenAI 的 GPT4:是最先进和广泛使用的大型语言模型之一,在多种任务上表现卓越,如文本生成、理解、翻译及各种专业和创意写作任务,能通过大量数据学习理解和生成人类语言,处理复杂问题和理解上下文能力出色。 2. Anthropic 公司的 Claude 3。 3. 谷歌的 Gemini。 4. 百度的文心一言。 5. 阿里巴巴的通义大模型。 大型模型主要分为两类: 1. 大型语言模型:专注于处理和生成文本信息。 2. 大型多模态模型:能够处理包括文本、图片、音频等多种类型的信息。 大型多模态模型与大型语言模型的不同点: 1. 处理的信息类型不同:大型语言模型专注于文本,大型多模态模型能处理多种类型信息。 2. 应用场景不同:大型语言模型主要用于自然语言处理任务,大型多模态模型应用领域更广泛。 3. 数据需求不同:大型语言模型依赖大量文本数据训练,大型多模态模型需要多种类型数据训练。 此外,如果想了解国内的大模型效果,可以参考第三方基准评测报告: 。需注意,内容由 AI 大模型生成,请仔细甄别。
2024-11-19
如何训练Agent?
在人工智能领域中,训练 Agent 主要有以下方法和特点: 1. 基于迁移学习和元学习的 Agent 训练: 传统强化学习中,Agent 训练消耗大量样本和时间,泛化能力不足。为突破此瓶颈,引入迁移学习,促进不同任务间知识和经验迁移,减轻新任务学习负担,提升学习效率和性能,增强泛化能力。 元学习让 Agent 学会从少量样本中迅速掌握新任务最优策略,利用已有知识和策略调整学习路径,减少对大规模样本集依赖。 但迁移学习和元学习面临挑战,如迁移学习在源任务与目标任务差异大时可能无效甚至负面迁移,元学习需大量预训练和样本构建学习能力,使通用高效学习策略开发复杂艰巨。 时间:21 世纪初至今 特点:迁移学习将一个任务知识迁移到其他任务;元学习学习如何学习,快速适应新任务 技术:迁移学习如领域自适应;元学习如 MAML、MetaLearner LSTM 优点:提高学习效率,适应新任务 缺点:对源任务和目标任务相似性有要求 2. 基于强化学习的 Agent 训练: 强化学习关注如何让 Agent 通过与环境互动自我学习,在特定任务中累积最大长期奖励。起初主要依托策略搜索和价值函数优化等算法,如 Qlearning 和 SARSA。 随着深度学习兴起,深度神经网络与强化学习结合形成深度强化学习,赋予 Agent 从高维输入学习复杂策略的能力,有 AlphaGo 和 DQN 等成果。 深度强化学习允许 Agent 在未知环境自主探索学习,无需人工指导,在游戏、机器人控制等领域有应用潜力。 但面临诸多挑战,包括训练周期长、采样效率低、稳定性问题,在复杂真实环境应用困难。 时间:20 世纪 90 年代至今 特点:通过试错学习最优行为策略,以最大化累积奖励 技术:Qlearning、SARSA、深度强化学习(结合 DNN 和 RL) 优点:能够处理高维状态空间和连续动作空间 缺点:样本效率低,训练时间长
2024-11-21
作为ai初学者,想训练自己的个性ai,应该怎么入手
对于 AI 初学者想要训练自己的个性 AI ,可以从以下几个方面入手: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括人工智能的定义、主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,如李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并争取获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,包括图像、音乐、视频等,根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,因其上手容易且实用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出自己的作品。 在知识库中分享实践后的作品和文章。 5. 体验 AI 产品: 与现有的 AI 产品如 ChatGPT、Kimi Chat、智谱、文心一言等聊天机器人进行互动,了解它们的工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,激发对 AI 潜力的认识。 此外,更注重人格属性,试图满足社交、情感、陪伴等需求,您也可以对其进行了解和参考。同时,为了在医疗保健中让 AI 产生真正的改变,应投资于创建像我们今天最优秀的医生和药物开发者那样学习的模型生态系统,例如通过学校教育和经验积累,培养在复杂情况下确定最佳答案的直觉。
2024-11-20
flux lora 训练
以下是关于 Flux 的 Lora 模型训练的详细步骤: 准备工作: 下载所需模型:t5xxl_fp16.safetensors、clip_l.safetensors、ae.safetensors、flux1dev.safetensors。 注意:不使用时模型放置位置不限,只要知道“路径”,后续会引用到“路径”。 训练建议使用 flux1dev.safetensors 版本的模型和 t5xxl_fp16.safetensors 版本的编码器。 下载训练脚本: 夸克网盘链接:https://pan.quark.cn/s/ddf85bb2ac59 百度网盘链接:https://pan.baidu.com/s/1pBHPYpQxgTCcbsKYgBi_MQ?pwd=pfsq 提取码:pfsq 数据集准备: 进入厚德云模型训练数据集:https://portal.houdeyun.cn/sd/dataset 步骤一:创建数据集 在数据集一栏中,点击右上角创建数据集。 输入数据集名称。 可以上传包含图片+标签 txt 的 zip 文件,也可以上传只有图片的文件(之后可在 c 站使用自动打标功能),或者一张一张单独上传照片,但建议提前将图片和标签打包成 zip 上传。 Zip 文件里图片名称与标签文件应当匹配,例如:图片名“1.png”,对应的达标文件就叫“1.txt”。 上传 zip 以后等待一段时间,确认创建数据集,返回到上一个页面,等待一段时间后上传成功,可点击详情检查,预览数据集的图片以及对应的标签。 步骤二:Lora 训练 点击 Flux,基础模型会默认是 FLUX 1.0D 版本。 选择数据集,点击右侧箭头,会跳出所有上传过的数据集。 触发词可有可无,取决于数据集是否有触发词。 模型效果预览提示词则随机抽取一个数据集中的标签填入即可。 训练参数可以调节重复次数与训练轮数,厚德云会自动计算训练步数。如果不知道如何设置,可以默认 20 重复次数和 10 轮训练轮数。 可以按需求选择是否加速,点击开始训练,会显示所需要消耗的算力。 等待训练,会显示预览时间和进度条,训练完成会显示每一轮的预览图。 鼠标悬浮到想要的轮次模型,中间会有个生图,点击会自动跳转到使用此 lora 生图的界面。点击下方的下载按钮则会自动下载到本地。 数据集放置位置:.Flux_train_20.4\\train\\qinglong\\train 运行训练:约 1 2 小时即可训练完成。 验证和 lora 跑图:有 ComfyUI 基础的话,直接原版工作流的模型后面,多加一个 LoraloaderModelOnly 的节点就可以,自行选择您的 Lora 和调节参数。
2024-11-20
如何将历史写过的文章发给 Ai,训练生成写作风格
要将历史写过的文章发给 AI 以训练生成写作风格,可以参考以下步骤: 1. 首先,像安迪的做法一样,把过去写的多篇相关文章发给 AI。 2. 让 AI 总结这些文章的写作特点。 3. 根据 AI 总结的特点,编写出描述写作风格的提示词,从而克隆出自己的写作风格。 4. 未来使用这个风格时,先花 3 分钟时间让 AI 分别写多篇内容。 5. 从多篇内容中找到最符合心意的作品,并从其他作品中寻找好的段落。 6. 最后进行整合、修改、删减和润色,少则几分钟、十几分钟,多则半个小时就能完成一篇文章。 同时,就像夙愿提到的,找选题对于写作很重要。我们可以通过学习其他优秀公众号的文章,分析其选题思路、文章结构、表达方式等,不断训练自己的“写作模型”,但要注意不能照搬,而是要形成自己独特的风格。 另外,在写作过程中,“主体性”的介入也很关键。比如在使用 Prompt 生成公众号文章时,要先思考自己对写作的理解以及对特定主题写作风格的认知,这样写出来的 Prompt 才会有个人特色。日常也要注重基本功的积累,因为在表达“意象”时非常考验语言能力。
2024-11-18
如何用ai模型做训练
以下是关于如何用 AI 模型做训练的相关内容: 要在医疗保健领域让 AI 产生真正的改变,应投资创建像优秀医生和药物开发者那样学习的模型生态系统。成为顶尖人才通常从多年密集信息输入和学徒实践开始,AI 也应如此。当前的学习方式存在问题,应通过堆叠模型训练,如先训练生物学、化学模型,再添加特定数据点。就像预医学生从基础课程学起,设计新疗法的科学家经历多年学习和指导,这种方式能培养处理细微差别决策的直觉。 大模型的构建过程包括: 1. 收集海量数据:如同教孩子博学多才要让其阅读大量资料,对于 AI 模型要收集互联网上的各种文本数据。 2. 预处理数据:像为孩子整理适合的资料,AI 研究人员要清理和组织收集的数据,如删除垃圾信息、纠正拼写错误等。 3. 设计模型架构:为孩子设计学习计划,研究人员要设计 AI 模型的“大脑”结构,通常是复杂的神经网络,如 Transformer 架构。 4. 训练模型:像孩子开始学习,AI 模型开始“阅读”数据,通过反复预测句子中的下一个词等方式逐渐学会理解和生成人类语言。 为提高 AI 模型的鲁棒性,应对可能的“恶意”样本数据导致的幻觉,可使用对抗训练技术,让模型在训练中接触并学会识别和抵抗。
2024-11-13
怎么训练自己的模型
训练自己的模型可以参考以下内容: 基于百川大模型: 选择 Baichuan27BChat 模型作为底模,配置模型本地路径和提示模板。 在 Train 页面里,选择 sft 训练方式,加载定义好的数据集(如 wechat 和 self_cognition)。 注意学习率和训练轮次的设置,要根据数据集大小和收敛情况来调整。 使用 FlashAttention2 可减少显存需求,加速训练速度。 显存小的情况下,可以减少 batch size 并开启量化训练,内置的 QLora 训练方式好用。 需要用到 xformers 的依赖。 显存占用约 20G 左右,训练时间根据聊天记录规模大小而定,少则几小时,多则几天。 训练自己的 AI 绘画模型(Stable Diffusion): 样本采样器(sample_sampler):可选择,默认是“ddim”。 保存模型格式(save_model_as):可选择,SD WebUI 兼容"ckpt"和"safetensors"格式模型。 训练流程主要包括: 训练集制作:数据质量评估、标签梳理、数据清洗、标注、标签清洗、增强等。 训练文件配置:预训练模型选择、训练环境配置、训练步数及其他超参数设置等。 模型训练:运行训练脚本,使用 TensorBoard 监控。 模型测试:用于效果评估与消融实验。 训练资源: Rocky 整理优化过的 SD 完整训练资源 SDTrain 项目,可通过关注公众号 WeThinkIn,后台回复“SDTrain”获取。
2024-11-12
小说创作类型的ai
以下是关于小说创作类型的 AI 相关信息: 在写作方面,有多种 AI 产品可供选择。例如,ChatGPT 在领跑,同时像 Sudowrite 和 Verb.ai 这样的产品也出现了,用于更专业化的写作类型,比如小说。 如果您想用 AI 把小说做成视频,具体的制作流程如下: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 以下是一些可以利用的工具及网址: 1. Stable Diffusion(SD):一种 AI 图像生成模型,可以基于文本描述生成图像。 网址: 2. Midjourney(MJ):另一个 AI 图像生成工具,适用于创建小说中的场景和角色图像。 网址: 3. Adobe Firefly:Adobe 的 AI 创意工具,可以生成图像和设计模板。 网址: 4. Pika AI:文本生成视频的 AI 工具,适合动画制作。 网址: 5. Clipfly:一站式 AI 视频生成和剪辑平台。 网址: 6. VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能。 网址: 7. 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具。 网址: 8. 故事 AI 绘图:小说转视频的 AI 工具。 网址: 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。
2024-11-17
可以写小说的ai软件
以下是一些可以写小说的 AI 软件: Novel.ai:AI 写小说领域的头部应用,是典型的 LLM 产品。其产品功能复杂,但使用模式简单,利用 LLM 的续写能力将写作改造成交互式的文本生成,渐进式生成小段,用户可自由更改或继续生成下一个小段,并基于写作业务抽象出模型风格、写作方式、故事世界、记忆等细分功能。本质上还是构造 Prompt,交互式、渐进式的 Prompt 构建会极大降低使用门槛。 Character.ai:大名鼎鼎的角色扮演类 AI 陪伴产品,服务游戏和二次元用户。使用简单,就是选角色对话,创建也很简单,角色的核心差异靠不同的详细描述,开放用户角色 Prompt 可见。 如果您想用 AI 把小说做成视频,这是一个涉及多个步骤的过程,通常包括以下方面: 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 以下是一些可以利用的工具及网址: Stable Diffusion(SD):一种 AI 图像生成模型,可以基于文本描述生成图像。网址: Midjourney(MJ):另一个 AI 图像生成工具,适用于创建小说中的场景和角色图像。网址: Adobe Firefly:Adobe 的 AI 创意工具,可以生成图像和设计模板。网址: Pika AI:文本生成视频的 AI 工具,适合动画制作。网址: Clipfly:一站式 AI 视频生成和剪辑平台。网址: VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能。网址: 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具。网址: 故事 AI 绘图:小说转视频的 AI 工具。网址: 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。
2024-11-14
可以写小说得ai
以下为您介绍一些关于可以写小说的 AI 相关内容: 2016 年,由人工智能撰写的《电脑写小说的那一天》小说成功通过了日本“星新一文学奖”的初选。Sony 开发的 DeepBach AI 在深度学习巴赫后,创作出的仿巴赫音乐,在 1600 位听众里,骗过了超过一半的人。如今,人工智能已经能生成真假难辨的视频、极具艺术感的图像,并在挑战文学、音乐、绘画、影视等原本属于艺术创作的领域。 Novel.ai 是 AI 写小说领域的头部应用,是典型的 LLM 产品。其产品功能复杂但使用模式简单,包括利用续写能力将写作改造成交互式文本生成、渐进式生成小段、抽象出模型风格等细分功能,本质上还是构造 Prompt,交互式、渐进式的 Prompt 构建会极大降低使用门槛。 如果想用 AI 把小说做成视频,制作流程如下: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。
2024-11-14
ai写小说,哪个软件更好,推荐三个
以下为您推荐三个用于 AI 写小说的软件: 1. Novel.ai:AI 写小说领域的头部应用,是典型的 LLM 产品。其产品功能复杂但使用模式简单,利用 LLM 的续写能力将写作改造成交互式的文本生成,渐进式生成小段,用户可自由更改或继续生成下一个小段,并基于写作业务抽象出模型风格、写作方式、故事世界、记忆等细分功能。本质上还是构造 Prompt,交互式、渐进式的 Prompt 构建会极大降低使用门槛。 2. Character.ai:大名鼎鼎的角色扮演类 AI 陪伴产品,服务游戏和二次元用户。使用简单,就是选角色对话,创建也很简单,角色的核心差异靠不同的详细描述,开放用户角色 Prompt 可见。 3. 筑梦岛:国内的同类产品,和角色聊天、捏角色是共同主题,捏角色的产品化本质是收集信息产生高质量角色 Prompt 的过程,基于聊天模式微创新了很多衍生玩法。
2024-11-07
可以帮我找一款写小说的智能体吗
以下为您推荐几款可用于写小说的智能体: 1. GPT:可以通过设定角色、情节等引导其生成小说内容。 2. 诗歌相机(Poetry Camera):让摄影机去“所见”,让人工智能去“所感”,用技术手段实现文学中难以量化的表达。 3. 在人机协作小说创作中,可以利用 GPT 并采用接龙创作的方式,如让作家们讨论共创,人类掌舵控制情节走向。
2024-11-05
中文短篇小说创作用的最多的ai app
目前在中文短篇小说创作方面,以下是一些常见的 AI 应用: 1. Grammarly、秘塔写作猫:属于 AI 智能写作助手,运用自然语言处理技术,可辅助检查语法、拼写错误并提供改进建议,进行智能润色和内容创作辅助。 2. 小爱同学、Siri:作为 AI 语音助手定制开发产品,采用语音识别和自然语言理解技术,能控制智能家居、回答问题等进行语音交互和任务处理。 如果您想用 AI 把小说做成视频,通常包括文本分析、角色与场景生成、视频编辑与合成等步骤。以下是一些可用的工具及网址: 1. Stable Diffusion(SD):AI 图像生成模型,可基于文本描述生成图像。网址:https://github.com/StabilityAI 2. Midjourney(MJ):适用于创建小说中的场景和角色图像。网址:https://www.midjourney.com 3. Adobe Firefly:Adobe 的 AI 创意工具,能生成图像和设计模板。网址:https://www.adobe.com/products/firefly.html 4. Pika AI:文本生成视频的 AI 工具,适合动画制作。网址:https://pika.art/waitlist 5. Clipfly:一站式 AI 视频生成和剪辑平台。网址:https://www.aihub.cn/tools/video/clipfly/ 6. VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能。网址:https://www.veed.io/zhCN/tools/aivideo 7. 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具。网址:https://tiger.easyartx.com/landing 8. 故事 AI 绘图:小说转视频的 AI 工具。网址:https://www.aihub.cn/tools/video/gushiai/
2024-11-05