Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

那些AI可以自定义训练

Answer

以下是一些可以自定义训练的 AI:

  • Character.ai:这是一个每个人都可定制自己个性化 AI 的平台。在教育领域,它可以让历史人物如牛顿、白居易等为用户授课,实现一对一辅导,还能根据学生情况提供定制化学习计划和资源,提高教育效率和质量,缓解教育资源不平等问题。它更注重人格属性,满足社交、情感、陪伴等需求。该平台也在研发自己的预训练大型语言模型,与聊天机器人互动时会有像与真人对话的感觉。

大型语言模型通过海量预料训练具备了一定智能,涌现出许多有用能力,能通过文字生成方式展现存储的大量知识。以 ChatGPT 为代表的 AI 不再是“人工智障”,能与我们友好对话,ChatGPT 更注重提高效率和解放生产力。面对 AI 技术发展和应用,我们需保持开放心态,思考如何在新情境下建立健康关系。

Content generated by AI large model, please carefully verify (powered by aily)

References

Character.ai:每个人都可定制自己的个性化AI

古时候的苏格拉底、孔子等传道授业解惑,采用的是对话式、讨论式、启发式的教育方法。他们通过向学生提问,引导学生思考和总结出一般性的结论,从而培养学生的批判性思维和创造性思维。如今,借助大型语言模型,人工智能生成的角色可以作为数字教师。例如,让牛顿亲自授课《牛顿运动定律》,让白居易为你讲述《长恨歌》背后的故事。你可以与任何历史人物进行对话交流,知识的获取不再受时空限制。这些人工智能生成的角色博学多能、善解人意,不受情绪左右,基本上可以实现一对一的辅导,让学生的参与感更高。这种技术的发展不仅可以提高教育的效率和质量,还可以让学生更加生动地了解历史和文化,拓宽视野,增强学习兴趣。个性化的数字教师可以根据学生的学习情况、学习兴趣和学习偏好提供定制化的学习计划和学习资源,真正实现因材施教,更好地满足学生的学习需求,提高学习效率和学习成果。数字教师的个性化教育也有望缓解教育资源不平等的问题,让更多的学生有机会接触到优质的教育资源。

Character.ai:每个人都可定制自己的个性化AI

大型语言模型通过海量的预料训练,具备了一定的智能,涌现出了许多有用的能力。模型中存储了大量的知识,这些知识可以通过文字生成的方式进行展现。正因如此,以ChatGPT为代表的AI看起来不再是“人工智障”,而是能够与我们进行非常友好的对话。[Character.ai](http://Character.ai)和ChatGPT侧重不同。前者更注重人格属性,试图满足社交、情感、陪伴等需求。而后者注重提高效率和解放生产力。最后还探讨了一下AI能否与人产生真的情感。面对AI技术的发展和应用,我们需要保持开放的心态,思考如何在新的情境下建立健康的关系。

Character.ai:每个人都可定制自己的个性化AI

[Character.ai](http://Character.ai)也在研发自己的预训练大型语言模型,类似于ChatGPT。因此,在这个平台上与聊天机器人互动,也会感觉像是与真人对话一样。

Others are asking
自定义采样器(高级) Expected all tensors to be on the same device,but found at least two devices,cuda:0 and cpu!(when checking argument for argument mat2 in method wrapper_CUDA_mm)
以下是关于“自定义采样器(高级)”中“Expected all tensors to be on the same device,but found at least two devices,cuda:0 and cpu!(when checking argument for argument mat2 in method wrapper\_CUDA\_mm)”错误的解决办法: 错误原因:Expected all tensors to be on the same device,but found at least two devices,cuda:0 and cpu! 对应插件地址:https://github.com/sipie800/ComfyUIPuLIDFluxEnhanced 资料链接: 百度网盘:通过网盘分享的文件:ComfyUI_PuLID_Flux_ll 链接:https://pan.baidu.com/s/1dMLAb4s0vroO9Zk6ecKb7Q?pwd=cycy 提取码:cycy 来自百度网盘超级会员 v5 的分享 说明文档:https://www.xiaobot.net/post/b98d55699a754b9baac242a3e285be94 由于 AI 技术更新迭代,请以文档更新为准 更多内容收录在:https://xiaobot.net/p/GoToComfyUI 网盘:https://pan.quark.cn/s/129886bbcc61 相关链接: ComfyUI_PuLID_Flux_ll :https://github.com/lldacing/ComfyUI_PuLID_Flux_ll?tab=readmeovfile guozinan/PuLID 模型:https://huggingface.co/guozinan/PuLID/tree/main
2025-02-03
如何实现定时通过用一个指定的豆包智能体给微信好友 发送自定义语音消息,,
要实现定时通过指定的智能体给微信好友发送自定义语音消息,您可以参考以下步骤: 1. 找到相关设置中的高级下开场白,点击展开,填写开场白文案和开场白预置问题。 2. 勾选用户问题建议,在 Bot 回复后,根据 Prompt 提供最多 3 条用户提问建议。 3. 添加语音选择,让智能体不仅会写,还能通过语音交流。 4. 点击“发布”,选择发布平台,如微信客服。 5. 提前准备一个闲置的微信,因为这种方法是非官方接口,有可能微信号会受到官方限制。 6. 点击容器,查看运行的服务,接口文档中可能启动了两个服务。 7. 点击“wcandyaibot”后面的日志按钮,用提前预备好的微信进行扫码。 8. 手动刷新界面验证是否成功,点击“刷新日志”,若显示“WeChat login success”,则微信登录成功。 9. 为确保微信实时在线,点击“日志管理”的“wcandyaibot”的“刷新日志”,若显示“wechat login seccess”则表示微信正常登录中。 10. 把绑定的微信号拉到群里或者单独对话进行效果测试,训练的数据越好,对话效果越好。
2025-01-26
我想实现定时通过用我的声音生成的智能体给微信好友 发送自定义语音消息,,如何实现, 并且帮我做出能实现这个功能的工具
目前暂时没有直接能实现您这个需求的现成工具。但要实现这个功能,可能需要以下步骤: 1. 声音采集与处理:首先需要采集您的声音,并进行处理和特征提取,以便后续生成语音。 2. 智能体开发:利用相关技术开发能够模拟您声音的智能体。 3. 微信接口对接:由于微信的接口限制和安全策略,直接对接微信发送消息可能存在困难,需要寻找合法合规的途径。 4. 定时任务设置:通过编程实现定时发送的功能。 这是一个较为复杂的综合性项目,可能需要涉及语音处理、人工智能、软件开发等多方面的知识和技术。
2025-01-26
我想用AI工具生成PPT,已经有文字内容了,需要AI帮我排版,我可以自定义PPT模板吗?如果可以的话,推荐几个合适的AI工具
您可以自定义 PPT 模板。以下为您推荐几个合适的 AI 工具: 免费工具:讯飞智文(http://zhiwen.xfyun.cn) 付费工具:百度文库、Gamma.app 有的网站,如 tome、gamma,配图也是由 GenAI 根据页面内容生成的。呈现 AI 生成的 PPT 结果,若用户不满意可以自行选择模板。 此外,对于 AI 文章排版工具,以下是一些流行的选择: Grammarly:不仅是语法和拼写检查工具,还提供排版功能,可改进文档整体风格和流畅性。 QuillBot:AI 驱动的写作和排版工具,能改进文本清晰度和流畅性,保持原意。 Latex:虽不是纯粹的 AI 工具,但广泛用于学术论文排版,使用标记语言描述格式,有许多 AI 辅助的编辑器和插件简化排版过程。 PandaDoc:文档自动化平台,使用 AI 帮助创建、格式化和自动化文档生成,适合商业和技术文档。 Wordtune:AI 写作助手,重新表述和改进文本,使其更清晰专业,保持原始意图。 Overleaf:在线 Latex 编辑器,提供丰富模板和协作工具,适合学术写作和排版。 选择合适的 AI 排版工具取决于您的具体需求,如文档类型、出版标准和个人偏好。对于学术论文,Latex 和 Overleaf 受欢迎,因其提供强大排版功能和广泛学术支持。对于一般文章和商业文档,Grammarly 和 PandaDoc 等工具可能更适用。但请注意,内容由 AI 大模型生成,请仔细甄别。
2024-10-08
我是一个程序员,我想快速且有一点深度的重头梳理AGI的原理与自定义AGI应用的开发流程与方法, 请帮我梳理一下AGI学习的路线
以下是为您梳理的 AGI 学习路线: 1. 应用方面: 深入了解 Prompt,选择适合自己的 AI 对话、绘画和语音产品,每天使用并用于解决实际问题或提升效率。 2. 分析方面: 大量阅读各类文章、视频以及行业报告,理解各知识之间的关系。 3. 学习路径方面: 关键词:少就是多、先有个初识、目录索引推荐、兴趣最重要、先动手。 学习路径如同主线+支线的游戏通关。 学以致用,通过学习分享不断填补知识的缝隙来成长。 4. 分类学习方面: 对 AI 学习路径进行了重构,分为了初学者、面向开发应用者、面向使用模型者三个部分。 将课程目录从文章中单独独立出来,并按照初学者、进阶者进行分类。 同时,还可以参考以下个人心得: YoYo 作为文科生,在学习前不理解 AI 和提示词工程,通过不断尝试各种 AI 工具,走了不少弯路。学习后能够搓多 Agent 的智能体,进行营销文案 demo、SQL 代码进阶学习应用,创建多个智能体,并在公司中实践智能客服从创建到应用的过程。 希望以上内容对您有所帮助。
2024-10-08
哪个AI工具可以实现自定义单词记忆
目前暂时没有特定的 AI 工具专门用于自定义单词记忆。但您可以考虑使用一些具有学习和记忆功能的综合性 AI 应用,如豆包,通过与它的交互来制定适合您的单词记忆策略和方法。
2024-09-21
AI生图
以下是关于 AI 生图的详细教程: 一、Liblibai 简易上手教程 1. 定主题:明确您想要生成的图片主题、风格和表达的信息。 2. 选择 Checkpoint:根据主题选择贴近内容的 Checkpoint,如麦橘、墨幽的系列模型。 3. 选择 lora:寻找与生成内容重叠的 lora,以控制图片效果和质量。 4. 设置 VAE:选择 840000 那一串。 5. CLIP 跳过层:设为 2。 6. Prompt 提示词:用英文写需求,使用单词和短语组合,用英文半角逗号隔开,无需考虑语法和长句。 7. 负向提示词 Negative Prompt:同样用英文单词和短语组合,用英文半角逗号隔开。 8. 采样方法:一般选 DPM++2M Karras,也可参考模型作者推荐的采样器。 9. 迭代步数:使用 DPM++2M Karras 时,在 30 40 之间,过多意义不大且慢,过少出图效果差。 10. 尺寸:根据个人喜好和需求选择。 11. 生成批次:默认 1 批。 二、AI 线上绘画教程 1. 背景:工作中需要大量图片时,AI 生图是高效解决办法,主流工具如 midjourney 付费成本高,stable diffusion 硬件门槛不低,可选择免费在线 SD 工具网站如。 2. 目标:让入门玩家在半个小时内自由上手创作绘图。 3. 注意事项:本教程适用于入门玩家,若有疑问可在评论区联系或加微信 designurlife1st 沟通,教程内容会持续更新。 三、Tusiart 简易上手教程 1. 图生图:上传图片后,sd 根据图片、模型、prompt 等信息重绘,重绘幅度越大,输出图与输入图差别越大。 2. 尺寸:太小生成内容有限,太大 AI 易放飞自我,如需高清图,可设中等尺寸并用高分辨率修复。 3. 采样算法:即让 AI 用何种算法生图。 4. 采样次数:次数越多调整越精密,效果理论上更好但耗时越长,并非越多越好。 5. 提示词相关性:数字增大图像更接近提示词,但过高会使图像质量下降。 6. 随机种子 seed:固定种子可对图片进行“控制变量”操作,首次生成图时无种子。 7. Clip Skip:一般设为 2,早期无需过多关注。 8. ENSD:eta 噪声种子增量,默认 0 即可。
2025-02-17
可以用ai做商务服务么,比如帮用户申请个商标
AI 可以在一定程度上辅助商务服务,比如商标申请。商标申请要有区分度,能区分自家与别家产品,不像著作权需考虑独创性等。 关于 AI 作品的相关问题: 微链区块链存证流程: 登录方式:用微信扫码即可登录微链,登录后无需在个人中心完善信息。 存证选择:在页面左上角选择区块链存证,AI 作品一般选此选项。 信息填写:包括存证内容类型、存证附件、存证名称、作品作者、作品简介、著作权人等信息,著作权人可委托登记。 发表信息:填写发表地区、首次发表日期、权力取得方式等。 提交付款:确认存证上传,勾选并提交存证,手机扫码付款 10 元。 查看订单:在个人中心的版权订单中查看处理状态,处理完成后可在区块链版权存证处查看证书。 版权登记:带有 AI 性质或名字的作品无法做著作权登记,选择微链区块链存证有法律效应,且一次存证无需每年续费。 关于侵权问题: AI 生成肖像侵权:用他人著名肖像生成特定形象可能侵犯肖像权和名誉权,用自己肖像则相对安全。 AI 生成人脸相似侵权:若生成的人脸世界上不存在,侵权可能性小;若提示词相同且生成相似,可能侵权,需具体情况具体分析。 简单提示词作品版权:简单提示词生成的作品,法律可能不保护其版权,被搬运时难以有效维权。 以图生图的鉴定:若生成的图与原图看不出相同,一般不侵权,但用与原图无相似之处的图做底图的原因值得思考。 AI 生成音乐侵权:AI 音乐中歌词和旋律与某首歌有相似部分,是否侵权需多元素、多因素整体判断,如相似部分占比、整体结构等。 使用逝者肖像:逝者肖像权永远受保护,使用需谨慎,未造成不良影响且增益的情况下权利人可能不追究。
2025-02-17
写微信小程序,用哪个 ai 代码助手最好
以下是一些适用于写微信小程序的 AI 代码助手推荐: 1. DIN: 搭建 OneAPI 以汇聚整合多种大模型接口。 搭建 FastGpt 作为知识库问答系统。 搭建 chatgptonwechat 接入微信,并配置 FastGpt 把知识库问答系统接入到微信。 2. Cursor: 可通过任意 AI 工具获得代码,专业代码模型表现更优。 网址:https://www.cursor.com/ 3. Deepseek(新手推荐): 网址:https://www.deepseek.com/zh 方便获取游戏代码,国内能访问,网页登录方便,目前完全免费。 4. 通义灵码: 在 Pytharm 中,“文件”“设置”“插件”红色框位置搜索“通义灵码”进行安装(目前免费)。 5. JetBrains 自身的助手插件: 在 Pytharm 中,“文件”“设置”“插件”红色框位置搜索“Jetbrains AI assistant”进行安装(收费,目前有 7 天免费试用)。 6. Marscode 及 Tencent cloud AI code Assistant 等。 7. 无影的晓颖 AI 助手: 内置在云电脑里,使用流畅,但需要在无影的云电脑中。 需要注意的是,不同的 AI 代码助手在生成特定代码时可能有不同的表现,您可以根据自己的需求和实际使用体验进行选择。
2025-02-17
分析化验单的AI
以下是关于分析化验单的 AI 和专利审查方面的 AI 的相关信息: 分析化验单的 AI: 目前没有直接针对分析化验单的具体内容,但在教育领域,AI 已展现出强大的能力。例如,借助大模型可以生成个性化学习和定制化作业,教师拥有 AI 就拥有了源源不断的真题库,学生也拥有了源源不断的错题练习库。 专利审查方面的 AI: 近年来,AI 在专利审查领域得到广泛应用,通过自动化和智能化手段,帮助专利审查员更高效地处理大量专利申请、检索相关文献、评估专利性和创新性等任务。以下是一些具体的应用和平台: 1. 专利检索与分类:AI 可通过自然语言处理和机器学习算法,自动识别和分类专利文献。示例平台如 Google Patents、IBM Watson for IP。 2. 专利分析和评估:AI 能够分析专利文本,评估专利的新颖性和创造性,预测专利的授权可能性。示例平台如 TurboPatent、PatentBot。 3. 自动化专利申请:AI 可以帮助自动生成专利申请文件,减少人工编写和审查时间。示例平台如 Specifio、PatentPal。 4. 专利图像和图表分析:AI 能分析专利申请中的图像和图表,帮助识别和分类技术内容。示例平台如 Aulive、AIpowered image recognition tools。 5. 专利趋势分析和预测:AI 可以分析大量专利数据,识别技术发展趋势和竞争情报,帮助企业和研究机构制定战略决策。示例平台如 Innography、PatSnap。 具体使用这些平台的步骤如下: 1. 注册和登录:在对应的平台上注册账户并登录。 2. 上传专利文献:上传待审查的专利文献或输入检索关键词。 3. 选择分析功能:根据需要选择专利检索、分析、评估或生成功能。 4. 查看结果和报告:查看 AI 生成的检索结果、分析报告和评估结果。 5. 进一步处理:根据分析结果进行进一步的人工审查和处理,或者直接生成专利申请文件。 需要注意的是,以上内容由 AI 大模型生成,请仔细甄别。
2025-02-17
能分析医学化验单的AI有哪些?
以下是一些能够分析医学化验单的 AI 工具: 1. Scite.ai:这是一个为研究人员、学者和行业专业人员打造的创新平台,提供引用声明搜索、自定义仪表板和参考检查等工具,能简化学术工作。 2. Scholarcy:一款科研神器,能从文档中提取结构化数据,并通过知识归纳引擎生成文章概要,包含关键概念、摘要、学术亮点、学术总结、比较分析、局限等板块的内容。 3. ChatGPT:强大的自然语言处理模型,可以提供有关医学课题的修改意见。您可以向它提供您的文章,并提出您的问题和需求,它将尽力为您提供帮助。 需要注意的是,内容由 AI 大模型生成,请仔细甄别。
2025-02-17
如何可以通过ai语音转文字
以下是关于通过 AI 实现语音转文字的相关内容: 可以使用 GVoice 提供的语音录制和识别能力,其中文识别率优秀。语音识别的少量错误,ChatGPT 能正常理解和纠错,衔接较为流畅。 推荐 OpenAI 的 wishper,相关链接:https://huggingface.co/openai/whisperlargev2 。还有一个项目:https://huggingface.co/spaces/sanchitgandhi/whisperjax ,此项目在 JAX 上运行,后端支持 TPU v48,与 A100 GPU 上的 PyTorch 相比,快 70 多倍,是目前最快的 Whisper API。 对于有字幕的 B 站视频,可通过安装油猴脚本获取字幕,然后将字幕文字内容复制发送给 GPTs 进行总结。
2025-02-17
flux lora训练
以下是关于 Flux 的 Lora 模型训练的详细步骤: 模型准备: 1. 下载所需模型:t5xxl_fp16.safetensors、clip_l.safetensors、ae.safetensors、flux1dev.safetensors。 注意:不使用时存放位置不限,只要知晓路径即可。训练时建议使用 flux1dev.safetensors 版本的模型和 t5xxl_fp16.safetensors 版本的编码器。 下载脚本: 1. 网盘链接: 夸克网盘链接:https://pan.quark.cn/s/ddf85bb2ac59 百度网盘链接:https://pan.baidu.com/s/1pBHPYpQxgTCcbsKYgBi_MQ?pwd=pfsq 提取码:pfsq 安装虚拟环境: 1. 下载完脚本并解压。 2. 在文件中找到 installcnqinglong.ps1 文件,右键选择“使用 PowerShell 运行”。 3. 新手在此点击“Y”,然后等待 1 2 小时的下载过程。下载完成后会提示是否下载 hunyuan 模型,选择“n”不用下载。 数据集准备: 1. 进入厚德云 模型训练 数据集:https://portal.houdeyun.cn/sd/dataset 2. 创建数据集:在数据集一栏中,点击右上角创建数据集,输入数据集名称。 可以上传包含图片 + 标签 txt 的 zip 文件,也可以上传只有图片的文件(之后可在 c 站使用自动打标功能),或者一张一张单独上传照片。建议提前将图片和标签打包成 zip 上传,Zip 文件里图片名称与标签文件应当匹配,例如:图片名“1.png”,对应的达标文件就叫“1.txt”。 上传 zip 以后等待一段时间,确认创建数据集。返回到上一个页面,等待一段时间后上传成功,可以点击详情检查,可预览到数据集的图片以及对应的标签。 Lora 训练: 1. 点击 Flux,基础模型会默认是 FLUX 1.0D 版本。 2. 选择数据集,点击右侧箭头,会跳出所有上传过的数据集。 3. 触发词可有可无,取决于数据集是否有触发词。模型效果预览提示词则随机抽取一个数据集中的标签填入即可。 4. 训练参数这里可以调节重复次数与训练轮数,厚德云会自动计算训练步数。如果不知道如何设置,可以默认 20 重复次数和 10 轮训练轮数。 5. 可以按需求选择是否加速,点击开始训练,会显示所需要消耗的算力。 6. 等待训练,会显示预览时间和进度条。训练完成会显示每一轮的预览图。鼠标悬浮到想要的轮次模型,中间会有个生图,点击会自动跳转到使用此 lora 生图的界面。点击下方的下载按钮则会自动下载到本地。 数据集存放位置:.Flux_train_20.4\\train\\qinglong\\train 运行训练:约 1 2 小时即可训练完成。 验证和 lora 跑图:有 ComfyUI 基础的话,直接在原版工作流的模型后面,多加一个 LoraloaderModelOnly 的节点就可以,自行选择您的 Lora 和调节参数。
2025-02-17
LLM 训练推理模型有哪些
以下是一些常见的 LLM 训练推理模型: 1. FengshenbangLM: 地址: 简介:是 IDEA 研究院认知计算与自然语言研究中心主导的大模型开源体系,开源了姜子牙通用大模型 V1,是基于 LLaMa 的 130 亿参数的大规模预训练模型,具备翻译、编程、文本分类、信息抽取、摘要、文案生成、常识问答和数学计算等能力。除姜子牙系列模型之外,还开源了太乙、二郎神系列等模型。 2. BiLLa: 地址: 简介:开源了推理能力增强的中英双语 LLaMA 模型。较大提升 LLaMA 的中文理解能力,并尽可能减少对原始 LLaMA 英文能力的损伤;训练过程增加较多的任务型数据,利用 ChatGPT 生成解析,强化模型理解任务求解逻辑;全量参数更新,追求更好的生成效果。 3. Moss: 地址: 简介:支持中英双语和多种插件的开源对话语言模型,MOSS 基座语言模型在约七千亿中英文以及代码单词上预训练得到,后续经过对话指令微调、插件增强学习和人类偏好训练具备多轮对话能力及使用多种插件的能力。 此外,Andrej Karpathy 的相关介绍中提到了 LLM 训练的一些情况,如训练过程涉及大约 10TB 的文本,通常来源于互联网的抓取,需要大量的互联网资源和一个 GPU 集群,费用大约 200 万美元。Karpathy 的视频还详细介绍了 LLM 训练的全部过程,包括预训练、有监督微调和强化学习等。
2025-02-16
RVC声音模型训练
RVC 声音模型训练是将输入音频转换为训练的声音,即变声。它对训练素材量级要求较高,最少需要 20 分钟的素材才能达到理想效果,并且可以选择是否关联音高,以区分说话和唱歌两个不同场景。 在节目《马上封喉》中,负责马季老师语音生成部分的人员提到,AI 语音主要涉及 TTS(文本转语音)和 RVC 两项技术。此次的 AI 马季主要以 gptsovits 为主。 在 AI 春晚《西游不能停》的创作过程中,尝试了用 RVC 进行 vocal 变声的两种办法,但效果均不理想。第一种方法是训练声音模型后直接变声,存在变声后 AI 味儿太重、丢失原有强调的问题;第二种方法是训练声音模型,自己录 rap 后再变声,但需要在录音时尽量模仿还原出特点和感觉,这涉及到专业配音技巧,超出了能力范围。此外,八戒和沙僧声音的训练文件丢失,效果也不理想。
2025-02-13
怎么训练适合自己的ai智能体
要训练适合自己的 AI 智能体,您可以参考以下内容: 1. 了解智能体的发展历程:智能体大多建立在大模型之上,从基于符号推理的专家系统逐步演进而来。 2. 认识智能体的特点:具有强大的学习能力、灵活性和泛化能力,能通过大量数据学习,适应不同任务和环境,将知识泛化到新情境。 3. 掌握核心要点:智能体的核心在于有效控制和利用大型模型,提示词设计直接影响智能体的表现和输出结果。 4. 实践操作: 基于公开的大模型应用产品(如 Chat GLM、Chat GPT、Kimi 等)尝试开发。 点击“浏览 GPTs”按钮和“Create”按钮创建自己的智能体。 使用自然语言对话或手工设置进行具体操作。 开始调试智能体并发布。 5. 在正式项目中部署 AI 智能体的建议: 先尝试使用提示,无法满足需求再考虑微调。 编写并测试提示,以其作为微调基线。 关注数据质量,必要时修正问题数据。 用真实场景数据微调,保留测试集。 选择适当的模型规模,设立快速评估指标。 执行完整评估,持续优化,灵活应变。
2025-02-12
大模型是怎么训练的
大模型的训练过程可以类比为“上学参加工作”: 1. 找学校:训练大模型需要大量的计算,因此 GPU 更合适,只有购买得起大量 GPU 的才有资本训练自己的大模型。 2. 确定教材:大模型需要大量的数据量,几千亿序列(Token)的输入基本是标配。 3. 找老师:即用合适的算法讲述“书本”中的内容,让大模型能够更好理解 Token 之间的关系。 4. 就业指导:学完书本中的知识后,为了让大模型能够更好胜任某一行业,需要进行微调(fine tuning)指导。 5. 搬砖:就业指导完成后,就要正式干活了,比如进行一次翻译、问答等,在大模型里称之为推导(infer)。 在 LLM 中,Token 被视为模型处理和生成的文本单位。它们可以代表单个字符、单词、子单词,甚至更大的语言单位,具体取决于所使用的分词方法(Tokenization)。Token 是原始文本数据与 LLM 可以使用的数字表示之间的桥梁。在将输入进行分词时,会对其进行数字化,形成一个词汇表。比如:The cat sat on the mat,会被分割成“The”、“cat”、“sat”等的同时,会生成相应的词汇表。 此外,训练大模型的具体操作步骤如下: 1. 创建数据集:进入厚德云模型训练数据集(https://portal.houdeyun.cn/sd/dataset),在数据集一栏中,点击右上角创建数据集,输入数据集名称。zip 文件可以是包含图片+标签 txt,也可以只有图片没有打标文件(之后可以在 c 站使用它的自动打标功能)。也可以一张一张单独上传照片,但建议提前把图片和标签打包成 zip 上传。Zip 文件里图片名称与标签文件应当匹配,例如:图片名"1.png",对应的达标文件就叫"1.txt"。上传 zip 以后等待一段时间,确认创建数据集,返回到上一个页面,等待一段时间后就会上传成功,可以点击详情检查,可以预览到数据集的图片以及对应的标签。 2. Lora 训练:点击 Flux,基础模型会默认是 FLUX 1.0D 版本。选择数据集,点击右侧箭头,会跳出所有上传过的数据集。触发词可有可无,取决于数据集是否有触发词。模型效果预览提示词则随机抽取一个数据集中的标签填入即可。训练参数这里可以调节重复次数与训练轮数,厚德云会自动计算训练步数。如果不知道如何设置,可以默认 20 重复次数和 10 轮训练轮数。可以按需求选择是否加速,点击开始训练,会显示所需要消耗的算力。然后就可以等待训练了,会显示预览时间和进度条。训练完成的会显示出每一轮的预览图。鼠标悬浮到想要的轮次模型,中间会有个生图,点击会自动跳转到使用此 lora 生图的界面。点击下方的下载按钮则会自动下载到本地。 从原理层面,用数学来理解 Prompt:传统的机器学习是 p,假设 a 是训练出来的通用模型,这个模型没有经过人工标注,但什么都可以学会。给出的 Prompt 其实就是 x,然后让大模型基于这个 x 知道概率最大的 y,这样就避免了人工标注,但依赖于 x 给入的信息,去更大概率找到合适的 y。比如给一张照片,然后输入这是一个动物,这是什么,大模型根据这个输入,提取照片的特征和提示作为输入,最终返回猫。
2025-02-11
Ai训练营课程大纲
以下是 AI 实训营的课程大纲: 第一期: |时间|主题|课程内容| |||| |01/07 20:00<br><br>必须了解的企业级 AI 应用开发知识点|阿里云百炼大模型平台全解析<br>企业级服务场景对号入座<br>百闻不如体验,实操方有感知| |01/08 20:00<br><br>更好用的文本知识库应用跟学,快速上手阿里云百炼|生态能力解析:手把手案例带做<br>服务场景透视:企业级案例应用<br>AI 机器人搭建:企业知识问答场景全覆盖| |01/09 20:00<br><br>更热门的多模态交互案例带练,实操掌握 AI 应用开发|阿里云百炼大模型多模态能力解析<br>商家运营场景&企业级解决方案分享<br>实践课堂:拍立得场景构建| 第二期: |时间|主题|课程内容| |||| |01/22 20:00<br>|0 基础入门篇:写代码像聊天一样简单<br>可以进入钉钉群获取更多文档:https://alidocs.dingtalk.com/i/nodes/yQod3RxJKGvvkP3rfj5Lgoy7Jkb4Mw9r?utm_scene=person_space|AI 编程的能力与边界<br>通义灵码上手指南<br>一句话 AI 编程小游戏展示| |01/23 20:00<br>|AI 编程实战篇:人人都能“福从天降”|0 基础带练“福从天降”小游戏<br>自然语言生成更多小游戏<br>如何在 Github 部署并生成在线链接| 此外,入门篇还包括多模态能力及相关内容介绍,如前两日课程回顾、多模态能力介绍、应用案例体验、学习资源与作业、未来合作与更新等。
2025-02-10