Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

学习ai有哪些方向可以选择

Answer

学习 AI 有以下几个方向可供选择:

  1. 编程语言基础:可以从 Python、JavaScript 等编程语言开始学习,掌握编程语法、数据结构、算法等基础知识,为后续的 AI 学习奠定基础。
  2. 工具和平台体验:尝试使用如 ChatGPT、Midjourney 等 AI 生成工具,体验其应用场景。也可以探索面向特定群体的教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。
  3. 基础知识学习:
    • 了解 AI 的基本概念、发展历程、主要技术(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。
    • 学习 AI 在教育、医疗、金融等领域的应用案例。
  4. 实践项目参与:参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动,尝试利用 AI 技术解决生活中的实际问题,培养动手能力。
  5. 关注前沿动态:关注 AI 领域的权威媒体和学者,了解 AI 技术的最新进展,思考其对未来社会的影响,培养思考和判断能力。
  6. 特定模块深入:根据自身兴趣选择特定模块,如图像、音乐、视频等进行深入学习,掌握提示词技巧。
  7. 与 AI 产品互动:使用如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解其工作原理和交互方式。
  8. 结合特定领域:如将 AI 与宠物行业结合,包括 AI 宠物助手(自动识别宠物情绪、提供饮食建议、监测健康状况等)、AI 宠物互动玩具、AI 宠物图像生成、AI 宠物医疗诊断、AI 宠物行为分析等,需要掌握基础的 AI 技术,了解宠物相关领域知识,关注应用案例并尝试开发原型。
Content generated by AI large model, please carefully verify (powered by aily)

References

问:中学生如何开始学习 AI,有哪些好用的工具或者平台?

我总结了以下中学生学习AI的建议:1.从编程语言入手学习可以从Python、JavaScript等编程语言开始学习,这些是AI和机器学习的基础。学习编程语法、数据结构、算法等基础知识,为后续的AI学习打下基础。2.尝试使用AI工具和平台可以使用ChatGPT、Midjourney等AI生成工具,体验AI的应用场景。探索一些面向中学生的AI教育平台,如百度的"文心智能体平台"、Coze智能体平台等。3.学习AI基础知识了解AI的基本概念、发展历程、主要技术如机器学习、深度学习等。学习AI在教育、医疗、金融等领域的应用案例。4.参与AI相关的实践项目可以参加学校或社区组织的AI编程竞赛、创意设计大赛等活动。尝试利用AI技术解决生活中的实际问题,培养动手能力。5.关注AI发展的前沿动态关注AI领域的权威媒体和学者,了解AI技术的最新进展。思考AI技术对未来社会的影响,培养对AI的思考和判断能力。总之,中学生可以从编程基础、工具体验、知识学习、实践项目等多个方面入手,全面系统地学习AI知识和技能,为未来的AI发展做好准备。内容由AI大模型生成,请仔细甄别

问:新手如何学习 AI?

了解AI基本概念:首先,建议阅读「[从这里启程](https://waytoagi.feishu.cn/wiki/PFXnwBTsEiGwGGk2QQFcdTWrnlb?table=blkjooAlLFNtvKJ2)」部分,熟悉AI的术语和基础概念。了解什么是人工智能,它的主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。浏览入门文章,这些文章通常会介绍AI的历史、当前的应用和未来的发展趋势。开始AI学习之旅:在「[入门:AI学习路径](https://waytoagi.feishu.cn/wiki/ZYtkwJQSJiLa5rkMF5scEN4Onhd?table=tblWqPFOvA24Jv6X&view=veweFm2l9w)」中,你将找到一系列为初学者设计的课程。这些课程将引导你了解生成式AI等基础知识,特别推荐李宏毅老师的课程。通过在线教育平台(如Coursera、edX、Udacity)上的课程,你可以按照自己的节奏学习,并有机会获得证书。选择感兴趣的模块深入学习:AI领域广泛(比如图像、音乐、视频等),你可以根据自己的兴趣选择特定的模块进行深入学习。我建议你一定要掌握提示词的技巧,它上手容易且很有用。实践和尝试:理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出你的作品。在知识库提供了很多大家实践后的作品、文章分享,欢迎你实践后的分享。体验AI产品:与现有的AI产品进行互动是学习AI的另一种有效方式。尝试使用如ChatGPT、Kimi Chat、智谱、文心一言等AI聊天机器人,了解它们的工作原理和交互方式。通过与这些AI产品的对话,你可以获得对AI在实际应用中表现的第一手体验,并激发你对AI潜力的认识。

问:AI 怎么和宠物结合?

我总结了以下关于AI+宠物赛道的一些例子和学习路径:1.AI宠物助手-基于自然语言处理和计算机视觉的AI宠物助手,可以帮助主人更好地照顾宠物-例如自动识别宠物情绪、提供饮食建议、监测宠物健康状况等2.AI宠物互动玩具-利用AI技术开发的智能互动玩具,可以增强宠物的娱乐体验-例如会自主移动并引起宠物注意的智能玩具、会发出声音和互动的智能宠物玩具等3.AI宠物图像生成-使用生成式AI模型,可以根据文字描述生成各种宠物形象的图像-这可以帮助宠物主人定制个性化的宠物形象4.AI宠物医疗诊断-利用计算机视觉和机器学习技术,可以开发AI辅助的宠物医疗诊断系统-通过分析宠物的症状图像和病历数据,提供初步诊断建议5.AI宠物行为分析-基于传感器数据和计算机视觉,可以利用AI技术分析宠物的行为模式-帮助主人更好地了解宠物的需求和习性学习路径建议:1.掌握基础的机器学习、计算机视觉、自然语言处理等AI技术2.了解宠物行为学、宠物医疗等相关领域知识3.关注业内先进的AI+宠物应用案例,学习其技术实现4.尝试开发简单的AI宠物应用原型,并不断迭代优化总的来说,AI+宠物是一个充满想象空间的新兴赛道,结合AI技术和宠物行业需求,可以开发出各种有趣有用的应用。内容由AI大模型生成,请仔细甄别

Others are asking
你能回答关于AI以外的事情吗?有关于AI的方面你又知道多少。
以下是关于 AI 的相关知识: 1. 基础方面: 背景知识:包括人工智能、机器学习、深度学习的定义及其之间的关系。 历史发展:简要回顾 AI 的发展历程和重要里程碑。 数学基础: 统计学基础:熟悉均值、中位数、方差等统计概念。 线性代数:了解向量、矩阵等线性代数基本概念。 概率论:基础的概率论知识,如条件概率、贝叶斯定理。 2. 算法和模型: 监督学习:了解常用算法,如线性回归、决策树、支持向量机(SVM)。 无监督学习:熟悉聚类、降维等算法。 强化学习:简介强化学习的基本概念。 3. 评估和调优: 性能评估:了解如何评估模型性能,包括交叉验证、精确度、召回率等。 模型调优:学习如何使用网格搜索等技术优化模型参数。 4. 神经网络基础: 网络结构:理解神经网络的基本结构,包括前馈网络、卷积神经网络(CNN)、循环神经网络(RNN)。 激活函数:了解常用的激活函数,如 ReLU、Sigmoid、Tanh。 关于 WaytoAGI 网站,它提供以下功能: 1. 和 AI 知识库对话:您可以在这里问任何关于 AI 的问题。 2. AI 网站:集合了精选的 AI 网站,按需求找到适合您的工具。 3. AI 提示词:集合了精选的提示词,可以复制到 AI 对话网站来使用。 4. 知识库精选:将每天知识库的精华内容呈现给大家。 请注意,我只能为您提供与 AI 相关的知识和指导,对于其他非 AI 领域的内容,我的知识库中没有相关信息。
2025-02-16
我想学习可灵ai的提示词
以下是一些关于可灵 AI 提示词的相关资源和信息: 提示词模板相关网站: 生成新年场景的提示词示例: 戴着醒狮帽,双手抱拳,红色背景,新年喜庆。背景中有金粉,碎花,3d 爆竹显得热闹而喜庆 拿着"福"字,新年气氛,红色背景,新年喜庆。背景中有金粉,碎花,3d 爆竹显得热闹而喜庆 关于律师如何写好提示词用好 AI 的观点: 不能期待设计一个完美的提示词,然后 AI 百分百给到一个完美的符合要求的答案,中间不能有谬误,否则就是一个需要修复的“BUG”。 要给到 AI 的提示词实际上是一个关于此项问题的相对完善的“谈话方案”,真正的成果需要在对话中产生,并且在对话中限缩自己思维中的模糊地带。
2025-02-16
非计算机专业出身,怎样快速入门ai
对于非计算机专业出身想要快速入门 AI 的人,以下是一些建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,您能找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,您可以根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 此外,对于不会代码的您,20 分钟上手 Python + AI 的方法如下: 在深入学习 AI 时,许多朋友发现需要编程,变得头大。同时,各类教程都默认您会打命令行,导致入门十分困难。鉴于此,就有了这份简明入门,旨在让大家更快掌握 Python 和 AI 的相互调用,并使您在接下来的 20 分钟内,循序渐进的完成以下任务: 1. 完成一个简单程序。 2. 完成一个爬虫应用,抓取公众号文章。 3. 完成一个 AI 应用,为公众号文章生成概述。 一些背景: 1. 关于 Python: Python 就像哆拉 A 梦,它拥有一个百宝袋,装满了各种道具,被称为标准库。当遇到问题时,都可以拿出来直接使用。 如果百宝袋里的道具不够用,还可以打电话给未来百货,去订购新道具。在这里:打电话对应 pip 一类的工具,可以用来订购任何的道具;未来百货对应 GitHub 一类的分享代码的平台,里面啥都有。 Python 被全世界广泛使用,尤其是在 AI 领域,所以遍地是大哥。 2. 关于 OpenAI API: OpenAI 通过两种方式提供服务:其一,通过 ChatGPT,提供开箱即用的服务,直接对话即可,简单直观;其二,通过 OpenAI API,提供更加灵活的服务,通过代码调用,来完成更多自动化任务,比如全自动将本地的 1 万本小说,从中文翻译成英文。 欢迎来到“AI 企业落地应用”专栏,在这里,我们将分享 AI 技术在真实商业场景中落地应用的有趣案例故事和实战经验教训。做为铺垫和开始,这是一篇能带你快速搞懂本轮 AI 大模型革命相关核心知识信息的文章,我们将从历史到今天,从原理到应用,从产业到趋势,用尽可能通俗易懂但又不失专业严谨的方式,带你快速走入 AI 的世界,跟上 AI 大势。阅读提示:为了方便没有计算机学习背景但又热衷学习 AI 应用的伙伴更好的阅读,下面的内容可能会使用打比方、作类比的方式来让那些晦涩枯燥的知识变得更为有趣和更容易入心入脑,帮助于您在学习应用 AI 的路上走得更加顺畅和稳健,但这也势必会一定程度带来专业性上的不严谨,我们将会显性的做出标注提示,方便您识别,您可以关注文末的论文推荐导引,去了解真实的技术细节。此外,文章中可能还会涉及一些相对专业和可能超纲的知识内容,我们也将会显性的做出标注提示,告诉您这部分内容即使不懂,也完全没关系,可以放心跳过,不必焦虑。
2025-02-16
如何用ai生成海报和视频
以下是使用 AI 生成海报和视频的方法: 1. 利用飞书多维表格字段插件生成海报: 第一步,用 AI 插件理解图片。上传参考的海报图片,在飞书多维表格中选择字段捷径,于 AI 中心找到智谱 AI 的内容生成插件。配置提示文本,如“详细描述下海报中的内容”,选择上传图片的所在列和模型 glm4v。很快 AI 就能将海报内容整理并填充到对应列中。 第二步,生成视频的指令。用飞书自带的插件总结宣语,生成视频的 prompt 指令。先将海报内容总结为活动宣传语,自定义总结要求为:根据活动海报的描述文案,总结为一句话的活动宣传语,删除日期时间,把活动的品牌统一更换为“智谱 AI”,采用小红书风格,有鲜明记忆点且不超过 50 字。然后使用飞书自带的自定义 AI 插件,输入指令生成视频所需的 prompt 指令,文案引用刚才的总结宣传语,要求画面描述开头包含“卡通风格,镜头从远推进:”,用英文生成,适合模型指令格式且不超过 100 个字。 2. 在 Adobe 产品中生成带有文本提示和图像的视频:在 Advanced 部分,可使用 Seed 选项添加种子编号来控制 AI 创建内容的随机性。若使用相同的种子、提示和控制设置,能重新生成类似的视频剪辑。选择 Generate 进行生成。 3. 关于一些基础通识: 多模态大模型基于大圆模型,能识别页面组件结构和位置绝对值信息,由解码器、backbone、Generator 等部件组成,左侧多模态理解,右侧生成输出。 stable diffusion 模型是生成模型,通过加噪和去噪实现图像的正向扩散和反向还原,可应用于带货商品图生成、模特服装展示、海报生成、装修设计等场景。 吉梦 AI 提供 AI 视频生成等能力,吐司是类似的在线生成平台,二者都可通过输入提示词生成图片。 AI 视频生成原理主要基于 Sara 的整体架构,采用 diffusion Transformer 架构,以扩散模型通过随机造点、加噪和去噪得到连续图像帧。Meta 的视频生成模型能生成视频和声音,可替换视频中的物体和人脸,其把 diffusion 架构换成纯 transformer 架构,基于 LLAMA3 训练。
2025-02-16
AI作图学习
以下是关于 AI 作图学习的全面指导: 比赛要求: 参加由麦乐园和摩达社区发起的“AI 梦一单一世界”比赛,需用摩搭平台和麦橘超然模型作为底膜训练 Lora,提交训练好的 Lora 及用其生成的六张以上高质量、展现完整世界观的作品。 作图思路: 1. 明确创作主题即锚点,根据 Lora 风格确定创作方向。 2. 确定主体,联想主体的角色设定。 3. 增加叙事感,让画面有一到两个及以上角色,制造反差和联想。 图片构成因素: 好看的图片的构成因素包括构图、色彩以及光影。 创作有趣作品: 通过运用反差制造有冲击力的画面,创作出有叙事感和趣味性的作品。 构图相关: 1. 概念:构图指在框架或空间内元素的摆放位置、形状、物体形状及纹理等,好的构图能引导观看者并创造和谐平衡。 2. 分类:包括景别(远景、全景、中景、近景、特写)和拍摄视角(俯视、平视、仰视,正面、侧面、背面)。 3. 要素:有主体、陪体、前景、背景、点线面,合理运用可丰富画面。 4. 方式:如点中心构图、九宫格构图、三分法构图、对称构图、对角线构图、曲线构图、框架构图、三角形构图等。在 AI 绘图中,推荐中景及以上景别,全身景别可能需开 AD 跳以确保作图质量。 实操演示相关: 1. 趣味性与美感:趣味性通过反差、反逻辑、超现实方式带来视觉冲击,美感需在美术基础不出错前提下形式与内容结合。 2. 纹身图创作:强调人机交互,对输出图片根据想象进行二次和多次微调,确定情绪、风格等锚点再发散联想。 3. 提示词编写:用自然语言详细描述画面内容,避免废话词,Flux 对提示词的理解和可控性强。 4. 实操演示准备:以未发布的 Lora 为例,按赛题需求先确定中式或日式怪诞风格的创作引子。 5. 人物创作过程:从汉服女孩入手,逐步联想其颜色、发型、妆容、配饰、表情、背景等元素编写提示词。 6. 中式风格图像生成:包括人物(如穿蓝色汉服女孩的半身像,包括发型、妆容、服饰、配饰等特征,以及光线、环境等元素)、动物(如蛇、孔雀等,涉及颜色、姿态、所处环境等描述)、景观(如中式宫殿、桃花树等室外景观)图像的生成尝试及效果分析。 此外,还有个人学习经历分享,如二师兄在 2024 年 2 月接触 AI 绘画,3 月啃完 SD 的所有教程并开始炼丹,4 月与小伙伴探讨 AI 变现途径,5 月因工作变动开启无硬件支持的 AI 学习之路,并加入 Prompt battle 社群学习 Midjourney。
2025-02-16
我现在想根据我的博士论文,想出一个国家社科基金的选题。但是我的博士论文感觉核心不是特别突出,我希望找到一个AI助手,让AI帮我读论文的PDF格式然后总结出一个最合适的选题,有没有推荐的AI工具?
以下是一些关于利用 AI 辅助完成您需求的建议: 1. 先拆解您的博士论文工作流程,搞清楚每个步骤的输入输出和相互关系。 2. 思考论文中的哪些环节可以引入 AI 工具来提效,一切要从业务逻辑出发,AI 是锦上添花,不能本末倒置。 3. 搭建选题库,明确论文的定位(可用 AI 辅助分析),找相关的对标论文和优秀研究。 4. 在写作环节,可用 AI 辅助拆解对标论文,提炼写作技巧,然后根据借鉴的技巧结合自身特色列出写作大纲,并使用 AI 优化大纲、查找资料、润色文章,但核心内容要自己完成,不能过度依赖 AI。 5. 起标题与配图方面,用 AI 辅助批量生成标题,再自己修改优化,评估标题是否足够吸引眼球,让 AI 分析论文提供配图建议,去免费图库搜索配图。 6. 养成习惯与总结,做每件事前都思考 AI 能提供什么帮助,把整套流程实践几次,形成肌肉记忆,不断打磨完善属于自己的 AI 辅助流程,同时警惕过度依赖,AI 只是辅助,核心能力要靠自己。 目前常见的可用于辅助您的 AI 工具如 ChatGPT 等,但具体的选择还需根据您的实际需求和使用体验来决定。
2025-02-16
stable diffusion学习
以下是关于 Stable Diffusion 学习的相关内容: 一、为什么要学 Stable Diffusion 以及它的强大之处 简单来说,Stable Diffusion 是一个 AI 自动生成图片的软件。通过输入文字就能生成对应的图片,无需像以前那样画图或拍照。学习它非常简单,目的是花更少时间快速入门。如果时间充裕,了解其原理也可以。 二、学习 SD 的 Web UI 步骤 1. 安装必要的软件环境 安装 Git 用于克隆源代码。 安装 Python 3.10.6 版本,确保勾选“Add Python 3.10 to PATH”选项。 安装 Miniconda 或 Anaconda 创建 Python 虚拟环境。 2. 克隆 Stable Diffusion Web UI 源代码 打开命令行工具,输入命令 git clone https://github.com/AUTOMATIC1111/stablediffusionwebui.git,将源代码克隆到本地目录。 3. 运行安装脚本 进入 stablediffusionwebui 目录。 运行 webuiuser.bat 或 webui.sh 脚本,它会自动安装依赖项并配置环境。等待安装完成,命令行会显示 Web UI 的访问地址。 4. 访问 Web UI 界面 复制命令行显示的本地 Web 地址,在浏览器中打开,即可进入 Stable Diffusion Web UI 的图形化界面。 5. 学习 Web UI 的基本操作 了解 Web UI 的各种设置选项,如模型、采样器、采样步数等。 尝试生成图像,观察不同参数对结果的影响。 学习使用提示词(prompt)来控制生成效果。 6. 探索 Web UI 的扩展功能 了解 Web UI 支持的各种插件和扩展,如 Lora、Hypernetwork 等。 学习如何导入自定义模型、VAE、embedding 等文件。 掌握图像管理、任务管理等技巧,提高工作效率。 三、Stable Diffusion 的原理及相关组件 1. 在传统扩散模型中存在计算效率挑战,Stable Diffusion 是为解决此问题提出的新方法,最初称为潜在扩散模型。 2. Stable Diffusion 是扩散模型的变体,核心组件包括: CLIP:将用户输入的 Prompt 文本转化成 text embedding。 VAE EncoderDecoder。 UNET:进行迭代降噪,在文本引导下进行多轮预测。 此外,还涉及 ComfyUI 存放路径、不同的模型(如 SD1.5、SDXL)、训练方法(如 DreamBooth)、模型格式(如.pt 和.safetensor)、微调模型、融合模型等内容。
2025-02-16
全不懂AI的人怎么学习AI?
对于完全不懂 AI 的人,以下是一些学习 AI 的建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,可根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 此外,还可以参考《雪梅 May 的 AI 学习日记》挑战 100 天和 AI 做朋友: 1. 适合纯 AI 小白:可先看左边的目录,从一开始的到处看看到走在学习 AI 的轨道上。 2. 学习模式:输入→模仿→自发创造。 3. 学习内容:去 waytoAGI 社区发现自己感兴趣的 AI 领域,学习最新的内容。 4. 时间安排:在半年多的时间跨度中,有空的时候学习。 5. 学习状态:保持良好的学习状态,能学多少算多少。 6. 费用:学习资源的内容都是免费开源的。 对于中学生学习 AI 的建议: 1. 从编程语言入手学习: 从 Python、JavaScript 等编程语言开始,学习编程语法、数据结构、算法等基础知识。 2. 尝试使用 AI 工具和平台: 使用 ChatGPT、Midjourney 等 AI 生成工具,体验应用场景。 探索面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识: 了解基本概念、发展历程、主要技术如机器学习、深度学习等。 学习在教育、医疗、金融等领域的应用案例。 4. 参与 AI 相关的实践项目: 参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动。 尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 5. 关注 AI 发展的前沿动态: 关注权威媒体和学者,了解最新进展。 思考对未来社会的影响,培养思考和判断能力。
2025-02-15
如何学习ai绘图
以下是关于如何学习 AI 绘图的指导: 一、比赛与训练要求 参加由麦乐园和摩达社区发起的“AI 梦一单一世界”比赛,需用摩搭平台和麦橘超然模型作为底膜训练 Lora,并提交训练好的 Lora 及用其生成的六张以上高质量、展现完整世界观的作品。 二、作图思路 作图分三步: 1. 明确创作主题即锚点,根据 Lora 风格确定创作方向。 2. 确定主体,联想主体的角色设定。 3. 增加叙事感,让画面有一到两个及以上角色,制造反差和联想。 三、图片构成因素 好看的图片的构成因素包括构图、色彩以及光影。 四、构图相关知识 1. 概念:构图指在框架或空间内元素的摆放位置、形状、物体形状及纹理等,好的构图能引导观看者并创造和谐平衡。 2. 分类:包括景别(远景、全景、中景、近景、特写)和拍摄视角(俯视、平视、仰视,正面、侧面、背面)。 3. 要素:有主体、陪体、前景、背景、点线面,合理运用可丰富画面。 4. 方式:如点中心构图、九宫格构图、三分法构图、对称构图、对角线构图、曲线构图、框架构图、三角形构图等。在 AI 绘图中,推荐中景及以上景别,全身景别可能需开 AD 跳以确保作图质量。 五、AI 绘画的定义与发展 AI 绘画是指利用人工智能技术,通过算法和模型让计算机生成具有一定艺术效果的图像。早期成果较为简单和粗糙,随着技术进步,尤其是深度学习算法的应用,如卷积神经网络等,能够生成更加复杂、逼真和富有创意的图像。如今涵盖各种风格和题材,在与人类艺术家的互动和融合中不断创新,为艺术创作带来新的可能性和挑战。 六、场景应用 1. 广告设计:可快速生成各种创意概念图,为广告策划提供灵感和初稿。 2. 游戏开发:用于创建游戏场景、角色形象等,提高开发效率。 3. 影视制作:辅助生成特效场景、概念设计等。 4. 建筑设计:帮助设计师构想建筑外观和内部布局。 七、工具选择与教程 1. 主流工具如 midjourney(MJ)付费成本较高,stable diffusion(SD)硬件门槛不低。 2. 免费在线 SD 工具网站如。 3. 本教程适用于入门玩家,计划让读者用半个小时就能自由上手创作绘图。如果半个小时不足以让您理解工具如何使用,可通过评论区、微信(designurlife1st,记得备注来意:ai 绘图交流)与作者沟通。教程内容会持续更新。 希望以上内容对您学习 AI 绘图有所帮助。
2025-02-15
AI提示词学习
以下是关于新手学习 AI 提示词的综合指导: 了解 AI 基本概念: 建议阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。同时浏览入门文章,了解 AI 的历史、当前应用和未来发展趋势。 开始 AI 学习之旅: 在「」中,能找到为初学者设计的课程,特别推荐李宏毅老师的课程。还可以通过在线教育平台(如 Coursera、edX、Udacity)按照自己的节奏学习,并可能获得证书。 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,可根据兴趣选择特定模块深入学习,提示词技巧上手容易且有用。 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品制作作品。知识库中有很多实践后的作品和文章分享,欢迎您实践后也进行分享。 体验 AI 产品: 与现有的 AI 产品互动,如 ChatGPT、Kimi Chat、智谱、文心一言等聊天机器人,了解其工作原理和交互方式,获得实际应用中的第一手体验。 提示词学习要点: 1. 一个月后开始学习提示词,可复制社区里他人的提示词。 2. 小白制作 AI 视频要做好脚本即提示词,了解主体、动作、场景,避免使用专有名词和网络名词,给 AI 清晰描述。 3. 学习提示词的步骤: 要有一个大模型帐号,至少熟悉和它们对话的方式。推荐 ChatGPT4 及国产平替:。 看 OpenAI 的官方文档,如「」。
2025-02-15
AIagent的发展方向
AI Agent 被认为是大模型未来的主要发展方向之一,其发展具有以下特点和阶段: 从原理上看,中间的“智能体”通常是 LLM 或大模型,为其增加了工具、记忆、行动、规划四个能力。目前行业里主要用到的是 langchain 框架,它通过代码或 prompt 的形式将 LLM 与 LLM 之间以及 LLM 与工具之间进行串接。 在人工智能的发展历程中,AI Agent 并非一蹴而就,其发展可分为几个阶段,并受到符号主义、连接主义、行为主义的影响。在人工智能的黎明时期,符号人工智能作为主导范式,以对符号逻辑的依赖著称,代表之作是基于知识的专家系统。其特点是基于逻辑和规则系统,使用符号来表示知识,通过符号操作进行推理。优点是推理过程明确、可解释性强,缺点是知识获取困难、缺乏常识、难以处理模糊性。时间为 20 世纪 50 70 年代。 近期出现的各类 AI 搜索引擎不断颠覆传统搜索引擎,如 perplexity.ai、metaso、360 搜索、ThinkAny 等。AI Agent 在辅助高效处理信息和简便信息表达方面表现出色,例如智能摘要能辅助快速筛选信息,自然语言描述可生成美观可用的图片。在工作流方面,每个人应根据自身情况找到适合的工具,如产品经理可使用 AI 进行用户画像、竞品调研、设计产品测试用例、绘制产品功能流程图等。关于 AI Agent 的未来,曾被认为异想天开的想法都可能成为现实,技术迭代会不断向前。
2025-02-15
现在AI发展的主要方向现状说明
目前 AI 的发展主要呈现以下几个方向和现状: 1. 技术范式的革新:传统的 Scaling Law 遭遇瓶颈,OpenAI 的 o 系列模型开创了从“快思考”到“慢思考”训推双管齐下的新道路。 2. 多模态能力的跃迁:从 Sora 的视频生成到原生多模态的崛起,再到世界模型的尝试,AI 开始真正理解和模拟立体世界。例如,除传统的文生视频、图生视频能力迭代外,当前的主要技术发展还围绕着通过转绘改变画风、视频内人物识别和替换方向。 在服务头部创作者方面,未来会逐渐转向编辑器能力增强,强化视频细节可控性,并逐渐将剪辑、音效生成匹配等后期制作任务智能化。 影视后期方向,未来可以将动捕演员的表演直接转化为虚拟角色,提高特效制作效率。 专业领域,创作者未来可以快速通过草图分镜验证效果。 随着实时生成能力的进一步提升,生成成本的下降,AI 实验性艺术在博物馆、展览等互动应用将会增多。 在 C 端大众消费侧,看好 AI 视频在小说、网文阅读、短情景剧等内容消费方向发挥潜力;人物识别和替换也可以衍生电商平台虚拟试衣间能力。 Viggle、DomoAI 的产品中的模板套用能力若以更低成本开放在短视频产品中,可能会带来短视频平台效果模板新的爆发周期。 3. 从“训练时代”向“推理时代”的转变:市场的关注焦点从去年基础模型能力的提升,到今年模型的落地应用和场景化。AI 的能力需要转化为实际的产品和服务,满足用户需求才是核心。 4. 前沿技术点: 数学基础:线性代数、概率论、优化理论等。 机器学习基础:监督学习、无监督学习、强化学习等。 深度学习:神经网络、卷积网络、递归网络、注意力机制等。 自然语言处理:语言模型、文本分类、机器翻译等。 计算机视觉:图像分类、目标检测、语义分割等。 前沿领域:大模型、多模态 AI、自监督学习、小样本学习等。 无论是技术研究还是应用实践,数学和编程基础都是必不可少的。同时需要紧跟前沿技术发展动态,并结合实际问题进行实践锻炼。
2025-02-15
AI 在生成单元测试代码方面有什么新的进展与方向?
AI 在生成单元测试代码方面有以下新的进展与方向: 1. 基于规则的测试生成: 测试用例生成工具:如 Randoop 可基于代码路径和规则为 Java 应用程序生成测试用例,Pex 是微软开发的能为.NET 应用自动生成高覆盖率单元测试的工具。 模式识别:Clang Static Analyzer 利用静态分析技术识别代码模式和潜在缺陷来生成测试用例,Infer 是 Facebook 开发的能自动生成测试用例以帮助发现和修复潜在错误的工具。 2. 基于机器学习的测试生成: 深度学习模型:DeepTest 利用深度学习模型为自动驾驶系统生成测试用例以模拟不同驾驶场景并评估系统性能,DiffTest 基于对抗生成网络(GAN)生成测试用例来检测系统的脆弱性。 强化学习:RLTest 利用强化学习生成测试用例,通过与环境交互学习最优测试策略以提高测试效率和覆盖率,A3C 是基于强化学习通过策略梯度方法生成高质量测试用例的工具。 3. 基于自然语言处理(NLP)的测试生成: 文档驱动测试生成:Testim 是 AI 驱动的测试平台,能通过分析文档和用户故事自动生成测试用例以减少人工编写时间,Test.ai 利用 NLP 技术从需求文档中提取测试用例以确保测试覆盖业务需求。 自动化测试脚本生成:Selenium IDE 结合 NLP 技术可从自然语言描述中生成自动化测试脚本,Cucumber 使用 Gherkin 语言编写的行为驱动开发(BDD)框架能通过解析自然语言描述生成测试用例。 此外,峰瑞资本投资的 AI Coding 创业公司 Babel 专注于 AI Agent 的研发,其核心产品 Test Gru 已在美国上线,能为客户自动生成单元测试,客户侧 PR 接受率约为 70%。还有如 Cursor 等工具,可借助其生成测试代码提升代码可靠性,但使用时也需注意方法,如使用 Git 管理代码版本、对 AI 代码进行 Review 等。
2025-02-14
基于大模型的应用开发主要包括哪些方向和相应的技术栈?
基于大模型的应用开发主要包括以下方向和相应的技术栈: IaaS 层: 百度智能云百舸 AI 异构计算平台,解决大模型应用中的算力问题,提供从集群创建到模型训练、推理的完整算力管理方案,通过引入自动故障预测与任务迁移技术,确保高达 99.5%的有效训练时间,为大模型应用落地提供强大的算力支撑。 PaaS 层: 百度智能云千帆大模型平台,解决大模型的调用、开发和应用开发问题,支持调用文心大模型全系列模型,提供全面的工具链,支持定制化的模型开发。通过 AppBuilder,提供企业级 Agent 和企业级 RAG 开发能力,还能将企业应用中产生的数据经过评估和对齐进一步反馈到模型中,形成良性循环,持续优化模型性能。 SaaS 层: 百度智能云提供丰富的常用应用供客户选择,如数字人平台曦灵、智能客服应用客悦等。 此外,还有一些其他的技术栈和框架,如: Langchain:是当前大模型应用开发的主流框架之一,提供了一系列的工具和接口,其核心在于“链”概念,包括 Model I/O、Retrieval、Chains、Agents、Memory 和 Callbacks 等组件,生态系统还包括 LangSmith、LangGraph 和 LangServe 等工具。 Ollama:是一个开箱即用的用于在本地运行大模型的框架。
2025-02-14
我想学习AI,但是不知道如何入门,希望你可以帮我梳理出AI的各个应用方向,要求要有具体的实操方法和必坑指南,能应用于生活和工作中,适合新手学习
以下是为您梳理的适合新手学习 AI 的应用方向、实操方法和避坑指南: 一、了解 AI 基本概念 1. 阅读「」部分,熟悉 AI 的术语和基础概念,包括人工智能的定义、主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 2. 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 二、开始 AI 学习之旅 1. 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 2. 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 三、选择感兴趣的模块深入学习 1. AI 领域广泛,比如图像、音乐、视频等,您可以根据自己的兴趣选择特定的模块进行深入学习。 2. 掌握提示词的技巧,它上手容易且很有用。 四、实践和尝试 1. 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。 2. 在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 五、体验 AI 产品 1. 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 六、如果希望继续精进 1. AI 背景知识 基础理论:了解人工智能、机器学习、深度学习的定义及其之间的关系。 历史发展:简要回顾 AI 的发展历程和重要里程碑。 2. 数学基础 统计学基础:熟悉均值、中位数、方差等统计概念。 线性代数:了解向量、矩阵等线性代数基本概念。 概率论:基础的概率论知识,如条件概率、贝叶斯定理。 3. 算法和模型 监督学习:了解常用算法,如线性回归、决策树、支持向量机(SVM)。 无监督学习:熟悉聚类、降维等算法。 强化学习:简介强化学习的基本概念。 4. 评估和调优 性能评估:了解如何评估模型性能,包括交叉验证、精确度、召回率等。 模型调优:学习如何使用网格搜索等技术优化模型参数。 5. 神经网络基础 网络结构:理解神经网络的基本结构,包括前馈网络、卷积神经网络(CNN)、循环神经网络(RNN)。 激活函数:了解常用的激活函数,如 ReLU、Sigmoid、Tanh。 避坑指南: 1. 不要急于求成,AI 学习需要逐步积累。 2. 注重理论与实践结合,避免只学习理论而不进行实际操作。 3. 对于复杂的概念和算法,要多花时间理解,不要一知半解。 4. 在选择学习资源时,要注意其质量和适用性。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-02-06
AI应用有哪些好的方向
以下是一些 AI 应用的好方向: 1. 医疗药品零售领域: 药品推荐系统:利用机器学习算法分析用户数据,为用户推荐合适的非处方药品和保健品,提升销售转化率。 药品库存管理:通过分析历史销售数据等因素,预测药品需求量,优化库存管理策略,降低成本。 药品识别与查询:借助计算机视觉技术,用户可通过手机拍摄药品图像,AI 系统自动识别并提供相关信息查询服务。 客户服务智能助手:基于自然语言处理技术,AI 虚拟助手回答顾客关于购药、用药、保健等常见问题,减轻人工客服工作压力。 药店运营分析:AI 分析药店销售、顾客流量、库存等大数据,发现潜在运营问题和优化空间,为决策提供参考。 药品质量监控:通过机器视觉等技术,AI 自动检测药品包装、标签、颜色等是否合格,及时发现问题。 药品防伪追溯:利用区块链等技术,AI 实现全流程药品溯源,确保药品供应链的安全性和真实可信度。 2. 改善大模型产品的使用体验,使其面对细分领域需求时变得更好用。 3. 助力用户工作流,对已有场景进行优化。 4. 细分场景独立实用工具。 5. AI 社区。 6. Chatbot。 7. 医疗保健: 医学影像分析:辅助诊断疾病。 药物研发:加速药物研发过程。 个性化医疗:为患者提供个性化治疗方案。 机器人辅助手术:提高手术精度和安全性。 8. 金融服务: 风控和反欺诈:降低金融机构风险。 信用评估:帮助金融机构做出贷款决策。 投资分析:辅助投资者做出投资决策。 客户服务:提供 24/7 服务,回答常见问题。 9. 零售和电子商务: 产品推荐:分析客户数据,推荐可能感兴趣的产品。 搜索和个性化:改善搜索结果,提供个性化购物体验。 动态定价:根据市场需求调整产品价格。 聊天机器人:回答客户问题并解决问题。 10. 制造业: 预测性维护:预测机器故障,避免停机。 质量控制:检测产品缺陷,提高产品质量。 供应链管理:优化供应链,提高效率和降低成本。 机器人自动化:控制工业机器人,提高生产效率。 11. 交通运输:(具体应用未详细列举)
2025-02-05
天工AI和秘塔AI哪个更好一些,你给出的选择建议
天工 AI 和秘塔 AI 各有特点。 秘塔 AI 搜索由秘塔科技开发,提供多模式搜索、无广告干扰、结构化展示和信息聚合等功能,旨在提升用户的搜索效率和体验。 天工 AI 搜索采用生成式搜索技术,支持自然语言交互和深度追问,未来还将支持图像、语音等多模态搜索。在搜索时直接上传文件,就能实现“定制 AI 搜索信息源”的效果。目前支持对话追问,支持脑图的图片下载。但天工 AI 目前仍处于早期版本的状态,一些功能如原文的对应、文本编辑、笔记、下钻探索等还不支持,也没有打通一些出彩的板块,没有跟音乐创作、图片创作等功能连接起来形成完整的“AIGC 工作流”。 综合来看,选择哪个更好取决于您的具体需求。如果您更注重成熟的功能和搜索体验,秘塔 AI 可能更适合;如果您对未来的多模态搜索和发展潜力有期待,且能接受当前一些功能的不完善,天工 AI 也是一个选择。
2025-02-15
当我想要解决一个问题,面对如此多的AI站点和AI智能体,我该如何选择?
在面对众多的 AI 站点和 AI 智能体时,您可以从以下几个方面进行选择: 1. 明确自身需求:确定您希望解决的具体问题和期望达到的目标,以便找到与之匹配的 AI 工具。 2. 了解功能特点:不同的 AI 智能体具有不同的功能和优势。例如,有些擅长自然语言处理和回答各种问题,有些则在特定领域如编程、设计等有出色表现。 3. 考虑技术能力:包括模型的性能、上下文窗口长度、响应速度和并发支持等。响应速度快、并发支持高的工具能在多人使用时保持良好性能。 4. 成本因素:关注免费或低价的选项,以降低使用成本。 5. 个性化需求满足:选择能够根据您的业务场景和个性化需求进行定制的 AI 智能体。 例如,字节的扣子(Coze)是新一代一站式 AI Bot 开发平台,无论有无编程基础都能构建各类问答 Bot,并可发布到多种社交平台和通讯软件上。而在开发 AI 插件时,像 AI Share Card 插件会根据需求选择合适的模型,如选用了具有较长上下文窗口、免费且并发支持高的 GLM4flash 模型。 总之,要综合考虑自身需求、功能特点、技术能力、成本和个性化等因素,选择最适合您的 AI 站点和智能体。
2025-02-04
Coze + 飞书 + 飞书多维表格:通过飞书机器人与 Coze 搭建的智能体进行对话,在聊天窗口中完成链接输入和阅读计划输出。由 Coze 调用大模型、插件完成内容的整理、推荐,利用飞书多维表格存储和管理稍后读数据,无需开发任何插件、APP,能实现跨平台的稍后读收集与智能阅读计划的推荐。其设计思路包括简化“收集”,实现跨平台收集和通过输入 URL 完成收集;自动化“整理入库”,自动整理关键信息并支持跨平台查看;智能“选择”推荐,根据收藏记录和用户兴趣生成阅读计划——这个方法具体如何操作?
以下是关于通过飞书机器人与 Coze 搭建的智能体进行对话,并利用飞书多维表格存储和管理稍后读数据,实现跨平台的稍后读收集与智能阅读计划推荐的具体操作方法: 前期准备: 1. 简化“收集”: 实现跨平台收集功能,支持电脑(web 端)、安卓、iOS 多端操作。 输入一个 URL 即可完成收集,借鉴微信文件传输助手的方式,通过聊天窗口完成收集输入。 2. 自动化“整理入库”: 系统在入库时自动整理每条内容的关键信息,包括标题、摘要、作者、发布平台、发布日期、收集时间和阅读状态。 阅读清单支持跨平台查看。 3. 智能“选择”推荐: 根据当前收藏记录和用户阅读兴趣进行相关性匹配,生成阅读计划。 使用飞书·稍后读助手: 1. 设置稍后读存储地址: 首次使用,访问。 点击「更多创建副本」,复制新表格的分享链接。 将新链接发送到智能体对话中。 还可以发送“查询存储位置”、“修改存储位置”来更换飞书多维表格链接,调整稍后读存储位置。 2. 收藏待阅读的页面链接: 在对话中输入需要收藏的页面链接,第一次使用会要求授权共享数据,授权通过后再次输入即可完成收藏。但目前部分页面链接可能小概率保存失败。 3. 智能推荐想看的内容: 在对话中发送“我想看 xx”、“xx 内容”,即可按个人兴趣推荐阅读计划。 至此,专属 AI 稍后读智能体大功告成,您可以尽情享受相关服务。
2025-01-27
AI换衣API推荐, 并多维度对比,选择最适合的API推荐给我
以下为您推荐的 AI 换衣相关的 API 并进行多维度对比: Comfyui_Object_Migration: 特点:可高精度迁移服装样式到目标人物图像,保持高一致性和细节完整性,支持从卡通到写实的风格互相转换,甚至可将平面角色图像转换为可 3D 打印的模型。 应用场景:虚拟角色服装设计迁移到真实照片、为动画角色添加写实服装、微调权重生成独特服装设计。 详细介绍及教程: GitHub: 在选择适合的 AI 大模型 API 服务时,需要考虑以下因素: 对于像开发 AI Share Card 插件这类情况,如果将模板生成功能设计为固定的代码组件,让大模型专注于内容总结的功能,那么对模型的要求就不会过高。 选型要求包括:较长的上下文窗口,因为内容总结类任务需要较大的上下文长度;响应速度要快、并发支持要高,以在多人使用插件时保持良好性能;免费或尽量低价,以减少模型 token 费用。例如,AI Share Card 选用的是 GLM4flash(截至 202412,长达 128k 的上下文窗口,完全免费的调用价格,200 RPM 高并发支持)。
2025-01-08
微调训练框架的选择
以下是关于微调训练框架选择的相关内容: 在 Stable Diffusion 中: 首先,config 文件夹中有两个配置文件 config_file.toml 和 sample_prompt.toml,分别存储着训练超参数与训练中的验证 prompt。 config_file.toml 文件主要包含了 model_arguments、optimizer_arguments、dataset_arguments、training_arguments、sample_prompt_arguments 以及 saving_arguments 六个维度的参数信息。 v2 和 v_parameterization:两者同时设置为 true 时,开启 Stable Diffusion V2 版本的训练。 pretrained_model_name_or_path:读取本地 Stable Diffusion 预训练模型用于微调训练。 optimizer_type:有七种优化器可以选择。不进行选择时默认启动 AdamW 优化器;显存不太充足时,可选择 AdamW8bit 优化器,但会有轻微性能损失;Lion 优化器是较新的版本,性能优异,但学习率需设置较小,比如为 AdamW 优化器下的 1/3。 learning_rate:单卡推荐设置 2e6,多卡推荐设置 1e7。 除了上述的训练环境参数传入,还需将配置好的 config_file.toml 和 sample_prompt.txt 参数传入训练脚本中。 当设置 1024 分辨率+FP16 精度+xformers 加速时,SD 模型进行 Batch Size=1 的微调训练需要约 17.1G 的显存,进行 Batch Size=4 的微调训练需要约 26.7G 的显存,所以最好配置一个 24G 以上的显卡。 微调训练完成后,模型权重会保存在之前设置的 output_dir 路径下。可以使用 Stable Diffusion WebUI 作为框架加载模型进行 AI 绘画,需将训练好的模型放入/models/Stablediffusion 文件夹下。 在 OpenAI 中: 使用 OpenAI CLI 开始微调工作,需指定从哪个 BASE_MODEL 开始(ada、babbage、curie 或 davinci),还可使用后缀参数自定义微调模型的名称。 运行命令后会上传文件、创建微调作业并流式传输事件直到作业完成。 每个微调工作都从一个默认为 curie 的基本模型开始,模型的选择会影响性能和成本。 开始微调作业后,可能需要几分钟或几小时才能完成,工作完成后会显示微调模型的名称。此外,还可以列出现有作业、检索作业状态或取消作业。
2025-01-06
微调训练框架的选择
以下是关于微调训练框架选择的相关内容: 对于 Stable Diffusion 的微调训练: 1. 配置文件: 在 config 文件夹中有 config_file.toml 和 sample_prompt.toml 两个配置文件,分别存储着训练超参数与训练中的验证 prompt。 config_file.toml 文件包含 model_arguments、optimizer_arguments、dataset_arguments、training_arguments、sample_prompt_arguments 以及 saving_arguments 六个维度的参数信息。 例如,v2 和 v_parameterization 同时设置为 true 时开启 Stable Diffusion V2 版本的训练;pretrained_model_name_or_path 用于读取本地 Stable Diffusion 预训练模型用于微调训练;optimizer_type 可选择多种优化器,如 AdamW(默认)、AdamW8bit(显存不足时可选,会有轻微性能损失)、Lion(最新版本,性能优异但学习率需设置较小)等;学习率方面,单卡推荐设置 2e6,多卡推荐设置 1e7。 2. 训练启动: 将配置好的 config_file.toml 和 sample_prompt.txt 参数传入训练脚本中。 在命令行输入相应命令即可开始训练,训练脚本启动后会打印出 log 方便查看训练过程节奏。 1024 分辨率+FP16 精度+xformers 加速时,SD 模型进行 Batch Size=1 的微调训练约需 17.1G 显存,Batch Size=4 的微调训练约需 26.7G 显存,因此最好配置 24G 以上显卡。 3. 模型使用: 微调训练完成后,模型权重保存在之前设置的 output_dir 路径下。 使用 Stable Diffusion WebUI 框架加载模型进行 AI 绘画,需将训练好的模型放入/models/Stablediffusion 文件夹下,并在 Stable Diffusion WebUI 中选用。 对于 OpenAI 的微调训练: 1. 准备训练数据后,使用 OpenAI CLI 开始微调工作。 2. 指明从哪个基本模型(ada、babbage、curie 或 davinci)开始,可使用后缀参数自定义微调模型名称。 3. 运行命令后会上传文件、创建微调作业并流式传输事件直到作业完成,通常需要几分钟,也可能因作业排队或数据集大小等因素需要数小时。 4. 每个微调工作都从默认为 curie 的基本模型开始,模型选择会影响性能和成本。 5. 开始微调作业后,可能需要排队等待,完成后会显示微调模型的名称。还可以列出现有作业、检索作业状态或取消作业。
2025-01-06