直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

Lora简单介绍

回答

Lora 全称 Low-Rank Adaptation Models,即低阶自适应模型,其作用在于影响和微调画面,能够再现人物或物品的特征。大模型的训练通常复杂且对电脑配置要求高,而 LoRA 采用在原模型中插入新的数据处理层的方式,避免了修改原有模型参数。LORA 模型训练是用特定特征替换大模型中的对应元素,从而生成不同于底模的图片,比如固定的人物相貌、特定的服装或者特定的风格。Lora 训练较为轻量化,所需显存较少,硬件门槛显存达到 6G 即可开启训练。

同时,模型微调方面,提供了 LoRA 微调和全量参数微调代码,关于 LoRA 的详细介绍可参考论文“LoRA:Low-Rank Adaptation of Large Language Models”以及微软 Github 仓库LoRA

此外,还有利用新版 SDXL 生成的如针线娃娃这样的 lora,它可以把一些常见形象制作成毛线编制的样子,需要使用 SDXL1.0 的模型,触发词是 BJ_Sewing_doll。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

【Lora炼丹术】从零开始,炼制你的第一个LoRA(1)

从接触SD到现在,相信大家一定使用过各种各样的lora,包括人物的、建筑的、画风的等等,那么你有没有想过炼制一款属于自己的lora模型呢。我们先来了解一下炼丹的基础概念,它的关键原理就是——等价交换法则!不好意思,说错了。重新来,Lora全称Low-Rank Adaptation Models,中文翻译为低阶自适应模型。它的作用在于影响和微调画面。通过lora的帮助,可以再现人物或物品的特征。大模型的训练通常是非常复杂且需要很高的电脑配置的,LoRA采用的方式就是在原有的模型中插入新的数据处理层,这样就避免了修改原有模型的参数。LORA模型训练,其实就是用一些特定特征来替换大模型中的对应元素,比如一个固定的人物相貌、特定的服装或者是特定的风格,这样就可以生成不同于底模的图片。所以,lora训练是比较轻量化的,需要的显存也少了很多,硬件门槛显存达到6G就可以开启训练了。我们今天要使用的是B站UP主“朱尼酱”的赛博丹炉,他的这款丹炉,界面更加友好、美观,适合新手入门。废话不多说,我们就正式开始吧。

【SD】萌到出血,SDXL针线娃娃模型

可爱就是正义,今天给大家介绍一个利用新版SDXL生成的lora——针线娃娃。它可以把一些常见的形象制作成毛线编制的样子。这个lora需要使用SDXL1.0的模型才可以运行,触发词是BJ_Sewing_doll。做了一些小动物的图片,很治愈的感觉,一起来看看吧。当然不仅仅是动物,很多小场景也很有爱。有个小彩蛋在里面,看谁能发现,嘿嘿~~想体验这款lora的话,可以添加我的公众号【白马与少年】,回复【SDXL】即可。-END-白马与少年Stable Diffusion、Blender等学习心得分享139篇原创内容(持续更新中)公众号微信扫一扫关注该公众号

模型微调

同时提供了LoRA微调和全量参数微调代码,关于LoRA的详细介绍可以参考论文“[LoRA:Low-Rank Adaptation of Large Language Models](https://arxiv.org/abs/2106.09685)”以及微软Github仓库[LoRA](https://github.com/microsoft/LoRA)。

其他人在问
lora是什么
Lora 全称 LowRank Adaptation Models,即低阶自适应模型。它的作用在于影响和微调画面,能够再现人物或物品的特征。大模型的训练通常复杂且对电脑配置要求高,而 LoRA 采用在原模型中插入新的数据处理层的方式,避免了修改原有模型参数。LORA 模型训练是用特定特征替换大模型中的对应元素,从而生成不同于底模的图片。Lora 训练较为轻量化,所需显存较少,硬件门槛显存达到 6G 即可开启训练。例如,有利用新版 SDXL 生成的如针线娃娃的 lora,还有如“KIDS ILLUSTRATION”这样用于生成儿童绘本风格插画的 lora 等。
2024-11-01
Lora模型训练数据集
以下是关于 Lora 模型训练数据集的相关内容: 创建数据集: 1. 进入厚德云模型训练数据集(https://portal.houdeyun.cn/sd/dataset)。 2. 在数据集一栏中,点击右上角创建数据集,输入数据集名称。 3. 可以上传包含图片+标签 txt 的 zip 文件,也可以只有图片(之后可在 c 站使用自动打标功能),还可以一张一张单独上传照片,但建议提前把图片和标签打包成 zip 上传。 4. Zip 文件里图片名称与标签文件应当匹配,例如:图片名“1.png”,对应的达标文件就叫“1.txt”。 5. 上传 zip 以后等待一段时间,确认创建数据集。返回到上一个页面,等待一段时间后上传成功,可以点击详情检查,能预览到数据集的图片以及对应的标签。 Lora 训练: 1. 点击 Flux,基础模型会默认是 FLUX 1.0D 版本。 2. 选择数据集,点击右侧箭头,会跳出所有上传过的数据集。 3. 触发词可有可无,取决于数据集是否有触发词。模型效果预览提示词则随机抽取一个数据集中的标签填入即可。 4. 训练参数这里可以调节重复次数与训练轮数,厚德云会自动计算训练步数。如果不知道如何设置,可以默认 20 重复次数和 10 轮训练轮数。 5. 可以按需求选择是否加速,点击开始训练,会显示所需要消耗的算力。然后等待训练,会显示预览时间和进度条。训练完成会显示每一轮的预览图。鼠标悬浮到想要的轮次模型,中间会有个生图,点击会自动跳转到使用此 lora 生图的界面。点击下方的下载按钮则会自动下载到本地。 用 SD 训练一套贴纸 LoRA 模型的工作流: 1. 原始形象:MJ 初步产出符合设计想法的贴纸原始形象。 2. 二次加工:完成贴纸的白色边线等细节加工。 3. 处理素材:给训练集图片打 tag,修改 tag。 4. 训练模型:将上述处理好的数据集做成训练集,进行训练。 用 SD 训练一套贴纸 LoRA 模型的原始形象:MJ 关键词: A drawing for a rabbit stickers,in the style of hallyu,screenshot,mori kei,duckcore plush doll art exaggerated poses,cry/happy/sad/...ar 3:4 niji 5 style cute s 180 。会得到不同风格的贴图,我们可以先看看自己喜欢哪一种。出图过程可以有意识地总结这一类贴图的特征,比如都是可爱的兔子,有不同的衣服和头饰,都有一双大大的卡通眼睛,会有不同的面部表情。 注意事项: 1. 关键词中限制了颜色,因此 MJ 生成的图片会一种情绪对应一种颜色,所以同一种情绪最好多生成几张不同色系的,可以减少后续训练中模型把情绪和颜色做挂钩(如果需要这样的话,也可以反其道而行之)。 2. 数据集中正面情绪与负面情绪最好比例差不多,如果都是正面积极的,在出一些负面情时(sad,cry)的时候,可能会出现奇怪的问题(如我们训练的是兔子形象,但 ai 认知的 sad 可能是人的形象,可能会出现人物特征)。 3. 如果训练 256266 大小的表情包,这样的素材就已经够用了。如果要训练更高像素的图片,则需要进一步使用 MJ 垫图和高清扩展功能。 高清化: 左(256)→右(1024),输入左图,加入内容描述,加入风格描述,挑选合适的,选出新 30 张图片(卡通二次元类型的 lora 训练集 30 张差不多,真人 60100 张)。
2024-10-22
Lora模型训练
以下是关于 Lora 模型训练的相关内容: 一、用 SD 训练一套贴纸 LoRA 模型的要点 1. 训练数据集准备:包括训练素材处理、图像预处理、打标优化。 2. 训练环境参数配置:选择本地或云端训练环境,进行训练环境配置和训练参数配置。 3. 模型训练:基于 kohyass 训练模型。 4. 模型测试:通过 XYZ plot 测试模型。 二、郑敏轩:Flux 的 Lora 模型训练 1. 所需模型下载:t5xxl_fp16.safetensors、clip_l.safetensors、ae.safetensors、flux1dev.safetensors。 注意事项: 不使用时,模型放置位置不限,只要知道路径即可。 训练时,建议使用 flux1dev.safetensors 版本的模型和 t5xxl_fp16.safetensors 版本的编码器。 2. 下载脚本: 夸克网盘链接:https://pan.quark.cn/s/ddf85bb2ac59 百度网盘链接:https://pan.baidu.com/s/1pBHPYpQxgTCcbsKYgBi_MQ?pwd=pfsq 提取码:pfsq 三、100 基础训练大模型 1. 步骤一·创建数据集 进入厚德云模型训练数据集:https://portal.houdeyun.cn/sd/dataset 在数据集一栏中,点击右上角创建数据集,输入数据集名称。 可以上传包含图片+标签 txt 的 zip 文件,也可以只有图片(之后可在 c 站使用自动打标功能),或者一张一张单独上传照片。 Zip 文件里图片名称与标签文件应当匹配,例如:图片名"1.png",对应的达标文件就叫"1.txt"。 上传 zip 以后等待一段时间,确认创建数据集,返回到上一个页面,等待一段时间后上传成功,可点击详情检查,预览数据集的图片以及对应的标签。 2. 步骤二·Lora 训练 点击 Flux,基础模型会默认是 FLUX 1.0D 版本。 选择数据集,点击右侧箭头,选择上传过的数据集。 触发词可有可无,取决于数据集是否有触发词。 模型效果预览提示词则随机抽取一个数据集中的标签填入即可。 训练参数可调节重复次数与训练轮数,厚德云会自动计算训练步数,若不知如何设置,可默认 20 重复次数和 10 轮训练轮数。 可按需求选择是否加速,点击开始训练,会显示所需要消耗的算力,然后等待训练,会显示预览时间和进度条。 训练完成后会显示每一轮的预览图,鼠标悬浮到想要的轮次模型,中间会有个生图,点击会自动跳转到使用此 lora 生图的界面。点击下方的下载按钮则会自动下载到本地。
2024-10-22
文生图lora微调
以下是关于文生图 lora 微调的详细内容: 定主题:明确您需要生成的图片的主题、风格和要表达的信息。 选择基础模型 Checkpoint:根据主题选择内容贴近的 checkpoint,如麦橘、墨幽的系列模型,如麦橘写实、麦橘男团、墨幽人造人等。 选择 lora:基于生成内容寻找重叠的 lora,以控制图片效果和质量,可参考广场上优秀帖子中使用的 lora。 ControlNet:可控制图片中特定图像,如人物姿态、生成特定文字或艺术化二维码等,属于高阶技能。 局部重绘:下篇再教。 设置 VAE:无脑选择 840000 即可。 Prompt 提示词:用英文写需求,使用单词和短语组合,不用管语法,单词、短语间用英文半角逗号隔开。 负向提示词 Negative Prompt:同样用英文写要避免的内容,单词和短语组合,用英文半角逗号隔开。 采样算法:一般选 DPM++ 2M Karras 较多,也可参考 checkpoint 详情页上模型作者推荐的采样器。 采样次数:选 DPM++ 2M Karras 时,采样次数通常在 30 40 之间。 尺寸:根据个人喜好和需求选择。 以下是一个简笔水彩风格插画的示例: 使用大模型“Flat 2D Animerge”,适合生成卡通动漫图片,官方建议 CFG 值在 5 或 6(使用动态阈值修复可拉到 11)。搭配两个 lora,“Chinese painting style”可增加中国画水彩风格效果,权重设为 0.4;“Crayon drawing”可添加简单线条和小孩子笔触,权重设为 0.8。将图片丢到标签器中反推关键词,发送到“文生图”。在正向提示词末尾添加这两个 lora,尺寸按参考图设置,重绘幅度开 0.5 让 AI 更自由发挥,若想更接近原图可降低数值。将图放入 ControlNet 中,选择 tile 模型,权重为 0.5,控制模式选择“更注重提示词”。
2024-10-05
使用人物Lora生成的图片中有多个人物时,怎么让人物的形象各不相同?
在 Stable Diffusion 中,若使用人物 Lora 生成的图片中有多个人物并想让人物形象各不相同,可参考以下方法: 1. 在提示词中输入数量词(如 2girls 或 3boys 等),再加上各自的描述提示词。若刷图成功率不高,可配合 openpose 控制,做一个多人骨架,以生成多人物构图。 2. 需使用不同的 Lora 来区分人物,但单纯靠提示词可能行不通。 3. 分区控制思路: Multidiffusion 的做法:启用 Tiled Diifusion,打开分区提示词控制,创建文生图画布。启用不同区域,分别填写背景、不同人物的描述词和 Lora。增加 controlnet 的 openpose 控制来稳定人物,但可能存在分区生成的人物连续性低、lora 控制不强等问题。 Latent Couple 的做法(文中未提及,需进一步探索)。 此外,关于 Lora 模型: 1. Lora 可以固定照片的特征,如人物特征、动作特征和照片风格。 2. 点击“生成”下面的第三个按钮,找到 Lora 选项,可添加下载保存到电脑的 Lora 模型,Lora 可叠加使用,但新手不建议使用太多,且 Lora 之间用英文逗号隔开,每个 Lora 后面的数字用于调整权重,一般只会降低权重。选择 Lora 应根据最初想要生成的照片类型决定。
2024-09-27
AI 增量训练 Lora
以下是关于 AI 增量训练 Lora 的相关知识: 参数理解: 1. 学习步数:指 AI 对每张图片的学习次数。二次元图片的 repeat 一般在 10 15,写实人物图片的 repeat 一般在 30 50,真实世界的景观场景可能要达到 100。理论上讲,图片精细度越高,学习步数越高。 2. 循环次数:AI 将所有图片按照学习步数学习一轮为一次循环,循环次数一般在 10 20 之间。次数并非越多越好,过多会导致过拟合,即画什么都和样图一样。 3. 效率设置:主要控制电脑的训练速度。可保持默认值,也可根据电脑显存微调,但要避免显存过载。 总的训练步数为:图片张数×学习步数×循环次数。 此外,沃尔夫勒姆提到人工智能是基于机器学习(通常通过神经网络实现),根据给出的示例进行增量训练,且这些示例包括大量人类生成的科学文本等,或者关于世界上发生的事情的实际经验。
2024-09-13
简单、便捷的python编程IDE
以下是一些简单、便捷的 Python 编程 IDE: 1. Wing Python IDE Pro:由 Wingware 开发,专为 Python 编程设计,集成了代码编辑、导航和调试功能,具备智能自动补全、代码重构、多选功能和代码片段工具,使编程更轻松高效。价格:年度许可证起价 179 美元/月。 2. Smol Developer:开源的 AI 开发助手,可根据产品需求生成完整的代码库,具有简单、安全、易于理解的代码结构,同时具备高度灵活性和定制性。价格:开源项目,遵循 MIT 许可证。 3. Cody:Sourcegraph 的 AI 工具,能理解整个代码库,解答问题并编写代码,还能详细解释代码,定位特定组件,并提出修复建议。可通过 VS Code 扩展直接使用,个人使用免费。 配置 Python 运行环境的方法如下: 简单版: 下载 Python 和 PyCharm。 Python 下载地址:https://www.python.org/ PyCharm 下载地址:https://www.jetbrains.com/pycharm/download/ 然后双击 exe 文件安装即可。 详细版: 1. 访问 Python 官网:https://www.python.org/ 2. 下载 Python 安装包 3. 安装 Python:打开 window 控制台,输入 python,能进入控制台就说明安装成功了。 4. 集成开发环境: PyCharm 是由 JetBrains 打造的一款 Python IDE,支持 macOS、Windows、Linux 系统。功能包括调试、语法高亮、Project 管理、代码跳转、智能提示、自动完成、单元测试、版本控制等。 下载 PyCharm: Professional(专业版,收费):完整的功能,可试用 30 天。 Community(社区版,免费):阉割版的专业版。 安装 PyCharm:下载完成后,双击安装即可。 使用 PyCharm:首先在桌面上创建一个文件夹 test,并创建一个目录 test.py,双击桌面 PyCharm 图标,打开刚才创建的 test 目录即可。 安装 PyCharm 的补充说明: PyCharm 是一个专门用于 Python 开发的集成开发环境(IDE),能更方便地编写和运行 Python 代码。 点击该网址:https://www.jetbrains.com/pycharm/download/ ,点击完后注意下拉,选择下面这个下载,这个是 Community Edition(社区版),该版本是免费的。如果是开头映入眼帘的下载按钮是收费版,只能体验 30 天。社区版自己玩的话够用了。如果没法外网下载,可使用以下网盘链接: 夸克网盘:Pycharm 和 Cursor(主要是 Pycharm,版本稳定,Cursor 有条件可以自己下) 链接:https://pan.quark.cn/s/c5df4670858c 百度网盘:pycharmcommunity2024.2.3.exe 链接:https://pan.baidu.com/s/1jFMxBQD0r41eU6f5BGQg?pwd=43h2 提取码:43h2
2024-11-13
可将复杂任务分解为简单子任务的ai工具是什么
以下是一些可将复杂任务分解为简单子任务的 AI 工具和相关策略: OpenAI 官方指南中提到,对于需要大量独立指令集来处理不同情况的任务,可以首先对查询类型进行分类,并使用该分类来确定需要的指令。例如,在客户服务应用程序中,将查询分类为计费、技术支持、账户管理或一般查询等主要类别,并进一步细分次要类别。 如同软件工程中将复杂系统分解为模块化组件,对 GPT 提交的任务也可如此。复杂任务往往可被重新定义为一系列简单任务的工作流程,早期任务的输出用于构造后续任务的输入。 在 AIAgent 系列中,基于 LLM 的 AI Agent 应首先以适当的方式将复杂任务分解为子任务,然后有效地组织和协调这些子任务,这有赖于 LLM 的推理和规划能力以及对工具的理解。
2024-11-05
将复杂任务分解为简单子任务以简化问题,这样的ai工具都有什么
以下是一些可将复杂任务分解为简单子任务以简化问题的 AI 工具和相关策略: 1. OpenAI 官方指南中提到的策略: 使用意图分类来识别与用户查询最相关的指令。 对于需要很长对话的对话应用程序,总结或过滤之前的对话。 分段总结长文档,并递归构建完整总结。 指示模型在急于得出结论之前先自己找出解决方案。 使用内心独白或一系列查询来隐藏模型的推理过程。 询问模型在之前的回答中是否遗漏了什么。 使用基于嵌入的搜索来实现高效的知识检索。 使用代码执行来进行更准确的计算或调用外部 API。 2. 在 AIAgent 系列中: 基于 LLM 的 AI Agent 应首先以适当的方式将复杂任务分解为子任务,然后有效地组织和协调这些子任务,这有赖于 LLM 的推理和规划能力,当然也包括对工具的理解。
2024-11-05
好用简单的算法有哪些?
以下为您介绍一种在自制 2048 小游戏中应用的简单算法: 作者吵爷前阵子写了 BP 算法入门,因公式多遭批评,近期学习 Pygame 制作 55 的 2048 小游戏。偶然产生让 AI 玩的想法,简单与 GPT 交流后,带入一些简单算法使 AI 能运行游戏,虽性能不如人,但能直观感受算法对模型性能的提升,对初学者比看数学公式更友好。目前仅在基础逻辑做优化,后续会继续改进。未用到高级算法,但此案例可作为简单算法应用的参考。
2024-10-31
我想翻译一些日漫,我该如何提问才可以让得到的翻译结果更接近正常人说话,而不是简单的直译。并且得到的结果必须与原文所表达的内容不出现差错,翻译结果读起来流畅自然
很抱歉,知识库中的内容没有直接针对您如何翻译日漫以获得更自然流畅且准确结果的相关指导。但一般来说,要实现这样的翻译效果,您可以从以下几个方面考虑: 1. 深入理解日漫的文化背景、角色性格和情节发展,以便更好地把握原文的“意”。 2. 注重上下文的连贯和逻辑,不仅仅是逐句翻译,而是从整体上把握语义。 3. 避免过于拘泥于原文的句式和词汇,灵活运用目标语言的表达方式。 4. 多参考优秀的日漫翻译作品,学习他人的翻译技巧和风格。 5. 对于一些特定的文化元素或术语,要进行适当的解释或转换,以确保目标读者能够理解。
2024-10-27
我想翻译一些日漫,我该如何提问才可以让得到的翻译结果更接近正常人说话,而不是简单的直译。还有当翻译时ai遇到比较敏感的话题通常会拒绝回答或者委婉的回答,我不想这样,
在让 AI 翻译日漫时,如果您希望得到更接近正常人说话的翻译结果,而非简单的直译,您可以这样提问:“请以符合自然语言表达习惯和逻辑的方式,为我翻译这段日漫内容,注重语言的流畅性和生动性,避免生硬的直译。” 关于 AI 遇到敏感话题可能拒绝回答或委婉回答的情况,如果您不想这样,需要注意的是,AI 遵循一定的道德和法律规范,对于确实不适合或不被允许处理的敏感内容,强制要求其回答是不可取且不恰当的。但如果您认为某些话题并非真正敏感,只是被误判,您可以尝试更清晰准确地描述相关内容,以减少误解的可能性。
2024-10-27
介绍一下什么是AI
AI 是一门令人兴奋的科学,它是指让计算机表现出智能行为,例如做一些人类所擅长的事情。 对于不具备理工科背景的文科生来说,可以把 AI 当成一个黑箱,只需要知道它是某种模仿人类思维可以理解自然语言并输出自然语言的东西。其生态位是一种似人而非人的存在。 从技术层面看,最初计算机是按照明确定义的程序(即算法)来对数字进行运算。但对于像“根据照片判断一个人的年龄”这类任务,我们无法明确编程的每一个步骤,而这正是 AI 所感兴趣的。 对于三年级的小学生,可以用简单的语言来解释,即让计算机或机器能像人类一样思考和学习的技术。
2024-11-13
介绍一下WaytoAGI
WaytoAGI 是由一群热爱 AI 的专家和爱好者共同建设的开源 AI 知识库。 其特点和内容包括: 大家贡献并整合各种 AI 资源,使人们能轻松学习各类 AI 知识,应用 AI 工具和实战案例等。 知识库的内容覆盖 AI 绘画、AI 视频、AI 智能体、AI 3D 等多个版块,还包含赛事和活动以促进大家动手实践。 孵化了离谱村这个千人共创项目,让大家更轻松、更有兴趣地学习和接触 AI。 2023 年 4 月 26 日诞生,在没有任何推广的情况下,一年时间已有超过 70 万用户和超千万次的访问量。 您可以通过以下方式进一步了解: 即刻体验:https://waytoagi.com/ 更多详细介绍: 此外,还有一些相关的内容,如: 放几个有意思的视频:离谱村、春晚、24 节气、 关键词学社:
2024-11-07
关于通往agi之路的介绍
“通往 AGI 之路”是一个致力于人工智能学习的中文知识库和社区平台。 其旨在为学习者提供系统全面的 AI 学习路径,涵盖从基础概念到实际应用的各个方面,帮助用户有效地获取 AI 知识,提高自身能力。 该平台由开发者、学者和 AI 爱好者共同参与建设,提供丰富的学习资源,包括文章、教程、工具推荐以及最新的 AI 行业资讯等。 此外,社区还定期组织活动,如视频挑战赛、模型创作大赛等,鼓励成员在实践中学习,促进交流与合作。 其品牌 VI 融合了独特的设计元素,以彩虹色彰显多元性和创新,以鹿的形象象征智慧与优雅,通过非衬线字体展现现代感和清晰性。 “通往 AGI 之路”还与广州广播电视台联合制作了 AI 动画短片《奥运前夜》。 同时,还涉及音乐相关的一些知识,如 Tropical house vibes、Steel drums 等的介绍,以及不同音乐速度和风格的特征等。
2024-11-06
有没有免费的图片处理AI工具介绍
以下为您介绍一些免费的图片处理 AI 工具: 1. AVAide Watermark Remover:在线工具,使用 AI 技术去水印,支持多种图片格式,如 JPG、JPEG、PNG、GIF 等。操作简单,上传图片、选水印区域,保存下载处理后的图片,还提供去除文本、对象等功能。 2. Vmake:提供 AI 去除图片水印功能,可上传最多 10 张图片,自动检测移除水印,处理后可保存文件,适合需快速去水印及在社交媒体分享图片的用户。 3. AI 改图神器:提供 AI 智能图片修复去水印功能,可一键去除多余物体、人物或水印,支持粘贴或上传手机图像,操作简便。 此外,在图像类 AI 产品中,通义万相是国产免费工具,每天签到获取灵感值即可使用。它在中文理解和处理方面出色,用户可选择多种艺术和图像风格,操作界面简洁直观、用户友好,能与阿里其他产品和服务无缝整合,但在某些方面存在局限性。 在图片生成 3D 建模工具方面,有以下几种: 1. Tripo AI:VAST 发布的在线 3D 建模平台,能利用文本或图像在几秒钟内生成高质量且可用的 3D 模型,基于数十亿参数级别的 3D 大模型,实现快速 2D 到 3D 转换,提供 AI 驱动的精准度和细节。 2. Meshy:功能全面,支持文本生成 3D、图片生成 3D 及 AI 材质生成,上传图片并描述材质和风格可生成高质量 3D 模型。 3. CSM AI:支持从视频和图像创建 3D 模型,Realtime Sketch to 3D 功能支持通过手绘草图实时设计 3D 形象再转换为 3D 模型。 4. Sudo AI:支持通过文本和图像生成 3D 模型,适用于游戏领域模型生成,上传图片或输入文本提示词即可。 5. VoxCraft:免费 3D 模型生成工具,能将图像或文本快速转换成 3D 模型,提供图像到 3D、文本到 3D 和文本到纹理等多种功能。 这些工具通常用户友好,无需专业 3D 建模技能,可广泛应用于游戏开发、动画制作、3D 打印、视觉艺术等领域。请注意,内容由 AI 大模型生成,请仔细甄别。
2024-11-04
给我一个秘塔搜索的介绍及使用指南
秘塔搜索是由秘塔科技开发的一款 AI 搜索引擎,具有以下特点和功能: 1. 多模式搜索:提供多种搜索方式,满足不同用户需求。 2. 无广告干扰:为用户提供更纯净的搜索环境。 3. 结构化展示:使搜索结果呈现更清晰、有条理。 4. 信息聚合:整合各类相关信息,提升搜索效率和体验。 使用指南方面: 1. 明确搜索需求:清晰地知道自己想要查找的内容。 2. 输入准确关键词:有助于获得更精准的搜索结果。 如果您想了解更多关于秘塔搜索的详细内容,建议您访问其官方网站获取最新和更全面的信息。
2024-11-01
介绍一下视觉算法产品,以及该方向产品经理需要做的内容,以及面试可能会考察的知识点
目前知识库中暂时没有关于视觉算法产品、该方向产品经理工作内容以及面试考察知识点的相关信息。但一般来说,视觉算法产品是利用计算机视觉技术来实现特定功能的产品,例如图像识别、目标检测、视频分析等。 视觉算法产品经理需要做的工作内容可能包括: 1. 市场调研与需求分析:了解市场需求、竞争对手情况,挖掘潜在的用户需求。 2. 产品规划与定义:明确产品的目标、功能、性能指标等。 3. 算法选型与整合:根据需求选择合适的视觉算法,并进行整合和优化。 4. 项目管理与推进:协调开发团队、测试团队等,确保项目按时交付。 5. 与客户沟通:收集反馈,优化产品。 在面试视觉算法产品经理时,可能会考察以下知识点: 1. 计算机视觉基础知识,如常见的算法和模型。 2. 对相关行业和市场的了解。 3. 产品管理的方法和流程。 4. 项目管理经验和能力。 5. 沟通协调和团队合作能力。
2024-11-01