Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

如何使用本地数据训练AI?

Answer

使用本地数据训练 AI 可以参考以下内容:

  • Teachable Machine
    • 应用场景广泛,如商品说明书、自动驾驶、教学互动等。
    • 允许用户快速、简单地创建机器学习模型,无需专业知识或编程技能。
    • 使用步骤:
      • 收集数据:可上传图片、录制声音或动作视频作为训练数据。
      • 训练模型:用收集的数据训练模型并测试其能否正确识别新的内容。
      • 导出模型:完成训练后可下载或上传到网上用于其他项目。
    • 特点:
      • 提供多种创建机器学习模型的方式,灵活且用户友好。
      • 可在本地完成训练,不通过网络发送或处理数据,保护隐私。
      • 生成的模型是真实的 TensorFlow.js 模型,可在任何运行 JavaScript 的地方工作,还能导出到不同格式在其他地方使用。
      • 官方网站:https://teachablemachine.withgoogle.com
  • Stable Diffusion
    • 训练数据集制作:
      • 数据清洗:筛除分辨率低、质量差、存在破损及与任务目标无关的数据,去除水印、干扰文字等。
      • 数据标注:分为自动标注(如使用 BLIP 输出自然语言标签)和手动标注(依赖标注人员)。
      • 补充标注特殊 tag:可手动补充特殊标注,如运行相关代码并修改参数。
Content generated by AI large model, please carefully verify (powered by aily)

References

Han:基于现有能力项目应用的思考

|技术名称|应用场景|技术类型|简介|主要特点|工作原理|其他|官方网站|项目及演示|论文|Github|在线体验|附件|最后更新时间||-|-|-|-|-|-|-|-|-|-|-|-|-|-||Teachable Machine:一个由Google开发的机器学习工具|这个项目在很多应用场景中可以被使用,<br>例如商品说明书,自动驾驶,教学互动等多个场景。|AI学习模型|它允许用户快速、简单地创建自己的机器学习模型,而无需专业知识或编程技能。<br><br>你可以用它来教电脑识别图片、声音或人的动作。|使用这个工具的步骤很简单:<br><br>1、收集数据:你可以上传图片、录制声音或动作视频来作为训练数据。<br><br>2、训练模型:用这些数据来训练你的模型,然后测试它能否正确识别新的图片、声音或动作。<br><br>3、导出模型:完成训练后,你可以下载这个模型,或者上传到网上,用在其他项目中。|Teachable Machine提供了多种方式来创建机器学习模型,非常灵活和用户友好。<br><br>1、使用文件或实时捕捉示例:用户可以选择上传已有的图片、音频文件作为数据,也可以直接通过电脑的摄像头或麦克风实时录制视频、声音作为训练数据。<br><br>2、可以在本地完成训练:用户有选项不通过网络发送或处理数据。所有操作,包括数据的收集、模型的训练和应用,都可以在用户自己的电脑上完成,不需要将摄像头或麦克风收集的数据发送到互联网上。这对于隐私保护是非常重要的,特别是当处理敏感信息时。<br><br>3、Teachable Machine”生成的模型是真实的TensorFlow.js模型,可以在任何运行JavaScript的地方工作。<br>此外,还可以将模型导出到不同的格式,以便在其他地方使用,如Coral、Arduino等。|||[https://teachablemachine.withgoogle.com](https://t.co/pZ3hjg3U2t)|||||2024/01/12|

教程:深入浅出完整解析Stable Diffusion(SD)核心基础知识 - 知乎

从上图可以看到,在将general_threshold和character_threshold同时设置为0.5时,wd-v1-4-moat-tagger-v2模型的标注效果整体上是最好的,内容丰富且最能反应图片中的语义信息。所以在这里,Rocky也推荐大家使用wd-v1-4-moat-tagger-v2模型。大家也可以在SD-Train项目的tag_models文件夹下调用这些模型,进行对比测试,感受不同系列Waifu Diffusion v1.4模型的标注效果。(3)补充标注特殊tag完成了caption和tag的自动标注之后,如果我们需要训练一些特殊标注的话,还可以进行手动的补充标注。SD-Trian项目中也提供了对数据进行补充标注的代码,Rocky在这里将其进行提炼总结,方便大家直接使用。大家可以直接拷贝以下的代码,并按照Rocky在代码中提供的注释进行参数修改,然后运行代码即可对数据集进行补充标注:看完了上面的完整代码流程,如果大家觉得代码太复杂,don‘t worry,大家只需要复制上面的全部代码,并将train_data_dir="/本地数据集路径"和custom_tag="WeThinkIn"设置成自己数据集的本地路径和想要添加的特殊标注,然后运行代码即可,非常简单实用。还是以之前的美女图片为例子,当运行完上面的代码后,可以看到txt文件中,最开头的tag为“WeThinkIn”:SD模型数据标注流程:手动补充增加特殊tag标签

教程:深入浅出完整解析Stable Diffusion(SD)核心基础知识 - 知乎

首先,我们需要对数据集进行清洗,和传统深度学习时代一样,数据清洗工作依然占据了AIGC时代模型训练70%-80%左右的时间。并且这个过程必不可少,因为数据质量决定了机器学习的上限,而算法和模型只是在不断逼近这个上限而已。我们需要筛除分辨率较低,质量较差(比如说768*768分辨率的图片<100kb),存在破损,以及和任务目标无关的数据,接着去除数据里面可能包含的水印,干扰文字等,最后就可以开始进行数据标注了。数据标注可以分为自动标注和手动标注。自动标注主要依赖像BLIP和Waifu Diffusion 1.4这样的模型,手动标注则依赖标注人员。(1)使用BLIP自动标注caption我们先用BLIP对数据进行自动标注,BLIP输出的是自然语言标签,我们进入到SD-Train/finetune/路径下,运行以下代码即可获得自然语言标签(caption标签):注意:在使用BLIP进行数据标注时需要依赖bert-base-uncased模型,Rocky这边已经帮大家配置好了,大家只要使用SD-Train项目便无需做任何修改。同时,如果大家想要修改bert-base-uncased模型的调用路径,可以找到SD-Train/finetune/blip/blip.py脚本的第189行,将“../bert-base-uncased”部分修改成自己的本地自定义路径比如“/本地路径/bert-base-uncased”即可。从上面的代码可以看到,我们第一个传入的参数是训练集的路径。下面Rocky再向大家介绍一下其余参数的意义:

Others are asking
ai绘画
AI 绘画具有多方面的特点和影响: 1. 与艺术界的双向影响: 改变传统艺术面貌:从生成艺术作品到辅助艺术创作,影响创作方式、审美观念和市场需求。 技术进步:从早期机械臂机器人到当前大语言模型,在创作质量和速度上有新突破,推动传统艺术数字化和普及化。 引发讨论和争议:人们对 AI 创作的艺术品接受程度与人类作品大致相同,但不太愿意将其视为艺术家;艺术家态度复杂,有期待也有担忧;带来从业者职业安全焦虑和“侵权”反对之声,挑战现有法律和伦理框架。 提供新可能性:帮助艺术家探索新创意表达方式,提高制作效率,降低成本,促进艺术与观众互动,提供个性化体验。 2. 关键词指南: 公式:主题+环境+气氛+灯光+色彩+构图+风格参考。 比如:将喜欢的艺术家、灯光、颜色等风格放入相应的关键词里。 3. 艺术与科技的融合: 呈现奇妙景象:将艺术与先进技术完美结合,引领艺术界走向未来。 探索之旅:利用机器学习和深度学习模拟创作过程,生成令人惊叹的作品,为艺术家提供新工具和观众带来新体验。 打破局限:不再局限于传统手工绘画技巧,通过技术手段开拓新创作领域,为缺乏绘画技巧的人提供参与机会,使艺术更民主化和包容。
2025-03-06
你作为AI开源项目的专家,请解释下如何来做一个AI开源项目
要做一个 AI 开源项目,以下是一些关键步骤和要点: 1. 明确项目目标和范围:确定您的 AI 开源项目要解决的具体问题和应用场景,以及项目的边界和功能。 2. 制定.cursorrules: 说明自己的身份和期望的技能:告诉 AI 您希望它具备的专业水准和技能。 明确项目任务:清晰地告知 AI 项目的具体目标和要求。 设定项目规则:包括代码规范、风格等,以保证代码的一致性和可维护性。 规划文件存放位置:便于代码的组织和查找。 指定使用的工具:如框架和库,确保项目的整洁和统一。 说明测试要求:让 AI 生成的代码具有可测试性,并主动编写测试用例。 提供参考资料:帮助 AI 基于最佳实践进行开发。 如有 UI 需求,明确相关要求。 3. 选择合适的技术和框架:例如 Fooocus 这样的图像生成开源项目,它内置多种风格,适合小白上手,且具有离线、开源、免费等特点,支持在多种操作系统上使用,并借鉴了稳定扩散和 Midjourney 的设计思想。 4. 考虑开源的角色和影响:从长远来看,开源模型的情况会变得复杂。对于具有高度能力的模型,如能够自主创办和建立大型科技公司或进行科学研究的模型,其是否开源会产生难以预测的后果。 总之,创建一个 AI 开源项目需要综合考虑多方面的因素,包括技术选型、规则制定、目标明确等,以确保项目的成功和可持续发展。
2025-03-06
有什么AI生图网站支持生成汉字?
以下是一些支持生成汉字的 AI 生图网站: 1. ComfyUI Kwai Kolors 快手可图:支持中英文提示词工作流,有相关的下载安装设置教程,可生成汉字。您可以通过了解更多。 2. 豆包 App 支持文生图中文文字生成。
2025-03-06
什么是AI
AI 是一门令人兴奋的科学,它是某种模仿人类思维,可以理解自然语言并输出自然语言的东西。对于没有理工科背景的人来说,可以把 AI 当成一个黑箱,其生态位是一种似人而非人的存在。 从技术角度看,最初计算机是按照明确的程序和算法进行运算。但对于像根据照片判断一个人的年龄这类任务,我们无法明确其具体步骤和解法,而这正是 AI 所感兴趣的。 如今的 AI(主要是生成式 AI 这类技术)可以接受和理解各种不同的输入和数据,并生成包括文字、声音、图像、视频、3D 模型等多种多样的内容。简单来说,可以把 AI 当人看。
2025-03-06
产品经理在设计AI产品功能时候,需要设计意图识别吗?怎么设计呢
产品经理在设计 AI 产品功能时,需要设计意图识别。以下是关于意图识别的相关内容: 意图识别的定义:当用户输入指令,这些指令通过感知模块传递到 Brain 模块,Brain 模块需要对这些指令做出反应。这个过程在本质上是一种分类任务,即识别并区分用户的具体意图。无论是在单一智能体架构还是复杂的多智能体系统中,意图识别都扮演着至关重要的角色。 意图识别的实现方式: 1. 通过准备特定于任务的数据集,然后利用这些数据对模型进行 Finetuning,以提升其在特定意图识别任务上的表现。这个过程涉及到在预训练模型的基础上进一步训练,以调整模型参数,使其更适应特定的任务需求。 2. Prompttuning,这种方法不需要对模型的参数进行大规模调整。而是通过精心设计的提示词来引导模型,使其能够识别和响应用户的意图。这种方法的优势在于其灵活性和快速适应性,能够在不改变模型参数的情况下,迅速适应新的任务或领域。 这两种方法各有优缺点:微调能够提供更高的准确性,但需要较多的训练数据和计算资源;而提示词调优则在创造性和灵活性方面表现更为突出。 在使用大型模型进行意图识别时,需要注意一些潜在的问题: 1. 由于意图识别在智能系统中扮演着守门人的角色,如果其准确性不足,整个系统的后续环节,包括记忆、规划和反思等,都可能受到影响,无法正常发挥作用。 2. 在落地设计时,意图识别通常与特定的业务场景紧密相关,如果脱离了具体的业务需求,意图识别将失去其实际意义。因此,在设计意图识别系统时,必须将其与业务需求紧密结合,确保其能够准确地理解和响应用户的需求。如果意图识别脱离了业务背景,那么可能不如利用模型的泛化能力去执行更基本的意图识别任务。 以下是一个使用 prompt 来设计意图识别的例子:在上述使用提示词进行意图识别的例子中,提示词对用户的指令进行了分类,以识别不同的意图。然后,根据这些识别出的意图,系统执行相应的动作。最终,系统会输出一个 JSON 格式的结果,这通常包含了对用户指令的解析和响应。 在未来的 AI 学习产品中,除了拥有大模型之外,还需要拥有其他的基础设施,包括但不仅限于具备学习任务规划能力的小参数规模模型、意图识别模型、多模态交互模型、搜索引擎、既有的知识库等等。
2025-03-06
sap与AI的相关知识
以下是关于 SAP 与 AI 的相关知识: NVIDIA 和 SAP 正在使用 NVIDIA NEMO 和 DGX Cloud 构建 SAP gem Copilots。SAP 支撑了全球 87%的全球商业,基本上世界都在 SAP 上运行。 目前提供的内容中关于 SAP 与 AI 的信息有限,您可以补充更多具体需求,以便为您提供更全面和准确的回答。
2025-03-06
deepseek 私有化训练
以下是关于 DeepSeek 私有化训练的相关信息: 模型测试、问题探讨与新模型部署过程: 探讨了模型存在幻觉、答案有概率性等问题,并对比了加提示词前后的情况。 准备从 32B 蒸馏新模型,提及该模型的资源需求及阿里云拍卖机制。 介绍了启动 DSW 获取廉价 CPU 资源,以及部署模型时因库存不足不断加价的过程。 派平台大模型训练与微调实操讲解: 许键分享了抢硬件资源的方法,演示了通过提问蒸馏标注数据。 讲解了在派平台训练模型的流程,包括参数设置、数据集上传等,并展示了训练效果和日志查看。 说明了训练好的模型部署方法,强调训出满意模型需要大量基础知识学习。 模型蒸馏微调演示、平台介绍与问题解答: 许键展示了模型微调后的效果,如幻觉下降等。 介绍了阿里云解决方案,对比了百炼和派平台的差异。 进行了 Q&A,回答了无监督学习微调、训练数据资源、多模态训练标注、Python 代码报错等问题,提及派平台有公用数据集,还举例说明了多模态标注方式。 总结: 本地部署介绍:讲解了如果拥有云服务器如何进行本地部署,以及满血版本地部署的实际情况。 免费额度说明:在 freely.aliyun.com 可领取 500 元免费额度,但有使用限制,不能部署满血版和较大的增流模型。 平台服务差异:介绍了 DLC、DSW 和 EAS 等模型部署平台服务的差别。 模型蒸馏微调:会带着大家复现模型的蒸馏和微调,并讲解相关知识。 Deepseek R1 模型的制作及相关模型比较: R1 模型的强化学习:通过强化学习,在训练过程中给予模型反馈,对正确路线增强权重,使做对的概率变高,导致思考逻辑变长。 R1 模型的蒸馏与微调:用 Deepseek RE Zero 蒸馏出带思考的数据,基于 Deepseek V3 微调,进行冷启动,再做强化学习,还从非公布模型提取微调数据,加上人类偏好,最终形成 R1。 R1 与其他模型的差别:R1 是原生通过强化学习训练出的模型,蒸馏模型是基于数据微调出来的,基础模型能力强,蒸馏微调模型能力也会强。 模型的相互帮助:Deepseek R1 反过来蒸馏数据微调 V3,形成互相帮助的局面,使两个模型都更强。 智能章节: 许键介绍今日课程重点是云服务器上如何使用 Deepseek R1 及本地部署相关内容,提及派平台免费额度及适用模型。还介绍了自己和社区情况。接着讲解 Deepseek R1 制作过程,包括强化学习概念及示例,阐述其从 Deepseek r e Zero 到 M2 等模型的演变及原理。 主要介绍了 Deepseek R1 模型的构建过程,包括多轮强化学习和微调,还提及蒸馏模型的情况。探讨了不同模型部署所需的显存、内存及成本,对比了各模型在专业领域的能力表现。 介绍了以云基础设施和 GPU 算力资源为底层的派平台。该平台搭建 AI 框架并做优化,提供一键式快捷部署工具等。与百炼不同,它开放更多自由度,租户数据隔离。很多大模型在此训练,支持多机分布式部署等,既面向企业,也适合个人创业者,不同应用定价有差异。
2025-03-05
Deepseek 怎么训练模型 到达写作的水准
要将 DeepSeek 训练模型达到写作的水准,可以参考以下方法: 1. 借助 AI 分析好的文章:找出您最喜欢的文章,投喂给 DeepSeek R1。然后进行多次询问,如从写作角度、读者角度分析文章,询问文章的缺点和不足以及改善和提升的空间,对作者进行侧写,分析其成长背景、个人经历和知识结构对文章的影响。 2. 让 AI 对您写的文章进行点评:使用类似“现在我希望你是一名资深中文写作教师/小学语文老师/中学语文老师/公文写作培训师,拥有 30 年教育经验,是一名传授写作技巧的专家。请先阅读我提供给你的文章,然后对文章进行分析,然后教我如何提升写作水平。请给出详细的优缺点分析,指出问题所在,并且给出具体的指导和建议。为了方便我能理解,请尽量多举例子而非理论陈述。”的提示词。 3. 根据文章内容对作者进行心理侧写:使用如“我希望你扮演一个从业 20 多年,临床诊治过两千多例心理分析案例的人性洞察和意识分析方面的专家,精通心理学、人类学、文史、文化比较。先阅读后附文章全文,然后对作者进行人格侧写。要尖锐深刻,不要吹捧包装,不要提出一些只能充当心理安慰的肤浅的见解。包括作者的基本画像、核心性格特质、认知与价值观、潜在心理动机、行为模式推测、矛盾与盲点、文化符号映射”的提示词。 此外,DeepSeek 模型具有文风出色、善用大词、发散能力强等特点,但也较难收敛,有时会出现幻觉。从创作角度看,其在文学创作上表现出色,能给予更多自由发挥空间。
2025-03-05
flux 训练lora 教程
以下是关于 Flux 训练 Lora 的教程: 1. 准备模型:需要下载以下几个模型:t5xxl_fp16.safetensors、clip_l.safetensors、ae.safetensors、flux1dev.safetensors。注意:不使用的话它们放到哪里都可以,甚至放一起一个文件夹,只要知道“路径”,后面要引用到“路径”。因为是训练,不是跑图,训练的话,模型就用 flux1dev.safetensors 这个版本,编码器也用 t5xxl_fp16.safetensors 这个版本最好。 2. 下载脚本: 夸克网盘链接:https://pan.quark.cn/s/ddf85bb2ac59 百度网盘链接:https://pan.baidu.com/s/1pBHPYpQxgTCcbsKYgBi_MQ?pwd=pfsq 提取码:pfsq 3. 安装虚拟环境:下载完解压,在文件中找到 installcnqinglong.ps1 这个文件,右键选择“使用 PowerShell 运行”,新手的话这里就点击“Y”,然后等待 1 2 小时的漫长下载过程,下好了之后最后会提示是否下载 hunyuan 模型,选择 n 不用下载。 4. 0 基础训练大模型: 进入厚德云 模型训练 数据集:https://portal.houdeyun.cn/sd/dataset 步骤一·创建数据集:在数据集一栏中,点击右上角创建数据集,输入数据集名称。zip 文件可以是包含图片 + 标签 txt,也可以只有图片没有打标文件(之后可以在 c 站使用它的自动打标功能),也可以一张一张单独上传照片,但建议提前把图片和标签打包成 zip 上传。Zip 文件里图片名称与标签文件应当匹配,例如:图片名"1.png",对应的达标文件就叫"1.txt"。上传 zip 以后等待一段时间,确认创建数据集,返回到上一个页面,等待一段时间后就会上传成功,可以点击详情检查,可以预览到数据集的图片以及对应的标签。 步骤二·Lora 训练:点击 Flux,基础模型会默认是 FLUX 1.0D 版本,选择数据集,点击右侧箭头,会跳出所有上传过的数据集,触发词可有可无,取决于数据集是否有触发词,模型效果预览提示词则随机抽取一个数据集中的标签填入即可。训练参数这里可以调节重复次数与训练轮数,厚德云会自动计算训练步数,如果不知道如何设置,可以默认 20 重复次数和 10 轮训练轮数,可以按需求选择是否加速,点击开始训练,会显示所需要消耗的算力,然后就可以等待训练了,会显示预览时间和进度条,训练完成的会显示出每一轮的预览图,鼠标悬浮到想要的轮次模型,中间会有个生图,点击会自动跳转到使用此 lora 生图的界面。点击下方的下载按钮则会自动下载到本地。 5. ControlNet 作者张吕敏再出新项目 LuminaBrush:基于数据集在 Flux 上训练 LoRA,并用 LoRA 生成的图像来扩展这个图像数据集。使用均匀光照图像作为中间表示具有一些优势,比如避免来自 3D 反照率的过于锐利的网格边界或过于平坦的表面。而这些图像在细节层面也足够细腻,可以处理皮肤纹理、头发、毛发等细节。接下来,通过合成随机法线,将这些均匀光照图像进行随机再光照,以训练一个可以从任何输入图像中提取均匀光照外观的模型。第一阶段的这个模型目前也提供了在线 demo:https://huggingface.co/spaces/lllyasviel/lumina_brush_uniform_lit 。第二阶段,会从数百万张高质量的自然场景图像中提取均匀光照外观图像,以构建成对数据集,用于训练最终的交互式光照绘制模型。
2025-03-04
我想完全本地化部署deepseek,然后,将我的文档,文本,图片等内容丢给它训练,微调。我要完全本地化,因为我的文档设计隐私。我要免费开源流程。如何实现,
要完全本地化部署 DeepSeek 并使用您的文档、文本、图片等内容进行训练和微调,以下是一些相关的信息和步骤: 1. 模型训练与平台服务: 模型复现与微调:1:1 复现通常没问题,但理解细节并自行制作需要基础知识。有手把手教程、数据集等可帮助 1:1 复现,微调在特定领域可降低幻觉,参数量不变但权重变化。 训练模型的学习方法:先会用再学会训,从训的过程中倒推学习参数调整,这是以用导学的学习方法。 模型回答效果对比:微调后的模型在回答排列组合等问题时,思考前几乎无反馈,答案多为英文且格式稳定,但仍可能答错。 2. 平台服务介绍: 阿里云提供多种解决方案。 百炼是提供多种模型服务的 Maas 平台。 派平台是提供云服务的 PaaS 平台,二者在定位、服务内容和核心差异上有所不同。 3. 关于模型训练与数据集相关问题: 数据资源情况:默认提供公共数据训练集,百派平台能匹配模型和数据,通义开源了不少数据集。 多模态训练:多模态有自身标注方式,如视频拉框标注。 参数量变化:通常训练模型参数量固定,若想改变需改模型层,但可能要从头调。 本地微调框架:可使用 llama factory 等框架,需搭建并部署。 开源数据下载:可在 GitHub、hugging face、Mo Model Scope 等平台获取。 数据集转化:将文档资料转成数据集可先手动形成 SOP,再逐步自动化,初期需大量人力。 4. 本地部署介绍:讲解了如果拥有云服务器如何进行本地部署,以及满血版本地部署的实际情况。 5. 免费额度说明:在 freely.aliyun.com 可领取 500 元免费额度,但有使用限制,不能部署满血版和较大的增流模型。 6. 平台服务差异:介绍了 DLC、DSW 和 EAS 等模型部署平台服务的差别。 7. 模型蒸馏微调:会带着大家复现模型的蒸馏和微调,并讲解相关知识。 R1 模型的强化学习:通过强化学习,在训练过程中给予模型反馈,如路线规划是否成功到达终点、输出格式是否符合期望等,对正确路线增强权重,使做对的概率变高,导致思考逻辑变长。 R1 模型的蒸馏与微调:用 Deepseek RE Zero 蒸馏出带思考的数据,基于 Deepseek V3 微调,进行冷启动,再做强化学习,还从非公布模型提取微调数据,加上人类偏好,最终形成 R1。 R1 与其他模型的差别:R1 是原生通过强化学习训练出的模型,蒸馏模型是基于数据微调出来的,基础模型能力强,蒸馏微调模型能力也会强。 模型的相互帮助:Deepseek R1 反过来蒸馏数据微调 V3,形成互相帮助的局面,使两个模型都更强。 请注意,在进行本地化部署和训练微调时,需要具备一定的技术知识和经验,并且要遵循相关的法律法规和道德规范。
2025-03-04
一个可以总结文章的AI应用是怎么训练出来的?
一个可以总结文章的 AI 应用通常通过以下方式训练: 1. 数据准备:收集大量的文本数据,包括各种类型和主题的文章。 2. 模型选择:使用适合自然语言处理任务的大型语言模型,如 OpenAI 的 GPT 系列。 3. 导入相关库和加载 API 密钥:例如导入 OpenAI 并加载 API 密钥。 4. 设计提示:制定明确的提示,如要求从电子商务网站的产品评论中生成简短摘要。 5. 针对不同需求训练: 文字总结:对一般性的文字进行总结。 针对某种信息总结:例如特定领域或特定类型的信息。 尝试“提取”而不是“总结”:更侧重于关键信息的提取。 针对多项信息总结:处理多个相关的文本信息。 6. 应用拓展:不仅可以总结文章,还能总结群聊消息、B站视频等。对于 B 站视频,通过获取字幕并发送给 AI 来实现总结。 7. 与 API 配合:通过 OpenAI API 等获取有效密钥,并结合示例代码进行开发和优化。
2025-03-03
怎么利用大模型训练自己的机器人
利用大模型训练自己的机器人可以参考以下内容: OpenAI 通用人工智能(AGI)的计划显示,在互联网上所有的图像和视频数据上训练一个与人类大脑大小相当的 AI 模型,将足以处理复杂的机器人学任务。常识推理隐藏在视频和文本数据中,专注于文本的 GPT4 在常识推理上表现出色。Google 最近的例子展示了机器人学能力可从大型视觉/语言模型中学习,在语言和视觉训练基础上,只需最少的机器人学数据,视觉和文本任务的知识就能转移到机器人学任务上。特斯拉训练的“Optimus”通过人类示范学习抓取物体,若人类示范是先进机器人学性能所需的一切,在互联网上所有视频上训练的大模型肯定能实现惊人的机器人学性能。 梦飞提供了在自己的电脑上部署 COW 微信机器人项目的教程,程序在本地运行,若关掉窗口进程结束,想持续使用需保持窗口打开和运行。以 Windows10 系统为例,注册大模型可参考百炼首页:https://bailian.console.aliyun.com/ ,需更改"model"和添加"dashscope_api_key",获取 key 可参考视频教程。 张梦飞提供了从 LLM 大语言模型、知识库到微信机器人的全本地部署教程,部署大语言模型包括下载并安装 Ollama,根据电脑系统下载:https://ollama.com/download ,安装完成后将下方地址复制进浏览器中确认安装完成:http://127.0.0.1:11434/ 。下载 qwen2:0.5b 模型,Windows 电脑按 win+R 输入 cmd 回车,Mac 电脑通过 Command(⌘)+Space 键打开 Spotlight 搜索输入“Terminal”或“终端”,复制命令行粘贴回车等待下载完成。
2025-03-03
我也想做一个有关于数据的知识库,做完之后可以让他帮我分析数据
以下是关于创建和使用数据知识库的相关信息: 智能体: 创建智能体的知识库时,可选择手动清洗数据,手动清洗数据能提高数据准确性。手动清洗数据包括创建在线知识库和本地文档。 在线知识库:点击创建知识库,创建画小二课程的 FAQ 知识库,飞书在线文档中每个问题和答案以分割,可编辑修改和删除,添加 Bot 后可在调试区测试效果。 本地文档:注意拆分内容以提高训练数据准确度,例如对于画小二课程,将其章节内容按固定方式人工标注和处理。 完成创建后点击发布,确保在 Bot 商店中能够搜到,只有通过发布才能获取 API。 安装 Coze Scraper: 安装扩展程序至浏览器后,可按以下步骤采集数据上传到知识库: 1. 登录。 2. 在左侧菜单栏选择一个工作区。 3. 在工作区内,单击知识库页签。 4. 创建一个知识库或点击一个已存在的知识库。 5. 在知识库页面,单击新增单元。 6. 在文本格式页签下,选择在线数据,然后单击下一步。 7. 单击手动采集,完成授权。 8. 输入要采集内容的网址,确认。 9. 标注要提取的内容,查看数据确认无误后再点击完成并采集。 Obsidian 加 Cursor: 用 Trae 查询笔记内容:Obsidian 虽支持多种搜索方式,但基于关键字搜索在笔记库较大时存在困难。可在 Trae 右侧的 Chat 输入框输入相关问题进行模糊搜索,如输入「」然后选择剪藏文件夹,提问特定内容。 用 Trae 和 Obsidian 辅助研究:可对多个不同的笔记文件进行比较或综合整理研究,在 Chat 输入框提问时用「」分别引用指定的笔记文件或文件夹。还可根据需求和内容发散更多用法,如用于学习和复习,或分析结构化数据。
2025-03-06
有没有什么工具,能根据需求进行数据库设计文档生成的
以下是为您提供的相关信息: COZE 工作流中关于数据库节点的教程: 1. 在 SQL 输入中添加 SQL 代码,如果不会写 SQL 语言或不懂代码,可以借助 AI 帮助。例如将相关需求发送给豆包,如学习特定文档并根据具体需求撰写用于工作流的 SQL 语句。 2. 向豆包提出具体要求,如指定数据库表名称(如“user_question_answer”)和存储字段名称(“create_time”“answer”“question”),并说明数据写入的需求。 3. 豆包会回复生成的 SQL 语句(如“INSERT INTO user_question_answer”),将其复制到数据库节点里 SQL 的位置。 4. 试运行时提供输入内容并选择第一步使用的 bot,成功后发布工作流即可记录对应数据到数据库。 另外,欧盟数据法案英文版.pdf 中提到:成员国主管当局应确保对违反本法规规定义务的行为处以处罚。在这样做时,应考虑到所涉公共利益、违规行为的性质、严重程度、复发和持续时间、所开展活动的范围和种类以及违规者的经济能力。委员会应在必要时考虑特定部门的条件和自愿数据共享机制的现有做法,为企业间数据共享合同制定和推荐非强制性示范合同条款。这些示范合同条款应主要是帮助特别是小企业签订合同的实用工具。当广泛和完整地使用时,这些示范合同条款也应具有有益的效果,影响关于访问和使用数据的合同设计,从而在访问和共享数据时更广泛地导致更公平的合同关系。为消除通过联网产品和相关服务的物理组件(如传感器)获得或生成的数据库中的数据持有者声称根据第 96/9/EC 号指令第 7 条享有的特殊权利(如果此类数据库不符合特殊权利的条件)从而阻碍用户根据本法规有效行使访问和使用数据以及与第三方共享数据的权利的风险,本法规应明确该特殊权利不适用于此类数据库,因为保护要求未得到满足。
2025-03-06
我想通过ai先提取图片数据,然后将获取的数据根据固定话术模板输出,要用什么软件可以实现呢
目前有多种软件可以帮助您实现从图片提取数据并根据固定话术模板输出的需求。以下是一些常见的选择: 1. TensorFlow:这是一个广泛使用的深度学习框架,可用于图像识别和数据处理。 2. OpenCV:提供了丰富的图像处理和计算机视觉功能。 3. PyTorch:常用于深度学习任务,包括图像数据的处理。 但具体选择哪种软件,还需要根据您的具体需求、技术水平和项目特点来决定。同时,您还需要掌握相关的编程知识和图像处理技术,以便有效地运用这些软件来实现您的目标。
2025-03-05
先喂给一些数据文本,然后进行分析的AI有哪些比较好
以下是一些可以先喂给数据文本然后进行分析的 AI 示例: DeepSeek R1:理论上适合大多数 AI,尤其是有推理模型。您可以找出最喜欢的文章投喂给它,并进行多次询问,如从写作角度、读者角度分析文章,指出文章的缺点和不足以及改善提升的空间,还可以对作者进行侧写,分析其成长背景、个人经历和知识结构对文章的影响。 此外,OpenAI 的 GPT 系列模型也是不错的选择。OpenAI 研究团队收集了海量的文本数据,涵盖各种内容,基于 Transformer 架构进行实验,在自然语言处理领域取得了显著成果。
2025-03-05
数据集
以下是关于数据集的相关信息: 厚德云创建数据集及 Lora 训练步骤: 步骤一·创建数据集 在数据集一栏中,点击右上角创建数据集。 输入数据集名称。 可以上传包含图片+标签 txt 的 zip 文件,也可以只有图片没有打标文件(之后可在 C 站使用自动打标功能),建议提前把图片和标签打包成 zip 上传。 Zip 文件里图片名称与标签文件应当匹配,例如:图片名“1.png”,对应的达标文件就叫“1.txt”。 上传 zip 以后等待一段时间,确认创建数据集。返回到上一个页面,等待一段时间后就会上传成功,可以点击详情检查,可预览到数据集的图片以及对应的标签。 步骤二·Lora 训练 点击 Flux,基础模型会默认是 FLUX 1.0D 版本。 选择数据集,点击右侧箭头,会跳出所有上传过的数据集。 触发词可有可无,取决于数据集是否有触发词。模型效果预览提示词则随机抽取一个数据集中的标签填入即可。 训练参数这里可以调节重复次数与训练轮数,厚德云会自动计算训练步数。如果不知道如何设置,可以默认 20 重复次数和 10 轮训练轮数。 可以按需求选择是否加速,点击开始训练,会显示所需要消耗的算力。 然后就可以等待训练,会显示预览时间和进度条。训练完成的会显示出每一轮的预览图。鼠标悬浮到想要的轮次模型,中间会有个生图,点击会自动跳转到使用此 lora 生图的界面。点击下方的下载按钮则会自动下载到本地。 中文数据集: |ID|标题|更新日期|数据集提供者|许可|说明|关键字|类别|论文地址|备注| ||||||||||| |1||42856|北京极目云健康科技有限公司||数据来源于其云医院平台的真实电子病历数据,共计 800 条(单个病人单次就诊记录),经脱敏处理|电子病历|命名实体识别|\\|中文| |2||2018 年|医渡云(北京)技术有限公司||CCKS2018 的电子病历命名实体识别的评测任务提供了 600 份标注好的电子病历文本,共需识别含解剖部位、独立症状、症状描述、手术和药物五类实体|电子病历|命名实体识别|\\|中文| |3||\\|MSRA||数据来源于 MSRA,标注形式为 BIO,共有 46365 条语料|Msra|命名实体识别|\\|中文| |4||35796|人民日报||数据来源为 98 年人民日报,标注形式为 BIO,共有 23061 条语料|98 人民日报|命名实体识别|\\|中文| |5||\\|玻森数据||数据来源为 Boson,标注形式为 BMEO,共有 2000 条语料|Boson|命名实体识别|\\|中文| Llama3 数据集相关: 大模型微调需要使用数据集,数据集是让大模型重新学习的知识。数据集的获取以及简单的原理可以参考文档: 数据集:json 下载地址: 有了数据集,就可以使用代码进行微调。首先把数据集上传到服务器,然后编写微调代码、执行微调代码,大概 15 分钟左右就可以微调完成。
2025-03-03
写论文数据最真实的ai是哪个?
在论文写作领域,AI 技术的应用发展迅速,能在多个方面提供辅助。以下是一些常用的 AI 工具和平台: 1. 文献管理和搜索: Zotero:结合 AI 技术,可自动提取文献信息,助于管理和整理参考文献。 Semantic Scholar:AI 驱动的学术搜索引擎,提供文献推荐和引用分析。 2. 内容生成和辅助写作: Grammarly:通过 AI 提供文本校对、语法修正和写作风格建议,提升语言质量。 Quillbot:基于 AI 的重写和摘要工具,可精简和优化论文内容。 3. 研究和数据分析: Google Colab:提供云的 Jupyter 笔记本环境,支持 AI 和机器学习研究,便于数据分析和可视化。 Knitro:用于数学建模和优化,助力复杂数据分析和模型构建。 4. 论文结构和格式: LaTeX:结合自动化和模板,高效处理论文格式和数学公式。 Overleaf:在线 LaTeX 编辑器,有丰富模板库和协作功能,简化编写过程。 5. 研究伦理和抄袭检测: Turnitin:广泛使用的抄袭检测工具,确保论文原创性。 Crossref Similarity Check:通过与已发表作品比较,检测潜在抄袭问题。 需要注意的是,这些工具只是辅助,使用时要结合自身写作风格和需求,选择最合适的,且内容由 AI 大模型生成,请仔细甄别。但目前没有哪个 AI 能保证提供的数据绝对真实,仍需您对数据进行仔细核实和评估。
2025-02-28
ComfyUI只能在N卡使用?可以在A卡上使用吗
ComfyUI 对电脑硬件有一定要求: 系统:Windows 7 以上。 显卡:推荐使用 NVIDIA 独立显卡且显存至少 4G 起步。不过,mac 系统、AMD 显卡以及低显卡的情况也可以安装使用,但可能存在功能不全、出错率偏高的问题,严重影响使用体验,建议升级设备或者采用云服务器玩耍。 硬盘:留有足够的空间,最低 100G 起步(包括模型)。 运行内存:最低 32GB,越高越好,最低配会经常爆显存。SDXL 出来后提高了运行配置,最低需要 8GB 显存+32GB 运行内存,12GB 流畅运行,推荐 16GB 以上。 甚至没有 GPU,光用 CPU 也可以运行,缺点是速度极慢。 综上所述,ComfyUI 虽然在某些情况下 A 卡也能安装使用,但使用体验可能不佳,一般建议使用 N 卡。
2025-03-06
AI 提示词怎么使用
AI 提示词的使用方法如下: 1. 星流一站式 AI 设计工具: 输入框中可输入提示词,使用图生图功能辅助创作。 提示词用于描绘画面,输入语言方面,星流通用大模型与基础模型 F.1、基础模型 XL 使用自然语言(如一个长头发的金发女孩),基础模型 1.5 使用单个词组(如女孩、金发、长头发),支持中英文输入。 可进行提示词优化,启用后能扩展提示词,更生动地描述画面内容。 写好提示词的方法包括:点击提示词上方官方预设词组进行生图;提示词内容准确,包含人物主体、风格、场景特点、环境光照、画面构图、画质等;调整负面提示词,点击提示框下方的齿轮按钮弹出负面提示词框,帮助 AI 理解不想生成的内容;利用“加权重”功能,在功能框增加提示词并进行加权重调节,权重数值越大越优先;还具有翻译功能可一键将提示词翻译成英文,以及删除所有提示词和会员加速等辅助功能。 2. Adobe Firefly AI 视频功能: 在“文生视频(Text to Video)”和“图生视频(Image to Video)”中,尽量使用更多词汇具体描述光线、摄影、色彩、氛围和美学风格。 提示词公式为镜头类型描述+角色+动作+地点+美学风格。镜头类型描述包括相机视角及移动方式;角色描述涵盖角色身份、外貌、穿着和情绪;动作描述角色在场景中的行为;地点描述包括位置、天气和地形;美学风格描述包括镜头类型、氛围、景深等。构建提示词时,建议限制主题数量,过多主题可能让 Firefly 困惑。 3. 一泽 Eze: 1 句提示词+1 个品牌 Logo 可生成超级符合品牌调性的创意名片,整个流程简单,输入提示词和 Logo 即可。 提示词的主要目的是“设计符合品牌调性的创意名片”,借助大模型可让 AI 自动推敲设计思路生成创意 Demo。 注意事项包括:“创意名片生成”已支持在 Artifacts 中正确回显上传的 Logo,为更好直出效果,Logo 建议使用清晰、底图透明的 PNG 格式;若生成结果不符合预期,可尝试让模型重新生成或和 AI 对话提出修改意见。
2025-03-06
在midjourney一个画布中放置多个角色,使用pan功能添加了新的画布,怎样把新的人物描述和新人物的--cref添加到新的画布中?
在 Midjourney 中,要在一个画布中放置多个角色并将新人物描述和 cref 添加到新画布中,您可以按照以下步骤操作: 1. 使用 /settings 将 Remix 打开,然后选择 。 2. 选择将包含第二个字符的图像,然后使用 U 将其从网格中分离出来。 3. 寻找蓝色小箭头(⬆️⬇️⬅️➡️),每个都会在现有图像中添加一条新图像。选择新角色的前进方向并输入提示及其 cref。这将缝合一条新的画布。 需要注意的是: cref 命令适用于单一主题、单一角色的图像。如果计划在场景中添加多个角色,需要使用平移按钮来添加它们。 您的 cref 图像中应只包含一个角色。如果 cref 图像中有多个人物形象,Midjourney 将它们混合在一起,并混合到输出中。 另外,语雀里面整理了 211 篇文档,共有 412731 字有关 AIGC 的相关文章,MJ 手册的规范使用说明,文章包含了很多大厂经验总结。无偿且标注了文章来源,希望对大家有所帮助,地址:https://www.yuque.com/frannnk7/f7《AIGC Design 手册》
2025-03-06
deepseek使用教程
以下是字节火山 DeepSeek 系列 API 的完整教程及使用方法: 1. 申请免费额度和获取邀请码: 可以使用邀请码 D3H5G9QA 。 邀请链接:https://www.volcengine.com/activity/deepseek?utm_term=202502dsinvite&ac=DSASUQY5&rc=D3H5G9QA ,邀请可拿 3000 万 tokens,畅享 671B DeepSeek R1。 即日起至北京时间 20250218 23:59:59,所有用户均可在方舟享受 DeepSeek 模型服务的价格优惠。DeepSeekR1、V3 模型,分别提供了 50 万免费额度和 API 半价活动(算下来 5 元有 100 万)。 2. 获取 DeepSeekR1 满血版密钥: 注册并登录火山引擎,点击立即体验进入控制台:https://zjsms.com/iP5QRuGW/ 。 创建一个接入点,点击在线推理创建推理接入点。 为接入点命名为 DeepSeekR1。 若有提示“该模型未开通,开通后可创建推理接入点”,点击“立即开通”,勾选全部模型和协议,一路点击开通。 确认以下无误后,点击“确认接入”按钮。 自动返回创建页面,复制接入点的 ID 并保存。 点击【API 调用】按钮,进入后点击【选择 API Key 并复制】,若没有 API key 则点击【创建 API key】,复制并保存好。 3. API 使用方式: 飞书多维表格调用。 Coze 智能体调用。 浏览器插件调用。 4. 使用提示词: 搜索 www.deepseek.com,点击“开始对话”。 将装有提示词的代码发给 Deepseek。 认真阅读开场白之后,正式开始对话。 希望以上内容对您有所帮助。
2025-03-06
有无财务人员可使用的大模型?
以下是一些财务人员可使用的大模型相关信息: 1. Coze 记账管家:通过大语言模型把用户输入的非结构化记账数据转变成结构化数据存入数据库。工作流程包括定义提示词,让大模型拆解识别记账事项、发生时间、变动金额等,并将其存入数据库。 2. 金融服务业中的应用: 客户服务代表:新的客户服务代表可使用经过过去 10 年银行部门客户服务通话训练的大语言模型,快速生成问题答案,减少培训时间。 贷款员:生成式 AI 模型可在相关系统数据上训练,贷款员提供客户名称即可生成贷款文件。 质量保证:生成式 AI 可加速银行和金融科技公司确保符合监管要求的过程。 3. 金融行业·大模型挑战赛:举办“2024 金融行业·大模型挑战赛”,整合公开金融数据打造多轮问答评测赛题,提供基础数据表,参赛选手需采用 GLM4 系列模型 API,可运用多种技术手段完成赛题,设有中文和英文测试集。主办单位为清华大学基础模型研究中心,有多个单位支持。
2025-03-06
企业财务如何使用ai
企业财务可以通过以下方式使用 AI: 1. 利用提示词工程中的思维程序(PoT)技术:PoT 能将思考过程转化为可执行的程序或算法,适合财务分析、风险评估等需要严谨计算的场景。在进行新产品的财务可行性分析时,可使用 PoT 提供精确的财务分析,并轻松调整参数进行不同情景的模拟,提高决策的精确度和灵活性。在选择框架时,需根据具体任务需求,如短时间内做出结构化决策选 AoT,快速生成大量结构化内容选 SoT,涉及复杂计算或高度精确性选 PoT。 2. 借助生成式 AI: 帮助回答财务问题,改进内部流程,简化日常工作流程。 从更多数据源获取数据,自动化突出趋势、生成预测和报告的过程,如预测分析的自动化、自动创建报告、辅助会计和税务工作、处理采购和应付账款等。 3. 应用于风险管理: 首先,使用 AI 工具进行风险评估,包括准确预测和识别潜在风险,如财务风险、供应链风险等。选择适合的 AI 风险评估工具,收集相关数据并分析,预测潜在风险及来源和影响。 其次,基于 AI 分析结果制定相应的风险应对策略,包括制定应急计划、调整业务策略等,并持续监控效果,定期复审和更新风险评估模型和管理策略。 通过以上方式,企业财务能够更有效地识别和应对潜在风险,提高工作效率和决策精确度,实现可持续发展。
2025-03-05