直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

怎么搭建混元3D模型到本地使用

回答

要在本地搭建混元 3D 模型,以下是一些方法和步骤:

  1. 制作乐高 logo 的 STL 文件:
    • 设计乐高 logo:使用矢量图形编辑软件(如 Adobe Illustrator 或 Inkscape)创建或获取矢量格式的乐高 logo,确保符合标准。
    • 导入 3D 建模软件:将矢量 logo 导入到 3D 建模软件(如 Blender、Fusion 360 或 Tinkercad)中。
    • 创建 3D 模型:在软件中根据矢量图形创建 3D 模型,调整尺寸和厚度以适合打印。
    • 导出 STL 文件:将完成的 3D 模型导出为 STL 格式。
    • 示例代码:在 Blender 中使用 Python 脚本创建 3D 文本作为乐高 logo 并导出 STL 文件,具体操作包括打开 Blender,切换到脚本编辑器,输入并运行脚本,然后在指定路径检查生成的 STL 文件,可根据需要调整脚本参数。
  2. 使用 Polycam 工具:
    • Polycam 是一个免费的 3D 建模工具,只需上传至少 20 张图片或至少 20 秒的视频,它会自动处理并构建 3D 模型。生成后可编辑模型,并支持 12 种以上格式导出到流行的 3D 软件(如 Blender、SketchUp、Unreal、Unity 等)。100 张图像的云处理建模时间约 1 - 2 分钟。还能将无人机拍摄的图像转换为 3D 模型,兼容多种流行无人机。
    • 官方网站:https://poly.cam/tools/photogrammetry…
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

生成3D模型的测试

创建一个乐高logo的STL文件4o:制作一个乐高logo的STL文件涉及以下几个步骤:1.设计乐高logo:使用矢量图形编辑软件(如Adobe Illustrator或Inkscape)来创建或获取一个矢量格式的乐高logo。确保设计是准确的,并符合乐高logo的标准。2.导入3D建模软件:将矢量logo导入到3D建模软件中,例如Blender、Fusion 360或Tinkercad。这些软件可以将矢量图形转换为3D模型。3.创建3D模型:在3D建模软件中,根据矢量图形创建3D模型。调整模型的尺寸和厚度,确保它可以实际打印。4.导出STL文件:将完成的3D模型导出为STL文件格式。这是3D打印常用的文件格式。以下是一个简单的示例代码,展示如何在Blender中使用Python脚本创建一个简单的3D文本作为乐高logo,并导出为STL文件:请按照以下步骤操作:1.打开Blender:确保你安装了Blender,并打开它。2.打开脚本编辑器:在Blender中,切换到“脚本编辑器”(Scripting)界面。3.输入脚本:将上述Python脚本复制并粘贴到脚本编辑器中。4.运行脚本:点击“运行脚本”(Run Script)按钮,Blender将创建一个3D文本对象,并将其导出为STL文件。5.检查STL文件:脚本完成后,你可以在脚本中指定的路径(例如lego_logo.stl)找到生成的STL文件。你可以根据需要调整脚本中的参数(如字体、位置、挤压深度等),以获得满意的乐高logo 3D模型。所以,他给了我一个字的模型......

【SD】SD梦幻联动PS插件Photopea

大模型选择“revAnimated”,添加一段关于小猫的描述——“(1cat:1.1),,chibi,full body,(small:1.1),((3D model,Zbrush,complex 3D rendering super detailed)),oversaturated,ultra realistic,digital art,art station,(colour contrast:1.1),finest masterpiece,8K,HDR,((best quality)),((masterpiece)),(detailed),<lora:blindbox_v1_mix:1>”(这段提示词其实只是说明了这是一只小猫,其他的都是可以套用的标准提示词)点击生成,给手稿注入灵魂!生成的小猫可以再次一键导入到PS中,有没有体会到一丝这个流程中的顺滑程度?点击选择菜单中的“去除背景”,一键就可以将主体勾出来,PS的强大可不是开玩笑的。而且如果你想要更精确的蒙版,还可以使用钢笔工具精细抠图。接下来,我们玩个大的。选择小猫以外的选区,然后找到这个工具“magic replace”。这个功能就是“创成式填充”,没错,就是那个大名鼎鼎的“创成式填充”,我们在SD里面也能用啦。输入一个文本关键词“Warm balcony”,让AI给我们绘制一个阳台背景。点击生成,就可以得到一幅和小猫相融合的阳台背景。使用裁切工具将画板放大一些。建立选区,再次使用“创成式填充”,就得到了完整的背景图像。可以看到,因为是自动抠图,小猫的边缘是有白边的,暂时还不完美,但是没关系,我们有神器帮忙。将做好的图发送到“图生图”和“controlnet”当中。使用Tile模型对图片重绘细化,然后使用脚本SD放大扩展图像尺寸。一张高清小猫的图片就画好了,

Han:基于现有能力项目应用的思考

|技术名称|应用场景|技术类型|简介|主要特点|工作原理|其他|官方网站|项目及演示|论文|Github|在线体验|附件|最后更新时间|<br>|-|-|-|-|-|-|-|-|-|-|-|-|-|-|<br>|Polycam发布了一个免费的3D建模工具|元宇宙数字空间的物体孪生采集生成又多了一种可能。|3D场景|你只需上传至少20张图片或至少20秒的视频,Polycam自动处理并构建一个3D模型。<br>生成后你还可以编辑模型,支持12种以上的格式导出到流行的3D软件中,如Blender、SketchUp、Unreal、Unity等。<br><100张图像的云处理建模时间只需要大约1-2分钟。<br>可以在<br>网站以及iOS和Android应用中来创建、编辑和存储3D模型,完全免费<br>Polycam还可以轻松将无人机拍摄的图像转换为广阔的3D模型。只需上传关键帧无人机图像,就可以快速得到3D模型。Polycam与所有流行的无人机兼容,包括DJI Mavic 3、DJI Mini 4 Pro和DJI Phantom 4 Pro。|||知识扩展:<br>摄影测量是什么?<br>摄影测量是一种技术,通过使用照片捕捉物体、地形或结构的精确三维测量和视觉表示。它依赖于先进的软件从不同角度分析多张图片,实现对主题的准确重建和测量。摄影测量在建筑、考古、地理空间制图和3D建模等多个行业中有应用,为各种项目提供宝贵的洞察和数据。|[https://poly.cam/tools/photogrammetry…](https://t.co/Yg4JPGNP7u)||||||2023/12/26|

其他人在问
文心一言、通义千问、Kimi、腾讯混元、讯飞星火、抖音豆包、智普清言这些AI工具之间有什么不同,各自擅长哪些领域
以下是文心一言、通义千问、Kimi、腾讯混元、讯飞星火、抖音豆包、智普清言这些 AI 工具的不同之处及各自擅长的领域: Kimi 智能助手:由 Moonshot AI 出品,有着超大“内存”,可以一口气读完二十万字的小说,还会上网冲浪。 文心一言:百度出品的 AI 对话产品,定位为智能伙伴,能写文案、想点子,陪聊天、答疑解惑,与搜索有较好的结合。 通义千问:由阿里云开发的聊天机器人,能够与人交互、回答问题及协作创作,与钉钉有结合应用。 腾讯混元:相对较为低调,公司文化特点及目前尚未有明确亮点可能是其受到关注较少的原因。 讯飞星火:暂未提及具体特点和擅长领域。 抖音豆包:字节旗下产品,字节在 AI 领域有较大投入和决心,如推出多种相关产品和应用。 智普清言:暂未提及具体特点和擅长领域。 需要注意的是,这些 AI 工具的性能和擅长领域可能会随着不断的更新和优化而发生变化。
2024-08-18
腾讯混元支持哪些数据库
腾讯的混元大模型(Hunyuan Foundation Model)作为一个强大的人工智能平台,提供了广泛的数据库支持,以便在各类应用场景中高效地管理和利用数据。虽然详细的官方数据库支持列表可能随时更新,但通常来说,腾讯云(Tencent Cloud)和其相关的AI平台会支持以下几类主要数据库: 支持的数据库类型 1. 关系型数据库(RDBMS): MySQL:广泛应用的开源关系型数据库。 PostgreSQL:功能强大的开源关系型数据库,支持复杂查询和高级功能。 SQL Server:微软的商业数据库,适用于企业级应用。 MariaDB:MySQL的分支,兼容性高,性能优化。 Oracle:广泛应用于企业级应用的商业关系型数据库。 2. NoSQL数据库: MongoDB:文档型NoSQL数据库,适用于大数据和实时数据处理。 Redis:内存数据库,支持高性能的缓存和实时数据处理。 Cassandra:高可用性和扩展性强的NoSQL数据库,适合分布式数据存储。 HBase:基于Hadoop的分布式NoSQL数据库,适用于大规模数据存储。 3. 时序数据库: TimescaleDB:基于PostgreSQL的时序数据库,适合处理时间序列数据。 InfluxDB:专为高性能查询和数据存储设计的时序数据库。 4. 图数据库: Neo4j:广泛应用的图数据库,支持复杂的图查询和数据关系。 JanusGraph:分布式图数据库,适合大规模图数据处理。 5. 云原生数据库: 腾讯云数据库服务(CDB):包括上述数据库在腾讯云环境中的托管服务。 TDSQL:腾讯云的分布式数据库解决方案,支持多种关系型和NoSQL数据库。 6. 数据仓库: Amazon Redshift:基于云的数据仓库,支持大规模数据分析。 Google BigQuery:完全托管的数据仓库,支持实时数据分析和查询。 Snowflake:云原生数据仓库,支持多云环境和复杂查询。 数据库支持的具体示例 为了更好地理解混元大模型可能支持的数据库,我们可以参考腾讯云上的数据库服务,这些服务通常与混元大模型集成良好。 腾讯云数据库 MySQL:高性能的关系型数据库服务,支持自动备份和数据恢复。 腾讯云数据库 PostgreSQL:功能强大的企业级数据库服务,支持复杂查询和数据分析。 腾讯云数据库 MongoDB:适用于大数据和实时数据处理的文档数据库服务。 腾讯云数据库 Redis:支持高性能缓存和实时数据处理的内存数据库服务。 腾讯云数据库 TDSQLC:腾讯自研的企业级分布式数据库,支持强一致性和高可用性。 使用场景 在实际应用中,混元大模型与上述数据库的集成可以覆盖以下场景: 数据分析和挖掘:利用关系型数据库和数据仓库进行大规模数据分析和挖掘,提供数据驱动的决策支持。 实时数据处理:通过NoSQL数据库(如Redis、MongoDB)处理实时数据,支持高并发的应用场景。 复杂查询和关系分析:使用图数据库进行复杂的关系分析和图数据处理,适用于社交网络分析等场景。 大规模分布式存储:通过分布式数据库(如Cassandra、HBase)实现大规模数据的存储和访问。 总结 腾讯混元大模型支持多种类型的数据库,包括关系型数据库、NoSQL数据库、时序数据库、图数据库、云原生数据库和数据仓库。通过这些数据库的集成,混元大模型能够在各种数据管理和分析场景中提供强大的支持,帮助用户高效地处理和利用数据。为了确保最新的支持信息和技术细节,建议参考腾讯云官方文档和技术支持资源。
2024-05-30
你知道腾讯混元么
腾讯混元是一款人工智能绘画工具,它可以根据用户输入的提示词,生成各种风格的绘画作品。以下是关于腾讯混元的一些介绍: 1. 功能:腾讯混元可以实现文生图、文生文等功能,同时还具有一些实用小工具,如翻译、知识问答等。 2. 优势:腾讯混元是一款双语言大模型,可以实现中英文切换,方便不同语言的用户使用。同时,腾讯混元的内容中立客观,内容健康,适合儿童、子女、父母、家长们使用。 3. 应用场景:腾讯混元可以帮助用户快速生成各种类型的绘画作品,如插图、漫画、海报等。同时,腾讯混元还可以帮助用户学习 AI 时代的人工智能交互,掌握提示词使用,发挥想象力和创造力。 4. 使用方法:用户可以在聊天框中询问混元关于绘画方面的知识储备,然后描述自己的需求,就可以创作出相关的 AI 生成绘画。同时,用户还可以通过专业词汇描述沟通,指导混元和自己进行人 AI 沟通。 总的来说,腾讯混元是一款非常实用的人工智能绘画工具,它可以帮助用户快速生成各种类型的绘画作品,同时还可以帮助用户学习 AI 时代的人工智能交互。
2024-05-30
搭建个人知识库,请推荐的免费人工智能软件
以下为您推荐一些可用于搭建个人知识库的免费人工智能软件: 1. AnythingLLM:包含所有 Open WebUI 的能力,额外支持选择文本嵌入模型和向量数据库。安装地址:https://useanything.com/download 。安装完成后需进行配置,主要分为三步:选择大模型、选择文本嵌入模型、选择向量数据库。在 AnythingLLM 中可创建独有的 Workspace 与其他项目数据隔离,包括创建工作空间、上传文档并进行文本嵌入、选择对话模式(Chat 模式会综合给出答案,Query 模式仅依靠文档数据给出答案),配置完成后可进行测试对话。 2. Coze 或 FastGPT 等工具可搭建知识库,但当下其 RAG 能力仅对问答场景友好,复杂企业级知识库场景可能需要专业团队,收费几万到几十万不等。若想使用专门搭建个人知识库的软件,可参考文章 ,忽略本地部署大模型环节,直接看其中推荐的软件。 此外,还有一些相关工具和方法: 用通义听悟整理录音笔记:https://tingwu.aliyun.com 用 React 实现选中即解释 定义提示语提取有用信息:https://memo.ac/zh/ 开源免费屏幕录制工具 OBS,下载地址:https://obsproject.com/ Mac 用 Downie,Windows 推荐 IDM 淘宝数码荔枝店购买 用 losslessCut 快速切块:https://github.com/mifi/losslesscut 希望这些信息对您有所帮助。
2024-11-11
飞书和notion,在搭建个人知识库方面,各自的优点和缺点是什么
飞书在搭建个人知识库方面的优点: 可以方便地分类和整理知识,例如个人搭建某一领域知识库或企业搭建产品资料知识库。 有相关的分享和直播,能帮助用户轻松打造知识管理体系。 缺点: 随着知识库中信息增多,如果分类不合理,很难找到所需文章。 问题答案可能在文章某一段落,每次都需重新阅读文章才能找到答案。 Notion 在搭建个人知识库方面的优点: 是功能强大的知识管理和项目管理工具,可将各种信息 all in one place。 数据库可定制性高,接近关系型数据库,适合有相关需求的用户。 数据库的每一条记录都是一个页面,页面包含可自定义的属性和丰富内容。 支持的块类型非常丰富。 缺点:暂未提及。 此外,Notion 在创建知识库并上传文本内容方面,有特定的操作步骤,如在文本格式页签下选择 Notion 并进行授权,还可选择自动分段与清洗或自定义分段等方式。
2024-11-11
合适搭建个人知识库的人工智能软件有哪一些
以下是一些适合搭建个人知识库的人工智能软件: 1. AnythingLLM:包含所有 Open WebUI 的能力,额外支持选择文本嵌入模型和向量数据库。安装地址为 https://useanything.com/download 。安装完成后需进行配置,主要分为三步:选择大模型、选择文本嵌入模型、选择向量数据库。在使用时,可创建独有的 Workspace 与其他项目数据隔离,包括创建工作空间、上传文档并进行文本嵌入、选择对话模式(Chat 模式会综合训练数据和上传文档给出答案,Query 模式仅依靠文档数据给出答案),配置完成后可进行测试对话。 2. Coze:如果您想使用专门搭建个人知识库的软件,可参考文章 ,忽略本地部署大模型环节,直接看其中推荐的软件。但使用该软件可能需要对接一些额外的 API 。
2024-11-11
你是基于哪个大模型搭建的
我是基于谷歌开源可商用的大语言模型 Gemma 搭建的。 Gemma 是一系列轻量级的最先进开源模型,由 Google DeepMind 和 Google 的其他团队开发,其灵感来自于 Gemini,名称反映了拉丁语中“宝石”的意思。此次开源的 Gemma 重点包括共两个尺寸的模型权重:Gemma 2B 和 Gemma 7B,每种尺寸都提供了预训练和指令调优的版本。模型地址为: 。 在基于大模型构建模型应用方面,需要注意以下要点: 1. 不做工程化终究会让模型应用变得无法维护。 2. 根据项目需求选择一个合适的开发框架是非常关键的。 3. 了解业务背后的深层次需求,确保模型能够解决实际问题。根据了解到的业务需求设定流程环节。 4. 在每个环节中,精心设计提示词以引导模型提供准确和有用的回复。 5. 确保应用在提供服务的同时,遵守安全和伦理标准。 6. 通过不断的测试和迭代,优化模型性能和用户体验。 7. 成功部署应用后,还需要持续的维护和更新以适应不断变化的需求。 此外,Embedding(嵌入)是一个浮点数的向量(列表),两个向量之间的距离度量它们的相关性,小的距离表示高相关性,大的距离表示低相关性。Embedding 共有词、句子、文档、图像等分类。在大模型中具有重要价值,实战中可从数据集中获取 Embedding 结果,并保存为 csv 文件。进阶到企业级应用开发的大模型技术还会涉及到利用开源的 Embedding 模型、向量数据库去做检索增强生成(RAG),以及购买 GPU 服务器去基于开源大模型搭建企业级大模型项目。OpenAI 官网文档链接:https://platform.openai.com/docs/introduction
2024-11-09
用现有的搭建一个ai网站 实现绘画 聊天 会员 积分 等功能
以下是搭建一个具备绘画、聊天、会员、积分等功能的 AI 网站的步骤: 1. 搭建 OneAPI(https://github.com/songquanpeng/oneapi),用于汇聚整合多种大模型接口,方便后续更换使用各种大模型,同时会告知如何白嫖大模型接口。 2. 搭建 FastGpt(https://fastgpt.in/),这是一个知识库问答系统,将知识文件放入,并接入上面的大模型作为分析知识库的大脑,最后回答问题。若不想接入微信,搭建到此即可,其有问答界面。 3. 搭建 chatgptonwechat(https://github.com/zhayujie/chatgptonwechat)接入微信,并配置 FastGpt 将知识库问答系统接入微信。建议先用小号以防封禁风险。若想拓展功能,可参考 Yaki.eth 同学的教程(https://waytoagi.feishu.cn/wiki/UADkwZ9B0iAWdTkFJIjcN7EgnAh),其中的 cow 插件能实现文件总结、MJ 绘画等能力。 在积分和会员方面,以下是一些相关的活动形式和积分设置示例: 吵爷帮助技能持有者在社区实现虚拟 IPO 审核服务。 Larkspur:扣子 bot 文案生图体验| 10 积分,扣子虚拟女友体验| 10 积分,帮你把 Siri 接入 Llama 3 70B |10 积分。 勿忘心安 Dify 本地部署不成功不要积分 10 积分一次。 Penny 给你解梦,并还原场景 10 积分。 Rachel 倩敏 宠物照片变毛毡头像 5 积分一个,before after 合并呈现 10 积分一个。 梦飞 给全国所有的项目做聚合平台,用户体验一次抽成 3 5 积分。 David 为社区用户做积分银行,可超前消费,存 10 个积分,利息 1 个积分,贷 10 个积分,利息 2 个积分,并为项目 IPO 提供融资服务。 波大波吗 5 分钟,让你的微信变成 chatgpt + MJ + SD +....+ 新闻专家 20 积分一次。 琥珀川 教你用 ai 技能接单、创业 10 积分。 大满满 简约的 mj 转模型|随喜积分。 Matteo 工作日晚 8 11 点,提供微信 1 对 1 视频聊天 30min,互通获取 AI 信息的渠道 + 漫聊 AI 相关使用体验思考 1 积分。 桂大阳 风景壁纸一张 10 积分、手机壳图案 + 手机壳效果图 10 积分。 镜 教你画小鹿动画表情包一个 10 积分,5 个 60 积分,8 个 100 积分。教你如何手绘蒙娜丽莎 10 积分一次,一次 10 分钟。教你做小鹿角色 2 维转 3D 一个 20 积分。 易求无方 与你的虚拟人进行一次心灵交流 20 积分,与你进行一次心灵交流 10 积分。 游小言 虚拟 IP 打造,给视频换脸,一次 10 积分,支持以技能易技能。
2024-11-04
搭建一个数据解读的ai工具,文字描述要有逻辑性,符合金字塔原则
很抱歉,目前知识库中没有关于搭建一个数据解读的 AI 工具且文字描述要符合金字塔原则的相关内容。但一般来说,搭建这样一个工具需要以下几个关键步骤: 1. 明确数据来源和类型:确定您要处理的数据是来自数据库、文件、网络等,以及数据的格式和特点,例如结构化数据、非结构化数据等。 2. 选择合适的技术框架:根据需求和技术能力,选择适合的 AI 框架和工具,如 TensorFlow、PyTorch 等。 3. 数据预处理:对原始数据进行清洗、转换、归一化等操作,以提高数据质量和模型的训练效果。 4. 特征工程:提取有意义的特征,以便模型能够更好地理解和处理数据。 5. 选择模型:根据数据特点和任务需求,选择合适的 AI 模型,如决策树、神经网络等。 6. 训练模型:使用预处理后的数据对模型进行训练,并不断调整参数以优化性能。 7. 评估模型:使用合适的指标对训练好的模型进行评估,如准确率、召回率等。 8. 优化和改进:根据评估结果对模型进行优化和改进。 9. 设计文字描述逻辑:按照金字塔原则,先给出结论或主要观点,然后逐步展开支持性的细节和论据。 需要注意的是,这只是一个大致的框架,实际搭建过程中可能会遇到各种技术和业务上的挑战,需要不断探索和优化。
2024-11-03
大模型排名以及排名的评测标准维度是什么
以下是一些常见的大模型排名及评测标准维度: FlagEval(天秤)大模型评测体系及开放平台: 地址: 简介:旨在建立科学、公正、开放的评测基准、方法、工具集,协助研究人员全方位评估基础模型及训练算法的性能,同时探索利用 AI 方法实现对主观评测的辅助,大幅提升评测的效率和客观性。创新构建了“能力任务指标”三维评测框架,细粒度刻画基础模型的认知能力边界,可视化呈现评测结果。 CEval: 地址: 简介:构造了一个覆盖人文,社科,理工,其他专业四个大方向,52 个学科(微积分,线代…),从中学到大学研究生以及职业考试,一共 13948 道题目的中文知识和推理型测试集。此外还给出了当前主流中文 LLM 的评测结果。 SuperCLUElyb: 地址: 简介:中文通用大模型匿名对战评价基准,这是一个中文通用大模型对战评价基准,它以众包的方式提供匿名、随机的对战。他们发布了初步的结果和基于 Elo 评级系统的排行榜。 斯坦福发布的大模型排行榜 AlpacaEval: 项目链接:https://github.com/tatsulab/alpaca_eval 排行榜链接:https://tatsulab.github.io/alpaca_eval/ 该研究团队选择了目前在开源社区很火的开源模型,还有 GPT4、PaLM 2 等众多「闭源」模型,甚至还开设了一个「准中文」排行榜。 AlpacaEval 分为以 GPT4 和 Claude 为元标注器的两个子榜单。 在斯坦福的这个 GPT4 评估榜单中: GPT4 稳居第一,胜率超过了 95%;胜率都在 80%以上的 Claude 和 ChatGPT 分别排名第二和第三,其中 Claude 以不到 3%的优势超越 ChatGPT。 值得关注的是,获得第四名的是一位排位赛新人——微软华人团队发布的 WizardLM。在所有开源模型中,WizardLM 以仅 130 亿的参数版本排名第一,击败了 650 亿参数量的 Guanaco。 而在开源模型中的佼佼者 Vicuna 发挥依然稳定,凭借着超过 70%的胜率排在第六,胜率紧追 Guanaco 65B。 最近大火的 Falcon Instruct 40B 表现不佳,仅位居 12 名,略高于 Alpaca Farm 7B。 AlpacaEval 的技术细节: 人类一致性:标注者与交叉标注集中人类多数票之间的一致性。 价格:每 1000 个标注的平均价格。 时间:计算 1000 个标注所需的平均时间。相对于人工标注,全自动化的 AlpacaEval 仅需花费约 1/22 的经济成本和 1/25 的时间成本。 AlpacaEval 评估模型的方式: alpaca_eval:直接根据目标模型输出的响应来评估模型。 alpaca_eval evaluate_from_model:根据 HuggingFace 已注册模型或这 API 提供商来端到端评测模型。 评测过程分为以下 3 步: 1. 选择一个评估集,并计算指定为 model_outputs 的输出。默认情况下,使用来自 AlpacaEval 的 805 个示例。 2. 计算 golden 输出 reference_outputs。默认情况下,在 AlpacaEval 上使用 textdavinci003 的输出。 3. 通过 annotators_config 选择指定的自动标注器,它将根据 model_outputs 和 reference_outputs 计算胜率。这里建议使用 alpaca_eval_gpt4 或 claude。根据不同的标注器,使用者还需要在环境配置中设定 API_KEY。
2024-11-12
从0到1学习大模型知识
以下是从 0 到 1 学习大模型知识的相关内容: 什么是大模型: 通俗来讲,大模型是输入大量语料,让计算机获得类似人类的“思考”能力,能进行文本生成、推理问答、对话、文档摘要等工作。可以用“上学参加工作”来类比大模型的训练和使用过程: 1. 找学校:训练大模型需要大量计算,GPU 更合适,只有购买得起大量 GPU 的才有资本训练自己的大模型。 2. 确定教材:大模型需要大量数据,几千亿序列(Token)的输入基本是标配。 3. 找老师:用合适算法让大模型更好理解 Token 之间的关系。 4. 就业指导:为让大模型更好胜任某一行业,需要进行微调(fine tuning)指导。 5. 搬砖:就业指导完成后,正式干活,比如进行翻译、问答等,在大模型里称之为推导(infer)。在 LLM 中,Token 被视为模型处理和生成的文本单位,会对输入进行数字化形成词汇表。 大模型如何运作: 打个比方,“我今天吃了狮子头和蔬菜”这句话,在 transformer 中,会由 attention 层对其加入更多信息补充,如“狮子头是一道菜”“今天是星期六”等,这些补充信息会作为输入给到下一个 attention 层,最终哪些信息补充、保留、传递由模型自主学习。层与层之间就像人阅读文章时的连贯性注意力过程,大模型以词向量和 transformer 模型学习海量知识,把知识作为向量空间中的关系网存储,接受输入时通过向量空间中的匹配进行输出。这个过程像人脑阅读学习,记忆的不是逐字逐句,而是按相关性、重要程度结合历史经验,比如看到红色会觉得代表温暖、强烈。 大模型的整体架构: 从整体分层角度,大模型架构可分为以下几层: 1. 基础层:为大模型提供硬件支撑、数据支持,如 A100、数据服务器等。 2. 数据层:分为静态的知识库和动态的三方数据集,不是用于基层模型训练的数据基集,而是企业根据自身特性维护的垂域数据。 3. 模型层:包括 LLm(largelanguagemodel,如 GPT,一般使用 transformer 算法实现)或多模态模型(如文生图、图生图等,训练数据与 llm 不同,用图文或声音等多模态数据集)。 4. 平台层:如大模型的评测体系或 langchain 平台等,提供模型与应用间的组成部分。 5. 表现层:即应用层,是用户实际看到的地方。
2024-11-12
在comyui中,使用flux1-dev模型24g显存够吗
在 ComfyUI 中使用 Flux1dev 模型,24G 显存是可以的,但建议内存尽量高于 32G 以避免意外情况的发生。如果您的显卡是 24G 或更高,右键 24G 那个 train_flux_24GLora 的文件。修改脚本路径和参数时,要注意底模路径、VAE 路径、数据集路径,还有下面的 clip 路径和 T5xxl 路径的正确填写。ae.safetensors 和 flux1dev.safetensors 的下载地址为:https://huggingface.co/blackforestlabs/FLUX.1dev/tree/main 。flux 相关模型(体积较大)的夸克网盘链接:https://pan.quark.cn/s/b5e01255608b ,百度网盘链接:https://pan.baidu.com/s/1mCucHrsfRo5SttW03ei0g?pwd=ub9h 提取码:ub9h 。如果 GPU 性能不足、显存不够,底模可以使用 fp8 的量化版模型,下载地址:https://huggingface.co/Kijai/fluxfp8/tree/main 。最后下载 dev 的工作流: ,或者使用官方原版的图片链接 https://comfyanonymous.github.io/ComfyUI_examples/flux/flux_dev_example.png ,打开 ComfyUI 把工作流或图片拖拽到其中即可。
2024-11-12
在comyui中,使用flux1-dev模型需要多少显存
在 ComfyUI 中使用 flux1dev 模型所需的显存情况如下: 相关模型的下载地址:https://huggingface.co/blackforestlabs/FLUX.1dev/tree/main 。 对于 GPU 性能不足、显存不够的情况,底模可以使用 fp8 的量化版模型,下载地址为:https://huggingface.co/Kijai/fluxfp8/tree/main 。 低显存方案(8G 以下):flux1devbnbnf4.safetensors ,放入 ComfyUI\\models\\checkpoints 文件夹内,下载链接为 https://huggingface.co/lllyasviel/flux1devbnbnf4/blob/main/flux1devbnbnf4.safetensors 。 此外,还提供了以下相关资源链接: BitsandBytes Guidelines and Flux :https://github.com/lllyasviel/stablediffusionwebuiforge/discussions/981 ComfyUI_bitsandbytes_NF4 节点:https://github.com/comfyanonymous/ComfyUI_bitsandbytes_NF4
2024-11-12
怎么训练自己的小说大纲模型
训练自己的小说大纲模型可以参考以下步骤: 步骤一:创建数据集 1. 进入厚德云模型训练数据集,网址为:https://portal.houdeyun.cn/sd/dataset 。 2. 在数据集一栏中,点击右上角创建数据集。 3. 输入数据集名称。 4. 可以上传包含图片+标签的 zip 文件,也可以只有图片没有打标文件(之后可在 c 站使用自动打标功能)。 5. 也可以一张一张单独上传照片,但建议提前把图片和标签打包成 zip 上传。 6. Zip 文件里图片名称与标签文件应当匹配,例如:图片名“1.png”,对应的达标文件就叫“1.txt”。 7. 上传 zip 以后等待一段时间。 8. 确认创建数据集,返回到上一个页面,等待一段时间后上传成功,可以点击详情检查,可预览到数据集的图片以及对应的标签。 步骤二:Lora 训练 1. 点击 Flux,基础模型会默认是 FLUX 1.0D 版本。 2. 选择数据集,点击右侧箭头,会跳出所有上传过的数据集。 3. 触发词可有可无,取决于数据集是否有触发词。 4. 模型效果预览提示词则随机抽取一个数据集中的标签填入即可。 5. 训练参数这里可以调节重复次数与训练轮数,厚德云会自动计算训练步数。如果不知道如何设置,可以默认 20 重复次数和 10 轮训练轮数。 6. 可以按需求选择是否加速,点击开始训练,会显示所需要消耗的算力。 7. 然后等待训练,会显示预览时间和进度条。训练完成的会显示出每一轮的预览图。 8. 鼠标悬浮到想要的轮次模型,中间会有个生图,点击会自动跳转到使用此 lora 生图的界面。点击下方的下载按钮则会自动下载到本地。 步骤三:Lora 生图 1. 点击预览模型中间的生图会自动跳转到这个页面。 2. 模型上的数字代表模型强度,可以调节大小,正常默认为 0.8,建议在 0.6 1.0 之间调节。 3. 也可以自己添加 lora 文件,点击后会显示训练过的所有 lora 的所有轮次。 4. VAE 不需要替换。 5. 正向提示词输入写的提示词,可以选择基于这个提示词一次性生成几张图。 6. 选择生成图片的尺寸,横板、竖版、正方形。 7. 采样器和调度器新手小白可以默认不换。 8. 迭代步数可以按照需求在 20 30 之间调整。 9. CFG 可以按照需求在 3.5 7.5 之间调整。 10. 随机种子 1 代表随机生成图。 11. 所有设置都好了以后,点击开始生态,生成的图会显示在右侧。 12. 如果有哪次生成结果觉得很不错,想要微调或者高分辨率修复,可以点开那张图,往下滑,划到随机种子,复制下来,粘贴到随机种子这里,这样下次生成的图就会和这次的结果近似。 13. 如果确认了一张很合适的种子和参数,想要高清放大,则点开高清修复,可以选择想放大的倍数。新手小白可以就默认这个算法,迭代步数也是建议在 20 30 之间,重回幅度根据需求调整,正常来说在 0.3 0.7 之间调整。 今日作业 按照比赛要求,收集六个主题中一个主题的素材并且训练出 lora 模型后提交 lora 模型与案例图像。提交链接:https://waytoagi.feishu.cn/share/base/form/shrcnpJAtTjID7cIcNsWB79XMEd 。 另外,直接在 Comfy UI 中训练 LoRA 模型的步骤如下: 1. 确保后面有一个空格。然后将 requirements_win.txt 文件拖到命令提示符中(如果在 Windows 上;否则,选择另一个文件 requirements.txt)。拖动文件将在命令提示符中复制其路径。 2. 按 Enter 键,这将安装所有所需的依赖项,使其与 ComfyUI 兼容。请注意,如果为 Comfy 使用了虚拟环境,必须首先激活它。 3. 教程: 图像必须放在一个以命名的文件夹中。那个数字很重要:LoRA 脚本使用它来创建一些步骤(称为优化步骤…但别问我是什么^^’)。它应该很小,比如 5。然后,下划线是必须的。 对于 data_path,必须写入包含数据库文件夹的文件夹路径。例如:C:\\database\\5_myimages ,必须写 C:\\database 。 对于参数,在第一行,可以从 checkpoint 文件夹中选择任何模型。据说必须选择一个基本模型进行 LoRA 训练。但也可以尝试使用微调。
2024-11-12
怎么训练自己的模型
训练自己的模型可以参考以下内容: 基于百川大模型: 选择 Baichuan27BChat 模型作为底模,配置模型本地路径和提示模板。 在 Train 页面里,选择 sft 训练方式,加载定义好的数据集(如 wechat 和 self_cognition)。 注意学习率和训练轮次的设置,要根据数据集大小和收敛情况来调整。 使用 FlashAttention2 可减少显存需求,加速训练速度。 显存小的情况下,可以减少 batch size 并开启量化训练,内置的 QLora 训练方式好用。 需要用到 xformers 的依赖。 显存占用约 20G 左右,训练时间根据聊天记录规模大小而定,少则几小时,多则几天。 训练自己的 AI 绘画模型(Stable Diffusion): 样本采样器(sample_sampler):可选择,默认是“ddim”。 保存模型格式(save_model_as):可选择,SD WebUI 兼容"ckpt"和"safetensors"格式模型。 训练流程主要包括: 训练集制作:数据质量评估、标签梳理、数据清洗、标注、标签清洗、增强等。 训练文件配置:预训练模型选择、训练环境配置、训练步数及其他超参数设置等。 模型训练:运行训练脚本,使用 TensorBoard 监控。 模型测试:用于效果评估与消融实验。 训练资源: Rocky 整理优化过的 SD 完整训练资源 SDTrain 项目,可通过关注公众号 WeThinkIn,后台回复“SDTrain”获取。
2024-11-12
如何使用ai帮助我写作
利用 AI 帮助写作可以参考以下步骤和方法: 1. 确定写作主题:明确您的研究兴趣和目标,选择一个具有研究价值和创新性的主题。 2. 收集背景资料:使用 AI 工具如学术搜索引擎和文献管理软件来搜集相关的研究文献和资料。 3. 分析和总结信息:利用 AI 文本分析工具来分析收集到的资料,提取关键信息和主要观点。 4. 生成大纲:使用 AI 写作助手生成写作的大纲,包括引言、文献综述、方法论、结果和讨论等部分。 5. 撰写初稿:可以利用 AI 写作工具草拟任何东西的初稿,如博客文章、论文、宣传材料、演讲、讲座等。 6. 优化内容:将文本粘贴到 AI 中,要求它改进内容,或就如何为特定受众提供更好的建议。也可以要求它以不同风格创建多个草稿,使事物更生动,或者添加例子,以激发您做得更好。 7. 帮助完成任务:AI 可以做您没有时间做的事情,像实习生一样使用它写邮件,创建销售模板,提供商业计划的下一步等。 8. 数据分析(若涉及):如果写作内容涉及数据收集和分析,可以使用 AI 数据分析工具来处理和解释数据。 9. 生成参考文献:使用 AI 文献管理工具来生成正确的参考文献格式。 10. 审阅和修改:利用 AI 审阅工具来检查写作的逻辑性和一致性,并根据反馈进行修改。 11. 提交前的检查:最后,使用 AI 抄袭检测工具来确保写作的原创性,并进行最后的格式调整。 需要注意的是,AI 工具可以作为辅助,但不能完全替代您的专业判断和创造性思维。在使用 AI 进行写作时,应保持批判性思维,并确保写作的质量和学术诚信。 目前,一些较好的写作工具包括: 最佳免费选项: 付费选项:带有插件的4.0/ChatGPT 此外,GPT4 仍然是功能最强的人工智能写作工具,您可以在 Bing(选择“创新模式”)上免费访问,或者通过购买 ChatGPT 的$20/月订阅来访问。Claude 是紧随其后的第二名,也提供了有限的免费选项。这些工具也被直接集成到常见的办公应用程序中,如 Microsoft Office 将包括一个由 GPT 提供支持的副驾驶,Google Docs 将整合 Bard 的建议。
2024-11-12
我有一份PPT,我想对这个PPT进行图像设计等美观化处理,怎么来做?使用哪个工具好?
以下为您介绍一些可用于对 PPT 进行图像设计等美观化处理的工具及相关信息: 1. Gamma:这是一个在线 PPT 制作网站,允许用户通过输入文本和想法提示快速生成幻灯片。它支持嵌入多媒体格式,如 GIF 和视频,以增强演示文稿的吸引力。网址:https://gamma.app/ 2. 美图 AI PPT:由知名图像编辑软件“美图秀秀”的开发团队推出。用户通过输入简单的文本描述来生成专业的 PPT 设计,包含丰富的模板库和设计元素,可根据需求选择不同风格和主题的模板,适用于多种场合。网址:https://www.xdesign.com/ppt/ 3. Mindshow:一款 AI 驱动的 PPT 辅助工具,提供一系列智能设计功能,如自动布局、图像选择和文本优化等,还可能包括互动元素和动画效果。网址:https://www.mindshow.fun/ 4. 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用科大讯飞在语音识别和自然语言处理领域的技术优势,提供智能文本生成、语音输入、文档格式化等功能。网址:https://zhiwen.xfyun.cn/ 在对 PPT 进行排版时,工具的选择可根据个人顺手程度决定,对于打工人来说,PPT 是较为熟练的选择。关于尺寸问题,如果想要打印,4:3 的比例比较适合童书绘本的比例,出图时可按此比例,文字可直接排版到画面上;若出图为 16:9 横板,排版时 4:3 可把文字放在图片下面。若要发小红书或者小绿书,竖版更合适,比例选 3:4,出图也选竖版。制作 H5 时,出图选竖版,比例选 9:16。所有排版尺寸在 PPT 里都可以选。另外,PPT 里的删除背景功能对于基础抠图很有用。用 PPT 另存为图片时,直接选 jpg 或 png 格式会降低图片清晰度,可先另存为“增强型 Windows 源文件”格式,再用画图软件打开另存为 JPG 以得到高清图。
2024-11-12
如何使用ai分析股票
以下为一些利用 AI 进行股票分析的常见方式和相关案例: 1. 东方财富网投资分析工具:它是一个 AI 金融投资分析平台,运用数据分析和机器学习技术,能够分析金融市场数据,为投资者提供投资建议和决策支持。例如,它会根据股票的历史走势和市场趋势,预测股票的未来走势。 需要注意的是,AI 分析股票虽然具有一定的参考价值,但不能完全依赖,还需要结合自身的投资知识和市场判断。
2024-11-11
给我一个办公使用的AI工具列表
以下是一些适用于办公的 AI 工具: 1. 豆果美食 APP:是一个 AI 菜谱生成平台,运用自然语言处理和数据分析技术,能根据用户口味和现有食材生成个性化菜谱,市场规模达数亿美元。 2. 沪江开心词场:作为 AI 语言学习助手,采用自然语言处理和机器学习技术,辅助用户学习语言并提供个性化学习方案,市场规模达数十亿美元。 3. 爱奇艺智能推荐:这是一个 AI 电影推荐系统,通过数据分析和机器学习技术,根据用户喜好推荐电影,市场规模达数亿美元。 4. WPS Office:作为 AI 办公自动化工具,借助自然语言处理和机器学习技术,提高办公效率,实现自动化办公流程,市场规模达数十亿美元。 此外,在软件架构设计方面,以下工具可用于绘制逻辑视图、功能视图、部署视图: 1. Lucidchart:流行的在线绘图工具,支持多种视图创建,用户可通过拖放界面轻松操作。 2. Visual Paradigm:全面的 UML 工具,提供多种架构视图创建功能。 3. ArchiMate:开源建模语言,与 Archi 工具配合可创建逻辑视图。 4. Enterprise Architect:强大的建模、设计和生成代码工具,支持多种视图创建。 5. Microsoft Visio:广泛使用的图表和矢量图形应用程序,有丰富模板。 6. draw.io(diagrams.net):免费在线图表软件,支持多种类型图表创建。 7. PlantUML:文本到 UML 转换工具,可自动生成相关视图。 8. Gliffy:基于云的绘图工具,提供架构图创建功能。 9. Archi:免费开源工具,支持逻辑视图创建。 10. Rational Rose:IBM 的 UML 工具,支持多种视图创建。
2024-11-11