Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

怎么搭建混元3D模型到本地使用

Answer

要在本地搭建混元 3D 模型,以下是一些方法和步骤:

  1. 制作乐高 logo 的 STL 文件:
    • 设计乐高 logo:使用矢量图形编辑软件(如 Adobe Illustrator 或 Inkscape)创建或获取矢量格式的乐高 logo,确保符合标准。
    • 导入 3D 建模软件:将矢量 logo 导入到 3D 建模软件(如 Blender、Fusion 360 或 Tinkercad)中。
    • 创建 3D 模型:在软件中根据矢量图形创建 3D 模型,调整尺寸和厚度以适合打印。
    • 导出 STL 文件:将完成的 3D 模型导出为 STL 格式。
    • 示例代码:在 Blender 中使用 Python 脚本创建 3D 文本作为乐高 logo 并导出 STL 文件,具体操作包括打开 Blender,切换到脚本编辑器,输入并运行脚本,然后在指定路径检查生成的 STL 文件,可根据需要调整脚本参数。
  2. 使用 Polycam 工具:
    • Polycam 是一个免费的 3D 建模工具,只需上传至少 20 张图片或至少 20 秒的视频,它会自动处理并构建 3D 模型。生成后可编辑模型,并支持 12 种以上格式导出到流行的 3D 软件(如 Blender、SketchUp、Unreal、Unity 等)。100 张图像的云处理建模时间约 1 - 2 分钟。还能将无人机拍摄的图像转换为 3D 模型,兼容多种流行无人机。
    • 官方网站:https://poly.cam/tools/photogrammetry…
Content generated by AI large model, please carefully verify (powered by aily)

References

生成3D模型的测试

创建一个乐高logo的STL文件4o:制作一个乐高logo的STL文件涉及以下几个步骤:1.设计乐高logo:使用矢量图形编辑软件(如Adobe Illustrator或Inkscape)来创建或获取一个矢量格式的乐高logo。确保设计是准确的,并符合乐高logo的标准。2.导入3D建模软件:将矢量logo导入到3D建模软件中,例如Blender、Fusion 360或Tinkercad。这些软件可以将矢量图形转换为3D模型。3.创建3D模型:在3D建模软件中,根据矢量图形创建3D模型。调整模型的尺寸和厚度,确保它可以实际打印。4.导出STL文件:将完成的3D模型导出为STL文件格式。这是3D打印常用的文件格式。以下是一个简单的示例代码,展示如何在Blender中使用Python脚本创建一个简单的3D文本作为乐高logo,并导出为STL文件:请按照以下步骤操作:1.打开Blender:确保你安装了Blender,并打开它。2.打开脚本编辑器:在Blender中,切换到“脚本编辑器”(Scripting)界面。3.输入脚本:将上述Python脚本复制并粘贴到脚本编辑器中。4.运行脚本:点击“运行脚本”(Run Script)按钮,Blender将创建一个3D文本对象,并将其导出为STL文件。5.检查STL文件:脚本完成后,你可以在脚本中指定的路径(例如lego_logo.stl)找到生成的STL文件。你可以根据需要调整脚本中的参数(如字体、位置、挤压深度等),以获得满意的乐高logo 3D模型。所以,他给了我一个字的模型......

【SD】SD梦幻联动PS插件Photopea

大模型选择“revAnimated”,添加一段关于小猫的描述——“(1cat:1.1),,chibi,full body,(small:1.1),((3D model,Zbrush,complex 3D rendering super detailed)),oversaturated,ultra realistic,digital art,art station,(colour contrast:1.1),finest masterpiece,8K,HDR,((best quality)),((masterpiece)),(detailed),<lora:blindbox_v1_mix:1>”(这段提示词其实只是说明了这是一只小猫,其他的都是可以套用的标准提示词)点击生成,给手稿注入灵魂!生成的小猫可以再次一键导入到PS中,有没有体会到一丝这个流程中的顺滑程度?点击选择菜单中的“去除背景”,一键就可以将主体勾出来,PS的强大可不是开玩笑的。而且如果你想要更精确的蒙版,还可以使用钢笔工具精细抠图。接下来,我们玩个大的。选择小猫以外的选区,然后找到这个工具“magic replace”。这个功能就是“创成式填充”,没错,就是那个大名鼎鼎的“创成式填充”,我们在SD里面也能用啦。输入一个文本关键词“Warm balcony”,让AI给我们绘制一个阳台背景。点击生成,就可以得到一幅和小猫相融合的阳台背景。使用裁切工具将画板放大一些。建立选区,再次使用“创成式填充”,就得到了完整的背景图像。可以看到,因为是自动抠图,小猫的边缘是有白边的,暂时还不完美,但是没关系,我们有神器帮忙。将做好的图发送到“图生图”和“controlnet”当中。使用Tile模型对图片重绘细化,然后使用脚本SD放大扩展图像尺寸。一张高清小猫的图片就画好了,

Han:基于现有能力项目应用的思考

|技术名称|应用场景|技术类型|简介|主要特点|工作原理|其他|官方网站|项目及演示|论文|Github|在线体验|附件|最后更新时间|<br>|-|-|-|-|-|-|-|-|-|-|-|-|-|-|<br>|Polycam发布了一个免费的3D建模工具|元宇宙数字空间的物体孪生采集生成又多了一种可能。|3D场景|你只需上传至少20张图片或至少20秒的视频,Polycam自动处理并构建一个3D模型。<br>生成后你还可以编辑模型,支持12种以上的格式导出到流行的3D软件中,如Blender、SketchUp、Unreal、Unity等。<br><100张图像的云处理建模时间只需要大约1-2分钟。<br>可以在<br>网站以及iOS和Android应用中来创建、编辑和存储3D模型,完全免费<br>Polycam还可以轻松将无人机拍摄的图像转换为广阔的3D模型。只需上传关键帧无人机图像,就可以快速得到3D模型。Polycam与所有流行的无人机兼容,包括DJI Mavic 3、DJI Mini 4 Pro和DJI Phantom 4 Pro。|||知识扩展:<br>摄影测量是什么?<br>摄影测量是一种技术,通过使用照片捕捉物体、地形或结构的精确三维测量和视觉表示。它依赖于先进的软件从不同角度分析多张图片,实现对主题的准确重建和测量。摄影测量在建筑、考古、地理空间制图和3D建模等多个行业中有应用,为各种项目提供宝贵的洞察和数据。|[https://poly.cam/tools/photogrammetry…](https://t.co/Yg4JPGNP7u)||||||2023/12/26|

Others are asking
对DeepSeek-R1、GPT-4o、文心一言、通义千文、豆包、海信星海和混元模型的性能对比分析
以下是对 DeepSeekR1、GPT4o、文心一言、通义千文、豆包、海信星海和混元模型的性能对比分析: 通义千问: 通义团队将 Qwen2.5Max 与目前领先的开源 MoE 模型 DeepSeek V3、最大的开源稠密模型 Llama3.1405B 以及同样位列开源稠密模型前列的 Qwen2.572B 进行了对比。在所有 11 项基准测试中,Qwen2.5Max 全部超越了对比模型。 Qwen2.5Max 已在阿里云百炼平台上架,企业和开发者可通过阿里云百炼调用新模型 API,也可在全新的 Qwen Chat 平台上使用。 DeepSeekR1: 属于基于强化学习 RL 的推理模型,在回答用户问题前会先进行“自问自答”式的推理思考,以提升最终回答的质量。 其“聪明”源于独特的“教育方式”,在其他 AI 模型还在接受“填鸭式教育”时,DeepSeek R1 已率先进入“自学成才”新阶段。 其思考与表达碾压了包括 GPT4o、Claude Sonnet3.5、豆包等模型,思考过程细腻、自洽、深刻、全面,输出结果在语气、结构、逻辑上天衣无缝。 目前关于文心一言、海信星海和混元模型在上述内容中未提供具体的性能对比信息。
2025-02-12
腾讯混元大模型网址
腾讯混元大模型的开源地址为:https://github.com/Tencent/HunyuanVideo 。普通用户也可以去腾讯元宝 APP,进入 AI 应用查看该模型,可能需要申请资格,但腾讯处理速度较快。此外,模型下载地址为:https://huggingface.co/tencent/TencentHunyuanLarge ,详细介绍可参考:https://xiaohu.ai/p/15254 ,技术报告:https://arxiv.org/pdf/2411.02265 。
2024-12-09
混元大模型
腾讯混元大模型(HunyuanLarge)是全球最大的 MoE 开源模型,具有以下特点: 拥有 3890 亿参数,其中活跃参数为 520 亿。 具备强大的长文本处理和常识推理能力,支持 256K 上下文窗口。 通过数据增强,使用合成数据提升对未见内容的理解。 详细介绍: 模型下载: 技术报告:
2024-11-15
文心一言、通义千问、Kimi、腾讯混元、讯飞星火、抖音豆包、智普清言这些AI工具之间有什么不同,各自擅长哪些领域
以下是文心一言、通义千问、Kimi、腾讯混元、讯飞星火、抖音豆包、智普清言这些 AI 工具的不同之处及各自擅长的领域: Kimi 智能助手:由 Moonshot AI 出品,有着超大“内存”,可以一口气读完二十万字的小说,还会上网冲浪。 文心一言:百度出品的 AI 对话产品,定位为智能伙伴,能写文案、想点子,陪聊天、答疑解惑,与搜索有较好的结合。 通义千问:由阿里云开发的聊天机器人,能够与人交互、回答问题及协作创作,与钉钉有结合应用。 腾讯混元:相对较为低调,公司文化特点及目前尚未有明确亮点可能是其受到关注较少的原因。 讯飞星火:暂未提及具体特点和擅长领域。 抖音豆包:字节旗下产品,字节在 AI 领域有较大投入和决心,如推出多种相关产品和应用。 智普清言:暂未提及具体特点和擅长领域。 需要注意的是,这些 AI 工具的性能和擅长领域可能会随着不断的更新和优化而发生变化。
2024-08-18
腾讯混元支持哪些数据库
腾讯的混元大模型(Hunyuan Foundation Model)作为一个强大的人工智能平台,提供了广泛的数据库支持,以便在各类应用场景中高效地管理和利用数据。虽然详细的官方数据库支持列表可能随时更新,但通常来说,腾讯云(Tencent Cloud)和其相关的AI平台会支持以下几类主要数据库: 支持的数据库类型 1. 关系型数据库(RDBMS): MySQL:广泛应用的开源关系型数据库。 PostgreSQL:功能强大的开源关系型数据库,支持复杂查询和高级功能。 SQL Server:微软的商业数据库,适用于企业级应用。 MariaDB:MySQL的分支,兼容性高,性能优化。 Oracle:广泛应用于企业级应用的商业关系型数据库。 2. NoSQL数据库: MongoDB:文档型NoSQL数据库,适用于大数据和实时数据处理。 Redis:内存数据库,支持高性能的缓存和实时数据处理。 Cassandra:高可用性和扩展性强的NoSQL数据库,适合分布式数据存储。 HBase:基于Hadoop的分布式NoSQL数据库,适用于大规模数据存储。 3. 时序数据库: TimescaleDB:基于PostgreSQL的时序数据库,适合处理时间序列数据。 InfluxDB:专为高性能查询和数据存储设计的时序数据库。 4. 图数据库: Neo4j:广泛应用的图数据库,支持复杂的图查询和数据关系。 JanusGraph:分布式图数据库,适合大规模图数据处理。 5. 云原生数据库: 腾讯云数据库服务(CDB):包括上述数据库在腾讯云环境中的托管服务。 TDSQL:腾讯云的分布式数据库解决方案,支持多种关系型和NoSQL数据库。 6. 数据仓库: Amazon Redshift:基于云的数据仓库,支持大规模数据分析。 Google BigQuery:完全托管的数据仓库,支持实时数据分析和查询。 Snowflake:云原生数据仓库,支持多云环境和复杂查询。 数据库支持的具体示例 为了更好地理解混元大模型可能支持的数据库,我们可以参考腾讯云上的数据库服务,这些服务通常与混元大模型集成良好。 腾讯云数据库 MySQL:高性能的关系型数据库服务,支持自动备份和数据恢复。 腾讯云数据库 PostgreSQL:功能强大的企业级数据库服务,支持复杂查询和数据分析。 腾讯云数据库 MongoDB:适用于大数据和实时数据处理的文档数据库服务。 腾讯云数据库 Redis:支持高性能缓存和实时数据处理的内存数据库服务。 腾讯云数据库 TDSQLC:腾讯自研的企业级分布式数据库,支持强一致性和高可用性。 使用场景 在实际应用中,混元大模型与上述数据库的集成可以覆盖以下场景: 数据分析和挖掘:利用关系型数据库和数据仓库进行大规模数据分析和挖掘,提供数据驱动的决策支持。 实时数据处理:通过NoSQL数据库(如Redis、MongoDB)处理实时数据,支持高并发的应用场景。 复杂查询和关系分析:使用图数据库进行复杂的关系分析和图数据处理,适用于社交网络分析等场景。 大规模分布式存储:通过分布式数据库(如Cassandra、HBase)实现大规模数据的存储和访问。 总结 腾讯混元大模型支持多种类型的数据库,包括关系型数据库、NoSQL数据库、时序数据库、图数据库、云原生数据库和数据仓库。通过这些数据库的集成,混元大模型能够在各种数据管理和分析场景中提供强大的支持,帮助用户高效地处理和利用数据。为了确保最新的支持信息和技术细节,建议参考腾讯云官方文档和技术支持资源。
2024-05-30
你知道腾讯混元么
腾讯混元是一款人工智能绘画工具,它可以根据用户输入的提示词,生成各种风格的绘画作品。以下是关于腾讯混元的一些介绍: 1. 功能:腾讯混元可以实现文生图、文生文等功能,同时还具有一些实用小工具,如翻译、知识问答等。 2. 优势:腾讯混元是一款双语言大模型,可以实现中英文切换,方便不同语言的用户使用。同时,腾讯混元的内容中立客观,内容健康,适合儿童、子女、父母、家长们使用。 3. 应用场景:腾讯混元可以帮助用户快速生成各种类型的绘画作品,如插图、漫画、海报等。同时,腾讯混元还可以帮助用户学习 AI 时代的人工智能交互,掌握提示词使用,发挥想象力和创造力。 4. 使用方法:用户可以在聊天框中询问混元关于绘画方面的知识储备,然后描述自己的需求,就可以创作出相关的 AI 生成绘画。同时,用户还可以通过专业词汇描述沟通,指导混元和自己进行人 AI 沟通。 总的来说,腾讯混元是一款非常实用的人工智能绘画工具,它可以帮助用户快速生成各种类型的绘画作品,同时还可以帮助用户学习 AI 时代的人工智能交互。
2024-05-30
我想了解如何在微信公众号搭建一个能发语音的数字人
以下是在微信公众号搭建能发语音的数字人的相关步骤: 1. 照片数字人工作流及语音合成(TTS)API 出门问问 Mobvoi: 工作流地址:https://github.com/chaojie/ComfyUImobvoiopenapi/blob/main/wf.json 相关文件: 记得下载节点包,放进您的 node 文件夹里,这样工作流打开就不会爆红了!ComfyUI 启动后就可以将 json 文件直接拖进去使用了! 2. 「AI 学习三步法:实践」用 Coze 免费打造自己的微信 AI 机器人: 组装&测试“AI 前线”Bot 机器人: 返回个人空间,在 Bots 栏下找到刚刚创建的“AI 前线”,点击进入即可。 组装&测试步骤: 将上文写好的 prompt 黏贴到【编排】模块,prompt 可随时调整。 在【技能】模块添加需要的技能:工作流、知识库。 【预览与调试】模块,直接输入问题,即可与机器人对话。 发布“AI 前线”Bot 机器人: 测试 OK 后,点击右上角“发布”按钮即可将“AI 前线”发布到微信、飞书等渠道。 发布到微信公众号上: 选择微信公众号渠道,点击右侧“配置”按钮。 根据以下截图,去微信公众号平台找到自己的 App ID,填入确定即可。不用了解绑即可。 最后去自己的微信公众号消息页面,就可以使用啦。
2025-02-18
知识库搭建
知识库搭建主要包括以下几个方面: 1. “拎得清、看得到、想得起、用得上”的核心步骤: 拎得清:主动选择和判断高质量、与目标相关的信息源,利用 AI 搜索引擎、加入优质社群和订阅号等建立信息通路,具备信息嗅探能力。 看得到:确保所选信息能频繁且不经意地触达个人,通过浏览器插件、笔记工具等组织信息,使其易于检索和浏览。 想得起:强调信息的内化和知识线索建立,做好标记(关键词、tag)、选择合适存放位置,推荐使用 PARA 笔记法等方法组织串联信息。 用得上:将积累的知识转化为实际行动和成果,在解决问题或创造价值时能从知识库中调取相应信息。 2. RAG 技术: 利用大模型的能力搭建知识库是 RAG 技术的应用。 RAG 是当需要依靠不包含在大模型训练集中的数据时的主要方法,首先检索外部数据,然后在生成步骤中将其传递给 LLM。 RAG 应用包括文档加载、文本分割、存储(包括嵌入和向量数据存储)、检索、输出(把问题及检索出的嵌入片提交给 LLM 生成答案)。 文本加载器是将用户提供的文本加载到内存中以便后续处理。 3. 智能体知识库创建: 手动清洗数据,提高数据准确性。 在线知识库:创建画小二课程的 FAQ 知识库,飞书在线文档中每个问题和答案以分割,可编辑修改和删除,添加 Bot 并在调试区测试效果。 本地文档:注意拆分内容,提高训练数据准确度,按章节进行人工标注和处理。 发布应用:确保在 Bot 商店中能搜到。
2025-02-18
知识库搭建
知识库搭建主要包括以下几个方面: 1. “拎得清、看得到、想得起、用得上”的核心步骤: 拎得清:主动选择和判断高质量、与目标相关的信息源,利用 AI 搜索引擎、加入优质社群和订阅号等建立信息通路,具备信息嗅探能力。 看得到:确保所选信息能频繁且不经意地触达个人,通过浏览器插件、笔记工具等组织信息,使其易于检索和浏览。 想得起:强调信息的内化和知识线索建立,做好标记(关键词、tag)、选择合适存放位置,推荐使用 PARA 笔记法等方法组织串联信息。 用得上:将积累的知识转化为实际行动和成果,在解决问题或创造价值时能从知识库中调取相应信息。 2. RAG 技术: 利用大模型的能力搭建知识库是 RAG 技术的应用。 RAG 是当需要依靠不包含在大模型训练集中的数据时的主要方法,首先检索外部数据,然后在生成步骤中将其传递给 LLM。 RAG 应用包括文档加载、文本分割、存储(包括嵌入和向量数据存储)、检索、输出(把问题及检索出的嵌入片提交给 LLM 生成答案)。 文本加载器是将用户提供的文本加载到内存中以便后续处理。 3. 智能体知识库创建: 手动清洗数据,提高数据准确性。 在线知识库:创建画小二课程的 FAQ 知识库,飞书在线文档中每个问题和答案以分割,可编辑修改和删除,添加 Bot 并在调试区测试效果。 本地文档:注意拆分内容,提高训练数据准确度,按章节进行人工标注和处理。 发布应用:确保在 Bot 商店中能搜到。
2025-02-18
我想创业,花多少钱,能够搭建一个视频领域的AI模型
在视频领域搭建 AI 模型的成本因多种因素而异。对于创业者或小公司来说,这个领域存在一定的挑战。 腾讯的混元 AI 视频模型目前只支持文生视频,且已开源免费。 在模型供应商方面,不同供应商的特点和成本有所不同: 智谱 GLM4V 是通用视觉类大模型,为拍立得最早使用的模型,接口响应速度快,指令灵活性差一些,调用成本为 0.05 元/千 tokens。 阿里云百炼 qwenvlplus 也是通用视觉类大模型,是拍立得目前使用的模型,指令灵活性比较丰富,接口调用入门流程长一些,密钥安全性更高,调用成本为 0.008 元/千 tokens,训练成本为 0.03 元/千 tokens。 阶跃星辰是通用视觉类大模型,响应速度快,支持视频理解,输入成本为 0.005 0.015 元/千 tokens,输出成本为 0.02 0.07 元/千 tokens。 百度 PaddlePaddle 是 OCR 垂直小模型,文本识别能力补齐增强,私有化部署有服务费,API 调用在 0.05 0.1 元/次。 此外,获取高质量数据的难度较高,大厂在该领域的护城河深厚。大公司在争取大模型 API 客户方面更具优势,且开源大模型的发展可能会影响创业公司的业务。去年为大客户定制一个大模型的最高订单额可达 1000 万元,而今年则快速降到了百万元级别乃至更低。
2025-02-18
我需要以无代码的形式搭建一个数据大屏,有哪些工具可以满足我的需求
目前市面上有一些无代码工具可以帮助您搭建数据大屏,例如: 1. 阿里云 DataV:提供丰富的可视化组件和模板,操作相对简单。 2. 腾讯云图:支持多种数据源接入,具备强大的可视化编辑能力。 3. 帆软 FineReport:功能较为全面,能满足多样化的大屏搭建需求。 您可以根据自己的具体需求和使用习惯选择适合的工具。
2025-02-17
有什么用于搭建页面的ai应用吗
以下是一些用于搭建页面的 AI 应用: 1. 韦恩:扣子“AI 应用”入门 选择桌面网页,进入界面编排页面。 左侧有组件、模板和结构,组件包括布局组件、展示组件、输入组件和 AI 组件等。 中间是页面布局,左侧组件拖入并通过右侧的属性面板、事件面板进行设置。 右侧是属性面板和事件面板,不同组件的事件种类不同。 模板部分有官方提供的参考模板,结构部分方便找到页面及相关组件。 2. Wix ADI 网址:https://www.wix.com/ 特点:基于用户提供的信息自动生成定制化网站,提供多个设计选项和布局,集成了 SEO 工具和分析功能。 3. Bookmark 网址:https://www.bookmark.com/ 特点:AIDA 通过询问用户几个简单问题快速生成网站,提供直观的拖放编辑器,包括多种行业模板和自动化营销工具。 4. Firedrop 网址:https://firedrop.ai/ 特点:Sacha 是 AI 设计助手,可根据用户指示创建和修改网站设计,提供实时编辑和预览功能,包含多种现代设计风格和自定义选项。 5. The Grid 网址:https://thegrid.io/ 特点:Molly 是 AI 设计助手,可自动调整网站设计和布局,基于内容和用户互动优化,支持多种内容类型。 此外,还有韦恩:扣子“AI 应用”进阶中提到的邮票收藏馆应用的搭建案例,包括业务背景与逻辑梳理、页面设计等方面。
2025-02-17
大语言模型、多模态、数据、算力、算法、预训练、微调、RAG、自注意力机制、transformer、token、神经网络、向量、scaling law这些内容的含义
以下是对您所提到的这些内容含义的解释: 大语言模型:是一种基于大量文本数据进行训练的语言处理模型,其工作原理包括训练数据、算力、模型参数等。在训练数据一致的情况下,模型参数越大能力越强。 多模态:指能够处理多种不同类型的数据模态,如文本、图像、音频等,并将它们融合进行理解和生成。 数据:是大语言模型训练和应用的基础,包括各种文本、图像、音频等信息。 算力:指用于支持大语言模型训练和运行的计算能力。 算法:是大语言模型实现各种功能的数学和逻辑方法。 预训练:在大语言模型中,先在大规模数据上进行无特定任务的初步训练。 微调:基于通用大模型,针对特定领域任务提供数据进行学习和调整,以适应特定领域的需求。 RAG:检索增强生成,通过引用外部数据源为模型做数据补充,适用于动态知识更新需求高的任务。其工作流程包括检索、数据库索引、数据索引、分块、嵌入和创建索引、增强、生成等步骤。 自注意力机制:是 Transformer 架构中的重要部分,能理解上下文和文本关联,通过不断检索和匹配来寻找依赖关系,处理词和词之间的位置组合,预测下一个词的概率。 Transformer:是大语言模型训练架构,用于翻译等任务,具备自注意力机制。 Token:在自然语言处理中,是文本的基本单位。 神经网络:是大语言模型的基础架构,模拟人脑神经元的连接和信息处理方式。 向量:在大语言模型中,用于表示文本等数据的数学形式。 Scaling Law:关于大语言模型规模和性能之间关系的规律。
2025-02-18
大语言模型、多模态、数据、算力、算法、预训练、微调、RAG、自注意力机制、transformer、token、神经网络、向量、scaling law这些内容的含义
以下是对您所提到的这些内容含义的解释: 大语言模型:是一种基于大量文本数据进行训练的语言处理模型,其工作原理包括训练数据、算力、模型参数等。在训练数据一致的情况下,模型参数越大能力越强。 多模态:指能够处理多种不同类型的数据模态,如文本、图像、音频等,并将它们融合进行理解和生成。 数据:是大语言模型训练和应用的基础,包括各种文本、图像、音频等信息。 算力:指用于支持大语言模型训练和运行的计算能力。 算法:是大语言模型实现各种功能的数学和逻辑方法。 预训练:在大语言模型中,先在大规模数据上进行无特定任务的初步训练。 微调:基于通用大模型,针对特定领域任务提供数据进行学习和调整,以适应特定领域的需求。 RAG:检索增强生成,通过引用外部数据源为模型做数据补充,适用于动态知识更新需求高的任务。其工作流程包括检索、数据库索引、数据索引、分块、嵌入和创建索引、增强、生成等步骤。 自注意力机制:是 Transformer 架构中的重要部分,能理解上下文和文本关联,通过不断检索和匹配来寻找依赖关系,处理词和词之间的位置组合,预测下一个词的概率。 Transformer:是大语言模型训练架构,用于翻译等任务,具备自注意力机制。 Token:在自然语言处理中,是文本的基本单位。 神经网络:是大语言模型的基础架构,模拟人脑神经元的连接和信息处理方式。 向量:在大语言模型中,用于表示文本等数据的数学形式。 Scaling Law:关于大语言模型规模和性能之间关系的规律。
2025-02-18
大模型产品对比
以下是对一些大模型产品的对比介绍: 智谱清言:由智谱 AI 和清华大学推出,基础模型为 ChatGLM 大模型。2023 年 10 月 27 日,智谱 AI 于 2023 中国计算机大会(CNCC)上推出了全自研的第三代基座大模型 ChatGLM3 及相关系列产品。 模型特点:在工具使用排名国内第一,在计算、逻辑推理、传统安全能力上排名国内前三。更擅长专业能力,但代码能力有优化空间,知识百科稍显不足,是很有竞争力的大模型。 适合应用:场景广泛,可优先推进在 AI 智能体方面相关的应用,包括任务规划、工具使用及长文本记忆相关场景,在较复杂推理应用上效果不错,也适用于广告文案、文学写作。 其他大模型产品: OpenAI 发布 GPT4 科大讯飞发布星火 1.0 及升级至星火 3.0 百度发布文心一言 1.0 及升级至 V3.5 清华开源 ChatGLM 360 发布 360 智脑 1.0 及升级至智脑 4.0 复旦开源 MOSS 元语开源 ChatYuan 阿里云发布通义千问 1.0 及开源 Qwen7B 商汤科技发布商量 1.0 及升级至商量 2.0、商量 3.0 昆仑万维发布天工 1.0 出门问问发布序列猴子 华为发布盘古 3.0 西湖心辰发布西湖大模型 云从科技发布从容大模型 理想汽车发布 MindGPT OPPO 发布 AndesGPT vivo 发布 BlueLM 小米发布大模型 MiLM 元象科技开源 XVERSE13B Google 发布多模态大模型 Gemini 上海人工智能实验室开源 InternLM20B 百川智能发布 Baichuan2—Turbo 关于大模型在营销方面的应用: 大模型在实体类产品的营销标语生成上表现较好,虚拟类产品相对欠佳。可能是因为大模型训练数据中实体类语料多,更能调用已有知识加工,而虚拟类产品非标准品,大模型认识不足。 情绪价值在营销领域有很多用武之地,除快消商品外,很多产品的营销需要反复沟通,虚拟产品对感性成交依赖更大,大模型在这方面仍有很大发展空间。
2025-02-18
你的底层大模型用的是哪个?
目前常见的大型语言模型多采用右侧只使用 Decoder 的 Decoderonly 架构,例如我们熟知的 ChatGPT 等。这些架构都是基于谷歌 2017 年发布的论文“attention is all you need”中提出的 Transformer 衍生而来,其中包括 Encoder 和 Decoder 两个结构。 大模型的特点在于: 1. 预训练数据非常大,往往来自互联网上的论文、代码、公开网页等,一般用 TB 级别的数据进行预训练。 2. 参数非常多,如 Open 在 2020 年发布的 GPT3 就已达到 170B 的参数。 大模型之所以能有效生成高质量有意义的回答,关键在于“大”。例如 GPT1 的参数规模是 1.5 亿,GPT2 Medium 的参数规模是 3.5 亿,到 GPT3.5 时,参数规模达到惊人的 1750 亿,参数规模的增加实现了量变到质变的突破,“涌现”出惊人的“智能”。 大模型的预训练机制是指其“脑袋”里存储的知识都是预先学习好的,预训练需要花费相当多的时间和算力资源。在没有其他外部帮助的情况下,大模型所知道的知识信息总是不完备且滞后的。
2025-02-18
怎么用大模型构建一个属于我自己的助手
以下是用大模型构建属于自己的助手的几种方法: 1. 在网站上构建: 创建百炼应用获取大模型推理 API 服务: 进入百炼控制台的,在页面右侧点击新增应用,选择智能体应用并创建。 在应用设置页面,模型选择通义千问Plus,其他参数保持默认,也可以输入一些 Prompt 来设置人设。 在页面右侧提问验证模型效果,点击右上角的发布。 获取调用 API 所需的凭证: 在我的应用>应用列表中查看所有百炼应用 ID 并保存到本地。 在顶部导航栏右侧,点击人型图标,点击 APIKEY 进入我的 APIKEY 页面,创建新 APIKEY 并保存到本地。 2. 微信助手构建: 搭建,用于汇聚整合多种大模型接口,并获取白嫖大模型接口的方法。 搭建,作为知识库问答系统,将大模型接入用于回答问题,若不接入微信,搭建完成即可使用其问答界面。 搭建接入微信,配置 FastGpt 将知识库问答系统接入微信,建议先用小号以防封禁风险。 3. 基于 COW 框架构建: COW 是基于大模型搭建的 Chat 机器人框架,可将多模型塞进微信。 基于张梦飞同学的更适合小白的使用教程:。 实现功能包括打造属于自己的 ChatBot(文本对话、文件总结、链接访问、联网搜索、图片识别、AI 画图等)、常用开源插件的安装应用。 注意事项: 微信端因非常规使用有封号危险,不建议主力微信号接入。 只探讨操作步骤,请依法合规使用。 大模型生成的内容注意甄别,确保操作符合法律法规要求。 禁止用于非法目的,处理敏感或个人隐私数据时注意脱敏,以防滥用或泄露。 支持多平台接入,如微信、企业微信、公众号、飞书、钉钉等。 支持多模型选择,如 GPT3.5/GPT4.0/Claude/文心一言/讯飞星火/通义千问/Gemini/GLM4/LinkAI 等。 支持多消息类型,能处理文本、语音和图片,以及基于自有知识库进行定制的企业智能客服功能。 支持多部署方法,如本地运行、服务器运行、Docker 的方式。
2025-02-17
哪一款AI 可以实现参考一张柱状图,使用我提供的数据,生成同样的柱状图
以下两款 AI 可以实现参考一张柱状图,使用您提供的数据生成同样的柱状图: 1. PandasAI:这是让 Pandas DataFrame“学会说人话”的工具,在 GitHub 已收获 5.4k+星。它并非 Pandas 的替代品,而是将 Pandas 转换为“聊天机器人”,用户可以以 Pandas DataFrame 的形式提出有关数据的问题,它会以自然语言、表格或者图表等形式进行回答。目前仅支持 GPT 模型,OpenAI API key 需自备。例如,输入“pandas_ai.run”,即可生成相关柱状图。链接:https://github.com/gventuri/pandasai 2. DataSquirrel:这是一款自动进行数据清理并可视化执行过程的数据分析工具,能帮助用户在无需公式、宏或代码的情况下快速将原始数据转化为可使用的分析/报告。目前平台提供的用例涵盖了 B2B 电子商务、人力资源、财务会计和调查数据分析行业。平台符合 GDPR/PDPA 标准。链接:https://datasquirrel.ai/
2025-02-18
deepseek使用小技巧
以下是关于 DeepSeek 使用的一些小技巧: 1. 高阶能力调用: 文风转换矩阵:包括作家风格移植(如“用鲁迅杂文风格写职场 PUA 现象”)、文体杂交(如“将产品说明书改写成《史记》列传格式”)、学术口语化(如“把这篇论文摘要翻译成菜市场大妈能听懂的话”)。 领域穿透技术。 2. 场景化实战策略:包括商业决策支持、创意内容生成、技术方案论证。 3. 效能增强技巧: 对话记忆管理:如上下文锚定(“记住当前讨论的芯片型号是麒麟 9010”)、信息回溯(“请复述之前确认的三个设计原则”)、焦点重置(“回到最初讨论的供应链问题”)。 输出质量控制:针对不同问题类型进行修正,如过度抽象(“请具体说明第三步操作中的温度控制参数”)、信息过载(“用电梯演讲格式重新组织结论”)、风格偏移(“回归商务报告语气,删除比喻修辞”)。 4. 特殊场景解决方案: 长文本创作:如分段接力法(“先完成故事大纲→逐章扩展→最后进行伏笔校验”)、逻辑粘合剂(“确保新章节与前文的三处细节呼应”)。 敏感内容处理:如概念脱敏法(“用经济学原理类比说明网络审查机制”)、场景移植法(“假设在火星殖民地讨论该议题”)。 5. 通用于任何大模型的提示词针对性技巧: 身份定位技巧:目的是让 AI 理解您的背景和专业水平,例如“作为一名刚入职的电商运营,需要为天猫美妆店铺制定 618 活动方案”。 场景描述技巧:提供具体的应用场景和限制条件,例如“为新上市的儿童智能手表写一篇朋友圈文案,目标用户是 25 35 岁的年轻父母,预算 3000 以内,需强调安全定位功能”。 结构化输出技巧:指定具体的输出格式和内容结构,例如“请用表格对比 2024 年 Q1 特斯拉、比亚迪的销量数据,包含以下维度:月度销量、同比增长、市场份额,并在表格下方总结三个关键发现”。 分步骤提问技巧:将复杂问题拆解为可管理的小任务,例如“请分三步指导新手做美食短视频:前期准备:需要哪些设备和技能 拍摄阶段:关键场景和机位选择 后期制作:剪辑节奏和音乐配合建议”。 反馈优化技巧:通过追问获得更精准的答案。 深度思考引导技巧:获得更深入的分析和见解。 6. 万能提示词:您是一名顶尖的提示词优化专家,请按以下步骤优化下方提示: 分析原提示的模糊性、冗余项和潜在歧义。 基于,重构提示结构(可参考 CRISPE/BROKE 框架)。 生成 3 个优化版本,并解释每版的改进逻辑。 7. 如果官网的搜索不能用,一直崩溃,可以用火山的满血版,在视频的最后 10 分钟左右有手把手教程。 8. 关于 DeepSeek 的论文解读,有直播视频回放和相关论文下载,如。
2025-02-18
deepseek使用说明
DeepSeek 的使用说明如下: 功能:能进行自然语言理解与分析、编程、绘图,如 SVG、MA Max 图表、react 图表等。 使用优势:可以用更少的词让模型做更多事,思维发散,能给出创意思路和高级内容。 存在问题:思维链长不易控制,可能输出看不懂或胡编乱造的内容,增加纠错成本。 审核方法:可以用其他大模型来解读 DP 模型给出的内容。 使用建议:使用时要有自己的思维雏形,多看思考过程,避免被模型冲刷原有认知。 使用场景:包括阅读、育儿、写作、随意交流等方面。 生成单词:输入单词主题、图片风格、单词数量,选择 deepseekr1 模型,可生成指定数量的单词数组,以数组方式输出,包括单词、中文、美式音标、英文句子及其中文翻译。提示词方面,作为专业的单词生成助手,要围绕用户输入主题挖掘相关英语单词,仅输出相关内容,并以规定的数组形式呈现。 产品情况:Deep Research 是基于 AI 模型的产品,使用 GPT4o、o3 等推理模型,结合 UI 交互、搜索引擎等。DeepSeek 只是品牌名,需要搭配具体模型,如 DeepSeek V3(类 GPT4o)和 DeepSeek R1(类 OpenAI o1)。
2025-02-18
清华104页AI使用指南
以下是清华 104 页 AI 使用指南的相关内容: 智能纪要部分: 共学课程涵盖 config UI 从入门到精通,还有个人专栏研究报告、产品数据、全球投融资情况等内容,做项目时可查看细分赛道融资情况,也可学习 AI 功能创业,介绍了企业专栏内容如 Kimi 的技巧等。 提到了 AI 的案例和投稿,包含开发相关、微信机器人、人物角色等内容,还有日报动态、法律法规、历史更新和社区介绍等,布置了关于 AI 兴趣方向的小作业。 介绍了 CONFIUI 生态大会东京站 11 月 16 17 日的活动内容及报名,包括社区共创项目、大奖、首届活动情况、海外创作者共学等。 总结了关于 AI 知识库使用及 AIPO 活动的介绍,包括使用情况、发起背景、内容安排及相关资源等;AIPO 线下活动及 AI 相关探讨,包括规则、玩法、重要地位和研究方向等;way to AGI 社区活动与知识库介绍,包括活动安排、材料准备、使用和内容更新等;还包括时代杂志评选的领军人物、AI 相关名词解释、知识库的信息来源、社区共创项目、学习路径、经典必读文章、初学者入门推荐、历史脉络类资料等。 介绍了 AI 相关技术与活动,如 AI 音乐创作、数字人语音合成、config UI 的应用,以及社区共创项目如东京的 confii 生态大会、AI 文旅视频、娃卡奖、李普村共创故事、AI 春晚等,还有作业与报名、线下寄送物料组织活动、AI 春晚即将开始、AIPO 活动及相关挑战、共学活动与技能提升、硬件机器人材料购买、自媒体发布与流量扶持、活动奖项与历史玩法、工具使用与新大赛预告等。
2025-02-17
语文教学如何使用大模型
在语文教学中使用大模型,可以参考以下方面: 1. 提示词设置: Temperature:参数值越小,模型返回结果越确定;调高参数值,可能带来更随机、多样化或具创造性的产出。对于质量保障等任务,可设置低参数值;对于诗歌生成等创造性任务,可适当调高。 Top_p:与 Temperature 类似,用于控制模型返回结果的真实性。需要准确答案时调低参数值,想要更多样化答案时调高。一般改变其中一个参数即可。 Max Length:通过调整控制大模型生成的 token 数,有助于防止生成冗长或不相关的响应并控制成本。 Stop Sequences:指定字符串来阻止模型生成 token,控制响应长度和结构。 Frequency Penalty:对下一个生成的 token 进行惩罚,减少响应中单词的重复。 2. 了解大模型: 大模型通俗来讲是输入大量语料,让计算机获得类似人类的“思考”能力,能进行文本生成、推理问答、对话、文档摘要等工作。 训练和使用大模型可类比上学参加工作:找学校(需要大量 GPU 计算)、确定教材(大量数据)、找老师(算法)、就业指导(微调)、搬砖(推导)。 Token 是模型处理和生成的文本单位,在将输入进行分词时会形成词汇表。 需要注意的是,在实际应用中,可能需要根据具体的教学需求和场景进行调整和实验,以找到最适合的设置和方法。
2025-02-17
我是一个有23年软件系统开发和设计经验的架构师,但是对AI还没有系统化了解过,请问我该如何开始?如何在短时间内掌握AI的使用、原理以及二次开发?
以下是为您提供的在短时间内系统化学习 AI 的建议: 一、了解 AI 基本概念 首先,建议阅读「」部分,熟悉 AI 的术语和基础概念。了解什么是人工智能,它的主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。同时,浏览入门文章,这些文章通常会介绍 AI 的历史、当前的应用和未来的发展趋势。 二、开始 AI 学习之旅 在「」中,您将找到一系列为初学者设计的课程。这些课程将引导您了解生成式 AI 等基础知识,特别推荐李宏毅老师的课程。您还可以通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 三、选择感兴趣的模块深入学习 AI 领域广泛(比如图像、音乐、视频等),您可以根据自己的兴趣选择特定的模块进行深入学习。我建议您一定要掌握提示词的技巧,它上手容易且很有用。 四、实践和尝试 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 五、体验 AI 产品 与现有的 AI 产品进行互动是学习 AI 的另一种有效方式。尝试使用如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。通过与这些 AI 产品的对话,您可以获得对 AI 在实际应用中表现的第一手体验,并激发您对 AI 潜力的认识。 如果希望继续精进,对于 AI,可以尝试了解以下内容作为基础: 1. AI 背景知识 (1)基础理论:了解人工智能、机器学习、深度学习的定义及其之间的关系。 (2)历史发展:简要回顾 AI 的发展历程和重要里程碑。 2. 数学基础 (1)统计学基础:熟悉均值、中位数、方差等统计概念。 (2)线性代数:了解向量、矩阵等线性代数基本概念。 (3)概率论:基础的概率论知识,如条件概率、贝叶斯定理。 3. 算法和模型 (1)监督学习:了解常用算法,如线性回归、决策树、支持向量机(SVM)。 (2)无监督学习:熟悉聚类、降维等算法。 (3)强化学习:简介强化学习的基本概念。 4. 评估和调优 (1)性能评估:了解如何评估模型性能,包括交叉验证、精确度、召回率等。 (2)模型调优:学习如何使用网格搜索等技术优化模型参数。 5. 神经网络基础 (1)网络结构:理解神经网络的基本结构,包括前馈网络、卷积神经网络(CNN)、循环神经网络(RNN)。 (2)激活函数:了解常用的激活函数,如 ReLU、Sigmoid、Tanh。 此外,以证件照为例,Code AI 应用开发教学中,智能体开发从最初的 chatbot 只有对话框,到有了更多交互方式,因用户需求扣子推出了 AI 应用,其低代码或零代码的工作流等场景做得较好。但 AI CODING 虽强,目前适用于小场景和产品的第一个版本,复杂应用可能导致需求理解错误从而使产品出错。在创建 AI 应用时,要学习操作界面、业务逻辑和用户界面,包括布局、搭建工作流、用户界面及调试发布,重点熟悉桌面网页版的用户界面。
2025-02-17