Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

有哪些辅助输出3d模型资源的ai工具推荐一下

Answer

以下是一些辅助输出 3D 模型资源的 AI 工具推荐:

  1. @CSM_ai:可以将文本、图像或草图转换为 3D 素材。体验地址:https://cube.csm.ai 。
  2. Move AI 推出的 Move API:能从 2D 视频生成 3D 运动数据,支持多种 3D 文件格式导出,为 AR 应用、游戏开发等提供高质量 3D 运动数据。网址:https://move.ai/api 。
  3. ComfyUI 3D Pack:可快速将图片转换为 3D 模型,支持多角度查看,使用 3D 高斯扩散技术提升模型质量,支持多种格式导出,集成先进 3D 处理算法。网址:https://github.com/MrForExample/ComfyUI-3D-Pack/tree/main 。
  4. Medivis 的 SurgicalAR 手术应用:将 2D 医疗图像转化为 3D 互动视觉,提高手术精度,支持 3D 模型的放大、缩小、旋转,精确手术计划。网址:https://t.co/3tUvxB0L4I 。
  5. Media2Face:3D 面部动画创造工具,根据声音生成同步的 3D 面部动画,允许个性化调整,如情感表达,应用于对话场景、情感歌唱等多种场合。网址:https://sites.google.com/view/media2face 、https://arxiv.org/abs/2401.15687 、https://x.com/xiaohuggg/status/1752871200303480928?s=20 。
  6. SIGNeRF:在 3D 场景中快速生成和编辑对象,新增或替换场景中的物体,新生成场景与原场景无缝融合。网址:https://signerf.jdihlmann.com 、https://x.com/xiaohuggg/status/1744950363667759474?s=20 。
  7. Luma AI 发布的 Genie 1.0 版本:文本到 3D 模型转换工具,生成详细逼真的 3D 模型,支持多种 3D 文件格式,获得 4300 万美元 B 轮融资。网址:https://lumalabs.ai/genie?view=create 、https://x.com/xiaohuggg/status/1744892707926122515?s=20 。
  8. BakedAvatar 动态 3D 头像:从视频创建逼真 3D 头部模型,实时渲染和多视角查看,兼容多种设备,交互性编辑。网址:https://buaavrcg.github.io/BakedAvatar/ 、https://x.com/xiaohuggg/status/1744591059169272058?s=20 。

此外,在 CAD 领域,也存在一些 AI 工具和插件可以辅助或自动生成 CAD 图,例如:

  1. CADtools 12:Adobe Illustrator 插件,为 AI 添加 92 个绘图和编辑工具,包括图形绘制、编辑、标注、尺寸标注、转换、创建和实用工具。
  2. Autodesk Fusion 360:集成了 AI 功能的云端 3D CAD/CAM 软件,能创建复杂的几何形状和优化设计。
  3. nTopology:基于 AI 的设计软件,可创建复杂的 CAD 模型,包括拓扑优化、几何复杂度和轻量化设计等。
  4. ParaMatters CogniCAD:基于 AI 的 CAD 软件,可根据用户输入的设计目标和约束条件自动生成 3D 模型,适用于拓扑优化、结构设计和材料分布等领域。
  5. 一些主流 CAD 软件,如 Autodesk 系列、SolidWorks 等,提供了基于 AI 的生成设计工具,能根据用户输入的设计目标和约束条件自动产生多种设计方案。

但使用这些工具通常需要一定的 CAD 知识和技能,对于 CAD 初学者,建议先学习基本的 3D 建模技巧,然后尝试使用这些 AI 工具来提高设计效率。

Content generated by AI large model, please carefully verify (powered by aily)

References

工具汇总:AI生成3D模型工具介绍

5⃣️🎮@CSM_ai:文本、图像或草图转换为3D素材🔗体验地址:https://cube.csm.ai🔗https://x.com/xiaohuggg/status/1763758877999587757?s=205⃣️🏃Move AI推出Move API:从2D视频生成3D运动数据支持多种3D文件格式导出为AR应用、游戏开发等提供高质量3D运动数据🔗https://move.ai/api🔗https://x.com/xiaohuggg/status/1761590288576061573?s=203⃣️🖼️ComfyUI 3D Pack引入3D图像处理:快速将图片转换为3D模型,支持多角度查看。使用3D高斯扩散技术提升模型质量。支持多种格式导出,集成先进3D处理算法。🔗https://github.com/MrForExample/ComfyUI-3D-Pack/tree/main🔗https://x.com/xiaohuggg/status/1755824687811346514?s=202⃣️👨⚕️Medivis的SurgicalAR手术应用:将2D医疗图像转化为3D互动视觉,提高手术精度。支持3D模型的放大、缩小、旋转,精确手术计划。🔗https://t.co/3tUvxB0L4I🔗https://x.com/xiaohuggg/status/1755183564021473404?s=206⃣️👤Media2Face:3D面部动画创造工具:

问:有没有用来画CAD图的AI工具

是的,存在一些AI工具和插件可以辅助或自动生成CAD图,特别是在设计和工程领域。以下是一些可以辅助创建CAD图的AI工具:1.CADtools 12:这是一个Adobe Illustrator(AI)插件,它为AI添加了92个绘图和编辑工具,包括图形绘制、编辑、标注、尺寸标注、转换、创建和实用工具。2.Autodesk Fusion 360:Fusion 360是Autodesk开发的一款集成了AI功能的云端3D CAD/CAM软件,能够帮助用户创建复杂的几何形状和优化设计。3.nTopology:nTopology是一款基于AI的设计软件,它可以帮助用户创建复杂的CAD模型,包括拓扑优化、几何复杂度和轻量化设计等。4.ParaMatters CogniCAD:CogniCAD是一款基于AI的CAD软件,可以根据用户输入的设计目标和约束条件自动生成3D模型,适用于拓扑优化、结构设计和材料分布等领域。5.生成设计工具:一些主流CAD软件,如Autodesk系列、SolidWorks等,提供了基于AI的生成设计工具,这些工具可以根据用户输入的设计目标和约束条件自动产生多种设计方案。这些工具通常需要一定的CAD知识和技能才能有效使用。对于CAD初学者,建议先学习基本的3D建模技巧,然后尝试使用这些AI工具来提高设计效率。内容由AI大模型生成,请仔细甄别

工具汇总:AI生成3D模型工具介绍

-根据声音生成同步的3D面部动画。-允许个性化调整,如情感表达。-应用于对话场景、情感歌唱等多种场合。🔗https://sites.google.com/view/media2face🔗https://arxiv.org/abs/2401.15687🔗https://x.com/xiaohuggg/status/1752871200303480928?s=205⃣️🌐SIGNeRF:3D场景中的物体添加与修改-在3D场景中快速生成和编辑对象。-新增或替换场景中的物体。-新生成场景与原场景无缝融合。🔗https://signerf.jdihlmann.com🔗https://x.com/xiaohuggg/status/1744950363667759474?s=209⃣️🔮Luma AI发布:Genie 1.0版本-文本到3D模型转换工具。-生成详细逼真的3D模型。-支持多种3D文件格式。-获得4300万美元B轮融资。🔗https://lumalabs.ai/genie?view=create🔗https://x.com/xiaohuggg/status/1744892707926122515?s=206⃣️👤BakedAvatar动态3D头像:-从视频创建逼真3D头部模型。-实时渲染和多视角查看。-兼容多种设备,交互性编辑。🔗https://buaavrcg.github.io/BakedAvatar/🔗https://x.com/xiaohuggg/status/1744591059169272058?s=20

Others are asking
市面上有哪些ai硬件
以下是市面上一些常见的 AI 硬件: 1. RayBan Meta 智能眼镜:由 meta 与雷朋合作推出,Tiktok 作品数约 180000 个,价格为 299 美元。 2. Vision Pro 眼镜:来自苹果公司,Tiktok 作品数约 38600 个,价格为 3999 美元。 3. cozmo 玩具机器人:由 Digital Dream Labs 制造,Tiktok 作品数约 10500 个,价格为 399 美元。 4. Lovot 玩具机器人:由 GROOVE X 生产,Tiktok 作品数约 5931 个,价格为 9000 美元。 5. Optimus 等身机器人:由特斯拉推出。 6. AI pin 挂件:由 Humane 制造,Tiktok 作品数约 1200 个,价格为 699 美元。 7. PLAUD 录音机:由机智连接生产,Tiktok 作品数约 1072 个,价格为 159 美元。 8. RabbitR1 挂件:由 Rabbit Inc 推出,Tiktok 作品数约 1048 个,价格为 199 美元。 9. Loona 玩具机器人:由可以科技制造,Tiktok 作品数约 753 个,价格为 449 美元。 10. Timekettle WT2 耳机:由 Timekettle 生产,Tiktok 作品数约 751 个,价格为 299 美元。 11. OrCam MYEYE 眼镜:由 OrCam 推出,Tiktok 作品数约 532 个,价格为 4250 美元。 这些数据来源于 google、tiktok、twitter、亚马逊等。更多榜单信息您可以访问:https://zw73xyquvv.feishu.cn/wiki/IqcqwTDiYiKttNktBg3cg8HgnLh 。对于榜单内容有疑问想交流的 GenAI 硬件创始人,或者想合作转载内容的公众号博主,请加微信,或者在本文末留言。
2025-03-12
AI生成图表
以下是为您整理的关于 AI 生成图表的相关内容: Napkin:这是一款能够生成多样风格图表的 AI 工具。它可以将选中文本转换为 mermaid 格式图表,支持 SVG 渲染,交互流畅且模板丰富。后台可能使用轻量模型(如 GPT4 mini),自动选择图标,生成多套模板供选择。当前免费,适合需要快速生成图表的用户。相关链接: 创建项目管理流程图(Lucidchart): 1. 注册并登录: 2. 选择模板:在模板库中搜索“项目管理流程图”。 3. 编辑图表:根据项目需求添加和编辑图形和流程步骤。 4. 优化布局:利用 AI 自动布局功能,优化图表的外观。 5. 保存和分享:保存图表并与团队成员分享,或导出为 PDF、PNG 等格式。 Liblibai 文生图简易上手教程: 1. 定主题:确定生成图片的主题、风格和表达的信息。 2. 选择 Checkpoint:根据主题选择内容贴近的 checkpoint,如麦橘、墨幽的系列模型。 3. 选择 lora:寻找内容重叠的 lora 以控制图片效果及质量。 4. 设置 VAE:选择 840000 那一串。 5. CLIP 跳过层:设成 2。 6. Prompt 提示词:用英文写生成需求,使用单词和短语组合,用英文半角逗号隔开。 7. 负向提示词 Negative Prompt:用英文写避免产生的内容,单词和短语组合,用英文半角逗号隔开。 8. 采样方法:一般选 DPM++2M Karras,也可参考 checkpoint 详情页中模型作者推荐的采样器。 9. 迭代步数:选 DPM++2M Karras 时,一般在 30 40 之间。 10. 尺寸:根据个人喜好和需求选择。 11. 生成批次:默认 1 批。
2025-03-12
怎样用AI生成行业每周内容分析简报
以下是使用 AI 生成行业每周内容分析简报的方法: 1. 项目目的: 目标:通过 AI 工具每天生成【画小二日报】,替代传统人工整理 AIGC 行业资讯。 思路:解决问题不止一种方法,多种思路各有优劣,重要的是锻炼实际应用中的问题解决能力。 2. 效果演示:通过方法一生成画小二日报 Demo 演示,可查看。 3. GPTs 画小二日报: OpenAI 的 GPTs:构建 GPTs 需要是 GPT4 的付费用户。 创建画小二日报的 GPTs:按照图片中标注的步骤操作。 Instruction 的 Prompt:请牢记这个英文单词。 4. 使用工具:扣子 Coze 创建 Bot:网址 https://www.coze.cn,后缀是 com 是国际版,可免费白嫖 GPT4。 编辑界面。 截图示意:提示词、插件选择 getToutiaoNews,引用插件生成对应内容。 Prompt 提示词。 输出结果。 5. 获取指定网站内容: 指定网站:如 36kr 网站 AI 频道资讯:https://36kr.com/information/AI/。 在 Coze 中的提示词。 输出结果。 6. 使用工作流重写: 工作流思路:将获取的新闻让大模型重新按照自己的风格创作新闻内容,可自定义风格,加入个人元素防止拷贝。 搭建工作流:使用到的组件包括 GetToutiaoNews、大模型,工作流布局。 GetToutiaoNews 配置。 大模型配置:根据输入内容,按照平易近人和搞笑的风格写标题,以科普博主画小二的口吻描述,写 100 左右的新闻概要,注意人设与回复逻辑。 7. 使用 Webpilot 插件: 原因:省去工作流,获取新闻列表并让 Webpilot 分析。 解题思路:首先获取新闻列表,其次让 Webpilot 分析对应的内容并输出,思考后续是否可跟大模型重写及相关问题。 8. 同步飞书:数据同步到飞书可变为训练数据。 9. 粉丝交流学习群:包括 AIGC 商业案例实操课、画小二微信交流群、画小二微信公众号。
2025-03-12
AI赛事网站
以下为一些 AI 赛事网站及相关信息: 【灵璧 AI】安徽文创 截止日期:0115 0315 奖金奖项:一等奖 2k1,二等奖 1k2,三等奖 8005 主题+作品类型:赛道一为数字艺术创作,利用 AIGC 技术创作数字绘画、数字雕塑等艺术作品;赛道二为互动体验设计,设计互动体验项目,如 AR/VR 体验、互动游戏等;赛道三为数字故事讲述,创作以虞姬及灵璧特色历史文化为主题的数字故事,如动画短片等。 关键要求:只能提交一份作品。以压缩包上传,材料包含创作作品的源文件、prompt 指令、制作过程的关键过程截图、录屏与说明等。 提交方式:邮箱 链接: 创无界智未来·文旅应用赛 截止日期:0101 0330 奖金奖项:一等奖 10w1,二等奖 6w2,三等奖 3w3 主题+作品类型:四个赛道 关键要求:模糊 提交方式:官网 链接: 【凌家滩】AI 创作大赛 截止日期:0101 0415 奖金奖项:一等奖 2w1,二等奖 8k2,三等奖 2k3,优秀奖 010 主题+作品类型:“文化遗产的数字化重现与未来表达”AI 图像/AIMV/AI 视频 关键要求:无 提交方式:无 链接: Project Odyssey 第二季 视频和图像:Civitai, Kling AI, Viggle, Hailuo, Hedra, RunPod, Higgsfield, ThinkDiffusion, neural frames, Genmo, fal, LTX Video, CogVideoX, Morph Studio, Domo, Haiper, Pony Diffusion, Leonardo AI, Rubbrband 音频:ElevenLabs, Hailuo, Cartesia, Sync, Tunes by Freepik 3D:Playhouse, Playbook, Tripo AI 故事板:SAGA 截止日期:12 月 16 日正式启动 奖金奖项:共涵盖 9 大参赛类别,超 40 个现金奖项累计 7 万美元,还提供价值超 75 万美元的 AI 工具免费试用额度 主题+作品类型:无 关键要求:无 提交方式:比赛现已开放注册,加入等候列表,12 月 16 日起即可解锁超 30 种免费试用 链接: 赛事官网:https://www.projectodyssey.ai/ 注册地址:https://projectodyssey.myflodesk.com/season2 赛事 Discord:https://discord.com/invite/projectodysseyai 智绘未来【台州】AI 大赛 截止日期:0122 0309 奖金奖项:①一等奖 5k1,二等奖 2k3,三等奖 1k5,台州奖 1k1;②一等奖 5.5k1,二等奖 2.5k2,三等奖 1.5k3,台州奖 1k1 主题+作品类型:AI 绘画赛道,AI 视频赛道(60S 以上) 关键要求:分辨率 2K 以上,【加分项】展现台州自然风光、人文历史、城市印象等元素,对台州未来景象的想象,或对台数字馆的未来想象相关的台州元素(额外在总分值增加 10%的分数) 提交方式:AITOP100 平台,投稿后必须转发至小红书分享并带上话题智绘未来+关注官方账号@台州数字馆。 链接:
2025-03-12
我想知道现在中国网络环境内可以用的最好图片AI,以图生图稳定
目前在中国网络环境内可用的较好的以图生图且较为稳定的 AI 产品有: 1. Artguru AI Art Generator:在线平台,能生成逼真图像,为设计师提供灵感,丰富创作过程。 2. Retrato:AI 工具,可将图片转换为非凡肖像,有 500 多种风格可选,适合制作个性头像。 3. Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具细节的全新视觉作品。 4. Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计的 AI 工具,能将上传的照片转换为芭比风格,效果出色。 此外,关于 Stable Diffusion 还有一些相关的使用技巧和处理步骤: 用 GFPGAN 算法将人脸变清晰,可参考文章。 将图片发送到图生图中,打开 stableSR 脚本放大两倍,该放大插件是所有插件中对原图还原最精准、重绘效果最好的,可参考文章。 使用 Stable Diffusion 中的【X/Y/Z plot】脚本做参数对比,如设置 X 轴为提示词相关性,Y 轴为重绘幅度等。绘图时可通过增加提示词、使用画笔工具等进行局部修改和重绘。
2025-03-12
AI学习路径
以下是为新手提供的 AI 学习路径: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,如图像、音乐、视频等,可根据兴趣选择特定模块深入学习。 掌握提示词的技巧,其上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解其工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 另外,如果您偏向技术研究方向,学习路径包括: 1. 数学基础:线性代数、概率论、优化理论等。 2. 机器学习基础:监督学习、无监督学习、强化学习等。 3. 深度学习:神经网络、卷积网络、递归网络、注意力机制等。 4. 自然语言处理:语言模型、文本分类、机器翻译等。 5. 计算机视觉:图像分类、目标检测、语义分割等。 6. 前沿领域:大模型、多模态 AI、自监督学习、小样本学习等。 7. 科研实践:论文阅读、模型实现、实验设计等。 如果您偏向应用方向,学习路径包括: 1. 编程基础:Python、C++等。 2. 机器学习基础:监督学习、无监督学习等。 3. 深度学习框架:TensorFlow、PyTorch 等。 4. 应用领域:自然语言处理、计算机视觉、推荐系统等。 5. 数据处理:数据采集、清洗、特征工程等。 6. 模型部署:模型优化、模型服务等。 7. 行业实践:项目实战、案例分析等。 无论是技术研究还是应用实践,数学和编程基础都是必不可少的。同时需要紧跟前沿技术发展动态,并结合实际问题进行实践锻炼。 记住,学习 AI 是一个长期的过程,需要耐心和持续的努力。不要害怕犯错,每个挑战都是成长的机会。随着时间的推移,您将逐渐建立起自己的 AI 知识体系,并能够在这一领域取得自己的成就。完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。
2025-03-12
我需要deepseek或chatgpt辅助完成中文硕士 论文综述的指令
很抱歉,目前没有关于使用 DeepSeek 或 ChatGPT 辅助完成中文硕士论文综述的具体指令。但一般来说,您可以利用这些工具来获取相关主题的信息和观点,为您的综述提供参考。不过需要注意的是,使用这些工具生成的内容不能直接作为您论文的一部分,您仍需要对获取的信息进行筛选、整理、分析和引用,并确保符合学术规范和道德标准。
2025-03-11
有哪些辅助财务工作提效的AI智能体或落地应用?
以下是一些辅助财务工作提效的 AI 智能体或落地应用: 新兴的 AI 智能体公司,如 Sierra、Decagon、Maven AGI、DevRev、Gradient Labs 等,在客户服务和支持等领域发挥作用,其中 Sema4 可用于财务后勤。 RPA(流程自动化机器人)产品,如杭州分叉智能公司的 RPA 产品,可控制桌面软件,实现办公流程自动化,在财务领域可用于开票、网银流水下载等。它能够替代电脑办公中的重复有逻辑工作,为企业降本增效。 利用引刀 AP 创建网页实现智能解答税务问题,结合飞书避免信息泄露和实现自动回复等。 生成式 AI 可以帮助金融服务团队改进内部流程,简化财务团队的日常工作流程。例如,帮助编写 Excel、SQL 和 BI 工具中的公式和查询以实现分析自动化,自动创建文本、图表、图形等报告内容,为会计和税务团队综合、总结并提供税法和潜在扣除项的可能答案,以及帮助自动生成和调整采购和应付账款相关的合同、订单和发票等。
2025-03-11
我想用AI辅助做科研选题,写学术课题申报书,我需要学习哪些内容,按步骤进行规划
利用 AI 辅助做科研选题并写学术课题申报书,您需要按以下步骤学习相关内容: 1. 确定课题主题:明确您的研究兴趣和目标,选择具有研究价值和创新性的主题。 2. 收集背景资料:使用学术搜索引擎和文献管理软件等 AI 工具,搜集相关研究文献和资料。 3. 分析和总结信息:借助 AI 文本分析工具,对收集到的资料进行分析,提取关键信息和主要观点。 4. 生成大纲:利用 AI 写作助手生成课题大纲,涵盖引言、文献综述、方法论、结果和讨论等部分。 5. 撰写文献综述:使用 AI 工具辅助撰写文献综述部分,保证内容准确完整。 6. 构建方法论:依据研究需求,采用 AI 建议的方法和技术设计研究方法。 7. 数据分析:若课题涉及数据收集和分析,运用 AI 数据分析工具处理和解释数据。 8. 撰写和编辑:借助 AI 写作工具撰写课题各部分,并进行语法和风格检查。 9. 生成参考文献:使用 AI 文献管理工具生成正确的参考文献格式。 10. 审阅和修改:利用 AI 审阅工具检查课题的逻辑性和一致性,并根据反馈修改。 11. 提交前的检查:最后,使用 AI 抄袭检测工具确保课题的原创性,并做最后的格式调整。 请记住,AI 工具只是辅助,不能完全替代研究者的专业判断和创造性思维。在使用 AI 进行课题写作时,要保持批判性思维,确保研究质量和学术诚信。
2025-03-09
是否有可以免费使用的可以辅助机械设计的AI大模型
以下是一些可以免费使用且能辅助机械设计的 AI 大模型: 1. Trae 国内版:内置豆包 1.5 pro、DeepSeek 满血版等大模型,无限量免费使用。其作为 AI IDE,整体比插件好用,连接稳定快速,界面根据国内用户习惯定制。 2. 阿里的通义千问大模型:有免费接口,但可能存在一定的免费额度限制。 3. 智谱 AI(ChatGLM):有免费接口,同样可能有免费额度的限制。 4. 科大讯飞(SparkDesk):提供免费接口,可能有限制免费额度的 Token。 此外,谷歌的 Gemini 大模型和海外版 Coze 的 GPT4 模型免费且能图片识别,但使用时需要给服务器挂梯子。
2025-03-07
我指的是用AI来辅助小红书内容的优化方面,我应该在WaytoAGI中学习什么内容?
在 WaytoAGI 中,您可以学习以下与用 AI 辅助小红书内容优化相关的内容: 1. 智能纪要中的数据转化与创作提示词工具:包括从数据到模型的转化过程,以及基于 AGI 特调的生成 MJ 和 SD 提示词的工具扣子,还有利用这些工具生成山海经神兽等创作提示词的方法和迭代优化方式。 2. 人文数据转化的不同层面:了解数据转化成模型的结构过程和情感层面的结构,以及人类世界人文价值对齐翻译对 AI 发展的重要性。 3. 关于神兽提示词创作及相关工具的交流:如社区建立种子群收集知识库,推荐表现力好的提示词组等。 4. 相关社区及平台的介绍:例如嘟嘟社区的现状,以及在队友平台上跑效果图等。 5. 开展的创作挑战活动:如 10 分钟神兽提示词创作挑战,包括挑战方式、成果检验和配方获取等。 6. 第 11 期 Video Battle AI 视频挑战活动:包括选题参考,如 AI 视频领域国内外近期热点话题事件、技术工作流拆解等;话题要求,如小红书内容文案需附特定字样和带特定标签;大赛主题和创意支持,以及视频工具建议等。 希望以上内容对您有所帮助。
2025-03-07
我是经济学研究者,经常写作学术论文,投稿SSCI期刊,大模型幻觉太严重,在辅助文献综述写作方面,基本没有用处。你有好的用于文献综述写作的AI辅助工具吗?
以下是一些可能有助于您在文献综述写作中应对大模型幻觉问题的方法和工具: 1. 对于 ChatGPT ,您可以使用 temporary chat 功能,保证其在没有任何记忆的情况下生成最新鲜的回答。 2. 当发现模型回答不理想时,可以采取以下技巧: 告诉模型忘掉之前的所有内容,重新提问或新建会话窗口。 让模型退一步,重新审视整个结构,从零开始设计。 对于像 Claude 这种会自己猜测的模型,如果不确定,可以给它看日志,让其依据日志判断问题所在。 3. 您可以参考 Hallucination Leaderboard (大语言模型幻觉排行榜),了解不同模型的幻觉情况,该排行榜使用 Vectara 的 Hughes 幻觉评估模型计算各大模型在总结文档时引入幻觉的频率,用于评估 LLM 的事实一致性,并为 RAG 系统提供参考。完整榜单可通过查看。 4. Claude APP 即将添加网页搜索和推理功能,这或许意味着新模型即将发布,预计发布时间在一两周内。
2025-03-06
总结文章内容,生成内容总结,最后输出图片、海报类的内容总结,用什么工具如何实现?
以下是对上述文章内容的总结: 文章主要介绍了三种与总结文章内容、生成相关图片和推送相关内容有关的工作流: 1. Yeadon 的 coze 扣子闪光卡片制作工作流:包括输入原文链接、提取链接内容、生成原文二维码、图片搜索、利用代码节点改变 HTML 展示信息变量、HTML 代码转图片内容、抠图提取卡片主体等步骤。具有页面自动对齐、修改方便、模板复用等优势,有待提升的方面包括自由选择显示内容和添加更多动画效果等。 2. 【拔刀刘】的自动总结公众号内容并定时推送到微信的工作流:包括使用大模型节点批量总结文章内容,选择模型和配置参数,使用代码节点汇总格式化最终输出内容,通过自建插件将格式化好的内容推送到用户微信。 3. 【买买买!💥产品买点提炼神器强化版🚀】的一站式营销内容解决方案工作流:包括卖点提炼模块,通过提问引导用户发掘卖点,或由大模型帮助生成;卖点修改模块,对大模型总结的卖点进行精细化调整;内容展示模块,将生成的内容制作成可保存的图片并输出图片链接。 关于生成图片、海报类内容总结的工具和实现方式,在 Yeadon 的工作流中,通过代码节点将 HTML 代码转成图片内容,在【买买买!💥产品买点提炼神器强化版🚀】的工作流中,利用图像流制作美观的图片模板,并传入相关信息展示在图片中。
2025-03-11
可以帮我输出一张图,解释人工智能的工作原理?
以下是关于人工智能工作原理的解释: 在音频生成方面,以谷歌的 V2A 系统为例: 首先,将视频输入编码为压缩表示。 然后,基于扩散模型从随机噪声中迭代改进音频,这一过程由视觉输入和自然语言提示引导,以生成与提示紧密配合的同步逼真音频。 最后,对音频输出进行解码,转化为音频波形,并与视频数据相结合。 在生成式人工智能的整体领域中: 监督学习用于标记事物,一直占据较大比例。 生成式 AI 由监督学习技术搭建,2010 2020 年是大规模监督学习的十年,为现代人工智能奠定了基础。 以生成文本为例,大语言模型通过使用监督学习不断预测下一个词语来生成新的文本内容,这需要千亿甚至万亿级别的单词数据库。 此外,大语言模型在写作、修改文本、翻译等方面有应用,但也存在编造故事产生错误信息的问题,需要鉴别信息准确性。人工智能作为一种通用技术,有大量的运用空间,如基于网络界面应用和基于软件程序应用等。
2025-03-10
最近想要出一本书,书籍的主题是“Deepseek的应用革命:打造AI时代的竞争力”主要是面相企业家和企业高管,希望能够将知识库内容中关于企业应用的部分提炼成书,请根据知识库素材,输出一个图书内容规划和重点参考资料
以下是为您规划的图书内容和重点参考资料: 一、图书内容规划 1. 引言 介绍 AI 时代的背景和企业面临的挑战与机遇。 阐述 DeepSeek 在塑造企业竞争力方面的重要性。 2. DeepSeek 的技术创新 详细介绍 DeepSeek 最新模型 V3 与 R1 的架构创新,如混合专家(MoE)架构、多头潜注意力(MLA)等。 解释其如何提升计算效率和推理能力,打破算力壁垒。 3. 多领域的应用案例 字节跳动的新技术 OmniHuman 在视频生成方面的突破。 Coinbase 全面推动 AI 应用的实践,如在欺诈预防和客户支持等领域的应用。 4. 对企业管理的影响 探讨善于沟通上下文、明晰 AI 能力边界、合理授权并监督等管理经验如何提升 AI 协作效率。 5. 行业趋势与挑战 分析 AI 基础大模型参数量的变化趋势。 讨论初级程序员面临的职业挑战以及编程领域的颠覆性变化。 6. 未来展望 预测 DeepSeek 及相关技术在未来的发展方向和可能的创新。 二、重点参考资料 1. 《》 2. 《》 3. 《》 4. 《》 5. 《》 6. 《[零基础掌握 Deepseek》》 7. 日报 8. 日报
2025-03-08
正在搭建客户CRM系统,对于客户拜访跟进记录表格,希望平衡销售人员的录入便捷性和信息完整性,如何通过多维表格接入的AI功能来简化信息录入,比如通过语音录音,直接解析内容。推荐我具体方法,包括怎么解析语音,输出的关键字段,以及提示词
以下是一种通过多维表格接入的 AI 功能来简化客户拜访跟进记录信息录入的方法: 1. 定义任务目标:让 AI 成为您的私人 CRM,即客户管理系统。 2. 编写指令: 定义角色:希望 AI 作为一名顶级的客户服务与销售总监,负责记住客户的爱好与信息。 提供背景信息:简单描述自己的身份,例如负责什么产品的销售。 明确任务目标和输出要求:在每次拜访客户后,把重要信息发送给 AI,要求 AI 每次接到新的客户消息后,只用回复一句“收到,知道了。” 3. 信息录入方式:可以通过语音录音的方式将拜访客户的信息传达给 AI。 4. 语音解析:利用 AI 的语音识别和自然语言处理能力,对语音内容进行解析。 5. 输出的关键字段:可能包括客户姓名、联系方式、拜访时间、拜访内容要点、客户需求、客户反馈等。 6. 提示词:例如“请整理本次拜访客户的关键信息”“提取重要内容并生成表格”等。 您可以参考以上方法,根据实际需求进行调整和优化。
2025-03-07
怎么在AI文生图中精准的输出想要的文字
要在 AI 文生图中精准输出想要的文字,可以参考以下方法: Recraft 模型: 提供提示词加上文本位置,因为模型获得的输入数据越多,越容易产生精确输出。遵循指令比仅理解提示词更容易。 Tusiart 模型: 定主题:明确生成图片的主题、风格和表达的信息。 选择基础模型 Checkpoint:根据主题选择内容贴近的模型,如麦橘、墨幽的系列模型。 选择 lora:寻找内容重叠的 lora 以控制图片效果及质量。 ControlNet:可控制图片中特定的图像,如人物姿态、生成特定文字等,属于高阶技能。 局部重绘:下篇再学。 设置 VAE:选择 840000 即可。 Prompt 提示词:用英文写需求,使用单词和短语组合,用英文半角逗号隔开,不用管语法和长句。 负向提示词 Negative Prompt:用英文写避免产生的内容,同样用单词和短语组合,用英文半角逗号隔开,不用管语法。 采样算法:一般选 DPM++2M Karras,也可参考模型作者推荐的采样器。 采样次数:选 DPM++2M Karras 时,采样次数在 30 40 之间。 尺寸:根据个人喜好和需求选择。 Liblibai 模型: 定主题:明确生成图片的主题、风格和表达的信息。 选择 Checkpoint:根据主题选择内容贴近的模型,如麦橘、墨幽的系列模型。 选择 lora:寻找内容重叠的 lora 以控制图片效果及质量。 设置 VAE:选择 840000 即可。 CLIP 跳过层:设成 2 。 Prompt 提示词:用英文写需求,使用单词和短语组合,用英文半角逗号隔开,不用管语法和长句。 负向提示词 Negative Prompt:用英文写避免产生的内容,同样用单词和短语组合,用英文半角逗号隔开,不用管语法。 采样方法:一般选 DPM++2M Karras,也可参考模型作者推荐的采样器。 迭代步数:选 DPM++2M Karras 时,迭代步数在 30 40 之间。 尺寸:根据个人喜好和需求选择。 生成批次:默认 1 批。
2025-03-06
我想通过ai先提取图片数据,然后将获取的数据根据固定话术模板输出,要用什么软件可以实现呢
目前有多种软件可以帮助您实现从图片提取数据并根据固定话术模板输出的需求。以下是一些常见的选择: 1. TensorFlow:这是一个广泛使用的深度学习框架,可用于图像识别和数据处理。 2. OpenCV:提供了丰富的图像处理和计算机视觉功能。 3. PyTorch:常用于深度学习任务,包括图像数据的处理。 但具体选择哪种软件,还需要根据您的具体需求、技术水平和项目特点来决定。同时,您还需要掌握相关的编程知识和图像处理技术,以便有效地运用这些软件来实现您的目标。
2025-03-05
请帮我推荐优化大模型+知识库的提示词技巧,重点是解决将知识库配置给大模型做RAG后,召回率不高或者不遵循指令。
以下是关于优化大模型+知识库的提示词技巧,以解决将知识库配置给大模型做 RAG 后召回率不高或者不遵循指令的问题: 首先,了解 LLM 应用性能优化的推荐路径: 1. 从 prompt 工程开始把 LLM 应用快速跑起来。 2. 若遇到表现性能不足等问题,如结构化提示词占用上下文过长,可尝试精简提示词长度;若指令遵循度不足,则加强指令约束。 3. 若提示工程无法满足要求,分析问题,若缺失知识,先简单做知识库 RAG。 4. RAG 之后若想让模型表现更收敛更稳定,尝试微调模型。 5. 微调模型后,若模型表现变好,使用更多高级 RAG 技术,构造输入输出样本,进一步用于微调模型,构建正向迭代循环。 需要注意的是,该路径有个隐藏前提:该 LLM 应用依赖外部知识,需要 RAG。若不需要外部知识,则不需要使用 RAG,可以直接进入 prompt 工程与微调的正向迭代循环。 对于 RAG 流程中的检索有用信息部分,有以下改进策略: 1. 优化索引: 按照子部分索引:将文本块再拆分为较小的文本(例如单句),然后对这些小块进行多次索引。适用于有多个主题、有冲突信息的复杂长文本信息,确保与查询相关的上下文。 按照文本框可以回答的问题索引:让 LLM 生成与拆分的文本块相关的假设性问题,并将这些问题用于索引,适用于用户没有提出非常明确的问题,减少模糊性。 按照文本块的摘要进行索引:适用于文本框中有多余信息或者与用户查询无关细节的情况。 2. 重排 rerank:搜到相似信息后,选择策略,大部分场景下选择最相似的即可。 在从知识库中检索出内容后利用大模型进行总结时,有两点需要注意: 1. 优化 Prompt,但此处不展开,可参考相关文章。 2. 选择合适的大模型,考虑上下文长度、聪明度和生成速度。若回答场景是很长的文档,可能更关注上下文长度;大多数情况下,大模型越聪明,生成速度可能越慢。
2025-03-12
大模型企业落地方案有哪些
大模型企业落地方案主要包括以下几个方面: 1. 提高内容可信: 做具备通用能力的大模型,通过商业交付应用、反馈和评测来解决内容可信问题。 不断优化数据以解决实际应用问题,如自我学习能力等。 走向垂直化,结合场景用一个模型和框架提高内容精准度。 2. 解决算力成本高、训练重复和资源紧缺的问题: 以 GPT3 模型为例,现有千卡集群训练一个月,单次训练周期一个月,总成本超过 1200 万美金,且全行业训练卡持续涨价。 目前仍无人能用商业化的国产芯片做大模型训练。 3. 降低大模型价格或使用垂直领域模型落地。 4. 以百度智能云为例: 在 IaaS 层,百舸 AI 异构计算平台解决算力问题,提供从集群创建到模型训练、推理的完整算力管理方案,提升算力管理能力和模型训练效率,确保高达 99.5%的有效训练时间,为大模型应用落地提供强大算力支撑。 在 Paas 层,千帆大模型平台解决大模型的调用、开发和应用开发问题,支持调用文心大模型全系列模型,提供全面工具链,支持定制化模型开发,通过 AppBuilder 提供企业级 Agent 和企业级 RAG 开发能力,还能将企业应用数据反馈到模型中形成良性循环,持续优化模型性能。 在 SaaS 层,提供丰富的常用应用供客户选择,如数字人平台曦灵、智能客服应用客悦等。 此外,大模型在实际应用中存在一些问题,如知识的局限性、幻觉问题和数据安全性问题,而 RAG 是解决上述问题的一套有效方案,它可以让大模型从权威的、预先确定的知识来源中检索、组织相关信息,更好地控制大模型生成的文本输出,并且用户可以深入了解 LLM 如何生成最终的结果。RAG 可以和微调结合使用,两者并不冲突。
2025-03-12
Berkeley做了一个AI相关的模型
以下是关于 Berkeley 相关的 AI 模型信息: 1 月 11 日,UC Berkeley 的 NovaSky 团队推出了 SkyT132BPreview 推理模型。这是一款开源的推理模型,基于 Qwen2.532BInstruct 训练而成,拥有 32B 参数,在数学、编程、物理和科学等复杂任务领域表现出色。使用入口完全开源,提供训练数据集和代码。NovaSky 团队隶属于加州大学伯克利分校 Sky Computing 实验室,成立于 2020 年,致力于推动低成本、高效率的 AI 模型开发。相关链接:https://novaskyai.github.io/posts/skyt1 5 月 23 日,伯克利实验室研究了“宙斯盾”数据集,用 YOLOv8 模型训练,美军及其盟友驱逐舰关键部件的检测精度达 0.926。相关链接:https://arxiv.org/pdf/2405.12167v1
2025-03-11
AI 大模型产品经理
以下是为您整理的关于 AI 大模型产品经理的相关信息: 招聘信息: 1. 北京: 大模型效果评测:针对大模型效果的综合评估,开发、沉淀并持续优化评测方法,确立评测流程及标准化工作,执行评测任务并撰写分析报告,推进大模型优化。 协助算法及产品同学不断提高 AI 准确性,提升用户体验。 基本要求:研究生及以上学历,计算机、金融、数据分析等相关专业优先。熟悉大模型及相关 NLP 技术者优先;有 AIGC 相关实习经验者优先;代码能力强且有利用大模型解决编程问题的经验,能够熟练的使用 python、sql、java 等工具,能独立完成数据分析/处理任务优先;能够尽快到岗,每周 5 天出勤,实习时间 4 个月以上。 2. 杭州: 杭州智诊科技有限公司招聘医疗大模型的算法工程师/产品经理。 岗位职责:负责跨语言领域 embedding 模型训练,如 SimCSE 通过对比学习方式进行无监督+有监督训练;负责构建知识检索增强模块,保证相关知识信息召回工作;基于 Chat GLM 系列模型进行 LLMasAgent 的落地应用;负责搭建智能体协同决策系统,从系统层面提供诊断决策支持。 任职要求:硕士及以上学历,计算机相关专业毕业,有较强的工程能力;熟悉 Transformer 结构,对 BERT、GPT、BART、T5 等常见的模型有深入的了解,有 ChatGLM/Llama 等模型的使用/训练经验者优先;熟悉 LangChain 等 LLM 的应用框架,熟悉 prompt engineering,能有效借助提示词来充分利用大模型的能力;熟悉知识图谱,对比学习,有信息检索相关实际项目经历;熟悉 AI agent 多智能体协同,有相关领域成熟项目落地,医疗行业优先;熟悉 PyTorch、Huggingface 等深度学习工具,熟悉 Python 编程语言和 Linux 开发环境,有扎实的编程功底。 培训课程: 第一期「AI 实训营」手把手学 AI【第一期:大咖带你在阿里云百炼从零搭应用】,讲师为银海,其为 AI 产品经理,通往 AGI 之路社区共建者,5+大模型厂商资深讲师,全网粉丝量 3W+,在 AI Agent、多模态大模型、企业级 AI 应用等多领域具备丰富实战经验。
2025-03-11
AI大模型训练是什么意思
AI 大模型训练是一个复杂的过程,主要包括以下方面: 1. 数据转换:当请求输入到模型时,会从自然语言形式转化为机器可理解的格式,通常是向量。 2. 数学计算确定参数:类似于通过已知的几组(x,y)值计算方程式 y=f(x)=ax+b 中的参数 a 和 b,大语言模型通过计算确定可能多达 1750 亿个的参数。 3. 一般训练步骤: 无监督学习:分析大量文本数据,学习语言基本结构和常识,具备文本补齐能力,将人类知识向量化以获得基础语言模型。 清洗出好的数据。 指令微调:训练模型理解并执行具体指令,如翻译文本,以回答问题,此阶段数据输入量相对减少。 对齐过程:引入人类评价标准和处理特定格式要求,优化模型输出以符合人类期望,包括处理文化、道德等细节。 4. 生成式预训练:是机器学习领域由来已久的概念,如 GPT 模型基于 Transformer 模型,在大型未标记文本数据集上进行预训练,并能生成类似人类自然语言的文本。 5. 大模型特点: 强大在于庞大的参数数量,这些参数在学习过程中不断调整,帮助模型深入理解和生成数据。 训练依赖大量数据,包括文本、图像、音频等,通过对数据的学习掌握丰富知识和技能。 总之,大模型训练是一个涉及多步骤、大量数据和复杂计算的过程,旨在使模型具备强大的语言处理和生成能力。
2025-03-11
如何学习使用AI模型
以下是关于学习使用 AI 模型的一些建议和知识: Teachable Machine: 这是由 Google 开发的机器学习工具,可应用于商品说明书、自动驾驶、教学互动等多个场景。使用步骤如下: 1. 收集数据:可上传图片、录制声音或动作视频作为训练数据。 2. 训练模型:用收集的数据训练模型,并测试其能否正确识别新的图片、声音或动作。 3. 导出模型:完成训练后,可下载或上传到网上用于其他项目。 它具有多种优势: 1. 允许用户快速、简单地创建机器学习模型,无需专业知识或编程技能。 2. 提供多种创建机器学习模型的方式,非常灵活和用户友好。 3. 支持使用文件或实时捕捉示例,用户可选择上传已有文件或实时录制。 4. 可以在本地完成训练,保护用户隐私。 5. 生成的模型是真实的 TensorFlow.js 模型,可在任何运行 JavaScript 的地方工作,还能导出到不同格式在其他地方使用。 AI 模型相关技术原理: 1. 概念:生成式 AI 生成的内容称为 AIGC。 2. 相关技术名词: AI 即人工智能。 机器学习是电脑找规律学习,包括监督学习、无监督学习、强化学习。 监督学习使用有标签的训练数据,目标是学习输入和输出之间的映射关系,包括分类和回归。 无监督学习的数据没有标签,算法自主发现规律,经典任务如聚类。 强化学习从反馈里学习,最大化奖励或最小化损失,类似训小狗。 深度学习参照人脑有神经网络和神经元,因为有很多层所以叫深度,神经网络可用于监督学习、无监督学习、强化学习。 生成式 AI 可以生成文本、图片、音频、视频等内容形式。 LLM 是大语言模型,生成图像的扩散模型不是大语言模型,对于大语言模型,生成只是其中一个处理任务,如谷歌的 BERT 模型可用于语义理解。 3. 技术里程碑:2017 年 6 月,谷歌团队发表论文《Attention is All You Need》,首次提出了 Transformer 模型,它完全基于自注意力机制来处理序列数据,不依赖于循环神经网络或卷积神经网络。
2025-03-11