Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

生成3D模型的AI

Answer

以下是一些关于生成 3D 模型的 AI 工具和相关信息:

3dfy.ai

  • 概览:是一家专注于将稀疏数据转化为逼真三维世界的公司,领导团队由计算成像领域资深专家组成,拥有近四十年综合专业知识。
  • 使用场景:数字 3D 互动体验流行度提升,但受 3D 内容可用性限制,其技术能利用稀疏数据自动创建高质量 3D 模型,在当前技术发展特定时期尤为重要。
  • 目标用户:数字内容创作者和艺术家、游戏开发者和动画制作人、教育和培训行业专业人士、医疗行业、建筑和工程领域。
  • 应用案例:暂未提及。

其他图片生成 3D 建模工具

  • Tripo AI:在线 3D 建模平台,能利用文本或图像在几秒钟内生成高质量且可立即使用的 3D 模型。
  • Meshy:功能全面,支持文本和图片生成 3D 以及 AI 材质生成。
  • CSM AI:支持从视频和图像创建 3D 模型,Real-time Sketch to 3D 功能支持通过手绘草图实时设计 3D 形象。
  • Sudo AI:支持通过文本和图像生成 3D 模型,适用于游戏领域。
  • VoxCraft:免费 3D 模型生成工具,能将图像或文本快速转换成 3D 模型,并提供多种功能。

在 3D 模型生成中,AI 主要完成了对 3D 模型生成流程的“一步到位”,工作流中的每个环节几乎都需要一位或一组 3D 美术工程师来完成,而使用 3D 生成模型可以直接完成一个可调整的 3D 粗模,大大提升效率。

此外,AI 在游戏测试环节中存在 3 大模拟场景,在优化环节承担改善角色动画、编程&加速、自动化游戏测试等功能。在游戏设计方面,AI 依托自然语言生成用法,用于角色与故事生成、游戏机制创新等,还能强化 NPC 模型的基础能力。在音乐与音效方面,AI 生成音乐有基于乐理规则的符号生成模型和基于音频数据的音频生成模型两种主流技术路线,开发者正在使用 AI 生成音乐填充游戏中的音效和音乐。

Content generated by AI large model, please carefully verify (powered by aily)

References

工具汇总:AI生成3D模型工具介绍

1)概览3DFY.ai是一家专注于开发先进技术的公司,其主要任务是将稀疏数据(如图片或文本提示)转化为逼真的三维世界,并且能够在大规模上实现这一转换。该公司的领导团队由计算成像领域的资深专家组成,他们在建设大规模医疗成像技术、软件解决方案及医疗3D扫描仪方面拥有近四十年的综合专业知识。[https://3dfy.ai/](https://3dfy.ai/)2)使用场景3DFY.ai观察到,在各行各业中,数字3D互动体验的流行度日益提升,这一现象得益于强大的计算设备普及以及通信吞吐量的不断增加。然而,他们也发现,这种新媒体的增长受到3D内容可用性的限制。尽管逼真的3D模型已成为新型媒体,类似于传统2D方式中常用的图像和视频文件,但现有的3D模型创建方法劳力密集、不可持续,需要一个技术范式的转变来真正解决大规模3D内容创建问题。3DFY.ai的技术能够利用稀疏数据(如文本或几张图片)自动创建高质量的3D模型,这一能力在当前技术发展的特定时期(计算能力、数据传输和存储能力的显著增长,以及深度学习技术的成熟和加速)显得尤为重要。3)目标用户数字内容创作者和艺术家,他们寻求高效、创新的方法来生成3D内容。游戏开发者和动画制作人,需要快速、高质量地创建3D模型。教育和培训行业的专业人士,他们可以利用3D内容提供更具吸引力和互动性的学习体验。医疗行业,特别是那些需要精确3D模型来支持诊断、治疗规划和患者教育的领域。建筑和工程领域,其中3D模型用于设计、可视化和项目规划。4)应用案例

问:图片生成 3d 建模工具

图片生成3D建模工具是指利用人工智能技术,通过分析图片内容并将其转换成3D模型的软件或服务。以下是一些可用的工具:1.Tripo AI:Tripo AI是VAST发布的在线3D建模平台,它能够利用文本或图像在几秒钟内生成高质量且可立即使用的3D模型。该平台基于一个数十亿参数级别的3D大模型,能够实现快速的2D到3D转换,并提供AI驱动的精准度和细节。2.Meshy:Meshy是一个功能全面的工具,它不仅支持文本生成3D,还支持图片生成3D以及AI材质生成。用户可以通过上传图片并描述需要的材质和风格,来生成高质量的3D模型。3.CSM AI:CSM(Common Sense Machines)支持从视频和图像创建3D模型。它的Real-time Sketch to 3D功能支持通过手绘草图实时设计3D形象,再转换为3D模型。4.Sudo AI:Sudo AI支持通过文本和图像生成3D模型,特别适用于游戏领域的模型生成。用户可以上传图片或输入文本提示词来生成3D模型。5.VoxCraft:由生数科技推出的免费3D模型生成工具,能够将图像或文本快速转换成3D模型,并提供了图像到3D、文本到3D和文本到纹理等多种功能。这些工具通常具有用户友好的界面,允许用户通过简单的操作来生成3D模型,无需专业的3D建模技能。它们可以广泛应用于游戏开发、动画制作、3D打印、视觉艺术等领域。内容由AI大模型生成,请仔细甄别

2024年度AI十大趋势报告:AI如何影响文化产业

在3D模型生成中,AI主要完成了对3D模型生成流程的“⼀步到位”。△图:3D美术工作流拆解,《AI游戏产业驱动力研究报告》工作流中的每⼀个环节几乎都需要⼀位或⼀组3D美术工程师来完成,而使用3D生成模型可以直接完成⼀个可调整的3D粗模,大大提升效率。△图:GAME BOT,超参数科技②测试与优化AI在游戏测试环节中存在3大模拟场景,分别是AI玩家模拟、AI NPC和AI游戏模型测试。在优化环节往往承担改善角色动画、编程&加速、自动化游戏测试等功能。通过生成文字、图片、视频、音乐来缩减时间和资源消耗,也能快速识别游戏开发过程中的基本问题,并提出改善方法。③故事情节与NPC游戏设计是整个游戏开发过程的核⼼,AI在角色与故事生成、游戏机制创新等方面,依托最基础的自然语言生成用法。生成式AI阶段,游戏开发者在决策式AI的基础上融合更多思维和方法用以训练智能NPC,通过针对性训练数据集,强化NPC模型的基础能力,如角色知识、对话能力、情节演绎和逻辑推理。目前,小型的智能NPC可以实现封包在游戏中本地运行。④音乐与音效AI生成音乐的存在2种主流技术路线:基于乐理规则的符号生成模型和基于音频数据的音频生成模型。开发者正在使用AI生成音乐来填充游戏过程与游戏UI中需要使用到的各类音效、不同游戏场景中用以渲染氛围的各种音乐。AI生成音乐作为音乐资产在游戏制作和发行环节使用都是非常可行的,像MusicLM等模型已经支持生成多音轨的作品。使用AI生成音乐为原型、佐以专业制作人的协调,将使AI音乐更快进入游戏制作与发行的生产线。⑤玩家体验与个性化

Others are asking
请你推荐适合做学习计划的AI工具
以下为适合做学习计划的 AI 工具推荐: 1. GPT4:效果稳定,内容质量高。使用时,首先询问用户的学习目标或需要解决的问题,然后按照顺序收集以下信息:学习目标与个人或职业发展目标的相关性、具体想要学习的内容、如何量化学习进度和成功、目标完成的时间框架、目标是否现实可行。综合这些信息形成综述,制定详细的分步骤学习计划,包括每日和每周的学习内容和目标。使用时需初始化提示词,回复主要目标或问题,回复 SMART 原则的每个问题,最终得到整体计划。 2. 文心 4.0:考虑到网络问题,如果不方便使用 GPT4 可以选择。文心 4.0 偶尔不稳定,可酌情使用。使用步骤与 GPT4 类似,包括初始化提示词、回复主要问题或目标、回复 SMART 原则的每个问题,从而得到详细的计划。 此外,利用 AI 进行英语学习和数学学习也有很多方法: 英语学习: 利用智能辅助工具如 Grammarly 进行写作和语法纠错。 使用语音识别应用如 Call Annie 进行口语练习和发音纠正。 借助自适应学习平台如 Duolingo 获得个性化学习内容和练习。 利用智能对话机器人如 ChatGPT 进行会话练习和对话模拟。 数学学习: 使用自适应学习系统如 Khan Academy 获得个性化学习路径和练习题。 借助智能题库和作业辅助工具如 Photomath 获取数学问题的解答和解题步骤。 运用虚拟教学助手如 Socratic 解答数学问题、获取教学视频和答疑服务。 参与交互式学习平台如 Wolfram Alpha 的数学学习课程和实践项目。
2025-03-12
AI产品经理应该具备哪些技能,需要学习哪些工具?计算机科学与技术专业的研究生如果想找AI产品经理的实习应该如何着手准备呢?如何准备项目呢?
AI 产品经理应具备的技能和需要学习的工具包括: 1. 学历背景:本科及以上学历,计算机科学、人工智能、机器学习相关专业背景。 2. 工具熟悉:熟悉 ChatGPT、Llama、Claude 等 AI 工具的使用及原理,并具有实际应用经验;熟练掌握 ChatGPT、Midjourney 等 AI 工具的使用及原理;具有一定的编程基础,熟练使用 Python、Git 等工具。 3. 项目能力:负责制定和执行 AI 项目,如 Prompt 设计平台化方法和模板化方法;了解并熟悉 Prompt Engineering,包括常见的 Prompt 优化策略(例如 CoT、Fewshot 等)。 4. 思维能力:对数据驱动的决策有深入的理解,能够基于数据分析做出决策;具有创新思维,能够基于业务需求提出并实践 AI first 的解决方案;对 AI 技术与算法领域抱有强烈的好奇心,并能付诸实践;对 AIGC 领域有深入的理解与实际工作经验,保持对 AI 技术前沿的关注;具备一定的编程和算法研究能力,能应用新的 AI 技术和算法于对话模型生成。 计算机科学与技术专业的研究生如果想找 AI 产品经理的实习,可以从以下方面着手准备: 1. 了解行业需求:搜索了解目前 AI 产品经理岗位的招聘技能要求情况。 2. 学习相关知识:深入学习上述提到的技能和工具知识。 3. 积累项目经验:可以参与一些相关的实践项目,例如收集数据、训练模型、派送模型等。 4. 思考商业价值:思考可以自动化的任务、驱动商业价值的核心以及商业领域的主要痛点。 5. 准备项目时,要明确项目目标,制定合理的开发时间表,清晰所需时间和人员。同时,为项目提供验收标准,尽量以数据衡量。 以上内容仅供参考,不同公司和项目可能有不同的具体要求。
2025-03-12
AI赋能办公,包含AI+对话、AI+写作与PPT、图片与视频生成和数据分析,还有面向HR、行政、财务、营销等岗位的AI赋能课
以下是关于 AI 赋能办公的相关内容: GPT 使用场景: 1. 内容生成:可以生成文章、故事、诗歌、歌词等内容。 演示:https://chat.openai.com/ 、https://bard.google.com/extensions 、https://claude.ai/ 2. 聊天机器人:作为聊天机器人后端,提供自然对话体验。 演示: 3. 问答系统:为用户提供准确答案。 4. 文本摘要:生成文本的摘要或概述。 5. 机器翻译:虽非专门设计,但有不错表现。 6. 群聊总结: 7. 代码生成:GPT3 及后续版本可生成代码片段,帮助解决编程问题。 8. 教育:用于教育领域,帮助学生解答问题或提供学习材料。 9. 浏览器插件:webpilot 10. PDF 对话:演示 www.chatpdf.com PPT 相关: 1. 2. AiPPT.cn:爱设计&AiPPT.cn 是一家 AIGC 数字科技企业,致力于打造“下一代个人与组织的 Ai 工作站”。旗下产品包括 AiPPT 等超过 10 余款应用 AI 能力的内容创作工具。23 年在 Ai+办公领域推出 AiPPT.cn/AiPPT.com,帮助用户“一分钟一键生成 PPT”,是国内 AiPPT 赛道创业公司第 1 的产品,全球第 4,国内所有 AIGC 产品 PC 端 Top10。目标市场主要是市场、运营、销售、人力、财务、行政、技术、产品、总助、公务员、学生、老师等基层及中高层管理岗位人员。 3. 在众多的 PPT 工具中,AI 带来便捷高效体验。深入了解了五大 AI PPT 工具:MindShow、爱设计、闪击、Process ON、WPS AI,它们各自有鲜明特色和擅长场景。选择合适工具要根据实际需求调整,试用和体验比盲目跟风更明智。 其他: 1. 音视频提取总结:https://bibigpt.co/r/AJ 2. 播客总结:https://podwise.xyz/dashboard/trending 3. 生成脑图:https://xmind.ai/editor/
2025-03-12
AI应用开发
以下是关于 AI 应用开发的相关信息: 阿里云百炼是基于通义系列大模型和开源大模型打造的一站式大模型服务平台,具有以下核心能力和优势: 1. 大模型 API 服务:高可用、高性能、高性价比,提供通义闭源和开源系列大模型,以及图片、语音等多模态大模型和国内优质三方大语言模型,主推规格如 qwenplus、qwenturbo 等。 2. 目标客户群体:有开发经验的企业或独立开发者。 3. AI 应用搭建:可观测、可干预、可追踪,提供 RAG 智能体应用、工作流编排和智能体编排三类使用场景的应用构建能力,以及包含插件能力、运营工具箱等适配工具,实现 10 分钟拖拉拽快速搭建 AI Agent。 4. 模型在线训练部署:一站式模型管理,弹性扩缩容,提供模型训练、部署、调优和评测,支持全参/高效等多种在线调优方式,同时配备多元化的大模型效果评测能力,目标客户群体为有算法和技术人力、有丰富企业数据、期望拥有专属大模型的企业。 第一期「AI 实训营」手把手学 AI 课程: 1. 共学直播地址: 会议时间:20:00 21:30 会议 ID:936197591 会议链接: 2. 第一期课表: 01/07 20:00 ,课程内容包括阿里云百炼大模型平台全解析、企业级服务场景对号入座、百闻不如体验,实操方有感知。 01/08 20:00 ,课程内容包括生态能力解析:手把手案例带做、服务场景透视:企业级案例应用、AI 机器人搭建:企业知识问答场景全覆盖。 01/09 20:00 ,课程内容包括阿里云百炼大模型多模态能力解析、商家运营场景&企业级解决方案分享、实践课堂:拍立得场景构建。 像字节 Coze 这样的工具本质上是「AIfirst aPaaS」,「aPaaS」是指这些 Bot Builder 完完全全就是以前的 aPaaS,把实现一个应用所需的不同类型代码用不同的可视化工具来实现,生成的是「配置」。Bot Builder 针对不同类型换了不同的可视化工具。「AIfirst」是指它们不但开发应用时用 AI 辅助或依赖 AI,开发出来的也是 AI 应用,应用的开发和运行阶段都有大模型支撑。
2025-03-12
AI产品经理
以下是为您整合的关于 AI 产品经理的相关信息: 北京分队中有一位叫 Kelton 的成员,是一位 AI 产品经理,深耕 NLP 方向 2 年,作为 Owner 从 0 1 打造过两款 AIGC 产品,也完成过 LLM 评测体系的从零搭建。技术出身,还曾在云计算、元宇宙领域工作过 2 年,坐标在海淀(北四环)。 银海是一位 AI 产品经理,也是通往 AGI 之路社区共建者,5 + 大模型厂商资深讲师,全网粉丝量 3W + ,在 AI Agent、多模态大模型、企业级 AI 应用等多领域具备丰富实战经验。 特看科技正在招聘 AI 产品经理,岗位要求:负责 AI 视频工具方向产品工作,对生成式 AI 产品有一定研究,熟悉 Transformer 和 Diffusion 模型的优先;英文好,有海外产品经验优先,有内容工具或 SaaS 产品经验优先;2 年以上产品岗位经验,职级根据经验能力制定,对标阿里 P6 P8 区间。 公司优势:特看科技专注于 AI 视频和直播应用,在国内市场已服务欧莱雅、宝洁、雅诗兰黛等头部品牌集团,海外市场服务了安克创新、Posee,Y.O.U 等头部出海品牌,也是 TikTok 官方广告创意合作伙伴。 员工福利:不管是厌倦大厂内卷的产品专家,还是初出茅庐的新人,只要对生成式 AI 的商业化应用充满热情,特看科技可以提供确定性的商业化应用场景、初创公司充沛的早期期权池、强大的工程师团队将新技术快速落地应用,最高可到合伙人级别。 加分项:有电子商务、企业服务、人工智能、海外产品等行业经验。欢迎推荐或自荐简历至 qingshen@tabcut.com,或飞书与清慎联系。
2025-03-12
有什么翻译文件的 AI 工具
以下是一些翻译文件的 AI 工具: 1. DeepL(网站):点击页面“翻译文件”按钮,上传 PDF、Word 或 PowerPoint 文件即可。 2. 沉浸式翻译(浏览器插件):安装插件后,点击插件底部“更多”按钮,选择“制作双语 BPUB 电子书”“翻译本地 PDF 文件”“翻译 THML/TXT 文件”“翻译本地字幕文件”。 3. Calibre(电子书管理应用):下载并安装 calibre,并安装翻译插件“Ebook Translator”。 4. 谷歌翻译(网页):使用工具把 PDF 转成 Word,再点击谷歌翻译“Document”按钮,上传 Word 文档。 5. 百度翻译(网页):点击导航栏“文件翻译”,上传 PDF、Word、Excel、PPT、TXT 等格式的文件,支持选择领域和导出格式(不过进阶功能基本都需要付费了)。 6. 彩云小译(App):下载后点击“文档翻译”,可以直接导入 PDF、DOC、DOCX、PPT、PPTX、TXT、epub、srt 等格式的文档并开始翻译(不过有免费次数限制且进阶功能需要付费)。 7. 微信读书(App):下载 App 后将 PDF 文档添加到书架,打开并点击页面上方“切换成电子书”,轻触屏幕唤出翻译按钮。 常见的文章润色 AI 工具包括: 1. Wordvice AI:集校对、改写转述和翻译等功能于一体的 AI 写作助手,基于大型语言模型提供全面的英文论文润色服务。 2. ChatGPT:由 OpenAI 开发的大型语言模型,可用于学生和写作人员的多方面写作辅助。 3. Quillbot:人工智能文本摘要和改写工具,可用于快速筛选和改写文献资料。 4. HyperWrite:基于 AI 的写作助手和大纲生成器,可帮助用户在写作前进行头脑风暴和大纲规划。 5. Wordtune:AI 驱动的文本改写和润色工具,可以帮助用户优化文章的语言表达。 6. Smodin:提供 AI 驱动的论文撰写功能,可以根据输入生成符合要求的学术论文。 以下是 100 个 AI 应用中的 41 60 部分: 1. WPS 文档翻译功能:AI 办公文档翻译工具,使用自然语言处理技术,市场规模达数亿美元。能快速翻译办公文档,提高工作效率。例如用户需要将一份中文报告翻译成英文,只需点击翻译按钮,即可快速得到翻译结果。 2. 美丽修行 APP:AI 美容护肤产品推荐平台,运用数据分析、自然语言处理技术,市场规模达数亿美元。根据用户肤质推荐适合的美容护肤产品。例如根据用户的油性皮肤,推荐控油、保湿的护肤品。 3. 360 儿童手表:AI 儿童安全监控系统,采用图像识别、机器学习技术,市场规模达数亿美元。保障儿童安全,让家长放心。例如当孩子走出安全区域时,手表会自动向家长发送警报。 4. 汽车之家 APP:AI 汽车保养提醒系统,借助数据分析、机器学习技术,市场规模达数亿美元。提醒车主及时进行汽车保养。例如当汽车行驶到一定里程时,APP 会推送保养提醒信息。
2025-03-12
列举出不同的 embedding模型
以下是不同的 embedding 模型: 1. 词嵌入: Word2Vec:包括 CBOW(Continuous BagofWords)和 SkipGram 模型,由 Google 提出,用于学习单词之间的语义关系。 GloVe(Global Vectors for Word Representation):由斯坦福大学开发,旨在结合全局统计信息和局部上下文窗口的优势来生成单词嵌入。 FastText:由 Facebook AI 团队推出,不仅考虑单个单词,还考虑内部字符 ngram,对于罕见词汇有更好的表现。 ELMo(Embeddings from Language Models):利用双向 LSTM 对整个句子进行建模,产生上下文敏感的单词嵌入。 2. 情景化的词嵌入: BERT(Bidirectional Encoder Representations from Transformers):由 Google 推出,利用 Transformer 架构的预训练模型,能够根据上下文提供动态的单词嵌入。 GPT(Generative Pretraining Transformer)及其后续版本 GPT2/3/4:由 OpenAI 开发,也是基于 Transformer 的自回归模型,同样能产出上下文相关的嵌入。 XLNet、RoBERTa 等都是 BERT 之后改进或扩展的预训练模型。 3. 句子和文档嵌入: Doc2Vec:扩展了 Word2Vec,能够为整个文档生成统一的向量表示。 Average Word Embeddings:将一段文本中所有单词的嵌入取平均作为整体的文本表示。 Transformers Sentence Embeddings:如 BERT 的标记对应的向量,或者专门针对句子级别的模型如 SentenceBERT。 4. 实体/概念嵌入: Knowledge Graph Embeddings:如 TransE、DistMult、ComplEx 等,用于将知识图谱中的实体和关系嵌入到低维向量空间中。 5. 其他类型: 图像 Embeddings:使用卷积神经网络(CNN)进行图像特征提取,得到的特征向量即为图像嵌入。 音频 Embeddings:在语音识别和声纹识别中,将声音信号转化为有意义的向量表示。 用户/物品 Embeddings:在推荐系统中,将用户行为或物品属性映射到低维空间以进行协同过滤或基于内容的推荐。 图 Embeddings:是用于学习图结构的表示学习方法,将图中的节点和边映射到低维向量空间中。通过学习图嵌入,可以将复杂的图结构转化为向量表示,以捕捉节点之间的结构和关联关系。这些方法可以通过 DeepWalk、Node2Vec、GraphSAGE 等算法来实现。图嵌入在图分析、社交网络分析、推荐系统等领域中广泛应用,用于发现社区结构、节点相似性、信息传播等图属性。 此外,以 OpenAI 为例,第一代嵌入模型(不推荐)包括: 所有第一代模型(以001 结尾的模型)都使用 GPT3 分词器,最大输入为 2046 个分词。 第一代嵌入由五个不同的模型系列生成,这些模型系列针对三个不同的任务进行了调整:文本搜索、文本相似性和代码搜索。 相似性嵌入:textsimilaritybabbage001、textsimilaritycurie001、textsimilaritydavinci001。 文本搜索嵌入:textsearchadaquery001、textsearchbabbagedoc001、textsearchbabbagequery001、textsearchcuriedoc001、textsearchcuriequery001、textsearchdavincidoc001、textsearchdavinciquery001。 代码搜索嵌入:codesearchadatext001、codesearchbabbagecode001、codesearchbabbagetext001。 对于001 文本嵌入(不是002,也不是代码嵌入),建议将输入中的换行符替换为单个空格,因为当存在换行符时可能会有更糟糕的结果。
2025-03-12
分布式预训练模型并行
分布式预训练模型并行主要包括以下内容: 张量并行:当模型参数增大,除流水线并行外,还可用张量并行缓解,即以前的模型并行。以矩阵乘为例,对权重矩阵 B 有按列切分和按行切分两种方案。按列切分,A 不变,每一列独立计算后结果 concat 在一起;按行切分,A 对应列切分,两部分独立计算后结果 sum 在一起。 大模型发展历程:2017 年发布的 Attention Is All You Need 论文开启了相关研究。之后有多种预训练模型,如 2018 年 Google 提出的 BERT,创新性地双向预训练并行获取上下文语义信息和使用掩码语言建模;2018 年 OpenAI 提出的 GPT,开创仅用自回归语言建模作为预训练目标;2021 年 Meta 提出的首个开源模型 LLAMA,为构建更大规模、更通用的语言模型提供方法与工具。 分布式训练的其他方面: 分布式通信原语包括点对点通信和集合通信,集合通信包含多种方式。 3D 并行包括数据并行,各自有优势和问题。 ZeRO 针对数据并行显存占用大的问题提出优化,Alpa 借鉴 AI 编译器思路对 3D 并行建模并用自动化搜索方式得到并行策略。 如果想了解更多关于 transformer 在 NLP/多模态/AIGC 的算法知识、分布式训练知识,以及如何在 TVM 上做 PTQ 量化和部署,可以关注作者 aaronxic。
2025-03-12
你说什么模型
以下是关于模型的相关信息: 我调用的是抖音集团的云雀大模型。 OpenAI API 由具有不同功能和价位的多种模型提供支持,包括 GPT4、GPT3.5、DALL·E、Whisper、Embeddings、Codex、Moderation、GPT3 等,您还可以通过微调针对特定用例对原始基本模型进行有限的定制。 在 Cursor 中,使用光标聊天、Ctrl/⌘K 和终端 Ctrl/⌘K 可以轻松在不同模型之间切换。在 AI 输入框下方有下拉列表,允许选择要使用的模型,默认准备好的模型有 GPT4o、GPT4、Claude 3.5 Sonnet 以及 Cursor 的自定义模型 cursorsmall,cursorsmall 不如 GPT4 智能但速度更快且用户可无限制访问,还可以在 Cursor Settings>Models>Model Names 下添加其他模型。
2025-03-12
请帮我推荐优化大模型+知识库的提示词技巧,重点是解决将知识库配置给大模型做RAG后,召回率不高或者不遵循指令。
以下是关于优化大模型+知识库的提示词技巧,以解决将知识库配置给大模型做 RAG 后召回率不高或者不遵循指令的问题: 首先,了解 LLM 应用性能优化的推荐路径: 1. 从 prompt 工程开始把 LLM 应用快速跑起来。 2. 若遇到表现性能不足等问题,如结构化提示词占用上下文过长,可尝试精简提示词长度;若指令遵循度不足,则加强指令约束。 3. 若提示工程无法满足要求,分析问题,若缺失知识,先简单做知识库 RAG。 4. RAG 之后若想让模型表现更收敛更稳定,尝试微调模型。 5. 微调模型后,若模型表现变好,使用更多高级 RAG 技术,构造输入输出样本,进一步用于微调模型,构建正向迭代循环。 需要注意的是,该路径有个隐藏前提:该 LLM 应用依赖外部知识,需要 RAG。若不需要外部知识,则不需要使用 RAG,可以直接进入 prompt 工程与微调的正向迭代循环。 对于 RAG 流程中的检索有用信息部分,有以下改进策略: 1. 优化索引: 按照子部分索引:将文本块再拆分为较小的文本(例如单句),然后对这些小块进行多次索引。适用于有多个主题、有冲突信息的复杂长文本信息,确保与查询相关的上下文。 按照文本框可以回答的问题索引:让 LLM 生成与拆分的文本块相关的假设性问题,并将这些问题用于索引,适用于用户没有提出非常明确的问题,减少模糊性。 按照文本块的摘要进行索引:适用于文本框中有多余信息或者与用户查询无关细节的情况。 2. 重排 rerank:搜到相似信息后,选择策略,大部分场景下选择最相似的即可。 在从知识库中检索出内容后利用大模型进行总结时,有两点需要注意: 1. 优化 Prompt,但此处不展开,可参考相关文章。 2. 选择合适的大模型,考虑上下文长度、聪明度和生成速度。若回答场景是很长的文档,可能更关注上下文长度;大多数情况下,大模型越聪明,生成速度可能越慢。
2025-03-12
大模型企业落地方案有哪些
大模型企业落地方案主要包括以下几个方面: 1. 提高内容可信: 做具备通用能力的大模型,通过商业交付应用、反馈和评测来解决内容可信问题。 不断优化数据以解决实际应用问题,如自我学习能力等。 走向垂直化,结合场景用一个模型和框架提高内容精准度。 2. 解决算力成本高、训练重复和资源紧缺的问题: 以 GPT3 模型为例,现有千卡集群训练一个月,单次训练周期一个月,总成本超过 1200 万美金,且全行业训练卡持续涨价。 目前仍无人能用商业化的国产芯片做大模型训练。 3. 降低大模型价格或使用垂直领域模型落地。 4. 以百度智能云为例: 在 IaaS 层,百舸 AI 异构计算平台解决算力问题,提供从集群创建到模型训练、推理的完整算力管理方案,提升算力管理能力和模型训练效率,确保高达 99.5%的有效训练时间,为大模型应用落地提供强大算力支撑。 在 Paas 层,千帆大模型平台解决大模型的调用、开发和应用开发问题,支持调用文心大模型全系列模型,提供全面工具链,支持定制化模型开发,通过 AppBuilder 提供企业级 Agent 和企业级 RAG 开发能力,还能将企业应用数据反馈到模型中形成良性循环,持续优化模型性能。 在 SaaS 层,提供丰富的常用应用供客户选择,如数字人平台曦灵、智能客服应用客悦等。 此外,大模型在实际应用中存在一些问题,如知识的局限性、幻觉问题和数据安全性问题,而 RAG 是解决上述问题的一套有效方案,它可以让大模型从权威的、预先确定的知识来源中检索、组织相关信息,更好地控制大模型生成的文本输出,并且用户可以深入了解 LLM 如何生成最终的结果。RAG 可以和微调结合使用,两者并不冲突。
2025-03-12
有哪些辅助输出3d模型资源的ai工具推荐一下
以下是一些辅助输出 3D 模型资源的 AI 工具推荐: 1. @CSM_ai:可以将文本、图像或草图转换为 3D 素材。体验地址:https://cube.csm.ai 。 2. Move AI 推出的 Move API:能从 2D 视频生成 3D 运动数据,支持多种 3D 文件格式导出,为 AR 应用、游戏开发等提供高质量 3D 运动数据。网址:https://move.ai/api 。 3. ComfyUI 3D Pack:可快速将图片转换为 3D 模型,支持多角度查看,使用 3D 高斯扩散技术提升模型质量,支持多种格式导出,集成先进 3D 处理算法。网址:https://github.com/MrForExample/ComfyUI3DPack/tree/main 。 4. Medivis 的 SurgicalAR 手术应用:将 2D 医疗图像转化为 3D 互动视觉,提高手术精度,支持 3D 模型的放大、缩小、旋转,精确手术计划。网址:https://t.co/3tUvxB0L4I 。 5. Media2Face:3D 面部动画创造工具,根据声音生成同步的 3D 面部动画,允许个性化调整,如情感表达,应用于对话场景、情感歌唱等多种场合。网址:https://sites.google.com/view/media2face 、https://arxiv.org/abs/2401.15687 、https://x.com/xiaohuggg/status/1752871200303480928?s=20 。 6. SIGNeRF:在 3D 场景中快速生成和编辑对象,新增或替换场景中的物体,新生成场景与原场景无缝融合。网址:https://signerf.jdihlmann.com 、https://x.com/xiaohuggg/status/1744950363667759474?s=20 。 7. Luma AI 发布的 Genie 1.0 版本:文本到 3D 模型转换工具,生成详细逼真的 3D 模型,支持多种 3D 文件格式,获得 4300 万美元 B 轮融资。网址:https://lumalabs.ai/genie?view=create 、https://x.com/xiaohuggg/status/1744892707926122515?s=20 。 8. BakedAvatar 动态 3D 头像:从视频创建逼真 3D 头部模型,实时渲染和多视角查看,兼容多种设备,交互性编辑。网址:https://buaavrcg.github.io/BakedAvatar/ 、https://x.com/xiaohuggg/status/1744591059169272058?s=20 。 此外,在 CAD 领域,也存在一些 AI 工具和插件可以辅助或自动生成 CAD 图,例如: 1. CADtools 12:Adobe Illustrator 插件,为 AI 添加 92 个绘图和编辑工具,包括图形绘制、编辑、标注、尺寸标注、转换、创建和实用工具。 2. Autodesk Fusion 360:集成了 AI 功能的云端 3D CAD/CAM 软件,能创建复杂的几何形状和优化设计。 3. nTopology:基于 AI 的设计软件,可创建复杂的 CAD 模型,包括拓扑优化、几何复杂度和轻量化设计等。 4. ParaMatters CogniCAD:基于 AI 的 CAD 软件,可根据用户输入的设计目标和约束条件自动生成 3D 模型,适用于拓扑优化、结构设计和材料分布等领域。 5. 一些主流 CAD 软件,如 Autodesk 系列、SolidWorks 等,提供了基于 AI 的生成设计工具,能根据用户输入的设计目标和约束条件自动产生多种设计方案。 但使用这些工具通常需要一定的 CAD 知识和技能,对于 CAD 初学者,建议先学习基本的 3D 建模技巧,然后尝试使用这些 AI 工具来提高设计效率。
2025-03-11
生成一个logo,以木为主题
以下是为您生成的以木为主题的 logo 相关的一些提示和信息: 在图像生成中,可以通过添加不同元素的权重来控制生成效果,例如“creature embedding in the woods:0.7 AND arcane_embedding:0.5 AND glitch_embedding:0.2”,表示将“在树林中的生物”权重设为 0.7,其他元素权重相应设置。 可以继续添加更多提示来微调生成的图像,比如“log AND frog:0.13 AND yellow eyes:0.08”(木头青蛙黄眼睛)。 目前有多种采样器可供选择,如老派采样器、DPM 采样器、新派采样器等,包括 LMS、Karras、Heun、Euler 等不同类型。 但这些内容主要侧重于图像生成的技术和参数方面,对于直接生成以木为主题的 logo 可能帮助有限。如果您需要更具体的以木为主题的 logo 设计建议,还需要进一步明确设计风格、色彩偏好、应用场景等方面的需求。
2025-03-12
形象照生成软件
以下是一些与形象照生成相关的内容: DALL·E 自动优化提示词:提供了关于绘画和数字方面的提示内容,包括提及绘画的种类、画布纹理、笔触形状和纹理,以及软件使用、阴影技术和多媒体方法等。还包括使用 DALL·E 3 生成图像的相关要求,如默认的方面比例、风格等,并强调遵循提示指南,避免违反服务条款和版权问题。 Han:优质 Prompts 分类精选 摸鱼辅助:可以帮助内向的人生成得体且简短的自我介绍和像素风格名片,通过提出一系列问题收集信息,然后生成自我介绍并结合形象照生成数字名片。 制作个人奥运头像:选用 MJ 软件进行生图,先生成基础图片,再对脸部重绘。输入部分使用 ChatGPT 生成人物描述,结合范例提示词添加中国人、中国运动服和项目场景描述,进行 MJ 绘图测试和局部重绘,还提到了处理流程图。
2025-03-12
如何用脚本文字生成视频
以下是关于用脚本文字生成视频的相关内容: 一、Sora 的功能 1. 文字生成视频,时长可到 60 秒。 示例:一位时尚的女士在充满温暖发光的霓虹灯和活泼的城市标志的东京街头漫步。 2. 图片生成视频。 3. 扩展视频,能够在时间上向前或向后扩展。 二、根据视频脚本生成短视频的工具 1. ChatGPT + 剪映:ChatGPT 生成视频小说脚本,剪映根据脚本自动分析出视频要素并生成素材和文本框架。 2. PixVerse AI:在线 AI 视频生成工具,支持将多模态输入转化为视频。 3. Pictory:AI 视频生成器,用户提供文本描述即可生成相应视频内容。 4. VEED.IO:提供 AI 图像和脚本生成器,帮助用户从图像制作视频并规划内容。 5. Runway:AI 视频创作工具,能将文本转化为风格化视频内容。 6. 艺映 AI:专注于人工智能视频领域,提供文生视频、图生视频、视频转漫等服务。 三、用 AI 把小说做成视频的制作流程 1. 小说内容分析:使用 AI 工具(如 ChatGPT)提取关键场景、角色和情节。 2. 生成角色与场景描述:利用工具(如 Stable Diffusion 或 Midjourney)生成视觉描述。 3. 图像生成:使用 AI 图像生成工具创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成脚本。 5. 音频制作:用 AI 配音工具(如 Adobe Firefly)转换语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)合成。 7. 后期处理:进行剪辑、添加特效和转场以提高质量。 8. 审阅与调整:观看视频并根据需要调整。 9. 输出与分享:完成编辑后输出并分享。 请注意,具体操作步骤和所需工具可能因项目需求和个人偏好不同而有所差异。AI 工具的可用性和功能也可能变化,建议访问工具网址获取最新信息和使用指南。内容由 AI 大模型生成,请仔细甄别。
2025-03-12
有没有根据描述自动生成前端代码的工具?
以下是一些根据描述自动生成前端代码的工具: 1. Vercel v0:已向所有人开放,能通过文本或图像生成代码化的用户界面。例如群友“嘴替笔记苏谨深”试用效果不错,可生成标准安卓的天气预报截图,还能输出 react 和 html 两种格式的代码。 2. ChatGPT 结合相关操作:可将后端定义的接口文档转换为前端项目中的 Mock 数据,提升效率。 3. AIGC 工具 V0:现在支持从外部 API 获取数据,v0 Premium 用户可将生成的页面发布到自定义的子域名。 您可以根据具体需求选择适合的工具。
2025-03-12
你现在是抖音运营,如何可以利用现有图片素材,自动生成服饰图文
以下是一些利用现有图片素材自动生成服饰图文的方法和相关资源: 1. TryOffDiff:这是一种 AI 脱衣技术,能够逆向打造服装图片。与虚拟试衣不同,它可以将衣服从照片中“摘取”生成标准化服装图,并且能够保留图案、褶皱、徽标等精细细节,即使原图中部分被遮挡,也能准确推断。其应用场景广泛,适合商品目录制作及电商平台服装展示需求。详细介绍: 2. 可生成自定义服装效果图,支持颜色、款式、材质等多种细节描述。基于 H&M Fashion Captions 数据集,提供多样化的时尚风格参考。模型权重为 Safetensors 格式,便于集成和使用。模型下载: 3. 在 Stable Diffusion 中,若看到好看的图片想复制其效果,可将照片导入。若为 SD 下载的 PNG 格式照片,右边会自动弹出照片信息,包括正面关键词、负面关键词等,可复制这些信息到“文生图”页面生成相似图片。若照片无法自动弹出信息,可使用“标签器(Tagger)”生成关键词。
2025-03-12