Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

ai语言模型记忆能力与什么相关,可以拥有人类相当的记忆吗

Answer

AI 语言模型的记忆能力主要与以下因素相关:

  1. 长期记忆:主要有长文本(持久化)、总结、RAG 等实现方式。长文本处理中的 KV Cache 可通过缓存历史计算的 Key(K)和 Value(V)减少冗余计算,但需额外存储空间,可能导致显存占用增加,未来结合持久化 KV Cache、KV Cache 的压缩技术有望控制成本,从而打造出记忆力超越人类的智能体。
  2. 短期记忆:主要存在于模型的上下文中,由对话内容(用户输入、模型输出)和系统提示词组成。

Inworld AI 开发的角色引擎,增加了可配置的安全性、知识、记忆、叙事控制、多模态等功能,其中长期记忆方面,角色能以类似人类的记忆功能操作,从闪存和长期记忆中检索信息。

人类的思维是由自然语言或感官记忆构成的超高维时间序列,而人工智能与人类不同,人类会为事物赋予意义与价值,人工智能则更追求“更准”。强化学习是人工智能的一个重要分支,通过定义状态、动作与奖励等元素,让 AI 求解如何选择动作以获得最大的期望奖励总和。

Content generated by AI large model, please carefully verify (powered by aily)

References

AI Agent系列(二):Brain模块探究

在智能体中同样也分为长期记忆和短期记忆。长期记忆主要有长文本(持久化)、总结、RAG这三种实现方式,而短期记忆则主要存在于模型的上下文中,由对话内容(用户输入、模型输出)和系统提示词组成。图4.2.1记忆分类长文本(KV Cache):KV Cache是Transformer架构中的一个功能,它通过缓存历史计算的Key(K)和Value(V)来减少冗余计算,加速模型的推理过程。在长文本处理中,KV Cache可以显著减少重复计算,提高推理速度。它通过缓存先前计算的K和V,避免了在每一步生成中重新计算所有token的K和V。然而,KV Cache的实现并非没有挑战。它需要额外的存储空间来缓存K和V,这可能导致显存占用显著增加,尤其是在处理非常长的序列时。为了解决这一问题,研究者们提出了多种优化技术,包括MQA(Memory-Quality Attention)、GQA(Grouped Query Attention)和Page Attention等。如果未来结合持久化KV Cache、KV Cache的压缩技术,把成本可以控制在一个相对较低的水平。那么,通过记录下所有对话的历史以及AI当时的思考过程和情绪状态,我们就有可能打造出一个记忆力超越人类的智能体。这样的智能体不仅能够回忆起更多详细信息,还能在提供服务时展现出更高级别的个性化和情感连贯性。延申阅读:EFFICIENT STREAMING LANGUAGE MODELS WITH ATTENTION SINKS(https://arxiv.org/pdf/2309.17453)总结:首先是文本总结,这是一种直观且广泛使用的方法。通过将长篇聊天记录或文档简化成几句关键描述,文本总结不仅提高了信息检索的效率,还使得内容更易于理解和记忆。这种方式在商业报告、新闻摘要等多个领域都有广泛应用。

Inworld AI :可以使NPC能够自我学习和适应,具有情绪智能!

https://twitter.com/xiaohuggg/status/1687047341969440768?s=46Inworld AI是一家专注于游戏和人工智能的初创公司,他们开发了一种名为Inworld的AI角色引擎,它可以将游戏的NPC进行AI化,并可以集成到游戏当中。这个引擎超越了大语言模型,增加了可配置的安全性、知识、记忆、叙事控制、多模态等功能。它可以使NPC能够自我学习和适应,具有情绪智能!Inworld的角色引擎可以创建具有独特个性和上下文意识的角色,这些角色可以无缝地集成到实时应用中,同时内置了优化规模和性能的功能。这个引擎可以让AI非玩家角色(NPC)通过模拟人类的全方位沟通方式(包括语言、手势、表情和动作)来表达个性。为了让NPC更加人性化,他们开发了Character Brain(性格大脑)引擎这种引擎不仅仅是一个对话AI,它使AI NPC能够学习和适应,具有情绪智能的关系导航能力,具有记忆和回忆能力,并能够自主地发起目标,执行动作并遵循自己的动机。它的功能包括:1、目标和行动:使用定义的触发器、意图识别和动机来触发角色对玩家行为的反应,并在游戏中驱动交互。允许你驱动响应玩家输入的NPC行为,以一种动态和自定义的方式。2、长期记忆:角色以类似人类的记忆功能操作,从闪存和长期记忆中检索信息,创建吸引玩家回归的引人入胜的体验。2、个性:通过使用自然语言创建不同的个性。添加关于角色背景故事、动机和缺点的丰富细节,使角色生动起来。3、情绪:Inworld角色能够对与用户的互动表达情绪。情绪可以映射到动画、目标和触发器。

余欣航heaven:人类一败涂地?

丁一点头:比方说,你脑子里有“狗”这个概念,这是因为你见过几只不同的狗、听过同学们用声音描述自己家里养的狗,获取过摸狗的触觉。随后,你脑中就有了相关记忆综合得到“狗”的抽象概念。有时候,即便没有任何关于狗的感官,比如只是躺在床上闭着眼,你也会想到“狗”有关的画面或其他信息……可事实上,你脑中的各种思维也是一个由自然语言或感官记忆构成的超高维时间序列,不妨将这个时间序列记为thought。那么,这个时间序列也是感官数据通过复杂的函数运转得到的:f:(V,A,S,T,F)→thought简单地说,我们获取的所有感官信息是一个复杂的数据结构,我们的思想是一个超高维的序列数据结构。这些数据结构之间存在复杂的函数映射关系,足以表示我们从感官中获取所有信息、抽象的概念与意义,乃至全部的事物……沉默了片刻之后,我又想到了第二个问题——意义,或者说是价值。诚然,按照多模态模型与大语言模型的发展速度,恐怕人类所认识的所有事物,连同实在感官到抽象概念,很快会被人工智能超过。但是,与人工智能不同的是,人会为这些事物赋予意义与价值。通俗地说,人工智能只会追求“更准”,但是,人会追求“更好”。人不是捕捉与记录客观事物的工具,人的行为总是有目的、有意义的。丁一为我介绍了强化学习(Reinforcement Learning)的概念。强化学习是人工智能与机器学习领域中一个重要的分支。我们熟知的AlphaGo就是用强化学习技术做的。在强化学习中,我们会定义几个元素:状态(state)、动作(action)与奖励(reward),并让AI求解在各种状态下,如何选择动作,以使得自己获得最大的期望奖励总和,也可以叫做“总效用”(Utility)。

Others are asking
Monica和Openai的记忆功能是如何让大模型产生记忆的?是什么原理?
大模型的记忆功能实现方式较为复杂,不同的模型可能有所不同。 OpenAI 的模型中,大模型 LLM 扮演了“大脑”的角色,其记忆功能可能通过“Agent = LLM + 规划 + 记忆 + 工具使用”的基础架构来实现。但需要注意的是,对于 ChatGPT 这类模型,实际上其本质上并没有直接的记忆功能。它能理解之前的交流内容,是因为每次将之前的对话内容作为新的输入重新提供给模型。这种记忆功能并非由大型模型直接实现,而是通过在别处进行存储来达成。 如果对话内容过长,可能会影响模型的整体性能。解决这个问题的一个简单方法是启动另一个对话框。对于之前的数据,通常只能进行总结。
2025-03-01
词根词缀记忆法哪个背单词app有?
以下是一款具有词根词缀记忆法的背单词 app 推荐:AI 雅思单词书。 这款 app 具有以下特点: 1. 走“质”路线:不以覆盖全部考纲单词为首要目的,而是将扩充词汇量、抓住单词用法置于首位。在呈现词意的同时,展示单词的近义辨析、常用搭配以及范文例句,强化记忆曲线,让使用者真正掌握单词用法,而非单纯记忆中英文含义。 2. 以词块为最小记忆单位:不将英语拆散成单个简单单词,而是以“词块”“语块”形式呈现,避免中式思维翻译和滥用词汇,深度扩充对单词使用的认知,助力在口语和写作中的实际应用提升。 3. 派生词助力一词多记:注重单词的发散联想和近义词辨析,注重延伸词的实用性。通过对某一单词的派生词联想,借助添加或删减不同的词根词缀,实现多个相关词意单词的集中记忆。 4. 巧记法:将趣味与知识性相结合。
2025-01-07
长期记忆设计
关于长期记忆设计,主要包括基础设定和人物背景两方面。 基础设定方面,设计了一些初始属性,如人物生日和星座、MTBI 性格分型(ENFJ)、出生地、职业、聊天习惯等。 人物背景方面,使用 AI 自动扩写了大约 100 条,涵盖了三观、爱好、日常习惯、教育经历、家庭背景、工作经历、恋爱经历等内容。
2024-12-29
现在哪些ai具有记忆功能
以下是一些具有记忆功能的 AI: 1. MemGPT:通过特定指令访问外部存储系统来保存和回调信息,极大地扩展了模型的记忆能力,并增强了其上下文理解能力。 2. ChatGPT 最新版本:可以将对话中的重点内容记录在一个名为“bio”的小本子上,这种内置记忆机制使得它能够在后续对话中利用之前的交流内容来提供更加个性化和相关性更强的回答。 3. OpenAI 的 GPT4:直接用 prompt 调用 bio 这个工具记录需要记忆的内容,每次新的对话开始时,在 prompt 的最后直接加上所有之前的记录的内容。 延伸阅读:MemGPT:Towards LLMs as Operating Systems
2024-12-17
有没有什么辅助初中生学习整理知识点,并能记录错误,反复记忆的AI
目前市面上有一些可以辅助初中生学习整理知识点,并能记录错误、反复记忆的 AI 工具。例如一些智能学习类的 APP,它们可以根据学生的学习情况和错题记录,生成个性化的学习计划和复习资料。但具体的选择还需要根据学生的学科需求、学习习惯等因素来决定。
2024-12-07
(defun 生成记忆卡片 (单词) "生成单词记忆卡片的主函数" (let* ((词根 (分解词根 单词)) (联想 (mapcar #'词根联想 词根)) (故事 (创造生动故事 联想)) (视觉 (设计SVG卡片 单词 词根 故事))) (输出卡片 单词 词根 故事 视觉))) (defun 设计SVG卡片 (单词 词根 故事) "创建SVG记忆卡片" (design_rule "合理使用负空间,整体排版要有呼
以下是关于生成记忆卡片和 SVG 卡片的相关信息: 卡片类的应用被定义为词生卡片,如李继刚的《汉语新解》、一泽的《名片设计》、云中江树的《AI 简历》等,都是通过给大模型优化过的 Prompt,让其生成 HTML 代码或 SVG 代码,再通过浏览器渲染效果。 把提示词丢给 Claude ,如在 Poe 平台上的 Claude 模型,大概率会直接输出 SVG 代码,但对于子步骤是否执行等情况难以知晓。Andrej Karpathy 认为,模型需要 tokens 来思考,如果大语言模型未将思考过程外化,则几乎等于没思考。 甲木介绍了让 Claude 生成古诗词卡片的方法,流程包括输入 Prompt 、用户输入主题和风格,AI 输出最终结果。获取提示词已开源,创作过程主要是根据给定主题和方向生成匹配的中国古诗词,创建设计感强烈、富有中国传统美学的 SVG 卡片展示诗词,并提供相关信息,还支持根据用户提供的主题和方向生成对应语境的 prompt 并配图生成 SVGCard 。但对于“逼格高”的看法因人而异,可将选择权交给 AI 。
2024-11-28
最近6个月的ai技术和趋势
在过去 6 个月中,AI 技术和趋势呈现出以下特点: 模型方面:DeepSeek 开源 R1 模型,将大模型行业推进到推理时代,引发了深刻影响。Scaling Law 再次“续命”,目标指向 AGI。 图像方面:整体朝着更快、更便宜的方向发展,AI 图像生成已成为常用生产力工具,资本市场看好相关赛道。 视频方面:底层架构无大变化,公司逐渐分化为面向 C 端的好玩快速的视频模板方向和面向 B 端的高质量高可控性的视频创作方向。 音频方面:跨越了真假难辨的临界点,成为继图像领域后被资本看好的赛道。 3D 方面:暂时停留在文字/图片生成 3D 模型阶段,世界模型刚起步。 应用方面:AI 编程领域快速迭代发展,从半自动向全自动迈进;Computer Agent 缓慢发展,OpenAI 的 Operator 工具效果不佳;DeepSearch 作为调研 Agent 存在模型幻觉等问题,实际使用需谨慎。 新闻方面:中美欧 2025 年将加大对 AI 基础建设和科学研究的投入,越来越多厂商接入 R1 并拥抱开源。
2025-03-31
ai生成海报
以下是关于 AI 生成海报的相关信息: 有摊位在 10 天前开发的 AI 除了提供配方,还会自动生成一张海报,实现私人订制,比如鸡尾酒相关的海报。 即梦提供了女神节海报教程,操作简单,只需 3 步:打开即梦 AI 选择“图片生成”功能,选择模型输入提示词,点击生成即可。同时还给出了几个女神节海报设计的案例及提示词。 一些设计海报的 AI 产品包括:Canva(可画),网址为 https://www.canva.cn/ ,是受欢迎的在线设计工具,提供大量模板和设计元素,AI 功能可帮助选择颜色搭配和字体样式;稿定设计,网址为 https://www.gaoding.com/ ,其智能设计工具采用先进人工智能技术,自动分析和生成设计方案;VistaCreate,网址为 https://create.vista.com/ ,是简单易用的设计平台,提供大量设计模板和元素,用户可使用 AI 工具创建个性化海报,智能建议功能可帮助快速找到合适设计元素;Microsoft Designer,网址为 https://designer.microsoft.com/ ,通过简单拖放界面可快速创建演示文稿、社交媒体帖子等视觉内容,还集成丰富模板库和自动图像编辑功能。 请注意,以上部分内容由 AI 大模型生成,请仔细甄别。
2025-03-31
我想找能生海报的ai
以下是一些能生成海报的 AI 产品: 1. Canva(可画):https://www.canva.cn/ 这是一个非常受欢迎的在线设计工具,提供大量模板和设计元素,用户通过简单拖放操作即可创建海报,其 AI 功能可帮助选择合适颜色搭配和字体样式。 2. 稿定设计:https://www.gaoding.com/ 稿定智能设计工具采用先进人工智能技术,自动分析和生成设计方案,稍作调整即可完成完美设计。 3. VistaCreate:https://create.vista.com/ 这是一个简单易用的设计平台,提供大量设计模板和元素,用户可使用 AI 工具创建个性化海报,其智能建议功能可帮助快速找到合适设计元素。 4. Microsoft Designer:https://designer.microsoft.com/ 通过简单拖放界面,用户可快速创建演示文稿、社交媒体帖子等视觉内容,还集成丰富模板库和自动图像编辑功能,如智能布局和文字优化,大大简化设计流程。 另外,关于如何用 AI 快速做一张满意的海报,您可以这样操作:首先准备一张真实照片作为样图,然后在无界 AI 找到图生图功能,别忘了图生图也要加关键词。如果要改变画面内容(比如父亲头发颜色),“二次元强度”改为 70%。左图为反向示例:啥也没写,所以 daddy 的发型被识别成了卤蛋。右图为正向示例:只添加了简单的人物关键词,父亲和女儿。可根据出图效果,进一步修改或增加提示词作为约束。例如,父亲的白发难以识别,就在人物关键词的基础上,增添“父亲一头白发”等修饰词。 需要注意的是,以上内容由 AI 大模型生成,请仔细甄别。
2025-03-31
AI在非标自动化机构设计上有哪些应用
AI 在非标自动化机构设计上的应用包括以下方面: 1. 智能体应用: 决策智能体设计,使用语言模型遍历预定义的决策树。 轨道智能体,为智能体配备更高层次的目标,限制解决空间,要求遵循标准作业程序并使用预先设定的“工具”库。 通用人工智能体,完全依赖语言模型的推理能力进行所有的计划、反思和纠正。 2. AI 绘画应用: 快速草图,帮助设计师快速创建草图和概念图,便于探索和调整设计方案。 自动化创意设计,快速创建各种设计方案,加快设计过程和减少犯错。 自动化颜色匹配,自动匹配色彩,使设计作品更协调美观。 自动化插图绘制,帮助设计师自动化绘制插图,如手绘、卡通风格插图等。 3. 计算机视觉工具库应用: Roboflow 的开源计算机视觉工具库 Supervision 新增了高级视频分析功能,其开发的自动计数工具能识别物体、追踪姿态并进行动作计数。该工具库是全方位的计算机视觉平台,支持多种注释和图像格式,提供过滤、标签、分割、预处理和增强图像数据的功能,还集成了 OpenAI、Meta AI 等的模型,并提供一系列工具来组织视觉数据、自动化标签和部署基础模型。
2025-03-31
AI在非标机构设计上有哪些应用
AI 在非标机构设计上有以下应用: 1. 品牌超级符号映射:根据品牌符号的模型训练和结构控制,用户输入丰富关键词,可快速完成准确的超级符号主视觉。例如双 11 AI 创作赢红包、双 11 联合传播猫头海报&花车大巡游、超级品类日 品牌符号系列海报等案例。 2. 品牌 IP 形象 AI 生成:训练特定的天猫/淘宝/营销 IP 公仔模型,根据不同需求稳定输出定制化 IP 形象,还可形成 IP 形象素材库。比如天猫 AI 玩行动 品牌联合海报、天猫双 11 出游主题喵卡、淘宝天猫一起冲亚、天猫 U 先公仔三视图生成及应用等案例。 3. 传播&投放:例如双 11 超级发布 品牌联合海报、媒介投放开屏海报等案例。 使用 AI 进行室外设计的最佳实践包括: 1. 充分利用 AI 的创意生成能力:使用 AI 图像生成工具,输入关键词生成多种创意设计方案,获取新颖独特的设计灵感。 2. 结合 AI 的模拟和可视化功能:利用 AR/VR 等技术,将 AI 生成的设计方案在实际环境中进行模拟和可视化,帮助评估和验证设计方案。 3. 运用 AI 的分析和优化能力:使用 AI 工具对设计方案进行采光、动线、材料等方面的优化,确保符合使用者需求和体验。 4. 借助 AI 的自动化设计功能:利用 AI 自动生成符合设计规范的平面图、立面图等,提高设计效率,缩短设计周期。 5. 融合 AI 与人工设计的协作模式:人工设计师与 AI 工具形成良性互补,发挥各自优势,在创意、分析、优化等环节充分利用 AI 的能力。 在大淘宝设计部,AI 作为工具带来了诸多效果: 1. 创意多样:项目中不同创意概念的提出数量增加了 150%。 2. 执行加速:设计师在创意生成阶段的时间缩短了平均 60%。 3. 整体提效:在整体项目的设计时间减少了 18%。主要工具为 Midjourney 和 Stabel Diffusion,辅助工具有 RUNWAY 和 PS beta 等。
2025-03-31
有降agi率的ai软件吗
目前没有专门降低 AGI 率的 AI 软件。AGI(通用人工智能)的发展仍处于不断探索和进步的阶段,通常软件的目的是提升 AI 的性能和能力,而非降低相关指标。
2025-03-31
罗列具体的AI模型产品和具体的AI技术创新点,并总结AI技术的发展趋势,并说明这些发展趋势为用户的交互体验带来了什么样的改变?按照时间线将以上内容梳理出来
以下是按照您的需求梳理的内容: 时间线 早期: 从图灵测试、早期的图灵机器人和 ELISA 开始,到 IBM 的语音控制打印机、完全由人工智能创作的小说、微软的同声传译系统。 近年来: OpenAI 发布 ChatGPT 模型,引发用户习惯从简单触控操作转向更复杂的长文本输入,未来可能延伸至长语音交互。 大模型创新方面,架构优化加速涌现,融合迭代成为趋势。Scaling Law 泛化,推理能力成为关键,倒逼计算和数据变革。AGI 探索中,视频生成点燃世界模型,空间智能统一虚拟和现实。 在应用方面,AI 在文科白领的个人助理、呼叫中心、文本处理和教育等领域表现出色,能完成 80%到 90%的工作;对于工科白领,特别是程序员,能简化代码检索和调整;在蓝领领域,自动驾驶取得显著进展。但在复杂任务方面仍有改进空间。 第一轮洗牌结束,聚焦 20 赛道 5 大场景,多领域竞速中运营大于技术,AI 助手成为竞争重点。AI+X 赋能类产品发展迅速,原生 AI 爆款难求。多模态上马,Agent 席卷一切,高度个性化呼之欲出。 人工智能发展经历了萌芽、积累沉淀到如今大模型和多模态模型百花齐放的阶段。大模型由数据、算法、算力构成,算法有技术架构的迭代,如英伟达的显卡辅助模型训练,数据质量对生成理想的大模型至关重要。 未来: 李沐预测技术发展可能催生出革命性的应用形态,但 AI 离真正变革世界还有一段距离。 预计 AI 在蓝领工作的初步应用至少需要 5 年时间。 AI 技术创新点: 大模型创新:架构优化加速涌现,融合迭代大势所趋。 Scaling Law 泛化:推理能力成皇冠明珠,倒逼计算和数据变革。 AGI 探索:视频生成点燃世界模型,空间智能统⼀虚拟和现实。 AI 技术的发展趋势: 模型架构不断优化和融合。 更加注重推理能力的提升。 探索 AGI 领域,实现虚拟和现实的统一。 应用格局不断洗牌,聚焦特定赛道和场景。 多模态和 Agent 技术的广泛应用。 对用户交互体验的改变: 用户习惯从简单触控操作转向更复杂的长文本输入,未来可能延伸至长语音交互。 AI 应用为用户提供辅助,在多个领域帮助完成任务。
2025-03-31
AI技术发展时间线,罗列具体的AI模型产品和具体的AI技术创新点,并总结AI技术的发展趋势,并说明这些发展趋势为用户的交互体验带来了什么样的改变?
以下是关于 AI 技术发展的相关内容: AI 技术发展时间线: 从图灵测试、早期的图灵机器人和 ELISA,到 IBM 的语音控制打印机、完全由人工智能创作的小说、微软的同声传译系统,再到 OpenAI 发布 ChatGPT 模型,经历了萌芽、积累沉淀到如今大模型和多模态模型百花齐放的阶段。 具体的 AI 模型产品: ChatGPT 改变了用户习惯,从简单触控操作转向更复杂的长文本输入,未来可能延伸至长语音交互。 具体的 AI 技术创新点: 大模型创新方面,架构优化加速涌现,融合迭代成为趋势。 Scaling Law 泛化,推理能力成为皇冠明珠,倒逼计算和数据变革。 AGI 探索中,视频生成点燃世界模型,空间智能统一虚拟和现实。 AI 技术的发展趋势: 大模型创新:架构优化加速涌现,融合迭代大势所趋。 应用格局:第一轮洗牌结束,聚焦 20 赛道 5 大场景。 应用竞争:多领域竞速运营大于技术,AI 助手兵家必争。 应用增长:AI+X 赋能类产品大干快上,原生 AI 爆款难求。 产品趋势:多模态上马,Agent 席卷一切,高度个性化呼之欲出。 智变千行百业:左手变革生产力,右手重塑行业生态。 行业渗透率:数据基础决定初速度,用户需求成为加速度。 创投:投融资马太效应明显,国家队出手频率提升。 对用户交互体验的改变: ChatGPT 使用户从简单触控操作转向更复杂的长文本输入,未来可能延伸至长语音交互。 在文科白领方面,AI 能完成 80%到 90%的工作,如个人助理、呼叫中心、文本处理和教育等领域。 对于工科白领,特别是程序员,AI 能简化代码检索和调整。 在蓝领领域,AI 在自动驾驶方面取得显著进展。
2025-03-31
3d模型
以下是关于 3D 模型生成的相关信息: Tripo AI: 文生 3D 模型: 在「Create」界面底部输入框输入提示词(不支持中文),不会写提示词可点击输入框左侧的</>按钮随机生成并自动填入。 填写好提示词后,点击右侧的「Create」生成 3D 模型,每次会生成 4 个基础模型,不满意可点击最下方白色的「Retry」按钮重新生成。 若有满意模型,点击单个模型下方黄色的「Refine」精修,在「My Models」中可查看精修进度,一般 5 分钟左右完成。 图生 3D 模型: 点击输入框右侧的图标上传图片生成 3D 模型,一次生成一个基础模型,支持Retry 重生成和 Refine 精修。 Rodin Gen 1: 输入文本后文生图,不满意可重复生成图片,图片满意后点击GENERATING 生成 3D。 很快获得一个快速生成的粗模,右上可选择是否对称、是锋利边缘还是光滑边缘、是否简单几何模式。 选择后查看模型是否满意,不满意可 redo,满意后选择 confirm 进行下一步,可先选择产出的面数(开始扣积分)。 下一步生成材质,可选材质的复杂度以及参考图片的影响,生成后在左边查看,满意点击 confirm。 左侧预览区可以选择多种形式查看,模型基本完成后可选择对应的格式规格下载,压缩包里会有 obj 格式和 PBR 材质,也可以发布到 sketchfab。 工具汇总: 从文本生成 3D: MakeACharacter:一键生成 3D 数字人,可自定义面部特征,生成逼真 3D 角色,基于真实人类扫描数据,使用 Unreal Engine 渲染,支持中英文提示,兼容多个行业应用。链接:https://x.com/xiaohuggg/status/1743986486780076279?s=20 Rodin Gen1:拥有 1.5B 参数,可实现 3Dto3D 生成,生成 3D 模型及物理基础渲染材质,支持 3D LoRA 技术,类似于 Stable Diffusion。链接:https://x.com/xiaohuggg/status/1743638052097184102?s=20 Skybox AI 0.9 版本更新:可以从文本提示或草图生成 360 度 3D 世界,使用 NeRF 技术,增强图像的空间深度和真实感,提供不同分辨率的 3D 网格下载。链接:https://x.com/xiaohuggg/status/1739926702158225859?s=20 扫描物体生成 3D 模型:使用 APP 扫描物体,完成 3D 全貌捕获,创建 AR QR 码,展示物体于任何地点,苹果新品官网展示中应用此技术。链接:https://x.com/xiaohuggg/status/1739259052448944139?s=20
2025-03-31
本地部署大模型硬件配置
本地部署大模型的硬件配置如下: 生成文字大模型: 最低配置:8G RAM + 4G VRAM 建议配置:16G RAM + 8G VRAM 理想配置:32G RAM + 24G VRAM(如果要跑 GPT3.5 差不多性能的大模型) 生成图片大模型(比如跑 SD): 最低配置:16G RAM + 4G VRAM 建议配置:32G RAM + 12G VRAM 生成音频大模型: 最低配置:8G VRAM 建议配置:24G VRAM 需要注意的是,最低配置可能运行速度非常慢。对于 SDXL 大模型的本地部署,其分为两个部分,base + refiner 是必须下载的,还有一个配套的 VAE 模型用于调节图片效果和色彩。要在 webUI 中使用 SDXL 的大模型,需在秋叶启动器中将 webUI 的版本升级到 1.5 以上,然后将模型放入对应的文件夹中。对于通义千问的 Qwen2.5 1M 模型的本地部署,使用以下命令启动服务时要根据硬件配置进行设置,如设置 GPU 数量、最大输入序列长度、Chunked Prefill 的块大小、限制并发处理的序列数量等。如果遇到问题,可参考相关的 Troubleshooting 内容。与模型交互可以使用 Curl 或 Python 等方法,对于更高级的使用方式,可以探索如 Qwen Agent 之类的框架。
2025-03-31
如何部署本地大模型
以下是本地部署大模型的一般步骤: 1. 部署大语言模型: 下载并安装 Ollama:根据您的电脑系统,从 https://ollama.com/download 下载。下载完成后,双击打开,点击“Install”。安装完成后,将 http://127.0.0.1:11434/ 复制进浏览器中,若出现相关字样则表示安装完成。 下载 qwen2:0.5b 模型(若设备充足可下载更大模型): Windows 电脑:点击 win+R,输入 cmd 点击回车。 Mac 电脑:按下 Command(⌘)+Space 键打开 Spotlight 搜索,输入“Terminal”或“终端”,然后从搜索结果中选择“终端”应用程序。 复制相关命令行并粘贴回车,等待自动下载完成。 2. 部署 SDXL 大模型: SDXL 的大模型分为 base+refiner(必须下载)和配套的 VAE 模型。 关注公众号【白马与少年】,回复【SDXL】获取下载链接。 在秋叶启动器中将 webUI 的版本升级到 1.5 以上。 将模型放入对应的文件夹:base 和 refiner 放在“……\\sdwebuiakiv4.2\\models\\Stablediffusion”路径下;vae 放在“……\\sdwebuiakiv4.2\\models\\VAE”路径下。 3. ComfyUI ollama 本地大模型部署: 先下载 ollama 安装,安装完成后可在电脑桌面右下角或隐藏图标里找到。 下载对应的模型,选择模型并复制对应的命令。 打开命令行界面,输入对应的模型获取命令,等待下载完成。 设置目录,下载的模型会保存到 D:\\ollama\\blobs。 进行 docker 安装,安装会下载一些文件,安装后更改目录,不要放在 C 盘。 进行 Open webui 安装,输入相关命令,安装成功后回到 docker,点击会自动打开网页,第一次使用需注册账号,选择下载好的模型即可开始使用。 4. 错误解决:端口占用问题,在 Windows 上可能出现,运行下面两条命令可以解决。 5. 相关链接: comfyuiollama:https://github.com/stavsap/comfyuiollama?tab=readmeovfile Ollama:https://ollama.com/ docker:https://www.docker.com/ Open webui:https://openwebui.com/
2025-03-31
大语言模型能力排行榜
以下是一些大语言模型能力排行榜的相关信息: Open LLM Leaderboard: 地址: 简介:由HuggingFace组织的一个LLM评测榜单,目前已评估了较多主流的开源LLM模型。评估主要包括AI2 Reasoning Challenge、HellaSwag、MMLU、TruthfulQA四个数据集上的表现,主要以英文为主。 chinesellmbenchmark: 地址: 简介:中文大模型能力评测榜单,覆盖百度文心一言、chatgpt、阿里通义千问、讯飞星火、belle/chatglm6b等开源大模型,多维度能力评测。不仅提供能力评分排行榜,也提供所有模型的原始输出结果。 聊天机器人竞技场:由伯克利的一个团队管理,根据ELO评级对不同的语言模型进行排名,计算ELO的方式与国际象棋中的计算方式非常相似。 智源评测:豆包模型在其中表现出色,荣获大语言模型第一,视觉理解第二、文生图第二、文生视频第二,在匿名投票竞技场中排名第二,仅次于OpenAI。 地址:
2025-03-31
自然语言转换为sql
以下是关于自然语言转换为 SQL 的相关信息: DuckDBNSQL7B 模型能够将自然语言转换成 SQL 代码,使非专业用户能轻松与数据库交互,它基于大量真实和合成的 DuckDB SQL 查询训练。相关链接:https://github.com/NumbersStationAI/DuckDBNSQL 、https://x.com/xiaohuggg/status/1751081213459415164?s=20 Claude 官方提示词中有将日常语言变成 SQL 查询语句的相关内容。 以下是一些推荐的 text2sql 相关的 AI 工具及其链接: Text2SQL:将英文转换为 SQL 查询。链接:https://toolske.com/text2sql/?ref=theresanaiforthat ai2sql:高效且无错误的 SQL 构建器。链接:https://www.ai2sql.io/ EverSQL:从 SQL 查询翻译英文文本。链接:https://www.eversql.com/sqltotext/ SupaSQL:从 NLP 生成 SQL 查询。链接:https://supasql.com/ SQLgenius:使用自然语言的 SQL 查询生成器。链接:https://sqlgenius.app/ SQL Chat:与数据库进行自然语言聊天的 SQL 客户端。链接:https://www.sqlchat.ai/ SQL Ease:从自然语言输入生成 SQL 查询。链接:https://sqlease.buildnship.in/ Talktotables:翻译和查询数据库。链接:https://talktotables.com/ 此外,还有几个知名的 text2sql 项目,如 SQLNet(使用深度学习方法解决 text2sql 任务的项目)、Seq2SQL(将自然语言转换为 SQL 查询的序列到序列模型)、Spider(一个大规模的 text2sql 数据集及其相关的挑战)
2025-03-31
flowith根据自然语言构建一个直接使用的工作流吗,如何向flowith提出要求
Flowith 可以根据自然语言构建工作流。即使没有专业编程技能,只要能用清晰的自然语言描述出想要的各个 Agents 具备的行为和功能,就可以快速制作多 Agents 应用或创建代理式工作流。 使用工作流的步骤如下: 1. 配置工作流: 在 Code 节点内使用 IDE 工具,通过 AI 自动生成代码或编写自定义代码逻辑,来处理输入参数并返回响应结果。 该节点支持 JavaScript、Python 运行时,需注意不同运行时的特定事项。 可在 IDE 底部单击尝试 AI,并输入自然语言设定代码逻辑,也可选中代码片段通过快捷键唤起 AI 并输入自然语言让其修改代码。 2. 通过工作流数据库节点操作数据表: 在工作流中添加数据库节点对数据表进行操作,可通过 NL2SQL 方式和代码方式进行调用,支持完整读写模式。 参考以下操作添加并配置工作流节点: 单击页面顶部的工作流页签,然后单击创建工作流。 输入工作流名称和使用描述,然后单击确认。 在基础节点页签下,将数据库节点拖入到工作流配置画布区域。 根据相关信息配置数据库节点,包括输入添加 SQL 执行中需要的参数,输入要执行的 SQL 语句,可单击自动生成使用大模型生成 SQL。 需注意不支持 Select语法、多表 Join 操作,最多返回 100 行数据。在配置数据库节点前,要确保已经搭建了一个 Bot,并在这个 Bot 中创建好了数据表。
2025-03-26
好用的大语言模型
目前好用的大语言模型有以下几种: 1. OpenAI 的 GPT4:是最先进和广泛使用的大型语言模型之一,在多种任务上表现卓越,包括文本生成、理解、翻译以及各种专业和创意写作任务。 2. Anthropic 公司的 Claude 3:在特定领域和任务上表现出色。 3. 谷歌的 Gemini。 4. 百度的文心一言。 5. 阿里巴巴的通义大模型:通义千问 2.0 在代码、上下文对话基础能力上排名国内第一,各项能力较为均衡,位于国内大模型第一梯队。适用于金融、医疗、汽车等垂直专业场景,以及代码生成与纠错、实时搜索信息、通用工具调用、办公等场景。 6. OPPO 的 AndesGPT:具有对话增强、个性专属和端云协同三大技术特征,已接入 OPPO 智能助理新小布,可用于用机助手、内容创作、超级问答、专属 AI、日程管理等全新能力,聚焦在移动设备端的应用。 7. 百川智能的 Baichuan213BChat:在逻辑推理、知识百科、生成与创作、上下文对话等基础能力上排名 200 亿参数量级国内模型第一,可应用场景广泛且可以私有化部署。 如果想了解国内的大模型效果,可以参考第三方基准评测报告: 。请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-03-26
国内主流的大语言模型公司有哪几家
国内主流的大语言模型公司主要有以下几家: 1. 百度:其文心一言大语言模型可用以文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成等。 2. 阿里巴巴:拥有通义大模型。 3. 北京智源人工智能研究院:推出了“悟道・天鹰”,是首个具备中英文双语知识、支持商用许可协议、国内数据合规需求的开源语言大模型。
2025-03-20
国内的大语言模型清单
以下是一些国内的大语言模型: 1. 文心一言:可用于文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成等。 2. 讯飞星火:通用模型,处理自然语言。 3. “悟道・天鹰”(北京智源人工智能研究院):首个具备中英文双语知识、支持商用许可协议、国内数据合规需求的开源语言大模型。 此外,如果想了解国内大模型的效果,可以参考第三方基准评测报告:
2025-03-20