Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

LLM通过已知的“世界知识”进行训练,那LLM是否能够为人类产生新的“世界知识”?

Answer

LLM (大型语言模型) 确实能够基于已有的"世界知识"产生一些新的知识和见解,但这种新知识的创造过程更多是组合、推理和外推现有知识,而非从无到有地创造全新的知识。我们可以从以下几个方面来解释:

  1. 知识组合和关联 LLM 擅长将已有的知识片段进行组合和建立新的联系,从而产生看似新颖的见解。例如结合"物理学"和"信息论"的知识,推导出"比特"在物理系统中的作用等。

  2. 知识推理和外推 基于已有的知识框架,LLM 可以进行逻辑推理并对已知结论作出外推和发散,得到一些新的、未曾见过的结论。例如利用量子理论推导出新的粒子存在可能性。

  3. 模式发现 LLM 通过学习大量数据,能够发现一些新的数据模式和规律性,为人类发现新知识提供线索和启发。例如在医疗数据中发现一些疾病新的症状模式等。

  4. 知识重组和解构 LLM 可以对知识进行解构和重新组织,从而产生一些新的表述方式和见解角度,虽然本质知识未发生变化。

  5. 模拟思维实验 利用 LLM 的计算能力,我们可以模拟一些在现实中无法开展的思维实验,探索一些未知的领域和前沿,获得新的认知。

总的来说,LLM 在生成新知识方面的能力是有限的,还难以完全取代人类的创造力和想象力。但它可以通过组合、关联、外推等方式,为人类发现新知识提供有价值的辅助和支持作用。未来 LLM 将如何推动人类知识的发展仍有待进一步观察。

Content generated by AI large model, please carefully verify (powered by aily)

References

Others are asking
我怎样用低代码工具去构建我的AI智能体?LLM应用?
以下是关于如何用低代码工具构建 AI 智能体和 LLM 应用的一些建议: 在构建基于 LLM 的应用时,Anthropic 建议先寻找最简单的解决方案,只在必要时增加复杂度。智能系统通常会以延迟和成本为代价来换取更好的任务表现,开发者需要考虑这种权衡是否合理。当需要更复杂的解决方案时,工作流适合需要可预测性和一致性的明确任务,而智能体则更适合需要灵活性和模型驱动决策的大规模场景。不过,对于许多应用来说,优化单个 LLM 调用(配合检索和上下文示例)通常就足够了。 目前有许多框架可以简化智能系统的实现,例如: 1. LangChain 的 LangGraph。 2. 亚马逊 Bedrock 的 AI Agent 框架。 3. Rivet(一个拖放式 GUI 的 LLM 工作流构建器)。 4. Vellum(另一个用于构建和测试复杂工作流的 GUI 工具)。 这些框架通过简化标准的底层任务(如调用 LLM、定义和解析工具、链接调用等)使入门变得容易,但它们往往会创建额外的抽象层,可能会使底层提示词和响应变得难以调试,也可能诱使开发者在简单设置就足够的情况下增加不必要的复杂性。建议开发者先直接使用 LLM API,许多模式只需要几行代码就能实现。如果确实要使用框架,请确保理解底层代码。 此外,还有以下相关工具和应用: 1. VectorShift:能在几分钟内构建和部署生成式人工智能应用程序,利用大型语言模型(例如 ChatGPT)构建聊天机器人、文档搜索引擎和文档创建工作流程,无需编码。 2. Unriddle:帮助更快阅读、写作和学习的工具,能简化复杂的主题,找到信息,提问并立即获得答案。 工具使用或函数调用通常被视为从 RAG 到主动行为的第一个半步,为现代人工智能栈增加了一个新的层。一些流行的原语如网页浏览(Browserbase、Tiny Fish)、代码解释(E2B)和授权+认证(Anon)已经出现,它们使 LLM 能够导航网络、与外部软件(如 CRM、ERP)交互并运行自定义代码。Omni 的计算 AI 功能体现了这种方法,它利用 LLM 直接输出适当的 Excel 函数到电子表格中,然后执行计算并自动生成复杂查询供用户使用。 详细示例请参考:https://github.com/anthropics/anthropiccookbook/tree/main/patterns/agents
2025-02-17
类似于ollama和vllm这样的LLM 框架有哪些
以下是类似于 ollama 和 vllm 的 LLM 框架: 1. Encoderonly 框架(也叫 AutoEncoder),典型代表如 BERT 等。 2. Encoderdecoder 框架,典型代表如 T5 和 GLM 等。 3. Decoderonly 框架(也叫 AutoRegressive),典型代表如 GPT 系列、LLaMa、PaLM 等。 此外,还有一些在 LLM 应用中发挥重要作用的框架,如: 1. LangChain:是当前大模型应用开发的主流框架之一,提供了一系列工具和接口,其核心在于“链”概念,包括 Model I/O、Retrieval、Chains、Agents、Memory 和 Callbacks 等组件,生态系统还包括 LangSmith、LangGraph 和 LangServe 等工具。 2. LlamaIndex:在促进 LLM 和整合上下文数据方面表现出色,抽象出许多提示链的细节,与外部 API 的接口,从向量数据库检索上下文数据,并在多个 LLM 调用中维持内存。
2025-02-17
LLM 训练推理模型有哪些
以下是一些常见的 LLM 训练推理模型: 1. FengshenbangLM: 地址: 简介:是 IDEA 研究院认知计算与自然语言研究中心主导的大模型开源体系,开源了姜子牙通用大模型 V1,是基于 LLaMa 的 130 亿参数的大规模预训练模型,具备翻译、编程、文本分类、信息抽取、摘要、文案生成、常识问答和数学计算等能力。除姜子牙系列模型之外,还开源了太乙、二郎神系列等模型。 2. BiLLa: 地址: 简介:开源了推理能力增强的中英双语 LLaMA 模型。较大提升 LLaMA 的中文理解能力,并尽可能减少对原始 LLaMA 英文能力的损伤;训练过程增加较多的任务型数据,利用 ChatGPT 生成解析,强化模型理解任务求解逻辑;全量参数更新,追求更好的生成效果。 3. Moss: 地址: 简介:支持中英双语和多种插件的开源对话语言模型,MOSS 基座语言模型在约七千亿中英文以及代码单词上预训练得到,后续经过对话指令微调、插件增强学习和人类偏好训练具备多轮对话能力及使用多种插件的能力。 此外,Andrej Karpathy 的相关介绍中提到了 LLM 训练的一些情况,如训练过程涉及大约 10TB 的文本,通常来源于互联网的抓取,需要大量的互联网资源和一个 GPU 集群,费用大约 200 万美元。Karpathy 的视频还详细介绍了 LLM 训练的全部过程,包括预训练、有监督微调和强化学习等。
2025-02-16
大型语言模型(LLM)基于Transformer架构的模型的优缺点是什么,有什么局限性
大型语言模型(LLM)基于 Transformer 架构的模型具有以下优点: 1. 在大量数据集上进行预训练,展现出卓越的语言处理能力,能预测接下来的 Token。 然而,也存在一些缺点和局限性: 1. 瞬态状态:天生缺乏持久的记忆或状态,需要额外的软件或系统来保留和管理上下文。 2. 概率性质:随机性导致响应的不确定性,对相同提示词可能产生不同回答。 3. 过时信息:依赖预训练数据,只能访问历史知识,无法获取实时更新。 4. 内容制造:可能生成看似合理但不准确的信息,即“幻觉”。 5. 资源密集:巨大规模意味着显著的计算和财务成本,影响可扩展性和可访问性。 6. 领域特定性:本质上通用,但通常需要特定领域数据才能在专业任务中表现出色。 7. 缺乏创造性:像一个高性能的知识检索工具,超出检索范围时表现差,甚至出现“幻觉”。面对复杂逻辑推导和新的知识推演能力不足,无法基于新的语料推演出新知识。 8. 对于特定领域或高度专业化的查询,容易产生错误信息或“幻觉”,特别是当查询超出训练数据或需要最新信息时。
2025-02-13
anythingllm安装包
以下是关于 AnythingLLM 安装包的相关信息: 安装地址:https://useanything.com/download 。 安装完成后会进入配置页面,主要分为三步: 第一步:选择大模型。 第二步:选择文本嵌入模型。 第三步:选择向量数据库。 在 AnythingLLM 中有 Workspace 的概念,可以创建自己独有的 Workspace 与其他项目数据进行隔离。配置流程包括: 首先创建一个工作空间。 上传文档并且在工作空间中进行文本嵌入。 选择对话模式,提供了 Chat 模式和 Query 模式。Chat 模式大模型会根据训练数据和上传的文档数据综合给出答案,Query 模式大模型仅依靠文档中的数据给出答案。 完成上述配置后,即可与大模型进行对话。 此外,在 GitHubDaily 开源项目列表 2023 年复盘的 AIGC 部分中, 是一个可打造成企业内部知识库的私人专属 GPT,能将任何文档、资源或内容转换为大语言模型(LLM)知识库,在对话中引用其中内容。
2025-02-06
AnythingLLM 怎么用,好用吗
AnythingLLM 是一款功能强大的软件,具有以下特点和使用方法: 功能:包含了所有 Open WebUI 的能力,并且额外支持选择文本嵌入模型和向量数据库。 安装和配置:安装地址为 https://useanything.com/download 。安装完成后进入配置页面,主要分为三步:选择大模型、选择文本嵌入模型、选择向量数据库。 构建本地知识库:其中有 Workspace 的概念,可以创建自己独有的 Workspace 与其他项目数据隔离。首先创建工作空间,然后上传文档并进行文本嵌入,接着选择对话模式,提供了 Chat 模式(大模型根据训练数据和上传文档数据综合给出答案)和 Query 模式(大模型仅依靠文档中的数据给出答案),最后进行测试对话。 相关评价:被认为是一个可打造成企业内部知识库的私人专属 GPT,能将任何文档、资源或内容转换为大语言模型(LLM)知识库,支持多用户使用,可设权限,兼容多种 LLM 和数据库。 总的来说,AnythingLLM 的使用效果因人而异,需要您亲自实践和体验来判断其是否好用。
2025-02-04
对作为知识库的数据进行预处理,用哪个软件比较哈
以下是一些可用于对作为知识库的数据进行预处理的软件和方法: 1. LangchainchatGLM:对于知识库内容的组织要求较高,无需微调训练,适合有结构、界限分明的数据。可使用langchain库比对字典的关键词keys部分,找到相似度最高的相关keys对应的内容文本,送进提示词模板(prompt_template),然后送到LLM进行后处理。 2. 在检索原理方面,可通过嵌入模型(如Word2Vec、GloVe、BERT)将问题文本转化为向量,用于后续检索。例如,在商业化问答场景中,会对接收的问题进行预处理和向量化。 3. 在创建知识库并上传表格数据时,可通过API获取在线API的JSON数据上传,或手动自定义创建数据表结构和数据。需注意指定语义匹配字段,在响应用户查询时,将用户查询内容与该字段内容进行比较,根据相似度进行匹配。
2025-02-17
我手里有一个文件知识库,想锻炼一个ai,按照这个文件知识库的习惯帮我改写新的文件
以下是为您整理的内容: 南瓜博士:平生第一次写小说获奖,是 AI 帮我的! 三、丰富细化 接下来要让 AI 一段一段进行细节描写。为确保文章前后一致,先让 AI 帮助写故事概要和角色背景介绍,并按自己的审美略做修改。使用了一个重要技巧,让 AI 以表格形式输出细节描述,这样有三个好处: 1. 打破 AI 原本的叙事习惯,避免出现陈词滥调。 2. 按编号做局部调整容易,指哪改哪,其他内容能稳定不变。 3. 确保内容都是具体细节,避免整段输出时因缩减而丢光细节只剩笼统介绍。 四、串联成文 把上一步生成的五个表格依次复制粘贴,AI 就照着写文章了,偶尔需要帮忙给点建议。 五、失败的局部修改 小说大赛要求最后的作品必须是 AI 直接吐出来的,不能有任何改动且不能超过 2000 字,而自己的小说 2300+字,只好让 GPT4 做修改,一开始它表现不错,但很快暴露出记性不好的缺点。还没来得及高兴,就发现它失忆得很彻底。眼看截止时间快到了,只能求助 Claude,把文章和 GPT 生成的修改意见都给它,让它生成作品,匆匆截图提交。没想到,Claude 把关键情节改没了,如马克偷偷看艾拉、无名猫受伤的原因等。 熊猫 Jay:AI 编程 Cursor 来了,你没理由说不会写代码了 四、初体验:Cursor 的安装和使用 三、新增/修改代码、文字 选中代码,使用 Command+K 打开窗口,并输入修改要求。不选中代码打开窗口,可要求 AI 实现新功能,比如让 AI 增加一个广告位。当然,除了代码,也可选中文字进行修改,如改写、翻译等。 四、自动补全代码、注释、文字 输入代码或注释,Cursor 会自动补全代码,按 Tab 生效。除补全代码外,还能补全文字,可尝试。 五、对话窗口 Mac 使用 Shift+Command+L 打开聊天窗口,输入优化页面的需求,AI 能提供不同方案。比如倾向于使用好看的配色方案,点击 Apply,再点击 Accept 生效。要记得保存文件,Mac 的快捷键是 Command+S。这不是成品,若要做完整功能,需不停和 Cursor 对话,在案例部分会介绍完整制作过程。 六、全局搜索 还可把它当作简易的 AI 搜索工具,让它根据现有文件夹下的内容回答问题,比如问到基于文件内容,温度值设置的误区在哪里,回答准确度很高,甚至能定位到具体文件的行。
2025-02-17
给我flux的提示词结构的知识库我以他作为知识库
以下是关于 Flux 提示词结构的相关知识: 大语言模型就像一个学过无数知识、拥有无穷智慧的人,但在工作场景中,需要通过提示词来设定其角色和专注的技能,使其成为满足需求的“员工”。知识库则相当于给“员工”发放的工作手册,提供特定的信息。 提示词可以设定 Bot 的身份及其目标和技能,例如产品问答助手、新闻播报员、翻译助理等,决定 Bot 与用户的互动方式。详情可参考。 学习提示词可以分为五个维度,从高到低依次是思维框架、方法论、语句、工具和场景。但舒适的学习顺序应反过来,先从场景切入,直接了解在不同场景下提示词的使用及效果对比;然后使用提示词工具,如 Meta Prompt、Al 角色定制等;接着学习有效的提示语句,包括经典论文中的相关语句;再学习有效的方法论,将有效语句及其背后的原理整合成稳定可控的方法;最后掌握思维框架。 此外,还可以通过插件、工作流、记忆库等功能定制 AI Bot。插件可通过 API 连接集成各种平台和服务扩展 Bot 能力,详情参考。
2025-02-16
知识库RAG方案
RAG(检索增强生成)是一种在 AI 领域中用于处理知识库的方案。 大模型的训练数据有截止日期,当需要依靠不包含在大模型训练集中的数据时,RAG 是主要方法之一。 RAG 的应用可以抽象为以下 5 个过程: 1. 文档加载:从多种不同来源加载文档,如 PDF 等非结构化数据、SQL 等结构化数据以及代码等。 2. 文本分割:把文档切分为指定大小的块,称为“文档块”或“文档片”。 3. 存储:包括将切分好的文档块进行嵌入转换成向量形式,并将向量数据存储到向量数据库。 4. 检索:通过某种检索算法找到与输入问题相似的嵌入片。 5. 输出:把问题以及检索出来的嵌入片一起提交给 LLM,LLM 会通过问题和检索出来的提示生成更合理的答案。 基于 Coze 的知识库问答是典型的 RAG 方案,其重要一环是文档切片。但 RAG 方案存在一些缺点,如跨分片总结和推理能力弱、文档有序性被打破、表格解析失败等。 相关的海外官方文档:https://www.coze.com/docs/zh_cn/knowledge.html ,国内官方文档:https://www.coze.cn/docs/guides/use_knowledge 。 在实际操作中,如使用外贸大师产品的帮助文档创建知识库时,要注意文档的分片策略会严重影响查询结果。
2025-02-16
你的知识库架构是怎样的,普通人如何迅速找到目标靶向,比如我想学ai绘画
以下是关于您想学习 AI 绘画的相关内容: 1. 知识库提到明天银海老师将详细讲解 AI agent,同时表示知识库内容丰富,您可挑选感兴趣的部分学习,比如较轻松的 AI 绘画等。 2. 强调 AI 绘画是视觉基础,还介绍了针对 AI 绘画学社做的关键词词库精选活动。 3. 讲述了 AI 绘画中的 stable diffusion 扩散模型的运作方式,是通过加噪和去噪,随机生成种子来形成最终图像,还提到生成式 AI 做高清放大可增加细节的原理。 您可以根据以上信息,逐步深入了解 AI 绘画的相关知识。
2025-02-15
知识库里面哪里有讲解AI在各行业应用现状的材料
以下是知识库中关于 AI 在各行业应用现状的相关材料: 在音乐创作方面,通过输入更高级的词汇与 AI 音乐对话能产生更好效果,有 AI 音乐的版块、挑战、分享会和教程,可通过王贝加入 AI 音乐社区。 在数字人语音合成方面,介绍了声音克隆技术,提到了微软、阿里等的相关成果,常用的是 JPT service。 在 config UI 的应用方面,能降低成本、提高效率,在图书出版、引流等方面有应用,岗位稀缺,社区有相关共学课程。 在零售电商行业,有《2024 生成式 AI 赋能零售电商行业解决方案白皮书》。 在招聘领域,牛客的《AI 面试实践手册(2024)》深入探讨了 AI 面试的应用现状、价值和未来发展,指出其在多个行业尤其在管培生、产品、IT 基础岗位和蓝领岗位中广泛应用。 在 PC 行业,腾讯广告 TMI 与 GfK 联合发布了《AI PC 行业趋势与潜力消费者洞察白皮书(2024 版)》。 在医疗领域,蛋壳研究院发布了《医疗人工智能走到新的十字路口》。 在新闻媒体领域,新华社研究院发布了《人工智能时代新闻媒体的责任与使命》。 在情感陪伴方面,头豹研究院发布了《AI 情感陪伴:缔造温情链接,拥抱智慧关怀新纪元》。
2025-02-15
最新的AI行业动态和进展有哪些,包含2025年
以下是关于最新的 AI 行业动态和进展(包含 2025 年)的内容: 2024 年: 图片超短视频的精细操控:包括表情、细致动作、视频文字匹配。 有一定操控能力的生成式短视频:风格化、动漫风最先成熟,真人稍晚。 AI 音频能力长足进展:带感情的 AI 配音基本成熟。 “全真 AI 颜值网红”出现,可以稳定输出视频,可以直播带货。 游戏 AI NPC 有里程碑式进展,出现新的游戏生产方式。 AI 男/女朋友聊天基本成熟:记忆上有明显突破,可以较好模拟人的感情,产品加入视频音频,粘性提升并开始出圈。 实时生成的内容开始在社交媒体内容、广告中出现。 AI Agent 有明确进展,办公场景“AI 助手”开始有良好使用体验。 AI 的商业模式开始有明确用例:数据合成、工程平台、模型安全等。 可穿戴全天候 AI 硬件层出不穷,虽然大多数不会成功。 中国 AI 达到或超过 GPT4 水平;美国出现 GPT5;世界上开始现“主权 AI”。 华为昇腾生态开始形成,国内推理芯片开始国产替代(训练替代要稍晚)。 AI 造成的 DeepFake、诈骗、网络攻击等开始进入公众视野,并引发担忧。 AI 立法、伦理讨论仍然大规模落后于技术进展。 2025 2027 年: AI 3D 技术、物理规则成熟:正常人无法区别 AI 生成还是实景拍摄。 全真 AI 虚拟人成熟:包含感情的 AI NPC 成熟,开放世界游戏成熟;游戏中几乎无法区别真人和 NPC。 AR/VR 技术大规模商用。 接近 AGI 的技术出现。 人与 AI 配合的工作方式成为常态,很多日常决策开始由 AI 来执行。 AI 生产的数据量超过全人类生产数据量,“真实”成为稀缺资源。 具身智能、核聚变、芯片、超导、机器人等技术有明显进展突破。 “人的模型”出现,出现“集中化 AGI”与“个人 AGI”的历史分叉。 AI 引发的社会问题开始加重,结构性失业开始出现。 AGI 对于地缘政治的影响开始显露。 此外,还有以下相关动态: 算力瓶颈不只是单纯的技术和建设问题,而是影响整个行业竞争格局的重要变量。 逐渐进入多模态灵活转换的新时代,实现文本、图像、音频、视频及其他更多模态之间的互相理解和相互转换。 人类劳动形式逐步“软件化”,复杂劳动被抽象为可调用的软件服务,劳动流程被大幅标准化和模块化,劳动能力像“即插即用”的工具一样易于获取。 AI 行业目前仍处于严重亏损的阶段,商业化进程仍有巨大提升空间。 云厂商是产业链中毋庸置疑的“链主”。 2024 年,头部 AI 应用的品类变化并不显著。创意工具(如图像和视频内容创作)依然占据最大比重。To P(面向专业用户)应用展现出强大的市场潜力,ToB(面向企业)应用发展路径相对复杂,ToC 应用面临较大的挑战。 在 AI 应用领域,Copilot 和 AI Agent 是两种主要的技术实现方式。 北美和欧洲贡献了 AI 移动应用市场三分之二的份额,众多中国 AI 公司积极出海。 2024 年 10 月的大事记包括: Gartner 发布 2025 年十大战略技术趋势。 DeepSeek 开源多模态 LLM 框架 Janus。 司南开源大模型能力评估模型 CompassJudger。 Anthropic 发布新功能 computer use,发布 Claude 3.5 Haiku,更新 Claude 3.5 Sonnet。 Stability AI 发布 Stable Diffusion 3.5。 x.AI 正式推出 API。 ComfyUI V1 官方桌面版开放内测。 华为发布纯血操作系统鸿蒙 OS NEXT。 Jina AI 推出高性能分类器 Classifier API。 OpenAI 发布图像生成模型 sCM。 Midjourney 上线外部图片编辑器。 Runway 发布动画视频功能 ActOne。 Ideogram 推出 AI 画板工具 Canvas。 Genmo 开源视频生成模型 Mochi 1。 荣耀发布操作系统 MagicOS 9.0。 美国 14 岁少年与 C.AI 聊天后离世。 新华社发文表示警惕「AI 污染」乱象。 港中文&趣丸推出 TTS 模型 MaskGCT。 科大讯飞发布讯飞星火 4.0 Turbo。 阿里通义代码模式开始内测。 Anthropic Claude 新增数据分析功能。 北京市大中小学推广 AI 学伴和 AI 导学应用。 稚晖君开源「灵犀 X1」全套资料。 OpenAI 高管 Miles Brundage 离职。
2025-02-17
最新的AI行业动态和进展有哪些
以下是最新的 AI 行业动态和进展: 1. 《2024 年度 AI 十大趋势报告》发布,其中提到大模型创新方面,架构优化加速涌现,融合迭代大势所趋;Scaling Law 泛化方面,推理能力成皇冠明珠,倒逼计算和数据变革;AGI 探索方面,视频生成点燃世界模型,空间智能统⼀虚拟和现实;AI 应用格局方面,第⼀轮洗牌结束,聚焦 20 赛道 5 大场景;AI 应用竞争方面,多领域竞速运营大于技术,AI 助手兵家必争;AI 应用增长方面,AI+X 赋能类产品大干快上,原生 AI 爆款难求;AI 产品趋势方面,多模态上马,Agent 席卷⼀切,高度个性化呼之欲出;AI 智变千行百业,左手变革生产力,右手重塑行业生态;AI 行业渗透率方面,数据基础决定初速度,用户需求成为加速度;AI 创投方面,投融资马太效应明显,国家队出手频率提升。 2. 2024 年 9 月的 AI 行业大事记: 9 月 12 日:李继刚再现神级 Prompt,玩法持续翻新;Mistral 发布首个多模态模型 Pixtral 12B。 9 月 13 日:商汤 Vimi 相机开放微博小程序;元象开源中国最大 MoE 大模型 XVERSEMoEA36B;OpenAI 发布 o1 模型。 9 月 14 日:人工智能生成合成内容标识办法(征求意见稿);Jina AI 发布 ReaderLM 和 Jina Embeddings V3。 9 月 18 日:DeepSeek 发文庆祝登上 LMSYS 榜单国产第一,几小时后 Qwen 新模型表示不服。 9 月 19 日:云栖大会;通义万相 AI 生视频上线;快手可灵 1.5 模型新增运动笔刷能力。 9 月 20 日:腾讯元器智能体对外发布;秘塔科技产品经理 JD 走红 AI 圈;阶跃跃问接入 Step2 万亿参数 MoE 语言大模型。 9 月 21 日:大模型测试基准研究组正式成立。 9 月 23 日:钉钉 365 会员上线。 9 月 24 日:讯飞星火 API 全新升级;豆包大模型全系列发布&更新。 9 月 25 日:Vidu API 正式开放,加速企业级视频创作;OpenAI 发布高级语音功能;西湖心辰开源 WestlakeOmni。 3. 2024 年,国内 AI 行业融资总金额增加,但事件数同比下降,马太效应越发明显,资本更青睐热点和高成熟度赛道。智能驾驶在各细分赛道中独占鳌头,AI+教育、AI+游戏、AI+医疗等赛道投资总额也有增长。政府积极推进 AI 原生行业发展,北京、上海、武汉等城市出台系列政策吸引人才和企业,国家队频繁投资体现政策支持。
2025-02-17
最新的AI行业动态和进展有哪些
以下是最新的 AI 行业动态和进展: 1. 《2024 年度 AI 十大趋势报告》发布,其中提到: 大模型创新方面,架构优化加速涌现,融合迭代大势所趋。 Scaling Law 泛化,推理能力成皇冠明珠,倒逼计算和数据变革。 AGI 探索中,视频生成点燃世界模型,空间智能统⼀虚拟和现实。 AI 应用格局方面,第一轮洗牌结束,聚焦 20 赛道 5 大场景。 AI 应用竞争中,多领域竞速运营大于技术,AI 助手兵家必争。 AI 应用增长方面,AI+X 赋能类产品大干快上,原生 AI 爆款难求。 AI 产品趋势为多模态上马,Agent 席卷一切,高度个性化呼之欲出。 AI 智变千行百业,左手变革生产力,右手重塑行业生态。 AI 行业渗透率方面,数据基础决定初速度,用户需求成为加速度。 AI 创投方面,投融资马太效应明显,国家队出手频率提升。 2. 2024 年 9 月的 AI 行业大事记: 9 月 12 日:李继刚再现神级 Prompt,玩法持续翻新;Mistral 发布首个多模态模型 Pixtral 12B。 9 月 13 日:商汤 Vimi 相机开放微博小程序;元象开源中国最大 MoE 大模型 XVERSEMoEA36B;OpenAI 发布 o1 模型。 9 月 14 日:人工智能生成合成内容标识办法(征求意见稿);Jina AI 发布 ReaderLM 和 Jina Embeddings V3。 9 月 18 日:DeepSeek 发文庆祝登上 LMSYS 榜单国产第一,几小时后 Qwen 新模型表示不服。 9 月 19 日:云栖大会;通义万相 AI 生视频上线;快手可灵 1.5 模型新增运动笔刷能力。 9 月 20 日:腾讯元器智能体对外发布;秘塔科技产品经理 JD 走红 AI 圈;阶跃跃问接入 Step2 万亿参数 MoE 语言大模型。 9 月 21 日:大模型测试基准研究组正式成立,国家队来了。 9 月 23 日:钉钉 365 会员上线。 9 月 24 日:讯飞星火 API 全新升级;豆包大模型全系列发布&更新。 9 月 25 日:Vidu API 正式开放,加速企业级视频创作;OpenAI 发布高级语音功能;西湖心辰开源 WestlakeOmni。 3. 从行业视角来看,2024 年国内 AI 行业融资总金额增加,但事件数同比下降,马太效应越发明显,资本更青睐热点和高成熟度赛道。智能驾驶在各细分赛道中独占鳌头,AI+教育、AI+游戏、AI+医疗等赛道投资总额也有增长。在政策方面,政府积极推进 AI 原生行业发展,北京、上海、武汉等城市出台系列政策吸引人才和企业,国家队频繁出手投资体现政策支持。
2025-02-17
配置最新的ai
以下是关于配置最新 AI 的相关内容: 1. Yaki:GPT/MJ 接入微信 检查环境 安装 Python 安装 git 克隆项目代码 安装 pip 环境 更改名称 配置文件:在 FinalShell 窗口下找到 root/chatgptonwechat/config.json 文件打开进行配置。 OpenAI API 的基础 URL(如果调用的不是官方的 key,需要更改这部分的内容):"open_ai_api_base":"https://api.gptapi.us/v1" 使用的模型版本(如果想要使用其他模型,记得需要更改这里):"model":"gpt4" 启动命令 注:扫码登录是模拟电脑登录微信号,需要保持在线才会触发,如果切换退出等,那么服务器中的微信也会掉线。 更详细内容参考:https://github.com/zhayujie/chatgptonwechat/tree/master 2. python 安装 FittenAI 编程助手 安装 python 的运行环境: 安装步骤:点击左上角的 FileSettingsPluginsMarketplace 注册:安装完成后左侧会出现 Fitten Code 插件图标,注册登录后即可开始使用 智能补全:按下 Tab 键接受所有补全建议;按下 Ctrl+→键接收单个词补全建议 AI 问答:通过点击左上角工具栏中的 Fitten Code–开始新对话打开对话窗口进行对话 自动生成代码:Fitten Code 工具栏中选择"Fitten Code生成代码",然后在输入框中输入指令即可生成代码 代码转换:Fitten Code 可以实现代码的语义级翻译,并支持多种编程语言之间的互译。选中需要进行翻译的代码段,右键选择"Fitten Code–编辑代码",然后在输入框中输入需求即可完成转换 3. 张梦飞:【知识库】FastGPT+OneAPI+COW 带有知识库的机器人完整教程 环境配置: 复制代码时注意复制全,每次只粘贴一行,然后点击一次回车。 回车后,只有最左边显示中括号时,才是上一个命令执行完毕。 1、第一步:cd/root||exit 1 2、第二步:下方两行粘贴进入,然后点击回车,等待下载完成。(如果有卡点,进行不下去,可能是服务器网络问题,去拉取时下载不全,可以复制网址,手动去下载到电脑上。然后进入文件夹,找到 root 文件夹,把下载的文件上传进去。) 2.2、再粘贴下方代码,出现下图,就代表在执行中了。 3、然后把下边这行粘贴进去,点击回车。rm f Anaconda32021.05Linuxx86_64.sh 4、继续粘贴:/root/anaconda/bin/conda create y name AI python=3.8 5、继续,一行一行依次粘贴,依次回车:echo 'source /root/anaconda/bin/activate AI' >> ~/.bashrc 6、执行完成后。刷新一下,重新进入终端,最左侧出现了(AI)的字符则配置完成。
2025-02-16
AI 在生成单元测试代码方面有什么新的进展与方向?
AI 在生成单元测试代码方面有以下新的进展与方向: 1. 基于规则的测试生成: 测试用例生成工具:如 Randoop 可基于代码路径和规则为 Java 应用程序生成测试用例,Pex 是微软开发的能为.NET 应用自动生成高覆盖率单元测试的工具。 模式识别:Clang Static Analyzer 利用静态分析技术识别代码模式和潜在缺陷来生成测试用例,Infer 是 Facebook 开发的能自动生成测试用例以帮助发现和修复潜在错误的工具。 2. 基于机器学习的测试生成: 深度学习模型:DeepTest 利用深度学习模型为自动驾驶系统生成测试用例以模拟不同驾驶场景并评估系统性能,DiffTest 基于对抗生成网络(GAN)生成测试用例来检测系统的脆弱性。 强化学习:RLTest 利用强化学习生成测试用例,通过与环境交互学习最优测试策略以提高测试效率和覆盖率,A3C 是基于强化学习通过策略梯度方法生成高质量测试用例的工具。 3. 基于自然语言处理(NLP)的测试生成: 文档驱动测试生成:Testim 是 AI 驱动的测试平台,能通过分析文档和用户故事自动生成测试用例以减少人工编写时间,Test.ai 利用 NLP 技术从需求文档中提取测试用例以确保测试覆盖业务需求。 自动化测试脚本生成:Selenium IDE 结合 NLP 技术可从自然语言描述中生成自动化测试脚本,Cucumber 使用 Gherkin 语言编写的行为驱动开发(BDD)框架能通过解析自然语言描述生成测试用例。 此外,峰瑞资本投资的 AI Coding 创业公司 Babel 专注于 AI Agent 的研发,其核心产品 Test Gru 已在美国上线,能为客户自动生成单元测试,客户侧 PR 接受率约为 70%。还有如 Cursor 等工具,可借助其生成测试代码提升代码可靠性,但使用时也需注意方法,如使用 Git 管理代码版本、对 AI 代码进行 Review 等。
2025-02-14
deepseek在世界上是什么水平
DeepSeek 在世界上具有一定的水平: 1. 华尔街分析师的反应:展示出媲美领先 AI 产品性能的模型,成本仅为一小部分,在全球主要市场的 App Store 登顶。但也有不同观点,如 Jefferies 警告其技术可能打破资本开支狂热,Citi 对其技术突破提出质疑,高盛预测其可能改变竞争格局并降低行业进入门槛。 2. 实际使用体验:在文字能力上表现突出,尤其在中文场景中符合日常写作习惯,但在专业论文总结方面稍弱。数学能力经过优化表现不错,编程能力略逊于 GPT。 3. 在文学创作方面:很火,在 Benchmark 表现出色,做数学和代码题达 O1 标准,处于国际领先。文风优秀,有哲学思考,能触动人情感,文创能力顶尖,甚至因其“发疯”在创作上更出色。但使用时需在控制和自由间平衡,旧模型在文学创作时存在一些弊端。
2025-02-11
我想知道全世界最新的AI资讯
以下是为您提供的全世界最新的 AI 资讯: 2024 年 10 月 1 日:Notion 近期进行了重构更新,增强了内置 AI 功能,采用对话式交互,用户可通过聊天与 AI 进行工作安排,并能跨页面、跨应用调用素材。但写作辅助功能在复杂文本处理上存在局限。Notion 以出色的 UX 设计和社区支持在效率软件领域领先。 推荐 6 个精准的海外 AI 信息渠道,包括 TechURLs(科技媒体汇总)、Toolify.ai(AI 产品导航和排行榜)、SimilarWeb(数据分析工具)、A16Z(硅谷知名投资机构)等,适合对 AI 感兴趣的读者和行业从业者。 12 月 25 日: AI 绘画:Recraft AI 更新了 60 种新的图像风格,用户可生成和编辑插画、海报、产品周边等,每日有免费试用点数,允许商业使用。地址:https://www.recraft.ai/ AI 公文智能体:学习强国 x 百度 AI 推出的“学习强国公文助手”在文小言 APP 正式上线,可进行文汇检索、AI 公文书写、AI 公文润色等。使用方式:下载文小言 APP,找寻学习强国公文助手。 关于最新的国内大模型排名,可能会有变化。您可以查阅相关科技新闻网站、学术论坛或关注人工智能领域的社交媒体平台获取最新信息。在通往 AGI 之路的知识库里,会定期更新相关排名报告。但请注意内容由 AI 大模型生成,请仔细甄别。
2025-01-23
世界模型
世界模型方面的相关信息如下: 谷歌发布了世界模型 Genie,这是一个 110 亿参数的基础世界模型,能够通过单张图像提示生成可玩的交互式环境。它由潜在动作模型、视频 tokenizer 和动态模型三个部分组成。可以用未见过的图像进行提示,并与想象中的虚拟世界互动,能处理合成图像、照片甚至手绘草图,生成无穷无尽的可玩世界。Genie 学到的潜在动作可以转移到真实的人类设计的环境中,谷歌针对机器人视频训练了相关模型作为概念验证。 润米咨询创始人刘润指出,世界模型是人类理解世界的方式,比如知道一杯咖啡的重量从而预测拿起所需的力。人类做的事情越多,大脑里形成的世界模型越复杂,用于更准确地预测世界的反应。 Genie 在模型训练方面,能通过在无动作标签的视频上训练较小模型展示学习一致动作空间的能力;在模拟可变形物体方面,能够模拟衣物飘动、橡胶球变形等复杂物理行为;它不仅开启了从图像或文本生成完整交互式世界的新时代,还可能极大推动 AI 技术发展,特别是在创建自适应、多功能的 AI 方面。项目地址:
2025-01-19
如果自己一个人要完成一个类似游戏的虚拟世界,需要一些什么软件,并且需要多久完成
要一个人完成类似游戏的虚拟世界,可能需要以下软件: 1. 图像生成软件,如 Midjourney、Stable Diffusion 等,用于生成概念图像和美术作品。 2. 3D 建模软件,用于创建 3D 模型、添加纹理和效果等。 完成所需的时间因多种因素而异,包括个人的技能水平、项目的复杂程度、投入的时间和精力等。像《Red Dead Redemption 2》这样复杂的游戏,制作成本近 5 亿美元,花了将近 8 年的时间来建造。但如果是相对简单的虚拟世界,时间可能会短很多。不过,这需要您具备扎实的相关技能和持续的努力。
2025-01-10
如果自己一个人要完成一个类似游戏的虚拟世界,需要一些什么软件
如果您想一个人完成类似游戏的虚拟世界,以下是一些可能会用到的软件: 1. Scenario、Iliad:可以创建游戏资源。 2. Promethean:能够构建整个虚拟世界的平台。 3. Inworld、Charisma、Convai:可用于生成非玩家角色(NPC)。 4. Midjourney:有助于游戏设计师进行游戏概念探索与灵感启发。 5. Stable Diffusion:可用于处理图像,如形成系列的图像变化、创建最后的艺术作品等。 6. 谷歌的 Genie:可以通过单张图像提示生成可玩的交互式环境,由潜在动作模型、视频 tokenizer 和动态模型组成。 此外,生成式人工智能工具在游戏概念探索、美术作品制作等方面也能发挥作用,比如加快概念艺术的开发流程。但需要注意的是,创建 3D 元素比创建 2D 平面图更为复杂,目前相关业务和创新尚在探索中。
2025-01-10
全世界最先进的模型是什么
目前全世界较为先进的模型包括: Meta 发布的 Meta Movie Gen 文生视频模型,Meta 称其为“迄今为止最先进的媒体基础模型(Media Foundation Models)”,但模型未公开上线。相关链接:https://ai.meta.com/research/moviegen/ 媒体报道:量子位:Meta 版 Sora 无预警来袭!抛弃扩散模型,音视频生成/画面编辑全包,92 页论文无保留公开 https://mp.weixin.qq.com/s/rs7JQigqHO9yT_0wbF6cTg 歸藏的 AI 工具:Meta 发布视频生成和编辑模型,来看看项目负责人的论文导读 https://mp.weixin.qq.com/s/BLXNgCW0vAHNZtHgd4623g OpenAI 的 GPT4 是其最新和最强大的模型,GPT3.5Turbo 是为 ChatGPT 提供支持的模型,此模型专为对话模式进行了优化。相关链接:https://platform.openai.com/docs/quickstart Llama 3.1 是迄今为止最大版本,其在推理、数学、多语言和长上下文任务中能够与 GPT4 相抗衡。这标志首次开放模型缩小与专有前沿的差距。 此外,由 DeepSeek、零一万物、知谱 AI 和阿里巴巴开发的模型在 LMSYS 排行榜上取得了优异的成绩,尤其在数学和编程方面表现尤为出色。中国的最强模型与美国生产的第二强前沿模型竞争,同时在某些子任务上挑战了 SOTA。中国模型更能优先考虑计算效率,以弥补 GPU 访问的限制,并学会比美国同行更有效地利用资源。中国模型各有优势。例如,DeepSeek 在推理过程中通过多头隐式注意力减少内存需求,并且改进了 MoE 架构。同时,零一万物更加关注数据集的建设而不是建筑创新。由于在像 Common Crawl 这样的流行存储库中相对缺乏数据,因此它更加关注建立强大的中文数据集来弥补不足。
2024-12-30