直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

Embedding 嵌入向量生成模型

回答

Embedding(嵌入)是一个浮点数的向量(列表),两个向量之间的距离度量它们的相关性,小距离表示高相关性,大距离表示低相关性。

Embedding 是一种在机器学习和深度学习中广泛应用的技术,特别是在自然语言处理(NLP)和其他涉及高维离散数据的领域。它指将原本高维且通常离散的输入数据(如单词、短语、用户 ID、商品 ID 等)映射到一个低维连续向量空间中的过程,这些低维向量称为嵌入向量。

例如,“国王”和“王后”在嵌入向量的空间里位置挨得很近,而“苹果”与前两者差别较大,其嵌入向量位置较远。Embedding 不仅限于单词,还可扩展到句子、文档、实体或其他类型的对象。通过训练诸如 Word2Vec、GloVe 或 BERT 等模型,可从大规模文本数据中学习出这样的嵌入向量,这些嵌入向量可看作是输入数据在潜在语义空间中的表示,能改善下游任务(如文本分类、情感分析、问答系统、机器翻译等)的表现。

除文本数据外,嵌入技术还应用于社交网络分析、推荐系统、图像识别(如位置嵌入)、图神经网络(如节点嵌入)等多种场景,实现将复杂对象的有效编码和降维表示。

Embeddings 有多种分类及对应模型:

  • 句子和文档嵌入:Doc2Vec 能为整个文档生成统一的向量表示;Average Word Embeddings 是将一段文本中所有单词的嵌入取平均作为整体的文本表示;Transformers Sentence Embeddings 如 BERT 的[CLS]标记对应的向量,或者专门针对句子级别的模型如 Sentence-BERT。
  • 实体/概念嵌入:Knowledge Graph Embeddings 如 TransE、DistMult、ComplEx 等,用于将知识图谱中的实体和关系嵌入到低维向量空间中。
  • 其他类型:图像 Embeddings 使用卷积神经网络(CNN)进行图像特征提取,得到的特征向量即为图像嵌入;音频 Embeddings 在语音识别和声纹识别中,将声音信号转化为有意义的向量表示;用户/物品 Embeddings 在推荐系统中,将用户行为或物品属性映射到低维空间以进行协同过滤或基于内容的推荐;还有图 Embeddings 用于学习图结构的表示学习方法,将图中的节点和边映射到低维向量空间中,通过 DeepWalk、Node2Vec、GraphSAGE 等算法来实现,在图分析、社交网络分析、推荐系统等领域广泛应用,用于发现社区结构、节点相似性、信息传播等图属性。

在将大型文档转换为可检索内容的过程中,嵌入向量生成这一步将文本块转换为实值向量并存储在数据库中。但检索 PDF 文档的过程充满挑战,可能出现文本提取不准确和 PDF 文档内表格行列关系混乱等问题。在检索增强生成(RAG)框架中,回答一个问题需要用户提出问询,系统从私有知识库中检索相关内容,将相关内容与用户查询合并为上下文,最后请求大语言模型生成答案,准确检索相关信息对 RAG 模型的效力至关重要。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

通过增强PDF结构识别,革新检索增强生成技术(RAG)

大语言模型的训练数据主要来源于公开互联网资源,包括网页、书籍、新闻和对话文本。这意味着大语言模型主要依赖互联网资源作为它们的训练数据,这些资源量级大、种类繁多且易于访问,支持大语言模型扩展其性能。然而,在垂直领域应用中,专业任务需要大语言模型利用领域知识(Domain knowledge)。遗憾的是,这些知识是私有数据,并不属于它们预训练数据中的一部分。为大语言模型配备领域知识的一种流行方法是检索增强生成(Retrieval-Augmented Generation,以下简称RAG)。RAG框架回答一个问题需要四个步骤:用户提出问询;系统从私有知识库中检索相关内容;将相关内容与用户查询合并为上下文;最后请求大语言模型生成答案。图1通过一个简单示例说明了这个过程。该过程反映了遇到问题时的典型认知过程,包括查阅相关参考资料,然后推导出答案。在这个框架中,关键部分是要准确地检索相关信息,这对RAG模型的效力至关重要。图1检索增强生成(RAG)的工作流然而,检索PDF文档的过程充满挑战,经常会出现文本提取的不准确和PDF文档内表格的行列关系混乱等问题。因此,在RAG之前,我们需要将大型文档转换为可检索内容。转换涉及以下几个步骤,如图2所示:图2将PDF文档转换为可检索内容的过程文档解析和文本切分(Document parsing & chunking)。这一步涉及到提取段落、表格和其他内容块,然后将提取的内容分块以进行后续检索。嵌入向量(Embedding)生成。这一步将文本块转换为实值向量并存储在数据库中。由于这些步骤中的每一步都可能导致信息损失,因此复合损失会显著影响RAG响应的效果。

认识大模型 Embedding 技术加实战

Embedding(嵌入)是一个浮点数的向量(列表)。两个向量之间的距离度量它们的相关性,小的距离表示高相关性,大的距离表示低相关性。Embedding(嵌入)也是是一种在机器学习和深度学习中广泛应用的技术,特别是自然语言处理(NLP)和其他涉及高维离散数据的领域。它指的是将原本高维且通常是离散的输入数据(如单词、短语、用户ID、商品ID等)映射到一个低维连续向量空间中的过程。这些低维向量称为嵌入(Embedding vectors)。例如,“国王”和“王后”在嵌入向量的空间里,位置就会挨得很近;而“苹果”这个词,虽然也是个词,但因为它的意思和前两者差别较大,所以它的嵌入向量就会落在离“国王”和“王后”比较远的地方。Embedding不仅限于单词,还可以扩展到句子、文档、实体或其他类型的对象。通过训练诸如Word2Vec、GloVe或BERT等模型,可以从大规模文本数据中学习出这样的嵌入向量。这些嵌入向量可以被看作是输入数据在潜在语义空间中的表示,使得机器学习模型能够更好地理解和处理这些数据,从而改善下游任务(如文本分类、情感分析、问答系统、机器翻译等)的表现。除了文本数据,嵌入技术也被应用于社交网络分析、推荐系统、图像识别(如位置嵌入)、图神经网络(如节点嵌入)等多种场景中,实现将复杂对象的有效编码和降维表示。

认识大模型 Embedding 技术加实战

Doc2Vec:扩展了Word2Vec,能够为整个文档生成统一的向量表示。Average Word Embeddings:将一段文本中所有单词的嵌入取平均作为整体的文本表示。Transformers Sentence Embeddings:如BERT的[CLS]标记对应的向量,或者专门针对句子级别的模型如Sentence-BERT。[heading3]实体/概念嵌入[content]Knowledge Graph Embeddings:如TransE、DistMult、ComplEx等,用于将知识图谱中的实体和关系嵌入到低维向量空间中。[heading3]其他类型[content]图像Embeddings:使用卷积神经网络(CNN)进行图像特征提取,得到的特征向量即为图像嵌入。音频Embeddings:在语音识别和声纹识别中,将声音信号转化为有意义的向量表示。用户/物品Embeddings:在推荐系统中,将用户行为或物品属性映射到低维空间以进行协同过滤或基于内容的推荐。还有一种图Embeddings:是用于学习图结构的表示学习方法,将图中的节点和边映射到低维向量空间中。通过学习图嵌入,可以将复杂的图结构转化为向量表示,以捕捉节点之间的结构和关联关系。这些方法可以通过DeepWalk、Node2Vec、GraphSAGE等算法来实现。图嵌入在图分析、社交网络分析、推荐系统等领域中广泛应用,用于发现社区结构、节点相似性、信息传播等图属性。下面以OpenAI为例继续展开介绍

其他人在问
embedding是什么
Embedding 是一种在深度学习和自然语言处理(NLP)中常用的特征工程方法,本质上是将高维度的数据(如单词、短语、句子等)转换为低维度的向量。其主要目的是降低数据的抽象性和复杂性,以便机器学习模型更有效地理解和处理数据,同时帮助模型理解语义关系,如单词之间的相似性、句子的情感等。 以下是几个关于 Embedding 的例子: 1. 电影推荐系统:假设存在一个电影推荐系统,用户可给电影打分,目标是预测用户未看过电影的评分。此时,每个用户和电影都可视为独特分类标签,直接处理这些高维度且稀疏的标签较困难。通过为每个用户和电影创建 Embedding(低维度向量),可捕捉用户兴趣和电影特性,进而通过比较 Embedding 来预测评分。 2. 文本分类:在文本分类任务中,Embedding 可将文本转换为适合模型处理的向量形式。 此外,在 Stable Diffusion 中,Embedding 相当于提示词打包的功能,能将大量提示词汇总到一个文件里,调用该文件就相当于输入了很多提示词,尤其在负向提示词中,当文本量很大且固定不变时,使用打包好的负向提示词 Embedding 可达到一词顶一百词的效果。 Embedding 是一个浮点数的向量(列表),两个向量之间的距离可度量它们的相关性,小距离表示高相关性,大距离表示低相关性。Embedding 有词、句子、文档、图像等分类。在大模型中,Embedding 具有重要价值,例如从数据集中获取 Embedding 结果并保存为 csv 文件。进阶到企业级应用开发的大模型技术还会涉及利用开源的 Embedding 模型、向量数据库去做检索增强生成(RAG),以及购买 GPU 服务器去基于开源大模型搭建企业级大模型项目。 参考链接:OpenAI 官网文档 https://platform.openai.com/docs/introduction
2024-08-27
embedding是什么?
Embedding 是一种在深度学习和自然语言处理(NLP)中的特征工程方法,用于将高维度的数据(如单词、短语、句子等)转换为低维度的向量。其本质是通过向量空间映射将文本转换为数值表示,主要目的是降低数据的抽象和复杂性,使机器学习模型能更有效地理解和处理数据,帮助模型理解语义关系,如单词之间的相似性、句子的情感等。 以下是几个关于 Embedding 的例子帮助您更好地理解: 1. 电影推荐系统:假设我们有一个电影推荐系统,用户可以给电影打分,目标是预测用户未看过的电影的评分。每个用户和电影都可视为独特分类标签,直接处理这些高维度和稀疏的标签很困难。此时可使用 Embedding,为每个用户和电影创建低维度向量,捕捉用户兴趣和电影特性,通过比较向量来预测评分。 2. 在 Stable Diffusion 中,Embedding 相当于提示词打包功能,能把很多提示词汇总到一个文件里。调用一个 Embedding 文件就相当于输入很多提示词,对于文本量很大且固定不变的提示词,如常见的负向提示词,使用打包好的负向提示词 Embedding 可达到一词顶一百词的效果。 此外,我们认识到 Embedding 是一个浮点数的向量(列表),两个向量之间的距离度量它们的相关性,小距离表示高相关性,大距离表示低相关性。Embedding 共有词、句子、文档、图像等分类。在大模型中,Embedding 具有重要价值,实战中可从数据集中获取 Embedding 结果,并保存为 csv 文件。进阶到企业级应用开发的大模型技术还会涉及利用开源的 Embedding 模型、向量数据库去做检索增强生成(RAG),以及购买 GPU 服务器去基于开源大模型搭建企业级大模型项目。OpenAI 官网文档链接:https://platform.openai.com/docs/introduction
2024-08-26
Coze中能给变量在赋值中嵌入其它变量并同时 使用公式么
在 Coze 中,变量是以 keyvalue 形式存储数据的,是 Bot 的数据记忆功能。大语言模型会根据用户输入内容进行语义匹配,为定义的变量赋值并保存值。您可以在提示词中为 Bot 声明某个变量的具体使用场景。 创建变量可在创建 Bot 的页面进行。对变量进行赋值时,首先可以在给大模型的提示词中做声明,例如:“与您的用户进行互动,并根据 user_language 变量,用他们偏好的语言在线搜索。除非另有设置,用户查询的语言应指导您的回答和搜索”。这段提示词相当于告诉了 LLM,user_language 这个变量该如何赋值以及使用。 变量创建并赋值后,如 user_language 变量,就可以在工作流中作为变量使用。这一块解释起来有些抽象,具体可以参考后面的例子,真正用一遍就懂了。 综上,在 Coze 中能给变量在赋值中嵌入其它变量并同时使用公式,但具体的实现方式和规则需要根据具体的提示词和使用场景来确定。
2024-12-11
ollama嵌入向量在模型后有什么用
嵌入向量在模型后的作用主要体现在以下方面: 1. 用于文档内容的表示和检索:将文档分成块,计算嵌入向量并存储在向量存储中,在测试时通过查询向量存储获取可能与任务相关的块,填充到提示中进行生成。 2. 提升模型的检索能力:在大语言模型应用程序中,向量存储成为检索相关上下文的主要方式,嵌入向量有助于更高效地获取相关信息。 3. 支持多语言和不同粒度的检索任务:例如像 bgem3 这样的向量模型,支持超过 100 种语言的语义表示及检索任务,能实现句子、段落、篇章、文档等不同粒度的检索。 在实际应用中,如在 LangChain 中,本地向量存储使用量较大,而在计算文本片段的嵌入时,OpenAI 占据主导地位,开源提供商如 Hugging Face 等也被较多使用。
2024-11-12
智能体如何嵌入课件
以下是关于智能体嵌入课件的相关内容: 在提示词培训课中: 点击“创建智能体”按钮。 输入对智能体的描述,如有准备好的提示词模板可直接粘贴。 ChatGLM 的智能体配置可自动生成,默认勾选增强能力,可根据实际需求调整,也可上传本地文件作为知识原料形成智能体的知识库。 在基础通识课中: 以可视化方式讲解 Transformer 架构,单词先拆分再嵌入(embedding),为保证语序不乱会做位置编码标记,嵌入后进入自助运力机制模型。 在 AI 智能体:企业自动化的新架构 Menlo Ventures 中: 轨道智能体被赋予更高级目标和更多自由度选择实现方法和工具,受程序性知识指导,拥有预定义工具并受保护栏和审查措施约束。 运行时会产生规划智能体评估应用程序当前状态、选择并执行最佳链条、进行审查和确保一致性等模式。 请注意,由于最近盗版事件频发,需要课件的扫群主二维码获取。
2024-10-16
如何自己弄一个网页嵌入型的智能问答对话AI
以下为您介绍如何自己弄一个网页嵌入型的智能问答对话 AI: AskAI 是一个不错的选择。它是一个构建自己的 AI 问答系统的平台,用户可以通过无代码的方式,在几分钟内构建自己的 AI 问答系统。 其特点和优势包括: 1. 能够快速构建:在短时间内即可完成。 2. 嵌入方式灵活:可以将构建好的系统分享到任何网页上,嵌入到网页中,或通过 API 进行访问。 3. 技术支持:使用 OpenAI 的嵌入技术。 AskAI 的官网是:https://www.myaskai.com 。通过该平台,您能够较为便捷地实现自己的网页嵌入型智能问答对话 AI 的需求。
2024-09-02
哪个服务可以把comfyui嵌入到现在有的网站
ComfyUI 是一个基于 Stable Diffusion 模型的图形用户界面(GUI),它允许用户通过节点式工作流设计和执行高级的图像生成任务。根据搜索结果,ComfyUI 可以作为一个独立的应用程序运行,并且似乎没有直接的选项将其嵌入到现有的网站中。 但是,如果你想将 ComfyUI 的功能集成到现有的网站中,你可以考虑以下几种方法: 1. 反向代理:可以在服务器上运行 ComfyUI,并使用反向代理服务(如 Nginx 或 Apache)将特定路由指向 ComfyUI 的接口,这样用户就可以通过你的网站访问 ComfyUI 的功能。 2. iframe 嵌入:如果 ComfyUI 提供了可以直接访问的 URL 并且可以作为服务运行,你可以尝试使用 HTML 的 `<iframe>` 标签将其嵌入到你的网页中。但是,出于安全和同源策略的考虑,这可能需要 ComfyUI 服务端的支持。 3. API 集成:如果 ComfyUI 支持 API 调用,你可以在自己的网站后端创建一个代理服务,将用户的请求转发给 ComfyUI 的 API,并将结果返回给前端用户。 4. 微服务架构:将 ComfyUI 作为微服务架构的一部分运行,并通过内部网络提供其功能,你的主网站应用程序可以通过服务间通信与之交互。 5. Web 服务集成:如果 ComfyUI 提供了 Web 服务接口,你可以在你的网站后端使用服务器端渲染技术(如 Node.js、PHP、Python 等)来与 ComfyUI 进行交云,并动态生成用户界面。 6. 容器化部署:使用 Docker 或其他容器化技术将 ComfyUI 部署为一个容器实例,并通过容器编排工具(如 Kubernetes)管理其运行,你的网站可以通过网络请求与之通信。 请注意,这些方法可能需要一定的技术知识和额外的配置工作。此外,确保任何集成都符合 ComfyUI 的使用条款和版权要求。如果你需要具体的技术指导,可能需要联系 ComfyUI 的开发者或查阅相关的开发者文档。
2024-04-23
向量检索在大语言模型中的应用主要是为了解决什么问题
向量检索在大语言模型中的应用主要是为了解决以下问题: 1. 由于大模型的输入窗口有限,通过文本分割器将文档分割成较小的对象,方便后续的检索和生成,在较短的文本中更容易找到相关信息。 2. 利用文本嵌入器将文本转换为高维向量,通过衡量文本之间的相似度实现检索功能。 3. 借助向量存储器存储和查询嵌入,通常使用索引技术如 Faiss 或 Annoy 加速嵌入的检索。 4. 检索器根据文本查询返回相关的文档对象,常见的实现如向量存储器检索器使用向量存储器的相似度搜索功能进行检索。
2024-12-05
数据如何向量化
数据向量化是为了实现高效的文档检索,将原始的文本数据转化为数值向量的过程。其目的是将文本数据映射到低维向量空间,使语义相似的文本距离较近,不相似的较远。但这一过程会导致一定程度的信息损失,因为文本的复杂性和多样性难以用有限向量完全表达,可能忽略细节和特征,影响文档检索准确性。 在语义搜索中,根据用户问题从文档集合中检索语义最相关的文档,主流方法是基于数据向量化结果,利用向量空间中的距离或相似度度量语义相似度,但存在局限性,如不能完全反映真实语义相似度,向量空间中的噪声和异常值会干扰结果,导致准确率无法 100%保证。 在计算机科学和数据分析中,向量常被用作表示数据点的方式,是一个数值列表或数组,每个数值代表数据点的一个特征。多维数据运算常以矩阵形式进行,矩阵乘法是基本操作。归一化是数据预处理的关键技术,用于调整数值数据范围,常用方法有最小最大缩放和 Z 得分标准化。 在向量数据库中,当用户输入查询时,如“激动人心的科幻冒险”,会转换成一个向量,例如,表示对不同元素的偏好程度。向量数据库存放的是词在不同维度上的相对位置,数据的存储和检索与传统 Excel 和关系数据库有很大不同。关于文字如何转换成向量,实际的向量结构会很复杂。
2024-10-12
以图片为主的PDF文件向量化的本地大模型推荐
以下是关于以图片为主的 PDF 文件向量化的本地大模型的相关信息: RAG 技术: 利用大模型的能力搭建知识库是 RAG 技术的应用。大模型训练数据有截止日期,当需要依靠不在训练集中的数据时,可通过检索增强生成 RAG 技术实现。RAG 应用包括 5 个过程: 1. 文档加载:从多种来源加载文档,如包括 PDF 在内的非结构化数据、SQL 在内的结构化数据以及代码等。 2. 文本分割:把文档切分为指定大小的块。 3. 存储:包括将切分好的文档块嵌入转换成向量形式,并将向量数据存储到向量数据库。 4. 检索:通过检索算法找到与输入问题相似的嵌入片。 5. 输出:把问题以及检索出来的嵌入片一起提交给 LLM,生成更合理的答案。 PDF 翻译的 AI 产品: 1. DeepL(网站):,点击页面「翻译文件」按钮,上传 PDF、Word 或 PowerPoint 文件。 2. 沉浸式翻译(浏览器插件):,安装插件后,点击插件底部「更多」按钮,选择相关翻译选项。 3. Calibre(电子书管理应用):,下载安装并安装翻译插件「Ebook Translator」。 4. 谷歌翻译(网页):,使用工具把 PDF 转成 Word,再点击谷歌翻译「Document」按钮上传 Word 文档。 5. 百度翻译(网页):,点击导航栏「文件翻译」,上传多种格式文件,支持选择领域和导出格式。 6. 彩云小译(App):下载后点击「文档翻译」,可导入多种格式文档,但有免费次数限制且进阶功能需付费。 7. 微信读书(App):下载 App 后将 PDF 文档添加到书架,打开并点击页面上方「切换成电子书」,轻触屏幕唤出翻译按钮。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-10-06
稀疏向量有什么用,跟稠密向量油什么区别
稀疏向量和稠密向量在多个领域都有重要的应用,它们的主要区别在于元素的分布和存储方式。 稀疏向量中,大部分元素的值为零或为空,只有少数元素具有非零值。其主要用途包括: 1. 在处理大规模数据时,能够节省存储空间和计算资源,例如在自然语言处理中处理高维的词向量。 2. 对于具有稀疏特征的数据,能够更有效地表示和处理,比如在推荐系统中用户的兴趣特征。 稠密向量则是大多数元素都具有非零值。其特点和适用场景包括: 1. 更适合表示数据特征分布较为均匀的情况。 2. 在一些需要精确计算和密集运算的场景中表现较好,例如图像识别中的像素特征向量。 总的来说,选择使用稀疏向量还是稠密向量取决于具体的应用场景和数据特点。
2024-09-07
支持向量机
支持向量机(SVM)是一种重要的机器学习算法。 在深度学习的发展历程中,尽管取得了一些进展,但在特定时期,如人工智能寒冬期间,用于神经网络研究的资金很少,人工智能领域发展受到一定限制。在此期间,Cortes 和 Vapnik 于 1995 年开发的支持向量机表现突出,使得一些重要进展如 Hochreiter 和 Schmidhuber 在 1997 年为递归神经网络开发的长短期记忆(LSTM)被忽视。后来随着计算机性能提升,神经网络逐渐与支持向量机相竞争,且在相同数据量下能获得更好结果,同时神经网络在有更多训练数据时会持续改进。 在算法学习中,支持向量机属于强学习器。强学习器通常具有高准确率,能很好地泛化到新数据上,例如深度神经网络或支持向量机,能够捕捉数据中的复杂模式。而弱学习器准确率仅略高于随机猜测,通常是简单的模型,如决策树桩。
2024-09-06
推荐一个AI工具,帮助我每天自动执行以下步骤:从本地上传文件给大模型,该文件内含有新闻网页链接,大模型读取链接并汇总内容
以下为您推荐的 AI 工具可能有助于您实现每天自动执行从本地上传文件给大模型,并让大模型读取文件内新闻网页链接并汇总内容的需求: 1. AI 拍立得(Pailido): 特点:即拍即得,简化流程,操作直观高效。 体验方式:微信小程序搜索“Pailido”。 交互逻辑:用户选择拍摄场景类型并拍照,AI 自动识别和分析照片内容信息,依据预设场景规则迅速生成符合情境的反馈。 实现场景: 图片转成文本:用户上传图片后,大模型根据选择的场景生成相关文字描述或解说文本,可用于生成美食点评、朋友圈发布文案、闲鱼上架示例模版等。 图片转绘图片:用户上传图片后,大模型按照指定风格快速生成图像的转绘版本,适应不同风格和场景需求,如图片粘土风、图片积木风、图片像素风等。 2. 内容仿写 AI 工具: 秘塔写作猫:https://xiezuocat.com/ ,是 AI 写作伴侣,能推敲用语、斟酌文法、改写文风,实时同步翻译,支持全文改写、一键修改、实时纠错并给出修改建议,智能分析文章属性并打分。 笔灵 AI 写作:https://ibiling.cn/ ,是智能写作助手,支持多种文体写作,如心得体会、公文写作、演讲稿、小说、论文等,支持一键改写/续写/扩写,智能锤炼打磨文字。 腾讯 Effidit 写作:https://effidit.qq.com/ ,由腾讯 AI Lab 开发的智能创作助手,能提升写作者的写作效率和创作体验。 更多 AI 写作类工具可以查看:https://www.waytoagi.com/sites/category/2 。请注意,内容由 AI 大模型生成,请仔细甄别。
2024-12-21
如何利用AGI创建3D打印的模型
利用 AGI 创建 3D 打印模型的方法如下: 1. 将孩子的画转换为 3D 模型: 使用 AutoDL 部署 Wonder3D:https://qa3dhma45mc.feishu.cn/wiki/Pzwvwibcpiki2YkXepaco8Tinzg (较难) 使用 AutoDL 部署 TripoSR:https://qa3dhma45mc.feishu.cn/wiki/Ax1IwzWG6iDNMEkkaW3cAFzInWe (小白一学就会) 具体实物(如鸟/玩偶/汽车)的 3D 转换效果最佳,wonder3D 能智能去除背景(若效果不佳,需手动扣除背景) 对于一些非现实类玩偶类作品,wonder3D 识别效果不佳时,可先使用 StableDiffusion 将平面图转换为伪 3D 效果图再生成模型。以 usagi 为例,先通过 SD 生成 3D 的 usagi,再将 usagi 输入 wonder3D。 2. 生成特定模型,如创建一个乐高 logo 的 STL 文件: 设计乐高 logo:使用矢量图形编辑软件(如 Adobe Illustrator 或 Inkscape)创建或获取矢量格式的乐高 logo,确保符合标准。 导入 3D 建模软件:将矢量 logo 导入到 3D 建模软件(如 Blender、Fusion 360 或 Tinkercad)中。 创建 3D 模型:在 3D 建模软件中根据矢量图形创建 3D 模型,调整尺寸和厚度以适合打印。 导出 STL 文件:将完成的 3D 模型导出为 STL 文件格式。 以下是在 Blender 中使用 Python 脚本创建简单 3D 文本作为乐高 logo 并导出为 STL 文件的步骤: 打开 Blender,切换到“脚本编辑器”界面。 输入脚本,点击“运行脚本”按钮,Blender 将创建 3D 文本对象并导出为 STL 文件。 检查生成的 STL 文件,可根据需要调整脚本中的参数(如字体、位置、挤压深度等)以获得满意的乐高 logo 3D 模型。 此外,还有一些其他动态: 阿里妈妈发布了:https://huggingface.co/alimamacreative/FLUX.1TurboAlpha ,演示图片质量损失小,比 FLUX schell 本身好很多。 拓竹旗下 3D 打印社区 Make World 发布 AI:https://bambulab.com/zh/signin ,3D 生成模型找到落地和变现路径。 上海国投公司搞了一个:https://www.ithome.com/0/801/764.htm ,基金规模 100 亿元,首期 30 亿元,并与稀宇科技(MiniMax)、阶跃星辰签署战略合作协议。 智谱的:https://kimi.moonshot.cn/ 都推出基于深度思考 COT 的 AI 搜索。 字节跳动发布:https://mp.weixin.qq.com/s/GwhoQ2JCMQwtLN6rsrJQw ,支持随时唤起豆包交流和辅助。 :https://x.com/krea_ai/status/1844369566237184198 ,集成了海螺、Luma、Runway 和可灵四家最好的视频生成模型。 :https://klingai.kuaishou.com/ ,现在可以直接输入文本指定对应声音朗读,然后再对口型。
2024-12-20
如何通过提示词提高模型数据对比和筛选能力
以下是一些通过提示词提高模型数据对比和筛选能力的方法: 1. 选择自定义提示词或预定义话题,在网站上使用如 Llama3.1 8B Instruct 模型时,输入对话内容等待内容生成,若右边分析未刷新可在相关按钮间切换。由于归因聚类使用大模型,需稍作等待,最终结果可能因模型使用的温度等因素而不同。 2. 在写提示词时不能依赖直觉和偷懒,要实话实说,补充详细信息以避免模型在边缘情况上犯错,这样也能提高数据质量。 3. 在分类问题中,提示中的每个输入应分类到预定义类别之一。在提示末尾使用分隔符如“\n\n\n\n”,选择映射到单个 token 的类,推理时指定 max_tokens=1,确保提示加完成不超过 2048 个 token,每班至少有 100 个例子,可指定 logprobs=5 获得类日志概率,用于微调的数据集应在结构和任务类型上与模型使用的数据集相似。例如在确保网站广告文字正确的案例中,可微调分类器,使用合适的分隔符和模型。
2024-12-20
通过提示词可以提高模型的数学计算能力吗
通过提示词可以在一定程度上提高模型的数学计算能力。例如 PoT 技术,它是思维链技术的衍生,适用于数值推理任务,会引导模型生成一系列代码,再通过代码解释器工具进行运算,这种方式能显著提升模型在数学问题求解上的表现。PoT 作为 CoT 的衍生技术,遵循零样本和少样本的学习范式,零样本 PoT 与 CoT 方法相似,不需要大量样本即可进行有效推理,少样本 PoT 也通过较少样本优化模型表现。但需要注意的是,大模型在解决数学问题时可能存在不够可靠的情况。
2024-12-20
哪一个开源大语言模型对中文支持比较好?
以下是一些对中文支持较好的开源大语言模型: 1. OpenChineseLLaMA: 地址: 简介:基于 LLaMA7B 经过中文数据集增量预训练产生的中文大语言模型基座,对比原版 LLaMA,该模型在中文理解能力和生成能力方面均获得较大提升,在众多下游任务中均取得了突出的成绩。 2. BELLE: 地址: 简介:开源了基于 BLOOMZ 和 LLaMA 优化后的一系列模型,同时包括训练数据、相关模型、训练代码、应用场景等,也会持续评估不同训练数据、训练算法等对模型表现的影响。 3. Panda: 地址: 简介:开源了基于 LLaMA7B,13B,33B,65B 进行中文领域上的持续预训练的语言模型,使用了接近 15M 条数据进行二次预训练。 4. Llama2Chinese13bChat: 地址: 5. Gemma7bit: 地址: 此外,AndesGPT 在语言理解与抽取、角色扮演能力上排名国内前一,在代码、生成与创作、上下文对话能力上排名国内前三,各项能力较为均衡,聚焦在移动设备端的应用。Baichuan213BChat 是百川智能自主训练的开源大语言模型,是中文开源模型的主导力量。
2024-12-20
说明jetson orin nano可以使用什么模型?Grok-1模型可以吗?
目前没有关于 Jetson Orin Nano 是否可以使用 Grok1 模型的明确信息。但一般来说,Jetson Orin Nano 可以支持多种常见的深度学习模型,如基于 TensorFlow、PyTorch 框架开发的模型等。具体能够使用哪些模型,还需要考虑模型的计算需求、内存占用以及 Jetson Orin Nano 的硬件配置和性能限制等因素。
2024-12-20