直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

如何提高RAG应用中的准确率

回答

以下是一些提高 RAG 应用准确率的方法:

  1. 基于结构化数据来 RAG:
    • 避免数据向量化和语义搜索的问题,直接利用原始数据和 LLM 的交互,提高准确率。因为结构化数据的特征和属性明确,能用有限标签集描述,可用标准查询语言检索,不会出现信息损失或语义不匹配的情况。
    • 减少 LLM 的幻觉可能性,LLM 只需根据用户问题提取核心信息和条件,并形成标准查询语句,无需理解整个文档语义。
    • 提高效率,省去数据向量化和语义搜索过程,直接使用标准查询和原始数据进行回复,且结构化数据的存储和更新更易更省空间。
    • 增加灵活性,适应不同数据源和查询需求,只要数据是结构化的,就可用此方法进行 RAG。
  2. 参考行业最佳实践,如 OpenAI 的案例:
    • 从较低的准确率开始,尝试多种方法,标记哪些被采用到生产中。
    • 通过尝试不同大小块的信息和嵌入不同内容部分,提升准确率。
    • 采用 Reranking 和对不同类别问题特别处理的方法进一步提升。
    • 结合提示工程、查询扩展等方法,最终达到较高的准确率,同时强调模型精调和 RAG 结合使用的潜力。
  3. 深入了解 RAG 的基础概念:
    • RAG 由检索器和生成器组成,检索器从外部知识中快速找到与问题相关的信息,生成器利用这些信息制作精确连贯的答案,适合处理需要广泛知识的任务,如问答系统,能提供详细准确的回答。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

开发:LangChain应用开发指南-不用向量也可以RAG

「准确」。基于结构化数据RAG避免了数据向量化和语义搜索的问题,直接利用原始数据和LLM的交互,提高了RAG的准确率。因为结构化数据的特征和属性都是明确的,可以用有限的标签集进行描述,可以用标准的查询语言进行检索,因此不会出现信息损失或语义不匹配的情况。而且,LLM只需要根据用户的问题,提取出核心的信息和条件,并形成标准的查询语句,而不需要理解整个文档的语义,因此也减少了LLM的幻觉的可能性。「高效」。基于结构化数据RAG提高了RAG的效率,因为它省去了数据向量化和语义搜索的过程,直接使用标准查询和原始数据进行回复。数据向量化和语义搜索的过程是非常耗时和资源密集的,因为它们需要对海量的文本数据进行处理和计算,而且还需要存储和更新大量的向量数据。而结构化数据RAG只需要对结构化数据进行标准查询,这是一个非常快速和简单的过程,而且结构化数据的存储和更新也比向量数据更容易和更节省空间。「灵活」。基于结构化数据RAG提高了RAG的灵活性,因为它可以适应不同的数据源和查询需求,只要数据是结构化的,就可以用这种方法进行RAG。结构化数据是一种非常通用和广泛的数据格式,它可以表示各种各样的信息和知识,例如表格、数据库、XML等。而且,结构化数据的查询语言也是非常标准和通用的,例如SQL、SPARQL等。因此,结构化数据RAG的方法可以应用于不同的领域和场景,只要将用户的问题转化为相应的查询语言,就可以实现RAG。

大模型RAG问答行业最佳案例及微调、推理双阶段实现模式:基于模块化(Modular)RAG自定义RAG Flow

上面的章节提到了了很多论文,论文的特点决定了他们的方法更多的是从细节出发,解决具体的细节问题。而RAG是更是一个在工业领域大放异彩的技术,下面我们将从RAG Flow的角度介绍几个行业最佳的RAG实践,看看在真实应用场景下应该如何构建RAG Flow。[heading3]1、OpenAI[content]从OpenAI Demo day的演讲整理所得,并不能完全代表OpenAI的实际操作。在提升RAG的成功案例中,OpenAI团队从45%的准确率开始,尝试了多种方法并标记哪些方法最终被采用到生产中。他们尝试了假设性文档嵌入(HyDE)和精调嵌入等方法,但效果并不理想。通过尝试不同大小块的信息和嵌入不同的内容部分,他们将准确率提升到65%。通过Reranking和对不同类别问题特别处理的方法,他们进一步提升到85%的准确率。最终,通过提示工程、查询扩展和其他方法的结合,他们达到了98%的准确率。团队强调了模型精调和RAG结合使用时的强大潜力,尤其是在没有使用复杂技术的情况下,仅通过简单的模型精调和提示工程就接近了行业领先水平。

【AI+知识库】商业化问答场景,让AI回复更准确,一篇专为所有“小白”讲透RAG的实例教程(上篇)

其中,她是陈美嘉,这里是人设中的设定。吵架的经过是知识库中的内容。在我提问了之后,大模型去知识库里找到了相关内容,然后回复了我。这就是一个简单的正确回复的demo示例。然而,我们会发现,有时候她的回答会十分不准确。图二明显回答的牛头不对马嘴。图三是知识库截图,其中是有“一菲为美嘉找了一份助教工作”的内容的。但是回答这个问题时,AI并没有根据正确的知识库内容回答。这,就是基于知识库问答中的一个非常常见的错误场景。在其他情况下,甚至有可能出现报价错误、胡编乱造等等。这在严肃场景中,是不能接受的出错。现在应该能够直观的理解,为什么需要让大模型根据知识库回答的更加准确、更符合我们的要求。在AI领域中,优化AI更准确回答问题的过程,有一个更加专业的术语,叫做RAG。接下来,咱们进入正题,一步一步探索,如何优化回答。二、基础概念如果我们要优化幻觉问题和提高准确性,就务必要了解清楚从“问题输入”--“得到回复”,这个过程中,究竟发生了什么。然后针对每一个环节,逐个调优,以达到效果最佳化。因此,我们先深入其中了解问答全貌。[heading3]1、RAG介绍[content]RAG(Retrieval-Augmented Generation),即检索增强生成,是一种结合信息检索和文本生成能力的技术,它由两部分组成:一个“检索器”和一个“生成器”。检索器从外部知识中快速找到与问题相关的信息,生成器则利用这些信息来制作精确和连贯的答案。这种结合使得RAG非常适合处理需要广泛知识的任务,如问答系统,能够提供详细而准确的回答。

其他人在问
RAG加速有什么好办法吗
以下是一些加速 RAG 的好办法: 1. 确保 LLM 以正确的格式回应:函数调用已成为确保 LLM 严格输出特定格式的相对靠谱的新方法,推荐使用此方法提升性能。可参考结构化输出文档,其中高层次的 LangChain API 展示了不同 LLM 如何调用工具和函数。 2. 使用参考样例:在实际操作中,将输入和对应输出的样例纳入其中通常大有裨益,这些样例有时比指示本身更能有效指导 LLM 处理特定情况。在提取用例文档中可找到更多细节,助您从 LLMs 中提取更好的性能。 此外,LangChain 携手 NVIDIA 为 RAG 加速带来了新的篇章: 1. 将 NVIDIA NIM 与 LangChain 结合使用:新增了支持 NIM 的集成包,安装专门的集成包后可导入所需模型,并通过示例展示如何构建应用程序,包括安装额外的包、加载数据源、初始化嵌入模型等一系列操作。 2. NVIDIA NIM 介绍:NVIDIA NIM 是一系列用户友好的微服务,旨在加速企业内部生成式 AI 的部署进程,支持广泛的 AI 模型,基于强大的推理引擎和技术构建,提供无缝的 AI 推理体验,是实现大规模、高性能生成式 AI 推理的最佳选择。其具有自托管特性,能保证数据安全;提供预构建的容器,方便选择和使用最新模型;具有可扩展性。开始使用 NIM 非常简单,在 NVIDIA API 目录中可轻松访问多种 AI 模型,NIM 是 NVIDIA AI Enterprise 的一部分,可通过相关博客获取详细指南。
2024-11-12
搜索DragGAN
DragGAN 于 2023 年 6 月 25 日开源。喜欢 AI 绘画的对它应该不陌生,期待它带来更大的惊艳。此外,相关论文中增加了微软研究院新发布的多模态 AI 助手;学习路径中增加了适合初学者的深度学习课程 fast.ai ;AI 名词增加到 80 多个,补充了很多技术名词。您可以通过以下链接获取更多详细信息:
2024-11-11
AI相关常见缩写及对应含义,包含例如prompt,rag
以下是一些 AI 相关的常见缩写及对应含义: LLM:Large language model 的缩写,即大语言模型。 Prompt:中文译作提示词,是输入给大模型的文本内容,可理解为与大模型说的话或下达的指令,其质量会显著影响大模型回答的质量。 Token:大模型语言体系中的最小单元。不同厂商的大模型对中文的文本切分方法不同,通常 1Token≈12 个汉字。大模型的收费计算及输入输出长度限制常以 token 为单位计量。 上下文(context):指对话聊天内容前、后的内容信息,其长度和窗口会影响大模型回答的质量。 在 AI 绘画中,常见的画面构图提示词有: 视图相关:Bottom view(底视图)、front,side,rear view(前视图、侧视图、后视图)、product view(产品视图)、extreme closeup view(极端特写视图)、look up(仰视)、firstperson view(第一人称视角)、isometric view(等距视图)、closeup view(特写视图)、high angle view(高角度视图)、microscopic view(微观)、super side angle(超博角)、thirdperson perspective(第三人称视角)、Aerial view(鸟瞰图)、twopoint perspective(两点透视)、Threepoint perspective(三点透视)、portrait(肖像)、Elevation perspective(立面透视)、ultra wide shot(超广角镜头)、headshot(爆头)、a crosssection view of)
2024-11-08
什么是RAG的分词?
RAG(RetrievalAugmented Generation,检索增强生成)是一种结合检索和生成能力的自然语言处理架构,旨在为大语言模型(LLM)提供额外的、来自外部知识源的信息。通过检索的模式为大语言模型的生成提供帮助,使大模型生成的答案更符合要求。 LLM 需要 RAG 进行检索优化的原因在于 LLM 存在一些缺点: 1. 无法记住所有知识,尤其是长尾的,受限于训练数据和现有的学习方式,对长尾知识的接受能力不高。 2. 知识容易过时且不好更新,微调效果不佳且有丢失原有知识的风险。 3. 输出难以解释和验证,存在内容黑盒、不可控以及受幻觉干扰等问题。 4. 容易泄露隐私训练数据。 5. 规模大,训练和运行成本高。 RAG 具有以下优点: 1. 数据库对数据的存储和更新稳定,不存在模型学不会的风险。 2. 数据库的数据更新敏捷,增删改查可解释,且对原有知识无影响。 3. 数据库内容明确、结构化,加上模型的理解能力,能降低大模型输出出错的可能。 4. 知识库存储用户数据,便于管控用户隐私数据,且可控、稳定、准确。 5. 数据库维护可降低大模型的训练成本,新知识存储在数据库即可,无需频繁更新模型。 在 PDF 结构识别方面,基于规则的方法 PyPDF 存在一些问题: 1. 不擅于检测段落的边界,没有解析段落的边界,使用特殊分隔符“.\n”的启发式方法在很多情况下不成立。 2. 无法识别表格内的结构,表格的结构会被完全破坏,大语言模型无法从中辨别有意义的信息。 3. 无法识别内容的阅读顺序,按照字符存储顺序解析文档,面对复杂布局时可能导致解析结果混乱。 4. 无法识别段落和表格的边界,会错误地分割表格,并将部分与后续段落合并。 PyPDF 的解析和分块工作流程是:先将 PDF 文档中的字符序列化为没有文档结构信息的长序列,然后使用分割规则如换行符“\n”进行分割,仅当组合块的长度不超过预定限制 N 个字符时,才会合并相邻块。
2024-11-05
RAG是什么
RAG(RetrievalAugmented Generation)即检索增强生成,是一种结合检索和生成能力的自然语言处理架构,旨在为大语言模型(LLM)提供额外的、来自外部知识源的信息。 大模型需要 RAG 进行检索优化的原因在于其存在一些缺点: 1. 无法记住所有知识,尤其是长尾知识,受限于训练数据和学习方式,对长尾知识的接受能力不高。 2. 知识容易过时且不好更新,微调效果不佳且有丢失原有知识的风险。 3. 输出难以解释和验证,存在黑盒、不可控和受幻觉干扰等问题。 4. 容易泄露隐私训练数据。 5. 规模大,训练和运行成本高。 RAG 具有以下优点: 1. 数据库对数据的存储和更新稳定,不存在模型学不会的风险。 2. 数据库的数据更新敏捷,增删改查可解释,对原有知识无影响。 3. 数据库内容明确、结构化,加上模型的理解能力,能降低大模型输出出错的可能。 4. 便于管控用户隐私数据,可控、稳定、准确。 5. 可降低大模型的训练成本,新知识存储在数据库即可,无需频繁更新模型。 RAG 的核心流程是根据用户提问,从私有知识中检索到“包含答案的内容”,然后把“包含答案的内容”和用户提问一起放到 prompt 中,提交给大模型,让大模型的回答充分考虑到“包含答案的内容”。其最常见应用场景是知识问答系统。 一个 RAG 的应用可抽象为 5 个过程: 1. 文档加载:从多种不同来源加载文档,LangChain 提供了 100 多种不同的文档加载器。 2. 文本分割:把 Documents 切分为指定大小的块。 3. 存储:包括将切分好的文档块进行嵌入转换成向量的形式,以及将 Embedding 后的向量数据存储到向量数据库。 4. 检索:通过某种检索算法找到与输入问题相似的嵌入片。 5. 输出:把问题以及检索出来的嵌入片一起提交给 LLM,LLM 会通过问题和检索出来的提示生成更合理的答案。
2024-11-05
RAG
RAG(RetrievalAugmented Generation)即检索增强生成,是一种结合检索和生成能力的自然语言处理架构。 它旨在为大语言模型(LLM)提供额外的、来自外部知识源的信息。通过检索的模式为大语言模型的生成提供帮助,使大模型生成的答案更符合要求。 LLM 需要 RAG 进行检索优化的原因在于 LLM 存在一些缺点: 1. 无法记住所有知识,尤其是长尾知识,受限于训练数据和学习方式,对长尾知识的接受能力不高。 2. 知识容易过时且不好更新,微调效果不佳且有丢失原有知识的风险。 3. 输出难以解释和验证,存在内容黑盒、不可控以及受幻觉问题干扰的情况。 4. 容易泄露隐私训练数据。 5. 规模大,训练和运行成本高。 RAG 具有以下优点: 1. 数据库对数据的存储和更新稳定,不存在模型学不会的风险。 2. 数据库的数据更新敏捷,可解释且对原有知识无影响。 3. 数据库内容明确、结构化,结合模型的理解能力,降低大模型输出出错的可能。 4. 便于管控用户隐私数据,可控、稳定、准确。 5. 可降低大模型的训练成本,新知识存储在数据库即可,无需频繁更新模型。 RAG 在 Natural Questions、WebQuestions 和 CuratedTrec 等基准测试中表现出色,在使用 MSMARCO 和 Jeopardy 问题进行测试时,生成的答案更符合事实、具体且多样,FEVER 事实验证使用 RAG 后也得到了更好的结果。基于检索器的方法越来越流行,常与 ChatGPT 等流行 LLM 结合使用来提高其能力和事实一致性。 在商业化问答场景中,优化 AI 更准确回答问题的过程中,RAG 是一个重要的术语。它由检索器和生成器两部分组成,检索器从外部知识中快速找到与问题相关的信息,生成器利用这些信息制作精确连贯的答案,适合处理需要广泛知识的任务,如问答系统,能提供详细准确的回答。
2024-11-04
目前语音转文字的AI工具有哪些,准确率怎样
目前常见的语音转文字的 AI 工具有以下几种: 1. GVoice:中文识别率优秀,少量错误可被 ChatGPT 正常理解和纠错,衔接流畅。 2. Reccloud:免费的在线 AI 字幕生成工具,可直接上传视频进行精准识别,能翻译并生成双语字幕,声称处理了 1.2 亿+视频,识别准确率接近 100%。 3. 绘影字幕:一站式专业视频自动字幕编辑器,支持 95 种语言,准确率高达 98%,可自定义字幕样式。 4. Arctime:能对视频语音自动识别并转换为字幕,支持自动打轴,支持 Windows 和 Linux 等主流平台及 SRT 和 ASS 等字幕功能。 5. 网易见外:国内知名语音平台,支持视频智能字幕功能,转换正确率较高,支持音频转写功能。 6. Ava:为聋人和重听者提供专业和基于 AI 的字幕(转录和说话人识别)。 7. Verbit:专业的基于 AI 的转录和字幕。 8. Otter:混合团队高效协作会议所需的工具。 9. Trint:音频转录软件,从语音到文本到魔法。 10. Rev:99%准确的字幕、转录和字幕服务。 11. Voiceitt:为语音不标准的人群提供的应用程序。 12. Deepgram.com:通过 AI 语音识别实现更快速、更准确的语音应用。 13. Fireflies.ai:会议的 AI 助手。 14. SoapBox:让孩子们的声音被听见的语音技术。 15. Amberscript:使用语音识别自动将音频和视频转换为文本和字幕的 SaaS 解决方案。 16. Speaksee:实时字幕记录面对面小组会议中的发言内容。 17. Speechmatics:理解每个声音的自主语音识别技术。 18. Sonix:支持 35 多种语言的自动转录。 需要注意的是,不同工具在不同场景和语言环境下的准确率可能会有所差异,您可以根据自己的具体需求选择适合的工具。
2024-09-23
最近有哪些 AI + 社交的应用
以下是一些近期的 AI + 社交的应用: 1. BOSS 直聘简历筛选功能:这是一个 AI 招聘简历筛选系统,运用自然语言处理和机器学习技术,市场规模达数亿美元。它能快速筛选简历,提高招聘效率,根据企业招聘要求提取关键信息,为企业推荐符合条件的候选人,比如筛选出有特定技能或工作经验的简历。 2. 贝壳找房租赁管理功能:这是一个 AI 房地产租赁管理系统,运用数据分析和自然语言处理技术,市场规模达数亿美元。它可以管理房地产租赁业务,提高效率,比如根据租客的需求和偏好自动推荐合适的房源。 3. 腾讯游戏社交平台:这是一个利用 AI 技术的游戏社交平台,运用数据分析和机器学习技术,市场规模达数十亿美元。它为玩家提供社交功能,如好友推荐、游戏组队、社区互动等,增强游戏体验,例如根据玩家的游戏历史和兴趣爱好推荐可能成为好友的玩家。 4. Butterflies AI:这是一款人类与 AI 共存的社交软件。 5. 对比流行的社交应用,即使是像 ChatGPT 这样的顶流,其首月用户留存度(56%)也不及社交应用的中位数(63%)。一些优秀的消费级社交应用,如 WhatsApp,DAU/MAU 比高达 85%,而生成式 AI 应用的中位数只有 14%,但 AI 陪伴类别除外。
2024-11-11
MT内部AIGC应用记录
以下是关于 MT 内部 AIGC 应用的记录: 在“海岱青州”晚会项目中,Shoppen 墨导受张健导演委托,将 AI 技术融入舞台展现。考虑使用 AIGC 的原因主要有两点:一是在史诗叙事中,为追求宏大视觉呈现,AIGC 能实现更多非常规视角的视觉创作;二是时间紧迫、任务繁重,传统手段制作全套视觉的建模渲染压力大。在两周左右的时间里,参与了整个晚会的制作过程,全面测试了 AIGC 在严肃内容制作中的价值。 AIGC 相关概念: 人工智能(AI):一种目标,让机器展现智慧。 生成式人工智能(GenAI):一种目标,让机器产生复杂有结构的内容。 机器学习:一种让机器自动从资料中找到公式的手段。 深度学习:更厉害的手段,类神经网络,具有非常大量参数的函数。 大语言模型:具有大量参数的“深度学习”模型。 ChatGPT:美国 OpenAI 公司开发的基于大型语言模型(LLM)的对话机器人,能根据用户输入生成连贯相关的文本回复,是 AIGC 技术在文本生成领域的一个应用实例。 AIGC 是利用人工智能技术生成内容的新型生产方式,包括文本、图像、音频和视频等。其技术可用于多种应用,如自动撰写新闻文章、生成艺术画作、创作音乐、制作视频游戏内容等。 AGI、GenAI、AIGC 几个概念的区别与理解可参考相关图示。更多概念可问 Kimi、通义千问、文心一言等大模型。国内主要模型公司及地址如下。
2024-11-11
汽车行业AI应用
以下是人工智能在汽车行业的一些应用: 1. 自动驾驶技术:利用 AI 进行图像识别、传感器数据分析和决策制定,如特斯拉、Waymo 和 Cruise 等公司都在开发和测试自动驾驶汽车,实现自主导航和驾驶。 2. 车辆安全系统:AI 用于增强车辆的安全性能,如自动紧急制动、车道保持辅助和盲点检测系统,通过分析摄像头和传感器数据预防事故。 3. 个性化用户体验:根据驾驶员的偏好和习惯调整车辆设置,包括座椅位置、音乐选择和导航系统,提供更个性化和舒适的驾驶体验。 4. 预测性维护:分析车辆实时数据预测潜在故障和维护需求,减少停机时间和维修成本,提高车辆可靠性和效率。 5. 生产自动化:在汽车制造中用于自动化生产线,提高生产效率和质量控制,监测设备状态并优化生产流程,减少人为错误。 6. 销售和市场分析:汽车公司用 AI 分析市场趋势、消费者行为和销售数据,以理解客户需求、制定营销策略和优化产品定价。 7. 电动化和能源管理:在电动汽车的电池管理和充电策略中发挥作用,优化电池使用和充电时间,提高能源效率和延长电池寿命。 8. 共享出行服务:如 Uber 和 Lyft 等共享出行平台使用 AI 优化路线规划、调度车辆和定价策略,提高服务效率和用户满意度。 9. 语音助手和车载娱乐:AI 驱动的语音助手允许驾驶员通过语音命令控制车辆功能、获取信息和娱乐内容。 10. 车辆远程监控和诊断:AI 系统远程监控车辆状态,提供实时诊断和支持,帮助车主及时了解车辆状况并采取措施。 此外,还有一些相关的 AI 应用案例,如汽车之家车商城利用 AI 分析用户购车需求和预算,为用户推荐合适的汽车品牌和车型,并提供购车优惠和金融服务。
2024-11-11
想剪辑视频,哪个AI应用帮助更大?
以下是一些在视频剪辑方面能够提供较大帮助的 AI 应用: 1. 对于专业创作者(艺术家、影视人等): AI 生成能够为作品赋予独特风格和想象力,为创作者提供灵感。 低成本动捕能大幅降低后期制作的门槛和成本,自动识别背景生成绿幕、视频主体跟随运动等功能能够辅助视频编辑,为后期制作增加更多空间。 目前该应用主要集中在音乐 MV、短篇电影、动漫等方向。一些 AI 视频平台也积极寻求创意合作,为创作者提供免费支持。例如,@valleeduhamel 使用现有的素材、Gen1 和大量合成创作了新电影《After Light》,Ammaar Reshi 的团队使用 Stable WarpFusion + Davinci Resolve 制作完整的动漫剧情。 2. 对于自媒体、非专业创作者: 科技、财经、资讯类重脚本内容的视频制作者,在制作时面临寻找视频素材和版权问题,一些产品(如 Invideo AI、Pictory)已在发力脚本生成分镜、视频,帮助创作者降低视频素材制作门槛。 Gamma AI 已实现文章高效转 PPT 的能力,若能结合 Synthesia、HeyGen AI、DID 等产品的 Avatar、语音生成能力也可快速转化为视频内容。 不同平台适合不同内容形式,创作者想要将同一个素材在不同平台分发就意味着制作成本的升高。而 OpusClip 提供的长视频转短视频致力于解决这一痛点。 3. 对于企业客户: 对于没有足够视频制作资金的小企业、非盈利机构来说,AI 视频生成可以为其大幅缩减成本。 此外,还有 MMVid 这一集成的视频理解系统,能处理和理解长视频内容并进行问答。其应用场景包括快速的视频剪辑、图生视频、快速诊断等。 在剪辑流程方面,以剪映为例,流程包括视频粗剪、视频定剪、音效/音乐、特效、包装(如字幕)。视频粗剪时可先确定画面逻辑,声音作部分参考,粗剪画面无需精美,先把握片子全貌,再进行细节调整和画面替换。音效和音乐方面,剪映中有简单音效库,复杂和真实音效可能需另外制作,音乐商用需注意版权。特效方面,可根据需要添加,如光的效果。包装方面,剪映可智能匹配字幕再修改。
2024-11-11
AI在产品经理岗位上的应用
AI 在产品经理岗位上有以下应用: 1. 辅助精读论文:能帮助翻译、拆解公式,分析代码等。可使用工具如 https://scispace.com 。 2. 编写小脚本:如写 SQL 查询、Python 脚本、正则表达式、图片批量处理等。 3. 撰写产品宣传文案:根据产品宣传渠道写营销文案、营销邮件、产品上架文案等。 4. 调研问卷设计与整理:生成调研框架,回收非结构化问卷,按指定框架生成指定表头表格。 5. 竞品分析:用 BingChat 或 ChatGPT Browsering 插件,按指定框架对比各项数据,如 DAU、用户结构、市场占比等。 6. 解释专业名词:很多垂直领域有不少缩写或行业黑话,可以用 ChatGPT 解释举例、给场景说明。 此外,还有以下相关内容: 写完 PRD 后,可让 GPT 从产品和研发两个视角写逻辑代码,既能发现自己产品逻辑表达问题,也方便以后 QA 同学测试。 创业团队的产品经理身兼数职,在做产品、营销推广、写脚本、数据分析等方面都能用到 AI,语言不再是障碍,有利于做出海产品。 作为产品经理,可以使用如 PMAI 这样的工具,它是一款面向产品经理的生产力工具,具有一键生成 PRD、输出解决方案、生成 SQL 等实用功能。产品体验地址:https://www.pmai.cn/?utm_source=qoZaR5O 。还可以参考作者 nimbus 关于用 10 个 Prompt 提示词做产品经理 AI 助手效果平替 PMAI 的相关内容,飞书原文:https://cskfogs2c7.feishu.cn/wiki/Dm2swP3sJiOkaEkevdAcevLNnLf?from=from_copylink ,微信公众号原文:https://mp.weixin.qq.com/s/XZ4XhpEKwcDRBBfINHjUYg 。
2024-11-11
AI在中国国内财务领域的应用
AI 在中国国内财务领域有以下应用: 1. 风控和反欺诈:用于识别和阻止欺诈行为,降低金融机构的风险。 2. 信用评估:评估借款人的信用风险,帮助金融机构做出更好的贷款决策。 3. 投资分析:分析市场数据,帮助投资者做出更明智的投资决策。 例如摩根大通通过处理大量数据集、检测模式并整合多个变量,利用人工智能完善经济和货币预测,为政策选择提供信息,改善利率、流动性管理和宏观审慎措施的决策。
2024-11-10
算力怎么提高
提高算力的方法主要有以下几种: 1. 技术创新: 继续在硅基上发展,如采用 3D 堆叠形态,但需要解决更好的散热问题。 材料创新,包括硅基掺杂、石墨烯片等。 探索计算原理的创新,如量子计算,不过目前距离商用还有不少理论和技术需要突破。 2. 提升传输速度:高速网络会进一步进化,片间链接、片上内存等技术都会有明显的进展。 3. 解决能耗和散热问题:高温超导技术是这方面的关键。 4. 白嫖算力的思路: 利用 Groq 平台提供的个人免费 APIKEY 接口,不同模型有相应限制。以 llama370b 为例,每分钟 30 次 request,每分钟 6000 tokens,每天 14400 次。 将 API 调用接入各种平台提供方,无需购买和部署云服务器。 考虑通过代理的方式解决国内 IP 访问限制,如 Cloudflare 或 Deno Deploy 等。 5. 从模型变强的要素来看: 算力方面,根据预估,到 2027 年底很可能会再增加 2 个 OOM,甚至在微软和 OpenAI 的超算合作下,接近 3 个多 OOM 也是有可能的。 算法效率方面,通过对架构的优化,到 2027 年能提升 1 2 OOM。 额外的潜力方面,通过强化反馈学习 RLHF、思考链 CoT、工具和 Scaffolding 等方法微调来提升模型能力。
2024-11-06
有哪些免费的可以提高图片分辨率的网站
以下是一些免费提高图片分辨率的方法和相关网站: 1. 在 Stable Diffusion 中: 文生图功能中有内置的高清修复(HiresFix)功能。将初始分辨率设置为 800x420 时,选择放大倍率为 2,理论上放大倍率越高,图片越清晰,但最高可达 4 倍,实际效果与电脑配置和显卡显存有关。 先以较低分辨率画图,获取生成图的种子值,然后将其填入随机数种子以固定图片,再进行高清修复,放大算法如二次元绘图可选择 RESRGAN 4x+ Anime6B,写实类风格可选择 RESRGAN 4x+。 2. Stability AI 推出的基于 Discord 的工具: :将低分辨率、低质量的图像转换为 4k 杰作,价格为 25 积分。 :简单、低成本的分辨率提升,价格为 0.2 积分。 此外,在 MJ 应用中也有相关操作,如复制图像链接和提示词等步骤来生成新的图像,并通过改变比例和镜头拉远等操作调整构图,最终提升分辨率。
2024-11-06
我只是想要修改背景和提高图片质量,哪个图片AI工具最合适
以下是一些适合修改背景和提高图片质量的图片 AI 工具: Liblibai:具有迭代步数、尺寸、生成批次、每批数量、提示词引导系数、随机数种子、ADetailer、ControlNet、重绘幅度等设置,可调整图片内容。 迭代步数:调整图片的次数,越多理论上效果越好,但并非越多越好。 尺寸:影响生成图片的大小,需适中选择。 生成批次和每批数量:控制生成图片的数量。 提示词引导系数:影响图像与提示的匹配程度,过高会使质量下降。 ADetailer 和 ControlNet 为高阶技能。 重绘幅度:用于图生图,决定输出图与输入图的差别。 辅助工具: 本地工具放大:https://www.upscayl.org/download SD 放大:扩散模型可增加细节。 开源工作流: stability.ai 的 https://clipdrop.co/tools 画质增强: magnific:https://magnific.ai/ Krea:https://www.krea.ai/apps/image/enhancer Image Upscaler:https://imageupscaler.com/ 佐糖:https://picwish.cn/photoenhancerapi?apptype=apsbdapi&bd_vid=8091972682159211710 腾讯 ARC:https://arc.tencent.com/zh/aidemos/humansegmentation?ref=88sheji.cn 腾讯开源的模型,能恢复老照片:https://github.com/TencentARC/GFPGAN 在线测试地址:https://replicate.com/tencentarc/gfpgan 美图老照片修复:https://www.xdesign.com/quality/?channel=sllbd90&bd_vid=11711254260543749686 Imglarger:https://imglarger.com/ Let's Enhance:https://letsenhance.io/ Waifu2x:http://waifu2x.udp.jp/ Photoshop 2023 Beta:更擅长对原有图像的扩充,具有创成式填充功能,可去除人物、添加元素等,但生成的某些图形质量可能不如 MJ 和 SD 的效果,仍需后期处理来达到满意效果。
2024-11-04
学习法律如何使用AI来提高学习效率
以下是关于学习法律如何使用 AI 来提高学习效率的方法和建议: 1. 数据分析处理:将数据清洗、提取、模型选择、训练和结果解释等环节分开处理,针对每个环节优化 AI 性能,便于发现和修正问题。 2. 提问方式:针对复杂问题,采用逐步深化和细化的方式提问。先提出宽泛问题,再根据回答进一步细化或深化。 3. 提供学习内容:给 AI 提供大量数据和示例,包括高质量的参考材料、操作指南、行业最佳实践、案例研究等,同时编写详细流程和知识。 4. 利用专业术语引导:在 Prompt 中使用法律术语引导 AI 回答方向。 5. 总结与组织:在提供法律建议时,用简洁明了的语言总结核心观点和注意事项,使用引号、分隔符号及连接词组织 Prompt。 6. 设定角色和能力:赋予 AI 专注于民商事法律领域、擅长案例研究等角色,提升工作效率。 7. Prompt 方法总结:格式为【设定角色+任务目标+上下文和背景信息+(正面要求)详细需求和细节性信息+(负面要求)限制和不需要的内容+回答的语言风格和形式】 8. Prompt 技巧:讲清楚背景和目的,学会提出好问题,拆解工作流程,切分环节,具体落实到工作细节。 需要注意的是,以上内容仅供参考,在实际应用中请结合自身情况进行调整和实践。
2024-10-27
剪辑事如何使用ai提高效率
在剪辑工作中,可通过以下方式利用 AI 提高效率: 1. 团队分工: 制片人负责影片的制作管理,包括团队组建、日程安排等。 图像创意人员用 AI 生成富有想象力的角色和场景,并为每个角色赋予人物小传。 视频制作人员将做好的图像素材进行 AI 图生文的工作,擅长运用工具控制以契合剧本。 编剧撰写剧本,包括故事情节、角色串联、人物台词等。 配音和配乐人员利用各种声音类 AI 工具完成相关工作。 剪辑师负责后期剪辑,包括镜头选择、节奏控制和音效配合。 团队成员分工明确,形成高效的 SOP,可快速产出。 2. 工具选择: 剪映具有人性化设计和简单音效库,但无法协同工作和导出工程文件,难以达到更好的商业化效果。 对于复杂和真实的音效制作,可能需要另外的工具。 利用 Adobe Photoshop 网页版的新技术,其 AI 能自动扫描、识别和选择图像中的各种元素,更高效、准确和可控地编辑选定区域。 3. 剪辑流程: 视频粗剪:先确定画面逻辑,声音作为部分参考,快速对片子全貌有整体把握,把素材放上,再看哪些部分需要细节调整和画面替换。 视频定剪:将画面素材调整和替换到满意效果。 音效/音乐:注意版权问题,复杂音效可能需另外制作。 特效:根据需要添加,如为弥补 AI 视频生成吃掉的光影可添加光的效果。 包装(如字幕):字幕最后添加,剪映可智能匹配字幕再修改。
2024-10-21
有哪些可以辅助产品经理提高效率的AI工具
以下是一些可以辅助产品经理提高效率的 AI 工具: 1. 辅助精读论文:能帮翻译、拆解公式,分析代码等。工具:https://scispace.com 2. 写一些小脚本:写 SQL 查询、Python 脚本、正则表达式、图片批量处理等。 3. 产品宣传文案:根据产品宣传渠道写营销文案、营销邮件、产品上架文案等。 4. 调研问卷设计/整理:生成调研框架,回收非结构化问卷,按指定框架生成指定表头表格。 5. 竞品分析:用 BingChat 或 ChatGPT Browsering 插件,按指定框架对比各项数据,如 DAU、用户结构、市场占比等等。 6. 解释专业名词:很多垂直领域,都有不少缩写或行业黑话,可以用 ChatGPT 解释举例、给场景说明。 以下是一些具体的工具集: 1. 用户研究、反馈分析:Kraftful(kraftful.com) 2. 脑图:Whimsical(whimsical.com/aimindmaps)、Xmind(https://xmind.ai) 3. 画原型:Uizard(https://uizard.io/autodesigner/) 4. 项目管理:Taskade(taskade.com) 5. 写邮件:Hypertype(https://www.hypertype.co/) 6. 会议信息:AskFred(http://fireflies.ai/apps) 7. 团队知识库:Sense(https://www.senseapp.ai/) 8. 需求文档:WriteMyPRD(writemyprd.com) 9. 敏捷开发助理:Standuply(standuply.com) 10. 数据决策:Ellie AI(https://www.ellie.ai/) 11. 企业自动化:Moveworks(moveworks.com) 此外,还有 nimbus 提到的一些 Prompt 提示词可作为产品经理的 AI 助手,效果平替 PMAI。PMAI 是一款面向产品经理的生产力工具,具有一键生成 PRD、输出解决方案、生成 SQL 等实用功能。产品体验地址:https://www.pmai.cn/?utm_source=qoZaR5O
2024-10-21