Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

文生图如何提高字在图中的准确率

Answer

要提高文生图中字在图中的准确率,可以从以下几个方面入手:

  1. 数据准备:
    • 对于中文文字的生成,Kolors从两个方面准备数据。一是选择 50000 个最常用的汉字,机造生成了一个千万级的中文文字图文对数据集,但机造数据真实性不足。二是使用 OCR 和 MLLM 生成海报、场景文字等真实中文文字数据集,大概有百万量级。
    • Hugging 和英特尔发布了提高文生图模型空间一致性的方案,包括一个详细标注了空间关系的 600 万张图片的数据集,模型和数据集都会开源。
  2. 模型能力:
    • DALL-E 3 和 SD3 已经有了很强的英文文字生成能力,但目前还未有模型具有中文文字的生成能力。中文文字的生成存在困难,一是中文汉字的集合大且纹理结构复杂,二是缺少中文文字的图文对数据。
    • 作者观察到,使用机造数据结合高质量真实数据后,中文文字生成能力的真实性大大提升,而且即使是真实数据中不存在的汉字的真实性也得到了提升。
  3. 训练方法:
    • 在包含大量物体的图像上进行训练,可以显著提高图像的空间一致性。

此外,在写文生图的提示词时,通常的描述逻辑是这样的:人物及主体特征(服饰、发型发色、五官、表情、动作),场景特征(室内室外、大场景、小细节),环境光照(白天黑夜、特定时段、光、天空),画幅视角(距离、人物比例、观察视角、镜头类型),画质(高画质、高分辨率),画风(插画、二次元、写实)。通过这些详细的提示词,能更精确地控制绘图。对于新手而言,还有一些功能型辅助网站来帮我们书写提示词,比如:http://www.atoolbox.net/ 、https://ai.dawnmark.cn/ 。还可以去 C 站(https://civitai.com/)里面抄作业。但要注意图像作者使用的大模型和 LORA,不然即使参数一样,生成的图也会截然不同。

Content generated by AI large model, please carefully verify (powered by aily)

References

模型能力简介

准确生成文字的能力一直是文生图模型的一大难题。DALL-E 3和SD3已经有了很强的英文文字生成能力。但是,目前还未有模型具有中文文字的生成能力。中文文字的生成有两点困难:一是相比于英文呢,中文汉字的集合太大,而且纹理结构更复杂;二是缺少中文文字的图文对数据。为了提升中文文字的生成能力,Kolors从两个方面准备数据。一是选择50000个最常用的汉字,机造生成了一个千万级的中文文字图文对数据集。但是机造数据毕竟真实性不足。因此,第二方面又实用OCR和MLLM生成了海报、场景文字等真实中文文字数据集,大概有百万量级。作者观察到,虽然使用机造数据一开始中文文字的生成能力的真实性比较差,但是在结合高质量真实数据之后,真实性大大提升,而且即使是真实数据中不存在的汉字的真实性也得到了提升。[heading3]图片视觉质量[content]作为一个生图模型,好不好看,自然才是最关键的指标。Kolors从数据和训练方法两方面入手,提升图片视觉质量。在网络结构方面,Kolors没有进行改动,仍旧使用与SDXL一致的UNet结构。

【SD】文生图怎么写提示词

下次作图的时候,只需要先选择你的模板,然后点击倒数第二个按钮,就能将这些标准提示词快速输入了。我们来看一下加入标准提示词后的效果,是不是好了很多。我们通常的描述逻辑是这样的:人物及主体特征(服饰、发型发色、五官、表情、动作),场景特征(室内室外、大场景、小细节),环境光照(白天黑夜、特定时段、光、天空),画幅视角(距离、人物比例、观察视角、镜头类型),画质(高画质、高分辨率),画风(插画、二次元、写实)。通过这些详细的提示词,我们就能更精确的控制Stable Diffusion的绘图了。对于新手而言,我们还有一些功能型辅助网站来帮我们书写提示词。比如:http://www.atoolbox.net/。它可以通过选项卡的方式快速地填写关键词信息。还有:https://ai.dawnmark.cn/。它的每种参数都有缩略图可以参考,可以方便我们更加直观的选择提示词。还有一个方法就是去C站(https://civitai.com/)里面抄作业,每一张图都有详细的参数,我们可以点击下面的复制数据按钮。然后直接粘贴到正向提示词栏里,然后点击生成按钮下的第一个按键,Stable Diffusion就可以将所有的参数自动匹配了。不过,还要注意图像作者使用的大模型和LORA,不然即使参数一样,生成的图也会截然不同。我们也可以只取其中比较好的一些描述词使用,比如人物描写、背景描述、一些小元素或者是画面质感之类的。好了,我们讲到这里,大家应该已经基本了解了文生图的使用方法和逻辑了,采用正确的语法规则和思路能让我们得到更好效果的AI绘图,快练习起来吧。-END-白马与少年Stable Diffusion、Blender等学习心得分享139篇原创内容(持续更新中)公众号

AIGC Weekly #66

[Getting it](https://spright-t2i.github.io/)[Righ[content]Hugging和英特尔发布了提高文生图模型空间一致性的方案,大幅提高了模型对提示词中空间关系的理解能力。还有一个详细标注了空间关系的600万张图片的数据集,模型和数据集都会开源。完整简介:当前将文字描述转换为图像的技术(T2I)面临一个关键短板,那就是它们往往无法精准地生成与文字提示中所描述的空间关系相符的图像。在本文中,我们全面调查了这一限制,并开发了一些数据集和方法,以此达到行业领先水平。首先,我们发现目前的图文数据集对空间关系的表达不够充分。为了解决这个问题,我们创建了SPRIGHT——第一个专注于空间关系的大规模数据集,方法是重新标注了来自四个广泛使用的图像数据集的600万张图片。经过三重评估和分析,我们发现SPRIGHT在捕捉空间关系方面大幅超越现有数据集。我们仅使用约0.25%的SPRIGHT数据,就在制作空间准确的图像方面取得了22%的提升,并且在FID(图像质量评分)和CMMD(跨模态匹配度评分)上也有所改进。其次,我们还发现,在包含大量物体的图像上进行训练,可以显著提高图像的空间一致性。特别地,我们在少于500张图片上进行微调后,在T2I综合比赛平台(T2I-CompBench)上达到了0.2133的空间得分,创造了新的最高记录。最后,通过一系列严格的实验和测试,我们记录了多项发现,这些发现有助于深入理解影响文字描述转换为图像技术在空间一致性方面的各种因素。

Others are asking
文生视频哪个网站最好,免费的
以下是一些免费的文生视频网站推荐: 1. Pika:一款出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。网址:https://pika.art/ https://discord.gg/pika 。 2. SVD:如果熟悉 Stable Diffusion,可以直接安装这款最新的插件,在图片基础上直接生成视频。这是由 Stability AI 开源的 video model。 3. Hidreamai(国内,有免费额度):https://hidreamai.com//AiVideo 支持文生视频、图生视频,提示词使用中文、英文都可以,文生视频支持正向提示词、反向提示词、运镜控制、运动强度控制,支持多尺寸,可以生成 5s 和 15s 的视频。 4. ETNA(国内):https://etna.7volcanoes.com/ 是一款由七火山科技开发的文生视频 AI 模型,它可以根据用户简短的文本描述生成相应的视频内容。生成的视频长度在 8~15 秒,画质可达到 4K,最高 38402160,画面细腻逼真,帧率 60fps,支持中文,时空理解。 更多的文生视频的网站可以查看这里:https://www.waytoagi.com/category/38 。 内容由 AI 大模型生成,请仔细甄别。
2025-01-26
现在有哪些开源的文生图大模型?
以下是一些开源的文生图大模型: Kolors: 2024 年 7 月 6 日开源,基于数十亿图文对进行训练,支持 256 的上下文 token 数,支持中英双语。技术细节参考 。 已支持 Diffusers,使用方式可参考 。 支持了 。 支持了 。 关于 Kolors 模型的教学视频: ,作者:BlueBomm 。 ,作者:AI 算法工程师 01 。 ,作者:峰上智行 。 ,作者:设计师学 Ai 。 Kolors 模型能力总结:改进全面,有更强的中文文本编码器、机造的高质量文本描述、人标的高质量图片、强大的中文渲染能力,以及巧妙的 noise schedule 解决高分辨率图加噪不彻底的问题。实测效果很不错,在看到 Kling 视频生成的强大表现,能体现快手的技术实力。
2025-01-24
如何让文生图,做到风格一致,人物一致,场景风格一致,
要让文生图在风格、人物和场景风格上保持一致,可以参考以下方法: 1. 图片生成工具:可使用 Midjourney 进行图片生成。 2. 画面电影感: 画幅:常用 21:9 的画幅比例,其会影响构图和光影。 Prompt 风格后缀:例如“________.Shot on Sony Venice 2,muted color tones,green and dark gray,awardwinning composition,cinematic scenear 21:9”。 专用摄影机:在 Prompt 里可添加电影专用摄影机,如 RED Helium 8K 等。 3. 人物一致性: 对于主角,可先跑一张定妆照。 利用 Midjourney 的新功能 Cref 保持发型、人脸、衣服,但对亚洲人脸尤其是老人的一致性效果较差,且对画面审美和构图有一定破坏性,能不用则不用,如只有背影时简单描述即可。 4. 场景一致性:目前尚无很好的解决办法,基本随缘。 此外,还可参考以下方式: 1. 生成人物图片:确定人物形象,如“a little girl wearing a yellow floral skirt+人物动作+风格词”,在 Midjourney 中生成满意的人物图像,为确保人物一致性,取“iw 2”。 2. 合成人物和场景:使用 PS 或者 Canva 将人物和场景合成到一张图,若色调不和谐,可将合成后的图作为垫图(“iw 2”),在 Midjourney 中重新生图。
2025-01-23
如何书写文生视频提示词达到连贯效果 并且根据自己的运镜指导运镜
以下是关于如何书写文生视频提示词达到连贯效果并且指导运镜的方法: 1. 在 PixelDance V1.4 中,支持在 prompt 里写入运镜控制,可用自然语言描述想要的镜头变化,例如“镜头环绕口红拍摄”“黑白风格,镜头环绕着戴墨镜的女人拍摄,从她侧面移动到正面,最后聚焦于女人的面部特写”“雨后模糊的玻璃逐渐聚焦,一个男人举着伞,带着一只金毛犬路过”等。 2. 对于更复杂的视频项目,在为 Generate video(beta)编写提示词时,可提供背景或背景故事,有助于生成连贯且引人入胜的序列。同时,Firefly 通常可以模拟真实世界的摄像机工作,可具体说明希望摄像机的角度或移动,如常见的相机方向有特写、广角镜头、平移/缩放/跟踪、从天而降、从下方拍摄等。 3. 在制作商业级的 AI 视频广告时,以汽车内饰片段为例,登录 runway 账户,在首页左侧点击“Text/Imagine to Video”,上传图片,更改大模型版本,在提示词方框中输入运镜方式,如“Roll Clockwise Shot slowly”(摄像机围绕垂直轴顺时针旋转)。不想动脑时可根据分镜表建议填写运镜方式,也可参照“运镜方式大全”。注意提示词不宜过多,可通过改变提示词、生成时长等多尝试几次。
2025-01-23
国内文生图模型
以下是关于国内文生图模型的相关信息: Recraft 模型:用 8 个月自研模型,包含处理数据的模型、标注工作、训练 OCR 模型、新构建的数据集等。Recraft 生成带有长文本图像的流程图解,但存在生成默认是外国面孔而非亚洲面孔且生成的亚洲人不太自然的情况,可能与数据集有关。只有少数公司真正从头训练模型,创建自己的模型困难且成本高,需要超强团队和资金。 模型能力方面: 文本编码器的能力是文生图模型语义理解能力的关键。一开始大部分模型使用 CLIP 作为文本编码器,但存在一些问题。新的模型纷纷优化文本编码器能力,如引入更大更强的 T5XXL 或结合多个特征,但开源模型在中文生图方面能力一般。 腾讯开源的 HunyuanDiT 是较可用的中文生图模型,但仍存在优化空间。 Kolors 是最近开源的给力文生图模型,改进全面,技术实力强。
2025-01-21
文生成图的ai工具
以下是一些文生成图的 AI 工具: 1. DALL·E:由 OpenAI 推出,能根据输入的文本描述生成逼真的图片。 2. StableDiffusion:开源的文生图工具,可生成高质量图片,支持多种模型和算法。 3. MidJourney:因高质量的图像生成效果和用户友好的界面设计而受欢迎,在创意设计人群中流行。 您还可以在 WaytoAGI 网站(https://www.waytoagi.com/category/104 )查看更多文生图工具。 如果您想将小说做成视频,可以参考以下步骤和工具: 步骤:通常包括文本分析、角色与场景生成、视频编辑与合成等。 工具与网址: 1. Stable Diffusion(SD):AI 图像生成模型,基于文本描述生成图像。网址:https://github.com/StabilityAI 2. Midjourney(MJ):适用于创建小说中的场景和角色图像。网址:https://www.midjourney.com 3. Adobe Firefly:Adobe 的 AI 创意工具,可生成图像和设计模板。网址:https://www.adobe.com/products/firefly.html 4. Pika AI:文本生成视频的 AI 工具,适合动画制作。网址:https://pika.art/waitlist 5. Clipfly:一站式 AI 视频生成和剪辑平台。网址:https://www.aihub.cn/tools/video/clipfly/ 6. VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能。网址:https://www.veed.io/zhCN/tools/aivideo 7. 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具。网址:https://tiger.easyartx.com/landing 8. 故事 AI 绘图:小说转视频的 AI 工具。网址:https://www.aihub.cn/tools/video/gushiai/
2025-01-19
如何提高RAG应用中的准确率
以下是一些提高 RAG 应用准确率的方法: 1. 基于结构化数据来 RAG: 避免数据向量化和语义搜索的问题,直接利用原始数据和 LLM 的交互,提高准确率。因为结构化数据的特征和属性明确,能用有限标签集描述,可用标准查询语言检索,不会出现信息损失或语义不匹配的情况。 减少 LLM 的幻觉可能性,LLM 只需根据用户问题提取核心信息和条件,并形成标准查询语句,无需理解整个文档语义。 提高效率,省去数据向量化和语义搜索过程,直接使用标准查询和原始数据进行回复,且结构化数据的存储和更新更易更省空间。 增加灵活性,适应不同数据源和查询需求,只要数据是结构化的,就可用此方法进行 RAG。 2. 参考行业最佳实践,如 OpenAI 的案例: 从较低的准确率开始,尝试多种方法,标记哪些被采用到生产中。 通过尝试不同大小块的信息和嵌入不同内容部分,提升准确率。 采用 Reranking 和对不同类别问题特别处理的方法进一步提升。 结合提示工程、查询扩展等方法,最终达到较高的准确率,同时强调模型精调和 RAG 结合使用的潜力。 3. 深入了解 RAG 的基础概念: RAG 由检索器和生成器组成,检索器从外部知识中快速找到与问题相关的信息,生成器利用这些信息制作精确连贯的答案,适合处理需要广泛知识的任务,如问答系统,能提供详细准确的回答。
2024-11-08
目前语音转文字的AI工具有哪些,准确率怎样
目前常见的语音转文字的 AI 工具有以下几种: 1. GVoice:中文识别率优秀,少量错误可被 ChatGPT 正常理解和纠错,衔接流畅。 2. Reccloud:免费的在线 AI 字幕生成工具,可直接上传视频进行精准识别,能翻译并生成双语字幕,声称处理了 1.2 亿+视频,识别准确率接近 100%。 3. 绘影字幕:一站式专业视频自动字幕编辑器,支持 95 种语言,准确率高达 98%,可自定义字幕样式。 4. Arctime:能对视频语音自动识别并转换为字幕,支持自动打轴,支持 Windows 和 Linux 等主流平台及 SRT 和 ASS 等字幕功能。 5. 网易见外:国内知名语音平台,支持视频智能字幕功能,转换正确率较高,支持音频转写功能。 6. Ava:为聋人和重听者提供专业和基于 AI 的字幕(转录和说话人识别)。 7. Verbit:专业的基于 AI 的转录和字幕。 8. Otter:混合团队高效协作会议所需的工具。 9. Trint:音频转录软件,从语音到文本到魔法。 10. Rev:99%准确的字幕、转录和字幕服务。 11. Voiceitt:为语音不标准的人群提供的应用程序。 12. Deepgram.com:通过 AI 语音识别实现更快速、更准确的语音应用。 13. Fireflies.ai:会议的 AI 助手。 14. SoapBox:让孩子们的声音被听见的语音技术。 15. Amberscript:使用语音识别自动将音频和视频转换为文本和字幕的 SaaS 解决方案。 16. Speaksee:实时字幕记录面对面小组会议中的发言内容。 17. Speechmatics:理解每个声音的自主语音识别技术。 18. Sonix:支持 35 多种语言的自动转录。 需要注意的是,不同工具在不同场景和语言环境下的准确率可能会有所差异,您可以根据自己的具体需求选择适合的工具。
2024-09-23
如何快速提高向AI工具的提问能力
以下是一些快速提高向 AI 工具提问能力的方法: 1. 先了解 AI 工具的功能和适用范围,明确其能解决的问题类型。 2. 学习相关的基础知识,例如 AIGC 背后的原理,以便更深入理解 AI 的可能性和局限性。 3. 避免拟人化的提问方式,而是直接清晰地描述问题。 4. 对于复杂的问题,逐步分解,分步骤进行提问。 5. 学会批判性地看待 AI 的输出结果,如有错误,分析原因并进一步优化提问。 6. 多参考他人成功的提问案例,如学生在春游前提问关于便携食物的规划。 7. 利用群里的交流氛围,如“公开问”,学习他人的提问技巧。 8. 对于不熟悉的领域,先进行一定的知识储备,再向 AI 提问。 9. 不断练习和尝试,在实践中总结经验,提高提问的准确性和有效性。
2025-01-28
怎么用AI提高团队工作效率,贸易类
以下是一些利用 AI 提高贸易类团队工作效率的方法: 1. 利用 AI“词生卡”技术:将抽象的文字描述转化为直观的逻辑图表和流程图,帮助团队更好地理解和执行复杂任务。团队成员可以通过“词生卡”方式自定义活动海报、商务名片、简历,也可以用于日报、月报等介绍工作进度,实现文图双输出,提高信息传导效率,并为创新思维提供新工具。 2. 参考哈佛商学院的研究:在工作中使用 AI 可以带来工作效率的显著改善。使用 AI 的被测试者比未使用者平均多完成 12.2%的任务,完成速度提高 25.1%,结果质量提高 40%。同时要注意,类似 GPT4 这样的模型有能力边界,过于依赖可能适得其反。能力较弱的被测试者提升较大,高级人才和低级人才的差距会被拉平。 3. 采用合适的协作方式:如“半人马”模式,强调人与 AI 紧密结合但各司其职,人类主导流程,根据任务性质调配资源;“机械人”模式,人与 AI 高度融合,在细节上循环迭代优化,最终实现人机一体化。 总之,合理利用 AI 技术和选择合适的协作方式,能够有效提高贸易类团队的工作效率。
2025-01-23
如何学习使用AI,提高工作效率,以及提高自身全方面能力
以下是关于如何学习使用 AI 来提高工作效率和自身全面能力的建议: 1. 工作方面: 让自己变成“懒人”,能动嘴的不要动手,用嘴说出想做的事。 能动手的尽量用 AI 替代,例如将工作单元切割开,建设属于自己的智能体,并根据结果反馈不断调整。 定期审视工作流程,看哪个部分可以更多地用上 AI,将所学应用于实践,不断优化工作流程。 2. 技术层面: 学习搭建专业的知识库、构建系统的知识体系,不仅用于工作,还可支持个人爱好和创作。 3. 个人素质方面: 提升学习能力,通过持续阅读和实践来吸收、消化和积累知识,培养好奇心和持续学习的习惯,广泛阅读,深入研究新领域,不断探索前沿知识。 提升创造能力,这是在时代保持竞争力的关键。 善用工具,使用 AI 工具自动化重复性任务,适应时代转变,腾出时间进行更高层次思考。 具备抽象与整合能力,在更高层次上学习,为 AI 提供方向并作出合适选择。 4. 编程和研究方面: 参考技术大佬 Nicholas Carlini 的博文「How I Use "AI"」,学习其使用 LLM 进行编程和研究的实例分享。 用 GPT4 构建完整的 Web 应用。 通过与模型的互动式对话学习新技术,如 Docker、Flexbox 和 React 等。 借助 AI 快速获取新项目或新论文所需的样板代码。 用 AI 简化复杂的大型代码库。 将单调且简单的任务交给 AI,如数据格式化等。 在 AI 帮助下提升用户专业度和效率。 通过 AI 获取特定工具或命令的使用信息。 利用 AI 进行搜索,其效果比传统搜索引擎好。 用 AI 解决一次性任务和常见任务,修复常见错误。
2025-01-16
普通人如何学习利用ai,提高工作学习效率,怎么学习及学习顺序是怎样的
以下是为普通人提供的学习利用 AI 以提高工作学习效率的方法及学习顺序: 一、了解 AI 基本概念 首先,建议阅读相关资料,如「」部分,熟悉 AI 的术语和基础概念,包括人工智能是什么、其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。同时,浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 二、开始 AI 学习之旅 在「」中,能找到为初学者设计的一系列课程。特别推荐李宏毅老师的课程。还可以通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并争取获得证书。 三、选择感兴趣的模块深入学习 AI 领域广泛,涵盖图像、音乐、视频等。可根据自身兴趣选择特定模块深入,比如一定要掌握提示词的技巧,其上手容易且实用。 四、实践和尝试 理论学习后,实践是巩固知识的关键。尝试使用各种产品做出自己的作品,在知识库中也有很多大家实践后的作品和文章分享,欢迎自己实践后也进行分享。 五、体验 AI 产品 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解其工作原理和交互方式。通过对话获得对 AI 在实际应用中表现的第一手体验,激发对 AI 潜力的认识。 此外,还可以参考《雪梅 May 的 AI 学习日记》中的学习模式,即输入→模仿→自发创造。同时注意,学习资源大多是免费开源的,可在 waytoAGI 社区发现自己感兴趣的 AI 领域,学习最新的内容。学习时间可根据自身情况灵活安排,不必有压力,能学多少算多少。
2025-01-12
怎样提高ai识别题库准确性
要提高 AI 识别题库的准确性,可以从以下几个方面入手: 1. 检索原理方面: 信息筛选与确认:对检索器提供的信息进行评估,筛选出最相关和最可信的内容,同时验证信息的来源、时效性和相关性。 消除冗余:识别并去除多个文档或数据源中的重复信息,避免在生成回答时出现重复或矛盾的内容。 关系映射:分析不同信息片段之间的逻辑和事实关系,如因果、对比、顺序等,构建结构化的知识框架,使信息在语义上更连贯。 上下文构建:将筛选和结构化的信息组织成连贯的上下文环境,包括对信息进行排序、归类和整合。 语义融合:在必要时合并意义相近但表达不同的信息片段,减少语义重复并增强信息表达力。 预备生成阶段:将整合好的上下文信息编码成适合生成器处理的格式,如转化为适合输入到生成模型的向量形式。 2. 知识库方面: 知识库中的文档需要转换成向量形式,以便在数值级别上与问题向量进行比较。使用知识库工具上传文档时,会完成文档的向量化,这依靠 Embedding Model 完成。 知识库检索:根据问题向量,检索器在庞大的向量空间中搜索相关内容,通过相似性计算(如余弦相似性)找出与问题最接近的文档,再根据相似性得分排序并选择得分最高的几个文档,从中抽取具体的信息片段或答案。 3. 信息整合阶段:将检索到的全部信息连同用户问题和系统预设整合成全新的上下文环境,为生成回答提供基础。 RAG(RetrievalAugmented Generation,检索增强生成)是一种结合信息检索和文本生成能力的技术,由检索器和生成器组成。检索器从外部知识中快速找到与问题相关的信息,生成器利用这些信息制作精确和连贯的答案,适合处理需要广泛知识的任务,如问答系统。
2025-01-10
怎样提高ai识别文档准确性
以下是一些提高 AI 识别文档准确性的方法: 1. 对于过期的文档,在标题里加上【已废弃】【已过期】等字眼,这样在召回排序过程中会被过滤掉,避免影响答案的准确性。 2. 现阶段尽量使用普通文本进行描述,避免过多表格、图片等内容。当前文档里插入的表格内容虽然能被 AI 识别,但识别效果还在提升中,图片等内容还不支持识别。随着技术发展,这些局限会逐渐消除。 3. 文档的标题内容需要跟正文有强相关性,因为召回排序的逻辑里文档总标题在相似度计算中占有较高权重。 4. 不同的知识点尽量分段书写、合理控制段落长度。不同的主题通过文档内的子标题进行区分,子标题下正文里每个段落最好对应一个明确的知识点,每个段落尽量不超过 500 字,避免段落过长在文档分割时导致主题打散。 5. 对于经常被问到的内容,可以写成问答对(FAQ)的格式,当用户提出相关问题时,包含该问答对的片段在召回排序里会更靠前,给出的答案也更准确。
2025-01-10