要通过 LangChain 实现上传客户需求文档并生成产品规格书(doc 格式),可以按照以下步骤进行:
(1)上传文档:用户上传包含知识的文档,支持txt、pdf、docx等格式,LangChain Chatchat会将文档转换为Markdown格式(2)文本切割:为了便于分析和处理,将长文本切割为小块(chunk)(3)文本向量化:将切割的chunk通过embedding技术,转换为算法可以处理的向量,存入向量数据库(4)问句向量化:用户提问后,同样将用户的问句向量化(5)语义检索匹配:将用户的问句与向量数据库中的chunk匹配,匹配出与问句向量最相似的top k个(6)提交prompt至LLM:将匹配出的文本和问句,一起添加到配置好的prompt模板中,提交给LLM(7)生成回答:LLM生成回答,返回给用户