直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

有没有一款AI可以管理个人电脑上存储的各类文件,并且根据这些文件形成个人知识库,方便用户进行搜索、总结、创新等工作?

回答

是的,市面上存在一些AI工具,它们可以帮助管理个人电脑上存储的各类文件,并将这些文件组织成个人知识库,以便于搜索、总结和创新。以下是一些具有这些功能的AI工具或软件:

  1. Evernote(印象笔记):

    • 一个流行的笔记应用,支持跨平台同步,可以存储文本、图片、网页和语音等多种形式的内容。
  2. Notion

    • 一个强大的工作区管理工具,支持笔记、数据库、看板、日历等,可以用来组织个人知识库。
  3. Obsidian

    • 一款基于Markdown的知识管理和笔记应用,支持链接思维和网络化知识结构。
  4. Zettlr

    • 一个面向研究人员和作家的笔记工具,支持引用管理和知识图谱。
  5. Devonthink

    • 一款专业的信息管理软件,支持文档索引、全文搜索和AI辅助的自动分类。
  6. OneNote(微软OneNote):

    • 微软提供的数字笔记本,支持笔记、绘图和文档整理。
  7. Trello

    • 一个看板式的项目管理工具,也可以用来管理个人知识库。
  8. Airtable

    • 一个灵活的数据库工具,结合了电子表格和数据库的功能,支持丰富的字段类型和自定义视图。
  9. Google Keep(谷歌便签):

    • 一个简单的笔记应用,支持文本、图片和语音笔记,可以快速记录想法。
  10. Bear

    • 一款美观的笔记应用,支持Markdown和标签系统,适合个人知识管理。
  11. RemNote

    • 一个专注于学习和记忆的笔记应用,支持双向链接和间隔重复学习。
  12. Nuclear

    • 一个知识管理和搜索工具,支持全文搜索、标签和自定义元数据。

这些工具通常具备强大的搜索功能、标签系统、引用管理、自动分类和AI辅助的整理功能,可以帮助用户高效地管理和利用个人知识库。选择合适的工具时,需要考虑个人的需求、使用习惯和偏好。随着AI技术的发展,这些工具的功能也在不断增强,为用户提供更加智能化的知识管理体验。

内容由 AI 大模型生成,请仔细甄别(powered by aily)
其他人在问
我是一个投资人,我想针对每个项目建立知识库,类似一个个对话的形式,我把关于某个项目的材料全部丢进一个对话中,然后可以针对每个项目进行提问,或者要求AI帮我产出某种类型的文件。哪个App可以最好的满足我的需求?
以下是一些可能满足您需求的 App 选项: 1. WaytoAGI 网站: 提供和 AI 知识库对话的功能,您可以在此询问任何关于 AI 的问题。 集合了精选的 AI 网站,方便您按需求找到适合的工具。 有精选的 AI 提示词,可复制到 AI 对话网站使用。 会将每天知识库的精华内容呈现给大家。 2. 阿里千问模型:可以作为 AI 模型用于问答机器人的配置。 在配置问答机器人时,需要注意模型、提示词和知识库的协同作用。模型就像拥有无穷智慧的人,提示词能设定其角色和专注技能,知识库则如同工作手册,为其提供特定项目的详细信息。
2024-12-17
AI 可以分析文件吗
AI 可以分析文件。在金融服务领域,生成式 AI 模型能够迅速汇总个体关键信息,预测洗钱者,进行更快的文档分析,用于培训和教育等,使合规工作更高效。 在专利审查方面,AI 也得到了广泛应用,例如: 1. 专利检索与分类:通过自然语言处理和机器学习算法,自动识别和分类专利文献。如 Google Patents、IBM Watson for IP 等平台。 2. 专利分析和评估:分析专利文本,评估新颖性和创造性,预测授权可能性。如 TurboPatent、PatentBot 等平台。 3. 自动化专利申请:帮助自动生成专利申请文件,减少人工编写和审查时间。如 Specifio、PatentPal 等平台。 4. 专利图像和图表分析:分析专利申请中的图像和图表,帮助识别和分类技术内容。如 Aulive、AIpowered image recognition tools 等平台。 在处理文档和数据方面,对于数据可以使用代码解释器,对于文档,Claude 2 适用于大型文档或同时处理多个文档,Bing 侧边栏适用于较小的文档和网页。代码解释器是一种 GPT4 模式,允许上传文件、编写和运行代码、下载结果等,可用于执行程序、数据分析等,尽管使用它进行未经培训的分析存在风险,但仍给许多专家留下深刻印象。
2024-12-15
如何将word文件中的内容和图表,自动生成PPT
以下是将 word 文件中的内容和图表自动生成 PPT 的一些方法: 1. 可以使用 Gamma app 进行转换。先将 Claude 的答案放到 Google Docs 中,再导入 Gamma app,初始版只有文字没有图片。但可给 Gamma app 发送指令进行美化。 2. 对于需要的关键图表,如果无法直接获取,可采取以下措施: 检查论文在线版本。有些期刊会发布论文的数字版本,包含原文、数据、图表和附录等内容。可在论文首页或期刊网站上检查相关链接,下载论文的在线全文 PDF 并查找所需图表资料。 联系论文作者。若论文的在线全文资料不可获得,可通过网络查找论文作者的联系方式,说明对论文的高度兴趣,希望获取论文原文以查阅相关图表和数据信息。作者同意后有可能会发送电子版论文全文。 咨询研究数据库。大学和公共图书馆通常订阅包括各类期刊在内的研究文献数据库。可联系相关馆员,说明论文题目和作者,请求他们在数据库中查阅和获取该研究文章。这可能需要前往图书馆亲自查阅,或支付少许费用获取电子资料。 3. 对于生成教案和 PPT,可访问地址 https://www.coze.cn/s/iDsBwYLF/ ,按照以下步骤操作: 进入设计教案页面,等待执行完成后即可看到教案。 进入趣味课堂,设计课堂问答卡和针对性的教学活动,采用寓教于乐的方式激发孩子学习兴趣。 基于教学大纲和课本重点内容设计课后作业,包括生字词运用、阅读理解、写作等。 生成的 PPT 内容基于前面生成的教学大纲,可能需要手动进行少许内容修正。若对大纲内容不满意,可重新生成大纲和 PPT。复制大纲内容,打开 kimi,选择 PPT,复制教案,在对话框粘贴,KIMI 会优化大纲,点击进去后选择喜欢的模版生成。 4. 在给 PPT 配图方面,稍微高级一点的薅法如下: 首先复制图片的网址,然后打开 discord,在聊天栏输入/imagine prompt。 之后再回到官网,把图像的提示词也复制下来,再回 discord 粘贴到刚才拷贝的网址后面,注意空个格。 都搞好以后输入命令,稍等一会儿就会得到一个内容和画风都和原图比较接近的图。效果不理想可多反复生成几次。 之后放大觉得还不错的一张,点 Custom Zoom,改变拉伸镜头后的画面比例,如屏显 PPT 一般用 16:9,zoom 参数设置为 1.5 至 1.7 比较靠谱。 选一张比较好的放大一下,就可以放进 PPT 调整构图。若构图不太好,可在当前这张图的基础上再用一次 Zoom Out 1.5x。
2024-12-14
编写一个python代码其中附件是一个名为data.csv的CSV格式文件,提取表格中数据,行列保持一致进行如下格式转换:‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬ (1)按行进行倒序排列;‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫
以下是一个使用 Python 实现读取 CSV 文件并按行倒序排列的代码示例: ```python import pandas as pd 读取 CSV 文件 data = pd.read_csv 按行倒序排列 reversed_data = data.iloc 打印结果 print ``` 在上述代码中,首先使用 `pandas` 库的 `read_csv` 函数读取 `data.csv` 文件,然后使用 `iloc` 索引和切片操作 `` 实现按行倒序排列。
2024-12-12
能够通过 给出 伴奏 和 歌词 生成音频文件
Suno 和 Udio 都推出了上传音频文件生成音乐的功能,很多行业大号借此做了各种无厘头编曲,短期能带来很多流量。此功能对于 AI 音乐的作用在于精确的控制力,有了前置旋律,可以精确控制每首歌的速度(Tempo),无需再背绕口的速度词,能精确控制想要的 BPM;旋律(Melody)方面,可自己制作简单旋律让 AI 补全并贯穿整首歌,实现旋律与速度的一谱变速,节省大量 Roll 旋律的时间;配器(Instrumentation)能按自己想法选择乐器,减少提示词里乐器不灵光的情况,还能选择特殊音色;合成(synthesizer)方面,当有两支 BPM 相同、调性相同的音乐时,可尝试更多拆分组合和好玩的效果。 上传音频节省了点数消耗,每月的点数可用于:用提示词多 Roll 一些和流派、心情、场景相关的曲子,减少限制让 AI 音乐发挥更多创造力,把好旋律存起来作为制作素材;用于 roll 更多细节调整,如让某段曲子升调提升作品品质。 UDIO 制作音乐时,除了更改每个部分的提示,还能指定单独的自定义歌词。构建 1.5 分钟长的独立歌曲的最简单工作流程为:使用常规创建模式生成中间(主要)部分,这是曲目的“核心”;为刚创建的部分输入扩展模式,在扩展放置区域中选择添加介绍选项并单击扩展,生成的两部分轨道长 1 分钟;进入 1 分钟曲目的扩展模式,选择“添加尾奏”并单击“扩展”,即可创作有正确开头和结尾的音乐。
2024-12-12
现在系统中有一些案例,这些案例包括一些PDF\PPT\WORD等文件,如何引入AI对这些案例进行解析,方便用户智能搜索、对文本中的内容进行全文提问
要引入 AI 对包括 PDF、PPT、WORD 等文件的案例进行解析,以方便用户智能搜索和对文本内容进行全文提问,可以参考以下方法: 1. 对于法律文本阅读场景: 操作动作:选择某一份或者若干份文档上传,AI 完成解析,然后根据需要了解的内容进行提问。 Prompt 指令词示例:“图纸是谁设计的?”“谁负责承担本项目的设计、建设?”“贷款期限是多少?”“谁承担律师费?”“请概括原告的诉讼请求和事实理由?”“根据民事答辩状,被告张三一方还有更好的答辩建议吗?” 拼接模板:根据以下材料内容回答我的问题【每个材料内容都以数字序号+文件名开头】。你需要尽可能的参考材料内容:【文档 1 内容】+【文档 2 内容】+...+【文档 n 内容】+ 我的问题是:参考上述 Prompt 指令词。 2. 对于 AI 产品案例和投稿中的自媒体场景: 例如“创作:社群的每日资讯”“创作:写科普内容”“分发:内容分发”“沟通:小团队与甲方沟通”等案例,涵盖了品牌推广、科普创作、内容分发、团队沟通等方面。 3. 对于 AI 产品案例和投稿中的工作场景: 包括企业运营、教育、游戏/媒体、零售/电商、金融/保险等七大行业的商业化应用,如企业日常办公文档撰写、教育资源平等获取、游戏剧情生成、电商舆情监测、金融理财顾问等方面。
2024-12-10
我想用AI把图片生成营销视频
以下是关于用 AI 把图片生成营销视频的相关信息: 生成式人工智能在营销中的应用:DALLE 2 和其他图像生成工具已被用于广告,如亨氏使用番茄酱瓶的图像和类似标签论证“这就是人工智能眼中‘番茄酱’的样子”;雀巢使用维米尔画作的人工智能增强版帮助销售酸奶品牌;Stitch Fix 服装公司使用 DALLE 2 根据客户偏好创建服装可视化;美泰使用该技术生成玩具设计和营销的图像。 判断图片是否为 AI 生成:AI 作画的画质画风偶尔会波动,不像人类画师作品质量大多稳定向上发展,AI 就像皮下雇佣无数画技参差不齐画手的批皮营销号,画质质量胡乱。 制作商业级 AI 视频广告的出图方法:MJ 出图质量稳定,使用门槛低,暂时无其他替代工具。常规操作是登录 Discord 网站,打开 MJ 服务器出图,通过/imagine 命令输入提示词生成图片。若想提高效率,可使用 Autojourney 插件,它是电脑浏览器的一个插件,能批量发送提示词、自动下载图片、自动放大图片、生成提示词等,在浏览器拓展程序中下载安装,激活后将 MJ 出图提示词复制到插件中即可自动批量出图,一次可输入 10 组提示词。
2024-12-19
我是一个法律工作者,需要经常回答客户的一些法律问题,哪个AI适合我这种场景的工作需求
对于您这种经常回答客户法律问题的法律工作者,以下几种场景中适合使用法律行业垂类的 AI 产品: 1. 法规研究与解读:使用 Prompt 指令词,如“根据最新修订的《数据安全法》,解析企业在处理个人信息时应遵循的主要原则,并给出具体操作建议”,AI 助手将依据最新条款解析原则并提出操作指南或合规建议。 2. 法律意见书撰写或非诉交易文件材料:例如“针对我方当事人涉及的版权纠纷案,输入【已有的证据材料】+【相关法律条文】,撰写一份初步法律意见书,论证我方主张的合理性和胜诉的可能性”,AI 将根据提供的材料撰写法律意见书。 3. 案例检索:如“请搜索近五年内关于商标侵权案件中‘混淆可能性’标准的具体判例,并提供相似度最高的三个案例的关键要点摘要”,AI 系统将检索并提炼关键判决理由和结果。 4. 类案检索:同样最好使用法律行业垂类的 AI 产品。 5. 法律文本阅读:选择某一份或者若干份文档上传,AI 完成解析,然后根据需要了解的内容进行提问。 在使用 Prompt 时,要注意结构提示,如“【需求或目的+根据具体法条或者根据某部法律+具体需要研究或则具体的研究细节内容】”。
2024-12-19
AI技术学习
以下是关于 AI 技术学习的相关内容: 一、AI 的技术历史和发展方向以及目前最前沿的技术点 如果您偏向技术研究方向,需要学习以下内容: 1. 数学基础:线性代数、概率论、优化理论等。 2. 机器学习基础:监督学习、无监督学习、强化学习等。 3. 深度学习:神经网络、卷积网络、递归网络、注意力机制等。 4. 自然语言处理:语言模型、文本分类、机器翻译等。 5. 计算机视觉:图像分类、目标检测、语义分割等。 6. 前沿领域:大模型、多模态 AI、自监督学习、小样本学习等。 7. 科研实践:论文阅读、模型实现、实验设计等。 如果您偏向应用方向,需要掌握以下知识: 1. 编程基础:Python、C++等。 2. 机器学习基础:监督学习、无监督学习等。 3. 深度学习框架:TensorFlow、PyTorch 等。 4. 应用领域:自然语言处理、计算机视觉、推荐系统等。 5. 数据处理:数据采集、清洗、特征工程等。 6. 模型部署:模型优化、模型服务等。 7. 行业实践:项目实战、案例分析等。 无论是技术研究还是应用实践,数学和编程基础都是必不可少的。同时需要紧跟前沿技术发展动态,并结合实际问题进行实践锻炼。 二、新手学习 AI 的方法 1. 了解 AI 基本概念 建议阅读「」部分,熟悉 AI 的术语和基础概念。了解什么是人工智能,它的主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅 在「」中,您将找到一系列为初学者设计的课程。特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习 AI 领域广泛(比如图像、音乐、视频等),您可以根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 5. 体验 AI 产品 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 三、中学生学习 AI 的建议 1. 从编程语言入手学习 可以从 Python、JavaScript 等编程语言开始学习,这些是 AI 和机器学习的基础。 学习编程语法、数据结构、算法等基础知识,为后续的 AI 学习打下基础。 2. 尝试使用 AI 工具和平台 可以使用 ChatGPT、Midjourney 等 AI 生成工具,体验 AI 的应用场景。 探索一些面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识 了解 AI 的基本概念、发展历程、主要技术如机器学习、深度学习等。 学习 AI 在教育、医疗、金融等领域的应用案例。 4. 参与 AI 相关的实践项目 可以参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动。 尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 5. 关注 AI 发展的前沿动态 关注 AI 领域的权威媒体和学者,了解 AI 技术的最新进展。 思考 AI 技术对未来社会的影响,培养对 AI 的思考和判断能力。 总之,中学生可以从编程基础、工具体验、知识学习、实践项目等多个方面入手,全面系统地学习 AI 知识和技能,为未来的 AI 发展做好准备。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-12-19
让ai生成情感语录怎么带动情绪价值
以下是关于让 AI 生成情感语录带动情绪价值的相关内容: 可以参考品牌咨询专家的观点和相关文章,如刘润老师关于「情绪价值的赛道,拼的不是营销情绪,而是说服人心」的文章,了解情绪营销的重要性和实施策略。 以具体的产品为例,如江小白(白酒,适合跟家人之间聊心事谈感情)、霸王茶姬(奶茶,原叶茶胚,口感清新自然,适合跟朋友郊游享用)、lululemon(女士运动紧身裤,轻盈柔滑,修身弹力),给定产品品牌、品类、特点或使用情境,让大模型生成营销语句。 作为 AI 博主,需提供“情绪价值”,通过信息和趣味内容缓解用户焦虑,例如分享有趣的 AI 动态和提示词,让用户感到学习 AI 是轻松有趣的事。 提示词的详尽程度取决于应用场景,简单提示适合快速了解长文内容,详尽提示适合深入分析。初步使用简单提示,依据反馈不断改进更高效,同时建议避免过多轮会话,减少模型产生“幻觉”的可能性。
2024-12-19
现在已经有ai功能的国内app
以下是一些具有 AI 功能的国内 APP: 1. QQ 音乐:拥有 AI 音乐分类器,使用机器学习和音频处理技术,市场规模达数亿美元。能自动分类音乐,方便用户查找和管理,例如按照风格、歌手、年代等分类,用户想听流行音乐时,点击流行音乐分类即可找到相关歌曲。 2. 科沃斯扫地机器人:具备 AI 家居清洁机器人调度系统,运用机器学习和物联网技术,市场规模达数十亿美元。可优化家居清洁机器人的工作安排,提高清洁效率,比如在电量不足时自动返回充电,然后继续未完成的清洁任务。 3. 东方财富 APP:包含 AI 金融风险评估工具,采用数据分析和机器学习技术,市场规模达数十亿美元。能够帮助金融机构评估风险,做出更明智的决策,例如根据股票的历史数据和市场趋势评估股票的风险程度。 4. 马蜂窝 APP:设有 AI 旅游景点解说系统,借助语音识别和自然语言处理技术,市场规模达数亿美元。可为游客提供景点解说服务,丰富旅游体验,比如用户在参观故宫时,APP 可以自动播放故宫的历史介绍和景点讲解。 5. WPS 文档翻译功能:是 AI 办公文档翻译工具,运用自然语言处理技术,市场规模达数亿美元。能够快速翻译办公文档,提高工作效率,例如用户需要将一份中文报告翻译成英文,只需点击翻译按钮,即可快速得到翻译结果。 6. 美丽修行 APP:构建了 AI 美容护肤产品推荐平台,使用数据分析和自然语言处理技术,市场规模达数亿美元。能根据用户肤质推荐适合的美容护肤产品,例如根据用户的油性皮肤,推荐控油、保湿的护肤品。 7. 360 儿童手表:配备 AI 儿童安全监控系统,通过图像识别和机器学习技术,市场规模达数亿美元。可以保障儿童安全,让家长放心,比如当孩子走出安全区域时,手表会自动向家长发送警报。 8. 汽车之家 APP:拥有 AI 汽车保养提醒系统,利用数据分析和机器学习技术,市场规模达数亿美元。能够提醒车主及时进行汽车保养,例如当汽车行驶到一定里程时,APP 会推送保养提醒信息。 9. 智联招聘 APP:设有 AI 招聘筛选工具,运用自然语言处理和机器学习技术,市场规模达数亿美元。可以帮助企业快速筛选简历,提高招聘效率,例如企业招聘程序员,APP 会筛选出有相关技术经验和技能的简历。 10. 贝壳找房 APP:包含 AI 房地产评估系统,采用数据分析和机器学习技术,市场规模达数亿美元。能够准确评估房地产价值,为买卖双方提供参考,比如用户想出售房屋,APP 可以给出一个合理的价格区间。 11. 腾讯游戏助手:具备 AI 游戏角色生成器,借助图像生成和机器学习技术,市场规模达数亿美元。可为游戏开发者生成独特的游戏角色,例如在一款角色扮演游戏中,生成不同外貌、性格和技能的角色,增加游戏的趣味性。 12. 墨迹天气 APP:设有 AI 天气预报助手,运用数据分析和机器学习技术,市场规模达数亿美元。能够提供精准的天气预报和气象预警,例如为用户提供准确的温度、湿度、风力等信息,同时还能提供暴雨、台风等气象预警,帮助用户合理安排出行和生活。
2024-12-19
数字人唱歌ai工具
以下是一些数字人唱歌的 AI 工具及相关信息: 【TecCreative】创意工具箱: 数字人口播配音:输入口播文案,选择数字人形象、目标语言和输出类型,即可生成数字人口播视频。操作指引:输入口播文案——选择目标语言——选择数字人角色——选择输出类型——点击开始生成。 音频合成数字人:上传音频文件,选择数字人角色和输出类型,即可基于音频合成对应的数字人视频。操作指引:上传音频文件——选择数字人角色——选择输出类型——点击开始生成。注意:音频文件支持 MP3 和 WAV 格式,文件大小上限 5M。 电商带货本地生活: 三种方式创作数字人脸:使用逼真的照片或插图人脸、上传自己的照片、利用 DID 自带的 Stable Diffusion 的能力生成想象中的人脸。 三种方式让数字人说话:用 GPT 直接生成脚本让数字人说话、先选好脸再输入脚本、上传自己的音频记录或从电影、电视剧中剪辑台词或吟唱自编歌曲。 AI 数字人: 算法驱动的数字人:开源代码仓库包括 ASR 语音识别(如 openai 的 whisper、wenet、speech_recognition)、AI Agent(大模型有 ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等,Agent 部分可用 LangChain 的模块自定义)、TTS(如微软的 edgetts、VITS、sovitssvc 等)。 人物建模模型可通过手动建模(音频驱动)或 AIGC 的方式生成人物的动态效果(如 wav2lip 模型)。但简单构建方式存在一些问题,如生成指定人物的声音、TTS 生成的音频精确驱动数字人口型及动作、数字人使用知识库做出专业回答等。
2024-12-19
如何在个人电脑中部署本地RAG
在个人电脑中部署本地 RAG 可以按照以下步骤进行: 1. 加载所需的库和模块: 确保 ollama 服务已开启并下载好模型,ollama 用于在 python 程序中跑大模型。 feedparse 用于解析 RSS 订阅源。 2. 从订阅源获取内容: 函数用于从指定的 RSS 订阅 url 提取内容,如需接收多个 url 可稍作改动。 通过专门的文本拆分器将长文本拆分成较小的块,并附带相关元数据,如标题、发布日期和链接。最终,这些文档被合并成一个列表并返回,用于进一步的数据处理或信息提取任务。 3. 为文档内容生成向量: 使用文本向量模型 bgem3,从 hf 下载好模型后放置在指定路径,如 /path/to/bgem3,通过函数利用 FAISS 创建一个高效的向量存储。 4. 创建 Python 虚拟环境: 创建 python 虚拟环境,并安装相关库,版本如下: ollama:0.1.8 langchain:0.1.14 faisscpu:1.8.0(有 gpu 则安装 gpu 版本) gradio:4.25.0 feedparser:6.0.11 sentencetransformers:2.6.1 lxml:5.2.1 5. 导入依赖库。 6. 基于用户的问题,从向量数据库中检索相关段落,并根据设定的阈值进行过滤,最后让模型参考上下文信息回答用户的问题,从而实现 RAG。 7. 创建网页 UI:通过 gradio 创建网页 UI,并进行评测。 8. 问答测试:对于同样的问题和上下文,基于 Qwen7b、Gemma、Mistral、Mixtral 和 GPT4 分别进行多次测试。 总结: 1. 本文展示了如何使用 Langchain 和 Ollama 技术栈在本地部署一个资讯问答机器人,同时结合 RSSHub 来处理和提供资讯。 2. 上下文数据质量和大模型的性能决定了 RAG 系统性能的上限。 3. RAG 通过结合检索技术和生成模型来提升答案的质量和相关性,可以缓解大模型幻觉、信息滞后的问题,但并不意味着可以消除。
2024-10-13
怎么构建个人本地知识库
构建个人本地知识库可以按照以下步骤进行: 1. 了解 RAG 技术: 利用大模型的能力搭建知识库是 RAG 技术的应用。 大模型训练数据有截止日期,RAG 可解决依靠不在训练集中的数据的问题。 RAG 应用包括文档加载、文本分割、存储、检索和输出 5 个过程。 文档加载可从多种来源加载,如 PDF 等非结构化数据、SQL 等结构化数据和代码等。 文本分割将文档切分为指定大小的块。 存储涉及将文档块嵌入转换为向量形式并存储到向量数据库。 检索通过算法找到与输入问题相似的嵌入片。 输出是将问题和检索出的嵌入片提交给 LLM 生成答案。 文本加载器将用户提供的文本加载到内存以便后续处理。 2. 准备软件: 需要一个额外的软件 AnythingLLM,它包含所有 Open WebUI 的能力,并额外支持选择文本嵌入模型和向量数据库。 3. 安装和配置: 安装地址:https://useanything.com/download 。 安装完成后进入配置页面,主要分为三步:选择大模型、选择文本嵌入模型、选择向量数据库。 4. 构建本地知识库: 在 AnythingLLM 中创建自己独有的 Workspace 与其他项目数据隔离。 首先创建一个工作空间。 上传文档并在工作空间中进行文本嵌入。 选择对话模式,AnythingLLM 提供 Chat 模式(大模型根据训练数据和上传文档综合给出答案)和 Query 模式(大模型仅依靠文档中的数据给出答案)。 完成配置后进行测试对话。 本文的思路来源于视频号博主黄益贺,作者按照其视频进行了实操并附加了一些关于 RAG 的额外知识。
2024-12-19
可不可以提供一个本地化的大模型方法,让我建立这个合规法律的知识库
以下是为您提供的本地化大模型及搭建合规法律知识库的方法: 一、通过 Open WebUI 使用大模型 1. 首先访问相关网址。打开页面时需使用邮箱注册账号。 2. 登陆成功后,若您使用过类似 ChatGPT 的大模型对话网站,对该页面不会陌生。 3. Open WebUI 一般有两种使用方式: 聊天对话。 RAG 能力,即让模型根据文档内容回答问题,这是构建知识库的基础之一。 4. 如果要求不高,此时已搭建本地大模型,并通过 Web UI 实现对话功能。 5. ChatGPT 访问速度快且回答效果好的原因: 速度快是因为 GPT 大模型部署的服务器配置高。 效果好是因为 GPT 大模型的训练参数多、数据更优及训练算法更好。 二、您的硬件达标了么 运行大模型需要很高的机器配置,个人玩家大多负担不起。以下是不同类型大模型的配置要求: 1. 生成文字大模型: 最低配置:8G RAM + 4G VRAM 建议配置:16G RAM + 8G VRAM 理想配置:32G RAM + 24G VRAM(如果要跑 GPT3.5 差不多性能的大模型) 2. 生成图片大模型(比如跑 SD): 最低配置:16G RAM + 4G VRAM 建议配置:32G RAM + 12G VRAM 3. 生成音频大模型: 最低配置:8G VRAM 建议配置:24G VRAM 最低配置运行非常慢,不建议使用。但这不妨碍我们亲自实操一遍,以加深对大模型构建知识库底层原理的了解。若想要更顺滑的体验知识库,可以参考文章: 三、本地知识库进阶 若要更灵活掌控知识库,需额外软件 AnythingLLM。它包含 Open WebUI 的所有能力,并额外支持以下能力: 1. 选择文本嵌入模型。 2. 选择向量数据库。 AnythingLLM 安装和配置 安装地址:https://useanything.com/download 。安装完成后进入配置页面,主要分为三步: 1. 第一步:选择大模型。 2. 第二步:选择文本嵌入模型。 3. 第三步:选择向量数据库。 构建本地知识库 AnythingLLM 中有 Workspace 的概念,可创建独有的 Workspace 与其他项目数据隔离。具体步骤: 1. 首先创建一个工作空间。 2. 上传文档并在工作空间中进行文本嵌入。 3. 选择对话模式。AnythingLLM 提供两种对话模式: Chat 模式:大模型会根据自己的训练数据和上传的文档数据综合给出答案。 Query 模式:大模型仅依靠文档中的数据给出答案。 4. 测试对话。完成上述配置后,即可与大模型进行对话。 四、写在最后 “看十遍不如实操一遍,实操十遍不如分享一遍”。若您对 AI Agent 技术感兴趣,可以联系我或者加我的免费知识星球(备注 AGI 知识库)。
2024-12-18
基于知识库系统的人工智能
基于知识库系统的人工智能包括以下方面: 专家系统: 是符号人工智能的早期成就之一,为充当有限问题领域的专家而设计。 基于从人类专家提取的知识库,并包含推理引擎。 像人类推理系统一样,包含短期记忆(问题记忆)和长期记忆(知识库)。 问题记忆包含与当前要解决问题有关的知识,称为静态知识。 知识库代表问题领域的长期知识,是动态知识。 推理引擎协调问题状态空间中的搜索过程,必要时向用户提问并找到适用规则。 例如,可根据动物物理特征判断动物的专家系统,其图称为 ANDOR 树,早期提取知识时绘制树形图有用,计算机中用规则表示更方便。 FastGPT: 基于 LLM 技术,能理解自然语言并生成高质量答案。 支持连接外部知识库获取更全面信息。 具有可视化工作流编排工具,方便创建复杂问答场景。 具备开箱即用的数据处理和模型调用功能,上手速度快。 是功能强大、易于使用的知识库问答系统,可帮助企业构建智能客服、知识库搜索、文档生成等应用。 相关资源: 您可以为喜欢的主题写一个 ANDOR 树。同时,可参见了解实施正向推理和反向推理的专家系统示例。需注意,此例简单,规则达一定数量(约 200 多条)时才会有智能行为,规则复杂时可能难以牢记,基于知识的系统重要特点是能准确解释任何决定的做出过程。
2024-12-17
基于知识库做备考AI Agent,我该怎么做
以下是基于知识库为您提供的备考 AI Agent 的建议: 首先,建议您先吃透 prompt,这对于学习 AI Agent 很重要。 在 cost 平台有丰富的教程和比赛,您可以参与其中。 了解到 AI agent 是大语言模型衍生出的智能体,用于解决大模型在处理复杂任务时存在的一些问题,如无法获取最新外部信息、缺少规划、没有记忆能力等。 明天银海老师将详细讲解 AI agent,您可以关注。 此外,知识库中还提到了一些相关的活动和内容,如 prompt battle、AI 神经大赛等,您可以根据自己的兴趣参与。 对于与 AI 会话相关的内容,您可以通过关键词学设进行学习,比如每日选词丢入稳定扩散模型,积累大量提示词,还建有飞书群供感兴趣的同学加入练习。 在 AI 绘画方面,是视觉基础,有针对 AI 绘画学社做的关键词词库精选活动。同时,还收集了 AI 视频类词汇和相关词典,更具象的描述词汇能让模型发挥更好效果。 希望以上内容对您备考 AI Agent 有所帮助。
2024-12-16
请问我该在知识库的 哪里找到MJ的提示词库
以下是关于 MJ 提示词库的相关信息: MidJourney 200 条风格词汇: 《》 @TheMouseCrypto 发表了一份 200 条风格词汇整理,页数是 77 页,很全的宝典。 Prompt 网站精选(图像类 Prompt 网站): MidLibrary:Midjourney 最全面的流派、艺术技巧和艺术家风格库, MidJourney Prompt Tool:类型多样的 promot 书写工具,点击按钮就能生成提示词修饰部分, OPS 可视化提示词:这个网站有 Mid Journey 的图片风格、镜头等写好的词典库,方便你快速可视化生成自己的绘画提示词, AIart 魔法生成器:中文版的艺术作品 Prompt 生成器, IMI Prompt:支持多种风格和形式的详细的 MJ 关键词生成器, Prompt Hero:好用的 Prompt 搜索,Search prompts for Stable Diffusion,ChatGPT & Midjourney, OpenArt:AI 人工智能图像生成器, img2prompt:根据图片提取 Prompt, MidJourney 提示词工具:专门为 MidJourney 做的提示词工具,界面直观易用, PromptBase:Prompt 交易市场,可以购买、使用、销售各种对话、设计 Prompt 模板, AiTuts Prompt:精心策划的高质量 Midjourney 提示数据库,提供了广泛的不同风格供你选择, MJ 的随机种子库收集: 使用方法: 输入提示词 + sref random ar 1:1,可获得随机风格种子和图片。 测试风格种子的泛用性:{a girl,a boy,animals,plants,environment}sref 同一个风格种子
2024-12-08