直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

如何使用大模型搜索本地文件连接

回答

使用大模型搜索本地文件连接的方法如下:

  1. 对于 SDXL 大模型:
    • 首先,获取模型。您可以关注公众号【白马与少年】,回复【SDXL】获取下载链接。
    • 要在 webUI 中使用,需将 webUI 的版本在秋叶启动器中升级到 1.5 以上。
    • 然后,将 base 和 refiner 模型放在“……\sd-webui-aki-v4.2\models\Stable-diffusion”路径下,将 vae 模型放在“……\sd-webui-aki-v4.2\models\VAE”路径下。
    • 启动 webUI 后,即可在模型中看到 SDXL 模型。
    • 正常使用时,先在文生图中使用 base 模型,填写提示词和常规参数生成图片,再将图片发送到图生图中,切换大模型为“refiner”重绘。
  2. 对于其他模型:
    • 大多数模型可在 Civitai(C 站)https://civitai.com/ 下载。使用方法为:科学上网,点击右上角筛选按钮找到所需模型类型,如 Checkpoint=大模型、LoRA=Lora,查看感兴趣的照片并下载,或通过左上角“Images”查看他人已做好的图片并获取相关信息。
    • 模型下载地址:大模型存放在下载 SD 时的根目录;Lora 和 VAE 也有相应存放位置。
    • 若不知下载的模型类型,可使用秋叶的模型解析工具 https://spell.novelai.dev/,将模型拖动到空白处查看模型信息。
    • 常用的模型网站还有:Civitai | Stable Diffusion models,embeddings,hypernetworks and more>Models - Hugging Face>SD - WebUI 资源站>元素法典 AI 模型收集站 - AI 绘图指南 wiki(aiguidebook.top)>AI 绘画模型博物馆(subrecovery.top)
    • 下载模型后,不同类型的模型放置在不同目录下。大模型(Ckpt)放入 models\Stable-diffusion;VAE 模型放置在 models\Stable-diffusion 或 models\VAE 目录并在 webui 的设置栏目选择;Lora/LoHA/LoCon 模型放入 extensions\sd-webui-additional-networks\models\lora 或 models/Lora 目录;Embedding 模型放入 embeddings 目录。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

【SD】向未来而生,关于SDXL你要知道事儿

[title]【SD】向未来而生,关于SDXL你要知道事儿[heading1]#本地部署与在线使用[heading2]1.本地部署SDXL的大模型分为两个部分:第一部分,base+refiner是必须下载的,base是基础模型,我们使用它进行文生图的操作;refiner是精炼模型,我们使用它对文生图中生成的模型进行细化,生成细节更丰富的图片。第二部分,是SDXL还有一个配套的VAE模型,用于调节图片的画面效果和色彩。这三个模型,我已经放入了云盘链接中,大家可以关注我的公众号【白马与少年】,然后回复【SDXL】获取下载链接。想要在webUI中使用SDXL的大模型,首先我们要在秋叶启动器中将webUI的版本升级到1.5以上。接下来,将模型放入对应的文件夹中,base和refiner放在“……\sd-webui-aki-v4.2\models\Stable-diffusion”路径下;vae放在“……\sd-webui-aki-v4.2\models\VAE”路径下。完成之后,我们启动webUI,就可以在模型中看到SDXL的模型了。我们正常的使用方法是这样的:先在文生图中使用base模型,填写提示词和常规参数,尺寸可以设置为1024*1024,进行生成。我这边使用了一个最简单的提示词“1girl”,来看看效果。生成的图片大家可以看一下,我觉得是相当不错的。我知道大家心里可能会想——“就这,还好吧,也没有那么惊艳吧?”,那么,我用同样的参数再给你画一幅sd1.5版本的图像,你就能看出进步有多大了。是不是没有对比就没有伤害?SDXL,真香!还没完,我们到现在还只使用了一个base模型,接下来,将图片发送到图生图当中,大模型切换为“refiner”,重绘幅度开小一点,再次点击生成。

教程:超详细的Stable Diffusion教程

除了链接里面给大家分享的模型,大家肯定还想去找更多更好看的模型而大多数的模型都是在Civitai(C站)这个网站里面https://civitai.com/现在就给大家说一下C站的使用方法:01.科学上网这个没法教,大家只能自己想办法了02.点击右上角的筛选按钮,在框框里面找到自己需要的模型类型Checkpoint=大模型LoRA=Lora常用的就是这两个03.看照片,看到感兴趣的就点进去点击右边的“Download”,也就是下载,保存到电脑本地,文件保存到哪里在这一节的第二部分另外,我们还可以点击左上角的“Images”这里就是看别人已经做好的图片,找到喜欢的点进去点进去之后的页面我们就可以看到这张图的全部信息,直接点击Lora和大模型,可以直接跳转到下载页面下面的就是照片关键词和其他信息点击最下面的“Copy...Data”就可以复制图片的所有信息回到SD,粘贴到关键词的文本框,点击右边的按钮这些信息就会自动分配要注意的就是,大模型是需要我们手动去换的!这样我们就可以生成出跟大神几乎一样的照片了!(电脑网络配置的不同,出来的照片有细微差别)[heading2]2.模型下载到哪里[content]这里大家就直接看我文件的保存地址,找到自己电脑里的01.大模型这里的SD根目录就是大家在下载时,存放SD的那个文件夹02.Lora03.VAE[heading2]3.如何分辨模型[content]如果我们下载了一个模型,但不知道它是哪个类型的,不知道要放到哪个文件夹我们就可以用到这个秋叶的模型解析工具https://spell.novelai.dev/把模型拖动到空白处接着就会自动弹出模型的信息在模型种类里面就可以看到是什么模型啦!

SD新手:入门图文教程

模型能够有效地控制生成的画风和内容。常用的模型网站有:[Civitai | Stable Diffusion models,embeddings,hypernetworks and more](https://link.zhihu.com/?target=https%3A//civitai.com/)>[Models - Hugging Face](https://link.zhihu.com/?target=https%3A//huggingface.co/models)>[SD - WebUI资源站](https://link.zhihu.com/?target=https%3A//www.123114514.xyz/models/ckpt)>[元素法典AI模型收集站- AI绘图指南wiki(aiguidebook.top)](https://link.zhihu.com/?target=https%3A//aiguidebook.top/index.php/model/)>[AI绘画模型博物馆(subrecovery.top)](https://link.zhihu.com/?target=https%3A//aimodel.subrecovery.top/)[heading3]模型安装[content]下载模型后需要将之放置在指定的目录下,请注意,不同类型的模型应该拖放到不同的目录下。模型的类型可以通过[Stable Diffusion法术解析](https://link.zhihu.com/?target=https%3A//spell.novelai.dev/)检测。大模型(Ckpt):放入models\Stable-diffusionVAE模型:一些大模型需要配合vae使用,对应的vae同样放置在models\Stable-diffusion或models\VAE目录,然后在webui的设置栏目选择。Lora/LoHA/LoCon模型:放入extensions\sd-webui-additional-networks\models\lora,也可以在models/Lora目录Embedding模型:放入embeddings目录

其他人在问
基于飞书的知识库RAG的搭建,需要什么接口进行全文搜索
基于飞书的知识库 RAG 搭建,可用于全文搜索的接口方式主要有以下几种: 1. 语义检索:语义匹配关注查询和文档内容的意义,而非仅仅表面的词汇匹配。通过向量的相似性来判断语义的相似性。 2. 全文检索:这是基于关键词的检索方式。例如,对于句子“猫的饮食习惯包括吃鱼和鸡肉”,输入“猫”“饮食”“猫的饮食习惯”“吃鱼”等关键词可搜索到该句子,但输入“猫喜欢吃什么呀”则无法搜索到。 3. 混合检索:结合了语义匹配和全文检索的优点,通常系统先进行全文检索获取初步结果,然后再对这些结果进行语义匹配和排序。 此外,在本地部署资讯问答机器人实现 RAG 时,会涉及加载所需的库和模块,如 feedparse 用于解析 RSS 订阅源,ollama 用于在 python 程序中跑大模型。还会为文档内容生成向量,如使用文本向量模型 bgem3 等。 在开发 LangChain 应用开发指南中,实现 LangChain 和 RAG 的结合时,需要加载数据、分割文档、转换嵌入并存储到向量存储器、创建检索器以及聊天模型等步骤。
2024-10-17
AI搜索与传统搜索的比较研究
AI 搜索与传统搜索相比具有以下特点和差异: 360 AI 搜索:定位为新一代答案引擎,在传统搜索网页检索能力基础上,结合大型语言模型的多种技术能力,学习人类思维和语言组织模式,生成优质答案。具有针对模糊问题通过反问和交互理解给出答案、搜索全网丰富内容生成丰富答案、回答更具时效性、通过主动追问帮助用户延展学习等特点。其工作流程包括分析问题语义、提炼搜索关键词、查询全网相关内容、精选高价值网页、进行结构化总结等。Web 端和 H5 端网址为,手机端可扫码下载 360 AI 搜索 APP。 一般情况:如果将人工智能作为搜索引擎,存在幻觉风险,大多数未连接互联网。但有证据表明在某些情况下,如技术支持、决定吃饭地点或获取建议等,若谨慎使用,人工智能能提供比搜索更有用的答案,必应通常比谷歌更好。 竞争格局:今年二月份以来,AI 搜索赛道不断有新产品,市场定位有差异。国内有大模型厂商和搜索厂商或创业团队推出的产品,海外也有成熟和新出的产品。如 Perplexity、ThinkAny 是通用搜索,Phind、Devv、Reportify 是垂直搜索。通用搜索没有明显受众倾向,能回答各类问题;垂直搜索面向特定人群或领域,在特定问题上有更好结果。其好坏没有客观评判标准。
2024-10-16
AI搜索的底层逻辑是怎样的
AI 搜索的底层逻辑主要是“检索增强生成(RAG)”,具体包括以下步骤: 1. 检索(Retrieve):使用用户的查询(query)调用搜索引擎 API,获取搜索结果。 2. 增强(Augmented):设置提示词,将检索结果作为挂载的上下文。 3. 生成(Generation):大模型回答问题,并标注引用来源。 在检索过程中,还涉及以下原理: 1. 信息筛选与确认:对检索器提供的信息进行评估,筛选出最相关和最可信的内容,并验证信息的来源、时效性和相关性。 2. 消除冗余:识别和去除多个文档或数据源中的重复信息,避免在生成回答时出现重复或矛盾。 3. 关系映射:分析不同信息片段之间的逻辑和事实关系,如因果、对比、顺序等,构建结构化的知识框架。 4. 上下文构建:将筛选和结构化的信息组织成连贯的上下文环境,包括排序、归类和整合。 5. 语义融合:必要时合并意义相近但表达不同的信息片段,减少语义重复并增强表达力。 6. 预备生成阶段:将整合好的上下文信息编码成适合生成器处理的格式,如转化为适合输入到生成模型的向量形式。 最后,全新的上下文被传递给大语言模型,大语言模型根据提供的信息生成准确和连贯的答案。影响 AI 搜索的关键因素包括挂载的上下文信息密度和基座模型的智能程度。在响应速度方面,Retrieve 要求联网检索信息的速度快,Generation 要求大模型生成内容的速度快,同时为提高准确度可能存在耗时的重排和获取内容详情步骤。
2024-10-16
请搜索生成式对话crm软件
以下是关于生成式对话 CRM 软件的相关信息: 生成式 AI Studio 方面: 创建聊天提示:可与模型进行自由形式聊天,跟踪之前内容并根据上下文响应。返回语言页面,单击 + CREATE CHAT PROMPT 按钮创建新聊天提示,添加上下文到上下文字段,将相关文本复制到 Responses 下的聊天框,按 Enter 键或单击发送消息,模型会根据提供的额外上下文在约束范围内回答问题。 探索提示库:Prompt Gallery 可让您探索生成式 AI 模型在各种用例中的应用。在 Generative AI Studio 菜单中,单击 Language 可在 Get Started 页面上找到 Prompt Gallery,可从总结、分类、提取、写作和构思等用例中选择并探索。 课程字幕:介绍了生成式 AI Studio 中的一些模型参数,如调整温度(选择概率低、比较不寻常的词)、top K(从可能性最高的 K 个词中随机返回一个词)、top P(从 top P 个词中随机返回一个词的概率)等。 AIGC 在 CRM 中的应用: 个性化营销内容创作:根据客户数据生成个性化营销文案、视觉内容等,提高营销效率和转化率。 客户服务对话系统:开发智能客服系统,通过自然语言交互解答客户咨询、投诉等。 产品推荐引擎:生成产品描述、视觉展示等内容结合推荐算法为客户推荐产品,提升销售业绩。 CRM 数据分析报告生成:自动生成数据分析报告,包括多种形式,加快生产流程。 智能翻译和本地化:提供高质量多语种翻译及本地化服务,打造全球化营销内容。 虚拟数字人和营销视频内容生成:快速生成虚拟数字人形象、场景背景和营销视频内容,降低制作成本。 客户反馈分析:高效分析客户反馈文本和多媒体信息,挖掘需求和潜在痛点。 需要注意的是,AIGC 在应用过程中仍需解决算法偏差、版权和知识产权等伦理法律问题。
2024-10-15
法律行业搜索案例的免费ai哪个好用
在法律行业,进行案例搜索时最好使用法律行业垂类的 AI 产品,通用型 AI 可能存在查不出来、数据不全或生成内容不满足需求的情况。以下是一些案例检索的 Prompt 指令词示例及相关场景: 场景一:案例检索 Prompt 指令词:请搜索近五年内关于商标侵权案件中“混淆可能性”标准的具体判例,并提供相似度最高的三个案例的关键要点摘要。 预计效果:AI 系统将检索相关数据库,找出符合要求的判例,并提炼出这些案例中有关“混淆可能性”标准的关键判决理由和结果,形成摘要报告。 其他例子: Prompt 指令词:检索近三年内所有涉及软件算法专利侵权的案例,分析法院判决中关于技术特征对比和侵权判定的标准,为即将面临的专利侵权案件提供参考。 Prompt 指令词:比对不同地区法院在处理劳动争议案件时对加班费计算标准的差异判决,总结对雇主有利的判决趋势,为客户提供合规操作指导。 Prompt 指令词:研究环境法相关案例,特别是涉及工业废弃物处理的法律责任,为客户提供合规处理建议,以降低潜在的法律风险。 Prompt 结构提示:【案例领域或类型+明确需要查找的重点内容+查找案例的目的+其他希望 AI 做的事情】 场景二:类案检索 Prompt 指令词:(与场景一类似) 预计效果:(与场景一类似) 其他例子:(与场景一类似) Prompt 结构提示:(与场景一类似) 场景四:法规研究与解读 Prompt 指令词:根据最新修订的《数据安全法》,解析企业在处理个人信息时应遵循的主要原则,并给出具体操作建议。 预计效果:AI 助手将依据《数据安全法》的最新条款,解析企业处理个人信息所必须遵循的原则,并结合实践情况提出详细的操作指南或合规建议。 其他例子: Prompt 指令词:分析新出台的《网络安全法》对电子商务平台的具体影响,特别是数据保护和用户隐私方面的规定,为客户提供合规操作指南。 Prompt 指令词:【输入一段具体法律规定如:国际贸易规定】,以上是国际贸易法规的最新变化,为客户提供跨境交易的合规指南,特别是关税和进出口限制方面的内容。 Prompt 指令词:解读新修订的税法对中小企业的影响,提供税务规划和避税策略的建议,确保客户在合法范围内优化税务负担。 Prompt 结构提示:【需求 or 目的+根据具体法条或者根据某部法律+具体需要研究或则具体的研究细节内容】 场景五:法律意见书撰写或非诉交易文件材料 Prompt 指令词:针对我方当事人涉及的版权纠纷案,输入【已有的证据材料】+【相关法律条文】,撰写一份初步法律意见书,论证我方主张的合理性和胜诉的可能性。 预计效果:AI 将基于商标法的相关条款和案例法,提供关于商标侵权案件的诉讼策略。这将包括对原告商标权利的详细分析、被告侵权行为的法律评估、关键证据的搜集建议、可能的法律抗辩点以及在适当情况下和解或调解的策略。AI 的目标是帮助律师构建一个全面的诉讼计划,以提高胜诉几率并为客户争取最大利益。 其他例子: Prompt 指令词:为一起涉及专利侵权的案件制定诉讼策略,分析专利的有效性、被告的侵权行为以及可能的抗辩理由,提出如何证明侵权和计算损害赔偿的建议。 Prompt 指令词:针对一起劳动合同纠纷案件,分析员工的权益和雇主的责任,提出诉讼策略,包括主张的权益、证据收集的重点以及如何证明雇主的违约行为。 Prompt 指令词:在一场涉及知识产权许可的诉讼中,分析许可协议的条款和双方的权利义务,提出诉讼策略,包括如何证明许可协议的违反、计算损失赔偿以及可能的合同解除条件。 其他可以尝试的场景:模拟法庭 Prompt 指令词:模拟一场涉及商业合同违约的法庭审理,分析原告主张的违约责任和被告提出的免责抗辩,预测法庭可能的判决,并提出如何优化法庭陈述和证据呈现的建议。 预计效果:AI 将根据商业合同法的相关规定和案例法,模拟法庭审理过程。AI 将提供对原告和被告双方可能的论点、证据和法律依据的分析,预测法庭可能的判决结果,并给出如何更有效地在法庭上进行陈述、展示证据和进行交叉审问的建议。这将帮助律师准备更有说服力的法庭策略,以期达到最佳的诉讼结果。 其他例子:(与上述类似)
2024-10-10
AI 搜索
以下为您介绍一些 AI 搜索引擎: 1. 秘塔 AI 搜索:由秘塔科技开发,具有多模式搜索、无广告干扰、结构化展示和信息聚合等功能,能提升用户搜索效率和体验。 2. Perplexity:聊天机器人式搜索引擎,支持自然语言提问,运用生成式 AI 技术收集信息并给出答案。 3. 360AI 搜索:360 公司推出,通过 AI 分析问题生成清晰有理的答案,支持增强模式和智能排序。 4. 天工 AI 搜索:昆仑万维推出,采用生成式搜索技术,支持自然语言交互和深度追问,未来将支持多模态搜索。 5. Flowith:创新的 AI 交互式搜索和对话工具,基于节点式交互,支持多种 AI 模型和图像生成技术,有插件系统和社区功能。 6. Devv:面向程序员,专注提供编程、软件开发和人工智能等领域的专业建议和指导。 7. Phind:专为开发者设计,利用大型语言模型提供相关搜索结果和动态答案,擅长处理编程和技术问题。 开搜 AI 搜索是一款免费无广告、直达结果的面向大众的搜索工具。它在以下方面有帮助: 1. 对于在校学生,能快速搜集学术资料,智能总结关键信息,助力论文和报告撰写,且支持查看来源出处,参考价值高。 2. 对于教育教师群体,可获取丰富教学资源,自动生成教案和课题研究报告,提高教学准备效率。 3. 对于职场办公人群,能高效查找工作所需信息,简化文案撰写、PPT 制作和工作汇报准备工作。 4. 对于学术研究人员,能提供深入的行业分析,通过 AI 技术整合和总结大量数据,形成有深度的研究报告。 存在能联网检索的 AI,例如: 1. ChatGPT Plus 用户可开启 web browsing 功能实现联网。 2. Perplexity 结合了 ChatGPT 式的问答和普通搜索引擎功能,可指定希望聊天机器人在响应时搜索的源类型。 3. Bing Copilot 作为 AI 助手,能简化在线查询和浏览活动。 4. 还有如 You.com 和 Neeva AI 等搜索引擎,提供基于人工智能的定制搜索体验,并保持用户数据私密性。 以上内容由 AI 大模型生成,请仔细甄别。
2024-10-08
如何连接GPT4o
以下是连接 GPT4o 的方法: 1. 对于 ChatGPT Mac 客户端: 下载地址:persistent.oaistatic.com/sidekick/public/ChatGPT_Desktop_public_latest.dmg 使用 Proxyman、Charles 或您喜欢的网络代理来进行以下操作(需要有 ChatGPT 付费账号,以及网络技术基础):以 ProxyMan 为例 登录一次以触发 API 调用 对 ChatGPT 的 App 启用 SSL 代理(需要配置好 ProxyMan 证书) 再登录一次以触发 API 调用 然后右键点击 ab.chatgpt.com/v1/initialize 选择本地映射,并将所有的 false 替换为 true 再尝试一次,您就应该能顺利登录了。 详细版图文教程: 2. 对于安卓系统: 先在 Google play 中的【支付和订阅】【支付方式】中绑定好银行卡 然后在区 chatgpt 里订阅 Plus,操作如下截图 完成后即可开始使用 ChatGPT 4o
2024-08-18
个人使用可以通过对话微调的大模型
大模型是指输入大量语料,使计算机获得类似人类的“思考”能力,能够进行文本生成、推理问答、对话、文档摘要等工作。可以用“上学参加工作”来类比大模型的训练和使用过程: 1. 找学校:训练大模型需要大量计算,GPU 更合适,只有购买得起大量 GPU 的才有资本训练。 2. 确定教材:大模型需要的数据量特别多,几千亿序列(Token)的输入基本是标配。 3. 找老师:用合适的算法让大模型更好理解 Token 之间的关系。 4. 就业指导:为让大模型更好胜任某一行业,需要进行微调(fine tuning)指导。 5. 搬砖:完成就业指导后,进行如翻译、问答等工作,在大模型里称为推导(infer)。 在 LLM 中,Token 被视为模型处理和生成的文本单位,能代表单个字符、单词、子单词等,具体取决于分词方法。将输入分词时会数字化形成词汇表。 个人动手实验方面: macOS 系统可采用 GGML 量化后的模型。有名的项目如 ggerganov/llama.cpp:Port of Facebook's LLaMA model in C/C++ ,首先编译,利用 Metal 的 GPU 用相应命令编译,然后去下载模型,还提供了 WebUI,启动 server 后默认监听 8080 端口,打开浏览器可对话。 Whisper 与 llama 类似,用 make 命令编译,去指定地址下载量化好的模型,转换音频,目前只接受 wav 格式,可用 ffmpeg 转化。 张梦飞的教程《用聊天记录克隆自己的 AI 分身》全程本地操作,目标是把微信聊天记录导出,用其微调模型,最终接入微信替你回复消息。
2024-10-18
国内能通过对话微调的语言大模型
以下是国内一些能通过对话微调的语言大模型: 教育领域:桃李(Taoli) 地址: 简介:在国际中文教育领域数据上进行了额外训练的模型,基于国际中文教育教材等构建资源库和问答数据集,并利用数据进行指令微调,让模型习得将知识应用到具体场景中的能力。 数学领域:chatglmmaths 地址: 简介:基于 chatglm6b 微调/LORA/PPO/推理的数学题解题大模型,样本为自动生成的整数/小数加减乘除运算,可 gpu/cpu 部署,开源了训练数据集等。 文化领域:Firefly 地址: 简介:中文对话式大语言模型,构造了许多与中华文化相关的数据,如对联、作诗、文言文翻译、散文、金庸小说等,以提升模型在这方面的表现。 金融领域: Cornucopia(聚宝盆) 地址: 简介:开源了经过中文金融知识指令精调/指令微调的 LLaMA7B 模型。通过中文金融公开数据+爬取的金融数据构建指令数据集,并在此基础上对 LLaMA 进行了指令微调,提高了 LLaMA 在金融领域的问答效果。基于相同的数据,后期还会利用 GPT3.5 API 构建高质量的数据集,另在中文知识图谱金融上进一步扩充高质量的指令数据集。 BBTFinCUGEApplications 地址: 简介:开源了中文金融领域开源语料库 BBTFinCorpus,中文金融领域知识增强型预训练语言模型 BBTFinT5 及中文金融领域自然语言处理评测基准 CFLEB。 XuanYuan(轩辕) 地址: 简介:国内首个开源的千亿级中文对话大模型,同时也是首个针对中文金融领域优化的千亿级开源对话大模型。在 BLOOM176B 的基础上针对中文通用领域和金融领域进行了针对性的预训练与微调,不仅可以应对通用领域的问题,也可以解答金融相关的各类问题,为用户提供准确、全面的金融信息和建议。
2024-10-18
我的app应用想要对接大语言模型,结合APP用户自身的数据,实现更精准的对话,是否有行业比较成功的案例可以借鉴
以下是一些在 APP 应用对接大语言模型方面比较成功的案例,可供您借鉴: 1. Poe: 由 Quora 开发,有 APP 版本,支持跨端使用。 集成了 Chat GPT、GPT4、Claude+、Claude、Dragonfly 等模型,同时支持用户自建 Chatbot。 不同语言模型回复效果有差异,适合需要调用多种大语言模型的用户。 Dragonfly 擅长给出较短的回答,并擅长在输入中给出示例时遵循指示。 Claude 更擅长创造性回复,配合 Poe 中的提问引导,非常适合在查阅资料时使用。 支持分享用户和模型的对话内容,但 GPT4、Claude+产品需要付费订阅使用。 访问地址: Poe 中的提问引导真的能够启发到用户,midjourney prompt 扩写 Chatbot 能力很惊人。 2. Perplexity.ai: 本质是个可联网的搜索引擎,完全免费,支持网页版、APP(目前支持 iOS,安卓即将推出)、Chrome 插件。 网页版能力全面,能够根据提问从互联网上搜寻信息并给出总结后的答案。 很多 Chat GPT 中调用插件才能解决的事情(联网查询、旅行、住宿、商品推荐)靠 Perplexity 就可以解决。 能给出信息来源网址,并根据搜索内容给出继续对话的问题建议。 最新推出的 Copilot 能力支持根据搜索内容进行信息补充,每 4h 内使用 5 次,调用 GPT4。 支持分享聊天内容到多渠道。 首页推荐当下流行的新闻、搜索内容。 支持筛选 Academic(包含不同领域的学术研究论文)、Wolfram|Alpha(包含数学、科学、经济学、语言学、工程学、社会科学、文化等领域的知识库)、Wikipedia(维基百科)、Youtube、Reddit(娱乐、社交和新闻网站)、News 进行搜索。 Chrome 插件可针对当前页面给出即时摘要。 访问地址:
2024-10-18
大模型合规
大模型的安全问题包括以下方面: 1. 对齐保障:通过对齐(指令调优),如 ChatGPT 从 GPT3 经过对齐而来,使其更好地理解人类意图,增加安全保障,确保不输出有害内容。对齐任务可拆解为监督微调及获取奖励模型和进行强化学习来调整输出分布。例如 LLAMA2 使用安全有监督微调确保安全,强化学习能让模型根据人类反馈更细粒度思考答案的安全性,面对训练分布外数据也能拒绝不当回答。 2. 数据过滤:在预训练阶段对数据进行过滤,如 baichuan2 采用此技术减少有害输出,但因数据关联性,仅靠此方法可能不够,模型仍可能从关联中学到有害内容,且面对不良信息时可能因缺少知识而处理不当。 3. 越狱问题:用户可能通过越狱(Jailbreak)使模型的对齐失效,重新回答各种问题。 大模型的特点包括: 1. 架构:分为 encoderonly、encoderdecoder、decoderonly 三类,目前熟知的 AI 助手多为 decoderonly 架构,由 transformer 衍生而来。 2. 规模:预训练数据量大,来自互联网的多种来源,且参数众多,如 GPT3 已达 170B 的参数。 GPT3 与 ChatGPT 相比,除形式不同外,安全性也有差别。
2024-10-18
大模型安全相关资料
以下是关于大模型安全的相关资料: 大模型的架构:包括 encoderonly、encoderdecoder 和 decoderonly 三种类型。其中,我们熟知的 AI 助手基本采用 decoderonly 架构,这些架构都是由谷歌 2017 年发布的“attention is all you need”论文中提出的 transformer 衍生而来。 大模型的特点:预训练数据量大,往往来自互联网上的论文、代码、公开网页等,通常用 TB 级别的数据进行预训练;参数非常多,如 Open 在 2020 年发布的 GPT3 就已达到 170B 的参数。 大模型的安全性保障:通过对齐(指令调优),包括监督微调、获取 reward model 与进行强化学习来调整语言模型的输出分布,以保证语言模型不会输出有害内容和信息。例如 LLAMA2 专门使用了安全有监督微调确保安全。但 Alignment 并不足以防护所有安全问题,存在越狱(Jailbreak)现象,会使模型对齐失效。此外,还有隐私问题。 相关资源:如果想进一步了解大语言模型安全,可以访问 Github awesomellmsafety 项目:https://github.com/ydyjya/AwesomeLLMSafety
2024-10-18
目前最好用的机关公文写作大模型或智能体
目前在机关公文写作方面表现较好的大模型或智能体有: 智谱清言:由智谱 AI 和清华大学推出,基础模型为 ChatGLM 大模型。在工具使用排名国内第一,在计算、逻辑推理、传统安全能力上排名国内前三。更擅长专业能力,但在代码能力上还有优化空间,知识百科方面稍显不足。可应用场景广泛,在 AI 智能体方面相关的应用,包括任务规划、工具使用及长文本记忆相关场景表现出色,在较复杂推理应用上效果不错,也适用于广告文案、文学写作等。 此外,在大模型中,智能体是大模型的一个重要发展方向。智能体可以理解为在大模型(如 LLM)基础上增加了工具、记忆、行动、规划等能力。目前行业里主要用到的如 langchain 框架,能通过代码或 prompt 的形式将 LLM 与 LLM 之间以及 LLM 与工具之间进行串接。
2024-10-18
我需要上传几篇论文文件,让AI参照文件和我的要求,帮我写一篇符合我需求的论文
在论文写作领域,AI 技术的应用发展迅速,能提供多方面的辅助。以下是一些常用的 AI 工具和平台: 1. 文献管理和搜索: Zotero:结合 AI 技术,可自动提取文献信息,助您管理和整理参考文献。 Semantic Scholar:由 AI 驱动的学术搜索引擎,提供文献推荐和引用分析。 2. 内容生成和辅助写作: Grammarly:通过 AI 技术进行文本校对、语法修正和写作风格建议,提升语言质量。 Quillbot:基于 AI 的重写和摘要工具,可精简和优化论文内容。 3. 研究和数据分析: Google Colab:提供基于云的 Jupyter 笔记本环境,支持 AI 和机器学习研究,便于数据分析和可视化。 Knitro:用于数学建模和优化,助力复杂数据分析和模型构建。 4. 论文结构和格式: LaTeX:结合自动化和模板,高效处理论文格式和数学公式。 Overleaf:在线 LaTeX 编辑器,有丰富模板库和协作功能,简化编写过程。 5. 研究伦理和抄袭检测: Turnitin:广泛使用的抄袭检测工具,确保论文原创性。 Crossref Similarity Check:通过与已发表作品比较,检测潜在抄袭问题。 需要注意的是,使用这些工具时,要结合自身写作风格和需求选择合适的辅助工具。同时,虽然可以向 LLM 寻求写作建议甚至直接要求其帮忙写论文,但这并非道德的使用方式。另外,在创作过程中,如让 AI 进行细节描写时,可采用一些技巧,如让其以表格形式输出细节描述,以打破叙事习惯、便于局部调整和确保内容具体。但在修改时可能会遇到如模型失忆等问题。
2024-10-17
国内可直接编辑或创建图像文件的最好用AI有哪些?
以下是一些国内可直接编辑或创建图像文件且好用的 AI 工具: 1. 无界 AI:可用于快速制作海报底图,并完成主题海报排版。操作流程包括确定主题与文案、选择风格与布局、生成与筛选、配文与排版。 2. Artguru AI Art Generator:在线平台,能生成逼真图像,为设计师提供灵感,丰富创作过程。 3. Retrato:将图片转换为非凡肖像,有 500 多种风格选择,适合制作个性头像。 4. Stable Diffusion Reimagine:通过稳定扩散算法生成精细、具有细节的全新视觉作品。 5. Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计,可将上传的照片转换为芭比风格。 6. 可灵:由快手团队开发,用于生成高质量的图像和视频,但价格相对较高。 7. 通义万相:在中文理解和处理方面表现出色,用户可选择多种艺术和图像风格,生成图像质量较高,操作界面简洁直观,用户友好度高,且目前免费,每天签到获取灵感值即可。但存在一定局限性,如某些类型的图像因国内监管要求无法生成,处理非中文语言或国际化内容可能不够出色,处理多元文化内容时可能存在偏差。
2024-10-15
视频压缩软件推荐(清晰度最好无损,用上ai技术,支持8G容量大的mp4文件压缩)
目前市面上支持您需求的视频压缩软件相对较少。不过,您可以关注以下几款可能符合部分要求的软件: 1. HandBrake:这是一款开源的视频转码工具,虽然没有明确提及使用 AI 技术,但在压缩视频时可以较好地保持画质。 2. Adobe Premiere Pro:专业的视频编辑软件,具有一定的视频压缩功能,但其主要优势在于视频编辑,对于大文件的处理能力较强。 需要注意的是,要实现无损压缩且支持 8G 容量大的 MP4 文件,同时还运用 AI 技术,可能较难完全满足。在实际使用中,您可能需要根据具体情况进行尝试和调整。
2024-10-10
以图片为主的PDF文件向量化的本地大模型推荐
以下是关于以图片为主的 PDF 文件向量化的本地大模型的相关信息: RAG 技术: 利用大模型的能力搭建知识库是 RAG 技术的应用。大模型训练数据有截止日期,当需要依靠不在训练集中的数据时,可通过检索增强生成 RAG 技术实现。RAG 应用包括 5 个过程: 1. 文档加载:从多种来源加载文档,如包括 PDF 在内的非结构化数据、SQL 在内的结构化数据以及代码等。 2. 文本分割:把文档切分为指定大小的块。 3. 存储:包括将切分好的文档块嵌入转换成向量形式,并将向量数据存储到向量数据库。 4. 检索:通过检索算法找到与输入问题相似的嵌入片。 5. 输出:把问题以及检索出来的嵌入片一起提交给 LLM,生成更合理的答案。 PDF 翻译的 AI 产品: 1. DeepL(网站):,点击页面「翻译文件」按钮,上传 PDF、Word 或 PowerPoint 文件。 2. 沉浸式翻译(浏览器插件):,安装插件后,点击插件底部「更多」按钮,选择相关翻译选项。 3. Calibre(电子书管理应用):,下载安装并安装翻译插件「Ebook Translator」。 4. 谷歌翻译(网页):,使用工具把 PDF 转成 Word,再点击谷歌翻译「Document」按钮上传 Word 文档。 5. 百度翻译(网页):,点击导航栏「文件翻译」,上传多种格式文件,支持选择领域和导出格式。 6. 彩云小译(App):下载后点击「文档翻译」,可导入多种格式文档,但有免费次数限制且进阶功能需付费。 7. 微信读书(App):下载 App 后将 PDF 文档添加到书架,打开并点击页面上方「切换成电子书」,轻触屏幕唤出翻译按钮。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-10-06
我要如何将一个pdf或者txt里面的内容,非人工地整理成表格或者按照文件里面的标题整理入notion的知识库里面?
要将 PDF 或 TXT 里的内容非人工地整理成表格或按照文件里的标题整理入 Notion 的知识库,可以按照以下步骤进行操作: Notion 上传方式: 1. 在文本格式页签下,选择 Notion,然后单击下一步。 2. 单击授权。首次导入 Notion 数据和页面时,需要进行授权。 在弹出的页面完成登录,并选择要导入的页面。 选择要导入的数据,然后单击下一步。 3. 选择内容分段方式: 自动分段与清洗:系统会对上传的文件数据进行自动分段,并会按照系统默认的预处理规则处理数据。 自定义:手动设置分段规则和预处理规则。 分段标识符:选择符合实际所需的标识符。 分段最大长度:设置每个片段内的字符数上限。 文本预处理规则: 替换掉连续的空格、换行符和制表符。 删除所有 URL 和电子邮箱地址。 4. 单击下一步完成内容上传和分片。 自定义上传方式: 1. 在文本格式页签下,选择自定义,然后单击下一步。 2. 输入单元名称,然后单击确认。 3. 单击创建分段,然后在弹出的页面输入要上传的内容。每个分段最多可添加 2000 个字符。 4. 单击保存。
2024-10-04
如何用AI翻译英文文献,文件格式是PDF
以下是几种将英文 PDF 文献翻译成中文的方法: 1. DeepL(网站):访问,点击页面「翻译文件」按钮,上传 PDF、Word 或 PowerPoint 文件即可。 2. 沉浸式翻译(浏览器插件):在安装插件后,点击插件底部「更多」按钮,选择「制作双语 BPUB 电子书」、「翻译本地 PDF 文件」、「翻译 THML / TXT 文件」、「翻译本地字幕文件」。 3. Calibre(电子书管理应用):在下载并安装 calibre,并安装翻译插件「Ebook Translator」。 4. 谷歌翻译(网页):使用工具把 PDF 转成 Word,再在点击谷歌翻译「Document」按钮,上传 Word 文档。 5. 百度翻译(网页):在点击导航栏「文件翻译」,上传 PDF、Word、Excel、PPT、TXT 等格式的文件,支持选择领域和导出格式(不过进阶功能基本都需要付费)。 6. 彩云小译(App):下载后点击「文档翻译」,可以直接导入 PDF、DOC、DOCX、PPT、PPTX、TXT、epub、srt 等格式的文档并开始翻译(不过有免费次数限制且进阶功能需要付费)。 7. 微信读书(App):下载 App 后将 PDF 文档添加到书架,打开并点击页面上方「切换成电子书」,轻触屏幕唤出翻译按钮。 8. 浏览器自带的翻译功能:如果一些 PDF 太大,翻译工具不支持,除了将 PDF 压缩或者切分外,还可以转成 HTML 格式,然后使用浏览器自带的网页翻译功能。 请注意,内容由 AI 大模型生成,请仔细甄别。
2024-10-04