Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

如何使用大模型搜索本地文件连接

Answer

使用大模型搜索本地文件连接的方法如下:

  1. 对于 SDXL 大模型:
    • 首先,获取模型。您可以关注公众号【白马与少年】,回复【SDXL】获取下载链接。
    • 要在 webUI 中使用,需将 webUI 的版本在秋叶启动器中升级到 1.5 以上。
    • 然后,将 base 和 refiner 模型放在“……\sd-webui-aki-v4.2\models\Stable-diffusion”路径下,将 vae 模型放在“……\sd-webui-aki-v4.2\models\VAE”路径下。
    • 启动 webUI 后,即可在模型中看到 SDXL 模型。
    • 正常使用时,先在文生图中使用 base 模型,填写提示词和常规参数生成图片,再将图片发送到图生图中,切换大模型为“refiner”重绘。
  2. 对于其他模型:
    • 大多数模型可在 Civitai(C 站)https://civitai.com/ 下载。使用方法为:科学上网,点击右上角筛选按钮找到所需模型类型,如 Checkpoint=大模型、LoRA=Lora,查看感兴趣的照片并下载,或通过左上角“Images”查看他人已做好的图片并获取相关信息。
    • 模型下载地址:大模型存放在下载 SD 时的根目录;Lora 和 VAE 也有相应存放位置。
    • 若不知下载的模型类型,可使用秋叶的模型解析工具 https://spell.novelai.dev/,将模型拖动到空白处查看模型信息。
    • 常用的模型网站还有:Civitai | Stable Diffusion models,embeddings,hypernetworks and more>Models - Hugging Face>SD - WebUI 资源站>元素法典 AI 模型收集站 - AI 绘图指南 wiki(aiguidebook.top)>AI 绘画模型博物馆(subrecovery.top)
    • 下载模型后,不同类型的模型放置在不同目录下。大模型(Ckpt)放入 models\Stable-diffusion;VAE 模型放置在 models\Stable-diffusion 或 models\VAE 目录并在 webui 的设置栏目选择;Lora/LoHA/LoCon 模型放入 extensions\sd-webui-additional-networks\models\lora 或 models/Lora 目录;Embedding 模型放入 embeddings 目录。
Content generated by AI large model, please carefully verify (powered by aily)

References

【SD】向未来而生,关于SDXL你要知道事儿

[title]【SD】向未来而生,关于SDXL你要知道事儿[heading1]#本地部署与在线使用[heading2]1.本地部署SDXL的大模型分为两个部分:第一部分,base+refiner是必须下载的,base是基础模型,我们使用它进行文生图的操作;refiner是精炼模型,我们使用它对文生图中生成的模型进行细化,生成细节更丰富的图片。第二部分,是SDXL还有一个配套的VAE模型,用于调节图片的画面效果和色彩。这三个模型,我已经放入了云盘链接中,大家可以关注我的公众号【白马与少年】,然后回复【SDXL】获取下载链接。想要在webUI中使用SDXL的大模型,首先我们要在秋叶启动器中将webUI的版本升级到1.5以上。接下来,将模型放入对应的文件夹中,base和refiner放在“……\sd-webui-aki-v4.2\models\Stable-diffusion”路径下;vae放在“……\sd-webui-aki-v4.2\models\VAE”路径下。完成之后,我们启动webUI,就可以在模型中看到SDXL的模型了。我们正常的使用方法是这样的:先在文生图中使用base模型,填写提示词和常规参数,尺寸可以设置为1024*1024,进行生成。我这边使用了一个最简单的提示词“1girl”,来看看效果。生成的图片大家可以看一下,我觉得是相当不错的。我知道大家心里可能会想——“就这,还好吧,也没有那么惊艳吧?”,那么,我用同样的参数再给你画一幅sd1.5版本的图像,你就能看出进步有多大了。是不是没有对比就没有伤害?SDXL,真香!还没完,我们到现在还只使用了一个base模型,接下来,将图片发送到图生图当中,大模型切换为“refiner”,重绘幅度开小一点,再次点击生成。

教程:超详细的Stable Diffusion教程

除了链接里面给大家分享的模型,大家肯定还想去找更多更好看的模型而大多数的模型都是在Civitai(C站)这个网站里面https://civitai.com/现在就给大家说一下C站的使用方法:01.科学上网这个没法教,大家只能自己想办法了02.点击右上角的筛选按钮,在框框里面找到自己需要的模型类型Checkpoint=大模型LoRA=Lora常用的就是这两个03.看照片,看到感兴趣的就点进去点击右边的“Download”,也就是下载,保存到电脑本地,文件保存到哪里在这一节的第二部分另外,我们还可以点击左上角的“Images”这里就是看别人已经做好的图片,找到喜欢的点进去点进去之后的页面我们就可以看到这张图的全部信息,直接点击Lora和大模型,可以直接跳转到下载页面下面的就是照片关键词和其他信息点击最下面的“Copy...Data”就可以复制图片的所有信息回到SD,粘贴到关键词的文本框,点击右边的按钮这些信息就会自动分配要注意的就是,大模型是需要我们手动去换的!这样我们就可以生成出跟大神几乎一样的照片了!(电脑网络配置的不同,出来的照片有细微差别)[heading2]2.模型下载到哪里[content]这里大家就直接看我文件的保存地址,找到自己电脑里的01.大模型这里的SD根目录就是大家在下载时,存放SD的那个文件夹02.Lora03.VAE[heading2]3.如何分辨模型[content]如果我们下载了一个模型,但不知道它是哪个类型的,不知道要放到哪个文件夹我们就可以用到这个秋叶的模型解析工具https://spell.novelai.dev/把模型拖动到空白处接着就会自动弹出模型的信息在模型种类里面就可以看到是什么模型啦!

SD新手:入门图文教程

模型能够有效地控制生成的画风和内容。常用的模型网站有:[Civitai | Stable Diffusion models,embeddings,hypernetworks and more](https://link.zhihu.com/?target=https%3A//civitai.com/)>[Models - Hugging Face](https://link.zhihu.com/?target=https%3A//huggingface.co/models)>[SD - WebUI资源站](https://link.zhihu.com/?target=https%3A//www.123114514.xyz/models/ckpt)>[元素法典AI模型收集站- AI绘图指南wiki(aiguidebook.top)](https://link.zhihu.com/?target=https%3A//aiguidebook.top/index.php/model/)>[AI绘画模型博物馆(subrecovery.top)](https://link.zhihu.com/?target=https%3A//aimodel.subrecovery.top/)[heading3]模型安装[content]下载模型后需要将之放置在指定的目录下,请注意,不同类型的模型应该拖放到不同的目录下。模型的类型可以通过[Stable Diffusion法术解析](https://link.zhihu.com/?target=https%3A//spell.novelai.dev/)检测。大模型(Ckpt):放入models\Stable-diffusionVAE模型:一些大模型需要配合vae使用,对应的vae同样放置在models\Stable-diffusion或models\VAE目录,然后在webui的设置栏目选择。Lora/LoHA/LoCon模型:放入extensions\sd-webui-additional-networks\models\lora,也可以在models/Lora目录Embedding模型:放入embeddings目录

Others are asking
AI搜索
以下是为您介绍的一些 AI 搜索引擎: 1. 秘塔 AI 搜索:由秘塔科技开发,具有多模式搜索、无广告干扰、结构化展示和信息聚合等功能,能提升用户搜索效率和体验。 2. Perplexity:聊天机器人式搜索引擎,允许用自然语言提问,通过生成式 AI 技术从各种来源收集信息并给出答案。 3. 360AI 搜索:360 公司推出,通过 AI 分析问题,生成清晰有理答案,支持增强模式和智能排序。 4. 天工 AI 搜索:昆仑万维推出,采用生成式搜索技术,支持自然语言交互和深度追问,未来将支持多模态搜索。 5. Flowith:创新的 AI 交互式搜索和对话工具,基于节点式交互,支持多种 AI 模型和图像生成技术,有插件系统和社区功能。 6. Devv:面向程序员的 AI 搜索引擎,专注提供编程、软件开发和人工智能等领域专业建议和指导。 7. Phind:专为开发者设计,利用大型语言模型提供相关搜索结果和动态答案,擅长处理编程和技术问题。 开搜 AI 搜索是一款免费无广告、直达结果的面向大众的搜索工具。它在以下方面有出色表现: 1. 论文资料搜集与整理:帮助在校学生快速搜集专业学术资料,智能总结关键信息,助力撰写论文和报告,且支持查看来源出处,参考价值高。 2. 教学内容准备:让教育教师群体获取丰富教学资源,自动生成教案和课题研究报告,提高教学准备效率。 3. 职场信息检索:使职场办公人群高效查找工作所需信息,简化文案撰写、PPT 制作和工作汇报准备工作。 4. 行业研究分析:为学术研究人员提供深入行业分析,通过 AI 技术整合和总结大量数据,形成有深度的研究报告。 从 AI 搜索引出 RAG:在学习 RAG 之初,可从 AI 搜索切入。AI 大模型擅长语义理解和文本总结,不擅长获取实时信息;搜索引擎擅长获取实时信息,但信息分散,需人为总结。AI 与搜索引擎结合,给 AI 配备活字典,让其随时查阅。
2025-02-15
AI搜索如何商业变现
AI 搜索的商业变现方式主要有以下几种: 1. 开放接口 API:将联网判断、意图识别、问题改写、信息源检索等步骤封装进黑盒,导出标准 API,让 ChatBot 类产品快速集成。开放 API 后,ChatBot 类应用只需修改 API 的域名前缀即可集成联网检索功能,这对 AI 搜索产品自身而言,增加了面向小 B 的营收途径。 2. 自定义信息源 Source:允许用户自定义信息源,满足个性化搜索需求。比如允许第三方创作者通过 Form 表单填写信息源的相关信息,调试通过后完成集成。 在 AI 时代,一些优秀的 AI 搜索产品如秘塔搜索(https://metaso.cn/)、Perplexity(https://www.perplexity.ai/?loginsource=oneTapHome)已展现出强大的搜索能力。同时,大型科技公司在 AI 搜索领域的动作也备受关注,如微软和苹果自愿放弃 OpenAI 董事会观察员席位,监管机构关注大型科技公司与初创企业的关系。人工智能驱动的搜索虽已开始出现成效,但也存在可靠性等问题。
2025-02-11
ai搜索引擎
以下是为您提供的关于 AI 搜索引擎的相关信息: 推荐的 AI 搜索引擎: 1. 秘塔 AI 搜索:由秘塔科技开发,具有多模式搜索、无广告干扰、结构化展示和信息聚合等功能,能提升搜索效率和体验。 2. Perplexity:聊天机器人式搜索引擎,允许用自然语言提问,通过生成式 AI 技术收集信息并给出答案。 3. 360AI 搜索:360 公司推出,通过 AI 分析问题,生成清晰有理答案,支持增强模式和智能排序。 4. 天工 AI 搜索:昆仑万维推出,采用生成式搜索技术,支持自然语言交互和深度追问,未来将支持多模态搜索。 5. Flowith:创新的交互式搜索和对话工具,基于节点式交互,支持多种 AI 模型和图像生成技术,有插件系统和社区功能。 6. Devv:面向程序员,专注提供编程、软件开发和人工智能等领域的专业建议和指导。 7. Phind:专为开发者设计,利用大型语言模型提供相关搜索结果和动态答案,擅长处理编程和技术问题。 个人制作 AI 搜索引擎的经历: 选择做 AI 搜索引擎产品基于三个原则:感兴趣、有价值能带来成就感、在能力范围内。起初认为搜索引擎技术壁垒高,不敢尝试。但后来研究了贾扬清老师开源的 Lepton Search 源码和 float32 的 AI 搜索引擎源码,了解到底层技术“RAG”(检索增强生成),包括检索、增强、生成三个步骤,即拿用户 query 调搜索引擎 API 拿到搜索结果,设置提示词把检索结果作为挂载上下文,大模型回答问题并标注引用来源。之后决定在这个领域尝试,所做的 AI 搜索引擎产品取名“ThinkAny”。 XiaoHu.AI 日报中的相关内容: 4 月 27 28 日的 XiaoHu.AI 日报中提到了 Perplexica AI 驱动的搜索引擎,它提供多种搜索模式,如学术、视频等,并支持本地部署的大型语言模型。
2025-02-11
AI全称是什么 和传统搜索引擎有什么不同,为什么说AI未来会取代人类
AI 的全称是“Artificial Intelligence”,即人工智能。 AI 搜索引擎与传统搜索引擎的不同主要体现在以下方面: 1. 信息处理方式:AI 搜索引擎能够更高效地处理信息,例如智能摘要功能,可辅助快速筛选信息,实现信息降噪。 2. 信息表达:用自然语言描述就能生成美观可用的图片,降低了创作门槛和周期,使信息表达更简便。 3. 工作流重塑:AI 可以重新构建工作流,如产品经理可使用 AI 进行用户画像、竞品调研、设计产品测试用例、绘制产品功能流程图等。 4. 协同关系:生成式 AI 的人机协同分为 Embedding(嵌入式)、Copilot(副驾驶)、Agent(智能代理)3 种产品设计模式,协作流程有所差异。 5. 知识传播与管理:正在发生的生成式 AI 革命正在吞噬搜索与社交网络时代的全部数字信息,未来知识可能由机器通过 AI 拥有和管理。 关于“AI 未来会取代人类”这种说法是不准确的。虽然 AI 在某些方面表现出强大的能力,但人类具有独特的创造力、情感、判断力和复杂问题解决能力等,AI 更多是辅助和增强人类的能力,而非完全取代。
2025-02-08
DeepSeek深度推理+联网搜索 目前断档第一
DeepSeek 深度推理+联网搜索目前断档第一,具有以下特点和成就: 发布了大一统模型 JanusPro,将图像理解和生成统一在一个模型中。 统一 Transformer 架构,使用同一个模型就能完成图片理解和生成。 提供 1B 和 7B 两种规模,适配多元应用场景。 全面开源,支持商用,MIT 协议,部署使用便捷。 Benchmark 表现优异,能力更全面。 模型(7B):https://huggingface.co/deepseekai/JanusPro7B 模型(1B):https://huggingface.co/deepseekai/JanusPro1B 官方解释:JanusPro 是一种新型的自回归框架,通过将视觉编码解耦为独立路径解决先前方法局限性,利用单一统一 Transformer 架构处理,缓解视觉编码器角色冲突,增强框架灵活性,超越之前统一模型,匹配或超过特定任务模型性能,成为下一代统一多模态模型有力候选者。 下载地址:https://github.com/deepseekai/Janus 官方频道: 微信公众号:DeepSeek 小红书:@DeepSeek(deepseek_ai) X DeepSeek R1 的成就: App Store 排名:冲到美国区 App Store 第一名,超越 OpenAI 的 ChatGPT。 口碑与技术实力:依靠技术实力和口碑赢得用户认可,没有市场部和市场投放。 技术特点: 性能与成本:效果比肩顶尖闭源模型 o1,价格仅为 o1 的 27 分之一。 开源与创新:开源让行业认知整体拉齐,得到全世界尊重和喜爱。 创新模型 R1 Zero:跳过监督微调训练,发现模型思考能力可自我涌现。 影响: 行业影响:引发美国科技界恐慌,Meta 内部对 DeepSeek V3 出色表现感到震惊。 市场影响:低成本和高性能使英伟达市场地位受挑战,股价短期内大跌超 3%,市值蒸发超 300 亿美元(27 日盘前又跌 14%)。 未来展望: 开源模型的进步将超越闭源模型,顶级模型推理价格急速下降,技术更加普惠平权。 AI 编程将随着模型能力提高显著提升效率并降低门槛,AI 创作能力不断提升,催生更多 AI 创作的可消费内容形式。
2025-02-08
ai搜索引擎
以下是一些常见的 AI 搜索引擎: 1. 秘塔 AI 搜索:由秘塔科技开发,具有多模式搜索、无广告干扰、结构化展示和信息聚合等功能,能提升搜索效率和体验。 2. Perplexity:聊天机器人式搜索引擎,允许用自然语言提问,通过生成式 AI 技术收集信息并给出答案。 3. 360AI 搜索:360 公司推出,能通过 AI 分析问题,生成清晰有理的答案,支持增强模式和智能排序。 4. 天工 AI 搜索:昆仑万维推出,采用生成式搜索技术,支持自然语言交互和深度追问,未来将支持多模态搜索。 5. Flowith:创新的 AI 交互式搜索和对话工具,基于节点式交互,支持多种 AI 模型和图像生成技术,有插件系统和社区功能。 6. Devv:面向程序员的 AI 搜索引擎,专注于提供编程、软件开发和人工智能等领域的专业建议和指导。 7. Phind:专为开发者设计,利用大型语言模型提供相关搜索结果和动态答案,擅长处理编程和技术问题。 有人做了一个名为“ThinkAny”的 AI 搜索引擎,其作者选择做这个产品基于三个原则:感兴趣、有价值能带来成就感、在能力范围内。作者在了解了一些相关项目代码和底层技术“RAG”(检索增强生成,包括检索、增强、生成三个步骤)后决定尝试。
2025-02-07
comfyui无法连接服务器
ComfyUI 无法连接服务器可能有以下原因和解决办法: 1. 网络问题导致无法从 GitHub 下载资源: 可以使用国内镜像,参考文档中的说明。 直接从 GitHub 网页下载资源,然后放到对应的文件路径。 2. 终端连接不上 GitHub 可能是因为网络未做到终端 FanQiang,需要配置好代理。具体端口要根据自己的 FanQiang 服务来看,最好把这个配置到默认的终端启动项里边:export https_proxy=http://127.0.0.1:7890 http_proxy=http://127.0.0.1:7890 all_proxy=socks5://127.0.0.1:7890 。或者考虑使用第三方镜像站下载,如 TUNA()。 此外,安装 ComfyUI 还有以下电脑硬件要求: 1. 系统:Windows7 以上(不建议使用 XP 系统)。 2. 显卡要求:NVDIA 独立显卡且显存至少 4G 起步。 3. 硬盘留有足够的空间,最低 100G 起步(包括模型)。 注:mac 系统、AMD 显卡、低显卡的情况也可以安装使用,但功能不全,出错率偏高,严重影响使用体验,个人建议升级设备或者采用云服务器玩耍。
2024-11-30
连接外部知识库
以下是关于连接外部知识库的相关内容: 创建并使用知识库: 在 Bot 内使用知识库: 1. 登录。 2. 在左侧导航栏的工作区区域,选择进入指定团队。 3. 在 Bots 页面,选择指定 Bot 并进入 Bot 详情页。 4. 在 Bot 编排页面的知识库区域,单击加号图标,添加指定的知识库。 5. (可选)添加知识库后,可以在自动调用下拉界面内,调整知识库的配置项,包括最大召回数量、最小匹配度和调用方式。配置项说明:最大召回数量指 Bot 在调用知识库匹配用户输入内容时,返回的数据片段数量,数值越大返回的内容越多;最小匹配度指 Bot 在调用知识库匹配用户输入内容时,会将达到匹配度要求的数据片段进行召回,若未达到则不会被召回;调用方式包括自动调用(每轮对话将自动从所有关联的知识库中匹配数据并召回)和按需调用(需在人设与回复逻辑中提示 Bot 调用 RecallKnowledge 方法,以约束 Bot 在指定时机从知识库内匹配数据)。 6. (可选)在预览与调试区域调试 Bot 能力时,扩展运行完毕的内容可以查看知识库命中并召回的分片内容。 在工作流内使用 Knowledge 节点: 1. 登录。 2. 在左侧导航栏的工作区区域,选择进入指定团队。 3. 在页面顶部进入工作流页面,并打开指定的工作流。 4. 在左侧基础节点列表内,选择添加 Knowledge 节点。 扣子知识库介绍: 功能概述:扣子的知识库功能支持上传外部数据(例如本地文件、实时在线数据),通过向量搜索来检索最相关的内容以回答用户的问题。扣子提供了简单易用的方式来存储和管理外部数据,让 Bot 可以与指定的数据进行交互。将数据上传到扣子知识库后,扣子会自动将文档分割成一个个内容片段进行存储,并通过向量搜索来检索最相关的内容来回答用户问题。 应用场景:扣子支持上传文本内容和结构化的表格数据,可满足不同的使用场景,例如语料补充、客服场景、垂直场景等。 AI Agent 系列:Brain 模块探究: 外置知识是由外部数据库提供,能够进行动态更新和调整。外置知识通常涉及多种数据存储和组织方式,包括向量数据库(优化了向量检索操作,常用于处理和索引非结构化数据,如图像和文本)、关系型数据库(通过表格形式存储结构化数据,支持复杂的查询,适用于事务性数据存储)、知识图谱(以图的形式组织数据,强调实体之间的关系,适合于复杂的语义分析和知识推理)。在实际应用中,外置知识的集成和管理常常采用 RAG(RetrievalAugmented Generation)架构,它是一种结合了检索和生成的模型,通过检索外部知识源来增强模型的生成能力。
2024-10-31
我计划编写一本关于生成式人工智能的书籍,但是在开始前,我需要确定一个合适的大纲框架来组织我的思路。这个框架应该包括那些部分,以及如何将各个部分连接起来,以便读者能够理解掌握AIGC的概念和应用
以下是为您编写关于生成式人工智能书籍提供的大纲框架建议: 一、引言 介绍编写本书的目的和背景,引导读者进入生成式人工智能的世界。 二、基础概念 1. 什么是生成式人工智能(AIGC) 定义和特点 与传统人工智能的区别 2. 相关技术名词 AI(人工智能) 机器学习(包括监督学习、无监督学习、强化学习) 深度学习(神经网络、神经元) 生成式 AI(可生成文本、图片、音频、视频等内容形式) LLM(大语言模型) 三、AIGC 的应用领域 1. 文字生成(如使用大型语言模型生成文章、故事、对话等) 2. 图像生成(如使用 Stable Diffusion、DALLE 等模型生成艺术作品、照片等) 3. 视频生成(如使用 Runway、KLING 等模型生成动画、短视频等) 四、AIGC 与其他内容生成方式的关系 1. AIGC 与 UGC(用户生成内容) 区别与联系 各自的优势和适用场景 2. AIGC 与 PGC(专业生成内容) 区别与联系 相互的影响和融合 五、技术原理 1. Transformer 模型 自注意力机制 处理序列数据的优势 2. 技术里程碑(如谷歌团队发表的《Attention is All You Need》论文) 六、实际案例分析 展示不同领域中成功的 AIGC 应用案例,分析其实现过程和效果。 七、挑战与展望 1. 面临的挑战(如数据隐私、伦理问题等) 2. 未来发展趋势和前景 八、结论 总结全书重点内容,对 AIGC 的未来发展进行展望。 各个部分之间可以通过逻辑递进、案例引用、对比分析等方式进行连接,使读者能够逐步深入理解掌握 AIGC 的概念和应用。
2024-10-23
如何连接GPT4o
以下是连接 GPT4o 的方法: 1. 对于 ChatGPT Mac 客户端: 下载地址:persistent.oaistatic.com/sidekick/public/ChatGPT_Desktop_public_latest.dmg 使用 Proxyman、Charles 或您喜欢的网络代理来进行以下操作(需要有 ChatGPT 付费账号,以及网络技术基础):以 ProxyMan 为例 登录一次以触发 API 调用 对 ChatGPT 的 App 启用 SSL 代理(需要配置好 ProxyMan 证书) 再登录一次以触发 API 调用 然后右键点击 ab.chatgpt.com/v1/initialize 选择本地映射,并将所有的 false 替换为 true 再尝试一次,您就应该能顺利登录了。 详细版图文教程: 2. 对于安卓系统: 先在 Google play 中的【支付和订阅】【支付方式】中绑定好银行卡 然后在区 chatgpt 里订阅 Plus,操作如下截图 完成后即可开始使用 ChatGPT 4o
2024-08-18
汇总一下现在的大语言模型都有哪些,国外和国内的模型分别列出来
以下是国内外的大语言模型汇总: 国外大语言模型: GPT4(OpenAI):目前最先进的自然语言生成模型,可用于回答问题、撰写文章等。 Gemini Ultra(Google):多模态人工智能模型,采用神经网络架构,对标 GPT4,可用于回答问题、生成代码、处理文本等。 Claude 3 Opus(Anthropic):多模态模型,能处理超过 1 百万 token 的输入,具有实时聊天、数据处理、分析预测等功能;实现了接近完美的召回率。 国内大语言模型: 文心一言(百度):大语言模型,可用以文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成。 讯飞星火:目前体验效果较好。 悟道・天鹰(北京智源人工智能研究院):首个具备中英文双语知识、支持商用许可协议、国内数据合规需求的开源语言大模型。 清华 ChatGLM 。 此外,国内还有通用模型如通用模型如文心一言、讯飞星火等,处理自然语言;还有垂直模型,专注特定领域如小语种交流、临床医学、AI 蛋白质结构预测等。
2025-02-19
0到1使用大语言模型
以下是关于 0 到 1 使用大语言模型的相关内容: Ollama 框架: 1. 支持多种大型语言模型,如通义千问、Llama 2、Mistral 和 Gemma 等,适用于不同应用场景。 2. 易于使用,适用于 macOS、Windows 和 Linux 系统,同时支持 CPU 和 GPU。 3. 提供模型库,用户可从中下载不同参数和大小的模型,通过 https://ollama.com/library 查找。 4. 支持用户自定义模型,例如修改温度参数调整创造性和连贯性,或设置特定系统消息。 5. 提供 REST API 用于运行和管理模型,以及与其他应用程序的集成选项。 6. 社区贡献丰富,包括多种集成插件和界面,如 Web 和桌面应用、Telegram 机器人、Obsidian 插件等。 7. 安装完后,确保 ollama 后台服务已启动(在 mac 上启动 ollama 应用程序,在 linux 上通过 ollama serve 启动),可通过 ollama list 确认。 大模型安全: 1. 通过对齐(指令调优)使语言模型更好理解人类意图并增加安全保障,可拆解为监督微调、获取 reward model 和强化学习调整输出分布两部分。 2. LLAMA2 专门使用安全有监督微调确保语言模型安全。 3. 强化学习通过引入人类反馈数据调整模型输出分布,使模型面对训练分布外数据时能拒绝不当回答。 4. 但 Alignment 并不足以防护所有安全问题,存在越狱(Jailbreak)情况,导致模型对齐失效。 5. 还需关注隐私问题。 大模型架构与特点: 1. 包括 encoderonly、encoderdecoder 和 decoderonly 三种架构,目前熟知的 AI 助手多为 decoderonly 架构。 2. 大模型预训练数据量大,来自互联网,参数多,如 Open 在 2020 年发布的 GPT3 已达 170B 参数。 3. GPT3 可根据任务描述和示例完成任务,ChatGPT 则通过对话完成任务,二者在形式和安全性上有差别。
2025-02-19
deepseek的论文里面讲的混合专家模型怎么理解
混合专家(MoE)模型是一种在深度学习中提升计算效率的架构。以 DeepSeek 为例,其最新模型 V3 与 R1 采用了这种架构。 在 DeepSeek 的 V3 模型中,引入了多头潜注意力(MLA),将 KV 缓存压缩至新低,从而提升了计算性能。R1 模型则通过强化学习激活推理能力,首次验证无需监督微调即可实现推理。 DeepSeek 的 2360 亿参数的 DeepSeekV2 是 60 位专家混合开源模型,在数学、编码和推理方面表现出色,具有 236B 参数,21B 在生成过程中被激活,在 MTBench 上表现优异,中文能力强且性价比高。 您可以通过以下链接获取更详细的介绍:https://xiaohu.ai/p/7468 、https://zhuanlan.zhihu.com/p/21208287743 。
2025-02-19
我想做一个产品(生涯规划领域的垂直大模型),这个产品服务的对象是所有人:帮助所有人进行更好的职业规划。每个人都能通过使用这个产品更好地了解自己,了解自己的天赋、兴趣、优势,然后找到自己的热爱的领域和热爱的事业,并且能够个性化地推荐相关的行业和职业,包括职业的主要工作内容和核心能力要求等等。 请对这个产品进行可行性分析,并给出产品的发展规划,别忘了给这个项目起一个名字。
以下是对您提出的生涯规划领域垂直大模型产品的可行性分析和发展规划,并为项目取名为“生涯智途”。 可行性分析: 1. 需求广泛:帮助人们进行职业规划是一个普遍存在的需求,涵盖了各个年龄段和职业阶段的人群。 2. 数据可用性:可以通过各种渠道收集大量与职业相关的数据,包括行业报告、职位描述、人才需求等。 3. 技术支持:当前大模型技术的发展为实现这样的产品提供了可能,能够处理和分析大量复杂的数据。 发展规划: 1. 数据收集与整理:广泛收集各类职业数据,建立丰富的数据库,确保数据的准确性和完整性。 2. 模型训练与优化:利用收集到的数据进行模型训练,不断优化模型,提高预测和推荐的准确性。 3. 功能开发: 个性化测评:开发能够准确评估用户天赋、兴趣、优势的功能模块。 精准推荐:根据用户的特点,提供个性化的行业和职业推荐,并详细介绍职业的工作内容和核心能力要求。 持续学习与更新:随着行业变化,及时更新数据和模型,以提供最新的职业信息。 4. 用户体验优化:设计简洁、易用的界面,提供良好的用户交互体验。 5. 市场推广:通过线上线下多种渠道进行推广,提高产品的知名度和用户覆盖面。 希望以上分析和规划对您有所帮助。
2025-02-18
现在大语言模型的跑分对比
对比不同大语言模型的性能需要考虑多个维度,包括但不限于以下方面: 1. 理解能力:评估对语言的语法、语义、上下文和隐含意义的理解程度。 2. 生成质量:检查生成文本的流畅性、相关性和准确性。 3. 知识广度和深度:掌握广泛主题的知识程度,以及对特定领域或话题的理解深度。 4. 泛化能力:处理未见过的任务或数据时的表现。 5. 鲁棒性:应对错误输入、对抗性输入或模糊不清指令的能力。 6. 偏见和伦理:生成文本时是否存在偏见,是否遵循伦理标准。 7. 交互性和适应性:在交互环境中的表现,包括对用户反馈的适应性和持续对话的能力。 8. 计算效率和资源消耗:考虑模型大小、训练和运行所需的计算资源。 9. 易用性和集成性:是否易于集成到不同应用和服务中,提供的 API 和工具的易用性。 为了进行有效的比较,可以采用以下方法: 1. 标准基准测试:使用如 GLUE、SuperGLUE、SQuAD 等标准的语言模型评估基准,它们提供统一的测试环境和评分标准。 2. 自定义任务:根据特定需求设计任务,评估模型在特定领域的表现。 3. 人类评估:结合人类评估者的主观评价,特别是在评估文本质量和伦理问题时。 4. A/B 测试:在实际应用场景中,通过 A/B 测试比较不同模型的表现。 5. 性能指标:使用准确率、召回率、F1 分数、BLEU 分数等性能指标来量化比较。 当前领先的大型语言模型的排行榜,例如聊天机器人竞技场,由伯克利的团队管理,根据 ELO 评级对不同语言模型进行排名,计算方式与国际象棋中的类似。在排行榜中,顶部多为专有模型,下方有开放权重的模型。 大语言模型的特点包括: 1. 架构:有 encoderonly、encoderdecoder、decoderonly 等,如 BERT 是 encoderonly 模型,google 的 T5 是 encoderdecoder 模型,众多 AI 助手多为 decoderonly 模型。 2. 数据和参数:预训练数据量大,往往来自互联网,包括论文、代码、公开网页等,参数多,如 OpenAI 在 2020 年发布的 GPT3 已达到 170B 的参数。
2025-02-18
现在大语言模型的跑分对比
对比不同大语言模型的性能需要考虑多个维度,包括但不限于以下方面: 1. 理解能力:评估对语言的语法、语义、上下文和隐含意义的理解程度。 2. 生成质量:检查生成文本的流畅性、相关性和准确性。 3. 知识广度和深度:掌握广泛主题的知识程度,以及对特定领域或话题的理解深度。 4. 泛化能力:处理未见过的任务或数据时的表现。 5. 鲁棒性:应对错误输入、对抗性输入或模糊不清指令的能力。 6. 偏见和伦理:生成文本时是否存在偏见,是否遵循伦理标准。 7. 交互性和适应性:在交互环境中的表现,包括对用户反馈的适应性和持续对话的能力。 8. 计算效率和资源消耗:考虑模型大小、训练和运行所需的计算资源。 9. 易用性和集成性:是否易于集成到不同应用和服务中,提供的 API 和工具的易用性。 为了进行有效的比较,可以采用以下方法: 1. 标准基准测试:使用如 GLUE、SuperGLUE、SQuAD 等标准的语言模型评估基准,它们提供统一的测试环境和评分标准。 2. 自定义任务:根据特定需求设计任务,评估模型在特定领域的表现。 3. 人类评估:结合人类评估者的主观评价,特别是在评估文本质量和伦理问题时。 4. A/B 测试:在实际应用场景中,通过 A/B 测试比较不同模型的表现。 5. 性能指标:使用准确率、召回率、F1 分数、BLEU 分数等性能指标来量化比较。 当前领先的大型语言模型的排行榜,例如聊天机器人竞技场,由伯克利的团队管理,根据 ELO 评级对不同语言模型进行排名,计算方式与国际象棋中的类似。在排行榜中,顶部多为专有模型,下方有开放权重的模型。 大语言模型的特点包括: 1. 架构:有 encoderonly、encoderdecoder、decoderonly 等,如 BERT 是 encoderonly 模型,google 的 T5 是 encoderdecoder 模型,众多 AI 助手多为 decoderonly 模型。 2. 数据和参数:预训练数据量大,往往来自互联网,包括论文、代码、公开网页等,参数多,如 OpenAI 在 2020 年发布的 GPT3 已达到 170B 的参数。
2025-02-18
我手里有一个文件知识库,想锻炼一个ai,按照这个文件知识库的习惯帮我改写新的文件
以下是为您整理的内容: 南瓜博士:平生第一次写小说获奖,是 AI 帮我的! 三、丰富细化 接下来要让 AI 一段一段进行细节描写。为确保文章前后一致,先让 AI 帮助写故事概要和角色背景介绍,并按自己的审美略做修改。使用了一个重要技巧,让 AI 以表格形式输出细节描述,这样有三个好处: 1. 打破 AI 原本的叙事习惯,避免出现陈词滥调。 2. 按编号做局部调整容易,指哪改哪,其他内容能稳定不变。 3. 确保内容都是具体细节,避免整段输出时因缩减而丢光细节只剩笼统介绍。 四、串联成文 把上一步生成的五个表格依次复制粘贴,AI 就照着写文章了,偶尔需要帮忙给点建议。 五、失败的局部修改 小说大赛要求最后的作品必须是 AI 直接吐出来的,不能有任何改动且不能超过 2000 字,而自己的小说 2300+字,只好让 GPT4 做修改,一开始它表现不错,但很快暴露出记性不好的缺点。还没来得及高兴,就发现它失忆得很彻底。眼看截止时间快到了,只能求助 Claude,把文章和 GPT 生成的修改意见都给它,让它生成作品,匆匆截图提交。没想到,Claude 把关键情节改没了,如马克偷偷看艾拉、无名猫受伤的原因等。 熊猫 Jay:AI 编程 Cursor 来了,你没理由说不会写代码了 四、初体验:Cursor 的安装和使用 三、新增/修改代码、文字 选中代码,使用 Command+K 打开窗口,并输入修改要求。不选中代码打开窗口,可要求 AI 实现新功能,比如让 AI 增加一个广告位。当然,除了代码,也可选中文字进行修改,如改写、翻译等。 四、自动补全代码、注释、文字 输入代码或注释,Cursor 会自动补全代码,按 Tab 生效。除补全代码外,还能补全文字,可尝试。 五、对话窗口 Mac 使用 Shift+Command+L 打开聊天窗口,输入优化页面的需求,AI 能提供不同方案。比如倾向于使用好看的配色方案,点击 Apply,再点击 Accept 生效。要记得保存文件,Mac 的快捷键是 Command+S。这不是成品,若要做完整功能,需不停和 Cursor 对话,在案例部分会介绍完整制作过程。 六、全局搜索 还可把它当作简易的 AI 搜索工具,让它根据现有文件夹下的内容回答问题,比如问到基于文件内容,温度值设置的误区在哪里,回答准确度很高,甚至能定位到具体文件的行。
2025-02-17
帮我找一些具有文件上传功能的AI智能体或应用的搭建教程
以下是一些具有文件上传功能的 AI 智能体或应用的搭建教程: 使用 Coze 搭建: 方法一:直接使用 Coze 的 API 对接前端 UI 框架,将工作流逻辑集中在工程模板端,实现前后端分离的处理方式。 方法二:直接调用大模型 API,并通过前端代码实现提示词处理和逻辑控制,将交互流程完全放入前端代码中。 实现文件上传:通过 Coze 的,用户可将本地文件上传至 Coze 的云存储。在消息或对话中,文件上传成功后可通过指定 file_id 来直接引用该文件。 Coze 的 API 与工作流执行:关于 API 的使用及工作流执行流程可以参考。 设计界面:搭建 Demo 最简单的方式是首先绘制草图,然后借助多模态 AI 工具(如 GPT/Claude)生成初步的前端结构代码。前端开发语言包括 HTML 用于构建网页基础框架,定义整体页面结构;CSS 负责网页布局样式美化;JavaScript 实现交互逻辑,如信息处理、网络请求及动态交互功能。 Stuart 教学 coze 应用中的“上传图片”: 传递上传图片地址:首先,把工作流的入参设置为 File>Image。然后,注意代码内容,其中 ImageUpload1 部分是可以替换成实际的文件上传组件的组件名称的,一个引号,一个大括号都不能错。 获得图片 URL:接下来就比较简单了,工作流中可以直接用这个 image 变量,也可以用 string 模式输出,它会在工作流中变成图片的 URL。 无企业资质也能 coze 变现: 以 API 形式链接 Zion 和 Coze:同理也可以为 dify、kimi 等给任何大模型&Agent 制作收费前端。参考教程: 自定义配置:变现模版 UI 交互、API、数据库等拓展功能,支持在 Zion 内自由修改,可参考文档配置。相关链接:支付: 微信小程序变现模版正在开发中,不久将会上线。目前实现小程序端可以通过 API 形式搭建。 Zion 支持小程序,Web,AI 行为流全栈搭建,APP 端全栈搭建 2025 上线。
2025-02-16
帮我查找关于文件上传的智能体搭建教程 、
以下是关于文件上传的智能体搭建教程: 1. 上传文档至知识库: 点击【上传知识】按钮,进入知识上传和配置页面。 上传文档文件或 URL 导入。 上传文档类知识:支持上传 pdf(建议)、doc/docx、ppt/pptx、xlsx、csv、txt、md 等类型的文档,当前文档默认上传大小不超过 50M。对于本地化部署的知识库,可通过配置文件调整此限制。 可以添加 URL 类知识:支持添加多个 url 链接,添加后将会至网页中抓取静态内容,当前暂不支持下钻抓取其他网页的内容;手动点击更新后将会从网页上重新爬取内容(仅包含静态网页内容,不可下钻爬取内容)。若企业自有网站会做知识的动态更新,可以手动快速同步到清流平台上。 配置知识的切片方式:切片类型选择当前系统会根据解析的知识类型自动选择,若想了解更多信息,可至【进阶功能】【文档切片调优】处查看。设置支持配置图片处理方式和自定义切片方式,了解更多信息,可至【进阶功能】【文档切片调优】、【图片解析】处查看。 知识预览:根据选择的知识类型,展示预览内容方便查看切片效果。 2. 知识处理学习:配置完成后知识将进入数据处理中状态,主要对知识进行解析、切片和向量化处理,此时耐心等待数据处理完成即可。
2025-02-16
能直接导入md文件的ai
以下是为您整理的相关内容: 关于导入 md 文件的 AI 工具 Process ON: 输入大纲和要点: 导入大纲和要点: 手动复制,相对比较耗时间。 导入方式: 1. 复制最终大纲的内容,到本地的 txt 文件后,将后缀改为.md。如果看不见后缀,可以自行搜索开启后缀。 2. 打开 Xmind 软件,将 md 文件导入 Xmind 文件中。 3. Process ON 导入 Xmind 文件。以导入方式新建思维导图,选择准备好的 Xmind 文件,导入成功。 输入主题自动生成大纲和要求:新增思维导图,输入主题,点击 AI 帮我创作,生成结束。 选择模版并生成 PPT:点击下载,选择导入格式为 PPT 文件,选择模版,再点击下载。如果喜欢用 Process ON 的小伙伴,没有会员,可以某宝买个一天会员。 Agentic AI 相关: 在使用 Windsurf 时,如果要进行相关操作,为了安全考虑,不允许 AI 直接更改.windsurfrules 文件。需要把相关内容拆成两个部分,一个比如叫 scratchpad.md,在.windsurfrules 文件里提及:当每次进行思考前,要先看一眼 Scratchpad,并在里面更新计划。这种间接方式虽效果可能不如直接放在..cursorrules 里好,但试下来也是可以工作的。 用 Claude 进行各种设计: 自从 Claude 3.5 sonnet 更新到新版后,增强了视觉理解与编程质量,词生卡效果已完美进化到下一个 Level。 用 Claude 画公众号封面:效果示例,如果第 1 版效果一般,可以多尝试通用改进提示词或直接提出针对性意见,如主题色改为浅色调、增加文字投影效果。 用 Claude 画海报:如果需要调整海报内容,可给出具体提示,如白色底,浅绿色主题,轻微投影。 用 Claude 绘制可视化概念图,用于 PPT 等插图场景:有浅色版和深色版示例。 用 Claude 绘制微信 UI:发挥脑洞,只要是网页、软件界面设计能做出的图片效果,只要没有专业要求,大部分都能靠 Claude AI 来实现。 尝试途径: 1. :一个优秀的 AI 助手工具,付费后可使用 Claude 3.5 sonnet、ChatGPT4O 等顶级大模型(也是目前最常用的 AI 对话助手;🔗是邀请链接,如介意可自行搜索 Monica) 2. :claude 官方原版,注册后可每日限额免费体验(但存在较高的封号风险) 也可以通过 Cursor、Windsurf 等 AI 编程产品,调用 Claude AI API,但不支持 Artifacts 这种即时预览的使用方式,需要单独保存代码文件后查看。不过好处是,可以用 MD、CSV 等格式的文件,存储提示词、更新记录和 AI 交互数据。
2025-02-13
音频文件转为MP3格式的AI有哪些?是否需要付费?
目前市面上将音频文件转为 MP3 格式的 AI 工具较多,常见的有格式工厂、迅捷音频转换器等。这些工具部分提供免费服务,但也有一些功能或高级版本需要付费。具体的付费情况会因工具的不同而有所差异。
2025-02-13
我做餐饮服务相关的投标文件,能用到哪些ai工具或平台能让我提高工作效率
以下是一些在制作餐饮服务投标文件时可能提高工作效率的 AI 工具和平台: 1. AutogenAI:伦敦初创公司开发的基于生成型人工智能的工具,声称可以帮助企业撰写更强的提案,提高中标率。能将撰写强大提案的过程加快 800%,同时降低 10%的采购成本。 2. Synthesia:允许用户创建由 AI 生成的高质量视频,包括数字人视频。可用于制作营销视频、产品演示等。 3. HeyGen:基于云的 AI 视频制作平台,用户可从 100 多个 AI 头像库中选择,并通过输入文本生成数字人视频。适合制作营销视频和虚拟主持人等。 4. Jasper AI:人工智能写作助手,可用于生成营销文案、博客内容、电子邮件等。提供多种语气和风格选择,写作质量较高。 5. Copy.ai:AI 营销文案生成工具,可快速生成广告文案、社交媒体帖子、电子邮件等营销内容。有免费和付费两种计划。 6. Writesonic:AI 写作助手,专注于营销内容创作,如博客文章、产品描述、视频脚本等。提供多种语气和行业定制选项。 您还可以查看 WaytoAGI 网站(https://www.waytoagi.com/sites?tag=8)获取更多相关信息。但请注意,内容由 AI 大模型生成,请仔细甄别。
2025-02-12