直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

你是一个搜索AI还是通用的大模型

回答

AI 既包括专门用于搜索的模型,也有通用的大模型。

在搜索方面,有像 You.com、Neeva 这样为一般搜索查询提供服务的公司,Consensus 跨越研究论文进行搜索,Perplexity 的 Bird SQL 产品针对特定的 Twitter 内容进行搜索。同时,存在能联网检索的 AI,例如 ChatGPT Plus 用户可开启 web browsing 功能实现联网,Perplexity 结合了问答和普通搜索引擎的功能,Bing Copilot 可简化在线查询和浏览活动,还有 You.com 和 Neeva AI 等提供基于人工智能的定制搜索体验并保护用户数据隐私的搜索引擎。

通用大模型方面,如 ChatGPT 的崛起让人们认为大模型可能是通用的,但通用技术并非通用人工智能(准确来讲,Artificial General Intelligence 是强人工智能),强人工智能的定义是可以如同人一样做任何智力任务。

需要注意的是,以上内容由 AI 大模型生成,请仔细甄别。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

生成式 AI:下一个消费者平台

人工智能语言模型有可能彻底改变互联网的核心功能之一:搜索。我们都经历过在Google中输入一个问题,然后被一大堆链接淹没的困境,其中一些链接还有相互冲突或不准确的信息。这实际上就是一个[无尽的滚动](https://techcrunch.com/2022/12/05/google-introduces-continuous-scrolling-on-desktop-for-search/)。如果你可以得到一个用自然语言写成的简洁答案,并且在你感兴趣的时候可以点击链接阅读更多内容,那将是多么美好?由大型语言模型(LLM)驱动的搜索引擎使这成为可能。如[You](https://you.com/)和[Neeva](https://neeva.com/)这样的公司正在为一般搜索查询提供这种服务。其他公司则采取更垂直化的方法:[Consensus](https://consensus.app/)跨越研究论文进行搜索,以提供有依据的答案,而[Perplexity](https://www.perplexity.ai/sql)的Bird SQL产品则针对Twitter(例如:“关于金球奖时尚的最热门推文”)。

学习笔记:Generative AI for Everyone吴恩达

ChatGPT的崛起导致大家认为,大模型可能是通用的。但是通用技术不是通用人工智能(准确来讲,Artificial General Intelligence是强人工智能)强人工智能定义是,可以如同人一样,可以做任何智力任务

问:有没有能联网检索的AI?

是的,存在能联网检索的AI。这些AI通过连接互联网,实时搜索、筛选并整合所需数据,以提供给用户更精准和个性化的信息。例如,ChatGPT Plus用户现在可以开启web browsing功能,实现联网功能。Perplexity,它结合了ChatGPT式的问答和普通搜索引擎的功能,允许用户指定希望聊天机器人在制定响应时搜索的源类型。Bing Copilot,作为一个AI助手,旨在简化您的在线查询和浏览活动。还有如You.com和Neeva AI等搜索引擎,它们提供了基于人工智能的定制搜索体验,并保持用户数据的私密性。这些AI搜索工具的出现,标志着在信息检索领域的一个重要发展,它们通过结合AI技术和搜索引擎,大幅提升了数据集命中预期,并为实际应用带来了更多可能性。内容由AI大模型生成,请仔细甄别。

其他人在问
结合知识库的商业项目, 给我100个ai创业的落地方案
很抱歉,目前知识库中没有为您提供 100 个 AI 创业的落地方案。但以下为您列举一些常见的 AI 创业方向供您参考: 1. 开发基于 AI 的智能客服系统,为企业提供高效的客户服务解决方案。 2. 利用 AI 技术进行精准营销,通过数据分析和预测为企业制定个性化的营销策略。 3. 打造 AI 驱动的医疗诊断辅助工具,帮助医生更准确地诊断疾病。 4. 研发 AI 教育软件,实现个性化学习和智能辅导。 5. 构建 AI 智能家居系统,实现家居设备的自动化控制和智能化管理。 6. 开发 AI 图像识别技术,应用于安防、交通等领域。 7. 推出 AI 金融风险评估模型,为金融机构提供更准确的风险评估。 8. 打造 AI 内容创作平台,生成文章、视频脚本等。 9. 研发 AI 人力资源管理工具,进行人才筛选和绩效评估。 10. 构建 AI 物流优化系统,提高物流效率和降低成本。 您可以根据自身的资源和优势,进一步细化和拓展这些方向,形成具体的创业方案。
2024-10-18
除了生成式ai还有什么ai
以下是除生成式 AI 之外的一些常见的 AI 类型: 1. 监督学习型 AI:使用标记的数据进行训练,以预测未来的值。 2. 无监督学习型 AI:专注于在原始数据中发现模式。 3. 深度学习型 AI:使用人工神经网络处理复杂模式,可使用标记和未标记的数据进行半监督学习。 4. 强化学习型 AI:通过与环境的交互和奖励机制来学习最优策略。 在游戏领域,早期的游戏中的计算机控制对手是简单脚本程序,而现在由于更快的微处理器和云技术,能够构建大型神经网络,在高度复杂的领域中识别模式和表示。未来,多代理系统可能会成为建模推理和社会学习过程的主流方式。在生成式 AI 的下一个阶段,推理研发成果将渗透到应用层,特定领域中获取真实世界数据和构建特定认知架构仍是挑战。
2024-10-18
有没有好用的辅助做笔记的ai工具和指令?
以下为您推荐一些好用的辅助做笔记的 AI 工具: Vowel:https://www.vowel.com/ Augment:https://www.augment.co/?ref=superhuman1_mar23&utm_source=superhuman.beehiiv.com&utm_medium=newsletter&utm_campaign=thisaicanhackinterviews Noty:https://noty.ai/ Sembly AI:https://www.sembly.ai/ Briefly:https://chrome.google.com/webstore/detail/brieflyaimeetingsummar/bjmgcelbpkgmofiogkmleblcmecflldk Fireflies.ai:https://app.fireflies.ai/ Noota:https://chrome.google.com/webstore/detail/nootascreenrecordermee/eilpgeiadholnidgjpgkijfcpaoncchh Read:https://app.read.ai/analytics/meetings 、https://app.read.ai/analytics/settings/workspace/new 相关文章参考: 此外,还有一些 AI 工具在其他相关领域也表现出色,例如: 在制作 PPT 方面,有 Gamma(https://gamma.app/)、美图 AI PPT(https://www.xdesign.com/ppt/)、Mindshow(https://www.mindshow.fun/)、讯飞智文(https://zhiwen.xfyun.cn/)等。
2024-10-18
ai视频
以下是关于 AI 视频的相关内容: 从生成方式分类: 1. 文生视频、图生视频:Runway、Pika labs、SD + Deforum、SD + Infinite zoom、SD + AnimateDiff、Warpfusion、Stability Animation。 2. 视频生视频: 逐帧生成:SD + Mov2Mov。 关键帧+补帧:SD + Ebsynth、Rerender A Video。 动态捕捉:Deep motion、Move AI、Wonder Dynamics。 视频修复:Topaz Video AI。 3. AI Avatar+语音生成:Synthesia、HeyGen AI、DID。 4. 长视频生短视频:Opus Clip。 5. 脚本生成+视频匹配:Invideo AI。 6. 剧情生成:Showrunner AI。 从产品阶段和可用维度分类: 1. Opusclip:利用长视频剪成短视频。 2. Raskai:短视频素材直接翻译至多语种。 3. invideoAI:输入想法>自动生成脚本和分镜描述>生成视频>人工二编>合成长视频。 4. descript:屏幕/播客录制>PPT 方式做视频。 5. veed.io:自动翻译自动字幕。 6. clipchamp:微软的 AI 版剪映。 7. typeframes:类似 invideoAI,内容呈现文本主体比重更多。 部分 AI 视频软件汇总及相关信息: |网站名|网址|费用|优势/劣势|教程| |||||| |Runway|https://runwayml.com| |有网页有 app 方便|| |haiper|https://app.haiper.ai/|免费| | | |SVD|https://stablevideo.com/|有免费额度|对于景观更好用|| |Pika|https://pika.art/|收费 https://discord.gg/pika|可控性强,可以对嘴型,可配音|| |PixVerse|https://pixverse.ai/|免费|人少不怎么排队,还有换脸功能|| |Dreamina|https://dreamina.jianying.com/|剪映旗下|生成 3 秒,动作幅度有很大升级|| |Morph Studio|https://app.morphstudio.com/| |还在内测| | |Heygen|https://www.heygen.com/| |数字人/对口型| | |Kaiber|https://kaiber.ai/| | | | |Moonvalley|https://moonvalley.ai/| | | | |Mootion|https://discord.gg/AapmuVJqxx| |3d 人物动作转视频| | |美图旗下|https://www.miraclevision.com/| | | | |Neverends|https://neverends.life/create|2 次免费体验|操作傻瓜| | |SD|Animatediff SVD deforum|免费|自己部署| | |Leiapix|https://www.leiapix.com/|免费|可以把一张照片转动态| | |Krea|https://www.krea.ai/|12 月 13 日免费公测了| | | |luma||30 次免费| | | |Kling|kling.kuaishou.com| | ||
2024-10-18
0基础学习AI应该从哪里开始入手呢
对于 0 基础学习 AI,您可以从以下几个方面入手: 1. 了解 AI 基本概念: 建议阅读「」部分,熟悉 AI 的术语和基础概念。了解什么是人工智能,它的主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,这些文章通常会介绍 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,您将找到一系列为初学者设计的课程。这些课程将引导您了解生成式 AI 等基础知识,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,您可以按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛(比如图像、音乐、视频等),您可以根据自己的兴趣选择特定的模块进行深入学习。 建议您一定要掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动是学习 AI 的另一种有效方式。尝试使用如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 通过与这些 AI 产品的对话,您可以获得对 AI 在实际应用中表现的第一手体验,并激发您对 AI 潜力的认识。 记住,学习 AI 是一个长期的过程,需要耐心和持续的努力。不要害怕犯错,每个挑战都是成长的机会。随着时间的推移,您将逐渐建立起自己的 AI 知识体系,并能够在这一领域取得自己的成就。完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。 对于中学生学习 AI,还可以: 1. 从编程语言入手学习: 可以从 Python、JavaScript 等编程语言开始学习,这些是 AI 和机器学习的基础。 学习编程语法、数据结构、算法等基础知识,为后续的 AI 学习打下基础。 2. 尝试使用 AI 工具和平台: 可以使用 ChatGPT、Midjourney 等 AI 生成工具,体验 AI 的应用场景。 探索一些面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识: 了解 AI 的基本概念、发展历程、主要技术如机器学习、深度学习等。 学习 AI 在教育、医疗、金融等领域的应用案例。 4. 参与 AI 相关的实践项目: 可以参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动。 尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 5. 关注 AI 发展的前沿动态: 关注 AI 领域的权威媒体和学者,了解 AI 技术的最新进展。 思考 AI 技术对未来社会的影响,培养对 AI 的思考和判断能力。 总之,中学生可以从编程基础、工具体验、知识学习、实践项目等多个方面入手,全面系统地学习 AI 知识和技能,为未来的 AI 发展做好准备。但请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-10-18
ai建站推荐
以下为您推荐一些 AI 建站工具: 1. 即时设计:https://js.design/ 这是一款可在线使用的「专业 UI 设计工具」,为设计师提供更加本土化的功能和服务,相较于其他传统设计工具,更注重云端文件管理、团队协作,并将设计工具与更多平台整合,一站搞定全流程工作。 2. V0.dev:https://v0.dev/ Vercel Labs 推出的 AI 生成式用户界面系统。每个人都能通过文本或图像生成代码化的用户界面。它基于 Shadcn UI 和 Tailwind CSS 生成复制粘贴友好的 React 代码。 3. Wix:https://wix.com/ Wix 是一款用户友好的 AI 工具,可让您在没有任何编码知识的情况下轻松创建和自定义自己的网站,提供广泛的模板和设计供您选择,以及移动优化和集成电子商务功能等功能。Wix 建站工具通过拖放编辑、优秀模板和 250 多种 app,能帮助不同领域的用户创建所有种类的网站。 4. Dora:https://www.dora.run/ 使用 Dora AI,可以通过一个 prompt,借助 AI 3D 动画,生成强大网站。支持文字转网站,生成式 3D 互动,高级 AI 动画。 在选择 AI 网站制作工具时,您可以考虑以下因素: 1. 目标和需求:确定您的网站目标(例如个人博客、商业网站、在线商店)和功能需求。 2. 预算:有些工具提供免费计划或试用版,但高级功能可能需要付费订阅。 3. 易用性:选择一个符合您技术水平的工具,确保您能够轻松使用和管理网站。 4. 自定义选项:检查工具是否提供足够的自定义选项,以满足您的设计和功能需求。 5. 支持和资源:查看是否有足够的客户支持和学习资源(如教程、社区论坛),帮助您解决问题。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-10-18
基于飞书的知识库RAG的搭建,需要什么接口进行全文搜索
基于飞书的知识库 RAG 搭建,可用于全文搜索的接口方式主要有以下几种: 1. 语义检索:语义匹配关注查询和文档内容的意义,而非仅仅表面的词汇匹配。通过向量的相似性来判断语义的相似性。 2. 全文检索:这是基于关键词的检索方式。例如,对于句子“猫的饮食习惯包括吃鱼和鸡肉”,输入“猫”“饮食”“猫的饮食习惯”“吃鱼”等关键词可搜索到该句子,但输入“猫喜欢吃什么呀”则无法搜索到。 3. 混合检索:结合了语义匹配和全文检索的优点,通常系统先进行全文检索获取初步结果,然后再对这些结果进行语义匹配和排序。 此外,在本地部署资讯问答机器人实现 RAG 时,会涉及加载所需的库和模块,如 feedparse 用于解析 RSS 订阅源,ollama 用于在 python 程序中跑大模型。还会为文档内容生成向量,如使用文本向量模型 bgem3 等。 在开发 LangChain 应用开发指南中,实现 LangChain 和 RAG 的结合时,需要加载数据、分割文档、转换嵌入并存储到向量存储器、创建检索器以及聊天模型等步骤。
2024-10-17
AI搜索与传统搜索的比较研究
AI 搜索与传统搜索相比具有以下特点和差异: 360 AI 搜索:定位为新一代答案引擎,在传统搜索网页检索能力基础上,结合大型语言模型的多种技术能力,学习人类思维和语言组织模式,生成优质答案。具有针对模糊问题通过反问和交互理解给出答案、搜索全网丰富内容生成丰富答案、回答更具时效性、通过主动追问帮助用户延展学习等特点。其工作流程包括分析问题语义、提炼搜索关键词、查询全网相关内容、精选高价值网页、进行结构化总结等。Web 端和 H5 端网址为,手机端可扫码下载 360 AI 搜索 APP。 一般情况:如果将人工智能作为搜索引擎,存在幻觉风险,大多数未连接互联网。但有证据表明在某些情况下,如技术支持、决定吃饭地点或获取建议等,若谨慎使用,人工智能能提供比搜索更有用的答案,必应通常比谷歌更好。 竞争格局:今年二月份以来,AI 搜索赛道不断有新产品,市场定位有差异。国内有大模型厂商和搜索厂商或创业团队推出的产品,海外也有成熟和新出的产品。如 Perplexity、ThinkAny 是通用搜索,Phind、Devv、Reportify 是垂直搜索。通用搜索没有明显受众倾向,能回答各类问题;垂直搜索面向特定人群或领域,在特定问题上有更好结果。其好坏没有客观评判标准。
2024-10-16
AI搜索的底层逻辑是怎样的
AI 搜索的底层逻辑主要是“检索增强生成(RAG)”,具体包括以下步骤: 1. 检索(Retrieve):使用用户的查询(query)调用搜索引擎 API,获取搜索结果。 2. 增强(Augmented):设置提示词,将检索结果作为挂载的上下文。 3. 生成(Generation):大模型回答问题,并标注引用来源。 在检索过程中,还涉及以下原理: 1. 信息筛选与确认:对检索器提供的信息进行评估,筛选出最相关和最可信的内容,并验证信息的来源、时效性和相关性。 2. 消除冗余:识别和去除多个文档或数据源中的重复信息,避免在生成回答时出现重复或矛盾。 3. 关系映射:分析不同信息片段之间的逻辑和事实关系,如因果、对比、顺序等,构建结构化的知识框架。 4. 上下文构建:将筛选和结构化的信息组织成连贯的上下文环境,包括排序、归类和整合。 5. 语义融合:必要时合并意义相近但表达不同的信息片段,减少语义重复并增强表达力。 6. 预备生成阶段:将整合好的上下文信息编码成适合生成器处理的格式,如转化为适合输入到生成模型的向量形式。 最后,全新的上下文被传递给大语言模型,大语言模型根据提供的信息生成准确和连贯的答案。影响 AI 搜索的关键因素包括挂载的上下文信息密度和基座模型的智能程度。在响应速度方面,Retrieve 要求联网检索信息的速度快,Generation 要求大模型生成内容的速度快,同时为提高准确度可能存在耗时的重排和获取内容详情步骤。
2024-10-16
请搜索生成式对话crm软件
以下是关于生成式对话 CRM 软件的相关信息: 生成式 AI Studio 方面: 创建聊天提示:可与模型进行自由形式聊天,跟踪之前内容并根据上下文响应。返回语言页面,单击 + CREATE CHAT PROMPT 按钮创建新聊天提示,添加上下文到上下文字段,将相关文本复制到 Responses 下的聊天框,按 Enter 键或单击发送消息,模型会根据提供的额外上下文在约束范围内回答问题。 探索提示库:Prompt Gallery 可让您探索生成式 AI 模型在各种用例中的应用。在 Generative AI Studio 菜单中,单击 Language 可在 Get Started 页面上找到 Prompt Gallery,可从总结、分类、提取、写作和构思等用例中选择并探索。 课程字幕:介绍了生成式 AI Studio 中的一些模型参数,如调整温度(选择概率低、比较不寻常的词)、top K(从可能性最高的 K 个词中随机返回一个词)、top P(从 top P 个词中随机返回一个词的概率)等。 AIGC 在 CRM 中的应用: 个性化营销内容创作:根据客户数据生成个性化营销文案、视觉内容等,提高营销效率和转化率。 客户服务对话系统:开发智能客服系统,通过自然语言交互解答客户咨询、投诉等。 产品推荐引擎:生成产品描述、视觉展示等内容结合推荐算法为客户推荐产品,提升销售业绩。 CRM 数据分析报告生成:自动生成数据分析报告,包括多种形式,加快生产流程。 智能翻译和本地化:提供高质量多语种翻译及本地化服务,打造全球化营销内容。 虚拟数字人和营销视频内容生成:快速生成虚拟数字人形象、场景背景和营销视频内容,降低制作成本。 客户反馈分析:高效分析客户反馈文本和多媒体信息,挖掘需求和潜在痛点。 需要注意的是,AIGC 在应用过程中仍需解决算法偏差、版权和知识产权等伦理法律问题。
2024-10-15
法律行业搜索案例的免费ai哪个好用
在法律行业,进行案例搜索时最好使用法律行业垂类的 AI 产品,通用型 AI 可能存在查不出来、数据不全或生成内容不满足需求的情况。以下是一些案例检索的 Prompt 指令词示例及相关场景: 场景一:案例检索 Prompt 指令词:请搜索近五年内关于商标侵权案件中“混淆可能性”标准的具体判例,并提供相似度最高的三个案例的关键要点摘要。 预计效果:AI 系统将检索相关数据库,找出符合要求的判例,并提炼出这些案例中有关“混淆可能性”标准的关键判决理由和结果,形成摘要报告。 其他例子: Prompt 指令词:检索近三年内所有涉及软件算法专利侵权的案例,分析法院判决中关于技术特征对比和侵权判定的标准,为即将面临的专利侵权案件提供参考。 Prompt 指令词:比对不同地区法院在处理劳动争议案件时对加班费计算标准的差异判决,总结对雇主有利的判决趋势,为客户提供合规操作指导。 Prompt 指令词:研究环境法相关案例,特别是涉及工业废弃物处理的法律责任,为客户提供合规处理建议,以降低潜在的法律风险。 Prompt 结构提示:【案例领域或类型+明确需要查找的重点内容+查找案例的目的+其他希望 AI 做的事情】 场景二:类案检索 Prompt 指令词:(与场景一类似) 预计效果:(与场景一类似) 其他例子:(与场景一类似) Prompt 结构提示:(与场景一类似) 场景四:法规研究与解读 Prompt 指令词:根据最新修订的《数据安全法》,解析企业在处理个人信息时应遵循的主要原则,并给出具体操作建议。 预计效果:AI 助手将依据《数据安全法》的最新条款,解析企业处理个人信息所必须遵循的原则,并结合实践情况提出详细的操作指南或合规建议。 其他例子: Prompt 指令词:分析新出台的《网络安全法》对电子商务平台的具体影响,特别是数据保护和用户隐私方面的规定,为客户提供合规操作指南。 Prompt 指令词:【输入一段具体法律规定如:国际贸易规定】,以上是国际贸易法规的最新变化,为客户提供跨境交易的合规指南,特别是关税和进出口限制方面的内容。 Prompt 指令词:解读新修订的税法对中小企业的影响,提供税务规划和避税策略的建议,确保客户在合法范围内优化税务负担。 Prompt 结构提示:【需求 or 目的+根据具体法条或者根据某部法律+具体需要研究或则具体的研究细节内容】 场景五:法律意见书撰写或非诉交易文件材料 Prompt 指令词:针对我方当事人涉及的版权纠纷案,输入【已有的证据材料】+【相关法律条文】,撰写一份初步法律意见书,论证我方主张的合理性和胜诉的可能性。 预计效果:AI 将基于商标法的相关条款和案例法,提供关于商标侵权案件的诉讼策略。这将包括对原告商标权利的详细分析、被告侵权行为的法律评估、关键证据的搜集建议、可能的法律抗辩点以及在适当情况下和解或调解的策略。AI 的目标是帮助律师构建一个全面的诉讼计划,以提高胜诉几率并为客户争取最大利益。 其他例子: Prompt 指令词:为一起涉及专利侵权的案件制定诉讼策略,分析专利的有效性、被告的侵权行为以及可能的抗辩理由,提出如何证明侵权和计算损害赔偿的建议。 Prompt 指令词:针对一起劳动合同纠纷案件,分析员工的权益和雇主的责任,提出诉讼策略,包括主张的权益、证据收集的重点以及如何证明雇主的违约行为。 Prompt 指令词:在一场涉及知识产权许可的诉讼中,分析许可协议的条款和双方的权利义务,提出诉讼策略,包括如何证明许可协议的违反、计算损失赔偿以及可能的合同解除条件。 其他可以尝试的场景:模拟法庭 Prompt 指令词:模拟一场涉及商业合同违约的法庭审理,分析原告主张的违约责任和被告提出的免责抗辩,预测法庭可能的判决,并提出如何优化法庭陈述和证据呈现的建议。 预计效果:AI 将根据商业合同法的相关规定和案例法,模拟法庭审理过程。AI 将提供对原告和被告双方可能的论点、证据和法律依据的分析,预测法庭可能的判决结果,并给出如何更有效地在法庭上进行陈述、展示证据和进行交叉审问的建议。这将帮助律师准备更有说服力的法庭策略,以期达到最佳的诉讼结果。 其他例子:(与上述类似)
2024-10-10
如何使用大模型搜索本地文件连接
使用大模型搜索本地文件连接的方法如下: 1. 对于 SDXL 大模型: 首先,获取模型。您可以关注公众号【白马与少年】,回复【SDXL】获取下载链接。 要在 webUI 中使用,需将 webUI 的版本在秋叶启动器中升级到 1.5 以上。 然后,将 base 和 refiner 模型放在“……\\sdwebuiakiv4.2\\models\\Stablediffusion”路径下,将 vae 模型放在“……\\sdwebuiakiv4.2\\models\\VAE”路径下。 启动 webUI 后,即可在模型中看到 SDXL 模型。 正常使用时,先在文生图中使用 base 模型,填写提示词和常规参数生成图片,再将图片发送到图生图中,切换大模型为“refiner”重绘。 2. 对于其他模型: 大多数模型可在 Civitai(C 站)https://civitai.com/ 下载。使用方法为:科学上网,点击右上角筛选按钮找到所需模型类型,如 Checkpoint=大模型、LoRA=Lora,查看感兴趣的照片并下载,或通过左上角“Images”查看他人已做好的图片并获取相关信息。 模型下载地址:大模型存放在下载 SD 时的根目录;Lora 和 VAE 也有相应存放位置。 若不知下载的模型类型,可使用秋叶的模型解析工具 https://spell.novelai.dev/,将模型拖动到空白处查看模型信息。 常用的模型网站还有: 下载模型后,不同类型的模型放置在不同目录下。大模型(Ckpt)放入 models\\Stablediffusion;VAE 模型放置在 models\\Stablediffusion 或 models\\VAE 目录并在 webui 的设置栏目选择;Lora/LoHA/LoCon 模型放入 extensions\\sdwebuiadditionalnetworks\\models\\lora 或 models/Lora 目录;Embedding 模型放入 embeddings 目录。
2024-10-09
个人使用可以通过对话微调的大模型
大模型是指输入大量语料,使计算机获得类似人类的“思考”能力,能够进行文本生成、推理问答、对话、文档摘要等工作。可以用“上学参加工作”来类比大模型的训练和使用过程: 1. 找学校:训练大模型需要大量计算,GPU 更合适,只有购买得起大量 GPU 的才有资本训练。 2. 确定教材:大模型需要的数据量特别多,几千亿序列(Token)的输入基本是标配。 3. 找老师:用合适的算法让大模型更好理解 Token 之间的关系。 4. 就业指导:为让大模型更好胜任某一行业,需要进行微调(fine tuning)指导。 5. 搬砖:完成就业指导后,进行如翻译、问答等工作,在大模型里称为推导(infer)。 在 LLM 中,Token 被视为模型处理和生成的文本单位,能代表单个字符、单词、子单词等,具体取决于分词方法。将输入分词时会数字化形成词汇表。 个人动手实验方面: macOS 系统可采用 GGML 量化后的模型。有名的项目如 ggerganov/llama.cpp:Port of Facebook's LLaMA model in C/C++ ,首先编译,利用 Metal 的 GPU 用相应命令编译,然后去下载模型,还提供了 WebUI,启动 server 后默认监听 8080 端口,打开浏览器可对话。 Whisper 与 llama 类似,用 make 命令编译,去指定地址下载量化好的模型,转换音频,目前只接受 wav 格式,可用 ffmpeg 转化。 张梦飞的教程《用聊天记录克隆自己的 AI 分身》全程本地操作,目标是把微信聊天记录导出,用其微调模型,最终接入微信替你回复消息。
2024-10-18
国内能通过对话微调的语言大模型
以下是国内一些能通过对话微调的语言大模型: 教育领域:桃李(Taoli) 地址: 简介:在国际中文教育领域数据上进行了额外训练的模型,基于国际中文教育教材等构建资源库和问答数据集,并利用数据进行指令微调,让模型习得将知识应用到具体场景中的能力。 数学领域:chatglmmaths 地址: 简介:基于 chatglm6b 微调/LORA/PPO/推理的数学题解题大模型,样本为自动生成的整数/小数加减乘除运算,可 gpu/cpu 部署,开源了训练数据集等。 文化领域:Firefly 地址: 简介:中文对话式大语言模型,构造了许多与中华文化相关的数据,如对联、作诗、文言文翻译、散文、金庸小说等,以提升模型在这方面的表现。 金融领域: Cornucopia(聚宝盆) 地址: 简介:开源了经过中文金融知识指令精调/指令微调的 LLaMA7B 模型。通过中文金融公开数据+爬取的金融数据构建指令数据集,并在此基础上对 LLaMA 进行了指令微调,提高了 LLaMA 在金融领域的问答效果。基于相同的数据,后期还会利用 GPT3.5 API 构建高质量的数据集,另在中文知识图谱金融上进一步扩充高质量的指令数据集。 BBTFinCUGEApplications 地址: 简介:开源了中文金融领域开源语料库 BBTFinCorpus,中文金融领域知识增强型预训练语言模型 BBTFinT5 及中文金融领域自然语言处理评测基准 CFLEB。 XuanYuan(轩辕) 地址: 简介:国内首个开源的千亿级中文对话大模型,同时也是首个针对中文金融领域优化的千亿级开源对话大模型。在 BLOOM176B 的基础上针对中文通用领域和金融领域进行了针对性的预训练与微调,不仅可以应对通用领域的问题,也可以解答金融相关的各类问题,为用户提供准确、全面的金融信息和建议。
2024-10-18
我的app应用想要对接大语言模型,结合APP用户自身的数据,实现更精准的对话,是否有行业比较成功的案例可以借鉴
以下是一些在 APP 应用对接大语言模型方面比较成功的案例,可供您借鉴: 1. Poe: 由 Quora 开发,有 APP 版本,支持跨端使用。 集成了 Chat GPT、GPT4、Claude+、Claude、Dragonfly 等模型,同时支持用户自建 Chatbot。 不同语言模型回复效果有差异,适合需要调用多种大语言模型的用户。 Dragonfly 擅长给出较短的回答,并擅长在输入中给出示例时遵循指示。 Claude 更擅长创造性回复,配合 Poe 中的提问引导,非常适合在查阅资料时使用。 支持分享用户和模型的对话内容,但 GPT4、Claude+产品需要付费订阅使用。 访问地址: Poe 中的提问引导真的能够启发到用户,midjourney prompt 扩写 Chatbot 能力很惊人。 2. Perplexity.ai: 本质是个可联网的搜索引擎,完全免费,支持网页版、APP(目前支持 iOS,安卓即将推出)、Chrome 插件。 网页版能力全面,能够根据提问从互联网上搜寻信息并给出总结后的答案。 很多 Chat GPT 中调用插件才能解决的事情(联网查询、旅行、住宿、商品推荐)靠 Perplexity 就可以解决。 能给出信息来源网址,并根据搜索内容给出继续对话的问题建议。 最新推出的 Copilot 能力支持根据搜索内容进行信息补充,每 4h 内使用 5 次,调用 GPT4。 支持分享聊天内容到多渠道。 首页推荐当下流行的新闻、搜索内容。 支持筛选 Academic(包含不同领域的学术研究论文)、Wolfram|Alpha(包含数学、科学、经济学、语言学、工程学、社会科学、文化等领域的知识库)、Wikipedia(维基百科)、Youtube、Reddit(娱乐、社交和新闻网站)、News 进行搜索。 Chrome 插件可针对当前页面给出即时摘要。 访问地址:
2024-10-18
大模型合规
大模型的安全问题包括以下方面: 1. 对齐保障:通过对齐(指令调优),如 ChatGPT 从 GPT3 经过对齐而来,使其更好地理解人类意图,增加安全保障,确保不输出有害内容。对齐任务可拆解为监督微调及获取奖励模型和进行强化学习来调整输出分布。例如 LLAMA2 使用安全有监督微调确保安全,强化学习能让模型根据人类反馈更细粒度思考答案的安全性,面对训练分布外数据也能拒绝不当回答。 2. 数据过滤:在预训练阶段对数据进行过滤,如 baichuan2 采用此技术减少有害输出,但因数据关联性,仅靠此方法可能不够,模型仍可能从关联中学到有害内容,且面对不良信息时可能因缺少知识而处理不当。 3. 越狱问题:用户可能通过越狱(Jailbreak)使模型的对齐失效,重新回答各种问题。 大模型的特点包括: 1. 架构:分为 encoderonly、encoderdecoder、decoderonly 三类,目前熟知的 AI 助手多为 decoderonly 架构,由 transformer 衍生而来。 2. 规模:预训练数据量大,来自互联网的多种来源,且参数众多,如 GPT3 已达 170B 的参数。 GPT3 与 ChatGPT 相比,除形式不同外,安全性也有差别。
2024-10-18
大模型安全相关资料
以下是关于大模型安全的相关资料: 大模型的架构:包括 encoderonly、encoderdecoder 和 decoderonly 三种类型。其中,我们熟知的 AI 助手基本采用 decoderonly 架构,这些架构都是由谷歌 2017 年发布的“attention is all you need”论文中提出的 transformer 衍生而来。 大模型的特点:预训练数据量大,往往来自互联网上的论文、代码、公开网页等,通常用 TB 级别的数据进行预训练;参数非常多,如 Open 在 2020 年发布的 GPT3 就已达到 170B 的参数。 大模型的安全性保障:通过对齐(指令调优),包括监督微调、获取 reward model 与进行强化学习来调整语言模型的输出分布,以保证语言模型不会输出有害内容和信息。例如 LLAMA2 专门使用了安全有监督微调确保安全。但 Alignment 并不足以防护所有安全问题,存在越狱(Jailbreak)现象,会使模型对齐失效。此外,还有隐私问题。 相关资源:如果想进一步了解大语言模型安全,可以访问 Github awesomellmsafety 项目:https://github.com/ydyjya/AwesomeLLMSafety
2024-10-18
目前最好用的机关公文写作大模型或智能体
目前在机关公文写作方面表现较好的大模型或智能体有: 智谱清言:由智谱 AI 和清华大学推出,基础模型为 ChatGLM 大模型。在工具使用排名国内第一,在计算、逻辑推理、传统安全能力上排名国内前三。更擅长专业能力,但在代码能力上还有优化空间,知识百科方面稍显不足。可应用场景广泛,在 AI 智能体方面相关的应用,包括任务规划、工具使用及长文本记忆相关场景表现出色,在较复杂推理应用上效果不错,也适用于广告文案、文学写作等。 此外,在大模型中,智能体是大模型的一个重要发展方向。智能体可以理解为在大模型(如 LLM)基础上增加了工具、记忆、行动、规划等能力。目前行业里主要用到的如 langchain 框架,能通过代码或 prompt 的形式将 LLM 与 LLM 之间以及 LLM 与工具之间进行串接。
2024-10-18
全球最好的通用AI大模型是哪一个?
目前全球范围内,在通用 AI 大模型方面,OpenAI 研发的 ChatGPT 具有显著的影响力和优势。 ChatGPT 的出现标志着通用 AI 的起点和强 AI 的拐点,是 AI 领域科技创新和成果应用的重大突破。它引发了全球范围内的广泛关注,众多科技大厂、创业公司和机构纷纷参与到 AI 大模型的竞争中。 不过,国内的通义千问系列模型,如 Qwen 也表现出色。Qwen 是国内唯一出现在 OpenAI 视野里、可以参与国际竞争的国产大模型,在一些榜单中多次上榜,其开源模型的累计下载量突破了 1600 万,受到国内外开发者的欢迎。 需要注意的是,对于“全球最好的通用 AI 大模型”的评判标准并非绝对,还会受到不同应用场景和需求的影响。
2024-10-14
请从学术上论证“通用人工智能(AGI)时代已经到来”
以下是从学术上对“通用人工智能(AGI)时代已经到来”的论证: 从机器之心的进化角度来看: 1. 数据方面:ImageNet 数据集的大小已接近人从出生到大学毕业视觉信号的数据量,Google 公司创建的新模型相关数据集大小可与人一生所获取的数据量媲美。 2. 算力方面:人工神经网络与人脑的大小虽有差距,但在某些哺乳动物面前已具竞争力。每花一美元所能得到的计算能力呈指数级增长,大规模基础模型所用到的计算量每 3.5 个月就会翻番。且随着时间推移,该领域的资金、资源增加,人才涌入,会开发更好的软件和硬件。同时,物理学的限制同样约束人脑能力极限,所以 AGI 可以实现。 从多模型机制和参考框架的角度: 1. 多模型机制:新皮层由数以万计的皮质柱组成,通过投票使多模型设计发挥作用。智能机器的“大脑”也应由许多几乎相同的元素组成,并连接到各种可移动的传感器。 2. 参考框架:大脑中的知识储存在参考框架中,机器也需要学会世界的模型及相关信息的表示。 从通用化的原因来看: 1. 如同通用电脑战胜专用电脑,通用电脑成效比更好,促进技术进步,更多努力用于加强受欢迎的设计和支持其生态系统,导致成本降低和性能提升,这是算力指数式增长的基本驱动力。 2. 机器智能的一些重要未来应用,如 Elon Musk 希望的通用智能机器人探索火星,需要通用方案的灵活性,因为它们要处理无法预料的问题并设计新颖的解决方案,而专用的深度学习模型无法做到。 周鸿祎认为,从最近技术的进步来看,AGI 时代大概在两三年就会到来,通用人工智能比大模型对社会和世界的影响更大。不拥抱 AI 的个人可能会被会 AI 的人取代,不拥抱 AI 的公司会被淘汰。
2024-09-30
根据我的论文主题撰写一段引言:《通用人工智能时代的博弈论应用:数据科学与决策价值》
在当今科技飞速发展的时代,通用人工智能(AGI)的崛起正以前所未有的态势改变着我们的生活和社会。随着数据量的爆炸式增长以及决策环境的日益复杂,博弈论作为一门研究决策主体相互作用时的策略选择及均衡问题的学科,在通用人工智能时代展现出了独特的应用价值。 在数据科学领域,海量的数据为我们提供了丰富的信息,但如何从这些数据中提取有价值的知识并做出明智的决策,成为了一个关键挑战。博弈论的引入为解决这一问题提供了新的思路和方法。它帮助我们理解不同数据主体之间的竞争与合作关系,从而优化数据的采集、处理和分析过程。 在决策价值方面,通用人工智能系统需要在复杂多变的环境中做出最优决策。博弈论通过对不同策略的收益和风险进行分析,为决策提供了理论依据和数学模型,使得决策更加科学、合理和高效。 综上所述,研究通用人工智能时代的博弈论应用,对于推动数据科学的发展以及提升决策的价值具有重要的理论和实践意义。
2024-09-28
根据我的论文题目撰写一段引言,要求达到人文社科的极高水准:《通用人工智能时代的博弈论应用:数据科学与决策价值》
在当今科技飞速发展的时代,通用人工智能正以前所未有的态势重塑着我们的生活和社会格局。在这一宏大背景下,博弈论的应用成为了一个引人瞩目的焦点。数据科学的崛起为我们提供了海量且复杂的数据资源,而如何从这些数据中挖掘出有价值的信息,并将其转化为明智的决策,成为了摆在我们面前的关键问题。博弈论,作为一门研究决策主体相互作用时的策略选择和均衡结果的学科,为我们在通用人工智能时代的决策过程提供了深刻的理论基础和实用的分析工具。它不仅能够帮助我们理解个体和群体在复杂环境中的行为模式,还能够预测和优化决策结果,从而实现决策价值的最大化。因此,深入探讨通用人工智能时代中博弈论在数据科学与决策价值方面的应用,具有极其重要的理论意义和现实价值。
2024-09-28
对于大语言模型使用的未来趋势,是闭源云端还是开源本地部署,作为普通用户是否有必要了解本地部署知识,并且是否有必要自己搭建agent以及rag?
大语言模型的未来趋势在闭源云端和开源本地部署方面存在多种可能性。 对于开源本地部署,以下是一些相关信息: Ollama 是一个方便用户在本地运行和管理大型语言模型的框架,具有以下特点: 支持多种大型语言模型,如通义千问、Llama 2、Mistral 和 Gemma 等,适用于不同应用场景。 易于使用,适用于 macOS、Windows 和 Linux 系统,同时支持 CPU 和 GPU。 提供模型库,用户可从中下载不同模型,以满足不同需求和硬件条件,模型库可通过 https://ollama.com/library 查找。 支持用户自定义模型,例如修改温度参数调整创造性和连贯性,或设置特定系统消息。 提供 REST API 用于运行和管理模型,以及与其他应用程序的集成选项。 社区贡献丰富,包括多种集成插件和界面,如 Web 和桌面应用、Telegram 机器人、Obsidian 插件等。 安装可访问 https://ollama.com/download/ 。 可以通过一些教程学习如何本地部署大模型以及搭建个人知识库,例如了解如何使用 Ollama 一键部署本地大模型、通过搭建本地聊天工具了解 ChatGPT 信息流转、RAG 的概念及核心技术、通过 AnythingLLM 搭建完全本地化的数据库等。 同时,采用开源或国内企业提供的 13B 级模型本地部署在内部系统中,虽需投入算力,但有其价值。智能客服的大量优质大客户可能会选择自己搭建智能客服平台,并结合大模型企业提供的技术服务,基于大模型搭建 LangChain、RAG 框架,实现 RPA 自动流程。 对于普通用户是否有必要了解本地部署知识以及是否有必要自己搭建 agent 以及 rag,这取决于个人需求和兴趣。如果您希望更深入了解大模型的工作原理和运行机制,或者有特定的个性化需求,那么了解和尝试本地部署可能是有意义的。但如果只是一般的使用需求,可能无需深入了解和自行搭建。
2024-09-03
这些是通用大模型,我要的是金融股票领域的大模型
目前在金融股票领域的大模型有彭博发布的 BloombergGPT 以及蚂蚁金融大模型。 通用大模型能够有问必答,适用不同产业,但在特定领域表现可能不理想。而垂直大模型类似于单领域专家,虽受众有限但在特定领域更专业,比如金融领域。微调是对大模型针对特定领域的训练过程,能优化参数提高在该领域的专业性,且相比从头训练新模型更经济高效。
2024-08-28