直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

ai基本运行逻辑

回答

AI 的基本运行逻辑包括以下方面:

  • 大模型与语音技能 NLU 的差异:语音技能 NLU 是通过一系列规则、分词策略等训练而成,运作逻辑规律可观测,具有 if-else 式逻辑性;大模型凭借海量数据在向量空间中学习知识的关联性形成,运作逻辑难以观测,脱离了 if-else 的层面。
  • 工作流中的应用:
    • 代码相关:让大模型写代码,可将其输出的代码片段再输入回去让其检查准确性和结构规范性,若有两个 Agent 分别负责 Coding 和 Code Review,效果更佳。
    • 工具利用:如 Kimi Chat 会在互联网上检索相关内容,基于检索结果总结分析并给出结论,其他工具为大模型在获取、处理、呈现信息上做额外补充。
    • 任务规划:Agent 通过自行规划任务执行的工作流路径,面向简单或线性流程运行,例如先识别姿势,再利用相关模型合成新图像,最后进行语音合成输出等。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

Ranger:【AI 大模型】非技术背景,一文读懂大模型(长文)

在深入了解了AI的运作原理,并盘了众多当前市面上AI的落地产品之后,我们不妨重新回到最开始的问题。此次AI大模型究竟引发了怎样的变革?在思考这个问题之前,我想先分享下去年刚接触大模型时,困扰我的一个问题。即大模型与当下的智能语音技能的NLU存在什么差异?此前,我也曾涉足过一些语音产品的设计逻辑,知道语音技能链路其实就是把声音转为ASR,再对文本进行NLU理解,然后映射到对应的语音技能表中,最后让程序依据相应的语音技能指令完成逻辑。乍看起来,大模型能实现的,通过语音技能似乎也能达成,那我们引入大模型的意义在哪里呢?抱着这样的疑问,我尝试去理解了大模型的原理。当我在初步理解大模型的原理之后,我发现二者还是存在本质性的差别的。差别在于,后者的语音技能NLU仅是通过一系列规则、分词策略等训练而成的产物。而且NLU的运作逻辑规律都是可观测的,具有if-else式的逻辑性。而大模型,则是凭借海量的数据,在向量空间中学习知识的关联性从而形成的,其运作逻辑难以观测,已然脱离了if-else的层面。

Inhai: Agentic Workflow:AI 重塑了我的工作流

反思在根本上其实是一个博弈的过程:如果你让大模型写一段代码,它会立刻给你反馈。这时你可以将它输出的代码片段再输入回去,让大模型仔细检查代码的准确性和结构规范性,并给出评论。然后,你可以将这些反馈结果再次输入给大模型,它可能会输出一个比第一版更好的代码,如果有两个Agent:一个负责Coding,另一个负责Code Review,效果会更佳。Tool Use如果大家使用Kimi Chat来查询某个问题,你会发现它会在互联网上检索相关内容,并基于检索结果进行总结分析,最后给出结论。这其实是大模型利用「网页搜索」工具的一个典型例子,同时你也会看到PPT中介绍了非常多的不同领域类型的工具,它其实是为大模型在获取、处理、呈现信息上做额外的补充。PlanningAgent通过自行规划任务执行的工作流路径,面向于简单的或者一些线性流程的运行。比如下图中:Agent会先识别男孩的姿势,并可能找到一个姿势提取模型来识别姿势,在接下来要找到一个姿势图像模型来合成一个新的女孩图像,然后再使用图像理解文本的模型,并在最后使用语音合成输出,完成这个流程任务。Multiagent Collaboration

其他人在问
ai 软件测试
以下是关于 AI 软件测试的相关内容: 实践中的应用示例: 1. Web 应用测试:使用 Testim 分析用户行为和日志数据,自动生成高覆盖率的测试用例,检测不同浏览器和设备上的兼容性问题。 2. 移动应用测试:利用 Test.ai 从需求文档中提取测试用例,确保覆盖关键功能和用户路径,提高测试效率和质量。 3. 复杂系统测试:采用 GraphWalker 基于系统状态模型生成测试用例,确保覆盖所有可能的状态和操作场景,检测系统的边界情况和异常处理能力。 工具和平台: 1. Testim:AI 驱动的自动化测试平台,生成和管理测试用例。 2. Test.ai:基于 NLP 技术的测试用例生成工具,适用于移动应用和 Web 应用。 3. DeepTest:利用深度学习生成自动驾驶系统测试用例。 4. GraphWalker:基于状态模型生成测试用例,适用于复杂系统的行为测试。 5. Pex:微软开发的智能测试生成工具,自动生成高覆盖率的单元测试。 另外,在 Coze 官方教程中,搭建好第一个 AI Bot 后,配置好 Bot 就可以在预览与调试区域中测试 Bot 是否符合预期,可单击清除图标清除对话记录。
2024-09-19
AI在法律领域的最新应用
以下是 AI 在法律领域的一些最新应用: 1. 专利审查方面:AI 技术通过自动化和智能化手段,帮助专利审查员更高效地处理大量专利申请、检索相关文献、评估专利性和创新性等任务。 2. 法律文书:这是目前 AI 在 2B 行业基本成熟的应用,其格式固定,核心技术是法条/判例的引用,是“搜索”能力和大模型能力的搭配。 3. 虽然目前其他 2B 应用如“AI 客服”等雷声大、雨点小,未达到大量取代人工的预期,但生成式人工智能技术已逐步涵盖艺术创作产业、医疗保健、虚拟现实、数据合成与数据增强等多个领域,为各行业带来创新、效率与价值。
2024-09-19
如何利用AI帮助自己成为一名知识产权律师?我已经获得了法律职业资格证,但还没有实习成为一名律师。
成为一名知识产权律师可以借助 AI 从以下几个方面入手: 1. 知识学习与案例研究:利用 AI 驱动的法律数据库和学习平台,深入了解知识产权领域的法律法规、典型案例和最新动态。 2. 法律文书撰写辅助:借助 AI 工具提高法律文书如起诉书、答辩状等的撰写效率和质量,确保语言准确、逻辑清晰。 3. 模拟案例分析:通过 AI 模拟各种知识产权相关的案例场景,进行分析和应对策略的制定,提升解决实际问题的能力。 4. 客户需求分析:利用 AI 对潜在客户的需求和问题进行分析,以便更好地提供针对性的法律服务。 5. 法律研究与创新:借助 AI 探索知识产权领域的前沿研究和创新趋势,为自己的业务发展提供新思路。 需要注意的是,AI 只是辅助工具,不能替代您自身的专业判断和实践经验。在使用 AI 工具时,要对其结果进行审慎评估和验证。
2024-09-19
网页翻译AI
以下为一些网页翻译 AI 产品及相关信息: 1. DeepL(网站): ,点击页面「翻译文件」按钮,上传 PDF、Word 或 PowerPoint 文件即可。 2. 沉浸式翻译(浏览器插件): ,安装插件后,点击插件底部「更多」按钮,选择「制作双语 BPUB 电子书」、「翻译本地 PDF 文件」、「翻译 THML / TXT 文件」、「翻译本地字幕文件」。 3. Calibre(电子书管理应用): ,下载并安装 calibre,并安装翻译插件「Ebook Translator」。 4. 谷歌翻译(网页): ,使用工具把 PDF 转成 Word,再点击谷歌翻译「Document」按钮,上传 Word 文档。 5. 百度翻译(网页): ,点击导航栏「文件翻译」,上传 PDF、Word、Excel、PPT、TXT 等格式的文件,支持选择领域和导出格式(不过进阶功能基本都需要付费了)。 此外,XiaoHu.AI 也具有高质量多语言翻译的特点,能提供沉浸式阅读和写作体验,支持多种语言的高质量翻译。它能够智能识别网页上的内容,如 Twitter、Discord 等,提供鼠标悬停翻译。支持 Chrome、Edge 等主流浏览器,下载插件即可使用。具有简单易用的用户界面,操作方便,还内置了 GPT 的聊天功能,可以随时提问。相关链接:
2024-09-19
用AI搭建网站
以下为您介绍一些用 AI 搭建网站的工具及选择合适工具的方法: AI 搭建网站的工具: 1. Zyro 网址: 特点:使用 AI 生成网站内容,包括文本、图像和布局建议;提供 AI 驱动的品牌和标志生成器,帮助创建独特的品牌形象;包含 SEO 和营销工具,帮助提升网站可见性和流量。 2. Site123 网址: 特点:简单易用的 AI 网站构建工具,适合初学者;提供多种设计模板和布局,用户可以快速创建专业网站;包括内置的 SEO 和分析工具,帮助优化网站表现。 选择合适的 AI 网站制作工具的方法: 1. 明确目标和需求:确定您的网站目标,如个人博客、商业网站、在线商店等,并明确功能需求。 2. 考虑预算:有些工具提供免费计划或试用版,但高级功能可能需要付费订阅。 3. 易用性:选择符合您技术水平的工具,确保能够轻松使用和管理网站。 4. 自定义选项:检查工具是否提供足够的自定义选项,以满足设计和功能需求。 5. 支持和资源:查看是否有足够的客户支持和学习资源,如教程、社区论坛等,帮助解决问题。 通过这些 AI 驱动的工具,您可以更轻松地创建和管理一个功能丰富、外观专业的网站。请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-09-19
国内ai制作ppt的最好软件
在国内,AI 辅助制作 PPT 的软件中,爱设计 PPT 表现出色,是值得推荐的选择。 爱设计 PPT 不仅代表了当前国内 AI 辅助 PPT 制作的最高水平,还在不断进步,为用户提供越来越好的体验。它的成功有以下原因: 1. 拥有实力强大的团队,技术过硬且对市场需求有敏锐洞察力,能持续推动产品创新和进步。 2. 成功把握住 AI 与 PPT 结合的市场机遇,具备前瞻性的市场洞察力和快速的执行能力。 3. 已在国内 AI 生成 PPT 产品中确立了市场领先地位,反映了用户的高度认可。 对于经常需要制作 PPT 的人,无论是商务人士、教育工作者还是学生,爱设计 PPT 都能大大提高制作效率,保证高质量输出。随着 AI 技术的不断进步,爱设计 PPT 有望在未来带来更多惊喜的功能和性能提升,继续引领 AI 辅助 PPT 制作领域的发展。
2024-09-18
AI的算法逻辑是什么
AI 的算法逻辑是一个复杂而广泛的概念。 最初,查尔斯·巴贝奇发明了计算机,其按照一套明确定义的程序即算法来对数字进行运算。现代计算机虽比 19 世纪的原始计算机模型先进得多,但仍遵循相同的受控计算理念。若知道实现某些目标所需的每一个步骤及其顺序,就能编写出程序让计算机按想法做事。 但有些任务无法明确编程,比如根据照片判断一个人的年龄。我们能做是因为见过很多不同年龄的人,但无法明确大脑具体通过哪些步骤完成,所以也无法编写明确程序让计算机完成。这类任务正是人工智能感兴趣的。
2024-09-08
帮我写一篇有关aigc的行业分析,标题为《AIGC行业洞察与概览》,其中框架内容包含以下部分,整体3万字 - 概念导入(AI、AIGC) - AI与人的区别 - AI衍生发展历程(诞生、发展、现状-中外各平台产品及语言模型介绍) - AI在社会各领域的应用实践 - AI技术的底层逻辑概览 - AI的弊端以及风险
以下是为您生成的《AIGC 行业洞察与概览》的部分内容: 一、概念导入 (一)AI 人工智能(Artificial Intelligence,简称 AI)是一种目标,旨在让机器展现智慧。 (二)AIGC GenAI(即生成式 AI)是一种能够从已有数据中学习并生成新的数据或内容的 AI 应用,利用 GenAI 创建的内容即 AIGC(全称 AIGenerated Content)。AIGC 是利用人工智能技术生成内容的新型生产方式,包括文本、图像、音频和视频等内容。 二、AI 与人的区别 三、AI 衍生发展历程 (一)诞生 (二)发展 (三)现状 1. 中外各平台产品及语言模型介绍 (1)语言文本生成利用马尔科夫链、RNN、LSTMs 和 Transformer 等模型生成文本,如 GPT4 和 GeminiUltra。 (2)图像生成依赖于 GANs、VAEs 和 Stable Diffusion 等技术,代表项目有 Stable Diffusion 和 StyleGAN 2。 (3)音视频生成利用扩散模型、GANs 和 Video Diffusion 等,代表项目有 Sora 和 WaveNet。 四、AI 在社会各领域的应用实践 AIGC 技术可以用于多种应用,如自动撰写新闻文章、生成艺术画作、创作音乐、制作视频游戏内容等。 五、AI 技术的底层逻辑概览 (一)机器学习:一种让机器自动从资料中找到公式的手段。 (二)深度学习:一种更厉害的手段,类神经网络,具有非常大量参数的函数。 (三)大语言模型:是一类具有大量参数的“深度学习”模型,Large Language Models,简称 LLMs。 六、AI 的弊端以及风险 作为一种强大的技术,生成式 AI 能够赋能诸多领域,但也存在多重潜在的合规风险。目前,我国对 AIGC 的监管框架由《网络安全法》《数据安全法》及《个人信息保护法》构成,并与《互联网信息服务算法推荐管理规定》、《互联网信息服务深度合成管理规定》、《生成式人工智能服务管理暂行办法》、《科技伦理审查办法(试行)》等形成了共同监管的形势。 由于篇幅限制,目前仅能为您提供约 2000 字的内容,距离 3 万字还有较大差距。后续还需要进一步丰富和完善各个部分的细节及案例分析等。
2024-09-03
我想要一个机器人的人设和回复逻辑,这个机器人要像人类更接近真人的对话方式,能够更好地理解和回应各种日常对话场景,包括玩笑、调侃和口水话。这样可以大大提高对话的自然度和真实感。
以下是关于机器人人设和回复逻辑的相关内容: 首先,Bot 的提示(人设与回复逻辑)是一种自然语言指令,告诉大语言模型(LLM)执行任务。编写提示词是搭建 Bot 的第一步,为 Bot 设定身份和目标,提示编写得越清晰明确,Bot 的回复越符合预期。 例如,“Coze 直聘”中的职业助手 Bot 人设是一个专业的职业助手,能够根据用户输入信息为用户精准提供匹配的职位推荐。 “安仔”这个社群运营机器人,基于其作用,目前版本的人设是更专注于 AI 相关的知识回答和服务,以满足初学者的需求,尽量不回答其他无关问题。为提升用户体验,还可以加入一些功能,如长期记忆(总结聊天对话内容用于更好响应用户消息)和设计更加美观的 Bot 开场白。 总之,要让机器人像人类更接近真人的对话方式,能够更好地理解和回应各种日常对话场景,包括玩笑、调侃和口水话,以提高对话的自然度和真实感,需要清晰明确地设定人设和回复逻辑,并不断优化完善。
2024-08-25
AI逻辑
以下是关于 AI 逻辑和如何判断一张图片是否由 AI 生成的相关内容: AI 逻辑 在当下的 AI 产品中,大都支持自定义 AI 的回复方式。例如在 ChatGPT/GPTs 里是“Instructions”,在 Coze 里是“人设与回复逻辑”。设定“人设与回复逻辑”时,其写法就是 Prompt,您可以相信 AI 的智商,无论怎么写它都能理解,但仅供参考,您可以自由发挥。 目标是尝试输入某个 AI 产品的网址,如 https://www.anthropic.com/news/introducingclaude ,AI 会自动处理并返回这个产品的名称、简介等信息。但由于 AI 的特性,它并不总能返回合适的结果。处理方法有很多,比如重试、优化 Prompt 或者使用 Workflow(这个后面讲)。 如何判断一张图片是否 AI 生成的 从本质上分析,人类的绘画创作是一个线性发展的过程,通常先学习线稿表达、再理解色彩搭配、随后加入光影表现等高级技巧,一步一个脚印地创作。初级人类画手可能在形体把握上不准确,但会认真刻画每一笔,笔触生硬但完整。天才除外,普通人很少能在掌握线条之前就大胆使用光影和色彩。 而 AI 是以积累数据、扩散噪声、再降噪收束的路径来生图的,这个过程不是线性的创作过程,而是计算猜测并筛选的螺旋迸进过程。这导致 AI 作画经常在同一张图中呈现出不同绘画级别的细节,比如线条还没整好,色彩却很完美;前后景透视有问题,但光影却很好。这种情况不太符合人类的创作逻辑。 有意思的是,有人提问说人类初学阶段也有画得不对的情况,会不会被误鉴为 AI 画的。
2024-08-23
AI的基本运行逻辑是什么?
AI 的基本运行逻辑主要体现在以下两个方面: 1. 在自然语言处理(NLU)方面,传统的语音技能 NLU 是通过一系列规则、分词策略等训练而成的产物,其运作逻辑规律都是可观测的,具有 ifelse 式的逻辑性。而大模型则是凭借海量的数据,在向量空间中学习知识的关联性从而形成的,其运作逻辑难以观测,已然脱离了 ifelse 的层面。 2. 在视频制作方面,例如在制作片头时,需要先确定镜头想法,如视线聚焦到中心的圆形细胞并保持固定以方便后续画面转场,可能会对单张 AI 图生视频进行分图层处理,并叠加多个画面来丰富画面。 此外,在 AI 监管方面,需要确定一系列支持监管一致性和监管者的功能,如建立中央监测和评估框架,收集相关数据,支持监管者进行内部监测和评估等,以实现创新的监管方式。监测和评估需要集中进行,以确定整体框架是否符合目标,是否以支持创新、清晰、适度、适应性强、值得信赖和协作的方式运行,并建立反馈回路以衡量框架的有效性。
2024-08-21
有哪些按逻辑整理文本内容的工具
以下是一些按逻辑整理文本内容的工具: 1. PlantUML:文本到 UML 转换工具,可通过描述生成序列图等,辅助创建逻辑视图。 2. Gliffy:基于云的绘图工具,能创建多种架构图,包括逻辑视图和部署视图。 3. Archi:免费开源,用于创建 ArchiMate 和 TOGAF 模型,支持逻辑视图创建。 4. Rational Rose:IBM 的 UML 工具,支持多种视图,包括逻辑视图和部署视图。 需要注意的是,这些工具并非都是基于 AI 的。在选择工具时,应考虑具体需求,如是否支持特定建模语言、与开发工具集成、偏好在线或桌面应用等。 此外,大型语言模型在总结文本方面也有应用,如 Chat GPT 可用于总结文章。 常见的文章润色 AI 工具包括: 1. Wordvice AI:集校对、改写转述和翻译等功能于一体。 2. ChatGPT:由 OpenAI 开发,可多方面辅助写作。 3. Quillbot:人工智能文本摘要和改写工具。 4. HyperWrite:基于 AI 的写作助手和大纲生成器。 5. Wordtune:AI 驱动的文本改写和润色工具。 6. Smodin:提供 AI 驱动的论文撰写功能。 这些工具涵盖了文章润色的多个环节,可根据自身需求选择使用。但请注意,内容由 AI 大模型生成,请仔细甄别。
2024-08-17
stable diffusion可以用macbook 13来运行吗?配置够吗
Stable Diffusion(简称“SD”)的运行对电脑配置有一定要求。对于 Windows 系统: 显卡:必须是 NVIDIA(俗称 N 卡)。 专用 GPU 内存:4GB 勉强可以跑动 SD,出图时间较长;6GB 出一张图时间为 20 50 秒,大部分功能可用;8GB 5 20 秒出一张图,所有功能基本开放。 电脑运行内存:8GB 以上。 电脑系统:Win10 或者 Win11。 对于 Mac 系统,可以查看以下视频进行一键安装:https://www.bilibili.com/video/BV1Kh4y1W7Vg/?spm_id_from=333.788&vd_source=6f836e2ab17b1bdb4fc5ea98f38df761 但具体 MacBook 13 是否能运行及配置是否足够,还需根据上述标准进行对照检查。
2024-09-16
请推荐一款适合在本地电脑上下载运行的供审计人员使用大模型,运用AI提升审计效率,请我们一步一步认真思考
在考虑适合审计人员使用的本地AI大模型时,我们需要认真思考几个关键点:模型的功能性、易用性、与现有审计流程的集成能力以及对审计效率的实际提升。以下是几款可能适合审计人员使用的AI工具的推荐: 1. AI Audit for Cash:普华永道开发的AI Audit for Cash工具,专注于现金审计的自动化,能够高效执行包括现金余额、银行存款余额调节表等关键测试,显著提升审计质量和效率。 2. Deloitte Auvenir:德勤推出的Auvenir平台,提供生态性解决方案,帮助中小型会计师事务所提升审计数字化程度,打破资源和能力限制,革新审计服务模式。 3. Deloitte Cobalt:德勤的Cobalt平台,使用人工智能技术进行全面的智能风险感知,适用于企业持续经营判断及业务发展等更广泛的领域。 4. Deloitte iCredit:德勤的智能信贷风险监测平台,深度融合了金融行业特别是大型商业银行的信贷资产审计经验,结合人工智能技术,实现从抽样到全量信贷扫描的转变,聚焦高风险客群,提早预警风险信息。 5. IT审计工具:利用IT审计技术,如VBA、SQL、Python等编程语言,开发自动化工具,可以大幅提升审计效率,特别是在处理大量重复操作或复杂计算时。 选择适合的AI工具时,审计人员应考虑以下因素: 功能性:工具是否能满足审计过程中的具体需求。 集成性:工具是否能与现有的审计软件和流程无缝集成。 用户友好性:工具是否易于学习和使用,以减少培训时间和成本。 数据安全和隐私:确保工具符合数据保护法规和标准。 成本效益:考虑工具的总体成本,包括购买、维护和升级费用。 审计人员在选择AI工具时,应进行充分的市场调研和产品测试,以确保所选工具能够真正提升审计工作的效率和质量。
2024-07-04
0基础中老年学习者必须知道的AI基本概念和知识 是哪几个
对于 0 基础的中老年学习者,以下是必须知道的 AI 基本概念和知识: 一、Python 基础 1. 基本语法:包括变量命名、缩进等规则。 2. 数据类型:如字符串、整数、浮点数、列表、元组、字典等。 3. 控制流:条件语句(if)、循环语句(for 和 while)控制程序执行流程。 4. 函数:定义和调用函数,理解参数和返回值,以及作用域和命名空间。 5. 模块和包:导入模块,使用包来扩展程序功能。 6. 面向对象编程(OOP):类和对象的定义与实例化,属性和方法的定义与调用。 二、AI 背景知识 1. 基础理论:了解人工智能、机器学习、深度学习的定义及相互关系。 2. 历史发展:回顾 AI 的发展历程和重要里程碑。 三、数学基础 1. 统计学基础:熟悉均值、中位数、方差等统计概念。 2. 线性代数:了解向量、矩阵等基本概念。 3. 概率论:掌握基础的概率论知识,如条件概率、贝叶斯定理。 四、算法和模型 1. 监督学习:了解常用算法,如线性回归、决策树、支持向量机(SVM)。 2. 无监督学习:熟悉聚类、降维等算法。 3. 强化学习:了解其基本概念。 五、评估和调优 1. 性能评估:知道如何评估模型性能,如交叉验证、精确度、召回率等。 2. 模型调优:学习使用网格搜索等技术优化模型参数。 六、文件操作 1. 文件读写:学习打开文件、读取文件内容和写入文件。 2. 文件与路径操作:理解如何处理文件路径,列举目录下的文件。 七、异常处理 1. 理解异常:了解什么是异常以及在 Python 中的工作方式。 2. 异常处理:学会使用 try 和 except 语句处理程序错误。
2024-09-13
如何了解AI的基本概念,是否有词条清单
以下是帮助您了解 AI 基本概念的一些途径和内容: 阅读相关资料:建议阅读「」部分,熟悉 AI 的术语和基础概念,了解人工智能、机器学习、深度学习的定义及其之间的关系,以及 AI 的主要分支和它们之间的联系。 浏览入门文章:这些文章通常会介绍 AI 的历史、当前的应用和未来的发展趋势。 学习数学基础:包括统计学基础(熟悉均值、中位数、方差等统计概念)、线性代数(了解向量、矩阵等基本概念)、概率论(基础的概率论知识,如条件概率、贝叶斯定理)。 了解算法和模型:监督学习(如线性回归、决策树、支持向量机)、无监督学习(如聚类、降维)、强化学习(简介强化学习的基本概念)。 掌握评估和调优知识:如性能评估(包括交叉验证、精确度、召回率等)、模型调优(学习如何使用网格搜索等技术优化模型参数)。 您还可以通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。同时,AI 领域广泛,您可以根据自己的兴趣选择特定的模块(比如图像、音乐、视频等)进行深入学习。
2024-09-12
大模型的基本工作原理
大模型的基本工作原理如下: 1. 对于 LLm(大语言模型),在回复时是一个字一个字地推理生成内容,就像输入法的输入联想逻辑。会根据输入的字推测下一个字,最初仅根据单个字推测存在不确定性,后来通过加入上下文来帮助模型理解下一个字。但大模型的学习数据规模海量,每次计算若带入全量数据,算力无法承受。 2. 以“我今天吃了狮子头和蔬菜”这句话为例,在 Transformer 中,由 attention 层对其加入更多信息补充,如“狮子头是一道菜”“今天是星期六”等,有些不重要的信息会被忽视。层与层之间,哪些信息补充、保留、传递,由模型自主学习。最终模型把海量数据以关系网形式“消化”并保留重要相关性。 3. 这些层就像人阅读文章时的连贯性注意力过程,像我们阅读理解时对输入内容消化吸收记忆,记住的不是点状知识,而是网状经验。 4. 词向量方面,大模型通过海量文档学习,把三维世界中的“词元”转化为 latent space 中的“意象”,如“杨柳”在 latent space 中的表达可能是。这种转换解决了将学习资料转化为 latent space 中的词向量的问题,提高了运算效率,并能表示词汇间的语义关系。 5. 自注意力机制解决了第二个问题,在机器训练中加入若干 attention 层,每个层都会对输入信息进行学习、理解和记忆。 总结起来,大模型以词向量和 Transformer 的模型学习海量知识,把知识作为向量空间中的关系网存储,接受输入时通过向量空间中的一系列匹配进行输出。
2024-09-06
ai的历史,基本术语,重要人物,方法和原理灯等
以下是关于 AI 的相关知识: AI 的历史: 最初,查尔斯·巴贝奇发明了计算机,用于按照一套明确定义的程序来对数字进行运算。现代计算机虽更先进,但仍遵循相同的受控计算理念。 基本术语: 您可以通过特定链接(https://ywh1bkansf.feishu.cn/wiki/PFXnwBTsEiGwGGk2QQFcdTWrnlb?table=tbltvr7KExCt7Jpw&view=vewjxk9tDu )了解。 重要人物: 相关信息可参考(https://ywh1bkansf.feishu.cn/wiki/PFXnwBTsEiGwGGk2QQFcdTWrnlb?table=tblLtN12KuvP5reO&view=vewuvGBXhd )。 方法和原理: 详情见(https://ywh1bkansf.feishu.cn/wiki/PFXnwBTsEiGwGGk2QQFcdTWrnlb?table=tblolGx2mprs1EQz&view=vewx5ROYtl )。 对于新手学习 AI,建议: 1. 了解 AI 基本概念:阅读「」部分,熟悉术语和基础概念,了解其主要分支及联系,浏览入门文章。 2. 开始 AI 学习之旅:在「」中找到为初学者设计的课程,可通过在线教育平台按自己节奏学习,如 Coursera、edX、Udacity 等,特别推荐李宏毅老师的课程。 3. 选择感兴趣的模块深入学习:AI 领域广泛,比如图像、音乐、视频等,可根据兴趣选择特定模块深入学习。
2024-08-21