Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

机器决策理论

Answer

机器决策理论: 情感计算与机器决策密切相关。情感对人类具有重要意义,包括生存功能(如遇危险时的生理反应有助于保障进化)、沟通功能(不同情感表达使内涵不同)、决策功能(大脑通过“系统一”主要依赖情感和经验迅速做出判断)、动机功能(激发和维持个体行为)、维系功能(是社会化过程中的纽带)。 情感计算的最终目标是赋予计算机类似于人的情感能力,主要有“识别”“表达”和“决策”三个方向。“识别”可基于文本、语音、视觉、生理等数据进行情感分析,或融合不同模态信息;“表达”让计算机以合适载体表示情感;“决策”利用情感机制进行更好决策。 在人工智能实现方法中,解决让计算机表现得像人类一样的问题有自上而下(模拟人类推理)和自下而上(模拟人脑结构)两种可能的方法,还有新兴的多智能体系统、进化方法或遗传算法等其他可能实现智能的方法。

Content generated by AI large model, please carefully verify (powered by aily)

References

情感计算

[title]情感计算如果机器不能很好地模拟情感,那么人们可能永远也不会觉得机器具有智能。——人工智能之父马文·明斯基情感是保障人类形成社会习性、支撑高级思维的心理要素。如果人类不具有情感,那么维持生存的将只有原始冲动和生存欲望。情感对人类有很重要的意义,主要表现在:生存功能。人类会为了适应环境而做出有利于生存或发展的生理反应,如遇危险时的紧张害怕,受到威胁时的愤怒亢奋,获得食物时的喜悦兴奋。这种生理反应,有助于保障人类的进化。沟通功能。同样的文字语言使用不同的情感来表达,其内涵是完全不同的。相比于语音或文字,增加表情、肢体动作等多种情感表达方式,能够更加充分的表达人类的意图。决策功能。大脑通过快(“系统一”)和慢(“系统二”)两种方式进行决策。而“系统一”主要依赖于情感、经验等迅速做出判断。动机功能。情感能够激发和维持个体的行为。维系功能。情感是人类社会化过程中阶层、族群、家庭等维系的纽带。情感计算就是为了使计算机能够识别、感知、推断和理解人类的情感。最终目标是赋予计算机类似于人的情感能力。

情感计算

情感计算主要有「识别」、「表达」和「决策」三个方向。「识别」让计算机准确识别人类的情感。可以基于从文本、语音、视觉、生理等数据进行情感分析。或者将不同模态之间的信息进行融合分析,使情感计算更准确,具有更高的鲁棒性。文本情感计算是NLP的一大研究热点,主要研究情感状态与文本信息的对应关系。主要由文本情感特征标注、文本情感特征提取和文本情感分类组成。语音情感计算主要研究两个部分:一个是语音所包含的语言情感内容,另一个是声音本省所具有的情感特征。视觉情感计算主要研究两个部分:一个是面部表情的情感识别,另一个是肢体动作的情感识别。生理信号情感计算,最常用的生理特征是脑电、眼动、肌电、皮肤电、心电、呼吸信号等。「表达」让计算机能够把情感以合适的信息载体表示出来;「决策」利用情感机制来进行更好地决策。[heading3]参考资料[content][《2022情感计算白皮书》,之江实验室](https://www.sohu.com/a/617242720_483389)[情感计算:让机器更加智能](https://cloud.tencent.com/developer/article/1519957)

人工智能简介和历史

[title]人工智能简介和历史[heading1]实现人工智能的不同方法如果我们希望让一台计算机表现得像人类一样,需要在计算机内模拟人类的思维方式。因此,我们需要理解是什么造就了人类的“智能”。我们必须理解自己的决策过程是如何进行的,才能够为机器编写智能程序。如果你稍微做一下自我觉察,就会发现有些过程是下意识发生的,例如我们可以不假思索地区分出猫和狗,而有些过程则需要推理。解决这个问题有两种可能的方法:|自上而下的方法(符号推理)|自下而上的方法(神经网络)|<br>|-|-|<br>|自上而下的方法模拟人类通过推理来解决问题的方式。它包括对人类知识的提炼,并用计算机可读的形式来表示,此外还需要开发一种在计算机内部模拟推理的方法。|自下而上的方法模拟人脑的结构,由大量称为神经元的简单单元组成。每个神经元的行为取决于输入数据的加权平均值,我们可以提供训练数据来训练神经元网络,从而解决有用的问题。|还有一些其他可能实现智能的方法:新兴的、依靠协同的多智能体系统(multi-agent),它基于这样一个事实,即复杂的智能行为可以来自大量简单智能系统的相互作用。根据进化控制论,在元系统跃迁的过程中,智能可以从更简单的反应行为中产生。进化方法或遗传算法(genetic algorithm),是一种基于进化原理的优化过程。[1]译者注:元系统跃迁,[Metasystem Transition](https://en.wikipedia.org/wiki/Metasystem_transition),是指通过演化涌现出更高层次的组织或者控制。我们将在课程的后续部分考虑这些方法,但现在我们将重点关注自上而下、自下而上两个主要方向。

Others are asking
搭建可以自主决策规划和行动的agent
搭建可以自主决策规划和行动的 agent 通常涉及以下几个方面: 一、Agent 的概念 Agent 是一种能够在环境中自主感知、思考并采取行动的实体。可以将其想象成一个具有特定目标和行为能力的智能角色,能根据环境变化做出相应决策和反应。 二、LLM Agent LLM Agent 是结合大型语言模型(LLM)和自主智能体(Agent)特性的系统,能够利用大型语言模型的自然语言处理能力,理解用户输入,并在此基础上进行智能决策和行动。 三、LLM Agent 的组成部分 1. 规划(Planning) 定义:规划是 Agent 的思维模型,负责将复杂任务分解成可执行的子任务,并评估这些子任务的执行策略。 实现方式:通过使用大型语言模型的提示工程(如 ReAct、CoT 推理模式)来实现精准任务拆解和分步解决。 2. 记忆(Memory) 定义:记忆即信息存储与回忆,包括短期记忆和长期记忆。 实现方式:短期记忆用于存储对话上下文,支持多轮对话;长期记忆存储用户特征和业务数据,通常通过向量数据库等技术实现快速存取。 3. 工具(Tools) 定义:工具是 Agent 感知环境、执行决策的辅助手段,如 API 调用、插件扩展等。 实现方式:通过接入外部工具(如 API、插件)扩展 Agent 的能力,例如使用插件解析文档、生成图像等。 4. 行动(Action) 定义:行动是 Agent 将规划和记忆转换为具体输出的过程,包括与外部环境的互动或工具调用。 实现方式:根据规划和记忆执行具体行动,如智能客服回复、查询天气预报、AI 机器人抓起物体等。 四、Anthropic 的建议 随着 LLM 在几个关键能力上的成熟,如理解复杂输入、进行推理和规划、可靠使用工具以及从错误中恢复,智能体开始在生产环境中涌现。智能体通过与人类用户的命令或交互式对话开始工作。一旦任务明确,智能体就会独立进行规划和操作,必要时会向人类寻求更多信息或判断。 在执行过程中,智能体需要在每个步骤从环境中获取“基准事实”(如工具调用结果或代码执行情况)以评估其进展。智能体可以在检查点或遇到障碍时暂停等待人类反馈。任务通常在完成时终止,但也常常包含停止条件(如最大迭代次数)以保持控制。 智能体适用于难以或无法预测所需步骤数量的开放性问题,且无法硬编码固定路径的场景。但智能体的自主性意味着更高的成本和潜在的错误累积。建议在沙盒环境中进行广泛测试,并设置适当的防护措施。 五、实例探究 Generative Agents 是一个有趣的实验,其中 25 个虚拟角色,每个角色都由 LLM 支持的 Agents 控制,在沙盒环境中生活和交互,其灵感来自《模拟人生》。生成 Agents 的设计将 LLM 与记忆、规划和反射机制相结合,使 Agents 能够根据过去的经验进行行为,并与其他 Agents 进行交互。 记忆流是一个长期记忆模块(外部数据库),用自然语言记录智能体经验的完整列表。检索模型会根据相关性、新近度和重要性,呈现上下文以告知 Agents 的行为。反射机制随着时间的推移将记忆合成更高层次的推论,并指导智能体未来的行为。规划与反应将反思和环境信息转化为行动,规划本质上是为了优化当前与时间的可信度。
2025-03-21
机器学习的子领域包括: 监督学习,常用算法如线性回归、决策树、支持向量机(SVM)。 无监督学习,如聚类、降维等算法。 强化学习,那深度学习是哪一种啊
深度学习是机器学习的一个子领域。 在机器学习中,深度学习是一种利用深度神经网络来学习数据特征和模式的方法。 深度学习的特点包括: 1. 具有复杂的网络结构,如前馈网络、卷积神经网络(CNN)、循环神经网络(RNN)等。 2. 能够自动从大量数据中提取高级特征。 深度学习在图像识别、语音识别、自然语言处理等领域取得了显著的成果。
2025-01-21
流程图有哪些工具可以制作,流程图主要用于展示一个过程或系统的步骤和决策点。图中通过不同形状的框(如椭圆形、矩形)和箭头来表示各种步骤、条件判断和流程走向, 有哪些AI工具可以直接制作吗
以下是一些可以制作流程图的 AI 工具: 1. Lucidchart: 注册并登录:。 选择模板:在模板库中搜索“项目管理流程图”。 编辑图表:根据项目需求添加和编辑图形和流程步骤。 优化布局:利用 AI 自动布局功能,优化图表的外观。 保存和分享:保存图表并与团队成员分享,或导出为 PDF、PNG 等格式。 2. ChatGPT: 确定制作目标。 通过自然语法描述逻辑,生成 Mermaid 图形语法。 在线校验测试是否成功。
2024-12-19
上面的流程图有哪些工具可以制作,流程图主要用于展示一个过程或系统的步骤和决策点。图中通过不同形状的框(如椭圆形、矩形)和箭头来表示各种步骤、条件判断和流程走向, 有哪些AI工具可以直接制作吗
以下是一些可以制作您所描述的流程图的 AI 工具: Lucidchart: 1. 注册并登录: 2. 选择模板:在模板库中搜索“项目管理流程图”。 3. 编辑图表:根据您的项目需求添加和编辑图形和流程步骤。 4. 优化布局:利用 AI 自动布局功能,优化图表的外观。 5. 保存和分享:保存图表并与团队成员分享,或导出为 PDF、PNG 等格式。 此外,文中还提到了关于智能体和人工智能在解决科学问题方面的一些相关内容,但未直接涉及流程图制作工具的更多信息。
2024-12-19
智能体感知决策执行
智能体是在现代计算机科学和人工智能领域中一个基础且重要的概念。 智能体的应用领域广泛,包括: 1. 自动驾驶:汽车中的智能体感知周围环境,做出驾驶决策。 2. 家居自动化:智能家居设备根据环境和用户行为自动调节。 3. 游戏 AI:游戏中的对手角色和智能行为系统。 4. 金融交易:金融市场中的智能交易算法根据市场数据做决策。 5. 客服聊天机器人:通过自然语言处理与用户互动,提供客户支持。 6. 机器人:各类机器人中集成的智能控制系统。 设计和实现一个智能体通常涉及以下步骤: 1. 定义目标:明确智能体要实现的目标或任务。 2. 感知系统:设计传感器系统采集环境数据。 3. 决策机制:定义决策算法,根据感知数据和目标做决策。 4. 行动系统:设计执行器或输出设备执行决策。 5. 学习与优化:若为学习型智能体,设计学习算法以改进。 具身智能是将机器学习算法适配至物理实体从而与物理世界交互的人工智能范式。以 ChatGPT 为代表的“软件智能体”通过多种模态与用户交互,具身智能体则将大模型嵌入物理实体,通过传感器与人类交流。人形机器人是具身智能的代表产品,其三要素为本体、智能、环境,高度耦合是高级智能的基础。不同环境有不同形态的硬件本体适应,如室内平地适用轮式机器人,崎岖地面适用四足机器人。具身智能体的行动分为“感知决策行动反馈”四个步骤,分别由四个模块完成并形成闭环。具身智能需要具备感知、决策和执行三种核心能力,执行能力是技术难点,涉及硬件设计,可泛化的通用执行能力是短板。LLM 为具身智能热潮来临提供了机会,其强泛化能力和 zeroshot 能力使不再需要为每个任务手工调校机器人。
2024-11-29
根据我的论文主题撰写一段引言:《通用人工智能时代的博弈论应用:数据科学与决策价值》
在当今科技飞速发展的时代,通用人工智能(AGI)的崛起正以前所未有的态势改变着我们的生活和社会。随着数据量的爆炸式增长以及决策环境的日益复杂,博弈论作为一门研究决策主体相互作用时的策略选择及均衡问题的学科,在通用人工智能时代展现出了独特的应用价值。 在数据科学领域,海量的数据为我们提供了丰富的信息,但如何从这些数据中提取有价值的知识并做出明智的决策,成为了一个关键挑战。博弈论的引入为解决这一问题提供了新的思路和方法。它帮助我们理解不同数据主体之间的竞争与合作关系,从而优化数据的采集、处理和分析过程。 在决策价值方面,通用人工智能系统需要在复杂多变的环境中做出最优决策。博弈论通过对不同策略的收益和风险进行分析,为决策提供了理论依据和数学模型,使得决策更加科学、合理和高效。 综上所述,研究通用人工智能时代的博弈论应用,对于推动数据科学的发展以及提升决策的价值具有重要的理论和实践意义。
2024-09-28
请问为什么需要机器学习?
机器学习之所以必要,主要是因为对于一些复杂任务,直接编程太过复杂,人类难以解决任务中的所有细节并精确编程。例如,编写程序去识别复杂场景中照明条件下新视角的三维物体很困难,因为我们不了解其在大脑中的运作机制,即便知道,编写的程序也会非常复杂;编写计算信用卡诈骗概率的程序也很困难,因为可能没有简单可靠的规则,需要结合大量弱规则判别,且欺骗行为会转移目标,程序需不断更改。 在这种情况下,我们向机器学习算法提供大量数据,让算法通过探索数据并找到能实现程序员目的的模型来解决问题。机器学习算法利用这些样本生成的程序可能与典型手写程序不同,可能包含数百万个数字。如果做得正确,该程序能像处理训练集样本一样处理新样本,且数据改变时程序也可通过训练新数据改变。 目前,大量的计算比支付给程序员编写特定任务的程序更便宜。机器学习适用的任务例子包括模式识别(如真实场景中的物体、面部识别或表情、口语)、异常识别(如不寻常的信用卡交易序列、核电站传感器读数的异常模式)、预测(如未来股票价格或货币汇率、一个人喜欢的电影)。
2025-03-26
我是一个没有技术背景且对AI感兴趣的互联网产品经理,目标是希望理解AI的实现原理并且能够跟开发算法工程师沟通交流,请给我举出AI模型或者机器学习的分类吧。
以下是 AI 模型和机器学习的分类: 1. AI(人工智能):是一个广泛的概念,旨在使计算机系统能够模拟人类智能。 2. 机器学习:是人工智能的一个子领域,让计算机通过数据学习来提高性能。包括以下几种类型: 监督学习:使用有标签的训练数据,算法学习输入和输出之间的映射关系,包括分类和回归任务。 无监督学习:学习的数据没有标签,算法自主发现规律,经典任务如聚类。 强化学习:从反馈中学习,以最大化奖励或最小化损失,类似训练小狗。 3. 深度学习:是机器学习的一个子领域,模拟人脑创建人工神经网络处理数据,包含多个处理层,在图像识别、语音识别和自然语言处理等任务中表现出色。 4. 大语言模型:是深度学习在自然语言处理领域的应用,目标是理解和生成人类语言,如 ChatGPT、文心一言等。同时具有生成式 AI 的特点,能够生成文本、图像、音频和视频等内容。 2017 年 6 月,谷歌团队发表论文《Attention is All You Need》,首次提出了 Transformer 模型,它基于自注意力机制处理序列数据,不依赖循环神经网络或卷积神经网络。生成式 AI 生成的内容称为 AIGC。
2025-03-26
四轮腿机器人资料
以下是关于四轮腿机器人的相关资料: 宇树科技在该领域的情况: 推动了 AI + 机器人技术的标准化、模块化、智能化,实现快速、低成本落地。 基于企业训练数据完善深度学习训练模型及预测代码,通过四足机器人完成救援场景任务执行。 其四足机器人产品能力出众,多场景头部客户落地验证。 发布了 Aliengo 四足机器人,采用全新设计的动力系统,更轻量集成,一体化机身设计。 其 CEO 王兴兴在硕士期间独立开发了低成本外转子无刷电机驱动的高性能四足机器人 Xdog,开创了全球低成本高性能四足机器人方案的技术先河,并于 2016 年创立宇树科技。 2021 年 6 月发布伴随仿生机器人 Go1,以超低价格和优秀的感知运动能力,成为人类科技史上首款真正走入大众生活的移动机器人。2022 年 2 月“泰哥”亮相,2022 年 4 月推出 PUMP 健身泵。2023 年 4 月发布仿生 4D 激光雷达 L1。未来还将推出 Go 1 升级版、行业版、人形机器人等产品。 具身智能方面: 具身智能是将机器学习算法适配至物理实体,从而与物理世界交互的人工智能范式。以 ChatGPT 为代表的“软件智能体”使用大模型通过网页端、手机 APP 与用户进行交互,具身智能体则将大模型嵌入到物理实体上,通过机器配备的传感器与人类交流,强调智能体与物理环境之间的交互。通俗讲就是给人工智能装上“身体”,人形机器人是具身智能的代表产品。 具身智能的三要素包括“本体”(硬件载体)、“智能”(大模型、语音、图像、控制、导航等算法)、“环境”(本体所交互的物理世界),本体、智能、环境的高度耦合是高级智能的基础,不同环境下会有不同形态的硬件本体适应环境,比如室内平地适用轮式机器人,崎岖不平地面适用四足机器人。 具身智能的行动分为“感知 决策 行动 反馈”四个步骤,分别由四个模块完成,并形成一个闭环。
2025-03-25
微信机器人
以下是关于微信机器人的相关内容: 测试和重新配置 1. 登录成功后,找另一个人私聊或者在群中@您,就可以看到机器人的正常回复,此时表示已通。若未通过,可检查 config.json 文件中的配置或直接跳到“第四章,第 3 步”重启服务。 2. 为机器人设置不同的提示词,可返回“第三章,第 7 步”或“目录 4 里的第 17 步”进行更改。 3. 此后任何更改,都需要“返回首页 右上角 点击重启,重启一下服务器”,或者在熟悉 linux 操作的情况下通过重启进程的方式来重启服务。 4. 重新在“文件”的【终端】里,直接输入“nohup python3 app.py&tail f nohup.out”重新扫码登录即可。 5. 若想退出机器人,在手机微信上找到桌面版已登录的信息,点击退出桌面版即可。 帮助 如果遇到问题,可以先查询社区知识库,或者加“通往 AGI 之路”群,社区小伙伴们(比如梦飞大佬,熊猫大侠)会尽力帮助。也可以加 Stuart 个人微信询问。 第一天教程:COW 部署 1. 登录成功后,找另一个人私聊或者在群中@您,就可以看到机器人的正常回复,此时表示已通。 2. 若想设置提示词,可返回“目录 4 里的第 17 步”进行更改。 3. 此后任何更改,都需要重新打印登陆二维码才会生效。建议在多次重新登录后,在宝塔“首页 右上角 点击重启,重启一下服务器”清理进程。 4. 重新在“文件”的【终端】里,直接输入“nohup python3 app.py&tail f nohup.out”重新扫码登录即可。 5. 如果没有手机登录,可以使用夜神模拟器模拟手机登录。 6. 一个月内,不要上来就加好友、最好不要私聊聊天。 7. 报错“wxsid”是因为微信未实名,实名即可。 8. Link AI 提供 100 个,合计 3500 万 GPT3.5 Token 的礼品码,可用于实现画图、搜索、识图等功能,COW 插件里几乎都支持使用 LinkAI 平台。完成机器人搭建,机器人拉群里,可领兑换码。 9. 添加微信,拉您进机器人群,先行体验。 COW 问题 1. 微信机器人无法正常画图,给的图片链接点进去有错误提示“{"Success":1,"error":{"code":4008,"message":"The specified key does not exist."}}”,查看/root/chatgptonwechat/run.log 中有相关提示。可能是点击链接时多了一个小括号。 2. 扫码后,手机登陆后,没有任何机器人的反应,可能是配置错误或安装不对,需根据步骤逐一检查或重装。 3. 按照在 coze 上的设计,输入特定数字后,会出现相应内容,由于内容生成需要时间,因此生成前加了“内容加速生成中,请稍等”的消息,在 coze 中运行正确,但在微信机器人中,始终只显示内容生成中的消息,后面的内容不会出现。这不是问题,COW 本身处理不了,一次只能调取一个对话。有代码能力,可以直接调整代码实现。 4. 宝塔之后登录的时候登录不上去,按下图所示重启服务器之后即可,重启时间可能会久,但一定会重启成功,请耐心等待。
2025-03-24
哪里可以找到免费且可以系统学习机器学习的课程
以下是一些可以免费系统学习机器学习的课程资源和学习路径: 1. 对于大型语言模型(LLM)开发的学习: 掌握深度学习和自然语言处理基础,包括机器学习、深度学习、神经网络等基础理论,以及自然语言处理基础,如词向量、序列模型、注意力机制等。相关课程有吴恩达的深度学习课程、斯坦福 cs224n 等。 理解 Transformer 和 BERT 等模型原理,包括 Transformer 模型架构及自注意力机制原理,BERT 的预训练和微调方法,掌握相关论文,如 Attention is All You Need、BERT 论文等。 学习 LLM 模型训练和微调,包括大规模文本语料预处理,LLM 预训练框架,如 PyTorch、TensorFlow 等,微调 LLM 模型进行特定任务迁移。相关资源有 HuggingFace 课程、论文及开源仓库等。 LLM 模型优化和部署,包括模型压缩、蒸馏、并行等优化技术,模型评估和可解释性,模型服务化、在线推理、多语言支持等。相关资源有 ONNX、TVM、BentoML 等开源工具。 LLM 工程实践和案例学习,结合行业场景,进行个性化的 LLM 训练,分析和优化具体 LLM 工程案例,研究 LLM 新模型、新方法的最新进展。 持续跟踪前沿发展动态,关注顶会最新论文、技术博客等资源。 2. 神经网络架构方面: 神经网络是机器学习文献中的一类模型,在完成吴恩达的 Coursera 机器学习课程后,可以寻找 Geoffrey Hinton 的机器学习神经网络课程。 一般神经网络架构可分为三类:前馈神经网络,这是实际应用中最常见的神经网络类型;循环网络,在他们的连接图中定向了循环,更具有生物真实性。 3. 强化学习的入门学习: 如果基础薄弱,可先学习概率论和线性代数相关课程。 对机器学习无基础的话,先看吴恩达的课程,再以李宏毅的课程作为补充,只看前几节讲完神经网络的部分。 学完后跟着《动手学深度学习 https://hrl.boyuai.com/》动手学习,只看前五章。 接着看 B 站王树森的深度学习课程的前几节学习强化学习基础知识点。 最后可以看《动手学强化学习》,看到 DQN 的部分。
2025-03-22
机器学习入门
以下是关于机器学习入门的相关知识: 实现人工智能的方法: 自上而下的方法:尝试对推理过程进行建模,将其形式化并转化为计算机程序,即符号推理。例如医生诊断时应用大量规则得出结果,但从人类专家提取知识较困难,且有些任务无法简化为知识操作。 自下而上的方法:模拟大脑中的神经元,在计算机中构建人工神经网络,通过举例让其学习解决问题,类似于新生儿的学习过程。 机器学习: 是人工智能的一部分,基于数据使计算机学会解决问题。 经典机器学习在《机器学习入门课程》中有详细介绍。 学习资源:《》。 算法学习中的数学基础: 统计学:机器学习是统计的另一种形式,可利用统计学预估数据规律。统计学中关注的数据汇总技术包括平均值、中位数、众数等。平均值在机器学习中的特征归一化、计算 R² 值等方面有应用;中位数在将数据样本划分为等间隔或四分位数范围时有用;众数可用于查找数据集中占主导地位的元素或类别。
2025-03-21
我应该如何系统学习本站的内容,以应用为主,基础理论为辅
如果您想系统学习本站内容,以应用为主、基础理论为辅,可以参考以下步骤: 基础理论方面: 了解人工智能、机器学习、深度学习的定义及其之间的关系。 简要回顾 AI 的发展历程和重要里程碑。 掌握数学基础,包括统计学基础(熟悉均值、中位数、方差等统计概念)、线性代数(了解向量、矩阵等基本概念)、概率论(基础的概率论知识,如条件概率、贝叶斯定理)。 算法和模型方面: 对于监督学习,了解常用算法,如线性回归、决策树、支持向量机(SVM)。 熟悉无监督学习中的聚类、降维等算法。 了解强化学习的基本概念。 评估和调优方面: 学会如何评估模型性能,包括交叉验证、精确度、召回率等。 掌握使用网格搜索等技术优化模型参数的方法。 神经网络基础方面: 理解神经网络的基本结构,包括前馈网络、卷积神经网络(CNN)、循环神经网络(RNN)。 了解常用的激活函数,如 ReLU、Sigmoid、Tanh。 关于知识库的使用,以 Agent 板块为例: 链接: 用法:从下往上看,一个一个点进去,都有视频。 注意事项:共学都有视频,都是手把手从注册开始的教学,不会就多看几遍,基本保障一个工具能调通、一个 Agent 能搭好。确实内容有点多,点进去看看哪个工具您听过就从哪个工具开始,不然太累。 链接: 用法:看了一些视频之后,您就知道您要看理论还是应用了,找到导航,想看哪里点哪里。 备注:智能千帆、阿里云百炼都是有视频的,其余没有视频。 注意事项:内容较多,您如果都看到这里了,就要考虑聚焦了,先挑一个,开始手把手一起做起来,看看能不能持续用起来,只要您开始用起来,这事儿就成啦!快捷菜单找不到的话,看这里。
2025-03-10
关于AI绘画的所有理论知识
以下是关于 AI 绘画的理论知识: 1. 色彩方面: 颜色的冷暖特性:任何色系都有冷暖之分,并非绝对。黄色等暖色系色相占比不同会改变冷暖感觉。 色彩空间感:暖色看起来前进,冷色看起来后退。 色彩搭配:一般作品采用前暖后冷的色彩搭配,即背景用冷色,主体前景用红色或暖色调,冷色后退可增强空间感和纵深感。家装中冷色器可让房间看起来更大,远浅近深更有开放感。 色彩三要素:色相、明度和纯度。色相指颜色种类,明度指亮度,纯度指饱和度。 色彩心理学:色彩能影响人的情绪,在设计、市场营销、心理治疗等方面有重要作用,每年有流行色,不同颜色可表现多种正面和负面情绪。 色环和配色:三原色可调配出所有颜色,色环中有间色、复色,配色方案有同类色、邻近色、互补色等,不同配色有不同效果。 2. 光源方面: 光源分类:包含自然光(如太阳光、月光)、人造光(如手电筒、路灯、闪光灯等,掌控性和对比度强)、环境光(来自周围自然环境,是折射光线,在表现主体与环境关系时重要)。 光的方向:不同方向光线能体现氛围、表达情绪,如逆光加底光用于塑造反派等,还列举顺光、侧光等不同光的效果及作用。 光的质量:硬光、强光和柔光区别明显,强光和硬光会形成强烈阴影,光线清晰,光与环境对比度高,能凸显主体;柔光与之相对,几乎无阴影,很柔和有氛围感。 光与提示词:光的知识对写提示词很重要,掌握这些才能写出有氛围感的提示词塑造角色形象。 3. 构图方面: 摄影构图:多样且不必严谨遵循特定规则,可同时满足多种构图方式,如 S 构图、三角形构图、引导线构图等,掌握构图知识能分析出更多图片信息。 AI 绘画构图:AI 生图的构图一般不会出大问题,除非刻意用提示词引导。
2025-03-06
我想学习制作机器人 机器狗等的原理及方法,给我一份理论指导和操作指南吧。
以下是关于制作机器人和机器狗的理论指导和操作指南: 具身智能是将机器学习算法适配至物理实体,与物理世界交互的人工智能范式。以 ChatGPT 为代表的“软件智能体”通过网页端、手机 APP 与用户交互,能接受多种模态指令实现复杂任务。具身智能体则将大模型嵌入物理实体,通过传感器与人类交流,强调与物理环境交互。人形机器人是具身智能的代表产品。 具身智能有三要素: 1. 本体:即硬件载体,不同环境有不同形态的硬件本体适应,如室内平地适用轮式机器人,崎岖地面适用四足机器人(机器狗)。 2. 智能:包括大模型、语音、图像、控制、导航等算法。 3. 环境:本体所交互的物理世界,本体、智能、环境高度耦合是高级智能基础。 具身智能还有四个模块:感知决策行动反馈。一个具身智能体的行动分为这四个步骤,分别由四个模块完成并形成闭环。在具身智能体与环境的交互中,智能算法通过本体传感器感知环境,做出决策操控本体执行动作任务影响环境,还可通过“交互学习”和拟人化思维学习适应环境实现智能增长。
2025-02-26
如何让ai写一篇很好的文学理论 论文
以下是关于如何让 AI 写一篇好的文学理论论文的相关内容: 首先,过度追求模型的正面描述和对齐人类价值观可能会带来问题。比如在文学创作中,道德过度正确和大量正面描述实际上是一种“对齐税”,会让模型变得愚蠢。像生成的游戏中主人公全是幸福人生,这样的故事缺乏冲突,人物单薄,不好看。而且全乎正确的道德和完美的正面在现实世界中并不存在,纵观文学史,伟大的文学作品几乎没有全是正面描述的,因为人类的心灵与生活极为复杂,痛苦、绝望和悲伤也是生命体验的一部分,只有正面的故事很难获得共鸣。 其次,好的文字能引起人的生理共鸣与情绪。人们在感受到好文字时,往往有一种被击中、头皮发麻的感觉。共鸣是文学的基础,有共鸣才有读者,有读者才有文学。文学映照的是人类相同的渴望与恐惧,人类之间的共性大于差异。对于像 GPT 这样的大语言模型,其预训练数据量大且丰富,储存了人类几乎所有可能的生命经验,理应能够学会引发人类的共鸣与情绪。 最后,在实际操作中,对于处理文本特别是 PDF,Claude 2 表现出色。可以将整本书粘贴到 Claude 的前一版本中取得不错的结果,新模型更强大。但需要注意的是,这些系统仍会产生幻觉,若要确保准确性,需检查其结果。
2025-01-29
关于AI的基础理论
AI 的基础理论包括以下方面: 背景知识:了解人工智能、机器学习、深度学习的定义及其之间的关系。 历史发展:简要回顾 AI 的发展历程和重要里程碑。 数学基础: 统计学基础:熟悉均值、中位数、方差等统计概念。 线性代数:了解向量、矩阵等线性代数基本概念。 概率论:基础的概率论知识,如条件概率、贝叶斯定理。 算法和模型: 监督学习:了解常用算法,如线性回归、决策树、支持向量机(SVM)。 无监督学习:熟悉聚类、降维等算法。 强化学习:简介强化学习的基本概念。 评估和调优: 性能评估:了解如何评估模型性能,包括交叉验证、精确度、召回率等。 模型调优:学习如何使用网格搜索等技术优化模型参数。 神经网络基础: 网络结构:理解神经网络的基本结构,包括前馈网络、卷积神经网络(CNN)、循环神经网络(RNN)。 激活函数:了解常用的激活函数,如 ReLU、Sigmoid、Tanh。 对于新手学习 AI,建议: 了解 AI 基本概念:首先,阅读「」部分,熟悉 AI 的术语和基础概念,了解人工智能的主要分支及它们之间的联系,浏览入门文章。 开始 AI 学习之旅:在「」中找到为初学者设计的课程,特别推荐李宏毅老师的课程,通过在线教育平台(如 Coursera、edX、Udacity)按自己节奏学习。 选择感兴趣的模块深入学习:AI 领域广泛,可根据兴趣选择特定模块,如掌握提示词技巧。 实践和尝试:理论学习后进行实践,尝试使用各种产品做出作品,在知识库分享实践成果。 体验 AI 产品:与如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人互动,了解其工作原理和交互方式。 AI 技术的发展历程和前沿技术点: 发展历程: 早期阶段(1950s 1960s):专家系统、博弈论、机器学习初步理论。 知识驱动时期(1970s 1980s):专家系统、知识表示、自动推理。 统计学习时期(1990s 2000s):机器学习算法(决策树、支持向量机、贝叶斯方法等)。 深度学习时期(2010s 至今):深度神经网络、卷积神经网络、循环神经网络等。 前沿技术点: 大模型(Large Language Models):GPT、PaLM 等。 多模态 AI:视觉 语言模型(CLIP、Stable Diffusion)、多模态融合。 自监督学习:自监督预训练、对比学习、掩码语言模型等。 小样本学习:元学习、一次学习、提示学习等。 可解释 AI:模型可解释性、因果推理、符号推理等。 机器人学:强化学习、运动规划、人机交互等。 量子 AI:量子机器学习、量子神经网络等。 AI 芯片和硬件加速。
2025-01-17
推荐学习Aigc的入门理论书籍
以下是为您推荐的学习 AIGC 的入门理论书籍和相关资料: 1. 《AIGC Weekly19》:其中包括腾讯非常系统的 Stable Diffusion 介绍文章,马丁整理的关于 AIGC 的碎片化思考,多邻国创始人 Luis von Ahn 专访,Meta AI 发布的自监督学习“烹饪书”,以及回顾大语言模型发展历程的内容。 2. 《AIGC Weekly01》:包含对 Stable Diffusion 工作原理的介绍,Emad 写的关于 SD V2 模型的笔记,Hugging Face Inference Endpoints 指南,GPT4 预测相关内容,以及关于 AI 时代工作未来的读物。 3. 【AI 学习笔记】:介绍了 AI 大模型的相关概念,如生成式 AI、相关技术名词(包括监督学习、无监督学习、强化学习、深度学习等)、技术里程碑(如 2017 年谷歌团队发表的提出 Transformer 模型的论文)等。
2025-01-01