以下是关于机器学习入门的相关知识:
在自上而下的方法中,我们尝试对推理过程进行建模。由于我们在推理时可以知道自己的思考步骤,因此我们可以尝试将这一过程形式化,并转化为计算机程序。这就是所谓的符号推理(symbolic reasoning)。人们的头脑中往往有一些指导决策过程的规则。例如,当医生对病人进行诊断时,他/她可能会通过发烧症状意识到病人身体内部可能有一些炎症。通过将大量规则应用于特定问题,医生有可能得出最终的诊断结果。这种方法在很大程度上依赖于知识表示和推理。从人类专家那里提取知识可能是最困难的部分,因为医生在很多情况下并不清楚自己为什么会得出特定的诊断结果。有时,他/她只是直接在脑海中浮现出解决方案,而并未经过明确的思考。类似“根据照片判断一个人的年龄”这样的任务,根本无法简化为对知识的操作。[heading2]自下而上的方法[content]我们还有另一种选择,就是模拟大脑中最简单的元素——神经元。我们可以在计算机中构建一个人工的神经网络,然后通过举例教它解决问题。这类似于新生儿通过观察周围环境来学习的过程。✅对婴儿的学习方式做一个小调研。婴儿大脑中的基本要素有哪些?那么机器学习(ML)呢?人工智能的一部分方法是基于数据来使计算机学会解决问题,这样的方法称为机器学习。我们在本课程中将不讨论经典机器学习,建议你可以学习单独的《[机器学习入门](https://github.com/microsoft/ML-For-Beginners)》课程。
人工智能的商业应用案例。如需要了解这方面的信息,可以考虑学习以下两个微软的课程:《[面向商业用户的人工智能学习](https://learn.microsoft.com/en-us/training/paths/introduction-ai-for-business-users/?WT.mc_id=academic-77998-cacaste)》、《[人工智能商学院](https://learn.microsoft.com/en-us/training/paths/transform-your-business-with-microsoft-ai/)》(和欧洲工商管理学院INSEAD共同开发)。经典机器学习。这在我们的《[机器学习入门课程](https://github.com/Microsoft/ML-for-Beginners)》中有详细介绍。使用Azure认知服务(Azure Cognitive Services)来创建实用的人工智能应用。如有需要,我们建议你从以下微软课程开始学习:《[视觉](https://learn.microsoft.com/en-us/training/paths/create-computer-vision-solutions-azure-ai/?WT.mc_id=academic-77998-cacaste)》、《[自然语言处理](https://learn.microsoft.com/en-us/training/paths/explore-natural-language-processing/?WT.mc_id=academic-77998-cacaste)》、《[使用Azure OpenAI服务的生成式人工智能](https://learn.microsoft.com/en-us/training/paths/develop-ai-solutions-azure-openai/?WT.mc_id=academic-77998-bethanycheum)》等。
机器学习是统计的另一种形式,我们可以利用统计学来预估数据规律。这种规律可以是从数据中查找平均值或通过预测隐藏模式以更复杂的形式查找得到。比如,假设我们给你一个公司同职位的10个人的工资,并要求你预测第11个人的工资;你会怎么预测?比如平均数,这种预估方法是对的,但这个平均值可能与实际数字差距非常大。使用机器学习,我们可以尝试缩小预测值与实际值之间的差距。因此,机器学习只是统计的另一种形式。我们在统计学中可以关注的主题主要是数据汇总技术,例如:[heading3]平均值[content]平均值是数据值的平均值。平均值在机器学习中的使用可以在对特征进行归一化、计算R²值等情况下找到。有关使用均值的[回归模型的](https://www.enjoyalgorithms.com/blog/evaluation-metrics-regression-models/)[归一化](https://www.enjoyalgorithms.com/blog/need-of-feature-scaling-in-machine-learning/)和评估指标的博客参考可以在相应的链接中找到。[heading3]中位数[content]中位数表示数据中按升序或降序排列的中间元素。将数据样本划分为等间隔或四分位数范围(IQR)时,它很有用。直接用例之一可以在用于数据分析的箱线图中找到。[heading3]众数[content]众数是数据样本中出现频率最高的数字,总结了有关频繁出现的元素的数据,这些数据可用于机器学习以查找哪个或者哪类样本在数据集中占主导地位。在分类问题的情况下,如果模式表明某个类别占主导地位,那么ML模型可能始终会预测该类别。