深度学习和机器学习的区别主要体现在以下几个方面:
例如,大语言模型是深度学习在自然语言处理领域的应用,其不仅能理解和分析数据,还能创造新的独特输出,如 ChatGPT、文心一言等。
视频学习地址:https://youtu.be/G2fqAlgmoPo中文版本推荐[宝玉XP翻译版本](https://www.bilibili.com/video/BV15a4y1u77v/)和超正经学术君(以下是两个版本):这个名为"生成式人工智能简介"的视频是由Gwendolyn Stripling博士主讲的。她介绍了生成式人工智能的概念,这是一种可以产生各种类型内容的人工智能,包括文本、图像、音频和合成数据。她解释了人工智能和机器学习的区别,机器学习是人工智能的一个子领域,它通过输入数据训练模型,使计算机能够在没有明确编程的情况下学习。机器学习模型可以是监督的,也可以是无监督的,监督模型使用标记的数据从过去的例子中学习并预测未来的值,而无监督模型则专注于发现原始数据中的模式。深度学习是机器学习的一个子集,它使用人工神经网络处理比传统机器学习模型更复杂的模式。这些神经网络可以使用标记和未标记的数据,从而允许半监督学习。生成式人工智能是适用于这个学科的人工智能的一个子集。它试图学习数据和标签之间的关系,以生成新的内容。生成式人工智能输出自然语言、图像或音频,而非生成式人工智能输出数字或类别。生成式人工智能模型使用统计模型预测预期的响应,并根据它们接受训练的数据的基础结构生成新的内容。他们可以根据接收到的输入生成文本、图像、音频和决策的新颖组合。生成式人工智能的力量来自于使用了Transformers,这种技术在2018年彻底改变了自然语言处理(Transformer模型的核心思想是“自注意力机制”/Self-Attention Mechanism,也被称为“自我注意力”或“注意力”。这种机制允许模型在处理一个词或短语时,同时考虑到与它相关的其他词或短语的信息。这种方式使得模型能够更好地理解语言的上下文,从而更准确地进行翻译或生成文本)。然而,Transformers也可能产生幻觉,这些是模型生成的无意义或语法错误的单词或短语。
因此在这个例子中,我们通过手动探索并选择了能获得更好的表征方式的变换。但是,假如我们能开发一个系统或程序来自动搜索不同的表征(在这个例子中是坐标变换),然后确定新方法的分类准确率的计算方式,这时候就变成了机器学习。这一点很重要,深度学习是使用不同类型神经网络的表征学习,通过优化网络的超参数来获得对数据的更好表征。而没有深度学习中的突破性研究,这一切也将不可能出现,这里我列出几个经典案例:1:反向传播参考阅读:[被Geoffrey Hinton抛弃,反向传播为何饱受质疑?(附BP推导)](http://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650731098&idx=1&sn=c7391caee3a567b4b046406d53f022f2&chksm=871b3624b06cbf320f3725fe452d291e04a4a8c1beda8ee9e00f1d10266847be4736090aade3&scene=21#wechat_redirect)A theoretical framework for Back-Propagation——Yann Lecun:http://yann.lecun.com/exdb/publis/pdf/lecun-88.pdf2:更好的初始化网络参数。需要记住的是:初始化策略需要根据所使用的激活函数来选择。参考阅读:
LLM大家都已经再熟知不过了,为了承上启下,这里针对LLM再做一些简单的概念以及自认为一些关键内涵的回顾。从概念分类角度上看,大语言模型是深度学习的分支。其中:机器学习是人工智能(AI)的一个子领域,它的核心是让计算机系统能够通过对数据的学习来提高性能。在机器学习中,我们不是直接编程告诉计算机如何完成任务,而是提供大量的数据,让机器通过数据找出隐藏的模式或规律,然后用这些规律来预测新的、未知的数据。深度学习是机器学习的一个子领域,它尝试模拟人脑的工作方式,创建所谓的人工神经网络来处理数据。这些神经网络包含多个处理层,因此被称为“深度”学习。深度学习模型能够学习和表示大量复杂的模式,这使它们在诸如图像识别、语音识别和自然语言处理等任务中非常有效。大语言模型是深度学习的应用之一,尤其在自然语言处理(NLP)领域。这些模型的目标是理解和生成人类语言。为了实现这个目标,模型需要在大量文本数据上进行训练,以学习语言的各种模式和结构。如ChatGPT,文心一言,就是一个大语言模型的例子。被训练来理解和生成人类语言,以便进行有效的对话和解答各种问题。如下图所示中LLM与ML、DL的关系:同时,LLM还有一个可以说独有的特点,即生成式AI,这也是区别与其它传统模型或训练任务的Uniqueness,表面上看,这种技术包括用于生成文本、图像、音频和视频等各种类型的内容的模型,其关键特性是,它不仅可以理解和分析数据,还可以创造新的、独特的输出,这些输出是从学习的数据模式中派生出来的。