CNN(卷积神经网络)主要应用于以下领域:
CNN的结构是基于这两类细胞的级联模型,主要用于模式识别任务。它在计算上比大多数其他架构更有效、更快速,在许多应用中,包括自然语言处理和图像识别,已经被用来击败大多数其他算法。我们每次对大脑的工作机制的认知多一点,神经网络的算法和模型也会前进一步!
图像Embeddings:使用卷积神经网络(CNN)进行图像特征提取,得到的特征向量即为图像嵌入。音频Embeddings:在语音识别和声纹识别中,将声音信号转化为有意义的向量表示。用户/物品Embeddings:在推荐系统中,将用户行为或物品属性映射到低维空间以进行协同过滤或基于内容的推荐。还有一种图Embeddings:是用于学习图结构的表示学习方法,将图中的节点和边映射到低维向量空间中。通过学习图嵌入,可以将复杂的图结构转化为向量表示,以捕捉节点之间的结构和关联关系。这些方法可以通过DeepWalk、Node2Vec、GraphSAGE等算法来实现。图嵌入在图分析、社交网络分析、推荐系统等领域中广泛应用,用于发现社区结构、节点相似性、信息传播等图属性。下面以OpenAI为例继续展开介绍
视觉分析技术的演进路径CV技术经历了几个重要发展阶段。在2014年之前,早期的方法主要依赖于手工特征提取技术,如SIFT、SURF和HOG,这些方法通常结合了传统的机器学习算法。进入2014年,随着深度学习的兴起,神经网络(CNN)开始在CV中发挥核心作用。这个阶段经历了从零开始的深度学习、有监督、无监督和自监督。到了2019年,随着Transformer结构的诞生及其在自然语言处理中的成功应用,预训练Transformer架构模型如VideoBERT开始兴起。