可分离卷积是卷积的一种特殊形式。在深度学习中,卷积具有多种解释和应用。
卷积可以描述信息的扩散,例如在不搅拌时牛奶在咖啡中的扩散,在量子力学中描述测量粒子位置时量子粒子在某个位置的概率,在概率论中描述互相关即重叠的两个序列的相似程度,在统计学中描述标准化输入序列上的加权移动平均值。
卷积滤波器可以被解释为特征检测器,输入针对某个特征进行过滤。图像的互相关可以通过反转核转换为卷积,内核可被解释为特征检测器,检测到特征会导致大输出,没有特征则小输出。
对于深度学习中卷积的哪种解释正确尚不明确,但目前最有用的解释是卷积滤波器作为特征检测器对输入进行过滤以解释图像的互相关。
相关参考资料包括:
Alternating Words交替词[cow|horse]in a field在第一步中,提示是“田野里的牛”。第二步是“田野里的马”。第三步是“田野里的牛”等等。[cow|cow|horse|man|siberian tiger|ox|man]in a field可以支持多个词交替Composable Diffusion可组合扩散就是AND语法a cat AND a dog比如想画一个猫和狗的混合物种每一个要混合的东西支持加权重比如a cat:1.2 AND a dog AND a penguin:2.2你可以creature_embedding in the woods:0.7 AND arcane_embedding:0.5 AND glitch_embedding:0.2这句话的意思可能是你可以主题权重设0.7不重要一点的设0.5稍微加一点的加0.2如果低于0.1的值基本是没用的比如a cat AND a dog:0.03基本是就是画a cat通过继续向总数添加更多提示,这可以方便地生成微调的递归变化.比如log AND frog:0.13 AND yellow eyes:0.08这是github wiki上面的例子木头青蛙黄眼睛
图3:通过在整个图像上滑动图像块来计算卷积。将原始图像(绿色)的一个图像块(黄色)乘以核(黄色斑块中的红色数字),并将其和写入一个特征映射像素(卷积特征中的红细胞)。图片来源:[1](http://deeplearning.stanford.edu/wiki/index.php/Feature_extraction_using_convolution)。卷积可以描述信息的扩散,例如,将牛奶放入咖啡中而不搅拌时发生的扩散可以通过卷积操作精确地建模(像素向图像中的轮廓扩散)。在量子力学中,它描述了当你测量粒子位置时量子粒子在某个位置的概率(像素位置的平均概率在轮廓处最高)。在概率论中,它描述了互相关,即重叠的两个序列的相似程度(如果特征(例如鼻子)的像素在图像(例如脸部)中重叠,则相似度很高)。在统计学中,它描述了一个标准化输入序列上的加权移动平均值(轮廓线的权重大,其他所有的权重都很小)。还有许多其他的解释。对于深度学习,卷积的哪种解释是正确的还不清楚,但目前最有用的解释是:卷积滤波器可以解释为特征检测器,即输入(特征映射)针对某个特征(核)进行过滤,如果在形象。这就是如何解释图像的互相关。
图4:图像的互相关。卷积可以通过反转核(倒置图像)转换为互相关。然后,内核可以被解释为一个特征检测器,其中检测到的特征导致大输出(白色)和小输出(如果没有特征存在)(黑色)。图片取自[史蒂芬·史密斯](http://www.dspguide.com/swsmith.htm)的优秀作品[关于数字信号处理的免费在线书籍](http://www.dspguide.com/pdfbook.htm)。附加材料:[在深度学习中理解卷积](http://timdettmers.com/2015/03/26/convolution-deep-learning/)