对象
物体
对象
物体
过滤器
滤波器
保持在手臂长度的拇指大小的区域
在手臂长度距离内一块拇指大小的区域
其他神经元响应Bill Clinton,Jennifer Aniston等的出现
其他神经元会对Bill Clinton, Jennifer Ansion等人的出现作出响应
接受域内
感受野
不是
代替
过滤器
滤波器
不通过
可以不通过
不是通过有监督方式训练的特征
不是由有监督方式训练得到的特征
并且核也需要更少的参数表示为向量
并且核也只要更少的参数来表示成向量
当核可分离时
当核是可分离的时候
每维一个向量
每一维一个向量
问题大小
问题规模
动态地把特征池化在一起
将特征一起动态地池化
用与核一样的拼贴模式
处于相同平铺模式下的核所对应的偏置之间共享参数
拼贴
平铺
也可能通过用ccc和hhh对ggg求微分得到
通过用c和h对g求微分也是可行的
得到
获取
通过
这可以通过
相同格式
相同形式
必须非常小心地来使这种转置运算和前向传播过程相协调
在转置运算与前向传播相协调的过程中必须非常小心
矩阵的很多个元素
矩阵中的多个元素
是
是关于
涉及到
其中包含
过滤器
滤波器
拼贴
平铺
扩展
推广
分别
各自
为了代数地定义拼贴卷积
为了用代数的方法定义平铺卷积
拼贴
平铺
拼贴
平铺
拼贴
平铺
下部中央部分
下半部分
而不是整个空间的特征时
并且相同的特征不会出现在所有的空间上
我们并不一定真正想用卷积
我们并不真正想用卷积
中
的术语中
表示
表征
应用
实现
卷积神经网络
卷积网络
对输出的每个方向上的sss个像素进行采样
在输出的每个方向上每间隔$s$个像素进行采样
卷积
全卷积
输出的处于通道iii中的一个单元和输入的处于通道jjj中的一个单元的连接强度
通道$i$的一个输出单元与通道$j$的一个输入单元之间的连接强度
卷积神经网络
卷积网络
亮度
强度
包含了并行地使用多个卷积
由多个并行的卷积运算组成
这个先验也要求除了那些处在隐藏单元空间连续的小的接收域以内的权值外
这个先验也要求除了那些处在隐藏单元所在的小的空间连续的感受野的权值外
通过针对特定属性的位置运行聚类算法
对于感兴趣特征的位置进行聚类算法
其输入大小的函数
关于这一层输入大小的函数
卷积
网络
很重要
很有用
大多数通过池化函数的输出值并不会发生改变
经过池化函数后的大多数输出并不会发生改变
输入平移一微小的量
输入进行少量的平移
对于平移的不变性是说
平移的不变性是指
我们的表示
输出的表征
不管采用什么样的池化函数
在所有的情况中
卷积层的输出
这一层的输出
非线性的激活函数如整流线性单元函数等作用在第一级中的每一个线性输出上
每一个线性激活响应将会通过一个非线性的激活函数,例如修正线性激活函数
卷积层并行地进行多个卷积运算来产生一组线性激活函数
这一层并行地计算多个卷积生成一组线性激活响应
卷积神经网络的卷积层通常包含三级
卷积网络中一个典型的层包含三级
一些不能被传统的由(固定大小的)矩阵乘法定义的神经网络处理的特殊数据,可能通过卷积神经网络来处理
有一些数据并不能由固定大小的矩阵乘法定义的神经网络来处理,但是卷积可以处理这些数据。
对于图像尺度或者角度的变换
一个图像尺度和旋转的变化
例如当我们在处理人脸图像(图像已经被剪裁成人脸在中心)时,我们可能会希望在不同的部位探测出不同的特征
例如,我们在处理已经通过剪裁居中的人脸图像,我们可能想要提取不同位置上的不同特征
卷积神经网络
卷积网络
某种属性在输入的什么位置出现了
某些特征在输入中出现的位置
延时
延后
卷积产生一条用来表明输入中出现不同特征的某种时间轴
这意味着通过卷积可以得到一个由输入中出现不同特征的时刻所组成的时间轴
一格
一个单位
其中
其中图像函数满足
表示图像的明亮度函数(取值为整数)
是表示图像在整数坐标上亮度的函数
输入的任意平移函数
能够使得输入平移的任意函数
稀疏连接和参数共享是如何显著地提高用于图像边缘检测的线性函数的效率的
稀疏连接和参数共享是如何显著提高线性函数在一张图像上进行边缘检测的效率
因为mmm 和nnn通常规模很接近
通常$m$和$n$有着大致相同的规模
kkk
$k$的大小
并且kkk通常是远小于mmm的数量级
并且$k$比$m$要小很多个数量级
一些可能的边界像素
可能遇见的一些边界像素
决策设计
设计决策
处在深层的单元可能\emph{不直接}地与绝大部分输入连接
处在网络深层的单元可能与绝大部分的输入是间接连接的
远小于
小于
百万个
数千或数百万个
当进行图像处理时
当处理一张图像的时候
这通过使得核的规模远小于输入的规模来实现
这是使核的规模远小于输入的规模来达到的。
传统的神经网络使用矩阵乘法来建立输入与输出的连接关系。 其中,参数矩阵的每一个独立的参数都描述了每一个输入单元与每一个输出单元间的交互。 这意味着每一个输出单元与每一个输入单元都产生交互。
传统的神经网络通过一个参数矩阵和另一个参数的矩阵乘法运算来描述每一个输入和每一个输出单元之间的交互。
输入的图像
输入图像的大小
核
核的大小
块循环矩阵
分块循环矩阵
几乎所有的元素都为零
一个几乎所有元素都为零的矩阵
矩阵的每一行都必须和上一行移动一个元素后相等
矩阵每一行中元素都与上一行对应位置平移一个单位的元素相同
翻转了它的核
对核进行了翻转
只有在用到核的翻转时才会在上下文中特别指明区别
在与核翻转有关的上下文中,我们会特别指出是否对核进行了翻转
使用互相关函数但是叫它卷积
应用互相关函数但称之为卷积
并不翻转核
对核并没有进行翻转
翻转核的唯一目的就是为了得到可交换性
我们将核翻转的唯一原因只是为了可以得到可交换的性质
这意味着当mmm增大时,输入的索引增大,但核的索引相应的减小
从$m$的取值增大的意义上而言,输入的数据索引在增大,但是核的数据索引在减小
因为输入与核的每一个元素都分开存储
因为在输入与核中的每一个元素都必须是明确分开存储的
而核也是由算法产生的高维参数数组
而核通常是由学习算法优化得到的多维数组的参数
就得到了
就可以定义
高维数据数组
多维数组的数据
我们相对输入翻转了核
我们将核相对于输入进行了翻转
因为它在mmm和nnn的有效范围内变化更少
因为$m$和$n$的有效取值范围更加小
更方便应用
实现更为直接
我们也相应的需要使用二维的核K
我们也许也需要使用一个二维的核$K$
如果把二维的图像III作为输入
如果把一张二维的图像$I$作为输入
我们可以统一地把无限的求和当作对有限个数组元素的求和来用
我们可以通过对有限个数组元素的求和来实现无限求和
我们有时对多个维度进行卷积运算
我们有时在多个维度上进行卷积运算
经常
通常
这种高维数组
这些高维数组
时间
时刻
所以比较现实的的假设是传感器每秒给出一次测量结果,
所以在我们的例子中,假设传感器每一秒反馈一次测量结果是比较现实的。
传感器会给出特定时间间隔的数据
传感器会在定期地反馈数据
激光传感器能够在任意时刻给出测量结果的想法是不现实的
激光传感器在每个瞬间反馈测量结果的想法是不切实际的
第一个参数(在这个例子中,函数xxx)叫做输入
卷积的第一个参数(在这个例子中,函数$x$)叫做输入
卷积神经网络
卷积网络
这不是我们能够做到的
这不是我们能够推测得了的。
www在参数为负值时必须为0
在参数为负值时,$w$的取值必须为$0$
就得到了对于飞船位置的连续估计函数
就得到了一个新的对于飞船位置的平滑估计函数
据
距
含有噪声
受到了噪声干扰
产生
公开
问题
基准测试
因为本章的目标是说明卷积神经网络提供的强大工具,第\?章会对在具体环境中使用相应的工具给出一些指导。
因为本章的目标是说明卷积网络所提供的各种工具,第\?章将会对如何在具体环境中选择使用相应的工具给出通用的准则。
卷积神经网络
卷积网络
卷积神经网络是神经科学的原理影响深度学习的典型代表
卷积网络是神经科学的原理中影响着深度学习的典型代表
用得比较多
广泛应用
然后我们会介绍一种几乎所有的卷积神经网络都会用到的操作池化。
然后我们会介绍池化,这是一种几乎所有卷积网络都会用到的操作。
卷积网络
卷积神经网络