maintain only the variations
只用保留重构输入所需要的数据变换,而不用保留输入中的冗余。
maintain only the variations
只用保留重构输入所需要的数据变换,而不用保留输入中的冗余。
balances
既需要对数据有适当的敏感,这样才能够作为经验,判断别的东西;但是又不能对数据太敏感了,不然就成了单纯记忆这些数据集里的东西,导致过度拟合,没有办法进行相似判断。
bottleneck
是因为节点太少了,限制了信息传输
tasked with outputting
对一些数据集找一些预测值。
independent
因为一旦这些特征shi相互独立的,经过压缩之后,相当于有些信息就损失了,所以重建就会变得很难。
forces a compressed knowledge representation
强制压缩知识表示
impose a bottleneck
施加瓶颈
representation learning
表征学习
leverage neural networks
利用神经网络
highes
最高的设为1,其余全部设为0.。比较高,但不是最高的,不会被计入到损失中去(原因是,虽然这些方框并不是预测得最准的,但是他们也不能被认为是错的)
labeled objects to whichever anchor box
把标签赋给方框
Although it is not visualized, these anchor boxes are present for each cell in our prediction grid.
什么意思
bounding box dimensions
为什么方框还有维数
normalized by the image width
都是把整张图片的长宽作为1,来衡量方框的长宽。
doubling the number of channels at each pooling step
在每个合并步骤中,将通道加倍。
pobjpobjp_{obj} above some defined confidence threshold
概率达到一定程度了,才判定为是目标物体。
single bounding box prediction for each object detected
对每个提取出来的物体,只想用一个方框
objects that are actually likely
不是一开始就告诉机器,图片上有多少个物体,给定方框的数量;而是让机器自己找有多少个,自己输出与物体数量匹配的方框数量。
BBB bounding
多个物体就用多个bounding box
how
这个方框的中心在哪里,长宽是多少
which grid cells are likely to contain an object
有一些格子,而不是一个,都是可能包含物体的
xxx coordinate, yyy coordinate, width, and height
刻画了中心点的坐标,及方框的大小
which grid cell contains the center of our bounding box annotation
我们会有一个bounding box,这个方框会有一个中心。图片被粗糙地分为了7*7,要看方框的中心落在哪一个方格中。
struggle to be flexible enough
意思是不够灵活么?
image segmentation which provides localization at the pixel-level
用长方形是以长方形为单位,而用图像分割的方式,就是以像素点为单位了。