卷积神经网络(CNN)
模仿人眼的一个局部相关性、局部感受的机制(感受野),提出的网络叫做卷积神经网络,每次感受一个小的方块(视野),窗口方块移动时,权值是共享的。 卷积神经网络中的权值共享,类似于滤波操作,就是整张图片在使用同一个卷积核内的参数,比如一个3×3×1的卷积核,这个卷积核9个参数被整张图共享,而不会因为图像内位置的不同而改变卷积核内的权系数,这大大减少了卷积核中的参数量,此外因为权值共享后意味着每个卷积和只能提取到一种特征,为了增加cnn的表达能力,当然需要多个核。 常见卷积操作和概念 1. upsample(向上采样) from torch . nn import functional as F # ( 1 , 16 , 14 , 14 ) - - > ( 1 , 16 , 28 , 28 ) out = F . interpolate ( x , scale_factor = 2 , mode = 'nearest' ) 2. pooling层(池化) 下采样:略 3. BatchNorm 目的:避免出现梯度离散的现象 操作:通过feature scaling将特征数据进行归一化缩放,对于[b,c,h,w]的batch数据,将生成[c]维的数据,可以用在image Normalization和Batch Normalization中 优点:收敛更快;更好的性能;更具有鲁棒性 算法步骤: