pytorch 图像中的数据预处理和批标准化实例
目前数据预处理最常见的方法就是中心化和标准化。
中心化相当于修正数据的中心位置,实现方法非常简单,就是在每个特征维度上减去对应的均值,最后得到0均值的特征。
标准化也非常简单,在数据变成0均值之后,为了使得不同的特征维度有着相同的规模,可以除以标准差近似为一个标准正态分布,也可以依据最大值和最小值将其转化为-1~1之间
批标准化:BN
在数据预处理的时候,我们尽量输入特征不相关且满足一个标准的正态分布,这样模型的表现一般也较好。但是对于很深的网路结构,网路的非线性层会使得输出的结果变得相关,且不再满足一个标准的N(0,1)的分布,甚至输出的中心已经发生了偏移,这对于模型的训练,特别是深层的模型训练非常的困难。
所以在2015年一篇论文提出了这个方法,批标准化,简而言之,就是对于每一层网络的输出,对其做一个归一化,使其服从标准的正态分布,这样后一层网络的输入也是一个标准的正态分布,所以能够比较好的进行训练,加快收敛速度。
batchnormalization的实现非常简单,接下来写一下对应的python代码:
importsys
sys.path.append('..')
importtorch
defsimple_batch_norm_1d(x,gamma,beta):
eps=1e-5
x_mean=torch.mean(x,dim=0,keepdim=True)#保留维度进行broadcast
x_var=torch.mean((x-x_mean)**2,dim=0,keepdim=True)
x_hat=(x-x_mean)/torch.sqrt(x_var+eps)
returngamma.view_as(x_mean)*x_hat+beta.view_as(x_mean)
x=torch.arange(15).view(5,3)
gamma=torch.ones(x.shape[1])
beta=torch.zeros(x.shape[1])
print('beforebn:')
print(x)
y=simple_batch_norm_1d(x,gamma,beta)
print('afterbn:')
print(y)
测试的时候该使用批标准化吗?
答案是肯定的,因为训练的时候使用了,而测试的时候不使用肯定会导致结果出现偏差,但是测试的时候如果只有一个数据集,那么均值不就是这个值,方差为0吗?这显然是随机的,所以测试的时候不能用测试的数据集去算均值和方差,而是用训练的时候算出的移动平均均值和方差去代替
下面我们实现以下能够区分训练状态和测试状态的批标准化方法
defbatch_norm_1d(x,gamma,beta,is_training,moving_mean,moving_var,moving_momentum=0.1): eps=1e-5 x_mean=torch.mean(x,dim=0,keepdim=True)#保留维度进行broadcast x_var=torch.mean((x-x_mean)**2,dim=0,keepdim=True) ifis_training: x_hat=(x-x_mean)/torch.sqrt(x_var+eps) moving_mean[:]=moving_momentum*moving_mean+(1.-moving_momentum)*x_mean moving_var[:]=moving_momentum*moving_var+(1.-moving_momentum)*x_var else: x_hat=(x-moving_mean)/torch.sqrt(moving_var+eps) returngamma.view_as(x_mean)*x_hat+beta.view_as(x_mean)
下面我们在卷积网络下试用一下批标准化看看效果
defdata_tf(x):
x=np.array(x,dtype='float32')/255
x=(x-0.5)/0.5#数据预处理,标准化
x=torch.from_numpy(x)
x=x.unsqueeze(0)
returnx
train_set=mnist.MNIST('./data',train=True,transform=data_tf,download=True)#重新载入数据集,申明定义的数据变换
test_set=mnist.MNIST('./data',train=False,transform=data_tf,download=True)
train_data=DataLoader(train_set,batch_size=64,shuffle=True)
test_data=DataLoader(test_set,batch_size=128,shuffle=False)
#使用批标准化
classconv_bn_net(nn.Module):
def__init__(self):
super(conv_bn_net,self).__init__()
self.stage1=nn.Sequential(
nn.Conv2d(1,6,3,padding=1),
nn.BatchNorm2d(6),
nn.ReLU(True),
nn.MaxPool2d(2,2),
nn.Conv2d(6,16,5),
nn.BatchNorm2d(16),
nn.ReLU(True),
nn.MaxPool2d(2,2)
)
self.classfy=nn.Linear(400,10)
defforward(self,x):
x=self.stage1(x)
x=x.view(x.shape[0],-1)
x=self.classfy(x)
returnx
net=conv_bn_net()
optimizer=torch.optim.SGD(net.parameters(),1e-1)#使用随机梯度下降,学习率0.1
train(net,train_data,test_data,5,optimizer,criterion)
以上这篇pytorch图像中的数据预处理和批标准化实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持毛票票。
声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:czq8825#qq.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
