Pytorch | 易学教程

简介

torchvision是Pytorch的计算机视觉工具库，是Pytorch专门用于处理图像的库。

torchvision.models中包含了许多已经训练好的模型，可以通过models直接调用。
模型

torchvision.datasets中，包含了许多已经被处理过的图片数据集，可以通过datasets直接调用。
数据集

transforms模块提供了一般的图像预处理方法，例如

裁剪	作用
CenterCrop	从图像中心裁剪图像
RandomCrop	从图片中随即裁剪出给定尺寸的图片（可填充）
ResizedCrop	随即大小，长宽比剪裁图片
FiveCrop	在图片的四个角和中心各截取一幅尺寸为size的图片
TenCrop	在FiveCrop的基础上进行水平和垂直翻转，默认为水平翻转

图像处理	作用
Pad	对图片边缘进行填充
Resize	修改图像分辨率
ColorJitter	调整亮度，对比度，饱和度和色相
Grayscale	转换为灰度
RandomGrayscale	依概率转换为灰度图片
RandomAffine	对图像进行仿射变换（二维的线性变换），即旋转、平移、缩放、错切和翻转
RandomErasing	对图像进行随机遮挡
Normalize	逐channel的对图像进行标准化， output = (input - mean) / std
Lanbda	用户自定义Lambda方法
Totensor	转化为张量
LinearTransformation	对矩阵做线性变换，可以用于白化处理
ToPILImage	将ndarray或者张良转化为PIL Image类型数据