python手写图片识别MNIST
MNIST(Modified National Institute of Standards and Technology) MNIST被称作是计算机视觉的新手村,相当于神经网络CNN版的helloword,也是TensorFlow的初体验。提供的数据集是28*28的灰度矩阵,要分析并识别出对应原来手写图片的数字。 载入数据集 train = pd.read_csv('./input/train.csv') test = pd.read_csv('./input/test.csv') 训练集数字总览 # 数字出现总数求和,柱状图 g = sns.countplot(Y_train) plt.show() 各个数字出现的总数大致相等,没有极端情况 原始数据处理 因为训练集是28*28的灰度矩阵,取值范围是0-255的整数,数字越大对应的像素点越暗,因此/255转化成float X_train = X_train / 255.0 test = test / 255.0 X_train = X_train.values.reshape(-1, 28, 28, 1) test = test.values.reshape(-1, 28, 28, 1) Y_train = to_categorical(Y_train, num_classes=10) CNN建模 因为训练集是28