1.导入需要用到的包:
import tensorflow as tf
import matplotlib as mpl
import matplotlib.pyplot as plt
import numpy as np
import sklearn
import pandas as pd
import os
import sys
import time
from tensorflow import keras
2.导入数据集
从库中导入全部数据集和测试集,并将全部数据集分成验证集和训练集,其中训练集有5000个,测试集10000个,训练集55000个
fashion_mnist=keras.datasets.fashion_mnist
(x_train_all,y_train_all),(x_test,y_test)=fashion_mnist.load_data()
x_valid,x_train=x_train_all[:5000],x_train_all[5000:]#验证集5000个
y_valid,y_train=y_train_all[:5000],y_train_all[5000:]
#打印训练集,测试集,验证集维度
#print(x_train.shape,y_train.shape)
##print(x_valid.shape,y_valid.shape)
#print(x_test.shape,y_test.shape)
#打印一张照片
def show_single_image(img_arr):
plt.imshow(img_arr,cmap='binary')
plt.show()
show_single_image(x_train[1])
3.建立模型
Sequential 模型结构: 层(layers)的线性堆栈。简单来说,它是一个简单的线性结构,没有多余分支,是多个网络层的堆叠。
#模型建立
model=keras.models.Sequential()
model.add(keras.layers.Flatten(input_shape=[28,28]))
model.add(keras.layers.Dense(300,activation='relu'))
model.add(keras.layers.Dense(100,activation='relu'))
model.add(keras.layers.Dense(10,activation='softmax'))#softmax 将向量变成概率分布
4.模型编译和训练
如果 targets 是 one-hot 编码,用 categorical_crossentropy
one-hot 编码:[0, 0, 1], [1, 0, 0], [0, 1, 0]
如果tagets 是 数字编码 ,用 sparse_categorical_crossentropy
数字编码:2, 0, 1
#编译模型
model.compile(loss='sparse_categorical_crossentropy',
optimizer='adam',
metrics=['accuracy'])
#print(model.layers)
#print(model.summary())
#训练模型
history=model.fit(x_train,y_train,epochs=10,
validation_data=(x_valid,y_valid))
5.画图显示训练过程及结果
#绘图观察训练过程和结果
def plot_learning_curves(history):
pd.DataFrame(history.history).plot(figsize=(8,5))#history.history是字典
plt.grid=(True)
plt.gca().set_ylim(0,1)#设置y轴坐标范围
plt.show()
plot_learning_curves(history)
loss,val_loss下降
accuracy,val_accuracy上升
来源:CSDN
作者:让时间来沉淀吧
链接:https://blog.csdn.net/qq_34488912/article/details/103792595