纯numpy 实现简易回归网络 (前向传递、反向传递、更新参数)

文章目录

代码

./utils.py
./main.py

运行截图

觉得好就点个赞吧~

代码

./utils.py

import numpy as np


def fc_forward(x, w, b):
    """z = x @ w + b

    全连接层(full connect)的前向传播"""
    assert w.shape[0] == x.shape[1]
    assert w.shape[1] == b.shape[0]
    return np.matmul(x, w) + b


def fc_backward(x, w, z_grad):
    """z = x @ w + b

    全连接层的反向传播"""
    # x @ w = z
    # -> z.shape = x.shape[0], z.shape[1]
    assert z_grad.shape[0] == x.shape[0]
    assert z_grad.shape[1] == w.shape[1]

    x_grad = z_grad @ w.T
    w_grad = x.T @ z_grad
    b_grad = np.mean(z_grad, 0)

    return x_grad, w_grad, b_grad


def relu_forward(z):
    """a = relu(z)

    relu前向传播"""
    return z * (z > 0)


def relu_backward(z, a_grad):
    """a = relu(z)

    relu反向传播"""
    return a_grad * (z > 0)


def mse(y_true, y_pred):
    """loss = np.mean((y_true - y_pred) ** 2, axis=-1)

    均方误差

    :param y_true: shape = (batch_size, class_num)
    :param y_pred: shape = (batch_size, class_num)
    :return: shape = (batch_size,)"""
    assert y_true.shape == y_pred.shape
    return np.mean((y_true - y_pred) ** 2, axis=-1)


def mse_grad(y_true, y_pred):
    """grad = d_loss/d_y_pred = 2 * (y_true - y_pred) * -y_pred

    :param y_true: shape = (batch_size, class_num)
    :param y_pred: shape = (batch_size, class_num)
    :return: shape = (batch_size, class_num)"""

    assert y_true.shape == y_pred.shape
    return 2 * (y_pred - y_true)

./main.py

import utils
import numpy as np

batch_size = 64
lr = 1e-3

# 1. 准备数据
np.random.seed(0)
x = np.random.randn(batch_size, 20)
true = np.random.randn(batch_size, 10)  # y_true

# 2. 初始化权重与偏置Q
w1 = np.random.randn(20, 100) * 0.1
w2 = np.random.randn(100, 10) * 0.1
b1 = np.zeros((100,))
b2 = np.zeros((10,))

for i in range(501):
    # 1. forward
    z = utils.fc_forward(x, w1, b1)  # (batch_size, 100)
    a = utils.relu_forward(z)  # (batch_size, 100)
    pred = utils.fc_forward(a, w2, b2)  # (batch_size, 10)

    # 2. loss
    loss = utils.mse(true, pred)  # (batch_size,)

    # 3. backward
    pred_grad = utils.mse_grad(true, pred)  # (batch_size, 10)
    a_grad, w2_grad, b2_grad = utils.fc_backward(a, w2, pred_grad)
    z_grad = utils.relu_backward(z, a_grad)  # (batch_size, 100)
    _, w1_grad, b1_grad = utils.fc_backward(x, w1, z_grad)

    # 4. update
    w1 -= lr * w1_grad  # (20, 100)
    w2 -= lr * w2_grad  # (100, 10)
    b1 -= lr * b1_grad  # (100,)
    b2 -= lr * b2_grad  # (10,)
    if i % 10 == 0:
        print(i, np.mean(loss))  # 500 2.3711536645661272e-05

运行截图

在这里插入图片描述

来源：CSDN

作者：努力学习计算机123

链接：https://blog.csdn.net/qq_40939814/article/details/104502068

标签

return

assert

纯numpy 实现 简易回归网络 (前向传递、反向传递、更新参数)

文章目录

代码

./utils.py

./main.py

运行截图

纯numpy 实现简易回归网络 (前向传递、反向传递、更新参数)