CART算法
CART算法可以用来解决分类与回归问题。CART假设决策树是二叉树,内部节点的取值为“是”或者“否”,左边的分支取值为“是”分支,右边的分支取值为“否”分支。CART算法采用gini系数来进行特征的选择与划分。 import cv2 import time import logging import numpy as np import pandas as pd from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score import os import struct total_class = 10 # 这里选用了一个比较小的数据集,因为过大的数据集会导致栈溢出 # 二值化 def binaryzation(img): cv_img = img.astype(np.uint8) cv2.threshold(cv_img, 50, 1, cv2.THRESH_BINARY_INV, cv_img) return cv_img #@log def binaryzation_features(trainset): features = [] for img in trainset: img = np.reshape(img, (28, 28)) cv