作业1——机器学习概述

时光怂恿深爱的人放手 提交于 2020-04-05 17:56:00

本周任务:

一、python基础的准备

1)安装好Python开发环境, PyCharm 或 Anaconda等都可以,按个人习惯喜好。

 

 

 

 

 

 

 

2)基本库的安装,如numpy、pandas、scipy、matplotlib

 

 

 

二、本周视频学习内容:https://www.bilibili.com/video/BV1Tb411H7uC?p=1

1)P4 Python基础

 

2)P1 机器学习概论

概念:机器学习是AI的一个分支,设计一个计算机系统,根据提供的数据按一定方式学习,随着训练次数增加,可以在性能上不断学习和改进,通过参数优化学习模型。

分类:机器学习包括有监督学习,无监督学习和增强学习(9’38

有监督学习——通过已有数据对(x,y)判断新数据(x)y值。

·例子:儿童经过多次训练学到月亮这个概念,之后能够判断某事物是否为月亮。

无监督学习——判断不完全独立的数据之间的关系,p(x)p(y)p(xy)。(聚类)

·例子:词库经过训练组合得到新词,根据词语组合的概率得到新词。

作用:1)清洗数据/特征选择;2)确定算法模型/参数优化;3)结果预测 (21’00

×】大数据存储/并行计算/机器人

 

【区别】做某些规则时采用传统算法;运用某些规则则是机器学习

 

多元线性回归模型:构建一个根据多个影响因素预测到的值无限接近实际值的模型。

 

无限迭代使得损失函数(目标函数)最低,模型达到最优。

 

机器学习的一般流程:数据收集数据清洗→特征工程(特征选择、调参)→数据建模→预测(37’39

【注】清洗和特征工程实际工作量较大

机器学习方法:

1)利用各种算法对数据进行分类

Linear SVM / RBF SVM / Decision Tree / Naive Bayes / Linear Discrimination / QDA / AdaBoast / Random Forest

2)采用不同的可延展的配置文件训练模型

3)适当调整损失函数使预测数据达到最优

4)设计模型的大小适应不同设备

 

泰勒公式——预测ex的值 / 考察Gini系数的图像(梯度下降法)

Γ函数   

凸函数  

 

 

Soft-max 回归

 

古典概型——生日悖论 / 装箱问题 → 熵(混乱程度的反映——决策树、随机森林)

3.作业要求:

1)贴上Python环境及pip list截图,了解一下大家的准备情况。暂不具备开发条件的请说明原因及打算。

2)贴上视频学习笔记,要求真实,不要抄袭,可以手写拍照。

3)什么是机器学习,有哪些分类?结合案例,写出你的理解。

 

 

 

二维数组直接采用Unique去重会先将二维数组变成一维数组再进行去重,不符合需求。故方法一:转换为虚数再进行去重。

 

方法二:将二维数组转化为元组再放入集合中

 

堆叠np.stack(),根据axis不同堆叠效果不同。

矩阵乘法

对应元素相乘

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!