回归模型

时间序列回归

余生长醉 提交于 2019-12-01 04:58:31
VAR模型针对平稳时间序列,VEC模型针对存在协整关系的非平稳时间序列 协整方程表示变量之间的长期均衡关系,它反映的是系统内部不同变量之间的均衡 来源: https://www.cnblogs.com/caiweijun/p/11656398.html

deep_learning_MNIST数据集

ぐ巨炮叔叔 提交于 2019-11-30 16:02:59
Code_link: https://pan.baidu.com/s/1dshQt57196fhh67F8nqWow 本文是为既没有机器学习基础也没了解过TensorFlow的码农、序媛们准备的。如果已经了解什么是MNIST和softmax回归本文也可以再次帮助你提升理解。在阅读之前,请先确保在合适的环境中安装了TensorFlow( windows安装请点这里 ,其他版本请官网找),适当编写文章中提到的例子能提升理解。 首先我们需要了解什么是“ MNIST ”? 每当我们学习一门新的语言时,所有的入门教程官方都会提供一个典型的例子——“Hello World”。而在机器学习中,入门的例子称之为MNIST。 MNIST是一个简单的视觉计算数据集,它是像下面这样手写的数字图片: 每张图片还额外有一个标签记录了图片上数字是几,例如上面几张图的标签就是:5、0、4、1。 本文将会展现如何训练一个模型来识别这些图片,最终实现模型对图片上的数字进行预测。 首先要明确,我们的目标并不是要训练一个能在实际应用中使用的模型,而是通过这个过程了解如何使用TensorFlow完成整个机器学习的过程。我们会从一个非常简单的模型开始——Softmax回归。 然后要明白,例子对应的源代码非常简单,所有值得关注的信息仅仅在三行代码中。然而,这对于理解TensorFlow如何工作以及机器学习的核心概念非常重要

名叫“重归”的分类器器

情到浓时终转凉″ 提交于 2019-11-30 05:53:08
名叫“重归”的分类器器 以前人们触碰了不不少带“重归”两字的优化算法,重归树,随机森林的重归,线性回归,无一例外。她们全是差别于分类算法们,用于解决理和预测分析连续型标识的优化算法。殊不知逻辑回归,是这种名叫“重归”的线形分类器器,其实质是由线性回归转变而成的,这种普遍应用于归类难题中的理论重归优化算法。要理理解逻辑回归究竟是从哪里而来的呢?,得要先从线性回归刚开始。线性回归是设备器学习培训中非常简单的的重归优化算法,对随意样版,它创作1个基本上每个人了解的式子: w 被通称为实体模型的主要参数,在其中 w0被称作截距(intercept), w1~ wn被称作指数(coefficient),这一表述 式,我觉得就和人们中小学时就极其了解的 y=ax+b是一样的特性。人们能够应用向量来表达这一式子, 在其中x和w 能够被看作是1个列向量,则有: 线性回归的每日任务,就是说结构1个预测分析涵数 来投射输⼊入的特点向量x和标识值y的线性相关,而结构预测分析涵数的关键就是说找到实体模型的主要参数:wT 和 w0,知名的最小二乘法就是说用于求出线性回归中主要参数的数学方法。 根据涵数 ,线性回归应用键入的特点向量X来輸出1组连续型的标识值y_pred,以进行各种各样预测分析连续型自变量量的每日任务(例如预测分析商品销售量量,预测分析股票价格这些)。那假如人们的标识是离开型自变量量

机器学习(四)——逻辑回归

久未见 提交于 2019-11-30 05:20:09
机器学习(四)——逻辑回归 文章目录 机器学习(四)——逻辑回归 关于分类问题 逻辑回归 隐含变量模型——probit回归 逻辑分布与sigmoid函数 逻辑回归 多分类问题 one-vs-all one-vs-one 多元逻辑回归 正则化 小结 关于分类问题 在前面的博文中,我介绍了线性回归、岭回归、Lasso回归三种回归模型,以及求解机器学习优化问题最重要、应用最广泛的优化算法——梯度下降法。接下来我们把目光投向另一类问题,也是更加广泛的问题—— 分类问题 。 在实际机器学习的应用领域中,我们更多地碰到的是这样的问题,我们通常需要预测的变量并不是连续的,而是离散的,举几个例子: 确定一封邮件是否为垃圾邮件;(这一类只有两个可能结果的问题被称为 二分类问题 ) 根据医学检测影像判断肿瘤是良性或者恶性; 预测一个产品属于优良中差中的哪一等;(这一类有多个可能结果的问题被称作 多分类问题 ) 对于这一类问题,回归模型往往起不到作用,这时我们就需要另一种模型—— 分类模型 。 逻辑回归 (Logistic Regression)就是一个非常经典的分类模型, 逻辑回归 我们以一个二分类的问题为例,讲解二元逻辑回归的基本原理。假设我们要分析一批学生在概率论与数理统计考试中能否及格。我们目前已经采集到了过去几届的人是否通过的数据,以及他们在大一时的各科成绩。我们希望能通过这些数据建立模型

从零开始构建逻辑回归模型

自闭症网瘾萝莉.ら 提交于 2019-11-30 04:32:10
逻辑回归模型是针对线性可分问题的一种易于实现而且性能优异的分类模型。我们将分别使用Numpy和TensorFlow实现逻辑回归模型训练和预测过程。 从零构建 首先,我们通过Numpy构建一个逻辑回归模型。 我们定义shape如下: \(X\) :(n,m) \(Y\) :(1,m) \(w\) :(n,1) \(b\) :(1) 其中 \(n\) 代表特征维数, \(m\) 代表样本个数。 对于逻辑回归二分类模型,其损失函数如下: \[ J(\theta)=-\frac{1}{m}\sum_{i=1}^N{[y_i\log{h_\theta(x_i)}+(1-y_i)\log{(1-h_\theta(x_i))}]} \] 对 \(\theta\) 求导得 \(\theta\) 的更新方式是: \[ \theta_j:= \theta_j-\alpha \frac{1}{m}\sum_{i=1}^m (h_\theta(x_i)-y_i)x_i^j \] 所以,在代码中, \(\theta\) 的更新方式为: dw = np.dot(X,(A-Y).T)/m 各个函数作用如下: sigmoid(x):激活函数实现 initialization(dim):零值初始化w以及b propagate(w,b,X,Y):前向传播得到梯度以及代价函数值 optimize(w,b,X,Y

scikit-learn代码实现SVM分类与SVR回归以及调参

你。 提交于 2019-11-30 04:28:21
分类 二分类: from sklearn.model_selection import train_test_split from sklearn.svm import SVC import mglearn.datasets import matplotlib.pyplot as plt #forge数据集是一个二维二分类数据集 X,y=mglearn.tools.make_handcrafted_dataset() X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.2, random_state=33) svm=SVC(kernel='rbf',C=10,gamma=0.1,probability=True).fit(X_train,y_train) print(svm.predict(X_test)) #输出分类概率 print(svm.predict_proba(X_test)) print(svm.score(X_test,y_test)) [0 0 1 1 1 0] [[0.91919503 0.08080497] [0.94703815 0.05296185] [0.04718756 0.95281244] [0.08991918 0.91008082] [0.18789225 0

携程面试

白昼怎懂夜的黑 提交于 2019-11-28 22:15:43
携程一面: 机器学习(现场) 1.介绍你自己,这里我把自己的兴趣点引入风控,然后讨论了一会。 2.你对风控有什么理解 3.风控模型有哪些 4.扣了会简历 5.机器学习算法会吗?会哪些? 6.手推下逻辑回归,逻辑回归是梯度下降还是上升? 7.手推下svm吧 8.了解GAN吗?讲一下 9.异常检测?处理无标签问题,有标签问题? 10.我讲了我自学的2个风控模型,挖掘了一下 11.你会自己改网络改损失建模吗?pytorch 12.讲下你的优点,缺点? 13.你有什么问题要问我的? 业务有啥,做啥? 应届生培养? 你觉得怎么去深入学习风控? 14.你平时是怎么解决问题的? 来源: https://www.cnblogs.com/ivyharding/p/11429635.html

热门数据挖掘模型应用入门(一): LASSO回归

喜夏-厌秋 提交于 2019-11-28 11:46:52
热门数据挖掘模型应用入门(一): LASSO回归 2016-10-10 20:46 作者简介: 侯澄钧,毕业于俄亥俄州立大学运筹学博士项目, 目前在美国从事个人保险产品(Personal Line)相关的数据分析,统计建模,产品算法优化方面的工作。 目录: 模型简介 线性回归 Logistic回归 Elstic Net模型家族简介 学习资料 1.模型简介 Kaggle网站 (https://www.kaggle.com/ )成立于2010年,是当下最流行的进行数据发掘和预测模型竞赛的在线平台。 与Kaggle合作的公司可以在网站上提出一个问题或者目标,同时提供相关数据,来自世界各地的计算机科学家、统计学家和建模爱好者,将受领任务,通过比较模型的某些性能参数,角逐出优胜者。 通过大量的比赛,一系列优秀的数据挖掘模型脱颖而出,受到广大建模者的认同,被普遍应用在各个领域。 在保险行业中用于拟合广义线性模型的LASSO回归就是其中之一。 LASSO回归的特点是在拟合广义线性模型的同时进行变量筛选(Variable Selection)和复杂度调整(Regularization)。 因此,不论目标因变量(dependent/response varaible)是连续的(continuous),还是二元或者多元离散的(discrete), 都可以用LASSO回归建模然后预测。

7天入门机器学习总结

人走茶凉 提交于 2019-11-28 09:44:39
初识机器学习 机器学习的概念 机器学习是一种从数据当中发现复杂规律,并且利用规律对未来时刻、未知状况进行预测和判定的方法。机器学习是一种从数据当中发现复杂规律,并且利用规律对未来时刻、未知状况进行预测和判定的方法。 机器学习的类型 按学习方式分为三大类 监督学习(Supervised learning):从给定的训练数据集(历史数据)中学习出一个函数,当新的数据到来时,可以根据这个函数预测结果。监督学习的训练集需要包括输入和输出,也可以说是特征和目标/Label。训练集中的目标是由人标注的。 非监督学习(Unsupervised learning):与监督学习相比,输入的数据没有人为标注的结果,模型需要对数据的结构和数值进行归纳。 强化学习(Reinforcement learning):输入数据可以刺激模型并且使模型做出反应。反馈不仅从监督学习的学习过程中得到,还从环境中的奖励或惩罚中得到。 机器学习的一般过程 机器学习是一个由数据建立模型的过程。 首先是对训练数据进行数据处理,选择算法进行建模和和评估,再对算法进行调优,最后得到一个模型。 数据处理到算法调优这个过程是一个不断完善、循环往复的过程,这个过程相当于做实验,直到得出一个在接受度范围内的模型,但是这个过程是可以被一些先验经验指导的,需要识别问题、识别场景、算法原理掌握等等。 机器学习中的数据处理 样本级数据处理

机器学习简介

我是研究僧i 提交于 2019-11-28 09:41:56
主要内容 • 机器学习的概念 • 机器学习主要分类 • 监督 学习 三要素 • 监督学习模型评估策略 • 监督学习模型求解算法 一、机器学习的概念 • 机器学习 是什么 • 机器学习的开端 • 机器学习的定义 • 机器学习的过程 • 机器学习示例 机器学习是什么 • 什么是学习 – 从人的学习说起 – 学习理论 ;从实践经验中 总结 – 在理论上推导;在实践中检验 – 通过各种手段获取知识或技能的过程 • 机器怎么学习? – 处理某个特定的任务,以大量的“经验”为基础 – 对任务完成的好坏,给予一定的评判标准 – 通过分析经验数据,任务完成得更好了 机器学习的定义 • 机器学习 (Machine Learning, ML) 主要研究 计算机系统 对于特定任务的性能, 逐步 进行 改善的算法和统计模型 。 • 通过输入海量训练数据对模型进行训练,使模型掌握数据所蕴含的潜在规律,进而对新输入的数据进行准确的分类或预测 。 • 是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸优化、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。 机器学习的过程 二 、机器学习的分类 • 机器学习的主要分类 • 无监督学习 • 无监督学习应用 • 监督学习 • 监督学习应用 机器学习主要分类 • 有监督学习