python机器学习

线性回归 - 机器学习多元线性回归 - 一步一步详解 - Python代码实现

风流意气都作罢 提交于 2019-11-26 15:33:31
目录 数据导入 单变量线性回归 绘制散点图 相关系数R 拆分训练集和测试集 多变量线性回归 数据检验(判断是否可以做线性回归) 训练线性回归模型 先甩几个典型的线性回归的模型,帮助大家捡起那些年被忘记的数学。 ● 单变量线性回归: h(x)=theta0 + theta1* x 1 ● 多变量线性回归: h(x)=theta0 + theta1* x 1 + theta2* x 2 + theta3* x 3 ● 多项式回归: h(x)=theta0 + theta1* x 1 + theta2* (x2^2) + theta3* (x3^3) 多项式回归始终还是线性回归,你可以令x2=x2^2,x3=x3^3,简单的数据处理一下就好了,这样上述多项式回归的模型就变成多变量线性回归的模型了。 数据导入 下面我们要开始用数据说话了,先来看看数据源是什么样子吧。 import pandas as pd import numpy as np import matplotlib.pyplot as plt from pandas import DataFrame,Series from sklearn.cross_validation import train_test_split from sklearn.linear_model import LinearRegression

【机器学习算法应用和学习_5_杂篇】5.2 Python常用函数汇总

橙三吉。 提交于 2019-11-26 14:09:05
一、背景   在写Python代码时通常有一些场景需要一些简单的函数实现,但这些函数也不是那么需要在基础篇看,因为其实help一下就知道怎么用了。但看英文的help文档总是费劲的,所以就在杂篇系列里开一篇汇总相关内容,碰到一个总结一个,便于后续直接搜函数名就可以快速回顾。 二、常用函数/类 1.enumerate enumerate(iterable[, start]) 内建类,参数是一个可迭代的对象(通常是列表),返回迭代对象的索引和值。 for pairidx, pair in enumerate([[0, 1], [0, 2], [0, 3], [1, 2], [1, 3], [2, 3]]): print(pairidx,'-', pair) --------------------- 0 - [0, 1] 1 - [0, 2] 2 - [0, 3] 3 - [1, 2] 4 - [1, 3] 5 - [2, 3] View Code 来源: https://www.cnblogs.com/everda/p/11323413.html

【校招面经】机器学习与数据挖掘常见面试题整理 part3

房东的猫 提交于 2019-11-26 13:05:37
四十一、请简要说说EM算法 有时候因为样本的产生和隐含变量有关(隐含变量是不能观察的),而求模型的参数时一般采用最大似然估计,由于含有了隐含变量,所以对似然函数参数求导是求不出来的,这时可以采用EM算法来求模型的参数的(对应模型参数个数可能有多个),EM算法一般分为2步:   E步:选取一组参数,求出在该参数下隐含变量的条件概率值;   M步:结合E步求出的隐含变量条件概率,求出似然函数下界函数(本质上是某个期望函数)的最大值。   重复上面2步直至收敛。作者:史兴 链接: https://www.zhihu.com/question/27976634/answer/39132183 理论: 简版:猜(E-step),反思(M-step),重复; 啰嗦版: 你知道一些东西(观察的到的数据), 你不知道一些东西(观察不到的),你很好奇,想知道点那些不了解的东西。怎么办呢,你就根据一些假设(parameter)先猜(E-step),把那些不知道的东西都猜出来,假装你全都知道了; 然后有了这些猜出来的数据,你反思一下,更新一下你的假设(parameter), 让你观察到的数据更加可能(Maximize likelihood; M-stemp); 然后再猜,在反思,最后,你就得到了一个可以解释整个数据的假设了。 1. 注意,你猜的时候,要尽可能的猜遍所有情况,然后求期望(Expected)

机器学习、计算机视觉面经整理(持续完善整理中……)

强颜欢笑 提交于 2019-11-26 12:58:40
算法岗计算机视觉方向 求职经验总结 进入11月份,楼主找工作也基本进入尾声了,从7月份开始关注牛客网,在求职的过程中学到了不少,感谢牛客提供这样一个平台,让自己的求职历程不再孤单。 先说一下楼主教育背景,本科西部末流985,研究生调剂到帝都某文科学校.专业都是CS专业,求职方向都是计算机视觉算法。有某外企以及二线互联网实习经历,本科虽然CS出身,但实际动手能力并不强。研究生的研究方向并不是计算机视觉方向。实习的时候开始接触计算机视觉,自己比较感兴趣,开始转CV方向。回想这几个月的求职经历,其中的辛苦只有自己知道。最终拿到了 百度SP ,京东SSP,美团无人驾驶SP,顺丰科技SP,拼多多SP,以及虹软SP,思科,中电29等offer。 想把我学习与求职路上的一些心得告诉学弟学妹们。 1. 一定要有一门自己比较熟悉的语言。 我由于使用C++ 比较多,所以简历上只写了C++。C++的特性要了解,C++11要了解一些,还有STL。面试中常遇到的一些问题,手写代码实现一个string类,手写代码实现智能指针类,以及STL中的容器的实现机制,多态和继承,构造函数, 析构函数等。推荐看一下 网易云课堂翁恺老师 的C++ 的视频以及经典的几本书。 2.一定要刷题 楼主主要刷了 剑指offer 以及leetcode上的easy,middle的题目。如果编程能力不是很强,推荐可以分类型进行刷题

总结和翻译机器学习和计算机视觉类资料的博客 ( 在微博上看到的)

雨燕双飞 提交于 2019-11-26 12:06:58
[置顶]说明 2015年05月25日 之前在csdn写博客,可是csdn经常进不去,所以转战博客园,,就用了一键博客搬家功能,只搬过来66篇,其中 Python2.3-原理之语句和语法 和 Python2.5-原理之模块 是手动搬过来的。估计版面格式也不太好看,欢迎收看csdn的博客:http://blog.csdn.net/shouhuxianjian 按照时间排序,在2015年5月25号之前的博客都来自csdn。 :) 2015年06月23日 今天早上发现发布在csdn上的博文居然莫名其妙的没了,昨天点击了发布,也看到了审核通过,结果今早发现完全没了,也就是找不回了。在2015年6月23日之前的博文都是csdn上搬到博客园的,所以格式会有问题,可以看csdn上的对应的文章。至于: 1、格式问题,好懒,等有空再弄吧 2、翻译问题,等自己第二次看到博文的时候在接着改,这些都是第一次翻译过来的,所以语句不是很通顺,也就是“信、达、雅”,自认为没完全做到,等第二次修改吧。 2015年8月31日 因为csdn博客发布系统有所改善,而且已经习惯了csdn的后台,所以其实博客园是备份,而csdn才是一直在的地方. 感谢您的关注并提出建议和意见! 多人交流才能够促进知识的成长,人类发展正是基于群体性智慧而不是靠个人的闭门造车就能够搞定的. 博文导航: Hinton的CSC321课程(完结

windows下安装docker

|▌冷眼眸甩不掉的悲伤 提交于 2019-11-26 07:00:43
Windows10家庭版: 下载 docker toolbox 进入 Toolbox Releases 选择DockerToolbox-19.03.1.exe下载安装 Windows专业版及其他: 下载 Desktop on Windows 详细步骤见: https://blog.csdn.net/vitaair/article/details/80894890 注意 使用使用阿里云的加速器的时候,出现以下情况: 速度超慢,于是本人就使用迅雷下载,好几个小时才下下来,把前面那个boot2docker.iso文件替换了。 需要docker toolbox和boot2docker.iso资源可以直接给我留言Email ———————————————————————————————————————————— 微信关注号: python爬虫机器学习深度学习 来源: CSDN 作者: 龙血战神p 链接: https://blog.csdn.net/qq_39498924/article/details/103240778

机器学习.2

余生长醉 提交于 2019-11-26 00:29:48
手写knn算法: 在看knn算法之前,先去简单学习了一下python的使用,简单了解了一下python相关知识,发现python序列与c++里的数组有一定的差别, 一、python学习。 列表、元组、字符串支持双向索引,第一个元素下标为0,第二个元素下标为1,以此类推;最后一个元素下标为-1,倒数第二个元素下标为-2,以此类推。 字符串:索引运算符[ i ]得到下标为i的字符,切片运算符[ i : j]得到从下标i到下标j-1的子串第一个字符索引为 0,最后一个字符索引为-1加号(+)用于字符串连接运算,星号(*)用于字符串复制。 列表:索引运算符[ i ]得到下标为i的元素,切片运算符[ i : j]得到从下标i到下标j-1的子集,第一个元素索引为 0,最后一个元素索引为-1。 列表常用方法: 二、学习手写knn算法 首先: iris = datasets.load_iris() x = iris.data y = iris.target x_train,x_test,y_train,y_test = train_test_split(x,y,random_state=2003) 这里我们导入的数据集叫做iris数据集 x_train,x_test,y_train,y_test = train_test_split(x,y,random_state=2003)

将机器学习框架与 Amazon SageMaker 结合使用

若如初见. 提交于 2019-11-25 23:22:03
Amazon SageMaker Python 开发工具包提供了开源 API 和容器,使您可在 Amazon SageMaker 中,轻松使用多种不同的机器学习和深度学习框架来训练和部署模型。有关 Amazon SageMaker Python 开发工具包的一般信息,请参阅 https://github.com/aws/sagemaker-python-sdk 。有关在 Amazon SageMaker 中使用特定框架的信息,请参阅以下主题: 主题 将 Apache Spark 与 Amazon SageMaker 结合使用 将 TensorFlow 与 Amazon SageMaker 结合使用 将 Apache MXNet 与 Amazon SageMaker 结合使用 将 Scikit-learn 与 Amazon SageMaker 结合使用 将 PyTorch 与 Amazon SageMaker 结合使用 将 Chainer 与 Amazon SageMaker 结合使用 使用 SparkML Serving 与 Amazon SageMaker 来源: https://www.cnblogs.com/cloudrivers/p/11931024.html