python机器学习

笔记 :归纳总结 (一)

孤街浪徒 提交于 2019-11-28 13:09:57
原文: http://blog.gqylpy.com/gqy/480 置顶:来自一名75后老程序员的武林秘籍——必读 (博主推荐) 来,先呈上武林秘籍链接: http://blog.gqylpy.com/gqy/401/ 你好,我是一名极客!一个 75 后的老工程师! 我将花两分钟,表述清楚我让你读这段文字的目的! 如果你看过武侠小说,你可以把这个经历理解为,你失足落入一个山洞遇到了一位垂暮的老者!而这位老者打算传你一套武功秘籍! 没错,我就是这个老者! 干研发 20 多年了!我也年轻过,奋斗过!我会画原理图,会画 PCB,会模拟,会数字!玩过 PLC,玩过单片机,会用汇编,会用 C!玩过 ARM,比如 PLC,STM32,和时下正在起飞的 NXP RT1052!搞过 DSP,比如 TMS320F28335!搞过 FPGA,不管 Xilinx 还是 Altera,也不管是 Verilog 还是 VHDL,或者直接画数字电路图!我懂嵌入式系统,比如 uCOS 和 Linux!我懂开源的硬件,比如 Arduino 和树莓派!我也搞软件,学了一堆上位机的语言C#,JAVA,Python,Kotlin,Swift!会写爬虫工具,又自学写APP,不管Android 还是 IOS! 可是这一切有什么用呢?土鸡瓦狗!不值一提!干技术的永远就是最苦逼的那个人! 我相信看到这里的你,应该是个 IT

机器学习的主要编程框架

ぃ、小莉子 提交于 2019-11-28 12:36:38
来源 :《暗知识-机器认知如何颠覆商业和社会》   TensorFlow是由谷歌大脑团队开发的,主要用于机器学习和深度神经网络的研究。2016年5月,谷歌从Torch(一种编程框架)转移到TensorFlow,这对其他编程框架造成了打击,特别是torch和theanoo许多人将TensorFlow描述成一个比theano更现代化的版本,吸取了这些年在新领域/技术的许多重要的经验教训。   TensorFlow以智能、灵活的方式而闻名,是一种高度可扩展的机器学习系统,使其更容易适应不同的新旧产品和研究,并且比较容易安装,还针对初学者提供了教程,涵盖神经网络的理论基础和实际应用。TensorFlow比theano和torch慢,但谷歌和开源社区正在解决这个问题。TensorBoard是TensorFlow的可视化模块,它提供了一个计算路径的直观视图。深度学习库Keras被移植到TensorFlow上运行,这意味着任何用Keras编写的模型现在都可以运行在TensorFlow上。最后,值得一提的是TensorFlow可以在各种硬件上运行,其特点如下: (1)GPU加速:支持 (2)语言/界面:Python、Numpy、C++ (3)平台:跨平台 (4)维护者:谷歌   theano起源于2007年在蒙特利尔大学的知名MILA(学习算法研究所),是用Python编写的CPU

对于机器学习初学者,三本书带你进入机器学习!

此生再无相见时 提交于 2019-11-28 09:43:32
人工智能包括机器学习、深度学习、神经网络,想要入行机器学习,这几本书籍可以带你进入机器学习: 机器学习导论:这本书系统全面,既可以自学又可以作为研究参圪,既道出了机器学习的前世今生,又展望了未来的发展,让道听途说的信息止于智者,本书主题包括贝叶斯分类器、近邻分类器、线性和多项式分类器、决策树、神经网络以及支持向量机。 图解机器学习:用丰富的图示,从最小二乘法出发,对基于最小二乘法实现的各种机器学习算法进行了详细的介绍。 机器学习实战:通过精心编排的实例,切入日常工作任务,摒弃学术化语言,利用高效的可复用Python代码来阐释如何处理统计数据,进行数据分析及可视化。 机器学习是人工智能研究领域中一个极其重要的研究方向,在现今的大数据时代背景下,捕获数据并从中萃取有价值的信息或模式,成为各行业求生存、谋发展的决定性手段,这使得分析师和数据科学家,越来越为人们所瞩目!   人工智能、大数据、云计算和物联网的未来发展值得重视,均为前沿产业,多智时代专注于人工智能和大数据的入门和科谱,在此为你推荐几篇优质好文: 1.四大机器学习编程语言对比:R、Python、MATLAB、Octave http://www.duozhishidai.com/article-16728-1.html 2.机器学习已经被广泛应用,但是入行机器学习主要难在哪里 http://www.duozhishidai

玩转Unity中的ML-Agents 机器学习(一):系统环境安装

我的梦境 提交于 2019-11-28 08:06:18
2018年4月17日更新-------------------------------------------------------- 目前github官方主页上ml-agents已有中文翻译,传送门是: https://github.com/Unity-Technologies/ml-agents/tree/master/docs/localized/zh-CN 2018年3月30日更新--------------------------------------------------------- 因为前不久,ML-Agents出了最新的0.3版本,而且内容也做出了较大的更新,现在对这篇环境安装的内容做出补充说明,原来的博文有些地方已经过时了。最佳的Windows环境安装教程以官方Github页面为准,传送门是在这里: https://github.com/Unity-Technologies/ml-agents/blob/master/docs/Installation-Windows.md 上面是windows用户安装环境的英文教程。此外,我会针对原来博客的部分内容作出修正补充: 1.原博客说用python3.5版本 和tensorflow1.3 版本,其实当前时间点(3月30日),最新的ml agent v0.3版本是支持到python3.6 和 tensorflow

当Python遇上AI(一)

我与影子孤独终老i 提交于 2019-11-28 07:28:35
Infi-chu: http://www.cnblogs.com/Infi-chu/ 一、什么是学习 如果要给学习下一个定义,那么根据某百科给出的定义是——学习,是指通过阅读、听讲、思考和实践等途径获得知识或技能的过程。 那么对于计算机而言,什么是学习呢?怎样可以使得机器也学会了学习?对于计算机而言,如果能够通过某个过程,就改变了它的性能,那么这个过程就称之为学习。 在计算机领域而言,学习的核心目的就是为了改善性能。 二、什么是机器学习 对于计算机系统而言,通过数据以及某种特定的方法来提升机器系统的性能,就是机器学习。 对于一个学习问题,我们要抓住三个特征: 任务的类型 衡量任务性能提升的标准 获取经验的来源 换种角度来定义的话,机器学习就是一个基于经验数据的函数估计问题。 虽说对于机器学习的定义颇多,但是相同之处在于,都强调了经验和数据的重要性,都认可机器学习提供了从数据中提取知识方法。 三、4象限 知识在2个维度上可以分为4类,即可以统计与不可统计2维度;可推理不可推理2维度,组合而成4类。 在横向坐标中,对于可推理的,可以通过机器学习的方法,最终完成推理; 在纵向坐标中,对于可统计的、但不可推理的,可以通过神经网络这种特定的机器学习方法,达到目的。 具体如下图所示: 四、什么是深度学习 首先要明确一个定律——麻烦守恒定律:麻烦不会减少,只会转移。

机器学习之用sklearn实现knn

醉酒当歌 提交于 2019-11-28 06:17:26
K近邻的详细算法,建议参考 李航老师的统计学习方法。下面是python3的代码 from sklearn.model_selection import train_test_split from sklearn.neighbors import KNeighborsClassifier import numpy as np data = [] with open ( 'E:\python 文件 \python 机器学习实践指南 /iris 数据 .txt' ) as txtData: lines = txtData.readlines() for line in lines: lineData = line.strip().split( ',' ) # 去除空白和逗号 “,” data.append(lineData) 虽然sklearn里面已经有iris的数据 ,但是我还是用python读取txt文件中的数据,因为数据的预处理往往要花费更多的时间以此方法来得到训练 data.pop( 0 ) # 删除花宽等文字 # print(data) arr = np.array(data) # 将列表转化成数组型 np.reshape(arr , - 1 , 5 ) # 把一行的数组转化成 n 行 5 列 # print(arr) iris_X = arr[: , : 4 ] #

机器学习—python+sklearn实现KNN&KD树算法

☆樱花仙子☆ 提交于 2019-11-28 06:16:33
python+sklearn实现KNN及KD树算法 from sklearn import datasets# 导入内置数据集模块 from sklearn.neighbors import KNeighborsClassifier# 导入sklearn.neighbors模块中KNN类 import numpy as np from sklearn.neighbors import KDTree#导入KD树类 np.random.seed(0)# 设置随机种子,不设置的话默认是按系统时间作为参数,因此每次调用随机模块时产生的随机数都不一样设置后每次产生的一样 iris = datasets.load_iris()# 导入鸢尾花的数据集,iris是一个类似于结构体的东西,内部有样本数据,如果是监督学习还有标签数据 iris_x = iris.data# 样本数据150*4二维数据,代表150个样本,每个样本4个属性分别为花瓣和花萼的长、宽 iris_y = iris.target# 长150的以为数组,样本数据的标签 indices = np.random.permutation(len(iris_x)) # permutation接收一个数作为参数(150),产生一个0-149一维数组,只不过是随机打乱的,当然她也可以接收一个一维数组作为参数,结果是直接对这个数组打乱 iris

【机器学习系列】之纯python及sklearn实现kNN

久未见 提交于 2019-11-28 06:14:56
作者:張張張張 github地址: https://github.com/zhanghekai 【转载请注明出处,谢谢!】 【机器学习系列】之k近邻(kNN) 【机器学习系列之】纯python及sklearn实现kNN 文章目录 一、纯python实现kNN Brute-Force法 kNN项目案例:优化约会网站的配对效果 二、sklearn实现kNN:KDTree和BallTree 一、纯python实现kNN Brute-Force法 kNN项目案例:优化约会网站的配对效果 项目概述 拉克丝使用约会网站寻找约会对象,经过一段时间之后,她发现曾交往过三种类型的人: 不喜欢的人 魅力一般的人 极具魅力的人 她希望: 工作日与魅力一般的人约会 周末与极具魅力的人约会 不喜欢的人则直接排除掉 现在她收集到了一些约会网站未曾记录的数据信息,这更有助于匹配对象的归类。拉克丝约会的对象主要包含以下3种特征: 每年获得的飞行常客里程数 玩视频游戏所耗时间百分比 每周消费的冰淇淋公升数 文本文件数据格式如下,完整数据集可在我的github中找到。 40920 8.326976 0.953952 3 14488 7.153469 1.673904 2 26052 1.441871 0.805124 1 75136 13.147394      0

Python机器学习之数据探索可视化库yellowbrick

时间秒杀一切 提交于 2019-11-28 00:45:33
# 背景介绍 从学sklearn时,除了算法的坎要过,还得学习matplotlib可视化,对我的实践应用而言,可视化更重要一些,然而matplotlib的易用性和美观性确实不敢恭维。陆续使用过plotly、seaborn,最终定格在了Bokeh,因为它可以与Flask完美的结合,数据看板的开发难度降低了很多。 前阵子看到这个库可以较为便捷的实现数据探索,今天得空打算学习一下。原本访问的是英文文档,结果发现已经有人在做汉化,虽然看起来也像是谷歌翻译的,本着拿来主义,少费点精力的精神,就半抄半学,还是发现了一些与文档不太一致的地方。 ```python # http://www.scikit-yb.org/zh/latest/quickstart.html # http://www.scikit-yb.org/en/latest/quickstart.html ``` ```python import pandas as pd data = pd.read_csv('data/bikeshare/bikeshare.csv') X = data[[ "season", "month", "hour", "holiday", "weekday", "workingday", "weather", "temp", "feelslike", "humidity", "windspeed" ]

Unity3D机器学习插件ML-Agents ToolKit(v0.5): 环境搭建和3DBallDemo运行

↘锁芯ラ 提交于 2019-11-27 23:09:46
前言: 由于项目需要,需要了解U3D的ML-Agents插件。预期目的有几点: ML-Agents的大致框架 各个部分的具体实现细节 在开始研究前,首先我要搭建实验环境,之后运行官方案例。 大致框架: ML-Agents是一个Unity3D的插件,其包含3个高级组件:学习环境,External Communicator,Python API。 学习环境:就是代理存在,并生活的地方。它可以小到是几个简单对象组成的模拟场景,大到可以是一个复杂场景的模拟。 Python API - 其中包含用于训练(学习某个行为或 policy)的 所有机器学习算法。请注意, 与学习环境不同,Python API 不是 Unity 的一部分,而是位于外部,并通过 External Communicator 与 Unity 进行通信。(ml-agents-master 中 ml-agents 就包含所有的策略算法) External Communicator:它将 Unity 环境与 Python API 连接起来。它位于 Unity 环境中。 每个学习环境包含有三个帮助组织场景的附加组件:Academy,Brain,Agent。 Agent - 它可以被附加到一个 Unity 游戏对象上(场景中的 任何角色),负责生成它的观测结果、执行它接收的动作 并适时分配奖励(正/负)。 每个 Agent 只与一个