python机器学习

机器学习:Jupyter Notebook入门

二次信任 提交于 2019-12-18 18:03:11
▌什么是 Jupyter Notebook? Jupyter Notebook 是一款开放源代码的 Web 应用程序,可让我们创建并共享代码和文档。 它提供了一个环境,你可以在其中记录代码,运行代码,查看结果,可视化数据并在查看输出结果。这些特性使其成为一款执行端到端数据科学工作流程的便捷工具 ,可以用于数据清理,统计建模,构建和训练机器学习模型,可视化数据以及许多其他用途。 当你还在构建项目原型时,Jupyter Notebooks 真的特别好用,因为你的代码是被写入独立的单元中并被单独执行的。这允许用户测试项目中的特定代码块,而无需从脚本的开始执行代码。许多其他的 IDE 环境(Integrated Development Environment, 集成开发环境)(如 RStudio )也以其他几种方式做到这一点,但我发现 Jupyter 的单个单元结构是最好的。 正如你在本文中将会看到的,这些 Notebooks 是数据科学家手中非常灵活、可交互和强大的工具。他们甚至允许你运行除 Python 以外的其他语言,比如 R 、SQL 等。由于它们比 IDE 平台更具交互性,因此它们被广泛地应用于教学场景。 ▌如何安装 Jupyter Notebook? 首先你需要在机器上安装 Python,Python 2.7或Python 3.3(或更高版本)都可以。 Anaconda

机器学习/深度学习-学习资料

江枫思渺然 提交于 2019-12-17 07:01:35
转自:https://blog.csdn.net/jinhuan_hit/article/details/81366873 1. 机器学习入门经典《统计学习方法》pdf下载 链接:https://pan.baidu.com/s/1o99BsV4 密码:b2ul 2. 周志华的《机器学习》pdf下载 链接:https://pan.baidu.com/s/1htFmlM0 密码:fx8y 3.《数学之美》吴军博士著pdf下载 链接:https://pan.baidu.com/s/1mjG0ZsW 密码:4wtq 4. Tensorflow 实战Google深度学习框架.pdf百度网盘下载链接 链接: http://pan.baidu.com/s/1boRz6Zt 5.《TensorFlow实战》黄文坚高清完整PDF 百度网盘下载链接 链接:https://pan.baidu.com/s/1hs3Z2ao 密码:qgn7 本书的大体框架以讲解demo为主,大部分时间都在讲解不同的demo,而这些demo基本都是来源于TensorFlow的开源实现https://github.com/tensorflow/models中的内容 6. 复旦大学邱希鹏老师编写的讲义《神经网络与深度学习》 链接:https://pan.baidu.com/s/1cORvonIs5XXFX1rKN91ptA 密码

机器学习入门路线和资源

邮差的信 提交于 2019-12-17 01:04:32
大家好: 这篇文章的目的是,给哪些基础不好、想入门机器学习但是没头绪、看了很多推荐学习路线后仍晕头转向、不知道怎么办的道友,我本人也是机器学习初学者,看了很多的经验贴,很多方式我都尝试过,现在我把最有效的入门学习路线分享给你,并且配套有一整套的学习资源,也就是说,你什么都不用做,只管学,按部就班的学即可,帮你节省了大量的时间,这可是我用心的分享哦,不会让你白白花几分钟读这篇文章的。(如有错别字、不足之处、建议还请一定帮我指出,十分感谢) 首先说明本篇文章主要结合了知乎高赞回答(参考但不限于此): https://zhuanlan.zhihu.com/p/29704017 更多内容可在知乎、csdn、github上搜索 我的个人情况: 基础不好,应届生,本科是软件工程的,但大学荒废了不少,19考研生,所以线性代数和高数基础还不错,但概率论几乎全忘了(因为没考这个 滑稽脸)。我在结合大佬们的推荐学习路线后,开始尝试自学了一段时间,现在我把我的个人体会和建议给你说一下,如果你还没有看上面的回答,可以不用看了,我会在这里给大家总结好: 关于机器学习的数学: 大部分是不推荐单独恶补这些知识的。首先说优点:单独学数学是很枯燥的,而且我是打算尽快入行的,没时间再花几个月去学概率论等数学知识,而且有些知识点机器学习中几乎用不到,至少前期用不到,所以不单独恶补数学可以大大的节省了时间;再说说缺点

ApacheCN 编程/大数据/数据科学/人工智能学习资源 2019.12

拜拜、爱过 提交于 2019-12-16 22:08:36
公告 我们的所有非技术内容和活动,从现在开始会使用 iBooker 这个名字。 “开源互助联盟”已终止,我们对此表示抱歉和遗憾。除非特地邀请,我们不再推广他人的任何项目。 公众号自动回复已更新,添加了“轻小说/知识星球”关键词。 我们近期将所有内容备份到 Gitee,欢迎访问 Gitee@ApacheCN 。 欢迎大家在我们平台上投放广告。如果你希望在我们的专栏、文档或邮件中投放广告,请准备好各种尺寸的图片和专属链接,联系咸鱼(1034616238)。 为了能够将开源事业做大做强, ApacheCN 需要与公益基金会(IT、教育类)合作 ,欢迎大家提供帮助。 如果你不希望再收到我们的邮件,请访问 notice.ibooker.org.cn 来退订。 特色项目 AILearning - 机器学习实战 文字教程 教学版视频 讨论版视频 Interview:简历指南 + LeetCode + Kaggle 计算机公开课推荐 Kaggle 学习系列视频 简历分享系列视频 AI 路线图(知识树) Machine Learning Mastery 博客文章翻译 PyTorch 0.2/0.3/0.4/1.0 中文文档和教程 数据科学比赛收集平台 斯坦福 DS/AI 系列笔记 斯坦福 CS229 机器学习中文笔记 DeepLearning.ai 深度学习中文笔记 斯坦福 CS224n

花了三个月终于把所有的 Python 库全部整理了!可以说很全面了

允我心安 提交于 2019-12-16 14:02:11
库名称简介 Chardet字符编码探测器,可以自动检测文本、网页、xml的编码。 colorama主要用来给文本添加各种颜色,并且非常简单易用。 Prettytable主要用于在终端或浏览器端构建格式化的输出。 difflib,[Python]标准库,计算文本差异 Levenshtein,快速计算字符串相似度。 fuzzywuzzy,字符串模糊匹配。 esmre,正则表达式的加速器。 shortuuid,一组简洁URL/UUID函数库。 ftfy,Unicode文本工具7 unidecode,ascii和Unicode文本转换函数。 xpinyin,将汉字转换为拼音的函数库 pangu.py,调整对中日韩文字当中的字母、数字间距。 pyfiglet,Python写的figlet程序,使用字符组成ASCII艺术图片 uniout,提取字符串中可读写的字符 awesome slugify,一个Python slugify库,用于处理Unicode。 python-slugify,转换Unicode为ASCII内码的slugify函数库。 unicode-slugify,生成unicode内码,Django的依赖包。 ply,Python版的lex和yacc的解析工具 phonenumbers,解析电话号码,格式,存储和验证的国际电话号码。 python-user-agents

机器学习之交易欺诈检测

醉酒当歌 提交于 2019-12-14 14:09:45
电商领域,交易欺诈的例子已多如牛毛,每年有非常多人受到欺诈带来的经济损害。作为电商企业,如何利用沉淀的订单数据,与机器学习相结合,提前检测交易是否有欺诈行为,从事前或事中就及时阻断交易动作,从而保障用户的使用安全,大幅度减少欺诈带来的损害是一直追求的目标。本文以简单数据特征为切入点,其目的是希望大家可直观了解核心思想,方便读者使用到自身的领域中,起到抛砖引玉效果(比如:电信、电购等)。业界所采用的方法会比文中所讲内容复杂的多。 一、特征元素选择 针对交易欺诈,本文从7个特征来表征,即4个原始数据特征及3个付款方式的编码特征。 4个原始数据特征包括:1.从第一笔交易时间与注册账号的时间差;2.购买次数;3.购买时间;4.付款方式添加时间与交易的时间差。 3个付款方式特征:1.信用卡(creditcard);2.支付宝(alipay);3.花呗(huabei)。 特征选择需要花费大量时间与精力,我们可以通过建设训练与评分流程,可利用逻辑回归、SVM、决策树确定相对特征的重要性。冗余的特征会降低模型的质量,高度相关特征可能会导致米线决策的不稳定,如果特征数据量大于数据点会出现过渡拟合问题,如果数据特征量太少会出现欠拟合问题。 二、功能实现 基础环境 本文基于python实现,所以读者需要具备python环境。 sklearn及pandas提供的类。 交易数据语料库,具体数据语料如下:

专题八.多线程编程之thread和threading

家住魔仙堡 提交于 2019-12-14 11:25:43
https://blog.csdn.net/Eastmount/article/details/50155353 有几个知识点是非常重要的,包括:面向对象的思想、如何架构一个项目、设计模式来具体解决问题、应用机器学习和深度学习的方法,当然也包括我这篇文章的内容——多线程和并行化处理数据。 这篇文章主要是参考Wesley J. Chun的《Python核心编程(第二版)》书籍多线程部分,并结合我以前的一些实例进行简单分析。尤其是在大数据、Hadoop\Spark、分布式开发流行的今天,这些基础同样很重要。希望对你有所帮助吧! PS:推荐大家阅读《Python核心编程》和《Python基础教程》两本书~ 强推: http://www.cnblogs.com/huxi/archive/2010/06/26/1765808.html 一. 线程和进程的概念 二. Python线程和全局解释器锁 三. thread模块 来源: https://www.cnblogs.com/chenhuan123/p/12038440.html

从负无穷学习机器学习(一)

我的梦境 提交于 2019-12-14 11:09:19
适逢双十一,买了一本名为《深入浅出Python机器学习》的书,作者生动描述机器学习的原理,爱了!ヾ(◍°∇°◍)ノ゙ 一、基础必需的库 (一)、numpy——基础科学计算库 import numpy #基础科学计算库 i = numpy . array ( [ [ 1 , 2 , 3 ] , [ 4 , 5 , 6 ] ] ) #为i赋值一个数组 print ( "i:\n{}" . format ( i ) ) #输出数组i (二)、scipy——科学计算工具集 import numpy as np from scipy import sparse matrix = np . eye ( 3 ) #创建一个3阶对角阵 sparse_matrix = sparse . csr_matrix ( matrix ) #把np数组转化成CSR格式的Scipy稀疏矩阵(sparse matrix) #sparse函数只会存储非0元素 print ( "对角矩阵:\n {}" . format ( matrix ) ) #打印数组 print ( "\n sparse matrix:\n{}" . format ( sparse_matrix ) ) #上下两矩阵进行对比 (三)、pandas——数据分析 #导入数据分析工具 import pandas data = { "Name" : [

为什么机器学习会选择Python语言?

六眼飞鱼酱① 提交于 2019-12-13 22:38:26
  说起编程语言,在众多编程语言之中想必Python的知名度是非常高的,凭借简洁优雅、容易上手的优势,广受大家的喜欢,也成为了进入IT行业的首选编程语言。   尤其是随着人工智能的兴起,也推动了Python的发展,目前所有做人工智能的公司基本都采用Python语言,整体情况来说,在人工智能领域中Python的趋势是非常不错的,那么为什么机器学习会选择Python语言呢?为大家详细的介绍一下吧。   首先,Python程序语言与机器学习可以说是互相成就,在机器学习领域可以发挥出更好的作用。   1、方便调试的解释型编程语言:Python是一门非常不错的解释型编程语言,源代码可以通过一个解释器直接转换为特殊字节码,Python解释型可以更好的处理这些代码,方便了整体的调试过程,特别适合应用于不同机器学习模型进行开发。   2、Python可以跨平台执行作业:只有一个平台安装有用于运行这些字节码虚拟器,那么Python就可以执行跨平台作业。这方面跟C语言不是很相似,跟Java语言比较类似,机器学习任务需要在多种平台上进行使用,因此Python具有这种特质,所以也成为了机器学习领域的首选。   3、具有广泛的编程接口:Python语言除了应用在自动开发所使用的第三方程序库意外,业内还有不少著名的公司都应用在科学研究和商业的云平台上

什么是人工智能?很多人至今仍然不知道AI是什么!

左心房为你撑大大i 提交于 2019-12-12 15:53:59
【推荐】2019 Java 开发者跳槽指南.pdf(吐血整理) >>> 具有执行感知功能(例如感知,学习,推理和解决问题)的能力的机器被认为拥有人工智能。当机器具有认知能力时,就会存在人工智能。 判断AI的基准是涉及推理、语音和视觉是否接近或达到人类水平。 一、入门人工智能 弱AI(Narrow AI): 当机器可以比人类更好地执行特定任务时。 通用AI(General AI): 人工智能可以以与人类相同的精度水平执行任何智力任务时达到通用状态。 强AI(Strong AI): 当AI在许多任务中都能击败人类时,它就是强AI。 如今,人工智能已在几乎所有行业中使用,为所有大规模集成人工智能的公司提供了技术优势。麦肯锡认为,与其他分析技术相比,人工智能有潜力创造6000亿美元的零售价值,为银行业带来50%的增量价值。在运输和物流领域,潜在收入增长了89%以上。 具体来说,如果企业将AI用于其营销团队,则可以使平凡而又重复性的任务自动化,从而使销售代表可以专注于诸如建立关系,培养领导等任务。企业可以使用AI分析和推荐来制定制胜战略。 简而言之,人工智能提供了一种尖端技术来处理人类无法处理的复杂数据。 AI将多余的工作自动化,使工人可以专注于高水平的增值任务。大规模实施AI可以降低成本并增加收入。 二、人工智能简史 如今,人工智能已成为流行语,尽管这个术语并不新鲜。 1956年