Jupyter Notebook

你的生产型ML复现不了,可能是工作流程出了问题

坚强是说给别人听的谎言 提交于 2020-10-20 11:14:19
  选自maiot blog    作者:Benedikt Koller    机器之心编译    编辑:Panda、张倩       在机器学习社区,越来越多的人开始讨论研究的可复现性,但这些讨论大部分局限于学术环境。如何确保生产环境的ML可复现?近日,机器学习开发服务提供商 maiot.io 的 CTO Benedikt Koller 发布一篇博客文章,介绍了他基于自身经验总结的开发可复现生产级机器学习所要注意的 12 个要素。   过去二十年来,我们对软件开发的理解有了大幅提升。其中一大部分原因是 DevOps 概念的出现及其在软件开发行业的广泛应用。   领先的软件公司都遵循着同样的模式:首先是在软件开发过程中快速迭代,然后进行持续集成、持续交付、持续部署。每个特性都要经过测试,看其提供价值的能力如何,而且软件始终要处于就绪的状态,并且通过自动化方法进行部署。   机器学习这个领域虽不同于传统的软件开发,但我们也能从软件开发行业汲取很多实用的经验教训。过去几年里,我们一直在开发生产型机器学习项目。我们的目标并不只是概念验证,而是与软件开发一样的可复现能力(reproducibility)。因此,我们构建了一套流程协调器、强大的自动化能力并建立了一套用于实现该目标的工作流程。   为什么不直接使用 Jupyter Notebook

别再折腾开发环境了,一劳永逸的搭建方法

跟風遠走 提交于 2020-10-14 18:48:29
点击上方 “ AI算法与图像处理 ”,选择加"星标"或“置顶” 重磅干货,第一时间送达 来源:Jack Cui 网上教程五花八门,读者吐槽最多的,也都是怎么搭建开发环境。 对于小白来说,开发环境搭建,是必过的 第一关 。 记得自己刚学 Python ,还是小白的时候,最爱做的一件事就是: 折腾开发环境 。 代码还没写几行,就各种折腾,走了太多弯路,浪费了太多时间。 IDE 我也折腾了个遍,Eclipse、Pycharm、Sublime Text 等等。 折腾了几周,代码不会写啥,最后也就来个「Hello World」。 作为工作时长两年的「算法搬砖工」,今天给「未来的大牛,如今的小白」们讲一下,开发环境怎么搭建。 以后要是有朋友问你环境搭建问题, 文章直接发给他 ,告诉他,这篇教程真的香! 1 环境搭建 我们都知道,Python 是一种脚本语言,有着丰富的 第三方库 。 Python 自带了很多 官方库 ,可以直接用,例如 re、os、math 等等。 但第三方库是需要我们自己安装的。 就好比,一个正常人,一生下来,自带了眼镜、鼻子、嘴巴等,这就是“官方库”。 你要是想买个漂亮衣服,做个漂亮发型,那得自己“安装”,这就是“第三方库”。 Python 提供了超级多,而且强大的第三方库。 我们搭建开发环境,就是让 Python 具备各式各样的能力,以满足我们的需求。

从零开始玩人工智能—语音API-03

核能气质少年 提交于 2020-10-08 02:25:43
还在担心自己的英语发音不标准?请个外教教发音太贵?有语音认知服务还要啥自行车啊~ 既然放音和录音我们都尝试过了,那么来一个更有难度的实验吧。 发音评估 实际上,语音转文本的服务中,提供了一个发音评估参数。利用这个参数,就能够对发送的语音进行发音评估。很有趣吧?我们看看 Speech-to-Text REST API 是怎么说明的。 要实现发音评估功能,只需简单在提交语音转文本请求的时候,在头部header中添加 'Pronunciation-Assessment' 这个字段即可。该字段指定用于在识别结果中显示发音评分的参数,这些参数可评估语音输入的发音质量,并显示准确性、熟练、完整性等。此参数是 base64 编码的 json,其中包含多个详细参数。 和前面的内容一样,我们首先做些准备工作,首先把代码环境设置好。 import requests import pyaudio, wave import os, json, base64 from xml.etree import ElementTree # constents for WAV file CHUNK = 1024 FORMAT = pyaudio.paInt16 CHANNELS = 1 RATE = 16000 RECORD_SECONDS = 5 # speech service information

关于jupyter notebook 使用tensorflow-gpu 2.0版本 安装及测试 关于cuda以及chdnn的pip安装

≡放荡痞女 提交于 2020-10-05 08:14:31
小编电脑显卡GEFORCE RTX2060 tensorflow目前的版本支持的是cuda10.0 首先配置tensorflow-gpu,是需要独立显卡的,小编刚配置的时候也是踩了非常多的坑。下面把正确的步骤非大家分享一下,也是比较简单。 step1:使用win+R 输入CMD打开命令窗口; step2:输入conda install cudatoolkit=10.0.130 step3:输入conda install cudnn=7.6.0 上述三步安装完成及配置好了jupyter notebook 使用tensorflow-gpu 2.0的环境。 注意:在使用这三步之前电脑已经安装好了tensorflow-gpu版本,以及anconda。 第一次发帖,有什么问题可以在下方留言。看到会及时回复。 来源: oschina 链接: https://my.oschina.net/u/4312354/blog/4659817

MindSpore!这款刚刚开源的深度学习框架我爱了!

时光毁灭记忆、已成空白 提交于 2020-10-03 01:53:29
【摘要】 本文主要通过两个实际应用案例:一是基于本地 Jupyter Notebook 的 MNIST 手写数据识别;二是基于华为云服务器的 CIFAR-10 图像分类,对开源框架 MindSpore 进行介绍。 犹记得今年的华为开发者大会 HDC 2020 上,一直受人瞩目的深度学习框架 MindSpore 终于开源了。 我之前一直关注 MindSpore,还是挺期待的。MindSpore 是一款支持端、边、云独立/协同的统一训练和推理框架。与 TensorFlow、PyTorch 等流行深度学习框架对标,MindSpore 旨在大幅度降低 AI 应用开发门槛,让人工智能无处不在。 MindSpore 最大的特点就是开发门槛大大降低,提高开发效率,这样可以显著减少模型开发时间。 因此,使用MindSpore的优势可以总结为以下四点: ●简单的开发体验 ●灵活的调试模式 ●充分发挥硬件潜能 ●全场景快速部署 既然开源了,那就赶紧上手,试一试这款开源的 MindSpore 怎么样!本文我将介绍 MindSpore 的安装和上手教程,通过一个简单的图像识别案例来跑完整个 AI 训练和测试流程。 一、MindSpore 的安装 开源框架 MindSpore 的安装方法有很多,可以在 Windows、Ubuntu 上安装,也可以在华为 Ascend 910 上安装

利用 Python 进行数据分析(Python 数据分析)· 第 2 版

↘锁芯ラ 提交于 2020-10-01 03:13:14
译者: SeanCheney 欢迎任何人参与和完善:一个人可以走的很快,但是一群人却可以走的更远。 ApacheCN 机器学习交流群 629470233 ApacheCN 学习资源 Sklearn 与 TensorFlow 机器学习实用指南 在线阅读 PDF格式 EPUB格式 MOBI格式 代码仓库 下载本书代码(本书GitHub地址): https://github.com/wesm/pydata-book (建议把代码下载下来之后,安装好Anaconda 3.6,在目录文件夹中用Jupyter notebook打开) 本书是2017年10月20号正式出版的,和第1版的不同之处有: 包括Python教程内的所有代码升级为Python 3.6(第1版使用的是Python 2.7) 更新了Anaconda和其它包的Python安装方法 更新了Pandas为2017最新版 新增了一章,关于更高级的Pandas工具,外加一些tips 简要介绍了使用StatsModels和scikit-learn 对有些内容进行了重新排版。(译者注1:最大的改变是把第1版附录中的Python教程,单列成了现在的第2章和第3章,并且进行了扩充。可以说,本书第2版对新手更为友好了!) (译者注2:毫无疑问,本书是学习Python数据分析最好的参考书。本来想把书名直接译为《Python数据分析》,这样更简短

Python技巧总结(持续更新)

对着背影说爱祢 提交于 2020-09-30 09:52:03
在这篇文章中,我会列举一些平常会用到的Python技巧和Python工具包,持续更新,建议收藏! 1.整理字符串输入 整理用户输入的问题在编程过程中极为常见。通常情况下,将字符转换为小写或大写就够了,有时你可以使用正则表达式模块「Regex」完成这项工作。但是如果问题很复杂,可能有更好的方法来解决: user_input = "This string has some whitespaces... " character_map = { ord( ) : , ord( ) : , ord( ) : None } user_input.translate(character_map) # This string has some whitespaces... 在本例中,你可以看到空格符「 n」和「 t」都被替换成了单个空格,「 r」都被删掉了。这只是个很简单的例子,我们可以更进一步,使用「unicodedata」程序包生成大型重映射表,并使用其中的「combining()」进行生成和映射。 2.迭代器切片(Slice) 如果对迭代器进行切片操作,会返回一个「TypeError」,提示生成器对象没有下标,但是我们可以用一个简单的方案来解决这个问题: import itertools s = itertools.islice(range(50), 10, 20) # <itertools

太赞了!《Python知识手册》更新到v2.2版

*爱你&永不变心* 提交于 2020-09-27 16:47:36
“种一棵树,最好的时间是十年前,其次是现在。” 一、前言 大家好,今天给大家推荐我的一位好朋友,公众号「Python数据之道」号主 Lemon 。 从 2017 年开始,Lemon 陆陆续续在公众号「Python数据之道」写了些 Python 相关的内容,并且逐步整理形成一本小册子,名曰《Python知识手册》。 二、手册内容 2019 年 2 月,「Python数据之道」发布了《Python知识手册》的第一个版本(v2018版)。 2020 年 5 月 ,《Python知识手册》更新到 V2.2 版,手册的页数从 365 页增加到 440 多页,从内容方面来看,增加了部分 Python 基础知识、Plotly 相关的内容、Python学习资料以及修订了第一版的部分内容。 手册 V2.2 的封面如下: 虽然 Lemon 写了一些关于 Python 零基础入门的文章,但《Python知识手册》 并没有比较完整的覆盖 Python 的基础知识。因此,针对手册的阅读,各位读者最好有一些 Python 的基本功底。 当前版本中,知识手册主要包含以下几方面相关的内容: Python基础知识 Jupyter Notebook Numpy Pandas Matplotlib Seaborn Bokeh Plotly 若干个项目实战案例 Python学习资料 手册的部分页面如下: 三、如何获取

python可视化(案例)高颜值图的复现(学术论文、商业周刊)

强颜欢笑 提交于 2020-09-25 11:30:57
前文的两个案例虽用的都是虚拟数据集,但都有一定的针对性,案例 水果分类(香蕉、苹果大战) 中,讨论了一个分类问题,并对散点图、直方图、箱线图和等比例子图的应用做了探讨;案例 多元线性回归 中,讨论了一个回归问题,并对散点图能最大限度可视化数据的维度做了探讨;以上案例涉及算法的部分,如有难度,可自行忽略,因为本系列主要是针对可视化的,案例的目的是为了赋予一个场景,方便对可视化内容的直观理解。 本文通过复现1张学术论文图及3张商业周刊图,加深对面积图、折线图、填充图等绘图对象及不等比例子图、栅格子图合并内容的理解。 涉及到的绘图对象传送门: 折线图、面积图、填充图 涉及到的子图内容传送门: 不等比例栅格子图 子图对象(坐标轴、刻度、轴标题)设置 本文的运行环境为 jupyter notebook python版本为3.7 本文所用到的库包括 % matplotlib inline from matplotlib . ticker import AutoMinorLocator from matplotlib . gridspec import GridSpec import matplotlib . pyplot as plt import pandas as pd import numpy as np 复现图表简介 案例一来源于一篇学术论文: 参考文献 PRABHU T S,

VS Code运行Jupyter报错

孤者浪人 提交于 2020-09-25 11:00:21
问题描述: 今天在电脑中安装了Python3.8.5环境,然后使用pip安装了ipython和jupyter,没想到在VS Code中使用Jupyter Notebook一直有问题,一直报一个错误:“Unable to start session for kernel Python 3.8.5 64-bit . Select another kernel to launch with.” 同时VS Code中Jupyter Server的状态也一直是busy 原因分析: 一开始百思不得其解,直接运行jupyter notebook是正常的,后来在github的vscode python插件讨论区找到了答案。 原地址如下: https://github.com/microsoft/vscode-python/issues/13701 这里在自己的博客中也记录下,是因为traitlets 这个包升级的原因,traitlets 在2020.9.1升级到了5.0版本,可以在 https://pypi.org/project/traitlets/#history 查看traitlets的版本: 解决方案: 根据github中大佬们的指引,将traitlets这个包的版本降回到4.3.3解决 python3 -m pip install traitlets==4.3.3 --force