深度学习

如何舒服地在图书馆用ipad入门深度学习【windows jupyter远程】

╄→гoц情女王★ 提交于 2020-09-25 07:05:48
目录 前言 选择 与 特点 实现过程 jupyter远程: 蒲公英组网: bat文件,一键激活环境 效果展示 过程中遇到的问题 改进方向 最后,感谢您的阅读,如果能从您这里再收获点建议就更好了。 前言 小伙伴们中有考研的、考法考的,预定好暑假一起去图书馆学习,互相监督, 目前我的任务是入门python 以及 深度学习,这肯定需要电脑。 我的游戏本,算上适配器好几斤重,去图书馆几天就受不了 (省图书馆有插座但很难抢到座位,市图书馆有座位没插座,没电源不管是笔记本还是surface几小时就得gg,更别提性能了)。 树莓派也试过,用ipad vnc控制 画面延迟实在难以忍受。就算勉强用来入门,万一后面模型大点树莓派那点算力还是拙荆见肘,同理也不打算采购地平线的开发板(麻烦,穷,而且教材上的框架能不能跑起来还是个问题)。 我的老ipad重量轻,可用充电宝供电,但是无法直接编程。 想来想家里才装的台式机2070super( win10 )不拿来用属实有些心痛(买前生产力,买后打游戏), 所以我需要一个办法,让我在图书馆内用ipad就能入门深度学习,最好还有很强的算力。 #此方案可能考虑不周,请抱着娱乐的心态观看,欢迎一切建议 选择 与 特点 经过调查本地编写、远程运行的常见方式有三种:code-server , remote-ssh , jupyter 远程,其特点大致如下: 方式 优点

基于SRAM的方法可加速AI推理

我们两清 提交于 2020-09-24 17:38:35
一种新颖的深度学习加速器。专用单元定义了一个 SRAM ,该单元可以处理矩阵乘法,量化,存储以及推理处理器所需的其他工作。 在Spice仿真中,当使用8位整数数学识别手写数字时,该设计可提供100兆次操作/秒/瓦(TOPS / W)。它的计算密度可以击败Google的TPU一个数量级。 该设计是使用内存中计算方法的加速器产品线中最新的一种。设计使用40纳米NOR闪存单元的深度学习处理器,其目标是为监视摄像机等设备使用低功耗芯片。 设计时使用了很少的模拟电路,因此可以扩展到精细的工艺节点。它可能成为低功耗处理器中引擎(从边缘到云)的引擎。 独特的方式操纵SRAM单元以处理深度学习任务 这个设计使用户可以为从权重到神经网络层甚至单个神经元的所有内容创建自定义参数。这种灵活性可以使将来设计用于训练处理器的设计成为可能。但是尚无用于对该设计进行编程的软件堆栈,可能会在以后解决或留给将来的客户使用. 来源: oschina 链接: https://my.oschina.net/u/4381476/blog/4599785

不会拒绝,就等于不会做工作。拒绝不合理要求的五个关键

北城余情 提交于 2020-09-24 07:28:17
王小军是一个Mr Ok Boy。他在办公室里熟人最多,大家都乐于找他办事,搬水桶啊、演节目啊、修电脑啊,忙的不亦乐乎。他总是说:“Ok!Ok!”就欣欣然答应别人了,很少拒绝。他的领导每次安排工作给他,他也是“OK!Ok!”然后不管能不能干,自己加班到半夜,拼命的干。不会的就自己上网买《21天精通深度学习》刻苦钻研。结果经常因为干得杂事太多,工作延期,还天天被领导嫌弃交货的质量差。小军很委屈:“真是的,事都是你们安排的,我那么努力了,为什么还要埋怨我???” 因为你不会拒绝,干的太杂,质量不高啊,亲! 警惕! 不合理要求的五大外貌 第一,非本职工作的事。 比如男生搬东西、修电脑、换饮水机。女生打印资料、陪吃饭、陪唱歌。如果是自己的项目有需要,可以考虑帮助做一下,毕竟“干活是本分”吗,工作需要的就干。但是我干这一次不代表我是干这个的人。什么我都干了,要物业、IT、行政干什么、要公关部门干什么。新人特别容易犯一个错误:以为干的越多越好。实际上,本职工作干的越多越好才对。 第二,不合流程的事。 逾越流程,不向领导请示,跨部门跨级别下命令,这种事理本身就不合理。公司的运作靠的是制度不是情面,要做事情,就正正规规的走流程。该请示请示,该汇报汇报,该哪一级别领导批准就让领导批。新人们常常碍于面子,畏惧老油条,不敢提要求。新人们还惧怕流程,以为只要做完就没事了,审批可以省去。结果出了问题的时候

蘑菇街首页推荐视频流——增量学习与wide&deepFM实践(工程+算法)

随声附和 提交于 2020-09-24 06:03:10
欢迎关注我的公众号: 『诗品算法』 禁止一切未经本人 @ 琦琦许可的转载 一、楔子 害,写个这么严肃的技术话题还需要楔子么?这不是让大家放松一下嘛!毕竟是我的处女作,还是要来个看似一本正经的开场白和自我介绍的。 大家好,我是混迹于奋斗X之都——杭州的互联网大龄脱发女程序员一枚,大家可以关注我的公众号: “诗品算法” 。我会尽量保持每个月甚至每周更新一次的频率,在此立证(更新慢你也不能打我,只能用唾沫星子淹死我了哈哈)。 下面进入正题,带你领略蘑菇街有(坎)趣(坷)的从0到1的增量学习历程。 二、背景 在online deep learning炒得尤其火热的今天,我们知道,实时性就是互联网的生命和活力所在。笔者前几天跟一个阿里的朋友吃饭,朋友说,ODL现在是他们组最容易出成果的方向,众人愕然,ODL?哪篇论文里的?随即一拍大腿,原来是deep online learning。。。 试想,如果你刷抖音时,平台捕获到了你最近偏好旅行的即时兴趣,随即在很短时间内给你推荐了旅行相关的内容,你是不是会持续嗑药般地滑动下去?从而产生了心理学中所谓的无限“心流”,但我并不推崇这种类似沉迷游戏般的"心流",这种带有引号的“心流”仅仅是感官的愉悦,与精神的满足与自我的成就感无关,与至高的纯粹的甘美的快乐无关,与灵魂真正的安宁与幸福更是无关,因这并不会让你获得实质性的进步。扯远了

【OCR技术系列之四】基于深度学习的文字识别(3755个汉字)

余生长醉 提交于 2020-09-24 06:00:46
上一篇提到文字数据集的合成,现在我们手头上已经得到了3755个汉字(一级字库)的印刷体图像数据集,我们可以利用它们进行接下来的3755个汉字的识别系统的搭建。用深度学习做文字识别,用的网络当然是CNN,那具体使用哪个经典网络?VGG?RESNET?还是其他?我想了下,越深的网络训练得到的模型应该会更好,但是想到训练的难度以及以后线上部署时预测的速度,我觉得首先建立一个比较浅的网络(基于LeNet的改进)做基本的文字识别,然后再根据项目需求,再尝试其他的网络结构。这次任务所使用的深度学习框架是强大的Tensorflow。 网络搭建 第一步当然是搭建网络和计算图 其实文字识别就是一个多分类任务,比如这个3755文字识别就是3755个类别的分类任务。我们定义的网络非常简单,基本就是LeNet的改进版,值得注意的是我们加入了batch normalization。另外我们的损失函数选择sparse_softmax_cross_entropy_with_logits,优化器选择了Adam,学习率设为0.1 #network: conv2d->max_pool2d->conv2d->max_pool2d->conv2d->max_pool2d->conv2d->conv2d->max_pool2d->fully_connected->fully_connected def build

百万年薪,等您挑战!招聘认知智能天才!

偶尔善良 提交于 2020-09-23 22:56:12
第一:公司简介 杭州道翰天琼智能科技有限公司是一家认知智能科技公司。其主要方向是 认知智能理论,认知智能技术以及认知智能产品体系。用最先进的认知智能技术体系,推动技术升级,推动市场升级,产业升级,推动认知智能以及新一代智能时代的的到来。同时响应国 家2030科技计划。公司在认知智能领域已经取得多项重大突破。同时让更多业内人士共享认知智能体系 ,助力企业腾飞。欢迎顶尖认知智能人才加入! 第二:招聘职位 认知智能工程师(天才型) 第三:职位要求 1:精通古今中外哲学体系:包含但不限于易经,道德经,程朱理学,王阳明心学,存在论,本体论,认知论等哲学思想体系。 2:精通脑科学,对大脑结构,功能,机制等有深入研究,并且对宇宙,信息,大脑三者关系有深入研究。 3:精通心理学,认知发展论,结构主义,联结主义,行为主义,逻辑学,情感学,认知科学,符号学,语言学,形式语言学,认知语言学,色彩学等相关学科,并且有很强的交叉学科研究能力以及技术转化能力。 4:精通信息论,计算机科学,数学,物理学等学科。 5:精通人工智能相关体系包含但不限于机器学习,深度学习,各类算法,机器视觉,自然语言处理,语音识别,语音生成,图谱,多模态,机器人大脑等体系。 6:极强的编程能力,精通四种以上编程语言,有10年以上编程经验,主导过复杂大型高难度系统的研发。 7:有独创性开拓性突破性思想体系,包含但不限于现有人工智能

阿里云ECS云服务器通用型g6和g5的区别以及选择建议

微笑、不失礼 提交于 2020-08-20 09:03:56
阿里云ECS云服务器通用型g6和g5的区别以及选择建议 阿里云ECS云服务器通用型g6和通用型g5实例有什么区别?通用型g5和g6都是用于性能均衡场景,CPU内存比都是1:4,本文来说说通用型g6和通用型g5的区别以及选择方法:官方文档: 云服务器ECS共享标准型S6实例 ECS云服务器通用型g6和通用型g5有什么区别? 顾名思义,通用型g6是通用型g5的升级版,ECS云服务器通用型g6是第六代云服务器,性能全面提升的同时价格有所下调,如何选择?云E优站长博客建议选择通用型g6实例。 通用型g6云服务器是阿里云的第六代云服务器,第六代云服务器是基于第二代Intel至强可扩展处理器,睿频从上一代2.7Ghz提升到3.2Ghz,E2E计算性能有3-15%的提升;支持vnni指令集,对于深度学习的推理场景有2-4倍性能提升;虚拟化优化性能抖动,ping flood延时超过1ms的报文数<1/100万。 通用型g6和通用型g5区别对比表 综上,阿里云ECS云服务器通用型g6是通用型g5的升级版,性能有所提升,如何选择?新手站长网还是建议性价比放在第一位,虽然通用型g6是g5的升级版,但是通用型g5的性能也不差,如果通用型g5拥有更优惠的折扣,通用型g5也是可以选择的。 来源: oschina 链接: https://my.oschina.net/u/4353713/blog/4282833

百度架构师深度学习课程 00 预习

允我心安 提交于 2020-08-20 08:56:41
一、作业一: ** 飞代码运行成功截图 ** ####请在下面cell中上传飞桨安装成功的截图#### 安装教程可参考:https://www.paddlepad dle.org.cn/documentation/docs/zh/install/index_cn.htm 1.查看python版本 python - - version 2.检查 Python 对应的 pip 的版本,确认是 9.0.1+ python - m ensurepip python - m pip - - version 3.执行命令安装 python - m pip install paddlepaddle - i https : // mirror . baidu . com / pypi / simple #或 python - m pip install paddlepaddle - i https : // pypi . tuna . tsinghua . edu . cn / simple 4.验证 再ipython中输入 import paddle.fluid ,再输入 paddle.fluid.install_check.run_check() 。 如果出现 Your Paddle Fluid is installed successfully! ,说明您已成功安装。 5.上传截图 启动AI

AI辅助,数据标注行业发展的新引擎丨曼孚科技

狂风中的少年 提交于 2020-08-20 08:55:55
人工智能是研究如何通过机器来模拟人类认知能力的科学,目前人工智能应用最广泛的计算机视觉与语音交互依赖于监督学习下的深度学习方式,而监督学习下的深度学习算法训练则十分依赖人工标注数据。 相关数据显示,目前一个新研发的计算机视觉算法需要上万张到数十万张不等的标注图片训练,新功能的开发需要近万张标注图片训练,而定期优化算法也有上千张图片的需求。 这些海量训练数据集的背后是无数标注员共同努力的成果,正如著名科幻作家刘慈欣所言,“现在的人工智能,前面有多少智能后面就有多少人工。” 不过,随着人工智能落地进程的加快,这种过于依赖人力的方式也暴露出很多弊端。 首先,AI商业化对数据标注行业提出了新的要求,想要更加契合落地需求、解决垂直场景具体痛点,还需要海量且优质的标注数据做支撑,这在无形中增加了数据服务供应商的管理以及人力成本。 此外,数据需求量的提升对服务商的交付能力也提出了新的要求,容易造成项目延期等连锁反应。 为了解决这些问题,通过在数据标注以及质检的环节中应用AI辅助,进行人机协作,可以有效提高标注效率,充分发挥AI对于数据标注行业的反哺作用。 1.AI预标注 在语音转写类标注项目中,数据标注员需要仔细聆听每一个词语的发音,判断并转写其语义,这对于标注员的听写能力以及在长时间多任务下的专注力有着极高要求。 通过在此环节应用AI辅助,对语音数据进行语音识别

阿里天池文本分类竞赛task1: 赛题理解

纵饮孤独 提交于 2020-08-20 08:20:04
一.比赛背景 在本次Datawhale的竞赛当中,我们有一个具有20w条训练集,5w条测试集的数据集。整个数据集里面包含了各种分类不同的文本,每一个文本在训练集里都进行了标注label,这个label能够让我们知道训练集里面的句子是属于哪一个类别的数据。本次竞赛的文本分类一共有14个类别的数据,分别是:财经,彩票,房产,家居,教育,科技,社会,时尚,时政,体育,星座,游戏和娱乐。那么我们来看看数据集长啥样: 其中,在数据集中标签的对应的关系如下:{'科技': 0, '股票': 1, '体育': 2, '娱乐': 3, '时政': 4, '社会': 5, '教育': 6, '财经': 7, '家居': 8, '游戏': 9, '房产': 10, '时尚': 11, '彩票': 12, '星座': 13}。这个数据集我们打开只会看到我们text的数据,而不会看到每一条text所对应的label,这是因为在csv文件当中标注的label是不会显示出来的,我们需要将其使用pandas进行读入,然后再通过dataframe来查看这个文件,就可以看到训练集数据的label了! 二.测评指标 在本次比赛当中我们使用了f1_score的测评指标,什么是f1_scrore呢?我们来看看它的定义: 相当于f1_score就是精确率和召回率的一个调和均值,这个算法和物理当中求解电阻的方法非常相似