深度学习

2020年前端技术栈 (送给努力学习通往一线大厂的同学们)

别说谁变了你拦得住时间么 提交于 2020-08-15 21:53:53
本人前端工作10年,结合了常见的"前端技术栈"文章,另外加上我在实际工作的经验(尤其是腾讯、字节跳动工作),汇总而成得到本文的前端技术栈。 在一般技术栈基础上,我标记了4种颜色,分别代表初级入门、工程师、资深工程师、高级工程师的技能要求。 这个划分,不直接对等某个公司的职级,只是我个人的一个简单划分,算是对一些刚入行的朋友的学习路线建议。 我的划分理由大概是这样的: 1.初级入门,只需要认识基本的语法、学会某个框架(例如vue),然后跟着公司项目照葫芦画瓢即可; 2.工程师,已经是团队中的熟练工,已经不需要跟别人做,需要对前端项目有整体的认识,能自行搭建一个新的小型项目架构,解决一些难题。此时需要对webpack、计算机基础都有更多认识,而且对编程思想有一些个人的见解; 3.资深工程师,除了工程师的理论知识和普适性技能外,对某个领域分支应该有丰富的实践经验,例如客户端兼容性、Nodejs高性能服务、动画类开发等; 4.高级工程师,一般是团队中的骨干,能带头分析业务的各种难题,包括需求实现的难题和性能优化难题,尤其是性能优化。这需要对所有知识点除了广度外,还要有针对性的深度学习和实践,给项目带来实际性的优化。 XMIND源文件,请到Github下载: https://github.com/kenkozheng/HTML5_research/tree/master

Tensroflow练习,包括强化学习、推荐系统、nlp等

不问归期 提交于 2020-08-15 18:58:28
向AI转型的程序员都关注了这个号 👇👇👇 机器学习AI算法工程 公众号:datayx 代码和数据集 获取: 关注微信公众号 datayx 然后回复 tf 即可获取。 AI项目体验地址 https://loveai.tech 目录 1、基础 TensorFlow基础知识点总结 用tensorboard来看看我们的网络流吧 使用dropout来避免过拟合吧 使用Tensorflow实现第一个神经网络吧! 实现CNN对mnist手写数字分类 2、自然语言相关 使用简单的RNN观测数字中的规律 更进一步,使用LSTM实现对手写数字识别 简单的Seq2Seq实现作对联 使用Seq2Seq+attention model实现简单的Chatbot 3、强化学习相关 实战深度强化学习DQN-理论和实践 DQN三大改进(一)-Double DQN DQN三大改进(二)-Prioritised replay DQN三大改进(三)-Dueling Network 深度强化学习-Policy Gradient基本实现 深度强化学习-Actor-Critic算法原理和实现 深度强化学习-DDPG算法原理和实现 Pointer-network理论及tensorflow实战 探秘多智能体强化学习-MADDPG算法原理及简单实现 4、推荐系统 推荐系统遇上深度学习(一)--FM模型理论和实践 推荐系统遇上深度学习

订单少落地难:被误解的人工智能

被刻印的时光 ゝ 提交于 2020-08-15 18:33:29
云栖号资讯:【 点击查看更多行业资讯 】 在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 文 | 特约观察员 顾夏辉 安涛 编辑 | 刘子晴 人工智能落地现状 2020年人工智能依然是一个非常热的话题。中美的科技巨头以及很多跨国企业都把人工智能作为其战略发展的重要布局,国家层面也出台政策重点发展人工智能产业。2019年,中国人工智能专利申请量排行世界第一,累计申请量44万余件,中国已超过美国成为人工智能领域专利申请量最高的国家。 但是与公众关注和各方支持的力度相比,人工智能技术的落地速度并没有达到人们的预期。目前人工智能集中于新零售、智能制造、智慧农业、医疗健康、智慧城市、营销和教育等产业,超过50%的赋能实体为安防。预计到2022年,人工智能赋能实体经济仅能达1600亿。对于40万亿的市场而言,人工智能还远远没有落地。 如何才能加快人工智能的落地速度?在这个问题之前,首先要明确人工智能技术是否重要、重要到什么程度。 人工智能带给我们的是什么? 一句话,科技带给人类发展的核心是对资源的优化。 蒸汽机的出现,使机器代替了手工劳动,一部分人从重复劳动解放出来,转为管理、运营和科研工作;电力的出现,推动企业间竞争的加剧,促进生产和资本的集中,产生了垄断;互联网的出现,使得人们节省大量获得信息的资源,整合企业的管理和策略工作。 如果人类想继续进行对资源和成本优化

神经网络数学基础-香浓信息量、信息熵、交叉熵、相对熵(KL散度)

て烟熏妆下的殇ゞ 提交于 2020-08-15 15:47:19
香浓信息量 这里以连续随机变量的情况为例。设 为随机变量X的概率分布,即 为随机变量 在 处的概率密度函数值,随机变量 在 处的香农信息量定义为: 这时香农信息量的单位为比特,香农信息量用于刻画 消除随机变量在处的不确定性所需的信息量的大小 。 如果非连续型随机变量,则为某一具体随机事件的概率。 为什么是这么一个表达式呢?想具体了解的可以参考如下的讨论: 知乎-香农的信息论究竟牛在哪里? 香农信息量_weixinhum-CSDN博客 信息熵 由香农信息量可以知,对于一个已知概率的事件,需要多少的数据量能完整地把它表达清楚。 信息熵则刻画的是,对于整个系统而言,表达系统整体所需要的信息量。比如,dddLdddYdddXddd 这段字母,虽然 L、Y 和 X 的香农信息量比较大,但他们出现的次数明显要比 d 少很多,因此需要信息熵来评估整体系统的信息量。 信息熵=事件香农信息量×事件概率 对于连续随机变量,信息熵 可表示为: 对于离散随机变量,信息熵 可表示为: 注意: 前面在说明的时候 log 是以 2 为底的,但是一般情况下在神经网络中,默认以指数 为底,这样算出来的香农信息量虽然不是最小的可用于完整表示事件的比特数,但对于信息熵的含义来说是区别不大的。其实只要这个底数是大于 1 的,都能用来表达信息熵的大小。 举例如下: zbbbb 的信息熵为: zrcdf 的信息熵为:

是选择Keras还是PyTorch开始你的深度学习之旅呢?

左心房为你撑大大i 提交于 2020-08-15 15:25:46
点击上方“ 算法猿的成长 “, 关注公众号,选择加“星标“或“置顶” 总第 135 篇文章,本文大约 7000 字,阅读大约需要 20 分钟 原文:https://medium.com/@karan_jakhar/keras-vs-pytorch-dilemma-dc434e5b5ae0 作者:Karan Jakhar 前言 上一篇 2020年计算机视觉学习指南 介绍了两种深度学习框架--Keras 和 PyTorch ,这篇文章的作者就对这两个框架进行了对比,分别通过实现一个简单的模型来对比两个不同的代码风格,最后还给出了他的个人建议。 当你决定开始学习深度学习,那么应该选择使用什么工具呢?目前有很多深度学习的框架或者库,但本文会对比两个框架,Keras 和 PyTorch ,这是两个非常好开始使用的框架,并且它们都有一个很低的学习曲线,初学者可以很快就学会它们,因此在本文,我将分享一个办法来解决如何选择其中一个框架进行使用。 最好的办法就是查看两个框架各自的代码风格 。设计任何方案的前提和最重要的事情就是你的工具,当你开始一个项目前必须安装配置好你的工具,并且一旦开始项目后,就不应该更改时用的工具。它会影响到你的生产力。作为一个初学者,你应该尽量尝试不同的工具,并且找到合适你的,但如果你正在参加一个非常正式的项目工作,那么这些事情都应该提早计划好。 每天都会有新的框架和工具面世

1. 感知机原理(Perceptron)

萝らか妹 提交于 2020-08-15 14:44:37
1. 感知机原理(Perceptron) 2. 感知机(Perceptron)基本形式和对偶形式实现 3. 支持向量机(SVM)拉格朗日对偶性(KKT) 4. 支持向量机(SVM)原理 5. 支持向量机(SVM)软间隔 6. 支持向量机(SVM)核函数 1. 前言 感知机是1957年,由Rosenblatt提出会,是 神经网络和支持向量机 的基础。 2. 感知机的原理 感知机是二分类的线性模型,其输入是实例的特征向量,输出的是事例的类别,分别是+1和-1,属于判别模型。 假设训练数据集是线性可分的,感知机学习的目标是求得一个能够将训练数据集 正实例点和负实例点完全正确分开的分离超平面 。如果是非线性可分的数据,则最后无法获得超平面 2.1 点到线的距离 公式中的直线方程为 \(Ax+By+C=0\) ,点 \(P\) 的坐标为 \((x_0,y_0)\) 。 \[d=\frac{Ax_0+By_0+C}{\sqrt{A^2+B^2}} \] 2.2 样本到超平面距离 我们假设超平面是 \(h=w \cdot {x}+b\) ,其中 \(w=(w_0,w_1,...w_m)\) , \(x=(x_0,x_1,...x_m)\) ,样本点 \(x^{'}\) 到超平面的距离如下: \[d=\frac{w \cdot {x^{'}}+b}{||w||} \] 2.2 超平面

【完结】12大深度学习开源框架(caffe,tf,pytorch,mxnet等)快速入门项目

别说谁变了你拦得住时间么 提交于 2020-08-15 14:34:17
转自: https://www.jianshu.com/p/16f69668ce25 这是一篇总结文,给大家来捋清楚12大深度学习开源框架的快速入门,这是有三AI的GitHub项目,欢迎大家star/fork。 https://github.com/longpeng2008/yousan.ai 1 概述 1.1 开源框架总览 现如今开源生态非常完善,深度学习相关的开源框架众多,光是为人熟知的就有caffe,tensorflow,pytorch/caffe2,keras,mxnet,paddldpaddle,theano,cntk,deeplearning4j,matconvnet等。 如何选择最适合你的开源框架是一个问题。有三AI在前段时间里,给大家整理了 12个深度学习开源框架快速入门的教程和代码 ,供初学者进行挑选,一个合格的深度学习算法工程师怎么着得熟悉其中的3个以上吧。 下面是各大开源框架的一个总览。 在这里我们还有一些框架没有放上来,是因为它们已经升级为大家更喜欢或者使用起来更加简单的版本,比如从torch->pytorch,从theano到lasagne。另外这些框架都支持CUDA,因此编程语言这里也没有写上cuda。 在选择开源框架时,要考虑很多原因,比如开源生态的完善性,比如自己项目的需求,比如自己熟悉的语言。当然

揭秘!文字识别在高德地图数据生产中的演进

不问归期 提交于 2020-08-15 13:35:53
导读 :丰富准确的地图数据大大提升了我们在使用高德地图出行的体验。相比于传统的地图数据采集和制作,高德地图大量采用了图像识别技术来进行数据的自动化生产,而其中场景文字识别技术占据了重要位置。商家招牌上的艺术字、LOGO五花八门,文字背景复杂或被遮挡,拍摄的图像质量差,如此复杂的场景下,如何解决文字识别技术全、准、快的问题?本文分享文字识别技术在高德地图数据生产中的演进与实践,介绍了文字识别自研算法的主要发展历程和框架,以及未来的发展和挑战。 一 背景 作为一个DAU过亿的国民级软件,高德地图每天为用户提供海量的查询、定位和导航服务。地图数据的丰富性和准确性决定了用户体验。传统的地图数据的采集和制作过程,是在数据采集设备实地采集的基础上,再对采集资料进行人工编辑和上线。这样的模式下,数据更新慢、加工成本高。为解决这一问题,高德地图采用图像识别技术从采集资料中直接识别地图数据的各项要素,实现用机器代替人工进行数据的自动化生产。通过对现实世界高频的数据采集,运用图像算法能力,在海量的采集图片库中自动检测识别出各项地图要素的内容和位置,构建出实时更新的基础地图数据。而基础地图数据中最为重要的是POI(Point of Interest)和道路数据,这两种数据可以构建出高德地图的底图,从而承载用户的行为与商家的动态数据。 图像识别能力决定了数据自动化生产的效率

阿里云飞天AI加速器+Serverless容器,帮助图森未来提升资源利用率

守給你的承諾、 提交于 2020-08-15 13:20:15
简介: 今年年初,图森未来的无人驾驶卡车还上了“钢铁侠”的扮演者小罗伯特·唐尼主持的科技聚集剧集《The Age of A.I.》(《AI时代》),在剧中不仅顺利完成无人驾驶的行驶任务,还与围追堵截的摄像车“斗智斗勇”,在摄像车各种找拍摄角度的情况下,自动自我调整,化险为夷,避让既礼貌又安全! 图森未来(TuSimple)成立于2015年,是一家专注于L4级无人驾驶卡车技术研发与应用的人工智能企业,已经实现卡车在干线物流场景和半封闭枢纽场景下的无人干预驾驶。图森未来品牌旗下产品——图森未来 L4 级别无人驾驶卡车能够实现环境感知、定位导航、决策控制等自动驾驶核心功能,可应用于高速公路货运和港内集装箱码头运输及其相似场景。 公司于2019年9月完成总额2.15亿美元D轮融资,资方:UPS、鼎晖资本、万都中国、累计融资超过3亿美元,最新估值超过12亿美元,是卡车无人驾驶头部企业,也是全球第一家无人驾驶卡车独角兽企业。 图森未来的业务主要在美国和国内两地展开,在美国主要是高速公路干路货运场景,国内业务开始以连接枢纽场景的干线物流货运为主。 在美国,图森未来已经向包括UPS、USPS、McLane、U.S. Xpress在内的18家客户提供无人驾驶物流服务。 今年年初,图森未来的无人驾驶卡车还上了“钢铁侠”的扮演者小罗伯特·唐尼主持的科技聚集剧集《The Age of A.I.》(

免费!顶会论文审稿人带你复现论文,还有奖学金可拿

会有一股神秘感。 提交于 2020-08-15 13:17:19
  作为 AI 从业者,怎样才能有所建树,而不是浅尝辄止?毫无疑问,当然是啃 Paper、复现 Paper呀!   对于本科生,论文复现可以帮你快速奠定理论基石并彻底搞懂,为课题研究打好基础;   对于硕博生,如果你要发AI论文,就必须要快速大量的阅读特定方向的重要论文,并且理解创新点,进行复现,这才有利于找到自己的研究方向;   对于在职开发者,可以探索最前沿的先进技术,解锁算法优化的新思路。    可是在啃 Paper、复现 Paper 过程中,你是否会遇到以下困难 :   导师丢过来课题让自己研究,不知如何下手;   论文读了和没读一样,抓不住重点;   论文内容偏理论,代码部分不知该如何复现!   百度作为「中国AI头雁」已多年出征CVPR、AAAI等顶会,为了帮大家在发表论文的过程中少走弯路,百度飞桨特别邀请了中国科学院的顶会论文作者,联合推出了 「百度全球顶会论文复现营」。    28天复现顶会论文    论文精读与解析   夯实GAN、视频分类技术基础,带大家精读前沿热门顶会论文, 深入剖析思路与关键点。    啃透算法模型   模型深入解析,中科院顶会论文作者、百度资深算法工程师结合多年实战经验, 分享宝贵算法调优经验。    实践论文复现全流程   公布10篇顶会论文list,手把手带你实践论文复现全流程: 论文筛选-论文精读-模型搭建-算法调优    奖学金计划