神经网络

人工智能刚上岗就“翻车” 培养一名合格的AI编辑总共分几步

纵饮孤独 提交于 2020-08-16 23:23:11
  目前阶段的编辑工作完全依赖AI是不现实的,让AI成为人类编辑的帮手似乎更切实可行。双方协同起来,将使工作更加高效有质量。   日前,微软宣布6月底拟裁撤近80名外包编辑,由AI编辑负责接下来的MSN网站的新闻抓取、排版和配图等工作。但没想到,刚到岗没多久,AI编辑就“翻车”了,而且犯了一个非常低级的错误。AI编辑在寻找配图的时候,把非裔歌手Leigh跟阿拉伯裔歌手Jade弄混了。   针对此次微软AI的配图错误事件,Jade也在社交媒体上表达了不满:“正常区分两个不同肤色的人有那么难吗?”为何一向以高识别率著称的AI,这次却“翻车”了?   解决脸盲问题需要不断扩大学习范围   人脸识别技术是目前AI领域公认的比较成熟的技术,圈内人士也热衷像刷分一样把人脸识别准确率屡屡刷出新高,最高的号称准确率可达99.9%。人脸识别技术有如此辉煌的战绩,为何此次AI编辑还会脸盲呢?   “人脸识别技术的工作原理,主要是比对五官比例以及面部特征。”天津大学智能与计算学部教授韩亚洪解释,简单说,就是基于人脸图像的大数据,先对看到的人脸图像进行预处理,提取面部各个方面的特征,并通过分层多次提取,寻找对于识别个体人脸最有效的特征表达。   人脸识别技术这些年已经发生了重大的变化,传统的人脸识别方法已经被基于卷积神经网络的深度学习方法替代。深度学习方法的主要优势是它们可通过大规模数据集进行训练

AI时代来了!为什么它也成为了国家战略目标?

亡梦爱人 提交于 2020-08-16 22:24:20
  AI时代的到来,使得手机的未来充满了更多的可能性,AI技术在各行业都非常火爆,相信AI技术还将掀起一片浪潮。人工智能的起源AI大家都熟知了就是人工智能,人工智能一词最早是在1956年Dartmouth学会上提出的,从那以后,研究者们扩展了众多理论和原理,人工智能的观念也随之扩大。人工智能学科研究的主要内容包括:知识表示、自动推理和搜索方法、机器学习和知识获取、知识处理系统、自然语言理解、计算机视觉、智能机器人、自动程序设计等方面,在2017年的时候,人工智能在中国也成为了国家战略目标。   人工智能是科学人工智能是一门极富挑战性的科学,从事这项工作的人一定要懂得计算机知识,心理学和哲学,人工智能是包括非常广泛的科学,它是由不同的范畴组成,比如机器学习,计算机视觉等等,总的说来,人工智能研究的一个主要目标是使机器就能胜任一些一般需要人类智能化才能完成的繁琐工作,人工智能的扩展呈现出全球化动向。   AI智能芯片的作用AI智能芯片可以增强软件的功能,它的本质就是模拟人类神经网络的人造神经网络,通过大量的人工神经元联结进行计算,在基于大量数据统计的人工神经网络具有一定的判断力,特别是在语音识别和人脸识别方面比较有优势。科技巨头们发现两点明显的难题,是因为AI算法在图像识别、语音识别、自然语言处理等等领域有着非常重要的影响,它的功能是为了在实行AI算法。  

Pytorch 基本操作

ぐ巨炮叔叔 提交于 2020-08-16 19:36:31
Pytorch 基础操作 主要是在读 深度学习入门之PyTorch 这本书记的笔记。强烈推荐这本书 1. 常用类numpy操作 torch.Tensor(numpy_tensor) torch.from_numpy(numpy_tensor) GPU上的Tensor不能直接转换为Numpy ndarry,要用 .cpu() 将其转换到CPU # 第一种方式是定义 cuda 数据类型 dtype = torch.cuda.FloatTensor # 定义默认 GPU 的 数据类型 gpu_tensor = torch.randn(10, 20).type(dtype) # 第二种方式更简单,推荐使用 gpu_tensor = torch.randn(10, 20).cuda(0) # 将 tensor 放到第一个 GPU 上 gpu_tensor = torch.randn(10, 20).cuda(1) # 将 tensor 放到第二个 GPU 上 # 将tensor放回CPU cpu_tensor = gpu_tenor.cpu() 得到tensor大小 .size() 得到tensor数据类型 .type() 得到tensor的维度 .dim() 得到tnsor的所有元素个数 .numel() 全1矩阵。数据类型是floatTensor torch.ones(n, m)

从CNN卷积参数计算到模型加速方法

ぃ、小莉子 提交于 2020-08-16 19:21:15
一:CNN卷积参数计算 要对CNN卷积过程进行参数计算,首先得知道卷积操作过程中的权值是共享的,即卷积核的权重参数以及偏置参数在一次卷积过程中不改变,CNN卷积操作的过程如下图所示。 CNN卷积操作示意图 上述卷积过程的输入特征图尺寸为: (7*7*3);卷积核大小为: (3*3*3);输出的特征图尺寸为: (3*3*2),可以看出,神经网络网络学习参数即卷积核的权重参数以及偏置参数在卷积过程中不改变,所以CNN卷积参数量与输入输出特征图的尺寸无关,只与卷积核的大小数量以及输入与输出通道数相关。 卷积过程实际上是卷积核与特征图尺寸进行线性计算的过程公式如下: ,其中 代表权重, 代表偏置,因为计算过程都是线性的,所以需要引入激活函数,增加网络的表达能力,而不是一味的线性叠加。 参数量即为权值 、 以及偏置 和 中参数个数总和。计算过程如下:卷积核的参数为: ,其中 为卷积核尺寸, 输入通道个数, 为输出通道个数。加上两个偏置参数,总的参数量为 : 。 当然每一次搭建模型后,不需要我们来手动计算参数量的大小,各种框架下已经备好了相应命令,比如:在keras框架下,模型参数量可以直接通过model.summary()来进行模型架构和参数量的输出;在pytorch框架下,需要先安装第三方包torchsummary,然后通过如下命令进行输出网络结构参数量。 import torch

李飞飞团队最经典计算机视觉课更新!斯坦福出品,深度学习入门必备

∥☆過路亽.° 提交于 2020-08-16 19:06:43
点击上方“ 3D视觉工坊 ”,选择“星标” 干货第一时间送达 萧萧 发自 凹非寺 量子位 报道 | 公众号 QbitAI 斯坦福最经典的计算机视觉课程 CS231n ——全称是面向视觉识别的卷积神经网络。 涉及目标检测、深度学习优化算法、图像和视频理解、3D视觉、语义分割、生成对抗网络等内容 。 今天更新啦。 作为计算机视觉和深度学习领域的经典课程,CS231n由 李飞飞团队 打造,从课程设计到内容选择,都以入门为导向。 然而,自从2017年后,这门课程的 录制版 就没再更新过,在李飞飞的社交媒体下面,不时能听见网友吐槽的声音: 我们很喜欢您的课程,但这个领域发展得非常快,为什么2017年后的视频课就不再上传了? 现在,这门课程的录制视频终于更新了,想要入门计算机视觉的小伙伴,可以收藏学习~ 如何获取? 在公众号「3D视觉工坊」后台,回复「 CS231n 」,即可获得视频网盘链接工坊已经为您下载好了。 那么,CS231n课程都讲了些什么? 22节课,入门计算机视觉 CS231n是斯坦福开设的一门视觉识别课程,在了解计算机视觉的基础上,理解 深度学习 在这个行业的应用。 作为一门研究机器人如何「看」的领域,计算机视觉的应用范围非常广泛,像自动驾驶汽车识别行人、图像搜索引擎自动分类等等。 而深度学习的出现,极大地提高了计算机视觉的应用效果。 这门课从理论到实践一键通,学习后,不仅能实现

MATLAB智能算法30个案例分析(第2版)PDF 随书代码

做~自己de王妃 提交于 2020-08-16 18:18:09
内容简介 《MATLAB智能算法30个案例分析》是作者多年从事算法研究的经验总结。书中所有案例均因国内各大MATLAB技术论坛网友的切身需求而精心设计,其中不少案例所涉及的内容和求解方法在国内现已出版的MATLAB书籍中鲜有介绍。《MATLAB智能算法30个案例分析》采用案例形式,以智能算法为主线,讲解了遗传算法、免疫算法、退火算法、粒子群算法、鱼群算法、蚁群算法和神经网络算法等最常用的智能算法的MATLAB实现。《MATLAB智能算法30个案例分析》共给出30个案例,每个案例都是一个使用智能算法解决问题的具体实例,所有案例均由理论讲解、案例背景、MATLAB程序实现和扩展阅读四个部分组成,并配有完整的原创程序,使读者在掌握算法的同时更能快速提高使用算法求解实际问题的能力。《MATLAB智能算法30个案例分析》可作为本科毕业设计、研究生项目设计、博士低年级课题设计参考书籍,同时对广大科研人员也有很高的参考价值。 链接:https://pan.baidu.com/s/1e2SCEdGCf55Ju0MC7rzpIQ 提取码:qq1q 另外一本类似: MATLAB 神经网络43个案例分析 PDF 随书代码 来源: oschina 链接: https://my.oschina.net/u/4339032/blog/4406227

AI也需要睡眠?Reddit网友吵翻了:说得好像我们很了解睡眠一样。。。

蹲街弑〆低调 提交于 2020-08-16 17:43:15
云栖号资讯:【 点击查看更多行业资讯 】 在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 【导读】人类需要充足的睡眠才能有最好的状态,而最新研究发现,人工神经网络也可能受益于长时间的休息。模拟神经网络中类似睡眠周期的状态,可以消除人工模拟大脑中不间断的自学习带来的不稳定性。 众所周知,充足的睡眠可以带来元气满满的一天,提高工作效率,无论是动物还是人类,都可以得到充足睡眠带来的好处。 而近日洛斯阿拉莫斯国家实验室 (Los Alamos National Laboratory) 的一项研究表明,人工计算大脑也可以从睡眠中受益,这种好处与睡眠给人类所带来的好处类似。 人工计算大脑的灵感来自于人类大脑的神经连接。想象一下,一个由相互连接的节点组成的庞大分层网络,他们互相通信。一连串的信息波,通过一系列电子发射穿过结构。网络中的每个节点或 “神经元” 都有自己的数据和信号供应,以便将数据传输到下一层节点。 随着时间的推移,神经网络调整这些神经元之间独特的相互作用,以提高其解决问题的能力。神经组合的路线图会慢慢地微调,直到系统为给定的任务开发出最佳策略。 人造大脑需要睡眠 在这项研究中,洛斯阿拉莫斯国家实验室的研究人员重点研究了脉冲神经网络,它的功能不同于标准的人工神经网络。这些计算系统更接近于人脑的神经回路,神经元在接收到大量输入信号后产生一个信号

线性代数应该这样学一

倾然丶 夕夏残阳落幕 提交于 2020-08-16 15:59:43
在网上看到的一篇文章,看了以后感触颇深。他讲述了线性代数的本质,对线性空间、向量和矩阵做了直觉的描述。 线性代数课程,无论你从行列式入手还是直接从矩阵入手,从一开始就充斥着莫名其妙。 比如说,在全国一般工科院系教学中应用最广泛的同济线性代数教材(现在到了第四版),一上来就介绍逆序数这个古怪概念,然后用逆序数给出行列式的一个 极不直观的定义,接着是一些简直犯傻的行列式性质和习题——把这行乘一个系数加到另一行上,再把那一列减过来,折腾得那叫一个热闹,可就是压根看不出 这个东西有嘛用。 大多数像我一样资质平庸的学生到这里就有点犯晕:连这是个什么东西都模模糊糊的,就开始钻火圈表演了,这未免太无厘头了吧!于是开始有人逃课,更多的 人开始抄作业。这下就中招了,因为其后的发展可以用一句峰回路转来形容,紧跟着这个无厘头的行列式的,是一个同样无厘头但是伟大的无以复加的家伙的出 场——矩阵来了!多年之后,我才明白,当老师犯傻似地用中括号把一堆傻了吧叽的数括起来,并且不紧不慢地说:“这个东西叫做矩阵”的时候,我的数学生涯 掀开了何等悲壮辛酸、惨绝人寰的一幕!自那以后,在几乎所有跟“学问”二字稍微沾点边的东西里,矩阵这个家伙从不缺席。对于我这个没能一次搞定线性代数 的笨蛋来说,矩阵老大的不请自来每每搞得我灰头土脸,头破血流。长期以来,我在阅读中一见矩阵,就如同阿Q见到了假洋鬼子,揉揉额角就绕道走。 事实上

推荐题

限于喜欢 提交于 2020-08-16 14:06:02
未完待续 校内OJ上出现过的,过水的,大家基本都做过的不在推荐范围内 星级仅代表个人对题目的评价,不完全代表题目难度,仅供参考 把大家所有人的推荐题开了题单QAQ 洛谷上开的题单A 洛谷上开的题单B 组题不易给波收藏吧QAQ Tarjan Grass Cownoisseur G \({\color{#8B0000} \bigstar}{\color{#8B0000} \bigstar}{\color{#8B0000} \bigstar}\) 嗅探器 \({\color{#8B0000} \bigstar}{\color{#8B0000} \bigstar}\) Trick or Treat on the Farm G \({\color{#8B0000} \bigstar}\) 拓扑排序 菜肴制作 \({\color{#8B0000} \bigstar}{\color{#8B0000} \bigstar}\) 车站分级 \({\color{#8B0000} \bigstar}{\color{#8B0000} \bigstar}\) 神经网络 \({\color{#8B0000} \bigstar}{\color{#8B0000} \bigstar}\) 二分 路标设置 \({\color{#8B0000} \bigstar}\) 跳石头 \({\color{#8B0000}

两种方式识别“传统”图片验证码

不羁岁月 提交于 2020-08-16 13:59:11
目前,很多网站为了反爬都会采取各种各样的策略,比较简单粗暴的一种做法就是图片验证码,随着爬虫技术与反爬技术的演变,目前验证码也越来越复杂,比较高端的如Google的I‘m not a robot,极验等等。这些新的反爬方式大多都基于用户行为分析用户点击前的鼠标轨迹来判断是访问者是程序还是人。 基于图像处理的图片验证码识别 这篇文章介绍的是破解一般“传统”的图片验证码的步骤。上面提到的极验(目前应用比较广)也已经可以被破解,知乎上有相关的专栏,这里就不重复了。 即便是传统的图片验证码,也是有难度区分的(图一是我母校研究生院官网上的验证码,基本形同虚设;图二则是某网站的会员登录时的验证码增加了一些干扰信息,字符也有所粘连),但是破解的流程大致是一样的。 图1 图2 ▐ 识别步骤 获取样本 从目标网站获取了5000个验证码图片到本地,作为样本。因为后期需要进行监督学习样本量要足够大。 样本去噪 ✎ 先二值化图片 这一步是为了增强图片的对比度,利于后期图片图像处理,代码如下: # 二值化图片 @staticmethod def two_value_img(img_path, threshold): img = Image.open(img_path).convert('L') # setup a converting table with constant threshold tables