深度学习

seq2seq聊天机器人

馋奶兔 提交于 2020-08-06 10:55:14
seq2seq聊天机器人 作者:魏祖昌 一、背景介绍 人工智能技术的进步,语音识别技术、自然语言处理等技术的成熟,智能客服的发展很好的承接当下传统人工客服所面临的挑战。智能客服能够24小时在线为不同用户同时解决问题,工作效率高等特点,这是传统人工客服不能替代的,它能为公司节省大量的人工客服成本。在这次疫情当中,由于总总原因,大家肯定多多少少都见识过各种各样的智能客服。本文就基于seq2seq来介绍一个聊天机器人。 二、seq2seq Seq2Seq即Sequence to Sequence,是一种时序对映射的过程,实现了深度学习模型在序列问题中的应用,其中比较突出的是自然语言中的运用。它主要由Encoder和Decoder两个部分组成,正如图一所示。 图一:论文中seq2seq结构( https://arxiv.org/pdf/1409.3215.pdf ) seq2seq模型的encoder非常简单(上图中ABC对应的部分),就是RNN,可以是多层(GRU,LSTM)。decoder在训练和测试的时候,稍微有点不同。decoder训练的时候输入由两部分组成,一部分是encoder的last state,另一部分是target序列,如上图中的第一个<EOS> WXYZ;其中两个<EOS>表示的是序列开始符和结束符;decoder测试的时候输入也是由两部分组成

AI催化新基建,创新奇智用人工智能促传统产业智能转型

笑着哭i 提交于 2020-08-06 10:10:34
云栖号资讯:【 点击查看更多行业资讯 】 在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! “新基建”已成为当下应对疫情引发的经济挑战及推动科技创新的强心剂,也是数字经济发展的基石,其覆盖的5G、人工智能、大数据中心、特高压、轨道交通、新能源汽车等七大领域,涉及诸多产业链上下游。长期来看,新基建将加速中国产业链完成数字化转型和智能化升级,实现生产要素的高效配置和推动面向业务价值的数据资产建设,打造一个融合创新的产业生态网络。 人工智能作为新技术基础设施,被视为支撑传统基础设施转型升级的融合创新工具,受到广泛关注。而要做到这一点,仅有人工智能技术尚且不足,还需将AI技术与实际应用场景结合,因此人工智能商业化落地的重要性愈加凸显。在人工智能领域,创新奇智是较早专注于AI商业化落地的企业,在2018年3月创立之初就提出了“人工智能赋能商业价值”的企业使命,致力于通过人工智能产品和商业解决方案,帮助传统产业智能化转型升级,提升商业价值。 麦肯锡数据显示,人工智能技术(主要指基于人工神经网络的深度学习技术)每年将在全球范围内创造3.5 万亿~5.8 万亿美元的潜在价值,约占分析技术可能提供的总价值规模的40%。面对AI技术带来的广阔市场,创新奇智精选了制造、金融、零售三个行业进行AI赋能。在创新奇智CEO徐辉看来,AI是能够赋能百业的,但在实践AI落地时,要挑选合适的行业切入

矩阵补全(Matrix Completion)和缺失值预处理

好久不见. 提交于 2020-08-06 09:46:20
目录 1 常用的缺失值预处理方式 1.1 不处理 1.2 剔除 1.3 填充 1.3.1 简单填充 1.3.2 建模填充 2 利用矩阵分解补全缺失值 3 矩阵分解补全缺失值代码实现 4 通过矩阵分解补全矩阵的一些小问题 References 矩阵补全(Matrix Completion),就是补上一个含缺失值矩阵的缺失部分。 矩阵补全可以通过矩阵分解(matrix factorization)将一个含缺失值的矩阵 X 分解为两个(或多个)矩阵,然后这些分解后的矩阵相乘就可以得到原矩阵的近似 X',我们用这个近似矩阵 X' 的值来填补原矩阵 X 的缺失部分。 矩阵补全有很多方面的应用,如推荐系统、缺失值预处理。 除了 EM 算法、树模型,机器学习中的大多数算法都需要输入的数据是不含缺失值的。在 deep learning 模型中,通过梯度的计算公式就可以发现,如果 feature 中含有缺失值,那么梯度也会含缺失值,梯度也就未知了。对缺失值的处理是在模型训练开始前就应该完成的,故也称为预处理。 数据缺失在实际场景中不可避免,对于一个包含 \(n\) 个 samples,每个 sample 有 \(m\) 个 features 的数据集 \(D\) ,我们可以将该数据集 \(D\) 整理为一个 \(n×m\) 的矩阵 \(X\) 。 通过矩阵分解补全矩阵是一种处理缺失值的方式

CVPR 2020 | 将深度学习算法应用于移动端最新研究汇总

梦想与她 提交于 2020-08-06 09:23:53
点击上方“ 3D视觉工坊 ”,选择“星标” 干货第一时间送达 作者:Derrick Mwiti 编译:ronghuaiyang 导读 边缘设备上的机器学习是未来的一大方向。 在最近结束的2020年CVPR会议上,有很多优秀的计算机视觉研究。在本文中,我们将重点关注与移动或与边缘计算相关的任务和内容。虽然并非所有这些论文都直接接触到移动相关的应用,但它们对移动端机器学习的影响是巨大的。它们推动了通常在移动设备和边缘设备上执行的ML任务,因此它们的进步对推动行业向前发展至关重要。 智能手机摄影的感知质量评估 本文作者对智能手机摄影的感知质量评估进行了深入的研究。他们还引入了智能手机摄影属性和质量(SPAQ)数据库。该数据库包含66部智能手机拍摄的11,125张照片。每个图像都有丰富的标注信息。 论文地址:http://openaccess.thecvf.com/content_CVPR_2020/html/Fang_Perceptual_Quality_Assessment_of_Smartphone_Photography_CVPR_2020_paper.html 作者还收集了人们对每张图片的看法。收集的一些信息包括图像质量、图像属性、图像属性和场景类别标签。为了进行更深入的分析,他们还记录了每张图像的可交换图像文件格式(EXIF)。然后

MNIST数据集下载及可视化

风流意气都作罢 提交于 2020-08-06 09:01:04
MNIST数据集介绍 MNIST数据集官网: http://yann.lecun.com/exdb/mnist/ MNIST数据库是非常经典的一个数据集,就像你学编程起初写一个“Hello Word”的程序一样,学Deep Learning你就会写识别MNIST数据集的Model。 MNIST数据集是由0〜9手写数字图片和数字标签所组成的,由60000个训练样本和10000个测试样本组成,每个样本都是一张28 * 28像素的灰度手写数字图片。如下图所示。 MNIST数据库一共有四个文件案,分别为 1. train-images-idx3-ubyte.gz :训练集图片(9912422字节),55000张训练集,5000张验证集 2. train-labels-idx1-ubyte.gz :训练集图片对应的标签(28881字节), 3. t10k-images-idx3-ubyte .gz :测试集图片(1648877字节),10000张图片 4. t10k-labels-idx1-ubyte.gz :测试集图片对应的标签(4542字节) 图片是指0〜9手写数字图片,而标签则是对应该图片之实际数字。 MNIST 数据集下载及可视化 TensorFlow提供了一个库可以对MNIST数据集进行下载和解压。具体的是使用TensorFlow中input_data.py脚本来读取数据及标签

又双叒来,谷歌网络嵌入函数新专利惹争议,网友:何时申请线性回归?

天涯浪子 提交于 2020-08-06 08:45:59
最近,谷歌又申请了一项深度学习算法专利,主题是「Using embedding functions with a deep network」。 机器之心报道,参与:蛋酱、张倩。 对于每个深度学习研究者来说,有些算法、方法可以说是研究必备,拿来直接用也是一种日常,但如果有人申请了专利呢? 最近,谷歌一项新的 AI 专利申请再次引燃了社区对于专利问题的讨论。 该专利的摘要描述如下: 本专利适用于在深度网络中使用嵌入函数(embedding functions)的方法、系统和设备,包括在计算机存储媒介上编码的计算机程序。其中一种方法包括接收包含多个特征的输入,其中每个特征具有不同的特征类型;使用各自的嵌入函数处理每个特征以生成一个或多个数值,其中每个嵌入函数独立地运算彼此的嵌入函数,并且每个嵌入函数用于各自特征类型的特征;使用深度网络处理数值以生成输入的第一个替代表征,其中深度网络是由多个层次的非线性运算组成的机器学习模型;使用 logistic 回归分类器处理输入的第一个替代表征,以预测输入的标签。 专利界面: https:// patents.google.com/pate nt/US10679124B1/en 这项专利的保护范围是怎样的呢?我们来看一下申请书的「权利要求(claims)」部分: 一种由一个或多个计算机执行的方法,该方法包括:接收包括多个特征的输入

最新综述:深度学习图像三维重建最新方法及未来趋势

爱⌒轻易说出口 提交于 2020-08-06 07:58:30
点击上方“ 3D视觉工坊 ”,选择“星标” 干货第一时间送达 今天分享的是: 深度学习领域基于图像的三维物体重建最新方法及未来趋势综述。 原文: Image-based 3D Object Reconstruction: State-of-the-Art and Trends in the Deep Learning Era 论文下载:https://arxiv.org/abs/1906.06543 摘要 : 三维重建是计算机视觉计算机图形学和机器学习等领域几十年来一个不适定问题。从2015年开始使用CNN解决基于图像的三维重建(image-based 3D reconstruction)有了极大的关注并且展示出强大的性能。在新时代的快速发展下,我们提供了这一领域详细的调研。本文章专注于从RGB图像估计三维物体形状的深度学习方法。除此之外我们还回顾了关于特定物体(如人脸)的近期研究。我们一些重要论文性能的分析和比较,总结这一领域的现有问题并讨论未来研究的方向。 本文是深度学习做三维重建的一篇综述 对自2015年以来本领域的149个方法做详尽的回顾 深入分析深度学习三维重建的各个方面,包括训练集,网络架构选择以及重建结果,训练技巧和应用场景 总结对比了普遍的三维重建算法(88种),本文还包含了三维人脸重建算法(11种),人体形状重建算法(6种方法) 问题陈述和分类 假设 为物体

工业互联网平台加速了石化行业数字化转型步伐

柔情痞子 提交于 2020-08-06 07:42:35
我国工业互联网与实体经济的融合持续深化,正由理念倡导走向垂直深耕阶段。近期,我们对石化行业进行调研,调研发现石化行业存在设备管理不透明、工艺知识传承难、产业链上下游协同水平不高、安全生产压力大等痛点,亟需加快基于工业互联网平台的数字化转型步伐,更多信息尽在振工链。 我们建议石化企业以设备智能管控、生产协同优化为切入点,提升设备管理、生产管理、供应链管理、安全管理、节能降耗等环节的数字化水平,加速推动石化行业向全流程智能化方向加速转型。具体建议包括: 一是加强底层数据分析,促进边云协同。在边缘数据采集方面,安装传感器、无人机、摄像头、三维扫描仪等数据采集工具,利用泛在感知技术,采集油田地质勘探、钻井、开采、运输、炼化、销售领域的多源设备、异构系统、运营环境、人员等数据,实现对油田、运输管道、炼化工厂运行状态的全面感知。在边缘数据分析方面,在原油开采装置、炼化重点装置、运输管道关键节点部署机器学习和深度学习算法,在边缘控制器上集成分析引擎,实现对装置的自动调整和优化,在模型、数据、服务三方面实现边云协同,更多信息尽在振工链。 二是梳理炼化工艺知识,研发工业模型。围绕设备管理,重点研发炼化重点装置的运行状态监测模型、远程故障诊断模型和预测性维护模型。围绕炼化生产,重点研发炼化工艺流程模拟优化模型、聚合物反应模型、换热网络优化模型、公用工程系统优化模型以及能量系统优化模型、生产质量管控模型

阿里云ECS云服务器通用型g6和g5的区别以及选择建议

蓝咒 提交于 2020-08-06 06:21:33
阿里云ECS云服务器通用型g6和g5的区别以及选择建议 阿里云ECS云服务器通用型g6和通用型g5实例有什么区别?通用型g5和g6都是用于性能均衡场景,CPU内存比都是1:4,本文来说说通用型g6和通用型g5的区别以及选择方法:官方文档: 云服务器ECS共享标准型S6实例 ECS云服务器通用型g6和通用型g5有什么区别? 顾名思义,通用型g6是通用型g5的升级版,ECS云服务器通用型g6是第六代云服务器,性能全面提升的同时价格有所下调,如何选择?云E优站长博客建议选择通用型g6实例。 通用型g6云服务器是阿里云的第六代云服务器,第六代云服务器是基于第二代Intel至强可扩展处理器,睿频从上一代2.7Ghz提升到3.2Ghz,E2E计算性能有3-15%的提升;支持vnni指令集,对于深度学习的推理场景有2-4倍性能提升;虚拟化优化性能抖动,ping flood延时超过1ms的报文数<1/100万。 通用型g6和通用型g5区别对比表 综上,阿里云ECS云服务器通用型g6是通用型g5的升级版,性能有所提升,如何选择?新手站长网还是建议性价比放在第一位,虽然通用型g6是g5的升级版,但是通用型g5的性能也不差,如果通用型g5拥有更优惠的折扣,通用型g5也是可以选择的。 来源: oschina 链接: https://my.oschina.net/u/4308002/blog/4282670

工作能力强的人有哪些共同特征?

蓝咒 提交于 2020-08-06 05:38:45
点击上方“ 3D视觉工坊 ”,选择“星标” 干货第一时间送达 本文整理自知乎问答,仅用于学术分享,著作权归作者所有。 如有侵权,请联系后台作删文处理。 观点一 作者|马力和知群 https://www.zhihu.com/question/28880482/answer/43434644 带过不少人,说自己的观察: 当我们有一项工作要做时,只需要指出一个大概方向,有的伙伴就可以欢快的向前冲,自己找到各种可能性,自己探路,而不是等待下一个「指示」。他们手里总是有事情做。 做事情的时候,有些伙伴的目标不是完成,而是比上一次更好,并且能够总结和反思。竞争对手永远是自己,永远是上一次,这样总是在前进。 每个人都会周期性的遇到瓶颈,有些伙伴选择有技巧的死磕,当时没感觉怎么样,六个月后再回眸,发现自己已经进阶了一大步。 有些伙伴遇到比自己强的人,有如看到了宝库,有太多自己可以学习的地方,不放过任何机会,有些伙伴则心理承受不了,不是勇往直前而是选择放弃,更愿意呆在自己的舒适区间。 发现了自己的问题,或者被别人指出了问题,有些伙伴会欣喜若狂,觉得赚到了,有了收获,以后就可以修正这个问题了,而有些伙伴则开始启动防御模式。 不做老好人是很多做的好的伙伴的共同之处,特别是负责一块工作、带领一个团队的伙伴,为了避免争议而做老好人,本质上是自私的,因为本应该对于工作、对于一群人、一个团队负起责任。