计算机视觉

万物AI时代,鲲鹏昇腾为智能计算而歌

有些话、适合烂在心里 提交于 2020-12-12 00:15:31
文 |魏启扬 来源|智能相对论(aixdlun) 来自Gartner的分析报告认为,未来将有75%的数据会在传统的集中式数据中心或云端之外的位置创建并得到处理。这些地方可能是工厂、医院、银行,抑或商场、公路、城市…… 这也意味着边缘计算将从被人忽视的“边缘”逐渐走到舞台的中心。 随着5G网络的渗透,如何更好地拥抱边缘计算,成为这场时代变革中每一个参与者都着重思考的问题。 刚刚结束的2020边缘计算产业峰会上,鲲鹏和昇腾通过自身的落地实践,向行业重新梳理了其对边缘智能的理解和主张,描绘了一幅边缘智能的悠悠长卷。 数字化转型大潮下,边缘计算进入2.0 在进入正题之前,我们需要重新审视一下当前的时代背景,在数字化转型浪潮之下,计算这件事正在经历些什么,而我们又该需要怎样的计算。 华为昇腾计算业务总裁许映童在2020边缘计算产业峰会上演讲时认为,当前边缘计算所面临的数据主要存在两方面的变化。 一是从互联网时代,到移动互联网时代,到产业互联网时代,再到万物互联时代,数据量呈现指数级增长,同时通过5G网络的放大效应之后,有实时性要求处理的数据需求也大大增加。 根据IDC的数据预测,2025年全球物联网连接数将增长至270亿个,物联网设备数量将达到1000亿台,全球数据总量预计2025年将达到163个ZB。 二是数据形态上,数据类型也从结构化数据、图形数据发展到多媒体数据,再到描述AI的元数据

容联荣登2020中国最具投资价值企业服务50强

流过昼夜 提交于 2020-12-11 23:24:02
在投资界2020企业服务 Venture 50评选中 容联凭借在企业服务领域过硬的 规模实力、经营能力、融资经历、未来潜力、社会贡献力 荣登2020中国最具投资价值企业服务50强 2020,在新基建的推动下 容联“通讯+AI”的边界不断【扩容】【加载】 在计算机视觉领域成绩斐然 加速海量卓越的视觉算法在 智慧社区、加油站、化工园区、城管等领域落地 识别准确率达到95% 在AICC领域不断创新 在强大的AI中台之上 打造小容智能语音机器人、小智坐席辅助、小易智能陪练 已经帮广发、哈尔滨银行、微众银行、招商信诺 等等金融机构构建智慧化运营体系 来源: oschina 链接: https://my.oschina.net/u/4593198/blog/4793204

卷积神经网络与Transformer结合,东南大学提出视频帧合成新架构

雨燕双飞 提交于 2020-12-11 03:55:07
研究者表示,这是卷积神经网络与 Transformer 首度结合用于视频帧合成。 选自arXiv,作者:Zhouyong Liu 等,机器之心编译,机器之心编辑部。 深度卷积神经网络(CNN)是功能非常强大的模型,在一些困难的计算机视觉任务上性能也很卓越。尽管卷积神经网络只要有大量已标记的训练样本就能够执行,但是由于物体的变形与移动、场景照明变化以及视频序列中摄像头位置的变化,卷积神经网络在视频帧合成方面的表现并不出色。 近日,来自东南大学的研究者提出了一种新型的端到端架构,称为卷积 Transformer(ConvTransformer),用于视频帧序列学习和视频帧合成。ConvTransformer 的核心组件是文中所提出的注意力层,即学习视频序列序列依赖性的多头卷积自注意力。ConvTransformer 使用基于多头卷积自注意力层的编码器将输入序列映射到特征图序列,然后使用另一个包含多头卷积自注意层的深度网络从特征图序列中对目标合成帧进行解码。 在实验阶段的未来帧推断任务中,ConvTransformer 推断出的未来帧质量媲美当前的 SOTA 算法。研究者称这是 ConvTransformer 架构首次被提出,并应用于视频帧合成。 论文地址: https:// arxiv.org/abs/2011.1018 5 卷积 Transformer 架构 如图 2 所示

巨头们为什么要开源自己的技术?解析科技企业对软件开源的态度

假如想象 提交于 2020-12-10 01:35:42
今年上半年 , Google 公开了用于Big Transfer(BiT)的预训练模型和微调代码——Big Transfer是一种深度学习的计算机视觉模型。根据 Google 的说法,Big Transfer 可使 任何人在相应的任务上达到最优表现,即使每个类只有少量的标签图片。BiT仅是这家科技巨头 众多 免费开放产品 中的一个 , 其实业界大佬 发布免费 且实用的 开源软件科技界 中并不罕见 , 那 大型科技公司 为什么要这样做,真的是“用爱发电”吗 ? 在 90年代后期, 那时 Open Source Initiative 才 出现 不久 , 人们普遍认为 将源代码公开的想法 很不理智 。 毕竟 专有软件是标准, 相关企业或者组织 会尽一切努力保护软件。 但 到 如今 2020年,开源的概念 早已经 发生了巨大的变化,现在 开源思维正一步步 成为主流。 世界上有如此之多的 开源技术 企业(组织) ,其中一些年 盈利 过亿美元 , 甚至 超过 10亿美元, 亿元俱乐部中不乏有像 红帽、MongoDB、Cloudera、MuleSoft、Hashicorp、Databricks(Spark)和Confluent(Kafka) 这样的大佬 。 除了上述高调收购和投资开源项目 的 科技公司外, 就连 谷歌和Facebook 这类传统科技巨擘 也 在推进开源战略 , 可见 开源对于

【计算机视觉处理三】图像基本处理

会有一股神秘感。 提交于 2020-12-08 05:08:28
图像基本处理 1、图像切片 在前面我们了解到opencv中的图像实际上就是一个ndarray数组,我们对ndarray数组进行操作就是对图像进行操作。我们先来看一下切片查找,这是我们非常常用的一个操作。 (1)一维数组的切片 我们来看看切片的语法,对于一维的数组我们可以通过下面的操作获取第0个到第4个元素: array[0:5] 从上面可以知道我们的切片操作是左闭右开的。上面的切片操作我们可以简写一下: array[:5] 如果我们没有设置第一个值,则表示从头开始切片。当然我们还可以省略第二个值,这时含义就是取到最后一个元素,比如下面的操作: array[3:] 我们用一个实际的例子来看看切片操作: import numpy as np # 创建一个一维的ndarray数组,数据为[0, 1, 2, 3, 4, 5, 6, 7] array = np.array([0, 1, 2, 3, 4, 5, 6, 7]) # 取0到4个元素 print(array[0:5]) print(array[:5]) # 取第3个到最后一个元素 print(array[3:]) 输出内容如下: [0 1 2 3 4] [0 1 2 3 4] [3 4 5 6 7] 我们可以把切片操作总结为: # 左闭右开 array[start: end-1] 当我们以第0个开始,获取以最后一个结尾的话

为什么说卷积神经网络,是深度学习算法应用最成功的领域之一?

百般思念 提交于 2020-12-05 22:12:17
目前,作为深度学习的代表算法之一,卷积神经网络(Convolutional Neural Networks,CNN)在计算机视觉、分类等领域上,都取得了当前最好的效果。 后来,基于深度神经网络和搜索树的智能机器人“AlphaGo”在围棋上击败了人类,这是CNN 给人们的一个大大的惊喜。一年后的 Master 则更是完虐了所有人类围棋高手,达到神一般的境界,人类棋手毫无胜机。 可以说,卷积神经网络是深度学习算法应用最成功的领域之一。 目前,CNN应用也十分广泛。例如Facebook用它进行自动的图像标签,google用它做照片检索,amazon用它做产品推荐,Pinterest用它做个性化家庭定制推送,Instagram用它搭建他们的搜索架构。 那么,基于CNN最经典也是最流行的应用应当是图像处理领域。 而研读卷积神经网络的经典论文,对于学习和研究卷积神经网络必不可缺。 今天,给大家推荐一些资料,有 论文、知识图谱。 7份经典学术论文 这些论文大部分都发表在计算机视觉顶级学术会议上。 这7份论文资料,100p以上的内容体量。 建议收藏学习。 01 resnet 02 CNN 03 batchnorm 04 alexnet 05 visualzing 06 resnet 07 yolo4 目前, 2000+ 的看过这个论文资料的同学都顺利成为各公司算法工程师。大家扫码添即可领取

下载!《Python面试大全》PDF版

心不动则不痛 提交于 2020-12-05 20:41:39
往期下载 下载!5000 页 Java 技术栈 PDF 手册 下载!343页经典书籍《算法之道(第二版)》 下载!《手把手AI项目》手册 下载!国外优质书籍《数字图像处理》电子版 下载!《机器学习基础》第二版正式开放下载 下载!《TensorFlow 2.0 深度学习算法实战》中文版(附随书代码+pdf) 下载!微软出品的最新 Kubernetes 学习指南 3.0 中文开源!《Python数据科学》PDF下载 下载!闲鱼最新升级版 Flutter 技术电子书! 下载!Springer 面向公众开放数据挖掘、编程、机器学习、数学、深度学习、数据科学等 65本电子书籍 下载!Python 密码学入门书籍 下载!《Java 编程思想》中文版! 2020最新版《神经网络与深度学习》中文版 pdf 开放下载 下载!Python 初学者经典教材 PDF课件下载!《用Python玩转数据》 下载!81 页计算机视觉学习指南 经典!《MySQL性能调优手册》高清电子版,限时 3 天免费下载 PDF下载!《数据结构与算法Python版》 下载!《工业智能白皮书》 下载!PyTorch中文版官方教程 InfoQ电子书下载:《前端面试指南》 《统计机器学习与凸优化》教程 PPT 下载 泰山版!Java开发手册开放下载 Pandas官方文档中文版下载、图形深度学习 PPT 下载 200页

2020-12-03

▼魔方 西西 提交于 2020-12-05 17:58:39
推荐系统实战之 特征工程 前言 本次特征工程任务我主要从理论出发,加强对推荐系统的特征工程的了解。本文主要参考了王喆大佬的《深度学习推荐系统》,将从推荐系统的视角出发,结合本次 新闻推荐比赛 的实际案例,探讨推荐系统的特征工程。 数据决定了机器学习模型的上限,特征则是对数据的表达,特征工程就是利用工程化的方法寻找对数据更好的表达。在推荐系统中,数据分为用户信息、物品信息和场景信息。推荐系统的特征工程就是利用工程手段从“用户信息”“物品信息”“场景信息”中提取特征的过程。 构建推荐系统特征工程的原则 由于用户的行为数据是原始的,是具体的,要从中抽取出某种数学形式的特征,就涉及到信息的损失。另一方面,用户的行为数据中又有很多冗余的、无用的信息,这些信息都考虑进来会损害模型的泛化能力。因此,构建推荐系统特征工程的原则是: 尽可能地让特征工程抽取出的一组特征能够保留推荐环境及用户行为过程中的所有有用信息,尽量摒弃冗余信息 在本次新闻推荐场景中,从我的角度考虑对我重要的新闻有: 对新闻的类型偏好(如科技、旅游、非娱乐) 新闻的热门程度(如抗疫、时事) 新闻相关程度(如嫦娥5号系列报道) 新闻发出的时间(大多新闻都会在饭点看) 看是由哪个订阅号发的新闻(保证权威性及类型偏好) 看新闻时的状态(烦躁时会看些有趣的) 将这些要素转换成特征,基于本次新闻推荐多路召回后的数据,即(用户,新闻

iPhone为盲人自动识别并标记按钮和UI功能

梦想的初衷 提交于 2020-12-05 09:57:25
苹果一直不遗余力地为残障用户构建功能,iOS上的VoiceOver对于视力障碍的人来说是无价的工具,假设界面的每个元素均已手动标记。但是该公司刚刚推出了一项全新功能,该功能使用机器学习来自动识别并标记每个按钮,滑块和标签。 屏幕识别(iOS 14中现已提供)是一种计算机视觉系统,已经对正在使用的应用程序的数千张图像进行了培训,可以学习按钮的外观,图标的含义等。 现在在任何应用程序中,用户都可以调用该功能,并且在不到一秒钟的时间内,屏幕上的每个项目都将被标记。 在iOS 13中,苹果自动为图标添加了标签,屏幕识别又向前迈出了一步。我们可以查看屏幕上的像素,并确定可以与之交互的对象的层次结构,所有这些操作都在设备上的十分之一秒之内发生。 佛山市东联科技有限公司表示:“这项新功能应有助于使数以百万计的应用程序更容易被视力障碍的用户完全可以访问。” 您可以通过以下方法打开它:“辅助功能”设置,然后依次选择“ VoiceOver”和“ VoiceOver识别”,在此处可以打开和关闭图像,屏幕和文本识别。(欢迎转载分享) 来源: oschina 链接: https://my.oschina.net/u/4283198/blog/4775765

Python人体肤色检测

走远了吗. 提交于 2020-12-02 10:08:25
代码地址如下:<br> http://www.demodashi.com/demo/12967.html Python人体肤色检测 概述 本文中的人体肤色检测功能采用 OpenCV 库实现, OpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉库,可以运行在Linux、Windows、Android和Mac OS操作系统上. 它轻量级而且高效——由一系列 C 函数和少量 C++ 类构成,同时提供了Python、Ruby、MATLAB等语言的接口,实现了图像处理和计算机视觉方面的很多通用算法. 本文主要使用了OpenCV的图像色域转换, 颜色通道分割, 高斯滤波, OSTU自动阈值等功能. 参考资料 OpenCV探索之路:皮肤检测技术 学习OpenCV—肤色检测 准备工作 安装 Python-OpenCV 库 pip install opencv-python -i https://mirrors.ustc.edu.cn/pypi/web/simple 利用 -i 为pip指令镜像源, 这里使用电子科技大学的源, 速度比官方源更快. 安装 Numpy 科学计算库 pip install numpy -i https://mirrors.ustc.edu.cn/pypi/web/simple 图像的基本操作 import numpy as np import cv2