深度学习

2020 LF AI & DATA Day 圆满落幕

ε祈祈猫儿з 提交于 2020-11-10 21:26:14
上周六 (11/7)于深圳鹏城实验室举行的 2020 LF AI & DATA Day 圆满结束。在这次的技术分享活动上,来自鹏城实验室、启智社区、MindSpore 社区、华为、腾讯、百度、ZTE、Zilliz、滴滴等资深 AI 专家齐聚一堂,分享了他们在开源与 AI 的建设与创新。 大会开场 图: 新一代人工智能产业技术创新战略联盟开源工作组组长、OpenI 启智平台秘书长刘明 (左上)、 鹏城实验室人工智能研究中心副主任田永鸿 (右上)、 OpenI 启智社区运营中心主任 余跃 (左下)、 LF AI & DATA APAC 总监杨轩 (右下)开场致辞 活动首先由 新一代人工智能产业技术创新战略联盟开源工作组组长刘明 、 鹏城实验室人工智能研究中心副主任田永鸿 ,OpenI 启智社区运营中心主任余跃与 LF AI & DATA 亚太总监杨轩做了精彩的开场。并且宣布未来 三方将加强合作,一同为全球各地开源社区助力。 图:LF AI & DATA 基金会理事会主席星爵进行现场分享 接着, LF AI & DATA 基金会理事会主席星爵为大家介绍了基金会发展近况。 2020 年是一个不平凡的一年,政府与各级组织纷纷支持以开源的方式来作为科技创新的重要的力量。 同时,从资本界来讲,开源获得的关注也是空前的。今年,中国开源项目也逐渐受到了资本的重视,估计今年中国开源项目共已获得了 将近

技术实践丨基于MindSpore的ResNet-50蘑菇“君”的识别应用体验

与世无争的帅哥 提交于 2020-11-10 18:03:18
本文分享自华为云社区 《基于MindSpore的ResNet-50蘑菇“君”的识别应用体验》 ,原文作者: Dasming 。 摘要:基于华为MindSpore框架的ResNet-50网络模型,实现6714张共10类蘑菇图片的识别分类训练。 背靠全新的设计理念,华为云推出了 MindSpore深度学习实战营,帮助小白更快的上手高性能深度学习框架,快速训练ResNet-50,实现你的第一个手机App开发,学会智能新闻分类、篮球检测和「猜你喜欢」模型! MindSpore深度学习实战营,通过 21天的合理课程安排,不仅提供目前大热的移动端部署介绍,还有紧跟时事的趣味实践,更有深度的底层开发讲解,让你从框架到算法到开发,都能一网打尽。 在MindSpore21天实战第三堂课,由王辉老师分享了基于MindSpore的ResNet-50的识别推理模型,如何应用在“蘑菇’君’是否有毒?”的检测场景。 ResNet之前的状况是: CNN能够提取low/mid/high-level的特征,网络的层数越多,意味着能够提取到不同level的特征越丰富。并且,越深的网络提取的特征越抽象,越具有语义信息。而实际随着神经网络层数的增加,梯度消失或者爆炸导致深层网络很难训练。 对于该问题的解决方法是正则化初始化和中间的正则化层(Batch Normalization),这样的话可以训练几十层的网络

下一个十年,Python的“王者”地位还保得住吗?

爱⌒轻易说出口 提交于 2020-11-10 13:13:51
作者 | Bharath K 译者 | Sambodhi 策划 | 刘燕 甭管唱反调的人怎么唱衰,Python 在下一个十年仍然很重要,并且会与时俱进。 本文最初发表在 Medium 博客上,经原作者 Bharath K 授权,InfoQ 中文站翻译并分享。 Python 是一门了不起的编程语言,它改变了游戏规则,将编程的格局提升到了一个完全不同的层次。Python 的迅速崛起对整个行业来说都是极其有利的,但是当它越来越受欢迎时,却总是受到批评。 最近,我看过一些文章和视频,它们似乎都在表明,Python 的辉煌时代行将终结。 由 Python 引发的批评经常有:“它是一种缓慢的语言”、“全局解释器锁”、“动态类型”,“移动应用程序缺乏支持”等。 所有的批评都正确吗?它们真的重要吗? 在这个十年的剩余时间里,Python 还能如此重要以及保持完整性吗? 今天,我们将对事实进行分析,破除一些误解。 闲话少叙,言归正传! Python 三大主要槽点,但所有的批评都正确吗? (一)、Python “非常缓慢” 不可否认的是,与 C、C++、Java 等编程语言相比,Python 的速度的确非常缓慢。那些编程语言之所以速度更快,主要原因之一是,它们是静态类型的,而 Python 是一种动态类型的编程语言。 这些语言是在运行之前就进行编译的,而 Python 是在运行时编译。 Python

【秋招总结】渣本Java应届生如愿以偿拿到阿里跟腾讯offer(双offer面经)

蓝咒 提交于 2020-11-10 11:55:14
前言 今年9月10月份,每天苦逼的刷着群里更新的面试题,逛着群文件里面的大厂面试,每天的心情就像一个一首歌,“山路十八弯”。 点击此处免费进群,暗号:CSDN 看过别人发的腾讯大厦,幻想过腾讯大厦向外看的感觉。 大一暑假去过阿里杭州园区,担忧自己有没有机会再去。 真的没想到迷茫中的自己等来了腾讯,又迎来了阿里。 终有一天,梦想实现,想起阿里园区中的一句话, “谢谢那个曾经努力的自己” 。 面试情况 腾讯(WXG微信支付) 投的是CSIG云产业群,意外的被WXG微信组捞起,感谢机缘巧合吧。 腾讯简历面(编程 + 33分35秒) 记事本里手写OOP实现一个签到的程序。 从一堆数字中O(n)找不重复的数字。 字符串处理,魔改KMP。 数学智力题,64匹马取前8,问最快要几次。11次。 简历面,问项目做了什么,主要的技术栈。 腾讯一面(41分38秒) 深入问了我项目。 线程池,连接池,各自优点。 Java常见设计模式。 讲讲builder建造者模式。这个答的不太好。 TCP/UDP区别,什么时候该用什么。 UDP实现TCP。 设计一个APP,TCP/UDP具体运用。 数据库索引,数据库引擎。 学习方向,我说C++/Java/Python比较均衡。 科技创新立项都做了什么。 没给我机会问问题,大概还是我太菜了。 腾讯二面(视频面试,75分钟,主要是写代码) ACM复杂规则模拟

2020CCFBDCI训练赛之室内用户时序数据分类baseline

倖福魔咒の 提交于 2020-11-10 11:52:09
室内用户时序数据分类 赛题介绍 数据简介 数据分析 Baseline程序 提交结果 赛题介绍 赛题名 :室内用户运动时序数据分类 赛道 :训练赛道 背景 :随着数据量的不断积累,海量时序信息的处理需求日益凸显。作为时间序列数据分析中的重要任务之一,时间序列分类应用广泛且多样。时间序列分类旨在赋予序列某个离散标记。传统特征提取算法使用时间序列中的统计信息作为分类的依据。近年来,基于深度学习的时序分类取得了较大进展。基于端到端的特征提取方式,深度学习可以避免繁琐的人工特征设计。如何对时间序列中进行有效的分类,从繁芜丛杂的数据集中将具有某种特定形态的序列归属到同一个集合,对于学术研究及工业应用具有重要意义。 任务 :基于上述实际需求以及深度学习的进展,本次训练赛旨在构建通用的时间序列分类算法。通过本赛题建立准确的时间序列分类模型,希望大家探索更为鲁棒的时序特征表述方法。 比赛链接 : https://www.datafountain.cn/competitions/484 数据简介 数据整理自网上公开数据集UCI(已脱敏),数据集涵盖2类不同时间序列,该类数据集广泛应用于时序分类的业务场景。 文件类别 文件名 文件内容 训练集 train.csv 训练数据集标签文件,标签CLASS 测试集 test.csv 测试数据集标签文件,无标签 字段说明 字段说明.xlsx 训练集

字节跳动招聘机器学习岗位,大家炸了!

一个人想着一个人 提交于 2020-11-10 05:31:29
只要一家互联网公司的营收超过 5 个亿,那我可以确定的说,这家公司需要具备机器学习的能力。 为什么呢? 因为大部分互联网公司的盈利模式基本都会围绕搜索、推荐和广告而去。 就比如极客时间,他的课程越来越多,如果能准确的给每位用户推荐合适的课程,那他们课程的转化率自然会提高。这就像美团外卖一样,把对你味口的餐馆推荐给你,你自然会买。 所以,前段时间有学弟还问我说,是不是机器学习行业已经达到饱和了,我就把上面的分析给他说了一遍。但是,我也清楚的知道,这个行业里一点都不缺初级的机器学习工程师,一点都不缺只会调包的算法工程师,因为这一点门槛都没有。你总不能说找不到好的工作,就说行业饱和了。难不成你到哪,哪的大环境都不好,感情你是环境破坏者? 当然,我们也不可否认,现在已经过了人工智能的红利期,企业在招聘时,更为看重的是候选人的实干能力。就像我一个朋友说的,企业要找的是能干活的人。而这类人,又需要具备三个能力,分别是 编程实现、数学基本功以及是否有一套成熟的建模方法论。 这些能力对于一个机器学习工程师至关重要,但又要如何具备这些能力呢?如何成为一个能落地的实干型机器学习工程师呢? 不卖关子, 我向你推荐我和极客时间合作的机器学习训练营,如果你想成为机器学习工程师,或者说想把机器学习当成一项提升自己竞争力的技能,那欢迎你的加入。 1 我是谁? 我是王然,目前是众微科技 AI Lab 负责人

常见面试算法:回归、岭回归、局部加权回归

五迷三道 提交于 2020-11-10 03:37:22
向AI转型的程序员都关注了这个号 👇👇👇 大数据挖掘DT机器学习 公众号: datayx 回归(Regression) 概述 我们前边提到的分类的目标变量是标称型数据,而回归则是对连续型的数据做出处理,回归的目的是预测数值型数据的目标值。 回归 场景 回归的目的是预测数值型的目标值。最直接的办法是依据输入写出一个目标值的计算公式。 假如你想要预测兰博基尼跑车的功率大小,可能会这样计算: HorsePower = 0.0015 * annualSalary - 0.99 * hoursListeningToPublicRadio 这就是所谓的 回归方程(regression equation) ,其中的 0.0015 和 -0.99 称作 回归系数(regression weights) ,求这些回归系数的过程就是回归。一旦有了这些回归系数,再给定输入,做预测就非常容易了。具体的做法是用回归系数乘以输入值,再将结果全部加在一起,就得到了预测值。我们这里所说的,回归系数是一个向量,输入也是向量,这些运算也就是求出二者的内积。 说到回归,一般都是指 线性回归(linear regression) 。线性回归意味着可以将输入项分别乘以一些常量,再将结果加起来得到输出。 补充: 线性回归假设特征和结果满足线性关系。其实线性关系的表达能力非常强大,每个特征对结果的影响强弱可以由前面的参数体现

ubuntu16.04安装cuda,无法定位软件包问题

一笑奈何 提交于 2020-11-10 01:46:31
为了学习深度学习,这几天在安装深度学习框架,cuda安装时却出现无法定位软件包的问题。cuda官网下载时提供了deb和run格式,今天只讲deb格式的安装包安装过程的问题。 按照官方教程,下载好cuda deb包后,分别用 sudo dpkg - i XXX.deb sudo apt update sudo apt install cuda 运行即可,一开始没太懂,安装了cuda9.1,发现版本太高,于是又重新下载cuda8.0,可是按上面步骤安装时还是给我安装的是9.0版,其实在sudo apt update 的时候就能看到,那里有cuda9.0和8.0的安装源,好像系统自动下载9.0, 于是我在系统设置里把9.0的安装源删除 后来忘了出于何种考虑把8.0的下载源也删除了,因为dpkg -i执行后会默认添加更新源嘛,可是后来问题出现了,执行dpkg -i 后,更新软件源,一直不见添加cuda的下载源进去,一时不知所措,不知道是什么原因导致,一度怀疑是cuda deb包有问题,可是这几天开始NVIDIA官网被限制访问,一点下载就提示它未在国内备注,没办法重新下载一个安装包,网上搜了各种办法都没办法解决,最后实在没招了。网上提供的方法大多是让sudo apt update更新下载源,或者更新系统下载源,因为cuda本不是从系统源里下载的,deb是一个离线安装的版本,对我没什么用

一幅图像能顶16x16字!——用于大规模图像缩放识别的变压器(对ICLR 2021年论文的简要回顾)

五迷三道 提交于 2020-11-10 00:27:32
作者|Stan Kriventsov 编译|Flin 来源|medium 在这篇博文中,我想在不作太多技术细节的情况下,解释其作者提交给2021 ICLR会议的新论文“一张图等于16x16个字:用于大规模图像识别的变压器”的意义(目前为止匿名)。 另一篇文章中,我提供了一个示例,该示例将这种新模型(称为Vision Transformer,视觉变压器)与PyTorch一起用于对标准MNIST数据集进行预测。 自1960年以来深度学习(机器学习利用神经网络有不止一个隐藏层)已经问世,但促使深度学习真正来到了前列的,是2012年的时候AlexNet,一个卷积网络(简单来说,一个网络,首先查找小的图案在图像的每个部分,然后尝试将它们组合成一张整体图片),由Alex Krizhevsky设计,赢得了年度ImageNet图像分类竞赛的冠军。 AlexNet: https://en.wikipedia.org/wiki/AlexNet ImageNet图像分类竞赛: https://en.wikipedia.org/wiki/ImageNet 在接下来的几年里,深度计算机视觉技术经历了一场真正的革命,每年都会出现新的卷积体系结构(GoogleNet、ResNet、DenseNet、EfficientNet等),以在ImageNet和其他基准数据集(如CIFAR-10、CIFAR-100

Using DeepChem with Amazon SageMaker for virtual screening

人走茶凉 提交于 2020-11-09 05:10:51
https://amazonaws-china.com/blogs/machine-learning/using-deepchem-with-amazon-sagemaker-for-virtual-screening/ Virtual screening is a computational methodology used in drug or materials discovery by searching a vast amount of molecules libraries to identify the structures that are most likely to show the target characteristics. It is becoming a ground-breaking tool for molecular discovery due to the exponential growth of available computer time and constant improvement of simulation. Deep learning technologies are widely used in this computational virtual compound screening, and such