机器学习

疫情肆虐,AI如何抗击二战以来最严重的的全球危机?

人走茶凉 提交于 2020-12-18 10:43:37
图源:iStockphoto 正如联合国秘书长古特雷斯所说的,新冠疫情可能是二战以来最严重的全球危机了,它已经给全世界造成了极大的破坏。 而不同历史上的抗疫,这一次,科技手段成为对抗疫情的中坚力量,其中也包括AI,人工智能技术在此次疫情中展现出了全新的价值。人类必将战胜这次危机,而人工智能在其中的作用不可小觑。 疫情抗击中的人工智能 新冠肺炎这类疾病传染性极强,通常一爆发就会迅速传播开来,科学家们很难在短时间内找到对抗疫情的良策,而人工智能将成为研究者和科学家的左膀右臂。 此次疫情之中,AI技术显现出许多新价值,这些经验对于下一次的疫情防控有着重要意义。人工智能可以梳理大量的数据,找到其中的联系。所以下次就可以更容易地决定哪种治疗方案更有效,或者应该进行何种实验。 世卫组织上次发布的月报中提到,中国对新冠疫情的抗击中,人工智能和大数据成为了必要的手段。 图源:research-live 此外,一份报告显示,英国初创公司Exscienta成为了今年第一个将AI设计的药物分子投入人体试验的公司。算法仅需要12个月就能完成此项发明,而传统方法则要花费4到5年。人工智能在其中的用处有以下三种: · AI能迅速开发针对新冠肺炎的抗体和疫苗。 · AI能对现存药物进行扫描,并找出其中能进行改进的。 · AI能针对此次和今后的新冠肺炎疫情设计出特效药物。 西雅图人工智能艾伦研究院(AI2

机器学习中的音频特征:理解Mel频谱图

泄露秘密 提交于 2020-12-18 09:37:13
如果你像我一样,试着理解mel的光谱图并不是一件容易的事。你读了一篇文章,却被引出了另一篇,又一篇,又一篇,没完没了。我希望这篇简短的文章能澄清一些困惑,并从头解释mel的光谱图。 信号 信号是一定量随时间的变化。 对于音频,变化的量是气压。 我们如何以数字方式捕获此信息? 我们可以随时间采集气压样本。 我们采样数据的速率可以变化,但是最常见的是44.1kHz,即每秒44,100个采样。 我们捕获的是信号的波形,可以使用计算机软件对其进行解释,修改和分析。 import librosa import librosa.display import matplotlib.pyplot as plty, sr = librosa.load('./example_data/blues.00000.wav')plt.plot(y); plt.title('Signal'); plt.xlabel('Time (samples)'); plt.ylabel('Amplitude'); 我们可以使用音频信号的数字表示形式。 欢迎来到信号处理领域! 您可能想知道,我们如何从中提取有用的信息? 看起来像是一团混乱。 这就引出我们的朋友傅里叶,这里是它最熟悉的领域。 傅立叶变换 音频信号由几个单频声波组成。 在一段时间内对信号进行采样时,我们仅捕获得到的幅度。 傅立叶变换是一个数学公式

微软提出Petridish,完美解决问题的神经网络?

♀尐吖头ヾ 提交于 2020-12-18 08:52:19
来源:www.lovehhy.net 神经架构搜索(NAS)是当前深度学习最热门的话题之一。 什么是NAS方法呢? 从概念上讲,NAS方法专注于为给定问题和数据集找到合适的神经网络体系结构。不妨将这个方法理解为使机器学习架构本身成为机器来学习问题。近年来,NAS技术的数量激增,并且正在更多主流的深度学习框架和平台得到应用。但是,第一代NAS模型在经历神经网络域名变更时遇到了许多困难。因此,寻找新的NAS技术极有可能会继续推动该领域的深层次创新。 来源:www.raincent.com 最近,微软研究院推出了Petridish,一种优化神经网络结构选择的NAS算法。 之所以开发NAS,是因为神经网络的设计过程相当消耗资源。在当前的深度学习生态系统中,借助于知名的,性能一流的网络,数据集可能与之前已被证实的网络所遇到的完全不同,几乎没什么保证。在许多情况下,NAS方法通常需要数百天才能找到好的架构,并且效果几乎很难比随机搜索好。机器学习中还有一个类似于NAS技术挑战的问题:特征选择。 就像NAS方法一样,特征选择算法需要为给定特定数据集的模型提取相关特征。显然,选择特征比神经网络体系结构要简单得多,但是特征选择技术的许多原理为Petridish团队提供了灵感。 获取经验的方式:NAS的简要历史 鉴于NAS方法最近的热度,许多人可能认为NAS是一门新兴学科。 毫无疑问,自2016年以来

2020年,5大顶级数据分析预测

痞子三分冷 提交于 2020-12-18 08:48:58
来源:Pexels “科技进步的速度如此之快,以至于我们无法在新变化出现的同时完全理解它们,”这样的说法并非言过其实。 这既是惊喜,也是惊吓。 如果说2019年,市场营销的某一个领域因为科技发生了翻天覆地的变化,毫无疑问这个领域就是数据分析领域。 商业可以说是一个被数据淹没的领域。 我们挣扎在浩如烟海的数据中,辨别什么信息是重要的、什么信息是不重要的。然而,这一问题还停留在“有就是好”的阶段。但是,对隐私和安全的关注带来了更大的挑战。数据丑闻的发生就像打开了商业领域的潘多拉魔盒,现在每个人都必须面对数据问题。 我们看到的很多关于2020年的趋势预测都围绕着如何应对这些挑战。有些问题与技术相关,有些问题本质上与技术无关。让我们来详细讨论这些问题: 来源:Pexels 1. 增强分析使得数据理解更加容易 2017年,高德纳第一次将增强分析列入其年度新兴技术成熟度曲线报告。在报告中,高德纳将增强分析描述为“数据分析领域的下一波浪潮”。无疑,高德纳一语成真,2019年,增强分析已在数据分析领域成为主流。 对于时间紧张的数据分析及阐释过程,增强分析已被证明可以缓解这一问题。这一技术实质上是专为非技术出身或没有数据科学知识的用户开发的,让他们能够独立开展数据分析。这也免除了数据科学家选择算法的麻烦,他们无需写代码就可以获得数据。 增强分析结合了机器学习和自然语言处理技术

从高校自主芯片生态建设做起,谈自主学习芯片设计的重要性

二次信任 提交于 2020-12-18 03:57:50
2020年7月30日上午的国务院学位委员会会议已投票通过集成电路专业将作为一级学科,并将从电子科学与技术一级学科中独立出来。拟设于新设的交叉学科门类下,将待国务院批准后,与交叉学科门类一起公布。上课时讲到芯片是“点石成金”的行业,如今正在一步步变成现实。另外,把自己学习和科研的方向与国家的迫切需要紧密联系起来,准没错!目前亟待解决的问题不少,简单总结来说,由于固有的学科分类,真正意义上的集成电路设计都依附于各个主流一级学科之下,注意,这里所说的集成电路设计是集成电路一级学科中最重要的一个方向。笔者认为,微电子跟集成电路设计是不一样的。并且,个人始终认为,做芯片的确是交叉学科,微电子专业毕业之后,还是应该学习其它专业的系统知识才能做出来芯片。 专业的事情还是需要专业的人去做 ,比如做CPU芯片还是需要具备计算机领域的知识,做通信芯片还是必须要有通信系统的知识储备才行。否则,仅知道芯片的设计方法而没有深入了解相关领域系统知识的芯片设计者,即便照葫芦画瓢做出来了芯片,也是一颗死芯片,根本不懂其中的内涵和更深层次的系统含义。这也许是设立集成电路一级学科最最重要的一个原因。可能今后相关学科都应该去学习芯片设计。原有学科划分已经不适应科技发展的需要了,人工智能,机器人,集成电路等都是横跨数个原有学科的交叉学科。从某种意义上讲,芯片化是学术研究除了文章之外的另外一种成果形式,可能以后相关学科评估

阿里技术开发(java)一面面经

余生颓废 提交于 2020-12-17 15:27:21
链接: https://www.nowcoder.com/discuss/89653 目录 1、你比较了解的机器学习的算法有哪些,说一下这些算法的过程和区别(因为一开始就跟他坦白说了自己的情况,面试官还是很nice的,从你熟悉的东西入手) 2、网络的体系结构分为哪五层,每层分别有哪些协议 3、TCP和UDP的区别是什么,如果想发送即时消息应该用哪种协议 4、TCP的连接建立和断开的过程(三次握手和四次挥手),如何保证TCP发送的信息是正确的,且保证其先后顺序不被篡改 5、对HTTP协议了解多少,HTTP和HTTPS有什么区别,HTTPS的安全性是怎么实现的 6、平时用mysql用什么引擎 7、数据库事务的特性有哪些 8、事务并发可能会导致哪些问题,数据库的隔离级别有哪些,mysql默认的是哪种级别,这种默认的隔离级别能够避免哪些问题(复习的太久了,有一些忘记了,这个问题居然答得不全) 9、如何判断SQL查询操作是不是慢sql,如何优化 10、进程和线程的区别,进程之间的通信方法 11、死锁是什么,处理死锁的方法有哪些 12、进程同步中的临界区有什么处理方法 13、Tomcat了解吗?linux中的命令了解哪些 14、java线程编程了解吗 15、hashmap的数据结构是什么,具体是怎么实现的,是不是线程安全的(不是),那么它的线程安全的替代有哪些 16、java有多继承吗?(没有

被微软称为 “世界的电脑” ,Azure 到底有多牛?

末鹿安然 提交于 2020-12-17 14:04:52
【文末有福利】 据中国通信院与 Gartner 预测,至 2023 年全球云计算行业规模将达到 3500 亿美元,中国云计算行业规模将达到 3800 亿元。当下,越来越来企业将核心技术互联网化,企业对云计算技术与服务需求日益增多。 据Gartner统计,2019 年全球 IaaS 公有云市场发展强劲,增长37.3%,达 445 亿美元,高于 2018 年的 324 亿美元,其中微软排名第二。早在 2014 年,微软把“移动为先、云为先”作为战略核心。 微软 Azure 为什么称为“世界电脑”? 在智能云和智能边缘的愿景下,微软打造“世界的电脑” Azure 来提供一致性的平台——无论大型公有云数据中心,还是最小的物联网设备,都能获得尽可能一致的服务。据悉,“一致性”涵盖云平台服务管理、安全性、身份认证、性能监控、应用模型、编程模型等方面。 如今 Azure 覆盖全球 58 个区域,并拥有生产力、信任、混合云、智能四大支柱能力。 1、生产力 Azure 支持从 Linux 到 Kubernetes 容器以及各种开源框架和语言。微软 Linux 内核开发人员 Sasha Levin 曾说,微软 Azure 上的 Linux 使用率现已超过了 Windows。 开发者还可用 Azure 扩展 VS Code,通过 Azure DevOps 可对自己 GitHub 上的项目做持续集成。 2

如何利用Python做数据分析 需要学习哪些知识

ぐ巨炮叔叔 提交于 2020-12-17 13:33:05
根据调查结果,十大最常用的数据工具中有八个来自或利用Python。Python广泛应用于所有数据科学领域,包括数据分析、机器学习、深度学习和数据可视化。不过你知道如何利用Python做数据分析吗?需要学习哪些知识?下面就给大家讲解一下。 与数据分析相关的Python库很多,比如Numpy、pandas、matplotlib、scipy等,数据分析的操作包括数据的导入和导出、数据筛选、数据描述、数据处理、统计分析、可视化等等。接下来我们看一下如何利用Python完成数据的分析。 生成数据表 常见的生成方法有两种,第一种是导入外部数据,第二种是直接写入数据,Python支持从多种类型的数据导入。在开始使用Python进行数据导入前需要先导入pandas库,为了方便起见,我们也同时导入Numpy库。代码是最简模式,里面有很多可选参数设置,例如列名称、索引列、数据格式等等。 检查数据表 Python中使用shape函数来查看数据表的维度,也就是行数和列数。你可以使用info函数查看数据表的整体信息,使用dtypes函数来返回数据格式。Isnull是Python中检验空值的函数,你可以对整个数据表进行检查,也可以单独对某一列进行空值检查,返回的结果是逻辑值,包含空值返回True,不包含则返回False。使用unique函数查看唯一值,使用Values函数用来查看数据表中的数值。 数据表清洗

机器学习实用指南:如何从数据可视化中发现数据规律?

£可爱£侵袭症+ 提交于 2020-12-17 10:55:34
机器学习实用指南:如何从数据可视化中发现数据规律? 点击上方“ AI有道 ”,选择“置顶”公众号 重磅干货,第一时间送达 本系列为《Scikit-Learn 和 TensorFlow 机器学习指南》的第四讲。上文请见下面这篇文章: 机器学习实战指南:如何入手第一个机器学习项目? 目前为止,我们已经对数据有了初步的认识,大体上明白了我们要处理的数据类型。现在,我们将进入更深入的研究。 首先,确保已经划分了测试集并放置一边,我们只会对训练集进行操作。另外,如果训练集很大,可以从中采样一些作为探索集(exploration set),方便进行快速处理。在我们这个例子中,数据集比较小,所以直接在训练集上处理即可。我们还要创建一个训练集的复制副本,这样就不会改动原来的训练集了。 housing = strat_train_set.copy() 1. 地理数据可视化 因为数据集中包含了地理位置信息(经纬度),所以创建所有地区的散点图来可视化数据是个好主意(如下图所示)。 这看起来有点像加州,但是很难看出任何规律。我们设置参数 alpha = 0.1,这样就更容易看出数据点的密度了(如下图所示)。 housing.plot(kind="scatter", x="longitude", y="latitude", alpha=0.1) 现在,我们可以很清晰地看出这些密度较大的区域了。 通常来说

致考研!谈谈我是如何考上北大的

∥☆過路亽.° 提交于 2020-12-17 10:54:27
致考研!谈谈我是如何考上北大的 点击上方“ AI有道 ”,选择“置顶”公众号 重磅干货,第一时间送达 图:北大未名湖畔 明天就是 2019 年全国硕士研究生入学考试的日子了。许久没有关注考研信息,今天颇有感慨,想跟大家谈一谈我的考研之路。我将分几个方面来说,可能比较琐碎,但都是我的真实经历,希望能给你一些经验和心得。 很多读者朋友通过博客、知乎、微信公众号认识我,看我的文章,但是可能对我也并不了解。我是 2012 年考入北大硕士的,2015 年顺利毕业,现在主要从事机器学习、深度学习相关领域的研究和工作。 好了,正文开始! 1. 为什么考研? 这是一个很多在大学阶段考研之前大家都会想的一个问题,我也不例外。我本科就读于一所 211 高校。其实,对于是否考研这个问题,我从入学开始就比较确定的,一定会考研。因为我觉得高考并没有发挥正常,心里总有一个名校梦,当时就给自己设定了要考研、继续深造的志愿。应该说,我是学习型的,虽然刚入学的时候也想加入一些社团、学生会,但后来觉得用处不大,或者说自己也不适合,没有时间和精力。索性安心上课、自习,倒也轻松。不过,机缘巧合,也先后担任过班级的学委和班长,这方面对自己的锻炼也挺大的,收获了不少东西。 有的读者可能会问:既然刚开始就准备考研,那么肯定从大一就开始死学吧?对我而言其实不然。虽然我也始终把学习放在第一位,争取每个学年的奖学金