机器学习

陈丹琦、杨笛一、李宏毅荣获Salesforce AI研究基金,每人5万美元!

微笑、不失礼 提交于 2021-01-30 11:53:18
作者:陈大鑫 转载自:AI科技评论 原文链接: 陈丹琦、杨笛一、李宏毅荣获Salesforce AI研究基金,每人5万美元! ​ mp.weixin.qq.com 昨日,Salesforce研究院宣布了2020年度Salesforce人工智能研究基金的获奖者。本年度一共有六位AI领域的学者入选,其中就包括大家比较熟知的 陈丹琦 和 杨笛一 。 Salesforce研究院将为每一位获奖者提供5万美元的资助,以推动他们的研究工作来帮助塑造人工智能的未来。 据了解这是Salesforce第三年提供这项研究基金,本次申请人数破了纪录。一共有来自30多个国家的180多个高质量学进行申请。在这轮申请中,Salesforce研究院最终根据申请提案质量、idea的新颖性以及与Salesforce提出的研究课题的相关性,授予6位AI学者研究基金资助。 以下对陈丹琦和杨笛一二人做简单介绍。 陈丹琦 陈丹琦目前为普林斯顿大学计算机系助理教授。陈丹琦在高中期间参加第 20 届国际信息学奥林匹克竞赛 (IOI2008) 获得金牌被保送到清华姚班,后直博到斯坦福大学。 在斯坦福期间,陈丹琦发表的论文《A Fast and Accurate Dependency Parser using Neural Networks》堪称 深度学习依存分析方法的“开山之作 ”,她和曼宁教授提出的方法在保持精度的前提下

Hinton最新访谈:无监督胶囊网络、对比学习以及大脑中的反向传播

走远了吗. 提交于 2021-01-30 11:53:00
来源 | 数据实战派 转载自:AI科技评论 原文链接: Hinton最新访谈:无监督胶囊网络、对比学习以及大脑中的反向传播 ​ mp.weixin.qq.com Geoff Hinton 是公认的深度学习先驱。2018 年,他与 Yoshua Bengio、Yann LeCun 共同获得了图灵奖。而在这之前的一年,他提出了一个想法 —— 胶囊网络(Capsule Network)。这是卷积神经网络的替代方案,它考虑了物体在 3D 世界中的姿势,尝试弥补当今计算机视觉模型学习能力上的不足,比如学会从不同的角度来识别同一个物体。 从那之后, Hinton 在学术界的公开活动有所沉寂。直到2020 年 12 月,在 NeurIPS 上,他的团队介绍了一项堆叠式胶囊自动编码器(stacked capsule autoencoders)相关的研究成果。更早之前 2 月的 AAAI 会议上,他谈到,胶囊网络是无监督学习的关键。4 月,Hinton 又重新提出了将反向传播作为人类大脑中的一种学习功能,并介绍了近似反向传播的算法 ——用活动差异表示神经梯度(neural gradient representation by activity differences,简称 NGRAD)。 近日,在播客节目 Eye on AI 中,受到播客主理人、纽约时报资深记者 Craig Smith 的邀请

【原创】大数据基础之ETL vs ELT or DataWarehouse vs DataLake

百般思念 提交于 2021-01-30 02:51:16
ETL ETL is an abbreviation of Extract, Transform and Load. In this process, an ETL tool extracts the data from different RDBMS source systems then transforms the data like applying calculations, concatenations, etc. and then load the data into the Data Warehouse system. In ETL data is flows from the source to the target. In ETL process transformation engine takes care of any data changes. ELT ELT is a different method of looking at the tool approach to data movement. Instead of transforming the data before it's written, ELT lets the target system to do the transformation. The data first copied

必备干货 | Hbase简介以及数据结构和表详解

喜欢而已 提交于 2021-01-30 01:03:08
注:此文章内容均节选自充电了么创始人,CEO兼CTO陈敬雷先生的新书 《分布式机器学习实战》(人工智能科学与技术丛书)【陈敬雷编著】【清华大学出版社】 文章目录 前言 Hbase原理和功能介绍 1. Hbase特性 2. Hbase的架构核心组件 Hbase数据结构和表详解 总结 前言 Hbase 经常用来存储实时数据,比如Storm/Flink/Spark-Streaming消费用户行为日志数据进行处理后存储到Hbase,通过Hbase的API也能够毫秒级别的实时查询。如果是对Hbase做非实时的离线数据统计,我们可以通过Hive建一个到Hbase的映射表,然后写Hive SQL来对Hbase的数据进行统计分析。并且这种方式可以方便的和其它的Hive表做关联查询,做更复杂的统计。所以从交互形势上Hbase满足了实时和离线的应用场景,在互联网公司应用的也非常普遍。 Hbase原理和功能介绍 HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop项目的子项目

推荐 :一文带你熟悉贝叶斯统计

萝らか妹 提交于 2021-01-29 04:47:10
作者:Matthew Ward 翻译:陈之炎 校对:陈丹 本文 约5000字 ,建议阅读 10+ 分钟 本文为你带来贝叶斯统计的基础示例及全面解释。 图:Unsplash,Chris Liverani 贝叶斯统计这个术语最近被广泛使用。它常用于社交场合、游戏和日常生活中,如棒球、扑克、天气预报、总统选举投票等。 在许多科学领域,可以用贝叶斯统计来确定粒子物理和药物有效性实验的结果,它还可用于机器学习和人工智能,以预测你想看什么新闻故事或观看什么Netflix节目。 不管是否对它有充分的理解,贝叶斯统计已融入了我们的日常生活当中,为此,笔者想通过本文对贝叶斯统计做全面的解读,通过一个详尽的例子来展示这个术语的含义。一旦你理解了这个例子,那么便基本上理解了贝叶斯统计。 首先,在读本文之前,假设读者事先对Bayes定理有所熟悉,愿意把公式当成一个黑匣子的读者,也不成问题。如果需要复习一下贝叶斯定理的话,可以到 Medium resources(https://towardsdatascience.com/bayes-theorem-the-holy-grail-of-data-science-55d93315defb)中查找相关资源。 示例和原始观察 这是教科书中经常用到的一个经典例子,我是十多年前在John Kruschke的《DoingBayesian Data Analysis:

据说是程序员才看懂的段子。。。

旧巷老猫 提交于 2021-01-29 04:21:07
0. 写完代码不知道这行代码是干嘛的,但是又不敢删掉。。。 1. 前端 vs 后端 2. 那些年暗恋的前任们 3. 今天公司新来了个妹子后,程序员们的反应 4. 程序员 vs *** 5. 第一行代码 vs 两小时后的代码 6. 如果选择适合你的系统 ** 客户期望的效果 vs 实际交付的效果** 8. 十万个为什么。。。 9. 论执行权限的作用 10. 代码没写注释的后果 11. 程序员穿着图解析 12. 什么是递归? 13. 当程序员们当了爸爸后。。。 ** 程序员眼中的技术支持** 15. 急招美工??? 16. 全球最佳浏览器。。。用于下载其它浏览器 17. 什么是机器学习? ** 当你在学习 ++ 操作的时候** 19. 做程序员是一件很轻松愉快的事 ** C vs C++** 程序员节 是一个国际上被众多科技公司和软件企业承认的业内人士节日。日期是在每年的第 256(十六进制为 0x100,或 28 )天,也就是平年的9月13日或闰年的 9 月 12 日。它是俄罗斯的一个官方节日,其他国家的程序员社区也庆祝这个节日。之所以选择 256(28),是因为它是一个被程序员们所熟知的 8 比特基数。用 1 个字节(等于 8 比特)最多能表示 256 个数值,而且在平年中,256 是 2 的最大幂中小于 365 的值。与此同时,也有人提出象征 2 的 10 次方(210=1024

斯坦福教授| 什么是博士论文?

≡放荡痞女 提交于 2021-01-28 14:39:07
本文中的闪图复制自北岭加州州立大学(California State University, Northridge) 网页 https://www. csun.edu/~vcpsy00h/crea tivity/define.htm 注:文末附交流群,最近赶ACL,比较忙,很多同学加了没有回过期了,可以重新加一下,备注好的一定会回复,敬请谅解。 这是我在1993年写给一名学生的信,内容涉及他的论文初稿。2003年,我修改了一下这封信,删除了与该学生相关的具体内容,并将修改后的这封信作为对所有研究生的额外知识要求。 I wrote this in 1993 as a letter to a student concerning a draft of his dissertation. in 2003 I edited it to remove some specific references to the student and present it as a small increment to the information available to my grad students. --spaf 先让我以一些看似显而易见的事情开始。Let me start by reviewing some things that may seem obvious: 第一

EventMesh:微众银行开源的新型云原生事件驱动架构实践

二次信任 提交于 2021-01-28 09:18:42
前言 2020 年微众银行在 GitHub 上正式开源了 EventMesh。 EventMesh 和 DeFiBus一起作为微众银行已经开源的项目,目前支撑了微众银行每天亿级的金融交易。 作为一个动态插件式云原生基础服务,EventMesh 提供了灵活,可靠和快速的事件分发与处理,并且可进行管理。本篇文章将围绕 EventMesh 起源及原理等方面进行介绍,并结合微众银行的实践经验带领大家一起探索事件驱动架构。 01 什么是事件驱动架构 近年来,随着微服务、云原生和 Serverless 概念的普及以及容器化技术的发展,事件驱动也再次成为热点,引起IT界广泛的关注。事件驱动架构是一种用于设计应用的软件架构和模型。对于事件驱动系统而言,事件的捕获、通信、处理和持久保留是解决方案的核心结构。事件驱动架构可以最大程度减少耦合度,很好地扩展与适配不同类型的服务组件,因此是现代化分布式应用架构的理想之选。 解耦 基于这种松耦合,微服务可以用不同的语言实现。解耦后的微服务能够轻松地在网络上相互独立地扩展,通过动态添加或删除事件生产者和消费者来修改他们的系统,而不需要更改任何微服务中的任何逻辑。 基于推送通知的消息传输机制 事件驱动的体系结构中,客户端无需轮询就可以接收更新,事件在到达事件存储后就会通知给客户端,客户端可以随时接收更新,这对于动态数据转换、分析和数据科学处理非常有用。

我们的大脑,足以理解大脑本身吗?

早过忘川 提交于 2021-01-28 07:13:36
来源: 利维坦 树突(红色)神经元的分支过程,接收突触信息的突出棘的渲染,以及来自小鼠大脑皮层的饱和重建(多色圆柱体)。© Lichtman Lab at Harvard University 利维坦按: 关于大脑,你可以用这句话来自问:你 凭什么 觉得自己可以理解它呢?你或许会回答说:凭大脑。即,凭借大脑来理解大脑。但问题是,这两个“大脑”的信息匹配度或许存在很大差异。这就如同文中博尔赫斯那篇关于帝国地图的精妙描述:所有地图的绘制之所以能够以比例成图,就在于忽略掉了现实的很多细节,可试想,如果真要绘制一幅 囊括一切 细节 的地图,那么这张地图无疑与真实国度的比例相同了。 同理,鉴于我们目前对于脑内的这坨物质理解十分有限,所以,如何再描述“理解”可谓十分重要了。也许,未来人类对于人脑的理解可以非常接近我们的人脑地图“比例”,但,无限接近也仅仅是无限接近。 在去年秋天一个寒冷的夜晚,紫红的太阳缓缓坠落,我坐在哈佛大学郊外的办公室里,透过落地窗凝视着窗外的虚无,思考着关于老鼠大脑的数据集。 与此同时,我回想起波士顿市中心那些没有窗户的冰冷房间,那里的高性能计算中心存储着我宝贵的48TB数据。作为博士实验的一部分,我用了13万亿个字节来记录数据,并研究 老鼠大脑的视觉皮层是如何对运动做出反应的 。 如果将数据集按双倍行距打印出来,需要1160亿张纸。但当我写完关于这些数据的故事时