机器学习

都 2021 年了,Serverless 能取代微服务吗?

 ̄綄美尐妖づ 提交于 2020-12-24 14:40:26
简介: 马上就要 2021 年了,Serverless 是否终将取代微服务?从微服务到 Serverless 需要经过怎样的路径?本文将对 Serverless 与微服务在优势劣势上进行深度对比。 来源 | Serverless 公众号 编译 | OrangeJ 作者 | Mariliis Retter “Serverless 能取代微服务吗?” 这是知乎上 Serverless 分类的高热话题。 有人说微服务与 Serverless 是相背离的,虽然我们可以基于 Serverless 后端来构建微服务,但在微服务和 Serverless 之间并不存在直接的路径。也有人说,因为 Serverless 内含的 Function 可以视为更小的、原子化的服务,天然地契合微服务的一些理念,所以 Serverless 与微服务是天作之合。马上就要 2021 年了,Serverless 是否终将取代微服务?从微服务到 Serverless 需要经过怎样的路径?本文将对 Serverless 与微服务在优势劣势上进行深度对比。 从概念上讲,微服务完全符合 Serverless 功能结构,微服务可以轻松实现不同服务的部署和运行时隔离。在存储方面,像 DynamoDB 这样的服务可以让每个微服务拥有独立的数据库,并独立地进行扩展。 在我们深入探讨细节之前,先别急着“站队”

Gartner:2021 年塑造未来的 9 大技术趋势

坚强是说给别人听的谎言 提交于 2020-12-24 13:47:01
Gartner’s Top Nine Strategic Tech Trends For 2021 编者按:今年由于疫情的关系,一些原本比较平稳的趋势得到了加速。总来说,因为疫情导致人与人之间被迫保持物理隔离,通过技术让大家(企业与客户,企业内部,以及企业与伙伴)保持虚拟连接的需求就显得更加迫切。Gartner对2021年的热门技术趋势做出了预测,发表在CRN上,标题是:Gartner’s Top Technology Trends That Will Define 2021。 Last week, Gartner, Inc. announced its top nine strategic technology trends for 2021. Analysts presented their findings during Gartner IT Symposium, which was virtual this year due to the Covid-19 pandemic. Just as the pandemic reshaped the conference, it has also reshaped the trends, as many of them are brought about or will be emphasized to a greater

根据标签分布来选择损失函数

徘徊边缘 提交于 2020-12-24 09:34:48
来自 | 知乎 作者丨马东什么 来源丨https://zhuanlan.zhihu.com/p/304462034 编辑丨极市平台 本文仅作学术交流,如有侵权,请联系后台删除。 本文 约2000字 ,建议阅读 5 分钟 本文介绍了损失函数与标签分布的联系。 首先回到经典的面试问题: 为什么线性回归使用mse作为损失函数? 为什么逻辑回归二分类常用二元交叉熵作为损失函数? 熟悉lgb、xgb或者是sklearn中的各类回归模型包括了线性回归,tweedie回归等等应该都比较熟悉,我们在模型的框架之下可以选择不同的损失函数,以lightgbm为例: 针对于回归问题有非常多的备选损失函数,那么这些损失函数什么时候用,为什么? 回到基本面试问题,首先我们需要知道的是, 使用特定损失函数的前提是我们对标签的分布进行了某种假设,在这种假设的前提下通过极大似然法推出所有样本构成的极大似然公式,然后再使用凸优化的方法比如常见的梯度下降法进行求解。 以常见的二分类问题和回归问题为例: 二分类问题的常见假设就是标签服从伯努利分布: 伯努利分布 是一个离散型机率分布。试验成功,随机变量取值为1;试验失败,随机变量取值为0。成功机率为p,失败机率为q =1-p,N次试验后,成功期望为N*p,方差为N*p*(1-p) ,所以伯努利分布又称两点分布。 观察到的数据为D1,D2,D3,...,DN

Yoshua Bengio:深度学习的未来需要“探索高级认知的归纳偏置”

北战南征 提交于 2020-12-24 09:32:06
来源:AI科技评论 编译:Mr Bear 本文介绍了Yoshua Bengio及其学生Anirudh Goyal近期发表的一篇论文,该论文围绕“归纳偏置”概念,展开了对当下人工智能研究现状的讨论,并提出了富有启发性的观点:不同的深度学习架构基于不同的归纳偏置,探索更大范畴的归纳偏置,是实现人工智能研究进步的关键。 该论文篇幅长达43页,讨论的主题有: 深度学习是否收敛? 归纳偏置是什么 基于高级认知的归纳偏置是通向分布外泛化系统的途径 因果依赖的声明性知识 高级认知的生物学启示与表征 近期与扩展归纳偏置相关的工作 未来的研究方向 回顾过去:与经典符号AI的关系 AI科技评论编译了“归纳偏置是什么”以及“未来的研究方向”两部分的内容,希望对读者有所启发。 论文:Inductive Biases for Deep Learning of Higher-Level Cognition 地址:https://arxiv.org/pdf/2011.15091.pdf 我们不妨做出一个有趣的假设:可以通过一些原理(而非广博的启发式方法)来解释人类和动物的智能。 如果这个假设成立,那么我们就可以更容易地理解人类本身的智能并且构建智能机器。正如在物理学中的那样,这些原理并不足以预测像大脑这样的复杂系统的行为,我们可能需要通过大量的计算来模拟类人智能。 上述假设意在指出:研究人类和动物利用的归纳偏置

kaggle-titanic实战--数据挖掘实例

a 夏天 提交于 2020-12-24 06:35:15
kaggle是一个国外的数据挖掘竞赛平台,大家做完竞赛之后会写一些指导,因此可以通过其他人写的指导文件进行学习, kaggle传送门 。 其中有一个入门类的分析问题是分析Titanic号的救援问题,分析哪些因素会影响到是否被救援,首先打开Titanic这个问题的具体页面, Titanic: Machine Learning from Disaster , 先看一看overview里面的description和evaluation,看看问题背景和最终需要预测的内容,然后点击数据,下载三个csv格式的数据集,第一个 train.csv 是训练集,第二个 test.csv 是测试集,第三个 gender_submission.csv 是验证集, 下载好之后打开pycharm,新建名为Titanic的工程,新建Titanic.py开始进行分析 首先,导入需要用到的包 import numpy as np import pandas as pd import matplot.pyplot as plt from pandas import DataFrame,Series 接下来导入数据 train_data = pd.read_csv('train.csv') 查看数据的信息 train_data.info() 得到的数据信息如下 <class 'pandas.core.frame

ODS与EDW的区别

心已入冬 提交于 2020-12-24 04:40:04
http://blog.csdn.net/bitcarmanlee/article/details/51013474 根据自己的理解与实际项目经验,说说ODS与EDW的异同。如果有不对的地方,欢迎大家批评指正。 维基百科对于ODS的定义为”An operational data store (or “ODS”) is a database designed to integrate data from multiple sources for additional operations on the data. Unlike a master data store, the data is not passed back to operational systems. It may be passed for further operations and to the data warehouse for reporting.” 翻译过来”ODS是一种数据架构或数据库设计的概念,出现原因是来自于当需要集成来自多个系统的数据,结果又要给一或多个系统使用时。” ODS全称为Operational Data Store,按照字面意思理解为操作型数据存储, 是“面向主题的、集成的、可变的、反映当前数据值的和详细的数据的集合,用来满足企业综合的、集成的以及操作型的处理需求”(Bill

Hacker News 简讯 2020-10-09

微笑、不失礼 提交于 2020-12-24 03:58:25
最后更新时间: 2020-10-09 21:00 Memory Safe ‘Curl’ for a More Secure Internet - (abetterinternet.org) 内存安全的“Curl”可实现更安全的互联网 得分:26 | 评论:9 Matt Levine makes sense of Wall Street like none other - (nytimes.com) 马特莱文对华尔街的理解是独一无二的 得分:119 | 评论:34 Why the Arabic world turned away from science (2011) - (thenewatlantis.com) 阿拉伯世界为何远离科学(2011) 得分:80 | 评论:39 Microsoft is letting employees work from home permanently - (theverge.com) 微软允许员工永久在家工作 得分:68 | 评论:38 Iron, How Did They Make It, Part IVa: Steel Yourself - (acoup.blog) 铁,他们是怎么做的,第四部分:钢铁你自己 得分:143 | 评论:20 Faith in government declines when mobile internet

阿里云实时大数据解决方案,助力企业实时分析与决策

只愿长相守 提交于 2020-12-23 19:01:05
性能高1倍,价格低3/4!数据库实时同步新选择! 实时分析决策的第一步就需要将数据实时同步到大数据计算引擎,DataWorks数据集成采用自研高性能引擎,在相同的机器规格情况下,RDS实时同步性能最高为其他数据同步方案的2倍,而价格可低至其1/4。通过DataWorks数据集成,企业可以进行高效、低成本、稳定的实时数据同步。 DataWorks数据集成可以追溯到2011年的DataX1.0和2.0版本,随后3.0版本正式对外提供服务,再后来公有云、专有云、阿里内部功能三版合一,建立了Data Integration 服务。在2019年,DataWorks数据集成完成了商业化,独享资源组上线,按量付费、包年包月的付费方式也成功面向了用户。在2020年,全增量实时同步解决方案正式发布。 在全增量实时同步解决方案系统中,可以从MySql、Oracle、IBM DB2、SQL server、POLARDB等关系型数据库中全量离线同步到MaxCompute、Hologres、Elasticsearch、Kafka、DataHub等大数据产品中,再实现实时抽取关系型数据库的变更信息,同步到大数据产品中。像MaxCompute这种离线数仓,可以通过同步到Log表、拆分至Delta表、Merge到Base表,最后再写入MaxCompute这样的方式做实时增量同步。

TED演讲-从苹果派到无人驾驶,为什么说大数据是更好的数据?

微笑、不失礼 提交于 2020-12-23 13:42:17
CDA数据分析师 出品 编译:Mika 【导读】 自动驾驶汽车只是个开始。大数据驱动技术和设计的未来是什么?肯尼斯·库基尔在TED演讲中探讨了机器学习和人类知识的下一步发展方向。 从苹果派销量下降说起 美国人最爱的馅饼是什么? 毋庸置疑是苹果派。 我们是怎么知道的?通过数据。 当你看到超市的销售数据,会发现超市销售的30厘米冷冻馅饼中,苹果派胜出,这是毫无悬念的。绝大多数的销售份额就是来自苹果派。但是之后,超市开始销售比较小的11厘米的馅饼。 突然间,苹果派的销量下降到了第4或第5名。这是为什么?发生什么了? 好的,不妨想象一下: 当你准备买一个30厘米的馅饼时,全家都不得不同意选择苹果派馅饼,虽然苹果派并不是每个人首选。但当你给自己选一个11厘米馅饼时,你可以买你最爱吃的口味。你会选你的首选项。 有了更多数据,你可以知道些事情 ,这些事情在你只有少量数据时你是无法知道的。这里关键的是更多的数据,不单单让我们知道更多,知道更多我们正在关注的同样事物;更多的数据使我们能了解新的事情,让我们更好地了解,让我们有不同的视角。 在这个例子里,更多的数据让我们知道:美国人最喜欢的馅饼,不是苹果派。 无处不在的大数据 你肯定听过大数据这个词。事实上,你可能对这个词已经有些烦了。确实,大数据受到了空前的宣传炒作,这很不应该。因为大数据是一个非常重要的工具,社会将由此而不断进步。

机器学习背后的数学原理--学习笔记1

一个人想着一个人 提交于 2020-12-23 04:33:57
支持向量机中的核技巧(kernel trick)与非参数估计中的核密度回归与核估计回归中的核函数可以认为是一回事,都是计算向量或点之间的“距离”,也就是相似度。 参考文章: https://zhuanlan.zhihu.com/p/35396322 https://blog.csdn.net/algorithmPro/article/details/84018114 https://blog.csdn.net/jesseyule/article/details/95246232 《机器学习方法》 李航 《非参数统计》 柳向东 来源: oschina 链接: https://my.oschina.net/u/3889482/blog/4672923