在线推理和在线学习,从两大层级看实时机器学习的应用现状
实时机器学习正得到越来越广泛的应用和部署。近日,计算机科学家和 AI 领域科技作家 Chip Huyen 在其博客中总结了实时机器学习的概念及其应用现状,并对比了实时机器学习在中美两国的不同发展现状。 选自 http:// huyenchip.com ,作者:Chip Huyen,机器之心编译,编辑:Panda。 与美国、欧洲和中国一些大型互联网公司的机器学习和基础设施工程师聊过之后,我发现这些公司可以分为两大类。一类公司重视实时机器学习的基础设施投资(数亿美元),并且已经看到了投资回报。另一类公司则还在考虑实时机器学习是否有价值。 对于实时机器学习的含义,现在似乎还没有明确的共识,而且也还没有人深入探讨过产业界该如何做实时机器学习。我与数十家在做实时机器学习的公司聊过之后,总结整理了这篇文章。 本文将实时机器学习分为两个层级: 层级 1:机器学习系统能实时给出预测结果(在线预测) 层级 2:机器学习系统能实时整合新数据并更新模型(在线学习) 本文中的「模型」指机器学习模型,「系统」指围绕模型的基础设施,包括数据管道和监测系统。 层级 1:在线预测 这里「实时」的定义是指毫秒到秒级。 用例 延迟很重要,对于面向用户的应用而言尤其重要。2009 年,谷歌的实验表明:如果将网络搜索的延迟从 100 ms 延长至 400 ms,则平均每用户的日搜索量会降低 0.2%-0.6%。2019