机器学习开发的灵药:Docker容器
来源:机器之心 本文 约4300字 ,建议阅读 10 分钟 转向容器化机器学习开发是应对众多挑战的一种途径。 大多数人都喜欢在笔记本电脑上做原型开发。当想与人协作时,通常会将代码推送到 GitHub 并邀请协作者。当想运行实验并需要更多的计算能力时,会在云中租用 CPU 和 GPU 实例,将代码和依赖项复制到实例中,然后运行实验。如果您对这个过程很熟悉,那么您可能会奇怪:为什么一定要用 Docker 容器呢? 运营团队中优秀的 IT 专家们可以确保您的代码持续可靠地运行,并能够根据客户需求进行扩展。那么对于运营团队而言,容器不就成了一种罕见的工具吗?您能够高枕无忧,无需担心部署问题,是因为有一群基础设施专家负责在 Kubernetes 上部署并管理您的应用程序吗? 在本文中,AWS会尝试说明为什么您应该考虑使用 Docker 容器进行机器学习开发。在本文的前半部分,将讨论在使用复杂的开源机器学习软件时遇到的主要难题,以及采用容器将如何缓和这些问题。然后,将介绍如何设置基于 Docker 容器的开发环境,并演示如何使用该环境来协作和扩展集群上的工作负载。 机器学习开发环境:基本需求 首先了解一下机器学习开发环境所需的四个基本要素: 计算:训练模型离不开高性能 CPU 和 GPU; 存储:用于存储大型训练数据集和您在训练过程中生成的元数据; 框架和库:提供用于训练的 API 和执行环境