机器学习:Jupyter Notebook入门
▌什么是 Jupyter Notebook? Jupyter Notebook 是一款开放源代码的 Web 应用程序,可让我们创建并共享代码和文档。 它提供了一个环境,你可以在其中记录代码,运行代码,查看结果,可视化数据并在查看输出结果。这些特性使其成为一款执行端到端数据科学工作流程的便捷工具 ,可以用于数据清理,统计建模,构建和训练机器学习模型,可视化数据以及许多其他用途。 当你还在构建项目原型时,Jupyter Notebooks 真的特别好用,因为你的代码是被写入独立的单元中并被单独执行的。这允许用户测试项目中的特定代码块,而无需从脚本的开始执行代码。许多其他的 IDE 环境(Integrated Development Environment, 集成开发环境)(如 RStudio )也以其他几种方式做到这一点,但我发现 Jupyter 的单个单元结构是最好的。 正如你在本文中将会看到的,这些 Notebooks 是数据科学家手中非常灵活、可交互和强大的工具。他们甚至允许你运行除 Python 以外的其他语言,比如 R 、SQL 等。由于它们比 IDE 平台更具交互性,因此它们被广泛地应用于教学场景。 ▌如何安装 Jupyter Notebook? 首先你需要在机器上安装 Python,Python 2.7或Python 3.3(或更高版本)都可以。 Anaconda