python数据分析入门笔记系列一
一、认识数据分析的各个库 1、numpy 提供数组支持以及相应的高效处理函数,是Python数据分析的基础,也是SciPy、Pandas等数据处理和科学计算库最基本的函数功能库。 2、pandas 强大、灵活的数据分析和探索工具,包含Series、DataFrame等高级数据结构和工具。 3、matplotlib 基于Numpy的一套Python包,强大的数据可视化工具和作图库,是主要用于绘制数据图表的Python库,提供了绘制各类可视化图形的命令字库、简单的接口,可以方便用户轻松掌握图形的格式,绘制各类可视化图形。 4、Scikit-Learn(Sklearn) 常用的机器学习工具包,提供了完善的机器学习工具箱,支持数据预处理、分类、回归、聚类、预测和模型分析等强大机器学习库,其依赖于Numpy、Scipy和Matplotlib等。 5、SciPy 一个高级的科学计算库,常见的是插值运算、优化算法、图像处理和数学统计等。 6、Keras 是一个高层神经网络API,Keras由纯Python编写而成并基 Tensorflow 、 Theano 以及 CNTK 后端。 TensorFlow和theano以及Keras都是深度学习框架,TensorFlow和theano比较灵活,也比较难学,它们其实就是一个微分器 Keras其实就是TensorFlow和Keras的接口