第九周 计算生态概览
从数据处理到人工智能 数据表示:采用合适方式用程序表达数据 数据清洗:数据归一化、数据转换、异常值处理 数据统计:数据的概要理解,数量、分布、中位数等 数据可视化:直观展示数据内涵的方式 数据挖掘:从数据分析获得知识,产生数据外的价值 人工智能:数据/语言/图像/视觉等方面深度分析与决策 数据分析 Numpy:表达N维数组的最基础库,是众多数据分析库的基础,使用C语言实现,但对外的接口是python语言,计算速度优异;基本支撑了python数据分析及科学计算的基础库,例如Pandas等;提供矩阵运算、广播函数、线性代数等功能。 Pandas:python数据分析高层次应用库。提供简单易用的数据结构和数据分析工具;理解数据类型与索引的关系,操作索引即操作数据;是python最主要的数据分析功能库,基于Numpy开发。 Series=索引+一维数据 DataFrame=行列索引+二维数据 SciPy:数学、科学和工程计算功能库。提供一批数学算法及工程数据运算功能;类似matlab,可用于傅里叶变换、信号处理等应用;python最主要的科学计算功能库,基于Numpy开发。 数据可视化 Matplotlib:高质量的二维数据可视化功能库。提供了超一百种数据可视化展示效果;通过matplotlib.pyplot子库调用可视化效果;python最主要的数据可视化功能库,基于Numpy开发。