scikit-learn入门导航
scikit-learn是一个非常强大的机器学习库, 提供了很多常见机器学习算法的实现. scikit-learn可以通过pip进行安装: pip install -U scikit-learn 不过这个包比较大, 若使用pip安装超时可以去 pypi 上下载适合自己系统的 .exe 或 .whl 文件进行安装. 安装成功后可以在python中导入: import sklearn sklearn的 官方文档 叙述非常详细清晰, 建议通过阅读 User Guide 学习sklearn. Dataset Loading sklearn基于numpy的矩阵与向量化运算支持, 可以采用类似numpy的导入: import numpy f = open('dataSet.txt') dataSet = numpy.loadtxt(f) dataSet为numpy的mat对象. 或者用libsvm的导入格式: from sklearn.datasets import load_svmlight_file X_train, y_train = load_svmlight_file("dataSet.txt") X_train.todense() # 将稀疏矩阵转换为完整矩阵 sklearn包中内置了一些示例数据: from sklearn import datasets iris =