DBSCAN聚类
##DBSCAN import numpy as np import pandas as pd from sklearn.cluster import DBSCAN #1.导入数据 #data = pd.read_csv(’’) #2.数据预处理 #略,最终生成x_train,x_test x_train = np.array([[1, 2, 3], [1, 4, 6], [1, 0, 9], [4, 6, 1], [7, 8, 9], [4, 5, 6], [5, 1, 3], [5, 6, 2], [6, 2, 1]]) #3.模型训练 model = DBSCAN(eps=3, min_samples=2) model.fit(x_train) #4.模型预测 print(model.labels_) #参数列表与调参方法 DBSCAN(eps=0.5, min_samples=5, metric=’euclidean’, metric_params=None, algorithm=’auto’, leaf_size=30, p=None, n_jobs=None) #eps : float, optional 两个样本之间的最大距离,一个被认为是另一个样本的邻域。这不是群集中点的距离的最大界限。这是为您的数据集和距离函数选择适当的最重要的DBSCAN参数。 #min