加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
文件
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
optimal_knn.py 2.68 KB
一键复制 编辑 原始数据 按行查看 历史
l李超丞 提交于 2024-09-21 07:55 . update optimal_knn.py.
# 导入必要的库和模块
from sklearn import datasets # 导入数据集模块
from sklearn.model_selection import train_test_split # 导入数据集划分模块
from sklearn.neighbors import KNeighborsClassifier # 导入KNN分类器
from sklearn.metrics import accuracy_score # 导入准确率评估模块
import joblib # 导入joblib库,用于模型保存和加载
import matplotlib.pyplot as plt # 导入matplotlib绘图库
# 加载数字数据集
digits = datasets.load_digits() # 从sklearn中加载手写数字数据集
# 将数据集划分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(
digits.data, # 特征数据
digits.target, # 目标标签
test_size=0.2, # 测试集占20%
random_state=42 # 随机种子,保证结果可重复
)
# 初始化变量以存储最佳准确率,相应的k值和最佳KNN模型
best_accuracy = 0 # 最佳准确率初始化为0
best_k = 0 # 最佳k值初始化为0
best_knn_model = None # 最佳KNN模型初始化为None
# 初始化一个列表以存储每个k值的准确率
accuracies = [] # 准确率列表
# 尝试从1到40的k值,对于每个k值,训练KNN模型,保存最佳准确率,k值和KNN模型
for k in range(1, 41): # 遍历k值从1到40
knn = KNeighborsClassifier(n_neighbors=k) # 初始化KNN分类器
knn.fit(X_train, y_train) # 用训练数据训练KNN模型
predictions = knn.predict(X_test) # 对测试数据进行预测
accuracy = accuracy_score(y_test, predictions) # 计算预测准确率
accuracies.append(accuracy) # 将准确率添加到列表中
# 如果当前准确率超过最佳准确率,则更新最佳准确率和相应的k值
if accuracy > best_accuracy:
best_accuracy = accuracy # 更新最佳准确率
best_k = k # 更新最佳k值
best_knn_model = knn # 更新最佳KNN模型
# 将最佳KNN模型保存到二进制文件
joblib.dump(best_knn_model, 'best_knn_model.pkl') # 保存模型到文件
# 打印最佳准确率和相应的k值
print(f'最佳准确率: {best_accuracy}') # 输出最佳准确率
print(f'最佳k值: {best_k}') # 输出最佳k值
# 绘制准确率曲线
plt.figure(figsize=(10, 6))
plt.plot(range(1, 41), accuracies, marker='o', linestyle='-', color='b', label='Accuracy')
plt.title('KNN Accuracy vs. Number of Neighbors')
plt.xlabel('Number of Neighbors (k)')
plt.ylabel('Accuracy')
plt.xticks(range(1, 41))
plt.grid(True)
plt.axvline(x=best_k, color='r', linestyle='--', label=f'Best k={best_k}')
plt.text(best_k, best_accuracy, f' ({best_k}, {best_accuracy:.2f})', color='red')
plt.legend()
plt.savefig("accuracy_plot.pdf", bbox_inches='tight') # 保存为PDF文件
plt.show() # 显示图表
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化