Copdi

Optuna参数调优Sklearn模型可视化+Roc分层抽样性能分析

1.数据集的选用和导入部分

2. Optuna调参部分

3.ROC图线绘制部分

1.数据集的选用和导入部分

本次文章的数据集选用经典的病马数据集,当然这个数据集都是可以替换的,可以用其他的二分类数据,数据导入部分没有做很多特殊的处理,做了一个基本的归一化处理,相关的代码如下:

# --------------病马预测------------------
# 文件解析函数,将文件数据转化为特征矩阵,标签矩阵
def file2matrix(filename):
    fr = open(filename)
    arrayOLines = fr.readlines()
    numberOfLines = len(arrayOLines)
    returnMat = np.zeros((numberOfLines, 21))
    classLabelVector = []  # 标签矩阵
    index = 0
    for line in arrayOLines:
        line = line.strip()  # 去除文本文件中的回车符'\n'
        listFromLine = line.split('\t')  # 根据tab符进行划分,返回的是列表
        returnMat[index, :] = listFromLine[0:21]
        x = int(float(listFromLine[-1]))
        if x == 1:
            classLabelVector.append(1)
        elif x == 0:
            classLabelVector.append(0)
        # classLabelVector.append(int(float(listFromLine[-1])))
        index += 1
    return returnMat, classLabelVector

# 将数据进行归一化处理
def autoNorm(dataSet):  # 归一化处理
    minVals = dataSet.min(0)
    maxVals = dataSet.max(0)
    ranges = maxVals - minVals
    normDataSet = np.zeros(np.shape(dataSet))
    m = dataSet.shape[0]
    normDataSet = dataSet - np.tile(minVals, (m, 1))
    normDataSet = normDataSet / np.tile(ranges, (m, 1))
    return normDataSet

2. Optuna调参部分

optuna是一个很棒的数据调参工具,相比于GridSearch网格搜索,它这个搜索是只用给定其要调参系数的大致范围,而不用自己特定限定参数值,是一个很智能化的调参工具,同时也可以为像一些比较热门的LGBT,XGBOST,NN等模型进行调参具有很不错的效果,这里主要是学习使用,就选择调节一些Sklearn常见的基础模型,进行调优.相关代码如下:

# --------opetuna调参模块-------------
def objective(trial):
    classifier_name = trial.suggest_categorical("classifier", ["SVC","RandomForest","Ridge","KNN"])
    # 设置想要调优的模型与模块
    if classifier_name == "SVC":
        # 设置分类向量机的一些参数如核函数,gamma值,C容忍度.
        kernel = trial.suggest_categorical('kernel', ['linear', 'rbf', 'sigmoid'])
        gamma = trial.suggest_float('gamma', 1e-5, 1e5)
        svc_c = trial.suggest_float("svc_c", 1e-10, 1e-2, log=True)
        classifier_obj = SVC(C=svc_c, kernel=kernel, gamma=gamma)
    elif classifier_name == "RandomForest":
        # 设置随机森林的深度,决策树的个数
        rf_max_depth = trial.suggest_int("rf_max_depth", 2, 32, log=True)
        rf_n_estimators=trial.suggest_int("rf_n_estimators",3,15)
        classifier_obj = RandomForestClassifier(max_depth=rf_max_depth, n_estimators=rf_n_estimators)
    elif classifier_name == "Ridge":
        # 设置岭回归的学习率,权重值
        C = trial.suggest_loguniform('alpha', 1e-7, 1e-2)
        b = trial.suggest_int('b', 1, 32)
        classifier_obj = RidgeClassifier(alpha=C, class_weight={0: 1, 1: b}, random_state=0)
    elif classifier_name == "KNN":
        # 设置kNN的邻居数量,第四个参数代表是步长为2,也就是都是奇数的邻居个数
        n_num = trial.suggest_int('n_neighbors', 1, 15,2)
        classifier_obj = KNeighborsClassifier(n_neighbors=n_num)
    return cross_val_score(
        # 根据交叉验证的平均值作为调优模型的调优方向,这里设置为五折的交叉验证
        classifier_obj , X_train, y_train, n_jobs=-1, cv=5).mean()

或者你想要使用Optuna剪枝的话只需要将返回值改为:

    for step in range(100):
        classifier_obj.fit(x_train, x_test)
        intermediate_value = classifier_obj.score(y_train, y_test)
        trial.report(intermediate_value, step)
        if trial.should_prune():
            raise optuna.TrialPruned()
        return intermediate_value

或者你可以使用lgbm的模型进行调参可以试一下这个:

def objective_lgb(trial):
    dtrain = lgb.Dataset(x_train, label=y_train)
    param = {
        "objective": "binary",
        "metric": "binary_logloss",
        "verbosity": -1,
        "boosting_type": "gbdt",
        "lambda_l1": trial.suggest_float("lambda_l1", 1e-8, 10.0, log=True),
        "lambda_l2": trial.suggest_float("lambda_l2", 1e-8, 10.0, log=True),
        "num_leaves": trial.suggest_int("num_leaves", 2, 256),
        "feature_fraction": trial.suggest_float("feature_fraction", 0.4, 1.0),
        "bagging_fraction": trial.suggest_float("bagging_fraction", 0.4, 1.0),
        "bagging_freq": trial.suggest_int("bagging_freq", 1, 7),
        "min_child_samples": trial.suggest_int("min_child_samples", 5, 100),
    }
    gbm = lgb.train(param, dtrain)
    preds = gbm.predict(x_test)
    pred_labels = np.rint(preds)
    accuracy = sklearn.metrics.accuracy_score(y_test, pred_labels)
    return accuracy

本次文章主要还是以使用Skelarn+交叉验证的值为准也就是第一个,那么通过主函数就可以直接调用这个代码了

if __name__ == "__main__":
    # -------optuna调优以及可视化显示--------
    study = optuna.create_study(direction="maximize")
    #首先使用optuna进行参数调参来找到最好的模型
    study.optimize(objective, n_trials=200)
    # n_trials:测试200次找到最佳参数
    print("最佳参数：", study.best_params)
    # 最佳参数： {'classifier': 'RandomForest', 'rf_max_depth': 15, 'rf_n_estimators': 14}
    print("最佳trial：", study.best_trial)
    # optuna的可视化
    optuna.visualization.plot_optimization_history(study).show()
    # 使用最佳的参数去训练模型,然后获取其相关的性能指标
    best_param=study.best_params
    clf= RandomForestClassifier(max_depth=15, n_estimators=14)
    # 最佳trial： FrozenTrial(number=79, values=[0.7857062146892655]
    clf.fit(X_train,y_train)
    predicted=clf.predict(X_test)
    print(
        f"Classification report for classifier {study}:\n"
        f"{classification_report(y_test, predicted)}\n"
    )
    # -------------------------------------

运行过程截图,可以看到整个调参过程中所选择的模型,和对应的参数和值

optuna的可视化展示图,单纯的用pycharm运行可能会出现绘制不出来的问题,可以使用jupyter进行绘制,如果jupyter无法绘制的话,可以参考官方文档上面的解决办法,GitHub - plotly/plotly.py: The interactive graphing library for Python (includes Plotly Express)

后面那个打印参数主要是输出我们模型的性能指标等,这些指标都是很经典来判断整个的预测模型好坏,比如我们对于标签0(活着)预测的准确率和召回率都不是很理想,而对于1可能要病死的马预测的效果很好.这是一些常用的指标性能.

3.ROC图线绘制部分

那么就此我们在去绘制一下它所对应的roc分层抽样的曲线图

    # ---K折交叉验证创建的不同数据集的ROC曲线,同时显示AUC面积---
    # 使用分层K折交叉验证
    cv = StratifiedKFold(n_splits=5, shuffle=False)
    # plot arrows
    fig1 = plt.figure(figsize=[12, 12])
    ax1 = fig1.add_subplot(111, aspect='equal')
    ax1.add_patch(
        patches.Arrow(0.45, 0.5, -0.25, 0.25, width=0.3, color='green', alpha=0.5)
    )
    ax1.add_patch(
        patches.Arrow(0.5, 0.45, 0.25, -0.25, width=0.3, color='red', alpha=0.5)
    )
    tprs = []
    aucs = []

    mean_fpr = np.linspace(0, 1, 100)
    i = 1
    fig, ax = plt.subplots()
    # 显示ROC是几折，AUC的值
    for i, (train, test) in enumerate(cv.split(X, y)):
        clf.fit(X[train], y[train])
        viz = plot_roc_curve(clf, X[test], y[test],
                             name='ROC fold {}'.format(i),
                             alpha=0.3, lw=1, ax=ax)
        interp_tpr = np.interp(mean_fpr, viz.fpr, viz.tpr)
        interp_tpr[0] = 0.0
        tprs.append(interp_tpr)
        aucs.append(viz.roc_auc)
    # 画出随机
    ax.plot([0, 1], [0, 1], linestyle='--', lw=2, color='r',
            label='Chance', alpha=.8)
    # 求tpr和auc的均值
    mean_tpr = np.mean(tprs, axis=0)
    mean_tpr[-1] = 1.0
    mean_auc = auc(mean_fpr, mean_tpr)
    std_auc = np.std(aucs)
    # 根据上述值，画出平均ROC曲线，对所有ROC曲线的走向进行可视化
    ax.plot(mean_fpr, mean_tpr, color='b',
            label=r'Mean ROC (AUC = %0.2f $\pm$ %0.2f)' % (mean_auc, std_auc),
            lw=2, alpha=.8)
    # 求tpr的最大值和最小值（根据tpr均值加减偏差）
    # 求tpr的标准偏差（分布分布的度量）
    std_tpr = np.std(tprs, axis=0)
    tprs_upper = np.minimum(mean_tpr + std_tpr, 1)
    tprs_lower = np.maximum(mean_tpr - std_tpr, 0)
    # 根据均值、最大值和最小值，进行区域画图，画出ROC曲面
    ax.fill_between(mean_fpr, tprs_lower, tprs_upper, color='grey', alpha=.2,
                    label=r'$\pm$ 1 std. dev.')
    ax.set(xlim=[-0.05, 1.05], ylim=[-0.05, 1.05],
           title="Receiver operating characteristic example")
    # ROC Receiver operating characteristic example
    # ax.legend(loc="lower right")
    plt.show()

绘制的效果如下:

可以看到我们整体的模型还是一个很不错的,曲线下方的面积占据大部分，AUC平均值在0.82左右，这也表示预测准确性高。

最后给出所有代码供大家学习

# -*- coding:utf-8 -*-
# @Time : 2022/4/3 0:01
# @Author ：Copdi
# @Software : PyCharm

# 导包模块
# ---optuna调优以及其相关的包---
import optuna
from sklearn.svm import SVC
from sklearn.linear_model import RidgeClassifier
from sklearn.neighbors import KNeighborsClassifier
from sklearn.ensemble import RandomForestClassifier
#-------------------------
# roc画图以及数据导入的相关模块
import matplotlib.pyplot as plt
import matplotlib.patches as patches
from sklearn.metrics import classification_report, plot_roc_curve, auc
from sklearn.model_selection import train_test_split, StratifiedKFold, cross_val_score
from bingma_loader import bingma_loader
import numpy as np
# 忽略一roc里面的报错
import warnings
warnings.filterwarnings("ignore")


# --------导数据模块-----------
X, y = bingma_loader("data/horseColicTraining.txt", 1)
# 导入病马数据集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=10)
# 使用train_test_split划分数据集和测试集
X = np.array(X)
y = np.array(y)
# 将数据集和测试集转换为numpy数组形式,方便后面画图
# --------------------------

# --------opetuna调参模块-------------
def objective(trial):
    classifier_name = trial.suggest_categorical("classifier", ["SVC", "RandomForest", "Ridge", "KNN"])
    # 设置想要调优的模型与模块
    if classifier_name == "SVC":
        # 设置分类向量机的一些参数如核函数,gamma值,C容忍度.
        kernel = trial.suggest_categorical('kernel', ['linear', 'rbf', 'sigmoid'])
        gamma = trial.suggest_float('gamma', 1e-5, 1e5)
        svc_c = trial.suggest_float("svc_c", 1e-10, 1e-2, log=True)
        classifier_obj = SVC(C=svc_c, kernel=kernel, gamma=gamma)
    elif classifier_name == "RandomForest":
        # 设置随机森林的深度,决策树的个数
        rf_max_depth = trial.suggest_int("rf_max_depth", 2, 32, log=True)
        rf_n_estimators = trial.suggest_int("rf_n_estimators",3,15)
        classifier_obj = RandomForestClassifier(max_depth=rf_max_depth, n_estimators=rf_n_estimators)
    elif classifier_name == "Ridge":
        # 设置岭回归的学习率,权重值
        C = trial.suggest_loguniform('alpha', 1e-7, 1e-2)
        b = trial.suggest_int('b', 1, 32)
        classifier_obj = RidgeClassifier(alpha=C, class_weight={0: 1, 1: b}, random_state=0)
    elif classifier_name == "KNN":
        # 设置kNN的邻居数量,第四个参数代表是步长为2,也就是都是奇数的邻居个数
        n_num = trial.suggest_int('n_neighbors', 1, 15,2)
        classifier_obj = KNeighborsClassifier(n_neighbors=n_num)
    return cross_val_score(
        # 根据交叉验证的平均值作为调优模型的调优方向,这里设置为五折的交叉验证
        classifier_obj, X_train, y_train, n_jobs=-1, cv=5).mean()


if __name__ == "__main__":
    # -------optuna调优以及可视化显示--------
    study = optuna.create_study(direction="maximize")
    # 首先使用optuna进行参数调参来找到最好的模型
    study.optimize(objective, n_trials=200)
    # n_trials:测试200次找到最佳参数
    print()
    print("最佳参数：", study.best_params)
    # 最佳参数： {'classifier': 'RandomForest', 'rf_max_depth': 15, 'rf_n_estimators': 14}
    print("最佳trial：", study.best_trial)
    # optuna.visualization.plot_optimization_history(study).show()
    # optuna.visualization.plot_contour(study).show()
    # optuna.visualization.plot_param_importances(study).show()

    # 使用最佳的参数去训练模型,然后获取其相关的性能指标
    best_param = study.best_params
    clf = RandomForestClassifier(max_depth=15, n_estimators=14)
    # 最佳trial： FrozenTrial(number=79, values=[0.7857062146892655]
    # 填充所使用的训练数据的模型
    clf.fit(X_train, y_train)
    # 使用predict对测试数据进行预测
    predicted = clf.predict(X_test)
    print(
        f"Classification report for classifier {study}:\n"
        f"{classification_report(y_test, predicted)}\n"
    )
    # -------------------------------------

    # ---K折交叉验证创建的不同数据集的ROC曲线,同时显示AUC面积---
    # 使用分层K折交叉验证
    cv = StratifiedKFold(n_splits=5, shuffle=False)
    # plot arrows
    fig1 = plt.figure(figsize=[12, 12])
    ax1 = fig1.add_subplot(111, aspect='equal')
    ax1.add_patch(
        patches.Arrow(0.45, 0.5, -0.25, 0.25, width=0.3, color='green', alpha=0.5)
    )
    ax1.add_patch(
        patches.Arrow(0.5, 0.45, 0.25, -0.25, width=0.3, color='red', alpha=0.5)
    )
    tprs = []
    aucs = []

    mean_fpr = np.linspace(0, 1, 100)
    i = 1
    fig, ax = plt.subplots()
    # 显示ROC是几折，AUC的值
    for i, (train, test) in enumerate(cv.split(X, y)):
        clf.fit(X[train], y[train])
        viz = plot_roc_curve(clf, X[test], y[test],
                             name='ROC fold {}'.format(i),
                             alpha=0.3, lw=1, ax=ax)
        interp_tpr = np.interp(mean_fpr, viz.fpr, viz.tpr)
        interp_tpr[0] = 0.0
        tprs.append(interp_tpr)
        aucs.append(viz.roc_auc)
    # 画出随机
    ax.plot([0, 1], [0, 1], linestyle='--', lw=2, color='r',
            label='Chance', alpha=.8)
    # 求tpr和auc的均值
    mean_tpr = np.mean(tprs, axis=0)
    mean_tpr[-1] = 1.0
    mean_auc = auc(mean_fpr, mean_tpr)
    std_auc = np.std(aucs)
    # 根据上述值，画出平均ROC曲线，对所有ROC曲线的走向进行可视化
    ax.plot(mean_fpr, mean_tpr, color='b',
            label=r'Mean ROC (AUC = %0.2f $\pm$ %0.2f)' % (mean_auc, std_auc),
            lw=2, alpha=.8)
    # 求tpr的最大值和最小值（根据tpr均值加减偏差）
    # 求tpr的标准偏差（分布分布的度量）
    std_tpr = np.std(tprs, axis=0)
    tprs_upper = np.minimum(mean_tpr + std_tpr, 1)
    tprs_lower = np.maximum(mean_tpr - std_tpr, 0)
    # 根据均值、最大值和最小值，进行区域画图，画出ROC曲面
    ax.fill_between(mean_fpr, tprs_lower, tprs_upper, color='grey', alpha=.2,
                    label=r'$\pm$ 1 std. dev.')
    ax.set(xlim=[-0.05, 1.05], ylim=[-0.05, 1.05],
           title="Receiver operating characteristic example")
    # ROC Receiver operating characteristic example
    # ax.legend(loc="lower right")
    plt.show()
    # --------------------------------------------------------

病马部分的数据集大家感兴趣可以找我要,或者你直接换成sklearn自带的乳腺癌数据集应该也是可以跑通的,loadbingma函数就是先执行上面写过的file2matrix和automated就行了,整个文章就是这样,欢迎大家进行学习交流.

python延时函数的使用锅锅是锅锅 Python python
库importtime函数time.sleep(seconds)参数：seconds延迟执行代码的秒数示例importtimewhile(1):print("helloguoguo")time.sleep(1)
Python 烟花展示：使用 Pygame 创建绚丽的夜空长风清留扬趣味Python pygame python 开发语言 Python小游戏 Python动画画图
在Python中，使用pygame库可以轻松地创建图形和动画效果，非常适合制作各种游戏和视觉展示。今天，我们将一起探索如何使用pygame来制作一个简单的烟花展示程序。这个程序将模拟烟花在夜空中绽放的壮丽景象，通过随机生成的粒子来模拟烟花的爆炸效果。准备工作首先，确保你已经安装了pygame库。如果还没有安装，可以通过pip命令来安装：pipinstallpygame导入必要的库importpyg
python 实现延时队列独壹@无贰 python 开发语言
python实现延时队列#延时队列importthreadingimportfunctoolsimportqueueimportdatetimedeftest():print("执行成功")defseconds_chagne(dt):returndt.seconds+dt.days*24*60*60#延迟任务类classDelayTask:#delay_time即将过期的时间#task参与延迟的任
python中用docx将doc文件转换为docx文件小X天天向上 python 开发语言
importosfromwin32comimportclientdefdoc_to_docx(path):ifnotos.path.isabs(path):print("不是绝对路径")returnifnot
Python 删除文件与文件夹 - 奇客谷教程八狐云|酷画册|二维码生成 python Python 教程 python
Python教程Python介绍Python开发环境搭建Python语法Python变量Python数值类型Python类型转换Python字符串(String)Python运算符Python列表(list)Python元组(Tuple)Python集合(Set)Python字典(Dictionary)PythonIf…ElsePythonWhile循环PythonFor循环Python函数Pyt
【Python】爬虫实战03：自动化抢票脚本【某麦网】 m0_74825152 python 爬虫自动化
1.脚本介绍1.1背景介绍在这个数字化时代，演唱会、体育赛事和各种活动的门票销售往往在线上进行。由于热门活动的高需求和门票的有限供应，抢票成为了一场激烈的竞争。许多粉丝和爱好者经常因为手速不够快或网络延迟而错失购票机会。为了提高抢票的成功率，自动化抢票脚本应运而生。以下这个脚本是一个用Python编写的自动化抢票程序，利用Selenium库来模拟用户在网页上的操作。下面是脚本的详细功能和结构介绍：
批量将.doc文件转换为.docx文件的Python脚本优化袁公白 python c#microsoft
在本篇博客中，我将分享如何使用Python编写一个脚本，可以批量将一个文件夹中的所有.doc文件转换为.docx文件。这个脚本利用了Python的win32com库来操作Word应用程序进行文件格式转换，并通过tkinter库中的filedialog模块实现文件夹选择对话框，让用户选择需要转换的文件夹路径。首先，我们定义了两个函数：doc_to_docx用于将单个.doc文件转换为.docx文件，
数学：机器学习的理论基石每天五分钟玩转人工智能机器学习人工智能
一、数学：机器学习的理论基石机器学习是一种通过数据学习模式和规律的科学。其核心目标是从数据中提取有用的信息，以便对未知数据进行预测和分类。为了实现这一目标，机器学习需要一种数学框架来描述和解决问题。数学在机器学习中起着至关重要的作用，它提供了一种数学模型来描述数据和模式，以及一种数学方法来优化模型。数学在机器学习中的应用非常广泛，涵盖了线性代数、概率论、统计学、微积分、优化等多个领域。这些数学方法
在 Python 中等待 5 秒迹忆客 Python 实用技巧 python java 前端
Python具有各种功能和库来创建交互式应用程序，用户可以在其中提供输入和响应。我们可以创建需要暂停应用程序执行的情况。本篇文章将讨论如何在Python中等待5秒。在Python中使用time.sleep()函数等待5秒Python的time模块提供了存储和操作时间的功能和对象。该库中的sleep()函数增加了执行延迟；该函数接受以秒为单位的时间。例如，importtimeprint("Befor
[转载]Python量化交易平台开发教程系列0-引言 dijiesa4351 c#操作系统 c/c++
原文出处：http://vnpy.org/2015/03/04/20150304_Python%E9%87%8F%E5%8C%96%E4%BA%A4%E6%98%93%E5%B9%B3%E5%8F%B0%E5%BC%80%E5%8F%91%E6%95%99%E7%A8%8B%E7%B3%BB%E5%88%970-%E5%BC%95%E8%A8%80/为什么用Python来开发量化交易平台目前本人所
os模块 datbgd1130 python
os.getcwd()获取当前工作目录，即当前python脚本工作的目录路径os.path.abspath(path)返回path规范化的绝对路径os.path.split(path)将path分割成目录和文件名二元组返回os.path.dirname(path)返回path的目录。其实就是os.path.split(path)的第一个元素os.path.basename(path)返回path最
python 快速拆分含有多种分隔符的字符串风陵苑主 python
importres='ab;cd|efghij,lmn;opq,rst,uvwx\yz're.split(r'[,;\\|]+',s)
华为OD机试 -TLV解码（Java & Python& JS & C++ & C ）算法大师最新华为OD机试 c++java 华为od 华为华为od机试 python javascript
最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看题目描述TLV编码是按[TagLengthValue]格式进行编码的，一段码流中的信元用Tag标识，Tag在码流中唯一不重复，Length表示信元Value的长度，Value表示信元的值。码流以某信元的Tag开头，Tag固定占一个字节，Length固定占两个字节，字节序为小端序。现给定TLV格式编码的码流，以及需要解码的信元T
股票量化交易进阶：构建回测框架backtrader InUnix python 开发语言
在量化交易领域，回测是一个重要的环节。回测框架可以帮助我们验证投资策略的有效性，并评估其在历史数据上的表现。backtrader是一个功能强大且灵活的Python回测框架，它为量化交易提供了丰富的工具和功能。本文将介绍如何使用backtrader构建一个简单的回测系统，并给出相应的源代码示例。首先，我们需要安装backtrader库。可以使用pip命令进行安装：pipinstallbacktrad
Python延时函数详解及实例代码 HackDyno python java 前端 Python
Python延时函数详解及实例代码在Python编程中，有时我们需要在程序中添加延时，以便在执行特定操作之前等待一段时间。延时函数允许我们在代码中创建一个暂停的时间间隔。本文将详细介绍Python中的延时函数，并提供一些实例代码供参考。Python中的延时函数可以通过time模块来实现。time模块是Python标准库中的一部分，提供了与时间相关的函数和方法。我们可以使用time.sleep()函
Python中删除文件和目录湫兮之风 python java 开发语言
python中分别提供os包下的os.remove()与shutil包下的shutil.rmtree()函数，其中os.remove(）的主要作用是删除一个具体的文件，shutil.rmtree()主要作用是删除一个具体的目录。os.remove()这个函数需要一个参数，即要删除的文件的路径。importosfile_path="/path/to/your/file.txt"#将此处的路径替换为你
python os.path.basename()方法 Arthur-Ji python
返回path最后的文件名。如果path以／或\结尾，那么就会返回空值。即os.path.split(path)的第二个元素。?12345>>>importos>>>path='/Users/beazley/Data/data.csv'>>>#Getthelastcomponentofthepath>>>os.path.basename(path)'data.csv'
Python path模块倾听冷暖 python 策略模式开发语言
在Python中，你可能说的是os.path模块（它属于os模块下专门处理路径相关操作的部分）或者是pathlib模块（Python标准库中用于面向对象风格的路径操作模块），以下分别为你详细介绍这两种与路径相关的内容：os.path模块os.path模块提供了一系列用于处理文件路径的实用函数，能帮助开发者方便地操作路径、获取路径相关信息等，且可以适配不同的操作系统（Windows、Linux、ma
【机器学习：二十六、决策树】 KeyPan 机器学习机器学习决策树人工智能算法深度学习数据挖掘
1.决策树概述决策树是一种基于树状结构的监督学习算法，既可以用于分类任务，也可以用于回归任务。其主要通过递归地将数据划分为子集，从而生成一个具有条件结构的树模型。核心概念节点（Node）：每个节点表示一个特定的决策条件。根节点（RootNode）：树的起点，包含所有样本。分支（Branch）：每个分支代表一个条件划分的结果。叶节点（LeafNode）：终止节点，表示最终的决策结果。优点直观可解释：
差分进化算法(Differential evolution,DE)(附详细注释的Python代码) XijueJa 算法 python 开发语言
概念与基本原理差分进化算法（DifferentialEvolution，简称DE）是一种基于种群的随机优化算法，由Storm和Price在1995年提出。它主要应用于解决非线性、非凸、连续和离散的优化问题。DE算法以其简单性、鲁棒性和高效性而受到广泛关注。差分进化算法的基本思想是通过模拟自然进化过程中的遗传和变异机制来寻找问题的最优解，类似于遗传算法。通过变异、交叉与选择，使得初始化的种群不断朝最
Python常用OS库之path模块学习风陵苑主 python 学习
学习python没有太多捷径，有也只有技巧，更重要的是要多学多练，个人觉得练更重要，读万卷书不如行万里路。编程是一门技能，所以除了看还要多实践，写得多了自然也就有了路。如果看全部的标准库文档，可以访问这个链接os---多种操作系统接口—Python3.12.3文档接下来就来敲敲OS库下的path方法，这里只是记录一下，搬运工作，加深印象。那就开始吧。os.path常用方法一、os.path.abs
python 删除文件、目录（文件夹） 2301_78094384 python python
最近使用python进行文件，目录的操作，实在难以相信，python这么简单，易用的语言，竟然没有一个库很好的支持删除文件、目录（文件夹），于是把最近收集到的一些信息做下整理。删除文件：Pathlib:file_path.unlink()os:os.remove(file_path)删除目录（文件夹）：空目录（Path库）：dir_path.rmdir()非空目录（shutil）：shutil.r
python与mysql的交互（一） xiaoking32 Python python
python与mysql的交互（一）在mac上装mysqlpython操作mysql的步骤解析sql注入什么是sql注入？怎么防止？在mac上装mysql下载mysqlformac:https://dev.mysql.com/downloads/mysql/解压dmg文件，点击pkg文件进行安装Continue->Continue,Agree->Install->输入管理员密码->设置root用户
手把手教你 AI 顾投：在 Ollama 中使用 Python 调用金融 API 服务老余捞鱼 AI探讨与学习人工智能 python 金融 llama
作者：老余捞鱼原创不易，转载请标明出处及原作者。写在前面的话：尽管Ollama本身不是一个大型语言模型（LLM）开发工具，而是一个LLM的平台。但它最近宣布了其系统中直接使用工具调用的功能，本文主要介绍了最新版本的主要更新，特别是关于功能调用的使用，并演示了如何在Ollama中使用Python调用外部API服务。一、部署Ollama在本地运行1.1设置开发环境在开始编写代码之前，最好的做法是建立一
基于深度学习的推荐系统构建：Movielens 数据集 fresh的转码之路深度学习人工智能机器学习推荐算法
基于深度学习的推荐系统构建：Movielens数据集依赖环境代码语言：python3.11.5开发平台：pycharmtensorflow版本：2.18.0MovieLen1M数据及简介MovieLens1M数据集包含包含6000个用户在近4000部电影上的100万条评分，也包括电影元数据信息和用户属性信息。下载地址为：http://files.grouplens.org/datasets/mov
PyMySQL 详解一只猪皮怪5 SQL 数据库 mysql python
PyMySQL是一个纯Python实现的MySQL客户端操作库，支持事务、存储过程、批量执行等。PyMySQL遵循Python数据库APIv2.0规范，并包含了pure-PythonMySQL客户端库。安装pipinstallPyMySQL创建数据库连接importpymysqlconnection=pymysql.connect(host='localhost',port=3306,user='
python界面小游戏贪吃蛇_用Python实现童年小游戏贪吃蛇 weixin_39627052 python界面小游戏贪吃蛇
贪吃蛇作为一款经典小游戏，早在1976年就面世了，我最早接触它还是在家长的诺基亚手机中。尽管贪吃蛇的历史相对比较久远，但它却有着十分顽强的生命力，保持经久不衰，其中很重要的原因便是游戏厂家不断的对其进行更新迭代。现在，这款游戏无论是游戏场景、规则等都变得十分丰富。接下来，我们看一下如何通过Python简单的实现这款小游戏。规则要有游戏主界面、贪吃蛇、食物能够控制贪吃蛇移动并获取食物贪吃蛇吃了食物后
python怎么安装pymysql_Python中操作mysql的pymysql模块详解 weixin_39634876
前言pymsql是Python中操作MySQL的模块，其使用方法和MySQLdb几乎相同。但目前pymysql支持python3.x而后者不支持3.x版本。本文测试python版本：2.7.11。mysql版本：5.6.24一、安装pip3installpymysql二、使用操作1、执行SQL#!/usr/bin/envpytho#-*-coding:utf-8-*-importpymysql#创
用python操作浏览器的三种方式_经验 | python 操作浏览器的三种方式 weixin_39642619
第一种：selenium导入浏览器驱动，用get方法打开浏览器，例如：importtimefromseleniumimportwebdriverdefmac():#browser=webdriver.Chrome()#browser=webdriver.Firefox()browser=webdriver.Ie()browser.implicitly_wait(5)browser.get("htt
python与mysql交互_Python和Mysql交互 weixin_39703561 python与mysql交互
安装引入模块~安装mysql模块sudoapt-getinstallpython-mysqldb~在文件中引入模块importMySQLdbConnection对象用于建立与数据库的连接，创建对象：调用connect()方法conn=MySQLdb.connect(参数列表)其中参数列表有：host:连接的mysql主机，如果本机是'localhost'；port:连接的mysql主机的端口，默认
java的(PO,VO,TO,BO,DAO,POJO) Cb123456 VO TO BO POJO DAO
转: http://www.cnblogs.com/yxnchinahlj/archive/2012/02/24/2366110.html ------------------------------------------------------------------- O/R Mapping 是 Object Relational Mapping（对象关系映
spring ioc原理（看完后大家可以自己写一个spring） aijuans spring
最近，买了本Spring入门书：spring In Action 。大致浏览了下感觉还不错。就是入门了点。Manning的书还是不错的，我虽然不像哪些只看Manning书的人那样专注于Manning,但怀着崇敬的心情和激情通览了一遍。又一次接受了IOC 、DI、AOP等Spring核心概念。先就IOC和DI谈一点我的看法。IO
MyEclipse 2014中Customize Persperctive设置无效的解决方法 Kai_Ge MyEclipse2014
高高兴兴下载个MyEclipse2014，发现工具条上多了个手机开发的按钮，心生不爽就想弄掉他！结果发现Customize Persperctive失效！！有说更新下就好了，可是国内Myeclipse访问不了，何谈更新... so~这里提供了更新后的一下jar包，给大家使用！ 1、将9个jar复制到myeclipse安装目录\plugins中 2、删除和这9个jar同包名但是版本号较
SpringMvc上传 120153216 springMVC
@RequestMapping(value = WebUrlConstant.UPLOADFILE) @ResponseBody public Map<String, Object> uploadFile(HttpServletRequest request,HttpServletResponse httpresponse) { try { //
Javascript----HTML DOM 事件何必如此 JavaScript html Web
HTML DOM 事件允许Javascript在HTML文档元素中注册不同事件处理程序。事件通常与函数结合使用，函数不会在事件发生前被执行！注：DOM：指明使用的 DOM 属性级别。 1.鼠标事件属性
动态绑定和删除onclick事件 357029540 JavaScript jquery
因为对JQUERY和JS的动态绑定事件的不熟悉，今天花了好久的时间才把动态绑定和删除onclick事件搞定!现在分享下我的过程。在我的查询页面，我将我的onclick事件绑定到了tr标签上同时传入当前行(this值)参数，这样可以在点击行上的任意地方时可以选中checkbox，但是在我的某一列上也有一个onclick事件是用于下载附件的，当
HttpClient|HttpClient请求详解 7454103 apache 应用服务器网络协议网络应用 Security
HttpClient 是 Apache Jakarta Common 下的子项目，可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包，并且它支持 HTTP 协议最新的版本和建议。本文首先介绍 HTTPClient，然后根据作者实际工作经验给出了一些常见问题的解决方法。HTTP 协议可能是现在 Internet 上使用得最多、最重要的协议了，越来越多的 Java 应用程序需
递归逐层统计树形结构数据 darkranger 数据结构
将集合递归获取树形结构: /** * * 递归获取数据 * @param alist:所有分类 * @param subjname:对应统计的项目名称 * @param pk:对应项目主键 * @param reportList: 最后统计的结果集 * @param count:项目级别 */ public void getReportVO(Arr
访问WEB-INF下使用frameset标签页面出错的原因 aijuans struts2
<frameset rows="61,*,24" cols="*" framespacing="0" frameborder="no" border="0">
MAVEN常用命令 avords
Maven库： http://repo2.maven.org/maven2/ Maven依赖查询： http://mvnrepository.com/ Maven常用命令： 1. 创建Maven的普通java项目： mvn archetype:create -DgroupId=packageName
PHP如果自带一个小型的web服务器就好了 houxinyou apache 应用服务器 Web PHP 脚本
最近单位用PHP做网站，感觉PHP挺好的，不过有一些地方不太习惯，比如，环境搭建。PHP本身就是一个网站后台脚本，但用PHP做程序时还要下载apache，配置起来也不太很方便，虽然有好多配置好的apache+php+mysq的环境，但用起来总是心里不太舒服，因为我要的只是一个开发环境，如果是真实的运行环境，下个apahe也无所谓，但只是一个开发环境，总有一种杀鸡用牛刀的感觉。如果php自己的程序中
NoSQL数据库之Redis数据库管理(list类型) bijian1013 redis 数据库 NoSQL
3.list类型及操作 List是一个链表结构，主要功能是push、pop、获取一个范围的所有值等等，操作key理解为链表的名字。Redis的list类型其实就是一个每个子元素都是string类型的双向链表。我们可以通过push、pop操作从链表的头部或者尾部添加删除元素，这样list既可以作为栈，又可以作为队列。 &nbs
谁在用Hadoop？ bingyingao hadoop 数据挖掘公司应用场景
Hadoop技术的应用已经十分广泛了，而我是最近才开始对它有所了解，它在大数据领域的出色表现也让我产生了兴趣。浏览了他的官网，其中有一个页面专门介绍目前世界上有哪些公司在用Hadoop，这些公司涵盖各行各业，不乏一些大公司如alibaba,ebay,amazon,google,facebook,adobe等，主要用于日志分析、数据挖掘、机器学习、构建索引、业务报表等场景,这更加激发了学习它的热情。
【Spark七十六】Spark计算结果存到MySQL bit1129 mysql
package spark.examples.db import java.sql.{PreparedStatement, Connection, DriverManager} import com.mysql.jdbc.Driver import org.apache.spark.{SparkContext, SparkConf} object SparkMySQLInteg
Scala: JVM上的函数编程 bookjovi scala erlang haskell
说Scala是JVM上的函数编程一点也不为过，Scala把面向对象和函数型编程这两种主流编程范式结合了起来，对于熟悉各种编程范式的人而言Scala并没有带来太多革新的编程思想，scala主要的有点在于Java庞大的package优势，这样也就弥补了JVM平台上函数型编程的缺失，MS家.net上已经有了F#，JVM怎么能不跟上呢？对本人而言
jar打成exe bro_feng java jar exe
今天要把jar包打成exe，jsmooth和exe4j都用了。遇见几个问题。记录一下。两个软件都很好使，网上都有图片教程，都挺不错。首先肯定是要用自己的jre的，不然不能通用，其次别忘了把需要的lib放到classPath中。困扰我很久的一个问题是，我自己打包成功后，在一个同事的没有装jdk的电脑上运行，就是不行，报错jvm.dll为无效的windows映像，如截图最后发现
读《研磨设计模式》-代码笔记-策略模式-Strategy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 策略模式定义了一系列的算法，并将每一个算法封装起来，而且使它们还可以相互替换。策略模式让算法独立于使用它的客户而独立变化简单理解： 1、将不同的策略提炼出一个共同接口。这是容易的，因为不同的策略，只是算法不同，需要传递的参数
cmd命令值cvfM命令 chenyu19891124 cmd
cmd命令还真是强大啊。今天发现jar -cvfM aa.rar @aaalist 就这行命令可以根据aaalist取出相应的文件例如：在d：\workspace\prpall\test.java 有这样一个文件，现在想要将这个文件打成一个包。运行如下命令即可比如在d：\wor
OpenJWeb(1.8) Java Web应用快速开发平台 comsci java 框架 Web 项目管理企业应用
OpenJWeb(1.8) Java Web应用快速开发平台的作者是我们技术联盟的成员，他最近推出了新版本的快速应用开发平台 OpenJWeb(1.8)，我帮他做做宣传 OpenJWeb快速开发平台以快速开发为核心，整合先进的java 开源框架，本着自主开发+应用集成相结合的原则，旨在为政府、企事业单位、软件公司等平台用户提供一个架构透
Python 报错：IndentationError: unexpected indent daizj python tab 空格缩进
IndentationError: unexpected indent 是缩进的问题，也有可能是tab和空格混用啦 Python开发者有意让违反了缩进规则的程序不能通过编译，以此来强制程序员养成良好的编程习惯。并且在Python语言里，缩进而非花括号或者某种关键字，被用于表示语句块的开始和退出。增加缩进表示语句块的开
HttpClient 超时设置 dongwei_6688 httpclient
HttpClient中的超时设置包含两个部分： 1. 建立连接超时，是指在httpclient客户端和服务器端建立连接过程中允许的最大等待时间 2. 读取数据超时，是指在建立连接后，等待读取服务器端的响应数据时允许的最大等待时间在HttpClient 4.x中如下设置： HttpClient httpclient = new DefaultHttpC
小鱼与波浪 dcj3sjt126com
一条小鱼游出水面看蓝天，偶然间遇到了波浪。　　小鱼便与波浪在海面上游戏，随着波浪上下起伏、汹涌前进。　　小鱼在波浪里兴奋得大叫：“你每天都过着这么刺激的生活吗？简直太棒了。”　　波浪说：“岂只每天过这样的生活，几乎每一刻都这么刺激！还有更刺激的，要有潮汐变化，或者狂风暴雨，那才是兴奋得心脏都会跳出来。”　　小鱼说：“真希望我也能变成一个波浪，每天随着风雨、潮汐流动，不知道有多么好！”　　很快，小鱼
Error Code: 1175 You are using safe update mode and you tried to update a table dcj3sjt126com mysql
快速高效用：SET SQL_SAFE_UPDATES = 0；下面的就不要看了！今日用MySQL Workbench进行数据库的管理更新时，执行一个更新的语句碰到以下错误提示： Error Code: 1175 You are using safe update mode and you tried to update a table without a WHERE that
枚举类型详细介绍及方法定义 gaomysion enum javaee
转发 http://developer.51cto.com/art/201107/275031.htm 枚举其实就是一种类型，跟int, char 这种差不多，就是定义变量时限制输入的，你只能够赋enum里面规定的值。建议大家可以看看，这两篇文章，《java枚举类型入门》和《C++的中的结构体和枚举》，供大家参考。枚举类型是JDK5.0的新特征。Sun引进了一个全新的关键字enum
Merge Sorted Array hcx2013 array
Given two sorted integer arrays nums1 and nums2, merge nums2 into nums1 as one sorted array. Note:You may assume that nums1 has enough space (size that is
Expression Language 3.0新特性 jinnianshilongnian el 3.0
Expression Language 3.0表达式语言规范最终版从2013-4-29发布到现在已经非常久的时间了；目前如Tomcat 8、Jetty 9、GlasshFish 4已经支持EL 3.0。新特性包括：如字符串拼接操作符、赋值、分号操作符、对象方法调用、Lambda表达式、静态字段/方法调用、构造器调用、Java8集合操作。目前Glassfish 4/Jetty实现最好，对大多数新特性
超越算法来看待个性化推荐 liyonghui160com 超越算法来看待个性化推荐
一提到个性化推荐，大家一般会想到协同过滤、文本相似等推荐算法，或是更高阶的模型推荐算法，百度的张栋说过，推荐40%取决于UI、30%取决于数据、20%取决于背景知识，虽然本人不是很认同这种比例，但推荐系统中，推荐算法起的作用起的作用是非常有限的。就像任何
写给Javascript初学者的小小建议 pda158 JavaScript
　　一般初学JavaScript的时候最头痛的就是浏览器兼容问题。在Firefox下面好好的代码放到IE就不能显示了，又或者是在IE能正常显示的代码在firefox又报错了。　　如果你正初学JavaScript并有着一样的处境的话建议你：初学JavaScript的时候无视DOM和BOM的兼容性，将更多的时间花在了解语言本身（ECMAScript）。只在特定浏览器编写代码（Chrome/Fi
Java 枚举 ShihLei java enum 枚举
注：文章内容大量借鉴使用网上的资料，可惜没有记录参考地址，只能再传对作者说声抱歉并表示感谢！一基础 1）语法枚举类型只能有私有构造器（这样做可以保证客户代码没有办法新建一个enum的实例）枚举实例必须最先定义 2）特性 &nb
Java SE 6 HotSpot虚拟机的垃圾回收机制 uuhorse java HotSpot GC 垃圾回收 VM
官方资料，关于Java SE 6 HotSpot虚拟机的garbage Collection，非常全，英文。 http://www.oracle.com/technetwork/java/javase/gc-tuning-6-140523.html Java SE 6 HotSpot[tm] Virtual Machine Garbage Collection Tuning &

Optuna参数调优Sklearn模型可视化+Roc分层抽样性能分析

1.数据集的选用和导入部分

2. Optuna调参部分

3.ROC图线绘制部分

你可能感兴趣的:(机器学习,python,机器学习)