我是菜狗子

AutoML框架-Auto-sklearn学习笔记01-原理及基本使用方法（参数、函数解析）

1、介绍

官网：APIs — AutoSklearn 0.15.0 documentation

源码：https://github.com/automl/auto-sklearn

主要功能：

自动学习样本数据: meta-learning，去学习样本数据的模样，自动推荐合适的模型。比如文本数据用什么模型比较好，比如很多的离散数据用什么模型好。
自动调超参：Bayesian optimizer，贝叶斯优化。
自动模型集成: build-ensemble，模型集成，在一般的比赛中都会用到的技巧。多个模型组合成一个更强更大的模型。往往能提高预测准确性。

2、安装

pip install auto-sklearn

或者

pip install --upgrade auto-sklearn -i https://pypi.douban.com/simple

导入库并打印版本号以确认它已成功安装

import autosklearn
print('autosklearn:%s'%autosklearn.__version__)

根据预测任务的不同，是分类还是回归，可以创建和配置 AutoSklearnClassifier或 AutoSklearnRegressor类的实例，将其拟合到数据集上。然后可以使用生成的模型直接进行预测或保存到文件（使用pickle）以供以后使用。

3、使用方法

加载数据

from pprint import pprint
import sklearn.datasets
import sklearn.metrics
import autosklearn.classification

X, y = sklearn.datasets.load_breast_cancer(return_X_y=True)
X_train, X_test, y_train, y_test = sklearn.model_selection.train_test_split(
    X, y, random_state=1
)

使用make_scorer封装我们自己的评价函数

import autosklearn.classification
import numpy as np
import pandas as pd
import sklearn.datasets
import sklearn.metrics
from autosklearn.metrics import balanced_accuracy, precision, recall, f1


def error(solution, prediction):
    # custom function defining error
    return np.mean(solution != prediction)

error_rate = autosklearn.metrics.make_scorer(
    name="custom_error",
    score_func=error,
    optimum=0,
    greater_is_better=False,
    needs_proba=False,
    needs_threshold=False,
)

构建和拟合一个分类器

automl = autosklearn.classification.AutoSklearnClassifier(
    time_left_for_this_task=120,
    per_run_time_limit=30,
    tmp_folder="/tmp/autosklearn_classification_example_tmp",
    scoring_functions=[balanced_accuracy, precision, recall, f1, error_rate],
)
automl.fit(X_train, y_train, dataset_name="breast_cancer")

获取所有搜索到的模型评分

def get_metric_result(cv_results):
    results = pd.DataFrame.from_dict(cv_results)
    results = results[results["status"] == "Success"]
    cols = ["rank_test_scores", "param_classifier:__choice__", "mean_test_score"]
    cols.extend([key for key in cv_results.keys() if key.startswith("metric_")])
    return results[cols]

print("Metric results")
print(get_metric_result(cls.cv_results_).to_string(index=False))

查看并保存通过auto-sklearn找到的模型

import os

my_leaderboard = automl.leaderboard(detailed=True)
print(my_leaderboard)

flag1 = os.path.isfile('./data/leaderboard/my_leaderboard.csv')
if flag1:
    print('file exists')
    os.remove('./data/leaderboard/my_leaderboard.csv')
    my_leaderboard.to_csv('./data/leaderboard/my_leaderboard.csv',encoding='utf-8-sig')
else:
    print("保存成功！")
    my_leaderboard.to_csv('./data/leaderboard/my_leaderboard.csv',encoding='utf-8-sig')

保存模型

打印由auto-sklearn构建的最终集成

automl.cv_results_
automl.sprint_statistics() #展示模型的状态
print(automl.show_models()) #展示最后我们获取的最佳模型

automl.performance_over_time_.plot(
        x='Timestamp',
        kind='line',
        legend=True,
        title='Auto-sklearn accuracy over time',
        grid=True,
    )
    plt.show()

performance_over_time_返回一个DataFrame，其中包含模型的性能随时间变化的数据，可以直接用于绘图。

查看训练集测试集表现

predictions = automl.predict(X_test)
print("Accuracy score:", sklearn.metrics.accuracy_score(y_test, predictions))

4、参数

(1) AutoSklearnClassifier()

autosklearn.classification.AutoSklearnClassifier(time_left_for_this_task=3600, per_run_time_limit=None, initial_configurations_via_metalearning=25, ensemble_size: int | None = None, ensemble_class: Type[AbstractEnsemble] | Literal['default'] | None = 'default', ensemble_kwargs: Dict[str, Any] | None = None, ensemble_nbest=50, max_models_on_disc=50, seed=1, memory_limit=3072, include: Optional[Dict[str, List[str]]] = None, exclude: Optional[Dict[str, List[str]]] = None, resampling_strategy='holdout', resampling_strategy_arguments=None, tmp_folder=None, delete_tmp_folder_after_terminate=True, n_jobs: Optional[int] = None, dask_client: Optional[dask.distributed.Client] = None, disable_evaluator_output=False, get_smac_object_callback=None, smac_scenario_args=None, logging_config=None, metadata_directory=None, metric: Scorer | Sequence[Scorer] | None = None, scoring_functions: Optional[List[Scorer]] = None, load_models: bool = True, get_trials_callback: SMACCallback | None = None, dataset_compression: Union[bool, Mapping[str, Any]] = True, allow_string_features: bool = True)

在这个过程中也将进行数据的预处理，auto-sklearn 中的预处理分为数据预处理和特征预处理。数据预处理包括分类特征的独热编码，缺失值插补以及特征或样本的归一化。这些步骤目前无法关闭。特征预处理是单个特征变换器，可实现例如特征选择或将特征变换到不同空间（如PCA）。特征预处理可以通过设置include参数中的可选项preprocessors=["no_preprocessing"] 将其关闭。

autosklearn.classification.AutoSklearnClassifier() 参数

autosklearn.classification.AutoSklearnClassifier() 参数
metric Scorer, optional (None)	autosklearn.metrics.Scorer的实例，由autosklearn.metrics.make_scorer()创建。这些是内置指标。如果提供了None，则根据任务选择默认的度量。内置指标有：{'accuracy': accuracy, 'balanced_accuracy': balanced_accuracy, 'roc_auc': roc_auc, 'average_precision': average_precision, 'log_loss': log_loss, 'precision_macro': precision_macro, 'precision_micro': precision_micro, 'precision_samples': precision_samples, 'precision_weighted': precision_weighted, 'recall_macro': recall_macro, 'recall_micro': recall_micro, 'recall_samples': recall_samples, 'recall_weighted': recall_weighted, 'f1_macro': f1_macro, 'f1_micro': f1_micro, 'f1_samples': f1_samples, 'f1_weighted': f1_weighted}
scoring_functions List[Scorer], optional (None)	评分列表，将计算每个管道和结果将通过cv_results可用
methods	我们提供以下方法来减少数据集的大小。这些可以在一个列表中提供，并按给定的顺序执行。 `"precision"` - 我们降低浮点精度如下: * `np.float128 -> np.float64` * `np.float96 -> np.float64` * `np.float64 -> np.float32` `subsample` - 我们对数据进行子采样，使其直接适合于内存 allocation `memory_allocation * memory_limit`. 次抽样考虑到分类标签并相应地分层。我们保证每个标签至少有一次出现在样本集中。
load_models bool, optional (True)	拟合Auto-sklearn后是否加载模型。
控制训练时间和内存使用量
time_left_for_this_task int, 可选(默认= 3600)	设置所有模型训练时间总和，以秒为单位。通过增加这个值，auto-sklearn有更高的机会找到更好的模型。
get_trials_callback callable	具有以下定义的可调用对象： (smac.SMBO, smac.RunInfo, smac.RunValue, time_left: float) -> bool \| None 这将在SMAC (autosklearn的底层优化器)完成每次运行的训练后调用。您可以使用它来记录您自己关于优化过程的信息。您还可以使用它来基于某些标准启用早期停止。
per_run_time_limit 可选(默认= time_left_for_this_task的1/10)	设置单个模型训练最长时间。如果机器学习算法超过时间限制，将终止模型拟合。将这个值设置得足够高，以便典型的机器学习算法能够适合训练数据。
max_models_on_disc int，可选(默认=50)	定义保存在磁盘中的模型的最大数量。额外数量的模型将被永久删除。由于这个变量的性质，它设置了一个集合可以使用多少个模型的上限。必须是大于等于1的整数。如果设置为None，则所有模型都保存在磁盘上。
memory_limit int,可选(3072)	机器学习算法的内存限制(MB)。如果auto-sklearn尝试分配超过memory_limit MB的内存，它将停止拟合机器学习算法。
initial_configurations_via_metalearning 可选(默认= 25)	用这些配置初始化超参数优化算法，这些配置在以前看过的数据集上工作得很好。如果超参数优化算法需要从头开始，则禁用。
ensemble_class type [AbstractEnsemble] \| " default "，可选(默认= " default ")	类实现了事后集成算法。设置为None可以禁用集成构建，或者使用SingleBest只获取使用单一最佳模型而不是集成。如果设置为“default”，它将对单目标问题使用EnsembleSelection，对多目标问题使用MultiObjectiveDummyEnsemble。
ensemble_kwargs Dict，可选，关键字参数	在初始化时传递给集成类。
模型选择
include 可选，[Dict[str, List[str]]] =None `"data_preprocessor"` `"balancing"` `"feature_preprocessor"` `"classifier"` - 仅当使用AutoSklearnClasssifier时 `"regressor"` -仅当使用AutoSklearnRegressor时	如果为None，则使用所有可能的算法。否则，指定搜索中包含的步骤和组件。参见/pipeline/components//*查看可用的组件。与参数exclude不兼容。举例： include = { 'classifier': ["random_forest"], 'feature_preprocessor': ["no_preprocessing"] } The supported components for the step 'feature_preprocessor' for this task are ['densifier', 'extra_trees_preproc_for_classification', 'fast_ica', 'feature_agglomeration', 'kernel_pca', 'kitchen_sinks', 'liblinear_svc_preprocessor', 'no_preprocessing', 'nystroem_sampler', 'pca', 'polynomial', 'random_trees_embedding', 'select_percentile_classification', 'select_rates_classification', 'truncatedSVD']
数据切分
resampling_strategy str\| BaseCrossValidator \| _RepeatedSplits\| BaseShuffleSplit = "holdout"	使用resampling_strategy参数可设置训练集与测试集的切分方法，设置五折交叉验证: resampling_strategy='cv', resampling_strategy_arguments={'folds': 5} 将数据切分为训练集和测集，其中训练集数据占2/3: resampling_strategy='holdout', resampling_strategy_arguments={'train_size': 0.67} `"holdout"` - 使用67:33 (train:test)分割 `"cv"`: 执行交叉验证，需要在resampling_strategy_arguments中“folds” `"holdout-iterative-fit"` - Same as “holdout” but iterative fit where possible `"cv-iterative-fit"`: Same as “cv” but iterative fit where possible `"partial-cv"`: Same as “cv” but uses intensification. `BaseCrossValidator` - 任何BaseCrossValidator子类(在scikit-learn model_selection模块中找到) `_RepeatedSplits` - 任何_repeatedslices子类(在scikit-learn model_selection模块中找到) `BaseShuffleSplit` - any BaseShuffleSplit subclass (found in scikit-learn model_selection module)
resampling_strategy_arguments 可选[Dict] = None	resampling_strategy的附加参数，如果使用基于cv的策略，这是必需的。如果保留为None，默认参数为: { "train_size": 0.67, # The size of the training set "shuffle": True, # Whether to shuffle before splitting data "folds": 5 # Used in 'cv' based resampling strategies }
模型存储
tmp_folder string, optional (None)	暂存目录。如果为“None”，则自动使用 `/tmp/autosklearn_tmp_$pid_$random_number`文件夹保存配置输出和日志文件
delete_tmp_folder_after_terminate: string, optional (True)	完成后，删除tmpfolder。如果tmp_folder为“None”，则将始终删除tmp_dir
n_jobs int, optional, experimental	fit()要并行运行的作业数。-1表示使用所有处理器。
logging_config dict, optional (None)	指定记录器配置的字典对象。如果为None，则默认日志记录。使用Yaml文件，该文件可以在util/logging目录中找到。
dataset_compression Union[bool, Mapping[str, Any]] = True	我们压缩数据集，以使它们适合于某些预定义的内存量。目前，这并不适用于数据帧或稀疏数组，只适用于原始numpy数组。注意:如果使用依赖于特定数据大小或顺序的自定义resampling_strategy，必须禁用此选项以保留这些属性。你可以通过传递False来完全禁用它，或者在下面的配置中保留默认的True： { "memory_allocation": 0.1, "methods": ["precision", "subsample"] }
disable_evaluator_output bool or list, optional (False)	如果为True，则禁用模型和预测输出。列表中允许的元素是： 'y_optimization'：do not save the predictions for the optimization set, which would later on be used to build an ensemble. model:不保存任何模型文件
属性
cv_results_ dict of numpy (masked) ndarrays	一种字典，其键作为列标题，值作为列，可以导入pandas DataFrame。目前还不支持所有由scikit-learn返回的键。
performance_over_time_ pandas.core.frame.DataFrame	包含模型随时间变化的性能数据的数据帧。可直接用于绘图。请参考示例训练和测试输入。Performance-over-time plot — AutoSklearn 0.15.0 documentation

metric

Scorer, optional (None)

autosklearn.metrics.Scorer的实例，由autosklearn.metrics.make_scorer()创建。这些是内置指标。如果提供了None，则根据任务选择默认的度量。

内置指标有：{'accuracy': accuracy, 'balanced_accuracy': balanced_accuracy, 'roc_auc': roc_auc, 'average_precision': average_precision, 'log_loss': log_loss, 'precision_macro': precision_macro, 'precision_micro': precision_micro, 'precision_samples': precision_samples, 'precision_weighted': precision_weighted, 'recall_macro': recall_macro, 'recall_micro': recall_micro, 'recall_samples': recall_samples, 'recall_weighted': recall_weighted, 'f1_macro': f1_macro, 'f1_micro': f1_micro, 'f1_samples': f1_samples, 'f1_weighted': f1_weighted}

scoring_functions

List[Scorer], optional (None)

评分列表，将计算每个管道和结果将通过cv_results可用

methods

我们提供以下方法来减少数据集的大小。这些可以在一个列表中提供，并按给定的顺序执行。

"precision" - 我们降低浮点精度如下: * np.float128 -> np.float64 * np.float96 -> np.float64 * np.float64 -> np.float32
subsample - 我们对数据进行子采样，使其直接适合于内存 allocation
memory_allocation * memory_limit. 次抽样考虑到分类标签并相应地分层。我们保证每个标签至少有一次出现在样本集中。

load_models

bool, optional (True)

拟合Auto-sklearn后是否加载模型。

控制训练时间和内存使用量

time_left_for_this_task

int, 可选(默认= 3600)

设置所有模型训练时间总和，以秒为单位。通过增加这个值，auto-sklearn有更高的机会找到更好的模型。

get_trials_callback

callable

具有以下定义的可调用对象：

(smac.SMBO, smac.RunInfo, smac.RunValue, time_left: float) -> bool | None

这将在SMAC (autosklearn的底层优化器)完成每次运行的训练后调用。

您可以使用它来记录您自己关于优化过程的信息。您还可以使用它来基于某些标准启用早期停止。

per_run_time_limit

可选(默认= time_left_for_this_task的1/10)

设置单个模型训练最长时间。如果机器学习算法超过时间限制，将终止模型拟合。将这个值设置得足够高，以便典型的机器学习算法能够适合训练数据。

max_models_on_disc

int，可选(默认=50)

定义保存在磁盘中的模型的最大数量。额外数量的模型将被永久删除。由于这个变量的性质，它设置了一个集合可以使用多少个模型的上限。必须是大于等于1的整数。如果设置为None，则所有模型都保存在磁盘上。

memory_limit

int,可选(3072)

机器学习算法的内存限制(MB)。如果auto-sklearn尝试分配超过memory_limit MB的内存，它将停止拟合机器学习算法。

initial_configurations_via_metalearning

可选(默认= 25)

用这些配置初始化超参数优化算法，这些配置在以前看过的数据集上工作得很好。如果超参数优化算法需要从头开始，则禁用。

ensemble_class

type [AbstractEnsemble] | " default "，

可选(默认= " default ")

类实现了事后集成算法。设置为None可以禁用集成构建，或者使用SingleBest只获取使用单一最佳模型而不是集成。

如果设置为“default”，它将对单目标问题使用EnsembleSelection，对多目标问题使用MultiObjectiveDummyEnsemble。

ensemble_kwargs

Dict，可选，关键字参数

在初始化时传递给集成类。

模型选择

include

可选，[Dict[str, List[str]]] =None

"data_preprocessor"
"balancing"
"feature_preprocessor"
"classifier" - 仅当使用AutoSklearnClasssifier时
"regressor" -仅当使用AutoSklearnRegressor时

如果为None，则使用所有可能的算法。

否则，指定搜索中包含的步骤和组件。参见/pipeline/components//*查看可用的组件。

与参数exclude不兼容。

举例：

include = {
    'classifier': ["random_forest"],
    'feature_preprocessor': ["no_preprocessing"]
}

The supported components for the step 'feature_preprocessor' for this task are ['densifier', 'extra_trees_preproc_for_classification', 'fast_ica', 'feature_agglomeration', 'kernel_pca', 'kitchen_sinks', 'liblinear_svc_preprocessor', 'no_preprocessing', 'nystroem_sampler', 'pca', 'polynomial', 'random_trees_embedding', 'select_percentile_classification', 'select_rates_classification', 'truncatedSVD']

数据切分

resampling_strategy

str| BaseCrossValidator | _RepeatedSplits| BaseShuffleSplit = "holdout"

使用resampling_strategy参数可设置训练集与测试集的切分方法，设置五折交叉验证:

resampling_strategy='cv',

resampling_strategy_arguments={'folds': 5}

将数据切分为训练集和测集，其中训练集数据占2/3:

resampling_strategy='holdout',

resampling_strategy_arguments={'train_size': 0.67}

"holdout" - 使用67:33 (train:test)分割
"cv": 执行交叉验证，需要在resampling_strategy_arguments中“folds”
"holdout-iterative-fit" - Same as “holdout” but iterative fit where possible
"cv-iterative-fit": Same as “cv” but iterative fit where possible
"partial-cv": Same as “cv” but uses intensification.
BaseCrossValidator - 任何BaseCrossValidator子类(在scikit-learn model_selection模块中找到)
_RepeatedSplits - 任何_repeatedslices子类(在scikit-learn model_selection模块中找到)
BaseShuffleSplit - any BaseShuffleSplit subclass (found in scikit-learn model_selection module)

resampling_strategy_arguments

可选[Dict] = None

resampling_strategy的附加参数，如果使用基于cv的策略，这是必需的。如果保留为None，默认参数为:

{
    "train_size": 0.67,     # The size of the training set
    "shuffle": True,        # Whether to shuffle before splitting data
    "folds": 5              # Used in 'cv' based resampling strategies
}

模型存储

tmp_folder

string, optional (None)

暂存目录。如果为“None”，则自动使用 /tmp/autosklearn_tmp_$pid_$random_number文件夹保存配置输出和日志文件

delete_tmp_folder_after_terminate: string, optional (True)

完成后，删除tmpfolder。如果tmp_folder为“None”，则将始终删除tmp_dir

n_jobs

int, optional, experimental

fit()要并行运行的作业数。-1表示使用所有处理器。

logging_config

dict, optional (None)

指定记录器配置的字典对象。如果为None，则默认日志记录。使用Yaml文件，该文件可以在util/logging目录中找到。

dataset_compression

Union[bool, Mapping[str, Any]] = True

我们压缩数据集，以使它们适合于某些预定义的内存量。目前，这并不适用于数据帧或稀疏数组，只适用于原始numpy数组。

注意:如果使用依赖于特定数据大小或顺序的自定义resampling_strategy，必须禁用此选项以保留这些属性。

你可以通过传递False来完全禁用它，或者在下面的配置中保留默认的True：

{
    "memory_allocation": 0.1,
    "methods": ["precision", "subsample"]
}

disable_evaluator_output

bool or list, optional (False)

如果为True，则禁用模型和预测输出。列表中允许的元素是：

'y_optimization'：do not save the predictions for the optimization set, which would later on be used to build an ensemble.

model:不保存任何模型文件

属性

cv_results_

dict of numpy (masked) ndarrays

一种字典，其键作为列标题，值作为列，可以导入pandas DataFrame。

目前还不支持所有由scikit-learn返回的键。

performance_over_time_

pandas.core.frame.DataFrame

包含模型随时间变化的性能数据的数据帧。可直接用于绘图。请参考示例训练和测试输入。Performance-over-time plot — AutoSklearn 0.15.0 documentation

(2) fit(X,y, X_test=None, y_test=None, feat_type=None, dataset_name=None)

参数
X：array-like or sparse matrix of shape = [n_samples, n_features]	The training input samples.
y：array-like, shape = [n_samples] or [n_samples, n_outputs]	The target classes.
X_test：array-like or sparse matrix of shape = [n_samples, n_features]	Test data input samples. Will be used to save test predictions for all models. This allows to evaluate the performance of Auto-sklearn over time.
y_test：array-like, shape = [n_samples] or [n_samples, n_outputs]	Test data target classes. Will be used to calculate the test error of all models. This allows to evaluate the performance of Auto-sklearn over time.
feat_type：list, optional (default=None)	描述属性类型的len(X.shape[1])的str列表。可能的类型是范畴型和数值型。分类属性将自动进行One-Hot编码。用于分类属性的值必须是整数，例如通过sklearn.preprocessing.LabelEncoder获得。
dataset_name：str, optional (default=None)	创建更好的输出。如果为None，则由数据集的md5散列确定一个字符串。

(3) fit_ensemble()

fit_ensemble(y, task: int = None, precision: Literal[16, 21, 64] = 32, dataset_name: Optional[str] = None, ensemble_size: int | None = None, ensemble_kwargs: Optional[Dict[str, Any]] = None, ensemble_nbest: Optional[int] = None, ensemble_class: Type[AbstractEnsemble] | Literal['default'] | None = 'default', metric: Scorer | Sequence[Scorer] | None = None)

根据优化过程中训练的模型拟合集合。所有参数默认为None。如果没有给出其他值，则使用在fit()调用中设置的默认值。

参数
y：array-like	Target values.
task：int	来自autosklearn.constants模块的常量。确定任务类型(二元分类、多类分类、多标签分类或回归)。
precision：int	加载集成数据时使用的数值精度。可以是16、32或64。
dataset_name：str	当前数据集的名称。
ensemble_kwargs：Dict, optional	关键字参数，在初始化时传递给集成类。
ensemble_nbest：int	在构建ensemble 时，只考虑最佳ensemble 模型。
ensemble_classType[AbstractEnsemble] \| “default”, optional (default=”default”)	类实现了事后集成算法。设置为None来禁用集成构建或使用类:SingleBest来只获得使用单一最佳模型而不是集成。如果设置为“default”，它将对单目标问题使用EnsembleSelection，对多目标问题使用MultiObjectiveDummyEnsemble。
metric: Scorer \| Sequence[Scorer] \| None = None

(4) fit_pipeline()

fit_pipeline(X: Union[List, pandas.core.frame.DataFrame, numpy.ndarray, scipy.sparse._base.spmatrix], y: Union[List, pandas.core.series.Series, pandas.core.frame.DataFrame, numpy.ndarray, scipy.sparse._base.spmatrix], config: Union[ConfigSpace.configuration_space.Configuration, Dict[str, Union[str, float, int]]], dataset_name: Optional[str] = None, X_test: Optional[Union[List, pandas.core.frame.DataFrame, numpy.ndarray, scipy.sparse._base.spmatrix]] = None, y_test: Optional[Union[List, pandas.core.series.Series, pandas.core.frame.DataFrame, numpy.ndarray, scipy.sparse._base.spmatrix]] = None, feat_type: Optional[List[str]] = None, *args, **kwargs: Dict) → Tuple[Optional[autosklearn.pipeline.base.BasePipeline], smac.runhistory.runhistory.RunInfo, smac.runhistory.runhistory.RunValue]

适合单独的管道配置并将结果返回给用户。

参数
X: array-like, shape = (n_samples, n_features)	The features used for training
y: array-like	The labels used for training
X_test: Optionalarray-like, shape = (n_samples, n_features)	If provided, the testing performance will be tracked on this features.
y_test: array-like	如果提供，测试性能将在此标签上跟踪
config: Union[Configuration, Dict[str, Union[str, float, int]]]	用于定义管道步骤的配置对象。如果传递了一个字典，则基于该字典创建一个配置。
dataset_name: Optional[str]	将用于标记Auto-Sklearn运行并标识Auto-Sklearn运行的名称
feat_typelist, optional (default=None)	描述属性类型的len(X.shape[1])的str列表。可能的类型是范畴型和数值型。分类属性将自动进行One-Hot编码。用于分类属性的值必须是整数，例如通过sklearn.preprocessing.LabelEncoder获得。
返回
pipeline: Optional[BasePipeline]	安装管道。如果在安装管道时出现故障，则返回None。
run_info: RunInFo	包含启动配置的命名元组
run_value: RunValue	包含运行结果的命名元组

(5) leaderboard()

leaderboard(detailed: bool = False, ensemble_only: bool = True, top_k: Union[int, Literal['all']] = 'all', sort_by: str = 'cost', sort_order: Literal['auto', 'ascending', 'descending'] = 'auto', include: Optional[Union[str, Iterable[str]]] = None)

返回所有评估模型的结果的DataFrame。给出在搜索过程中训练的所有模型的概述，以及关于它们的训练的各种统计数据。现有的统计如下:

输出（Simple）	输出（Detailed）
`"model_id"` - 给模型的id。	`"config_id"` - The id used by SMAC for optimization.
`"rank"` - The rank of the model based on it’s `"cost"`.	`"budget"` - 分配给这个模型的预算是多少。
`"ensemble_weight"` - 在集合中赋予模型的权重。	`"status"` - 用SMAC训练模型的返回状态。
`"type"` - 使用的分类器/回归器的类型。	`"train_loss"` - The loss of the model on the training set.
`"cost"` - 验证集中模型的损失。	`"balancing_strategy"` - 用于数据预处理的平衡策略。
`"duration"` - 模型优化的时间长度。	`"start_time"` - 模型开始优化的时间
	`"end_time"` - Time the model ended being optimized
	`"data_preprocessors"` - 数据上使用的预处理器
	`"feature_preprocessors"` - 特性类型的预处理器
参数
detailed: bool = False	是要给出详细的信息还是只是一个简单的概述。
ensemble_only: bool = True	是只查看集合中包含的模型还是所有训练过的模型。
top_k: int or “all” = “all”	要显示多少个模型。
sort_by: str = ‘cost’	按哪一列排序。如果该列不存在，则默认排序为“model_id”索引列。默认为优化的度量。在多目标优化问题中，按第一个目标排序
sort_order: “auto” or “ascending” or “descending” = “auto”	Which sort order to apply to the `sort_by` column. If left as `"auto"`, it will sort by a sensible default where “better” is on top, otherwise defaulting to the pandas default for DataFrame.sort_values if there is no obvious “better”.
include: Optional[str or Iterable[str]]	包括的项目，其他未指定的项目将被排除。例外的是“model_id”索引列，它总是包含在内。如果保留为None，它将返回使用详细参数来决定要包含的列。

(6) show_models()

返回一个包含集合模型的字典的字典。通过将model_id作为键，可以访问集成中的每个模型。

一个模型字典包含以下内容:

"model_id" - 模型id.
"rank" - The rank of the model based on it’s "cost".
"cost" - The loss of the model on the validation set.
"ensemble_weight" - The weight given to the model in the ensemble.
"voting_model" - The cv_voting_ensemble model (for ‘cv’ resampling).
"estimators" - List of models (dicts) in cv_voting_ensemble
(‘cv’ resampling).
"data_preprocessor" - The preprocessor used on the data.
"balancing" - The balancing used on the data (for classification).
"feature_preprocessor" - The preprocessor for features types.
"classifier" / "regressor" - The autosklearn wrapped classifier or regressor.
"sklearn_classifier" or "sklearn_regressor" - The sklearn classifier or regressor.

(7) autosklearn.metrics.make_scorer()

autosklearn.metrics.make_scorer(name: str, score_func: Callable, *, optimum: float = 1.0, worst_possible_result: float = 0.0, greater_is_better: bool = True, needs_proba: bool = False, needs_threshold: bool = False, needs_X: bool = False, **kwargs: Any)

参数
name: str	名称
score_func：callable	带有签名score_func(y, y_pred， **kwargs)的评分函数(或损失函数)
optimum：int or float, default=1	得分函数所能达到的最佳分数，即记分函数的最大值和损失函数的最小值。
worst_possible_resultint of float, default=0	得分函数可达到的最差分数，即记分函数中的最小值和损失函数中的最大值。
greater_is_better：boolean, default=True	score_func是一个分数函数（默认），表示高就是好。score_func是一个损失函数，表示低就是好。在后一种情况下，scorer对象将对score_func的结果进行符号翻转。
needs_proba：boolean, default=False	score_func是否需要predict_proba才能从分类器中获得概率估计值。
needs_threshold：boolean, default=False	score_func是否需要持续的决策确定性。这仅适用于二进制分类。
needs_X：boolean, default=False	Whether score_func requires X in __call__ to compute a metric.
**kwargsadditional arguments	要传递给score_func的其他参数。

你可能感兴趣的:(学习,sklearn,机器学习)

Deepseek 对种猪市场会带来哪些影响？百态老人笔记大数据人工智能
DeepSeek对种猪市场的影响可以从以下几个方面进行分析：1.提高生产效率与降低成本根据，DeepSeek已经被用于养猪场中分析饲料配比，从而将猪的育肥周期从6个月缩短至5个月，并降低了15%的成本。这表明DeepSeek在优化养殖流程和提高生产效率方面具有显著作用，能够帮助养猪场降低运营成本，提升经济效益。2.推动智能化养殖技术的应用和提到，深度学习技术（如YOLOv5模型）已经被应用于生猪的
Python 库的记录 weixin_40895135 python
GitHub-jobbole/awesome-python-cn:Python资源大全中文版，内容包括：Web框架、网络爬虫、网络内容提取、模板引擎、数据库、数据可视化、图片处理、文本处理、自然语言处理、机器学习、日志、代码分析等环境管理管理Python版本和环境的工具p–非常简单的交互式python版本管理工具。pyenv–简单的Python版本管理工具。Vex–可以在虚拟环境中执行命令。vir
UEFI与BIOS的比较_2020-05-11 尘世闲鱼底层开发 #UEFI 底层应用开发 uefi
BIOS 学习UEFI前先简单了解一下BIOS。BIOS功能：加电自检程序，用于开机时对硬件的检测。系统初始化代码，包括硬件设备的初始化，创建BIOS中断向量等。基本的外围I/O处理的子程序代码。CMOS程序设置。BIOS工作流程：加电自检（PowerOnSelfTest，POST）：检测关机设备是否正常工作，设备设置是否与CMOS（CMOS是是电脑主板上的一块可读写的RAM芯片，常用来保存BI
kotlin 深入学习爱水的云开发分享 java servlet android
一、进阶用法解构解构:解构指的是将对象的多个属性分别赋值给多个变量的过程funmain(args:Array){valuser=User(12,"name")val(age,name)=userprintln(age)println(name)}classUser(varage:Int,varname:String){operatorfuncomponent1()=ageoperatorfunco
第2节课：文本内容与格式化——HTML中的文本处理技巧学问小小谢 HTML学习 html 前端学习
目录文本内容与格式化：段落和标题：构建文本基础段落``标题``到``格式化：强调和样式加粗``斜体``下划线``列表：组织内容无序列表``有序列表``定义列表``实践：创建一个内容丰富的网页结语文本内容与格式化：在网页设计中，文本是传达信息的核心元素。HTML提供了多种方式来创建和格式化文本，使其既美观又易于阅读。在本节课中，我们将深入学习HTML中文本内容的创建和格式化，包括段落、标题、加粗、斜
matlab学习路线 kyle~ matlab matlab 学习信息可视化
阶段1：基础入门（1-2周）目标：熟悉MATLAB界面、基础语法和简单操作。学习内容：环境与界面：了解MATLAB的桌面布局（命令窗口、工作区、编辑器、当前文件夹）。学习如何创建脚本（.m文件）和实时脚本（.mlx文件）。掌握常用快捷键（如Ctrl+R注释、F5运行脚本）。基础语法：变量定义与数据类型（数值、字符、逻辑、矩阵、cell数组、结构体）。矩阵操作（创建、索引、切片、拼接），例如：A=[
CVPR‘24开源 | ADA-Track：端到端3D多目标跟踪最新SOTA！计算机视觉工坊 3D视觉从入门到精通 3d 目标跟踪人工智能
编辑：计算机视觉工坊添加小助理：dddvision，备注：方向+学校/公司+昵称，拉你入群。文末附行业细分群扫描下方二维码，加入3D视觉知识星球，星球内凝聚了众多3D视觉实战问题，以及各个模块的学习资料：近20门视频课程（星球成员免费学习）、最新顶会论文、3DGS系列、计算机视觉书籍、优质3D视觉算法源码等。想要入门3D视觉、做项目、搞科研，欢迎扫码加入！
linux防火墙禁止80端口入站,Linux中在防火墙中开启80端口的例子，linux80 在下乔西西
Linux中在防火墙中开启80端口的例子，linux80最近自己在学习Linux。搭建一个LNMP环境。在测试时一切都好。然后重启Linux后。再次访问网站无法打开。最终原因是在防火墙中没有加入80端口的规则。具体方法如下：在CentOS下配置iptables防火墙，是非常必要的。来我们学习如何配置！，其它版本一下：1.打开iptables的配置文件：代码如下复制代码vi/etc/sysconfi
22、JavaScript学习笔记——ES5严格模式 lvh98 javascript 学习前端
ES5严格模式当前使用的ES语法是基于ES3.0的方法加上ES5.0的新增方法。默认情况下，ES3.0和ES5.0冲突的部分，会沿用ES3.0的方法；而在ES5.0严格模式下，冲突部分会使用ES5.0的方法。1.“usestrict”不再兼容ES3.0的一些不规则语法。使用全新的ES5.0规范。1.1ES5.0严格模式的启动要选择使用严格模式，需要使用严格模式编译指示（pragma），即一个不赋值
Python3 【集合】项目实战：3 个新颖的学习案例李智 - 重庆 Python 精讲精练 -从入门到实战 python 经验分享案例学习编程技巧
Python3【集合】项目实战：3个新颖的学习案例以下是3个应用“Python集合”知识的综合应用项目，这些项目具有新颖性、前瞻性和实用性，每个项目都包含完整的代码、解释说明、测试案例和执行结果。基因序列比对文章推荐系统运行日志分析项目1：基因序列比对（集合运算与去重）项目描述在生物信息学中，比对两个基因序列的相似性。使用集合的交集和并集计算相似度。代码实现#基因序列（简化为字符串集合）seque
spring mvc java 8 rest idea_springmvc学习笔记---面向移动端支持REST API 射命丸咲 spring mvc java 8 rest idea
前言:springmvc对注解的支持非常灵活和飘逸,也得web编程少了以往很大一坨配置项.另一方面移动互联网的到来,使得RESTAPI变得流行,甚至成为主流.因此我们来关注下springmvc对restapi的支持程度,以及需要做的工作评估.样例设计和准备:springmvc学习笔记系列的文章目录:•idea创建springmvc项目RESTAPI的设计原则遵循之前的博文来实现•移动互联网实战--
2020 年 12 月大学英语四级考试真题（第 1 套）——纯享题目版 fo安方英语—四级CET4 学习四级生活
个人主页：fo安方的博客✨个人简历：大家好，我是fo安方，目前中南大学MBA在读，也考取过HCIECloudComputing、CCIESecurity、PMP、CISP、RHCE、CCNPRS、PEST3等证书。兴趣爱好：b站天天刷，题目常常看，运动偶尔做，学习需劳心，寻觅些乐趣。欢迎大家：这里是CSDN，是我记录我的日常学习，偶尔生活的地方，喜欢的话请一键三连，有问题请评论区讨论。导读页：这是
2022 年 6 月大学英语四级考试真题（第 2 套）——纯享题目版 fo安方英语—四级CET4 生活学习四级
个人主页：fo安方的博客✨个人简历：大家好，我是fo安方，目前中南大学MBA在读，也考取过HCIECloudComputing、CCIESecurity、PMP、CISP、RHCE、CCNPRS、PEST3等证书。兴趣爱好：b站天天刷，题目常常看，运动偶尔做，学习需劳心，寻觅些乐趣。欢迎大家：这里是CSDN，是我记录我的日常学习，偶尔生活的地方，喜欢的话请一键三连，有问题请评论区讨论。导读页：这是
2023 年 6 月大学英语四级考试真题（第 3 套）——纯享题目版 fo安方英语—四级CET4 学习生活英语四级
个人主页：fo安方的博客✨个人简历：大家好，我是fo安方，目前中南大学MBA在读，也考取过HCIECloudComputing、CCIESecurity、PMP、CISP、RHCE、CCNPRS、PEST3等证书。兴趣爱好：b站天天刷，题目常常看，运动偶尔做，学习需劳心，寻觅些乐趣。欢迎大家：这里是CSDN，是我记录我的日常学习，偶尔生活的地方，喜欢的话请一键三连，有问题请评论区讨论。导读页：这是
2022 年 12 月大学英语四级考试真题（第 3 套）——纯享题目版 fo安方英语—四级CET4 学习生活
个人主页：fo安方的博客✨个人简历：大家好，我是fo安方，目前中南大学MBA在读，也考取过HCIECloudComputing、CCIESecurity、PMP、CISP、RHCE、CCNPRS、PEST3等证书。兴趣爱好：b站天天刷，题目常常看，运动偶尔做，学习需劳心，寻觅些乐趣。欢迎大家：这里是CSDN，是我记录我的日常学习，偶尔生活的地方，喜欢的话请一键三连，有问题请评论区讨论。导读页：这是
研发团队管理：如何应对工期非合理要求程序猿学长团队管理研发管理研发团队管理
关注公众号程序猿学长，获取大量免费学习资源和更多文章内容。在销售主导型公司中，面对CEO要求“三个月完成本应半年的项目”，研发管理者需要采取“系统性谈判+结构化交付+风险显性化”的组合策略。以下是具体应对框架，含操作步骤、工具使用和典型案例：一、需求解构与优先级重塑1.需求价值四象限分析高价值+高紧急高价值+低紧急低价值+高紧急低价值+低紧急需求池商业价值评估核心MVP分阶段交付简化方案暂缓或放弃
Spring MVC学习笔记万般滋味皆生活后端开发 spring springmvc
文章目录SpringMVC什么是MVC设计模式？SpringMVC的核心组件SpringMVC的工作流程如何使用？SpringMVC注解SpringMVC数据绑定SpringMVC模型数据解析SpringMVC自定义数据转换器SpringMVCREST特点如何使用SpringMVC文件上传下载SpringMVC表单标签库常用的表单标签SpringMVC数据校验SpringMVCSpringMVC是
Python语言的安全开发慕璃嫣包罗万象 golang 开发语言后端
Python语言的安全开发引言在信息技术迅速发展的今天，网络安全问题愈发凸显。随着Python语言的广泛应用，尤其是在数据分析、人工智能、Web开发等领域，其安全问题越来越受到重视。Python作为一门高效且易于学习的编程语言，虽然在开发过程中为我们提供了很多便利，但如果忽视了安全性，将可能导致严重的安全漏洞和数据泄露等问题。因此，本文将围绕Python语言的安全开发展开讨论，重点分析常见的安全问
react学习 guhy fighting react react.js 学习前端
react框架的选择低代码、BI前瞻性bs架构，网页客户端去使用react就是用来代替DOM的，dom操作，构建前端界面的react-native直接开发ios，安卓，原生应用虚拟dom，操作react，影响dom，中间人现在的dom和当前的dom做比较看哪个发生了变化，做最小的修改1、虚拟dom2、兼容性3、性能好，避免做一些多余的操作声明式编程：结果为导向命令式编程：过程为导向基于组件开发，组
使用scikit-learn中的KNN包实现对鸢尾花数据集或者自定义数据集的的预测。 Jam-Young scikit-learn python 信息可视化
使用scikit-learn中的KNN包实现对鸢尾花数据集或者自定义数据集的的预测。#导入鸢尾花数据集fromsklearn.datasetsimportload_iris,fetch_20newsgroups#数据化可视包importseabornassnsimportmatplotlib.pyplotaspltimportpandasaspdfromsklearn.model_selectio
获取PPT中的MSO格式图片报错 ♢.＊ ppt python
亲爱的小伙伴们，在求知的漫漫旅途中，若你对深度学习的奥秘、Java与Python的奇妙世界，亦或是读研论文的撰写攻略有所探寻，那不妨给我一个小小的关注吧。我会精心筹备，在未来的日子里不定期地为大家呈上这些领域的知识宝藏与实用经验分享。每一个点赞，都如同春日里的一缕阳光，给予我满满的动力与温暖，让我们在学习成长的道路上相伴而行，共同进步✨。期待你的关注与点赞哟！image.ext的报错ValueEr
知识图谱技术剖析 ♢.＊人工智能知识图谱大数据
亲爱的小伙伴们，在求知的漫漫旅途中，若你对深度学习的奥秘、Java与Python的奇妙世界，亦或是读研论文的撰写攻略有所探寻，那不妨给我一个小小的关注吧。我会精心筹备，在未来的日子里不定期地为大家呈上这些领域的知识宝藏与实用经验分享。每一个点赞，都如同春日里的一缕阳光，给予我满满的动力与温暖，让我们在学习成长的道路上相伴而行，共同进步✨。期待你的关注与点赞哟！一、引言在当今数字化信息爆炸的时代，如
启元世界（Inspir.ai）技术浅析（一）爱研究的小牛 AIGC—游戏制作人工智能机器学习 AIGC 深度学习
启元世界（Inspir.ai）作为全球领先的通用人工智能平台公司，自2017年成立以来，一直致力于通过人工智能技术提升产业效能和生活体验。公司汇聚了来自全球顶尖公司和高等学府的技术专家，专注于深度强化学习、推荐算法以及机器学习系统平台等前沿领域，并成功将人工智能技术应用于数字娱乐、智能决策和机器人等多个领域。一、核心技术启元世界在人工智能领域取得了多项突破性进展，其核心技术涵盖了以下几个方面：1.
python神经网络框架有哪些,python调用神经网络模型小明技术分享 python 神经网络深度学习
人工智能Python深度学习库有哪些由于Python的易用性和可扩展性，众多深度学习框架提供了Python接口，其中较为流行的深度学习库如下：第一：CaffeCaffe是一个以表达式、速度和模块化为核心的深度学习框架，具备清晰、可读性高和快速的特性，在视频、图像处理方面应用较多。Caffe中的网络结构与优化都以配置文件形式定义，容易上手，无须通过代码构建网络;网络训练速度快，能够训练大型数据集与S
I2C协议与FPGA开发教程_VHDL/Verilog实现侯昂
本文还有配套的精品资源，点击获取简介：本压缩包文件包含了I2C协议的学习资料，特别是针对FPGA开发的实验教程。内容涵盖了I2C基础知识、通信模式、总线仲裁机制，以及用VHDL和Verilog语言实现I2C控制器的方法。教程还包括在FPGA平台配置I2C接口的详细步骤和实验指导，帮助读者深入理解I2C协议，并在FPGA上实现其控制。1.I2C协议基础介绍I2C（Inter-IntegratedCi
备赛蓝桥杯之第十五届职业院校组省赛第三题：产品360度展示云端·目前学前端备赛蓝桥杯蓝桥杯职场和发展
提示：本篇文章仅仅是作者自己目前在备赛蓝桥杯中，自己学习与刷题的学习笔记，写的不好，欢迎大家批评与建议由于个别题目代码量与题目量偏大，请大家自己去蓝桥杯官网【连接高校和企业-蓝桥云课】去寻找原题，在这里只提供部分原题代码本题目为：2024年十五届省赛职业院校组真题第三题：产品360度展示题目：需要考生作答的代码段如下：/***@param{*}initialValue初始值*@param{Arra
JavaScript学习记录22 济南小草根 JavaScript javascript 学习开发语言
第十节RegExp对象1.概述正则表达式（regularexpression）是一种表达文本模式（即字符串结构）的方法，有点像字符串的模板，常常用来按照“给定模式”匹配文本。比如，正则表达式给出一个Email地址的模式，然后用它来确定一个字符串是否为Email地址。JavaScript的正则表达式体系是参照Perl5建立的。新建正则表达式有两种方法。一种是使用字面量，以斜杠表示开始和结束。varr
Python实现复原毫米波雷达呼吸波形的示例 go5463158465 python 算法机器学习 python 开发语言
以下是一个使用Python实现复原毫米波雷达呼吸波形的示例，该示例将涉及模型算法在重建损失和KL（Kullback-Leibler）损失之间的平衡问题。我们将使用深度学习中的变分自编码器（VAE）作为模型来进行呼吸波形的复原，因为VAE可以很好地处理重建和潜在空间分布的问题。步骤概述数据准备：生成或加载毫米波雷达的呼吸波形数据。定义VAE模型：包括编码器和解码器。定义损失函数：结合重建损失和KL损
fpga学习入门串口rs232回环杨龙龙yll fpga
奇偶检验位这里是省略了做好回环后可以使用上位机做回环测试，top文件写的方式就是将rx（fpga端）接受到的模块（pc端）tx发送出去，这两个端口用杜邦线连接，同理模块的rx连接fpga的tx，看上位机接收区是否是你发送的即可测试代码正确，如果不对的话可以先把上位机停止位改成1.5或者2位即可需要使用到usb转ttl的模块一个这个做仿真的话稍微麻烦tb文件里需要例化tx发送给top文件，再例化rx
关于在学习mybatis框架中遇到的xml解析错误的bug 愿天堂没有java java学习 mybatis 学习 xml
项目场景：在写动态sql语句时，由于不小心对文字进行错误的备注操作从而导致mybatis中写sql语句1的xml文件解析错误代码重现：org.xml.sax.SAXParseException;lineNumber:136;columnNumber:10;元素类型为"mapper"的内容必须匹配"(cache-ref|cache|resultMap*|parameterMap*|sql*|inse
戴尔笔记本win8系统改装win7系统 sophia天雪 win7 戴尔改装系统 win8
戴尔win8 系统改装win7 系统详述第一步：使用U盘制作虚拟光驱： 1）下载安装UltraISO：注册码可以在网上搜索。 2）启动UltraISO，点击“文件”—》“打开”按钮，打开已经准备好的ISO镜像文
BeanUtils.copyProperties使用笔记 bylijinnan java
BeanUtils.copyProperties VS PropertyUtils.copyProperties 两者最大的区别是： BeanUtils.copyProperties会进行类型转换，而PropertyUtils.copyProperties不会。既然进行了类型转换，那BeanUtils.copyProperties的速度比不上PropertyUtils.copyProp
MyEclipse中文乱码问题 0624chenhong MyEclipse
一、设置新建常见文件的默认编码格式，也就是文件保存的格式。在不对MyEclipse进行设置的时候，默认保存文件的编码，一般跟简体中文操作系统（如windows2000，windowsXP）的编码一致，即GBK。在简体中文系统下，ANSI 编码代表 GBK编码;在日文操作系统下，ANSI 编码代表 JIS 编码。 Window-->Preferences-->General -
发送邮件不懂事的小屁孩 send email
import org.apache.commons.mail.EmailAttachment; import org.apache.commons.mail.EmailException; import org.apache.commons.mail.HtmlEmail; import org.apache.commons.mail.MultiPartEmail;
动画合集换个号韩国红果果 html css
动画指一种样式变为另一种样式 keyframes应当始终定义0 100 过程 1 transition 制作鼠标滑过图片时的放大效果 css .wrap{ width: 340px;height: 340px; position: absolute; top: 30%; left: 20%; overflow: hidden; bor
网络最常见的攻击方式竟然是SQL注入蓝儿唯美 sql注入
NTT研究表明，尽管SQL注入（SQLi）型攻击记录详尽且为人熟知，但目前网络应用程序仍然是SQLi攻击的重灾区。信息安全和风险管理公司NTTCom Security发布的《2015全球智能威胁风险报告》表明，目前黑客攻击网络应用程序方式中最流行的，要数SQLi攻击。报告对去年发生的60亿攻击行为进行分析，指出SQLi攻击是最常见的网络应用程序攻击方式。全球网络应用程序攻击中，SQLi攻击占
java笔记2 a-john java
类的封装： 1，java中，对象就是一个封装体。封装是把对象的属性和服务结合成一个独立的的单位。并尽可能隐藏对象的内部细节（尤其是私有数据） 2，目的：使对象以外的部分不能随意存取对象的内部数据（如属性），从而使软件错误能够局部化，减少差错和排错的难度。 3，简单来说，“隐藏属性、方法或实现细节的过程”称为——封装。 4，封装的特性： 4.1设置
[Andengine]Error：can't creat bitmap form path “gfx/xxx.xxx” aijuans 学习Android遇到的错误
最开始遇到这个错误是很早以前了，以前也没注意，只当是一个不理解的bug，因为所有的texture，textureregion都没有问题，但是就是提示错误。昨天和美工要图片，本来是要背景透明的png格式，可是她却给了我一个jpg的。说明了之后她说没法改，因为没有png这个保存选项。我就看了一下，和她要了psd的文件，还好我有一点
自己写的一个繁体到简体的转换程序 asialee java 转换繁体 filter 简体
今天调研一个任务，基于java的filter实现繁体到简体的转换，于是写了一个demo，给各位博友奉上，欢迎批评指正。实现的思路是重载request的调取参数的几个方法，然后做下转换。
android意图和意图监听器技术百合不是茶 android 显示意图隐式意图意图监听器
Intent是在activity之间传递数据;Intent的传递分为显示传递和隐式传递显式意图：调用Intent.setComponent() 或 Intent.setClassName() 或 Intent.setClass()方法明确指定了组件名的Intent为显式意图，显式意图明确指定了Intent应该传递给哪个组件。隐式意图;不指明调用的名称,根据设
spring3中新增的@value注解 bijian1013 java spring @Value
在spring 3.0中，可以通过使用@value，对一些如xxx.properties文件中的文件，进行键值对的注入，例子如下： 1.首先在applicationContext.xml中加入： <beans xmlns="http://www.springframework.
Jboss启用CXF日志 sunjing log jboss CXF
1. 在standalone.xml配置文件中添加system-properties： <system-properties> <property name="org.apache.cxf.logging.enabled" value=&
【Hadoop三】Centos7_x86_64部署Hadoop集群之编译Hadoop源代码 bit1129 centos
编译必需的软件 Firebugs3.0.0 Maven3.2.3 Ant JDK1.7.0_67 protobuf-2.5.0 Hadoop 2.5.2源码包 Firebugs3.0.0 http://sourceforge.jp/projects/sfnet_findbug
struts2验证框架的使用和扩展白糖_ 框架 xml bean struts 正则表达式
struts2能够对前台提交的表单数据进行输入有效性校验，通常有两种方式： 1、在Action类中通过validatexx方法验证，这种方式很简单，在此不再赘述； 2、通过编写xx-validation.xml文件执行表单验证，当用户提交表单请求后，struts会优先执行xml文件，如果校验不通过是不会让请求访问指定action的。本文介绍一下struts2通过xml文件进行校验的方法并说
记录-感悟 braveCS 感悟
再翻翻以前写的感悟，有时会发现自己很幼稚，也会让自己找回初心。 2015-1-11 1. 能在工作之余学习感兴趣的东西已经很幸福了； 2. 要改变自己，不能这样一直在原来区域，要突破安全区舒适区，才能提高自己，往好的方面发展； 3. 多反省多思考；要会用工具，而不是变成工具的奴隶； 4. 一天内集中一个定长时间段看最新资讯和偏流式博
编程之美-数组中最长递增子序列 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class LongestAccendingSubSequence { /** * 编程之美数组中最长递增子序列 * 书上的解法容易理解 * 另一方法书上没有提到的是，可以将数组排序（由小到大）得到新的数组， * 然后求排序后的数组与原数
读书笔记5 chengxuyuancsdn 重复提交 struts2的token验证
1、重复提交 2、struts2的token验证 3、用response返回xml时的注意 1、重复提交 (1)应用场景 (1-1)点击提交按钮两次。 (1-2)使用浏览器后退按钮重复之前的操作，导致重复提交表单。 (1-3)刷新页面 (1-4)使用浏览器历史记录重复提交表单。 (1-5)浏览器重复的 HTTP 请求。 (2)解决方法 (2-1)禁掉提交按钮 (2-2)
[时空与探索]全球联合进行第二次费城实验的可能性 comsci
二次世界大战前后,由爱因斯坦参加的一次在海军舰艇上进行的物理学实验 -费城实验至今给我们大家留下很多迷团..... 关于费城实验的详细过程,大家可以在网络上搜索一下,我这里就不详细描述了在这里,我的意思是,现在
easy connect 之 ORA-12154: TNS: 无法解析指定的连接标识符 daizj oracle ORA-12154
用easy connect连接出现“tns无法解析指定的连接标示符”的错误，如下： C:\Users\Administrator>sqlplus username/[email protected]:1521/orcl SQL*Plus: Release 10.2.0.1.0 – Production on 星期一 5月 21 18:16:20 2012 Copyright (c) 198
简单排序:归并排序 dieslrae 归并排序
public void mergeSort(int[] array){ int temp = array.length/2; if(temp == 0){ return; } int[] a = new int[temp]; int
C语言中字符串的\0和空格 dcj3sjt126com c
\0 为字符串结束符，比如说： abcd (空格)cdefg；存入数组时，空格作为一个字符占有一个字节的空间，我们
解决Composer国内速度慢的办法 dcj3sjt126com Composer
用法：有两种方式启用本镜像服务： 1 将以下配置信息添加到 Composer 的配置文件 config.json 中（系统全局配置）。见“例1” 2 将以下配置信息添加到你的项目的 composer.json 文件中（针对单个项目配置）。见“例2” 为了避免安装包的时候都要执行两次查询，切记要添加禁用 packagist 的设置，如下 1 2 3 4 5
高效可伸缩的结果缓存 shuizhaosi888 高效可伸缩的结果缓存
/** * 要执行的算法，返回结果v */ public interface Computable<A, V> { public V comput(final A arg); } /** * 用于缓存数据 */ public class Memoizer<A, V> implements Computable<A,
三点定位的算法 haoningabc c 算法
三点定位，已知a,b,c三个顶点的x,y坐标和三个点都z坐标的距离，la，lb,lc 求z点的坐标原理就是围绕a,b,c 三个点画圆，三个圆焦点的部分就是所求但是，由于三个点的距离可能不准，不一定会有结果，所以是三个圆环的焦点，环的宽度开始为0，没有取到则加1 运行 gcc -lm test.c test.c代码如下 #include "stdi
epoll使用详解 jimmee c linux 服务端编程 epoll
epoll - I/O event notification facility在linux的网络编程中，很长的时间都在使用select来做事件触发。在linux新的内核中，有了一种替换它的机制，就是epoll。相比于select，epoll最大的好处在于它不会随着监听fd数目的增长而降低效率。因为在内核中的select实现中，它是采用轮询来处理的，轮询的fd数目越多，自然耗时越多。并且，在linu
Hibernate对Enum的映射的基本使用方法 linzx0212 enum Hibernate
枚举 /** * 性别枚举 */ public enum Gender { MALE(0), FEMALE(1), OTHER(2); private Gender(int i) { this.i = i; } private int i; public int getI
第10章高级事件（下） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
孙子兵法 roadrunners 孙子兵法
始计第一孙子曰：兵者，国之大事，死生之地，存亡之道，不可不察也。故经之以五事，校之以计，而索其情：一曰道，二曰天，三曰地，四曰将，五曰法。道者，令民于上同意，可与之死，可与之生，而不危也；天者，阴阳、寒暑、时制也；地者，远近、险易、广狭、死生也；将者，智、信、仁、勇、严也；法者，曲制、官道、主用也。凡此五者，将莫不闻，知之者胜，不知之者不胜。故校之以计，而索其情，曰
MySQL双向复制 tomcat_oracle mysql
本文包括: 主机配置从机配置建立主-从复制建立双向复制背景按照以下简单的步骤: 参考一下：在机器A配置主机(192.168.1.30) 在机器B配置从机(192.168.1.29) 我们可以使用下面的步骤来实现这一点步骤1：机器A设置主机在主机中打开配置文件 ,
zoj 3822 Domination(dp) 阿尔萨斯 Mina
题目链接：zoj 3822 Domination 题目大意：给定一个N∗M的棋盘，每次任选一个位置放置一枚棋子，直到每行每列上都至少有一枚棋子，问放置棋子个数的期望。解题思路：大白书上概率那一张有一道类似的题目，但是因为时间比较久了，还是稍微想了一下。dp[i][j][k]表示i行j列上均有至少一枚棋子，并且消耗k步的概率（k≤i∗j）,因为放置在i+1~n上等价与放在i+1行上，同理