free_fly_

lightGBM参数简记

参数格式是 key1=value1 key2=value2 ... 。参数可以在配置文件和命令行中。

一些重要的参数如下 :

config, 默认="", type（类型）=string, alias（别名）=config_file
- 配置文件的路径
task, 默认=train, type（类型）=enum, options（可选）=train, predict, convert_model
- train, alias（别名）=training, 用于训练
- predict, alias（别名）=prediction, test, 用于预测。
- convert_model, 用于将模型文件转换为 if-else 格式，在转换模型参数中了解更多信息
application, 默认=regression, 类型=enum, 可选=regression, regression_l1, huber, fair, poisson, quantile, quantile_l2, binary, multiclass, multiclassova, xentropy, xentlambda, lambdarank, 别名=objective, app
- 回归 application
  - regression_l2, L2 损失, 别名=regression, mean_squared_error, mse
  - regression_l1, L1 损失, 别名=mean_absolute_error, mae
  - huber, Huber loss
  - fair, Fair loss
  - poisson, Poisson regression
  - quantile, Quantile regression
  - quantile_l2, 与 quantile 类似, 但是使用 L2 损失
- binary, 二进制log loss_ 分类 application
- 多类别分类 application
  - multiclass, softmax 目标函数, num_class 也应该被设置
  - multiclassova, One-vs-All 二元目标函数, num_class 也应该被设置
- 交叉熵 application
  - xentropy, 交叉熵的目标函数 (可选线性权重), 别名=cross_entropy
  - xentlambda, 交叉熵的替代参数化, 别名=cross_entropy_lambda
  - label 是在 [0, 1] 间隔中的任何东西
- lambdarank, lambdarank application
  - 在 lambdarank 任务中 label 应该是 int 类型，而较大的数字表示较高的相关性（例如，0:bad, 1:fair, 2:good, 3:perfect）
  - label_gain 可以用来设置 int label 的 gain(weight)（增益（权重））
boosting, 默认=gbdt, type=enum, 选项=gbdt, rf, dart, goss, 别名=boost, boosting_type
- gbdt, traditional Gradient Boosting Decision Tree（传统梯度提升决策树）
- rf, 随机森林
- dart, Dropouts meet Multiple Additive Regression Trees
- goss, Gradient-based One-Side Sampling（基于梯度的单面采样）
data, 默认="", 类型=string, 别名=train, train_data
- 训练数据， LightGBM 将从这个数据训练
valid, 默认="", 类型=multi-string, 别名=test, valid_data, test_data
- 验证/测试数据，LightGBM 将输出这些数据的指标
- 支持多个验证数据，使用 , 分开
num_iterations, 默认=100, 类型=int, 别名=num_iteration, num_tree, num_trees, num_round, num_rounds, num_boost_round
- boosting iterations/trees 的数量
learning_rate, 默认=0.1, 类型=double, 别名=shrinkage_rate
- shrinkage rate（收敛率）
num_leaves, 默认=31, 类型=int, 别名=num_leaf
- 在一棵树中的叶子数量
tree_learner, 默认=serial, 类型=enum, 可选=serial, feature, data, voting, 别名=tree
- serial, 单个 machine tree 学习器
- feature, 别名=feature_parallel, feature parallel tree learner（特征并行树学习器）
- data, 别名=data_parallel, data parallel tree learner（数据并行树学习器）
- voting, 别名=voting_parallel, voting parallel tree learner（投票并行树学习器）
- 参考 Parallel Learning Guide（并行学习指南）来了解更多细节
num_threads, 默认=OpenMP_default, 类型=int, 别名=num_thread, nthread
- LightGBM 的线程数
- 为了获得最好的速度，将其设置为 real CPU cores（真实 CPU 内核） 数量，而不是线程数（大多数 CPU 使用 hyper-threading 来为每个 CPU core 生成 2 个线程）
- 对于并行学习，不应该使用全部的 CPU cores ，因为这会导致网络性能不佳
max_depth, 默认=-1, 类型=int
- 树模型最大深度的限制。当 #data 很小的时候，这被用来处理 overfit（过拟合）。树仍然通过 leaf-wise 生长
- < 0 意味着没有限制
min_data_in_leaf, 默认=20, 类型=int, 别名=min_data_per_leaf , min_data, min_child_samples
- 一个叶子中的最小数据量。可以用这个来处理过拟合。
min_sum_hessian_in_leaf, 默认=1e-3, 类型=double, 别名=min_sum_hessian_per_leaf, min_sum_hessian, min_hessian, min_child_weight
- 一个叶子节点中最小的 sum hessian 。类似于 min_data_in_leaf ，它可以用来处理过拟合。

所有参数：http://lightgbm.apachecn.org/#/docs/6

这个页面包含了 LightGBM 的所有参数.

一些有用的链接列表

Python API
Parameters Tuning

外部链接

Laurae++ Interactive Documentation

更新于 08/04/2017

以下参数的default已经修改:

min_data_in_leaf = 100 => 20
min_sum_hessian_in_leaf = 10 => 1e-3
num_leaves = 127 => 31
num_iterations = 10 => 100

参数格式

参数的格式为 key1=value1 key2=value2 .... 并且, 在配置文件和命令行中均可以设置参数. 使用命令行设置参数时, 在 = 前后都不应该有空格. 使用配置文件设置参数时, 一行只能包含一个参数. 你可以使用 # 进行注释.

如果一个参数在命令行和配置文件中均出现了, LightGBM 将会使用命令行中的该参数.

核心参数

config, default="", type=string, alias=config_file
- 配置文件的路径
task, default=train, type=enum, options=train, predict, convert_model
- train, alias=training, for training
- predict, alias=prediction, test, for prediction.
- convert_model, 要将模型文件转换成 if-else 格式, 可以查看这个链接获取更多信息 Convert model parameters
objective, default=regression, type=enum, options=regression, regression_l1, huber, fair, poisson, quantile, quantile_l2, binary, multiclass, multiclassova, xentropy, xentlambda, lambdarank, alias=objective, app , application
- regression application
  - regression_l2, L2 loss, alias=regression, mean_squared_error, mse
  - regression_l1, L1 loss, alias=mean_absolute_error, mae
  - huber, Huber loss
  - fair, Fair loss
  - poisson, Poisson regression
  - quantile, Quantile regression
  - quantile_l2, 类似于 quantile, 但是使用了 L2 loss
- binary, binary log loss classification application
- multi-class classification application
  - multiclass, softmax 目标函数, 应该设置好 num_class
  - multiclassova, One-vs-All 二分类目标函数, 应该设置好 num_class
- cross-entropy application
  - xentropy, 目标函数为 cross-entropy (同时有可选择的线性权重), alias=cross_entropy
  - xentlambda, 替代参数化的 cross-entropy, alias=cross_entropy_lambda
  - 标签是 [0, 1] 间隔内的任意值
- lambdarank, lambdarank application
  - 在 lambdarank 任务中标签应该为 int type, 数值越大代表相关性越高 (e.g. 0:bad, 1:fair, 2:good, 3:perfect)
  - label_gain 可以被用来设置 int 标签的增益 (权重)
boosting, default=gbdt, type=enum, options=gbdt, rf, dart, goss, alias=boost, boosting_type
- gbdt, 传统的梯度提升决策树
- rf, Random Forest (随机森林)
- dart, Dropouts meet Multiple Additive Regression Trees
- goss, Gradient-based One-Side Sampling (基于梯度的单侧采样)
data, default="", type=string, alias=train, train_data
- 训练数据, LightGBM 将会使用这个数据进行训练
valid, default="", type=multi-string, alias=test, valid_data, test_data
- 验证/测试数据, LightGBM 将输出这些数据的度量
- 支持多验证数据集, 以 , 分割
num_iterations, default=100, type=int, alias=num_iteration, num_tree, num_trees, num_round, num_rounds, num_boost_round
- boosting 的迭代次数
- Note: 对于 Python/R 包, 这个参数是被忽略的, 使用 train and cv 的输入参数 num_boost_round (Python) or nrounds (R) 来代替
- Note: 在内部, LightGBM 对于 multiclass 问题设置 num_class * num_iterations 棵树
learning_rate, default=0.1, type=double, alias=shrinkage_rate
- shrinkage rate (收缩率)
- 在 dart 中, 它还影响了 dropped trees 的归一化权重
num_leaves, default=31, type=int, alias=num_leaf
- 一棵树上的叶子数
tree_learner, default=serial, type=enum, options=serial, feature, data, voting, alias=tree
- serial, 单台机器的 tree learner
- feature, alias=feature_parallel, 特征并行的 tree learner
- data, alias=data_parallel, 数据并行的 tree learner
- voting, alias=voting_parallel, 投票并行的 tree learner
- 请阅读并行学习指南来了解更多细节
num_threads, default=OpenMP_default, type=int, alias=num_thread, nthread
- LightGBM 的线程数
- 为了更快的速度, 将此设置为真正的 CPU 内核数, 而不是线程的数量 (大多数 CPU 使用超线程来使每个 CPU 内核生成 2 个线程)
- 当你的数据集小的时候不要将它设置的过大 (比如, 当数据集有 10,000 行时不要使用 64 线程)
- 请注意, 任务管理器或任何类似的 CPU 监视工具可能会报告未被充分利用的内核. 这是正常的
- 对于并行学习, 不应该使用全部的 CPU 内核, 因为这会导致网络性能不佳
device, default=cpu, options=cpu, gpu
- 为树学习选择设备, 你可以使用 GPU 来获得更快的学习速度
- Note: 建议使用较小的 max_bin (e.g. 63) 来获得更快的速度
- Note: 为了加快学习速度, GPU 默认使用32位浮点数来求和. 你可以设置 gpu_use_dp=true 来启用64位浮点数, 但是它会使训练速度降低
- Note: 请参考安装指南来构建 GPU 版本

用于控制模型学习过程的参数

max_depth, default=-1, type=int
- 限制树模型的最大深度. 这可以在 #data 小的情况下防止过拟合. 树仍然可以通过 leaf-wise 生长.
- < 0 意味着没有限制.
min_data_in_leaf, default=20, type=int, alias=min_data_per_leaf , min_data, min_child_samples
- 一个叶子上数据的最小数量. 可以用来处理过拟合.
min_sum_hessian_in_leaf, default=1e-3, type=double, alias=min_sum_hessian_per_leaf, min_sum_hessian, min_hessian, min_child_weight
- 一个叶子上的最小 hessian 和. 类似于 min_data_in_leaf, 可以用来处理过拟合.
feature_fraction, default=1.0, type=double, 0.0 < feature_fraction < 1.0, alias=sub_feature, colsample_bytree
- 如果 feature_fraction 小于 1.0, LightGBM 将会在每次迭代中随机选择部分特征. 例如, 如果设置为 0.8, 将会在每棵树训练之前选择 80% 的特征
- 可以用来加速训练
- 可以用来处理过拟合
feature_fraction_seed, default=2, type=int
- feature_fraction 的随机数种子
bagging_fraction, default=1.0, type=double, 0.0 < bagging_fraction < 1.0, alias=sub_row, subsample
- 类似于 feature_fraction, 但是它将在不进行重采样的情况下随机选择部分数据
- 可以用来加速训练
- 可以用来处理过拟合
- Note: 为了启用 bagging, bagging_freq 应该设置为非零值
bagging_freq, default=0, type=int, alias=subsample_freq
- bagging 的频率, 0 意味着禁用 bagging. k 意味着每 k 次迭代执行bagging
- Note: 为了启用 bagging, bagging_fraction 设置适当
bagging_seed , default=3, type=int, alias=bagging_fraction_seed
- bagging 随机数种子
early_stopping_round, default=0, type=int, alias=early_stopping_rounds, early_stopping
- 如果一个验证集的度量在 early_stopping_round 循环中没有提升, 将停止训练
lambda_l1, default=0, type=double, alias=reg_alpha
- L1 正则
lambda_l2, default=0, type=double, alias=reg_lambda
- L2 正则
min_split_gain, default=0, type=double, alias=min_gain_to_split
- 执行切分的最小增益
drop_rate, default=0.1, type=double
- 仅仅在 dart 时使用
skip_drop, default=0.5, type=double
- 仅仅在 dart 时使用, 跳过 drop 的概率
max_drop, default=50, type=int
- 仅仅在 dart 时使用, 一次迭代中删除树的最大数量
- <=0 意味着没有限制
uniform_drop, default=false, type=bool
- 仅仅在 dart 时使用, 如果想要均匀的删除, 将它设置为 true
xgboost_dart_mode, default=false, type=bool
- 仅仅在 dart 时使用, 如果想要使用 xgboost dart 模式, 将它设置为 true
drop_seed, default=4, type=int
- 仅仅在 dart 时使用, 选择 dropping models 的随机数种子
top_rate, default=0.2, type=double
- 仅仅在 goss 时使用, 大梯度数据的保留比例
other_rate, default=0.1, type=int
- 仅仅在 goss 时使用, 小梯度数据的保留比例
min_data_per_group, default=100, type=int
- 每个分类组的最小数据量
max_cat_threshold, default=32, type=int
- 用于分类特征
- 限制分类特征的最大阈值
cat_smooth, default=10, type=double
- 用于分类特征
- 这可以降低噪声在分类特征中的影响, 尤其是对数据很少的类别
cat_l2, default=10, type=double
- 分类切分中的 L2 正则
max_cat_to_onehot, default=4, type=int
- 当一个特征的类别数小于或等于 max_cat_to_onehot 时, one-vs-other 切分算法将会被使用
top_k, default=20, type=int, alias=topk
- 被使用在 Voting parallel 中
- 将它设置为更大的值可以获得更精确的结果, 但会减慢训练速度

IO 参数

max_bin, default=255, type=int
- 工具箱的最大数特征值决定了容量工具箱的最小数特征值可能会降低训练的准确性, 但是可能会增加一些一般的影响（处理过度学习）
- LightGBM 将根据 max_bin 自动压缩内存。例如, 如果 maxbin=255, 那么 LightGBM 将使用 uint8t 的特性值
max_bin, default=255, type=int
min_data_in_bin, default=3, type=int - 单个数据箱的最小数, 使用此方法避免 one-data-one-bin（可能会过度学习）
data_r和om_seed, default=1, type=int
- 并行学习数据分隔中的随机种子 (不包括并行功能)
output_model, default=LightGBM_model.txt, type=string, alias=model_output, model_out
- 培训中输出的模型文件名
input_model, default="", type=string, alias=model_input, model_in
- 输入模型的文件名
- 对于 prediction 任务, 该模型将用于预测数据
- 对于 train 任务, 培训将从该模型继续
output_result, default=LightGBM_predict_result.txt, type=string, alias=predict_result, prediction_result
- prediction 任务的预测结果文件名
model_format, default=text, type=multi-enum, 可选项=text, proto
- 保存和加载模型的格式
- text, 使用文本字符串
- proto, 使用协议缓冲二进制格式
- 您可以通过使用逗号来进行多种格式的保存, 例如 text,proto. 在这种情况下, model_format 将作为后缀添加 output_model
- Note: 不支持多种格式的加载
- Note: 要使用这个参数, 您需要使用 build 版本 <./Installation-Guide.rst#protobuf-support>`__
pre_partition, default=false, type=bool, alias=is_pre_partition
- 用于并行学习(不包括功能并行)
- true 如果训练数据 pre-partitioned, 不同的机器使用不同的分区
is_sparse, default=true, type=bool, alias=is_enable_sparse, enable_sparse
- 用于 enable/disable 稀疏优化. 设置 false 就禁用稀疏优化
two_round, default=false, type=bool, alias=two_round_loading, use_two_round_loading
- 默认情况下, LightGBM 将把数据文件映射到内存, 并从内存加载特性。这将提供更快的数据加载速度。但当数据文件很大时, 内存可能会耗尽
- 如果数据文件太大, 不能放在内存中, 就把它设置为 true
save_binary, default=false, type=bool, alias=is_save_binary, is_save_binary_file
- 如果设置为 true LightGBM 则将数据集(包括验证数据)保存到二进制文件中。可以加快数据加载速度。
verbosity, default=1, type=int, alias=verbose
- <0 = 致命的, =0 = 错误 (警告), >0 = 信息
header, default=false, type=bool, alias=has_header
- 如果输入数据有标识头, 则在此处设置 true
label, default="", type=string, alias=label_column
- 指定标签列
- 用于索引的数字, e.g. label=0 意味着 column_0 是标签列
- 为列名添加前缀 name: , e.g. label=name:is_click
weight, default="", type=string, alias=weight_column
- 列的指定
- 用于索引的数字, e.g. weight=0 表示 column_0 是权重点
- 为列名添加前缀 name:, e.g. weight=name:weight
- Note: 索引从 0 开始. 当传递 type 为索引时, 它不计算标签列, 例如当标签为 0 时, 权重为列 1, 正确的参数是权重值为 0
query, default="", type=string, alias=query_column, group, group_column
- 指定 query/group ID 列
- 用数字做索引, e.g. query=0 意味着 column_0 是这个查询的 Id
- 为列名添加前缀 name: , e.g. query=name:query_id
- Note: 数据应按照 query_id. 索引从 0 开始. 当传递 type 为索引时, 它不计算标签列, 例如当标签为列 0, 查询 id 为列 1 时, 正确的参数是查询 =0
ignore_column, default="", type=string, alias=ignore_feature, blacklist
- 在培训中指定一些忽略的列
- 用数字做索引, e.g. ignore_column=0,1,2 意味着 column_0, column_1 和 column_2 将被忽略
- 为列名添加前缀 name: , e.g. ignore_column=name:c1,c2,c3 意味着 c1, c2 和 c3 将被忽略
- Note: 只在从文件直接加载数据的情况下工作
- Note: 索引从 0 开始. 它不包括标签栏
categorical_feature, default="", type=string, alias=categorical_column, cat_feature, cat_column
- 指定分类特征
- 用数字做索引, e.g. categorical_feature=0,1,2 意味着 column_0, column_1 和 column_2 是分类特征
- 为列名添加前缀 name:, e.g. categorical_feature=name:c1,c2,c3 意味着 c1, c2 和 c3 是分类特征
- Note: 只支持分类与 int type. 索引从 0 开始. 同时它不包括标签栏
- Note: 负值的值将被视为 missing values
predict_raw_score, default=false, type=bool, alias=raw_score, is_predict_raw_score
- 只用于 prediction 任务
- 设置为 true 只预测原始分数
- 设置为 false 只预测分数
predict_leaf_index, default=false, type=bool, alias=leaf_index, is_predict_leaf_index
- 只用于 prediction 任务
- 设置为 true to predict with leaf index of all trees
predict_contrib, default=false, type=bool, alias=contrib, is_predict_contrib
- 只用于 prediction 任务
- 设置为 true 预估 SHAP values, 这代表了每个特征对每个预测的贡献. 生成的特征+1的值, 其中最后一个值是模型输出的预期值, 而不是训练数据
bin_construct_sample_cnt, default=200000, type=int, alias=subsample_for_bin
- 用来构建直方图的数据的数量
- 在设置更大的数据时, 会提供更好的培训效果, 但会增加数据加载时间
- 如果数据非常稀疏, 则将其设置为更大的值
num_iteration_predict, default=-1, type=int
- 只用于 prediction 任务
- 用于指定在预测中使用多少经过培训的迭代
- <= 0 意味着没有限制
pred_early_stop, default=false, type=bool
- 如果 true 将使用提前停止来加速预测。可能影响精度
pred_early_stop_freq, default=10, type=int
- 检查早期early-stopping的频率
pred_early_stop_margin, default=10.0, type=double
- t提前early-stopping的边际阈值
use_missing, default=true, type=bool
- 设置为 false 禁用丢失值的特殊句柄
zero_as_missing, default=false, type=bool
- 设置为 true 将所有的0都视为缺失的值 (包括 libsvm/sparse 矩阵中未显示的值)
- 设置为 false 使用 na 代表缺失值
init_score_file, default="", type=string
- 训练初始分数文件的路径, "" 将使用 train_data_file + .init (如果存在)
valid_init_score_file, default="", type=multi-string
- 验证初始分数文件的路径, "" 将使用 valid_data_file + .init (如果存在)
- 通过 , 对multi-validation进行分离

目标参数

sigmoid, default=1.0, type=double
- sigmoid 函数的参数. 将用于 binary 分类和 lambdarank
alpha, default=0.9, type=double
- Huber loss 和 Quantile regression 的参数. 将用于 regression 任务
fair_c, default=1.0, type=double
- Fair loss 的参数. 将用于 regression 任务
gaussian_eta, default=1.0, type=double
- 控制高斯函数的宽度的参数. 将用于 regression_l1 和 huber losses
poisson_max_delta_step, default=0.7, type=double
- Poisson regression 的参数用于维护优化
scale_pos_weight, default=1.0, type=double
- 正值的权重 binary 分类任务
boost_from_average, default=true, type=bool
- 只用于 regression 任务
- 将初始分数调整为更快收敛速度的平均值
is_unbalance, default=false, type=bool, alias=unbalanced_sets
- 用于 binary 分类
- 如果培训数据不平衡设置为 true
max_position, default=20, type=int
- 用于 lambdarank
- 将在这个 NDCG 位置优化
label_gain, default=0,1,3,7,15,31,63,..., type=multi-double
- 用于 lambdarank
- 有关获得标签. 列如, 如果使用默认标签增益这个 2 的标签则是 3
- 使用 , 分隔
num_class, default=1, type=int, alias=num_classes
- 只用于 multiclass 分类
reg_sqrt, default=false, type=bool
- 只用于 regression
- 适合sqrt(label) 相反, 预测结果也会自动转换成 pow2(prediction)

度量参数

metric, default={l2 for regression}, {binary_logloss for binary classification}, {ndcg for lambdarank}, type=multi-enum, options=l1, l2, ndcg, auc, binary_logloss, binary_error …
- l1, absolute loss, alias=mean_absolute_error, mae
- l2, square loss, alias=mean_squared_error, mse
- l2_root, root square loss, alias=root_mean_squared_error, rmse
- quantile, Quantile regression
- huber, Huber loss
- fair, Fair loss
- poisson, Poisson regression
- ndcg, NDCG
- map, MAP
- auc, AUC
- binary_logloss, log loss
- binary_error, 样本: 0 的正确分类, 1 错误分类
- multi_logloss, mulit-class 损失日志分类
- multi_error, error rate for mulit-class 出错率分类
- xentropy, cross-entropy (与可选的线性权重), alias=cross_entropy
- xentlambda, “intensity-weighted” 交叉熵, alias=cross_entropy_lambda
- kldiv, Kullback-Leibler divergence, alias=kullback_leibler
- 支持多指标, 使用 , 分隔
metric_freq, default=1, type=int
- 频率指标输出
train_metric, default=false, type=bool, alias=training_metric, is_training_metric
- 如果你需要输出训练的度量结果则设置 true
ndcg_at, default=1,2,3,4,5, type=multi-int, alias=ndcg_eval_at, eval_at
- NDCG 职位评估, 使用 , 分隔

网络参数

以下参数用于并行学习, 只用于基本(socket)版本。

num_machines, default=1, type=int, alias=num_machine
- 用于并行学习的并行学习应用程序的数量
- 需要在socket和mpi版本中设置这个
local_listen_port, default=12400, type=int, alias=local_port
- 监听本地机器的TCP端口
- 在培训之前, 您应该再防火墙设置中放开该端口
time_out, default=120, type=int
- 允许socket几分钟内超时
machine_list_file, default="", type=string, alias=mlist
- 为这个并行学习应用程序列出机器的文件
- 每一行包含一个IP和一个端口为一台机器。格式是ip port, 由空格分隔

GPU 参数

gpu_platform_id, default=-1, type=int
- OpenCL 平台 ID. 通常每个GPU供应商都会公开一个OpenCL平台。
- default为 -1, 意味着整个系统平台
gpu_device_id, default=-1, type=int
- OpenCL设备ID在指定的平台上。在选定的平台上的每一个GPU都有一个唯一的设备ID
- default为-1, 这个default意味着选定平台上的设备
gpu_use_dp, default=false, type=bool
- 设置为 true 在GPU上使用双精度GPU (默认使用单精度)

模型参数

该特性仅在命令行版本中得到支持。

convert_model_language, default="", type=string
- 只支持cpp
- 如果 convert_model_language 设置为 task``时该模型也将转换为 ``train,
convert_model, default="gbdt_prediction.cpp", type=string
- 转换模型的输出文件名

其他

持续训练输入分数

LightGBM支持对初始得分进行持续的培训。它使用一个附加的文件来存储这些初始值, 如下:

0.5
-0.1
0.9
...

它意味着最初的得分第一个数据行是 0.5,第二个是 -0.1` 等等。初始得分文件与数据文件逐行对应, 每一行有一个分数。如果数据文件的名称是 `train.txt`, 最初的分数文件应该被命名为train.txt.init` 与作为数据文件在同一文件夹。在这种情况下, LightGBM 将自动加载初始得分文件, 如果它存在的话。

权重数据

LightGBM 加权训练。它使用一个附加文件来存储权重数据, 如下:

1.0
0.5
0.8
...

它意味的重压着第一个数据行是 1.0, 第二个是 0.5, 等等. 权重文件按行与数据文件行相对应, 每行的权重为. 如果数据文件的名称是 train.txt, 应该将重量文件命名为 train.txt.weight 与数据文件相同的文件夹. 在这种情况下, LightGBM 将自动加载权重文件, 如果它存在的话.

update: 现在可以在数据文件中指定 weight 列。请参阅以上参数的参数.

查询数据

对于 LambdaRank 的学习, 它需要查询信息来训练数据. LightGBM 使用一个附加文件来存储查询数据, 如下:

27
18
67
...

它意味着第一个 27 行样本属于一个查询和下一个 18 行属于另一个, 等等. Note: 数据应该由查询来排序.

如果数据文件的名称是train.txt`,这个查询文件应该被命名为train.txt.query``查询在相同的培训数据文件夹中。在这种情况下, LightGBM将自动加载查询文件, 如果它存在的话。

update: 现在可以在数据文件中指定特定的 query/group id。请参阅上面的参数组

你可能感兴趣的:(python学习)

Python Textract库：文本提取程序员喵哥 python 开发语言
更多Python学习内容：ipengtao.comTextract是一个强大的Python库，用于从各种文件格式中提取文本。无论是PDF、Word文档、Excel电子表格、HTML页面还是图像，Textract都能有效地提取其中的文本内容。Textract通过集成多种开源工具和库，实现了对多种文件格式的支持，使得文本提取变得简单而高效。本文将详细介绍Textract库的安装、主要功能、基本操作、高
python学习笔记之异常（内置标准异常总结） Molly_DD Python学习笔记 python 软件测试
python异常处理机制异常处理是python的一种高级工具，当异常发生时，程序会停止当前的所有工作，跳转到异常处理部分去执行。异常既可以是程序错误引发的，也可以由代码主动触发。异常处理基本结构try:可能引发异常的代码except异常类型名称：异常处理代码else：没有发生异常时执行的代码异常报错：try：classtest:defgetdata(self):returnself.datay=t
关于使用python进行处理雷达数据笔记六毛驴 python 数据分析
好久不见，甚是想念本人深知这段时间鸽了一篇博（上一篇博），后续会补上的，今天想写一下关于使用python进行TI雷达接收回波数据处理的一些常见问题和解决方法。这也是前几天领导给我布置的任务，所以我将这段时间自己遇到的并且已经解决的问题进行了简单的汇总，也会推荐几本这几天阅读了python书籍。python书籍推荐：python学习手册MarkLutz著（对应python版本3.X，2.X都可）Py
python技巧之下划线老虎也淘气 Python编程掌握指南 python django 开发语言
‍♂️个人主页@老虎也淘气个人主页✍作者简介：Python学习者希望大家多多支持我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注python技巧之下划线1、python的moudles文件中__all__作用2、__slots__用于限定类属性，如：3、下面的小技巧可以获取私有变量：4、下划线种类单个下划线（_）单下划线前缀的名称（例如_shahriar）双下划线前缀的名称（例如__s
【Python学习笔记】一些关于多线程，xls文件读取，PyQt5，PyInstaller打包等问题的解决方案记录百里香酚兰 Python自学笔记 python 学习笔记 pyinstaller xls文件 PyQt5 多线程
背景：最近利用休息时间写了个小型exe程序，主要涉及的技术点有：多线程，读取xls文件，基于PyQt5的简单GUI页面，利用PyInstaller打包成exe。虽然有ChatGPT等协助，但难免还是在开发过程中遇到了一些疑难问题，所以开个记录贴刊登解决方式。问题&解决方式：1.PyQt+PyInstaller：tqdm报错AttributeError:‘NoneType‘objecthasnoat
Python学习日记-第二十九天-tcp（客户端）差点长成吴彦祖 python pandas tcp/ip 网络
系列文章目录tcp介绍tcp特点tcp客户端一、tcp介绍Tcp协议，传输控制协议是一种面向连接的、可靠的、基于字节流的传输层通信协议，由IETF的RFC793定义TCP通信需要经过创建连接、传输数据、终止连接三个步骤TCP通信模型中，在通信开始之前，一定要先建立相关的链接，才能发送数据，类似于生活中的“打电话”（注：之前学习的udp，在通信前，不需要建立相关的链接，只需要发送数据即可，类似于“写
Python学习第十九天 Leo来编程 Python学习学习 python
Django-分页后端分页Django提供了Paginator类来实现后端分页。Paginator类可以将一个查询集（QuerySet）分成多个页面，每个页面包含指定数量的对象。fromdjango.shortcutsimportrender,redirect,get_object_or_404from.modelsimportUserfrom.formsimportUserFormfromdja
漫画算法python篇pdf_用Python抓取漫画并制作mobi格式电子书 jian bao 漫画算法python篇pdf
想看某一部漫画，但是用手机看感觉屏幕太小，用电脑看吧有太不方面。正好有一部Kindle，决定写一个爬虫把漫画爬取下来，然后制作成mobi格式的电子书放到kindle里面看。本人对于Python学习创建了一个小小的学习圈子，为各位提供了一个平台，大家一起来讨论学习Python。欢迎各位到来Python学习群：943752371一起讨论视频分享学习。Python是未来的发展方向，正在挑战我们的分析能力
批量安装 Python 库的脚本：提高python学习效率的第一步（附源码） TAGRENLA Interesting python project python 学习开发语言
批量安装Python库批量安装Python库的脚本：提高数据分析效率的一步（附源码）批量安装脚本前提条件使用pip：Python包管理工具批量安装脚本查看当前python解释器中安装的所有的库批量安装Python库的脚本：提高数据分析效率的一步（附源码）在现代数据分析领域，Python已成为一个不可或缺的工具。为了进行数据处理、分析、可视化和建模等任务，Python社区涌现出了众多强大的库和工具。
Python学习-----项目设计1.0（设计思维和ATM环境搭建） Fitz& Python学习学习 python
目录前言：项目开发流程MVC设计模式什么是MVC设计模式？ATM项目要求ATM项目的环境搭建前言：我个人学习Python大概也有一个月了，在这一个月中我发布了许多关于Python的文章，建立了一个Python学习起步的专栏（https://blog.csdn.net/m0_73633088/category_12186491.html），在这里我非常感谢各位的一路陪伴，你们的支持是我创作的不竭动力
Python学习日志3-复合类型可惜还不下雨学习
python支持多种复合类型，可以将不同的值组合在一起一、列表列表（list）是用方括号标注、逗号隔开的一组值，可以包含不同类型的元素（但最好不要这么做），列表有以下特点：列表内的顺序有先后顺序列表的值可变1.创建列表列表有两种创建方式，一是直接用方括号把表达式括起来，而是用构造函数list()表达式list1=[]#创建了一个空列表list2=["a","b","c"]#创建了一个字符串列表li
Python学习第十四天 Leo来编程 Python学习 python 学习开发语言
pip命令pip是Python的包管理工具，用于安装和管理Python第三方库安装安装pip指令（主要是为了更换pip的国内源），在C:\Users下建立pip文件夹，在pip文件夹里建立pip.ini(C盘不让建立可以桌面建立拖进去)文件内容如下：[global]index-url=https://pypi.tuna.tsinghua.edu.cn/simple常用命令操作类型命令格式描述安装包
Python学习第十五天 Leo来编程 Python学习 python 学习
Django概念Django最初被设计用于具有快速开发需求的新闻类站点，目的是要实现简单快捷的网站开发。以下内容简要介绍了如何使用Django实现一个数据库驱动的网络应用。（Django是一个开放源代码的第三方模块Web应用框架，并且是一个功能全，重量的框架。Flask框架是一个轻量级功能少，从github上搜索pythonweb项目基本都出来的是django和flask项目）学习文档可以使用：官
python爬虫遇到IP被封的情况，怎么办？(2) 2301_82242251 程序员 python 爬虫开发语言
代理的设置：①urllib的代理设置fromurllib.errorimportURLErrorfromurllib.requestimportProxyHandler,build_opener‘’’更多Python学习资料以及源码教程资料，可以在群1136201545免费获取‘’’proxy=‘127.0.0.1:8888’#需要认证的代理#proxy=‘username:password@12
Python学习笔记 Helloooooworldddddd python
eclipse中配置PyDev：Help-->InstallNewSoftware-->Add-->起名如：PyDev，网址：http://www.pydev.org/updates-->选择PyDev-->一路Next安装完之后创建新项目时，如果没有PyDev选项，则是安装的版本跟eclipse、jdk不匹配，需要卸载重新安装。卸载：Help-->AboutEclipse-->Installat
入坑 Python 全能实战小白训练营，470 集干货 12.9G 大揭秘！七七知享 Python python 开发语言 pandas numpy matplotlib java php
家人们，我最近挖到了一个Python学习的宝藏——Python全能实战小白训练营。整整470集，内容超丰富，资源包有12.9G，完全就是为咱们这些想系统学习Python的小白量身定制的。接下来就给大家好好唠唠。随着课程深入，会涉及到Python的各种高级特性，比如面向对象编程、模块与包的使用。在讲面向对象编程时，老师通过打造一个小型游戏角色系统，把类、对象、继承、多态这些抽象概念诠释得生动形象，让
Python学习第十一天 Leo来编程 Python学习 python
疑惑：有很多人不知道是不是也分不清什么是单核？什么是多核？什么是时间片？进程？线程？那么在讲进程和线程前我先举个例子更好理解这些概念。单核例子：比如你是一个厨师（计算机）在一个厨房（CPU）里需要同时做3个菜（进程）、每个菜需要准备不同的调料以及协作（线程），那么这个厨师需要不断地切换时间（时间片）来达到同时在一个时间将三个菜做完。多核的话其实对应的例子就是多个厨师，这样的例子太多了因为万物皆对象
python学习第三天 Leo来编程 Python学习 python 开发语言
条件判断条件判断使用if、elif和else关键字。它们用于根据条件执行不同的代码块。#条件判断age=18ifage0:#也可以写if(s>0)但是没必要因为python给个提示建议去掉保证代码的按照缩进来进行更加规范print("这个数字是大于0的数字!")#这行代码属于if语句的代码块elifs==0:print("这个数字是等于0的数字!")#这行代码属于elif语句的代码块else:pr
Python学习指南：系统化路径 + 避坑建议程之编 Python全栈通关秘籍青少年编程 python 开发语言人工智能机器学习
新手小白学习编程就像搭积木——需要从基础开始，逐步构建知识体系。以下是为你量身定制的Python学习路径，帮你告别杂乱，高效入门！一、学习前的关键认知明确目标：想用Python做什么？数据分析（如Excel自动化、可视化）Web开发（如搭建网站）人工智能（如机器学习）自动化办公（如处理文件、邮件）目标不同，后续学习侧重点不同（但基础通用）。避免误区：❌只看教程不写代码✅边学边动手，哪怕抄代码也要运
第五周作业——第十章动手试一试 hongsqi
10-1Python学习笔记学习笔记：在文本编辑器中新建一个文件，写几句话来总结一下你至此学到的Python知识，其中每一行都以“InPythonyoucan”打头。将这个文件命名为learning_python.txt，并将其存储到为完成本章练习而编写的程序所在的目录中。编写一个程序，它读取这个文件，并将你所写的内容打印三次：第一次打印时读取整个文件；第二次打印时遍历文件对象；第三次打印时将各行
Python学习总结 serve the people 巨人的肩膀 python 开发语言
第一个python程序print("HelloWorld")#缩进一般4个空格键或者1个tab键，但是所有代码块语句必须是相同的缩进，这个必须严格执行，不同的缩进会导致程序不能运行，不能混用空格和tabifTrue:print("True")else:print("False")python注释符单行注释（行注释）#print("HelloWorld")多行注释（块注释）'''print("Hel
python学习，Windows图标一键替换工具开发详解木木黄木木 python 学习 windows
Windows图标一键替换工具开发详解项目概述本项目是一个基于Python开发的Windows图标一键替换工具，提供了简单易用的图形界面，让用户能够轻松地替换Windows系统中的回收站图标、快捷方式图标以及应用程序图标。功能特点支持三种图标替换模式：回收站图标替换桌面快捷方式图标替换系统应用程序图标替换图标预览功能：实时预览选择的图标支持缩放预览支持多种图片格式（ICO、PNG、JPEG等）便捷
2024年Python最新Pytorch--3，面试高分实战 m0_60666452 程序员 python 学习面试
（1）Python所有方向的学习路线（新版）这是我花了几天的时间去把Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。最近我才对这些路线做了一下新的更新，知识体系更全面了。（2）Python学习视频包含了Python入门、爬虫、数据分析和web开发的学习视频，总共100多个，虽然没有那么全面，但是对于入门
Python学习之-分支语句-基础训练 YMLT花岗岩 educoder Python实践（代码篇）学习 python educoder
第1关：计算并输出圆的面积和周长。任务描述从键盘输入圆的半径，如果半径大于等于0，则计算并输出圆的面积和周长。相关知识判断半径是不是小于零测试说明平台会对你编写的代码进行测试：示例代码：#单分支#coding=utf-8#********Begin**********r=float(input())s=3.1415*pow(r,2)c=2*3.1415*rprint("圆的面积为：%.2f"%s)
数据挖掘实战-基于Catboost算法的艾滋病数据可视化与建模分析艾派森数据挖掘实战合集 python 人工智能数据挖掘信息可视化数据分析
‍♂️个人主页：@艾派森的个人主页✍作者简介：Python学习者希望大家多多支持，我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注+目录1.项目背景2.数据集介绍
Python就业薪资怎么样？前景如何？田野猫咪 Python 计算机 python 人工智能数据挖掘
Python是一种全栈的开发语言，你如果能学好Python，前端，后端，测试，大数据分析，爬虫等这些工作你都能胜任。那么Python现在在国内的就业薪资高吗？Python就业薪资怎么样？前景如何？对于这些问题，下面小编整理相关内容为大家详情解析，一起来了解吧~如果你也对Python感兴趣，想通过学习Python转行、做副业或者提升工作效率，我也为大家整理了一份【最新全套Python学习资料】一定对
Python学习第七天 Leo来编程 Python学习学习
模块模块是一个包含Python代码的文件，通常以.py为扩展名。模块中内容有函数、类、变量/常量、测试代码。模块的作用：划分代码结构、提高代码的复用率。命名规范使用小写字母：模块名应全部使用小写字母。避免使用大写字母，因为不同操作系统对文件名的大小写敏感度不同。使用下划线分隔单词：如果模块名由多个单词组成，使用下划线_分隔单词。这种风格称为file_util避免使用关键字和内置模块名不要使用Pyt
Python学习第九天 Leo来编程 Python学习学习
序列化和反序列概念在Python中，序列化是将对象转换为可存储或传输的格式（如字节流或字符串），而反序列化则是将序列化后的数据重新转换为对象（官网序列化）。序列化：就是将不能存储的对象转为可存储的对象（封存pickling）。发序列化：序列化的对象返回成原来的对象（解封unpickling）。方式序列化和反序列化有下面五种方式pickle模块官网概念：pickle模块实现了对一个Python对象结
pywin32，一个超强的 Python 库！ Sitin涛哥 Python python 开发语言
更多Python学习内容：ipengtao.com大家好，今天为大家分享一个超强的Python库-pywin32。Github地址：https://github.com/mhammond/pywin32在Python的世界里，有许多优秀的第三方库可以帮助开发者更轻松地处理各种任务。其中，pywin32库是一个特别引人注目的工具，它提供了对WindowsAPI的完整访问，使得开发者能够利用Pytho
Python 学习与开发：高效编程技巧与实用案例壹屋安源知识分享 python 学习开发语言
Python学习与开发：高效编程技巧与实用案例Python是现代编程语言中最受欢迎的一种，它以简洁、易读的语法和强大的功能广泛应用于数据分析、人工智能、Web开发等多个领域。无论你是Python新手还是有经验的开发者，掌握一些高效编程技巧和实用案例，能让你的Python开发之旅更加顺畅。1.高效的函数式编程使用列表推导式列表推导式是Python中非常常用的功能，它不仅可以让代码更加简洁，还能提高执
Java开发中，spring mvc 的线程怎么调用？小麦麦子 spring mvc
今天逛知乎，看到最近很多人都在问spring mvc 的线程http://www.maiziedu.com/course/java/ 的启动问题，觉得挺有意思的，那哥们儿问的也听仔细，下面的回答也很详尽，分享出来，希望遇对遇到类似问题的Java开发程序猿有所帮助。问题：在用spring mvc架构的网站上，设一线程在虚拟机启动时运行，线程里有一全局
maven依赖范围 bitcarter maven
1.test 测试的时候才会依赖，编译和打包不依赖，如junit不被打包 2.compile 只有编译和打包时才会依赖 3.provided 编译和测试的时候依赖，打包不依赖，如：tomcat的一些公用jar包 4.runtime 运行时依赖，编译不依赖 5.默认compile 依赖范围compile是支持传递的，test不支持传递 1.传递的意思是项目A，引用
Jaxb org.xml.sax.saxparseexception : premature end of file darrenzhu xml premature JAXB
如果在使用JAXB把xml文件unmarshal成vo(XSD自动生成的vo)时碰到如下错误： org.xml.sax.saxparseexception : premature end of file 很有可能时你直接读取文件为inputstream，然后将inputstream作为构建unmarshal需要的source参数。InputSource inputSource = new In
CSS Specificity 周凡杨 html 权重 Specificity css
有时候对于页面元素设置了样式，可为什么页面的显示没有匹配上呢？ because specificity CSS 的选择符是有权重的，当不同的选择符的样式设置有冲突时，浏览器会采用权重高的选择符设置的样式。规则： HTML标签的权重是1 Class 的权重是10 Id 的权重是100
java与servlet g21121 servlet
servlet 搞java web开发的人一定不会陌生，而且大家还会时常用到它。下面是java官方网站上对servlet的介绍： java官网对于servlet的解释写道 Java Servlet Technology Overview Servlets are the Java platform technology of choice for extending and enha
eclipse中安装maven插件 510888780 eclipse maven
1.首先去官网下载 Maven： http://www.apache.org/dyn/closer.cgi/maven/binaries/apache-maven-3.2.3-bin.tar.gz 下载完成之后将其解压，我将解压后的文件夹：apache-maven-3.2.3，并将它放在 D:\tools目录下，即 maven 最终的路径是：D:\tools\apache-mave
jpa@OneToOne关联关系布衣凌宇 jpa
Nruser里的pruserid关联到Pruser的主键id，实现对一个表的增删改，另一个表的数据随之增删改。 Nruser实体类 //***************************************************************** @Entity @Table(name="nruser") @DynamicInsert @Dynam
我的spring学习笔记11-Spring中关于声明式事务的配置 aijuans spring 事务配置
这两天学到事务管理这一块，结合到之前的terasoluna框架，觉得书本上讲的还是简单阿。我就把我从书本上学到的再结合实际的项目以及网上看到的一些内容，对声明式事务管理做个整理吧。我看得Spring in Action第二版中只提到了用TransactionProxyFactoryBean和<tx:advice/>,定义注释驱动这三种，我承认后两种的内容很好，很强大。但是实际的项目当中
java 动态代理简单实现 antlove java handler proxy dynamic service
dynamicproxy.service.HelloService package dynamicproxy.service; public interface HelloService { public void sayHello(); } dynamicproxy.service.impl.HelloServiceImpl package dynamicp
JDBC连接数据库百合不是茶 JDBC编程 JAVA操作oracle数据库
如果我们要想连接oracle公司的数据库，就要首先下载oralce公司的驱动程序，将这个驱动程序的jar包导入到我们工程中; JDBC链接数据库的代码和固定写法; 1,加载oracle数据库的驱动; &nb
单例模式中的多线程分析 bijian1013 java thread 多线程 java多线程
谈到单例模式，我们立马会想到饿汉式和懒汉式加载，所谓饿汉式就是在创建类时就创建好了实例，懒汉式在获取实例时才去创建实例，即延迟加载。饿汉式： package com.bijian.study; public class Singleton { private Singleton() { } // 注意这是private 只供内部调用 private static
javascript读取和修改原型特别需要注意原型的读写不具有对等性 bijian1013 JavaScript prototype
对于从原型对象继承而来的成员，其读和写具有内在的不对等性。比如有一个对象A，假设它的原型对象是B，B的原型对象是null。如果我们需要读取A对象的name属性值，那么JS会优先在A中查找，如果找到了name属性那么就返回；如果A中没有name属性，那么就到原型B中查找name，如果找到了就返回；如果原型B中也没有
【持久化框架MyBatis3六】MyBatis3集成第三方DataSource bit1129 dataSource
MyBatis内置了数据源的支持，如： <environments default="development"> <environment id="development"> <transactionManager type="JDBC" /> <data
我程序中用到的urldecode和base64decode,MD5 bitcarter c MD5 base64decode urldecode
这里是base64decode和urldecode，Md5在附件中。因为我是在后台所以需要解码： string Base64Decode(const char* Data,int DataByte,int& OutByte) { //解码表 const char DecodeTable[] = { 0, 0, 0, 0, 0, 0
腾讯资深运维专家周小军：QQ与微信架构的惊天秘密 ronin47
社交领域一直是互联网创业的大热门，从PC到移动端，从OICQ、MSN到QQ。到了移动互联网时代，社交领域应用开始彻底爆发，直奔黄金期。腾讯在过去几年里，社交平台更是火到爆，QQ和微信坐拥几亿的粉丝，QQ空间和朋友圈各种刷屏，写心得，晒照片，秀视频，那么谁来为企鹅保驾护航呢？支撑QQ和微信海量数据背后的架构又有哪些惊天内幕呢？本期大讲堂的内容来自今年2月份ChinaUnix对腾讯社交网络运营服务中心
java-69-旋转数组的最小元素。把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素 bylijinnan java
public class MinOfShiftedArray { /** * Q69 旋转数组的最小元素 * 把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素。 * 例如数组{3, 4, 5, 1, 2}为{1, 2, 3, 4, 5}的一个旋转，该数组的最小值为1。 */ publ
看博客，应该是有方向的 Cb123456 反省看博客
看博客，应该是有方向的: 我现在就复习以前的，在补补以前不会的，现在还不会的，同时完善完善项目，也看看别人的博客. 我刚突然想到的: 1.应该看计算机组成原理，数据结构，一些算法，还有关于android,java的。 2.对于我，也快大四了，看一些职业规划的，以及一些学习的经验，看看别人的工作总结的. 为什么要写
[开源与商业]做开源项目的人生活上一定要朴素,尽量减少对官方和商业体系的依赖 comsci 开源项目
为什么这样说呢？因为科学和技术的发展有时候需要一个平缓和长期的积累过程，但是行政和商业体系本身充满各种不稳定性和不确定性，如果你希望长期从事某个科研项目，但是却又必须依赖于某种行政和商业体系，那其中的过程必定充满各种风险。。。所以，为避免这种不确定性风险，我
一个 sql优化（[精华] 一个查询优化的分析调整全过程！很值得一看） cwqcwqmax9 sql
见 http://www.itpub.net/forum.php?mod=viewthread&tid=239011 Web翻页优化实例提交时间: 2004-6-18 15:37:49 回复发消息环境： Linux ve
Hibernat and Ibatis dashuaifu Hibernate ibatis
Hibernate VS iBATIS 简介 Hibernate 是当前最流行的O/R mapping框架，当前版本是3.05。它出身于sf.net，现在已经成为Jboss的一部分了 iBATIS 是另外一种优秀的O/R mapping框架，当前版本是2.0。目前属于apache的一个子项目了。相对Hibernate“O/R”而言，iBATIS 是一种“Sql Mappi
备份MYSQL脚本 dcj3sjt126com mysql
#!/bin/sh # this shell to backup mysql #[email protected] (QQ:1413161683 DuChengJiu) _dbDir=/var/lib/mysql/ _today=`date +%w` _bakDir=/usr/backup/$_today [ ! -d $_bakDir ] && mkdir -p
iOS第三方开源库的吐槽和备忘 dcj3sjt126com ios
转自 ibireme的博客做iOS开发总会接触到一些第三方库，这里整理一下，做一些吐槽。目前比较活跃的社区仍旧是Github，除此以外也有一些不错的库散落在Google Code、SourceForge等地方。由于Github社区太过主流，这里主要介绍一下Github里面流行的iOS库。首先整理了一份 Github上排名靠
html wlwmanifest.xml eoems html xml
所谓优化wp_head()就是把从wp_head中移除不需要元素，同时也可以加快速度。步骤：加入到function.php remove_action('wp_head', 'wp_generator'); //wp-generator移除wordpress的版本号，本身blog的版本号没什么意义，但是如果让恶意玩家看到，可能会用官网公布的漏洞攻击blog remov
浅谈Java定时器发展 hacksin java 并发 timer 定时器
java在jdk1.3中推出了定时器类Timer,而后在jdk1.5后由Dou Lea从新开发出了支持多线程的ScheduleThreadPoolExecutor，从后者的表现来看，可以考虑完全替代Timer了。 Timer与ScheduleThreadPoolExecutor对比： 1. Timer始于jdk1.3,其原理是利用一个TimerTask数组当作队列
移动端页面侧边导航滑入效果 ini jquery Web html5 css javascirpt
效果体验：http://hovertree.com/texiao/mobile/2.htm可以使用移动设备浏览器查看效果。效果使用到jquery-2.1.4.min.js，该版本的jQuery库是用于支持HTML5的浏览器上，不再兼容IE8以前的浏览器，现在移动端浏览器一般都支持HTML5，所以使用该jQuery没问题。HTML文件代码： <!DOCTYPE html> <h
AspectJ+Javasist记录日志 kane_xie aspectj javasist
在项目中碰到这样一个需求，对一个服务类的每一个方法，在方法开始和结束的时候分别记录一条日志，内容包括方法名，参数名+参数值以及方法执行的时间。 @Override public String get(String key) { // long start = System.currentTimeMillis(); // System.out.println("Be
redis学习笔记 MJC410621 redis NoSQL
1)nosql数据库主要由以下特点：非关系型的、分布式的、开源的、水平可扩展的。 1，处理超大量的数据 2，运行在便宜的PC服务器集群上， 3，击碎了性能瓶颈。 1)对数据高并发读写。 2)对海量数据的高效率存储和访问。 3)对数据的高扩展性和高可用性。 redis支持的类型： Sring 类型 set name lijie get name lijie set na
使用redis实现分布式锁 qifeifei
在多节点的系统中，如何实现分布式锁机制，其中用redis来实现是很好的方法之一，我们先来看一下jedis包中，有个类名BinaryJedis,它有个方法如下： public Long setnx(final byte[] key, final byte[] value) { checkIsInMulti(); client.setnx(key, value); ret
BI并非万能，中层业务管理报表要另辟蹊径张老师的菜大数据 BI 商业智能信息化
BI是商业智能的缩写，是可以帮助企业做出明智的业务经营决策的工具，其数据来源于各个业务系统，如ERP、CRM、SCM、进销存、HER、OA等。 BI系统不同于传统的管理信息系统，他号称是一个整体应用的解决方案，是融入管理思想的强大系统：有着系统整体的设计思想，支持对所有
安装rvm后出现rvm not a function 或者ruby -v后提示没安装ruby的问题 wudixiaotie function
1.在~/.bashrc最后加入 [[ -s "$HOME/.rvm/scripts/rvm" ]] && source "$HOME/.rvm/scripts/rvm" 2.重新启动terminal输入： rvm use ruby-2.2.1 --default 把当前安装的ruby版本设为默