weixin_42001089

Xgboost实践+第一名天池o2o优惠券的使用预测思路完整版

前言：

即上篇理论的学习之后，我们来实践一个天池上面的比赛:o2o优惠券的使用预测（目前第一名auc:0.81，本篇:0.786,待优化）

大赛地址https://tianchi.aliyun.com/getStart/introduction.htm?spm=5176.100066.0.0.479b33aflxXSQ8&raceId=231593

首先解题思路来源于原第一名wepe：https://github.com/wepe/O2O-Coupon-Usage-Forecast

笔者这里对其进行了进一步的归并总结，本文分为两大部分第一部分就是特征提取，第二部分是模型训练，即参照上篇理论的讲解，第二部分会介绍Xgboost的重要超参数。由于上篇已经介绍过部分参数含义，所以本篇不会累述，凡是讲解过得，这里会以#号标识，如不懂请看理论部分，笔者还是建议在用Xgboost之前，还是要对其原理有一定的了解，不要随大流拿过来就是用，随便训练训练，其实这样学习到的东西非常有限，而且对其模型参数也没有一个深刻的认识，可能只是随便百度一下看了看其表面意思，具体含义并不是很清楚，所以还是希望看一下原理，网上已经有很多Xgboost的文章都很好，自己也是从中学到很多，这里就顺便安利一下自己写过的：

https://blog.csdn.net/weixin_42001089/article/details/84965333

其实Xgboost是集成学习这一大家族中的一员，所以希望从下面这篇看起，相信会对机器学习集成学习这一大分支有一个整体系统的认识，对以后深入该领域都会有些许的帮助。

https://blog.csdn.net/weixin_42001089/article/details/84935462

当然啦，这里只是推荐一下，网上还有很多更好的关于Xgboost讲解，笔者只是想表达一个意思：先原理，后实践。

本篇接下来的全部代码和比赛数据：

https://github.com/Mryangkaitong/python-Machine-learning/tree/master/Xgboost

-----------------------------------------------------------------------------------------------------------------------------------------------------------------

数据集介绍：

github 中，笔者在Data下面有两个数据集即：

其中data_origin下面是原始数据，data_preprocessed下面是经过了特征提取后的预处理数据

data_origin中包含三个文件

第一个是要提交比赛的测试数据，字段含义如下：

第二个是供我们使用的训练数据，线下数据，其实原比赛数据还提供了线上数据，因为本文没有使用，所以就没上传，后续想要进一步优化使用该数据的可以当天池官网进行下载，其字段含义如下：

第三个是要提交数据，即最终要提交的数据形式，其字段含义如下：

本赛题提供用户在2016年1月1日至2016年6月30日之间真实线上线下消费行为，预测用户在2016年7月领取优惠券后15天以内的使用情况。
注意：为了保护用户和商家的隐私，所有数据均作匿名处理，同时采用了有偏采样和必要过滤。

评价方式：

本赛题目标是预测投放的优惠券是否核销。针对此任务及一些相关背景知识，使用优惠券核销预测的平均AUC（ROC曲线下面积）作为评价标准。即对每个优惠券coupon_id单独计算核销预测的AUC值，再对所有优惠券的AUC值求平均作为最终的评价标准。关于AUC的含义与具体计算方法，可参考维基百科

data_preprocessed中也包含了三个数据集：

其实通过特征提取data_origin数据后得到的三个数据集，我们使用模型训练以及最终预测的时候就是直接利用该三个数据集，当然了，这三个数据集不是必须要下载的，可以通过运行体征提取部分的代码进行得到。

------------------------------------------------------------------------------------------------------------------------------------------------------------------

提取体征：

该部分代码位于code下的ofoFeature.ipynb

这部分最大的亮点在于采用滑窗的方法对数据集进行了划分

对于为什么要这样做，很多人感到了困惑，其实很好理解。跟着笔者思路一步步来：

首先通过数据集部分的介绍我们知道可以利用的信息非常有限即就这7个字段：

为此我们想到要进行特征提取，获得尽可能多的额外信息。都可以提取哪些信息呢？一句话竟可能多的想吧：

wepe大神将其归纳成了五种类型信息：

有了上面的想法，我们去看看我们最终要预测的字段：

你会发现没有Date这个字段，这是肯定的嘛！如果都给了那还预测个啥，哈哈是吧。

同时会发现上面归纳出的种种待提取的信息，相当一部分信息是要用到Date即消费日期这一字段的。

那么问题来了，我们在给训练数据提取特征的时候是没有任何问题的，但是当要给最后的预测数据即2016年7月后的数据提取体征时怎么办呢？其根本就没有Date。

于是可以这样想，其实最后提取出来的特征信息代表的是一种习惯或者叫做固有属性，比如个人的一些消费习惯啦，商家的受欢迎程度啦等等，这些其实是不会随着月份改变而改变的，那我们就用7月份的前三个月来提取这些特征，然后默认为7月份也是这种特征信息，依照这种规则方法，我们在给训练集提取特征的时候也都是统一用前三个月的特征来默认为本月的特征，于是就出现了开始那样采用滑窗的方法对数据集进行了划分，进而会发现在上面归纳特征部分的《其他特征》和《优惠券相关》中提取的信息中不需要用到Date这一字段，于是在提取这两部分特征的时候就没有使用前三个月，而就是使用本月，在接下来的代码中也可以清晰看到，当然了这部分信息其实在真真实践的时候其实是得不到的对吧，假设现在来了一个客户要让我们预测，我们总不能说，现在不能预测，等这个月过完吧，我们再统计一下他的信息，进行预测是吧！从这个角度来讲，其实也刚好印证了为什么要采用滑窗的方法，比喻着总结为一句话那就是：评估一个人时，我们所能用到的信息就是根据其以前的所作所为，而不能也得不到其将来的言行。

展开联想：假如我们要给12月份提取特征，其实是不能默认用11月份的信息的，为什么呢？因为有个双11，即11月份购物欲望很强，这是某个时间点的特殊，不是普遍的，不能将其视为一贯的行为强加给12月份。

下面就来简单看一下代码：

首先定义两个路径，一个是源数据一个是预处理后数据存放的路径

接下来就是加载数据，划分数据集，提取特征，笔者这里将代码重写为了函数，这样更加简洁便于理解。

这里有一个小点需要注意：

off_train = pd.read_csv(os.path.join(DataPath,'ccf_offline_stage1_train.csv'),header=0,keep_default_na=False)
off_train.columns=['user_id','merchant_id','coupon_id','discount_rate','distance','date_received','date']

off_test = pd.read_csv(os.path.join(DataPath,'ccf_offline_stage1_test_revised.csv'),header=0,keep_default_na=False)
off_test.columns = ['user_id','merchant_id','coupon_id','discount_rate','distance','date_received']

看到keep_default_na=False部分了吧

当使用了改参数，那么加载后数据中如果有缺省值那么其默认是null，大部分是数字字段的数据类似是object即可以看做是字符串，当不写这句话时默认缺省值NAN，即大部分是数字字段是float，这也直接导致了怎么判断缺省值的问题：

当是null时很好说，比如判断date字段时是否是空省值就可用

off_train.date=='null'

当是NAN时可是使用：

off_train.date==off_train.date

当其为真时，是非空值，当其为假时是空值。更多该方面探讨（https://blog.csdn.net/weixin_42001089/article/details/83715484）

本文采用的是第一种加载方式，即空省值是null的方式如下：

主函数是位于一个叫做 DataProcess中

里面对应着上面归纳的五种信息：

GetOtherFeature:其它特征

GetMerchantRelatedFeature：商家相关特征

GetUserRelatedFeature：商户相关特征

GetUserAndMerchantRelatedFeature：商户-商家交互特征

GetCouponRelatedFeature：优惠券相关特征

如下：

def DataProcess(dataset,feature,TrainFlag):
    
    other_feature = GetOtherFeature(dataset)
    merchant = GetMerchantRelatedFeature(feature)
    user = GetUserRelatedFeature(feature)
    user_merchant = GetUserAndMerchantRelatedFeature(feature)
    coupon = GetCouponRelatedFeature(dataset,feature)
    
    
    dataset = pd.merge(coupon,merchant,on='merchant_id',how='left')
    dataset = pd.merge(dataset,user,on='user_id',how='left')
    dataset = pd.merge(dataset,user_merchant,on=['user_id','merchant_id'],how='left')
    dataset = pd.merge(dataset,other_feature,on=['user_id','coupon_id','date_received'],how='left')
    dataset.drop_duplicates(inplace=True)
 
    dataset.user_merchant_buy_total = dataset.user_merchant_buy_total.replace(np.nan,0)
    dataset.user_merchant_any = dataset.user_merchant_any.replace(np.nan,0)
    dataset.user_merchant_received = dataset.user_merchant_received.replace(np.nan,0)
    dataset['is_weekend'] = dataset.day_of_week.apply(lambda x:1 if x in (6,7) else 0)
    weekday_dummies = pd.get_dummies(dataset.day_of_week)
    weekday_dummies.columns = ['weekday'+str(i+1) for i in range(weekday_dummies.shape[1])]
    dataset = pd.concat([dataset,weekday_dummies],axis=1)
    if TrainFlag:
        dataset['date'] = dataset['date'].fillna('null');
        dataset['label'] = dataset.date.astype('str') + ':' +  dataset.date_received.astype('str')
        dataset.label = dataset.label.apply(get_label)
        dataset.drop(['merchant_id','day_of_week','date','date_received','coupon_count'],axis=1,inplace=True)
    else:
        dataset.drop(['merchant_id','day_of_week','coupon_count'],axis=1,inplace=True)
    dataset = dataset.replace('null',np.nan)
    return dataset

从这里也可以清晰看到：

GetMerchantRelatedFeature

GetUserRelatedFeature

GetUserAndMerchantRelatedFeature

利用的都是feature即本月的特征其实是前三个月提取的特征信息

GetOtherFeature

GetCouponRelatedFeature

利用的是dataset即就是当前本月提取的信息（再次说明：实际生产中不可用）

有人可能质疑道：GetCouponRelatedFeature中不是也利用feature信息了吗？我都看到了，不要骗我，哈哈，好的好的，这里解释一下：

在GetCouponRelatedFeature函数中有一个字段：

dataset['days_distance']

假设我们现在在提取20160515~20160615区间的信息

它的含义是当前领取优惠券时间距离5月15号已有多少天了，只不过去看原代码中这里应该是5月14，即其选取特征区间的最大值，同理当我们提取20160701~20160731区间信息时，源代码中是6月30日，所以这里只是利用了划分日期的分界线，并不是利用了前三个月的信息来当做本月的特征信息，对应到代码中是：


t = feature[feature['date']!='null']['date'].unique()
t = max(t)

可以看到只是提取了各自feature取得最大时间即t，而且t也仅仅是在‘days_distance’字段时使用，GetCouponRelatedFeature函数下其它地方根本就没有t即没有feature。所以本质来讲GetCouponRelatedFeature函数利用的还是dataset即本月数据。

我们利用DataProcess这个批处理函数，最后就得到了数据集介绍部分data_preprocessed下的三个数据集

其中

ProcessDataSet1.csv对应的是图片中的训练集2

ProcessDataSet2.csv对应的是图片中的训练集1

ProcessDataSet3.csv对应的是图片中的测试集

具体到每一个提取特征的函数细节，这里笔者就不再累述了，代码中笔者都加了大量的注释，对比着那五种特性信息下的每一条再结合代码相信都能看懂。

说明：特征工程是非常重要的，也是一个难点，但是有套路，大家可以看一下：https://tianchi.aliyun.com/mas-notebook/preview/36434/bffd10b0-18d3-11e9-bace-61d7df7cd8c1.ipynb/-1?lang=zh-cn

------------------------------------------------------------------------------------------------------------------------------------------------------------------

模型训练

毫无疑问我们使用的是Xgboost

注意审题，题目中的评价方式是对每个优惠券coupon_id单独计算核销预测的AUC值，再对所有优惠券的AUC值求平均作为最终的评价标准。而不是我们平时简单的auc。

于是我们定义了一下相应的评价函数用来性能评价：

#性能评价函数
def myauc(test):
    testgroup = test.groupby(['coupon_id'])
    aucs = []
    for i in testgroup:
        tmpdf = i[1] 
        if len(tmpdf['label'].unique()) != 2:
            continue
        fpr, tpr, thresholds = roc_curve(tmpdf['label'], tmpdf['pred'], pos_label=1)
        aucs.append(auc(fpr,tpr))
    return np.average(aucs)

接着就是加载我们预处理过得数据集，这里讲ProcessDataSet1和ProcessDataSet2合并为一个更大的数据集dataset12

并且抛弃了一些训练过程中不必要的字段，并删除了重复项

dataset1 = pd.read_csv('D:/MachineLearning/ofo/ofoOptimization/ProcessDataSet1.csv')
dataset1.label.replace(-1,0,inplace=True) 
dataset2 = pd.read_csv('D:/MachineLearning/ofo/ofoOptimization/ProcessDataSet2.csv')
dataset2.label.replace(-1,0,inplace=True)
dataset3 = pd.read_csv('D:/MachineLearning/ofo/ofoOptimization/ProcessDataSet3.csv')

dataset1.drop_duplicates(inplace=True)
dataset2.drop_duplicates(inplace=True)
dataset12 = pd.concat([dataset1,dataset2],axis=0)
dataset12_y = dataset12.label
dataset12_x = dataset12.drop(['user_id','label','day_gap_before','coupon_id','day_gap_after'],axis=1)      
                                         
dataset3.drop_duplicates(inplace=True)                       
dataset3_preds = dataset3[['user_id','coupon_id','date_received']]
dataset3_x = dataset3.drop(['user_id','coupon_id','date_received','day_gap_before','day_gap_after'],axis=1)

dataTrain = xgb.DMatrix(dataset12_x,label=dataset12_y)
dataTest = xgb.DMatrix(dataset3_x)

注意Xgboost训练的数据必须要使用xgb.DMatrix()转化后的形式，这里就转化了一下。

接下来就是训练模型，保存模型

params={'booster':'gbtree',
	    'objective': 'rank:pairwise',
	    'eval_metric':'auc',
	    'gamma':0.1,
	    'min_child_weight':1.1,
	    'max_depth':5,
	    'lambda':10,
	    'subsample':0.7,
	    'colsample_bytree':0.7,
	    'colsample_bylevel':0.7,
	    'eta': 0.01,
	    'tree_method':'exact',
	    'seed':0,
	    'nthread':12
	    }
watchlist = [(dataTrain,'train')]
model = xgb.train(params,dataTrain,num_boost_round=3500,evals=watchlist)

model.save_model('D:/MachineLearning/ofo/ofoOptimization/xgbmodel')

下面来说一下各个参数的含义，注意就像前面说过的理论部分介绍过的参数，这里会标记#，不再累述，请看理论部分

https://blog.csdn.net/weixin_42001089/article/details/84935462

开始：

'booster':#

'objective':可选的目标函数

定义学习任务及相应的学习目标，可选的目标函数如下：
“reg:linear” –线性回归。
“reg:logistic” –逻辑回归。
“binary:logistic” –二分类的逻辑回归问题，输出为概率。
“binary:logitraw” –二分类的逻辑回归问题，输出的结果为wTx。
“count:poisson” –计数问题的poisson回归，输出结果为poisson分布。
在poisson回归中，max_delta_step的缺省值为0.7。(used to safeguard optimization)
“multi:softmax” –让XGBoost采用softmax目标函数处理多分类问题，同时需要设置参数num_class（类别个数）
“multi:softprob” –和softmax一样，但是输出的是ndata * nclass的向量，可以将该向量reshape成ndata行nclass列的矩阵。每行数据表示样本所属于每个类别的概率。
“rank:pairwise” –set XGBoost to do ranking task by minimizing the pairwise loss

一般二分类问题就用“binary:logistic”和“rank:pairwise”，其它的都很好理解，而且网上的介绍资料也是一大把，但是介绍“rank:pairwise”的博客却很少，而且当使用“rank:pairwise”时，直接用训练好的模型预测的时候结果有时候令人费解甚至出现否值，为止笔者这里专门有一篇文章对其进行了探究：

https://blog.csdn.net/weixin_42001089/article/details/84146238

希望对大家有所帮助

本篇采用的就是“rank:pairwise”目标函数。

'eval_metric'：评价函数，用户是可以自己定义自己的评价函数的，这里采用了auc，对了其实我们在一开头是定义了自己评价函数的

'gamma'：#默认0

'min_child_weight'：#

'max_depth'：这个很好理解，就是每个基分类树的最大深度

'lambda'：#

'subsample':这个参数控制每棵树随机采样的比例：减小该值，算法会更加保守，避免过拟合。但是，过小，它可能会导致欠拟合。

一般：0.5-1

'colsample_bytree':用来控制每棵随机采样的列数的占比
'colsample_bylevel':用来控制树的每一级的每一次分裂，对列数的采样的占比。

'eta': #
'seed':复现随机数据的结果，也可以用于调整参数
'nthread':进行多线程控制，应当输入系统的核数。

num_boost_round：多少颗基分类树

evals：显示的训练过程，这里的watchlist可以是：

watchlist = [(Train,'train'),(Test,'test')]

这样就可以同时显示当前训练下训练集和测试集的auc，只不过笔者这里只有训练集没有测试集，澄清一下：

不是没有训练集，我们代码中的dataTest中是要我们预测的，提交的，其中并没有l真实的abel,而watchlist中的Test其实就是我们通常的将样本划分为训练集和测试集中的测试集，对应到我们代码中应该是将dataTrain划分一下，但是笔者这里并没有这么做，相当于将全部样本作为了训练集。

我们看一下训练过程：这里仅仅截取了最后一部分

oots, 62 extra nodes, 0 pruned nodes, max_depth=5
[3495]	train-auc:0.907827
[17:43:58] C:\Users\Administrator\Desktop\xgboost\src\tree\updater_prune.cc:74: tree pruning end, 1 roots, 60 extra nodes, 0 pruned nodes, max_depth=5
[3496]	train-auc:0.90783
[17:43:59] C:\Users\Administrator\Desktop\xgboost\src\tree\updater_prune.cc:74: tree pruning end, 1 roots, 62 extra nodes, 0 pruned nodes, max_depth=5
[3497]	train-auc:0.907834
[17:43:59] C:\Users\Administrator\Desktop\xgboost\src\tree\updater_prune.cc:74: tree pruning end, 1 roots, 62 extra nodes, 0 pruned nodes, max_depth=5
[3498]	train-auc:0.907838
[17:44:00] C:\Users\Administrator\Desktop\xgboost\src\tree\updater_prune.cc:74: tree pruning end, 1 roots, 60 extra nodes, 0 pruned nodes, max_depth=5
[3499]	train-auc:0.907843

可以看到，随着训练次数的增多训练集的auc也在不断增大，那么用我们自行定义的auc去在训练样本上测一下性能把：

model=xgb.Booster()
model.load_model('D:/MachineLearning/ofo/ofoOptimization/xgbmodel') 

temp = dataset12[['coupon_id','label']].copy()
temp['pred'] =model.predict(xgb.DMatrix(dataset12_x))
temp.pred = MinMaxScaler(copy=True,feature_range=(0,1)).fit_transform(temp['pred'].values.reshape(-1,1))
print(myauc(temp))

结果：

看到是0.77，然后我们就用该模型去预测并提交比赛官网

#predict test set 
dataset3_preds1 = dataset3_preds
dataset3_preds1['label'] = model.predict(dataTest)
#标签归一化在[0，1]原作者代码这里有错
#修改前
#dataset3_preds.label = MinMaxScaler(copy=True,feature_range=(0,1)).fit_transform(dataset3_preds.label)
 
#修改后
dataset3_preds1.label = MinMaxScaler(copy=True,feature_range=(0,1)).fit_transform(dataset3_preds1.label.reshape(-1,1))
dataset3_preds1.sort_values(by=['coupon_id','label'],inplace=True)
dataset3_preds1.to_csv("D:/MachineLearning/ofo/ofoOptimization/xgb_preds.csv",index=None,header=None)
print(dataset3_preds1.describe())

这个结果在天池上面的得分便是0.78

调优：

一般Xgboost调优的顺序可以参考如下：

确定一个学习速率0.1

num_boost_round调优

max_depth 和 min_weight 参数调优

gamma参数调优

正则化参数调优

降低学习速率

关于num_boost_round的调优，一般有两种可选的方法：

第一种就是使用xgb.train+watchlist的形式，首先将num_boost_round设的足够大，然后在运行的过程中我们看训练集和测试集的auc变化，一般来说训练集上面的auc会一直增加，但是测试集上面的auc会随着num_boost_round增大因为过拟合而下降，这样我们就会在训练过程中找到测试集的一个峰值，一旦找到，我们就可以结束训练了。

第二种就是使用其内置的xgb.cv函数，它的好处在于不用我们实时去人工观察，而是直接会得到最佳的num_boost_round值，同理我们还是直接给一个足够大的初始值让其去训练，然后就美滋滋的等待其返回最佳结果值把。

这里就来演示一下第二种方法：

params={'booster':'gbtree',
	    'objective': 'rank:pairwise',
	    'eval_metric':'auc',
	    'gamma':0.1,
	    'min_child_weight':1.1,
	    'max_depth':5,
	    'lambda':10,
	    'subsample':0.7,
	    'colsample_bytree':0.7,
	    'colsample_bylevel':0.7,
	    'eta': 0.01,
	    'tree_method':'exact',
	    'seed':0,
	    'nthread':12
	    }

cvresult = xgb.cv(params, dataTrain, num_boost_round=20000, nfold=5, metrics='auc', seed=0, callbacks=[
            xgb.callback.print_evaluation(show_stdv=False),
            xgb.callback.early_stop(50)
        ])
num_round_best = cvresult.shape[0] - 1
print('Best round num: ', num_round_best)

watchlist = [(dataTrain,'train')]
model1 = xgb.train(params,dataTrain,num_boost_round=num_round_best,evals=watchlist)

model1.save_model('D:/MachineLearning/ofo/ofoOptimization/xgbmodel1')
print('------------------------train done------------------------------')

其中xgb.cv中的nfold代表的就是交叉验证的份数， xgb.callback.early_stop 是在多少次迭代 metrics 没有变好的情况下提前结束，这个函数可以找到此参数组下最佳的迭代次数（n_estimators）。

其返回DataFrame型的n折交叉验证的平均结果，cvresult.shape[0]即为其最佳迭代次数（代码中这里减不减一并无大碍）

看一下结果：

可以看到最好的是11689，同时我们可以观察到每一轮的train-auc和test-auc

最后当我们知道了最佳的迭代树，便依次训练即可：得到模型model1

然后我们测试一下该模型：

可以看到现在就是0.81啦，其它参数怎么调优呢？

很简单使用sklearn中的网格训练工具GridSearchCV吧。

但是我们以上使用的都是原生态的Xgboost,怎么和sklearn中的GridSearchCV结合呢？

其实sklearn中也有Xgboost的接口即

from xgboost.sklearn import XGBClassifier

关于两者怎么结合调优等细节问题，这里有一篇很好的文章也推荐给大家供参考：

https://blog.csdn.net/han_xiaoyang/article/details/52665396

最后对着我们理论篇讲的Xgboost特征筛选功能我们来看一下get_fscore()函数：

feature_score = model1.get_fscore()
feature_score = sorted(feature_score.items(), key=lambda x:x[1],reverse=True)#value逆序排序

fs = []
for (key,value) in feature_score:
    fs.append("{0},{1}\n".format(key,value))
 
with open('D:/MachineLearning/ofo/ofoOptimization/xgb_feature_score.csv','w') as f:
    f.writelines("feature,score\n")
    f.writelines(fs)

看一下结果：

说明一下：笔者再将num_boost_round从3500提到11689后，虽然训练集上面得到了大幅度提高，但是提交结果在测试集上面却没有提升，反而下降了，同时需要说明的是这里其它超参数采用的值都是wepe中给出的，相信也是经过多次尝试优化的结果，关于更多优化方法或细节方法欢迎多多交流，嘻嘻。

------------------------------------------------------------------------------------------------------------------------------------------------------------------

收获总结和感悟：

1）希望通过实践篇后能够对Xgboost有更加深刻的认识

2）特征划分部分滑窗的方法值得学习。

3）最后得分的高低，其实很大部分在于特征提取，其决定了最佳值，模型的调优只不过是在不断向该值逼近。

4）Xgboost的调优过程及方法。

5）遇到问题一定要想办法搞懂，蒙混自己终究还是不会，迟早问题还是会暴露，会花更多的时间去解决！亏。

你可能感兴趣的:(人工智能机器学习,天池大赛,Xgboost实践)

Java Web开发技术解析：从基础到实践的全栈指南以恒1 java 前端开发语言
JavaWeb开发技术解析：从基础到实践的全栈指南在互联网技术演进中，JavaWeb凭借其跨平台特性、成熟的生态系统和强大的企业级服务能力，成为构建动态Web应用的核心技术栈。本文从技术组成、开发工具、实战应用三个维度，全面解析JavaWeb的完整技术体系，并结合最新行业实践探讨其演进方向。一、JavaWeb的核心技术组成JavaWeb开发以Servlet和JSP为基石，通过分层架构实现动态网页生
从 0 到 1 构建 Python 分布式爬虫，实现搜索引擎全攻略七七知享 Python python 分布式爬虫搜索引擎算法程序人生网络爬虫
从0到1构建Python分布式爬虫，实现搜索引擎全攻略在大数据与信息爆炸的时代，搜索引擎已然成为人们获取信息的关键入口。你是否好奇，像百度、谷歌这般强大的搜索引擎，背后是如何精准且高效地抓取海量网页数据的？本文将带你一探究竟，以Python为工具，打造属于自己的分布式爬虫，进而搭建一个简易搜索引擎，完整呈现从底层代码编写到系统搭建的全过程。通过本文的实践，我们成功打造了Python分布式爬虫，并以
第三十篇维度建模：从理论到落地的企业级实践随缘而动，随遇而安数据库 sql 数据仓库大数据数据库架构
目录一、维度建模核心理论体系1.1Kimball方法论四大支柱1.2关键概念对比矩阵二、四步建模法全流程解析2.1选择业务过程（以电商为例）2.2声明原子粒度（订单案例）2.3维度设计规范时间维度（含财年逻辑）SCDType2完整实现（Hudi）2.4事实表类型与设计三、企业级建模实战：电商用户分析3.1业务矩阵分析3.2模型实现代码四、高级建模技巧4.1多星型模式关联4.2大数据场景优化五、性能
【人工智能机器学习基础篇】——深入详解无监督学习之降维：PCA与t-SNE的关键概念与核心原理猿享天开人工智能数学基础专讲人工智能机器学习无监督学习降维
深入详解无监督学习之降维：PCA与t-SNE的关键概念与核心原理在当今数据驱动的世界中，数据维度的增多带来了计算复杂性和存储挑战，同时也可能导致模型性能下降，这一现象被称为“维度诅咒”（CurseofDimensionality）。降维作为一种重要的特征提取和数据预处理技术，旨在通过减少数据的维度，保留其主要信息，从而简化数据处理过程，并提升模型的性能。本文将深入探讨两种广泛应用于无监督学习中的降
生成式对抗网络在人工智能艺术创作中的应用与创新研究辛迎蕌人工智能
摘要本文深入探究生成式对抗网络（GAN）在人工智能艺术创作领域的应用与创新。通过剖析GAN核心原理，阐述其在图像、音乐、文学等艺术创作中的实践，分析面临的挑战与创新方向，呈现GAN对艺术创作模式的变革，为理解人工智能与艺术融合发展提供全面视角。一、引言在人工智能与艺术深度融合的时代浪潮中，生成式对抗网络（GAN）作为一项突破性技术，为艺术创作带来了全新的可能性。它打破传统创作边界，以独特的对抗学习
【Kafka高级】Kafka性能优化与调优实践全栈追梦人 kafka 性能优化 linq
在大规模数据处理和实时消息传递场景中，Kafka的性能优化至关重要。本文将从生产者性能优化、消费者性能优化以及集群性能调优三个方面展开，结合实际代码示例和配置参数，帮助读者更好地理解和应用Kafka性能优化策略。一、生产者性能优化Kafka生产者的性能直接影响消息发送的效率和系统的吞吐量。以下是一些关键优化策略：1.1批量发送生产者会将消息批量发送到Kafka，减少网络请求次数。以下参数对批量发送
使用Nginx实现后端负载均衡海上彼尚 node.js nginx 负载均衡运维 node.js
目录引言一、负载均衡的核心作用二、基础配置三步曲1.定义后端服务器组（upstream）2.配置代理转发规则3.重载配置生效三、六大负载均衡算法详解四、高级配置技巧1.健康检查机制2.会话保持方案3.SSL终止优化五、实战场景配置案例案例1：WebSocket负载均衡案例2：多级地域分发案例3：连接池优化六、最佳实践与陷阱规避结语引言在现代高并发场景下，单一服务器难以支撑海量请求的处理。Nginx
【C++】C++从入门到精通教程（持续更新...）废人一枚 C++c++开发语言
前言最近在整理之前一些C++资料，重新整理出了一套C++从基础到实践的教程，包含概念、代码、运行结果以及知识点的扩展，感兴趣的后续大家持续关注。以下是更新的文章目录，文章之后整理了一个知识思维导图，看起来比较清楚点。目录1、C++基础知识C++基础知识一个简单的C++程序函数重载引用的概念引用与指针的区别引用作为函数参数引用作为返回值面向对象类的定义类的声明结构体与类的区别inline函数this
数智读书笔记系列021《大数据医疗》：探索医疗行业的智能变革 Allen_Lyb 数智读书笔记大数据健康医疗人工智能 python
一、书籍介绍《大数据医疗》由徐曼、沈江、余海燕合著，由机械工业出版社出版。徐曼是南开大学商学院副教授，在大数据驱动的智能决策研究领域颇有建树，尤其在大数据驱动的医疗与健康决策方面有着深入研究，曾获天津优秀博士论文、教育部博士研究生新人奖。沈江等作者也在相关学术和实践领域有着丰富的经验和深厚的专业知识。这本书系统且深入地探讨了大数据技术在医疗领域的应用与变革，对推动医疗行业的智能化发展具有重要的理论
CAN协议简介：从基础到高级应用 New_Teen 嵌入式硬件学习笔记嵌入式硬件物联网
文章目录引言一、CAN协议概述1.1基本特性1.2典型应用场景二、物理层解析2.1信号规范2.2网络拓扑三、数据链路层机制3.1帧类型对比3.2非破坏性仲裁3.3错误处理机制四、帧结构详解4.1标准数据帧结构4.2扩展帧结构五、高级特性5.1CANFD协议增强5.2报文过滤机制六、同步与定时6.1位时间组成6.2同步规则七、开发实践要点结语引言在现代工业控制和汽车电子领域，CAN（Controll
UI设计中的负空间：提示和最佳实践 weixin_34346099
我们常常认为沉默，空虚或无色对我们不利。我们认为它们是理所当然的，而不认为它们是对比的坚实基础。只有沉默让我们知道声音的价值。只有空白空间才能让我们了解我们想要填充它的内容。只有无色才能让我们在舞台上出现时感觉颜色更明亮更深。只有缺乏空气才能让我们知道它的重要性。今天我们谈论的是设计中的空气，让我们讨论下什么是负空间。什么是设计中的负空间？基本上，负空间或通常称为空白区域-是布局的空白区域。它不仅
Android Compose 图标按钮深度剖析：从源码到实践(四) &有梦想的咸鱼& Android开发大全 Androiod Compose原理 android
AndroidCompose图标按钮深度剖析：从源码到实践一、引言在现代Android应用开发中，用户界面的交互性和美观性至关重要。图标按钮作为一种常见的UI元素，以其简洁直观的特点，在提升用户体验方面发挥着重要作用。AndroidCompose作为Google推出的新一代声明式UI工具包，为开发者提供了创建图标按钮的便捷方式。本文将深入AndroidCompose框架的图标按钮模块，从源码级别进
并查集：从连通性检测到动态合并的算法艺术六七_Shmily 数据结构与算法分析算法
并查集：从连通性检测到动态合并的算法艺术（C++实现）一、并查集：算法世界的隐形支柱在算法竞赛和工程实践中，并查集（DisjointSetUnion，DSU）是解决动态连通性问题的终极武器。它能在近乎常数时间内完成集合的合并与查询操作，广泛应用于社交网络、图像处理、编译器优化等领域。本文将深入剖析并查集的核心原理，并通过实战案例揭示其精妙之处。二、并查集的三重核心1.数据结构设计classDSU{
在Selenium 中更改 User-Agent 的步骤与最佳实践守城小轩网络爬虫 selenium 网络爬虫浏览器开发自动化浏览器爬虫 chrome
引言在Selenium中更改UserAgent是许多网页自动化任务中的关键步骤。它有助于将自动化脚本伪装成常规浏览器，从而避免被网站检测到。本指南将带您了解如何在Selenium中更改GoogleChrome的UserAgent，并提供最佳实践以确保您的网页自动化任务顺利进行。目录了解SeleniumUser-AgentSelenium中的默认User-Agent为什么要更改User-Agent？
Ai时代初期，人类文明的多纬度演进方向分析 Ai度人工智能
在AI时代初期，文明的演进呈现出多维度、跨领域的突破性特征，结合最新研究进展与实践案例，其深层变革可进一步细化为以下六大维度：一、技术平权与生产要素重构AI技术通过算力跃迁与认知革命重构生产要素。例如，华为昇腾芯片使县域政务系统获得省级决策能力，特斯拉工厂的机械臂实现0.8秒完成车身焊接，而量子-经典混合算法将药物分子模拟效率提升1200倍。这种技术平权运动正推动全球劳动生产率提升30%，同时催生
基于Python的智能决策支持系统：实现智能化决策的关键要素 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型自然语言处理人工智能语言模型编程实践开发语言架构设计
文章目录基于Python的智能决策支持系统：实现智能化决策的关键要素11.背景介绍2.核心概念与联系数据收集与预处理模型构建与训练决策规则生成与优化决策结果评估与反馈3.核心算法原理具体操作步骤数据挖掘算法机器学习算法优化算法4.数学模型和公式详细讲解举例说明线性回归模型最小二乘法5.项目实践：代码实例和详细解释说明6.实际应用场景金融领域医疗领域供应链管理智能制造7.工具和资源推荐编程语言和开发
【尚硅谷】鸿蒙应用开发 - 带源码课件 6v6-博客 harmonyos 华为
【尚硅谷】鸿蒙应用开发-带源码课件课程描述本教程精心设计了一款精致而小巧的实战应用，贯穿整个学习过程，真正做到理论与实践相结合。课程内容从基础到高级，层层递进，全面覆盖鸿蒙应用开发的所有必备技能。通过图解抽象知识、丰富的案例和清晰的讲解，帮助学习者快速掌握鸿蒙应用开发的核心技术。课程亮点实战驱动：以实际应用案例为主线，贯穿整个学习过程，让学习更贴近实际开发需求。内容全面：从基础概念到高级技能，系统
解释一下什么是 React 的 useRef Hook 祈澈菇凉 react.js javascript 前端
useRef是React中的一个Hook，用于创建一个可以持久化存储的可变引用。它通常用于访问DOM元素或保存任何可变值，而不触发组件的重新渲染。本文将详细介绍useRef的定义、用法、适用场景及最佳实践。1.什么是useRef？1.1定义useRef是一个Hook，用于创建一个可变的引用对象。它返回一个包含.current属性的对象，.current属性可以用来存储任何值。与组件的状态（stat
深入解析 .NET 中的依赖项加载机制：原理、实现与最佳实践江沉晚呤时 Net core 前端数据库 c#.netcore
在现代应用程序的开发中，依赖项管理与加载是非常重要的组成部分，尤其是在大型系统中，如何高效地加载和管理依赖项可以极大地影响应用程序的性能、可维护性和扩展性。在.NET中，依赖项加载不仅涉及静态依赖的管理，还包括动态加载组件和程序集的能力。本文将详细讲解.NET中的依赖项加载机制，覆盖从静态依赖注入到动态加载的所有重要概念。1.依赖项加载的基本概念1.1依赖项与依赖注入（DI）依赖项是一个对象在其生
知识管理系统：构建企业智慧大脑 AI天才研究院 ChatGPT AI大模型企业级应用开发实战 DeepSeek R1 &大数据AI人工智能大模型大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
第一部分：知识管理概述与重要性第1章：知识管理的定义与基本概念1.1.1知识管理的起源与发展知识管理（KnowledgeManagement，KM）起源于20世纪80年代，当时企业在市场竞争中逐渐意识到知识作为一种战略资源的重要性。早期的知识管理实践主要集中在知识的收集、存储和传播上。随着信息技术的发展，知识管理逐渐融入了更先进的技术手段，如数据挖掘、人工智能和大数据分析，使其成为一个跨学科、多领
六十天前端强化训练之第二十一天大师级详解 React Context API：从原理到实战编程星辰海 #前端前端 react.js javascript React Context API
=====欢迎来到编程星辰海的博客讲解======看完可以给一个免费的三连吗，谢谢大佬！目录一、庖丁解牛：深入理解ContextAPI1.1设计哲学与运转机制工作原理三步曲：1.2核心三剑客详解1.3性能优化要诀二、手把手实现主题切换系统2.1完整代码实现（逐行注释版）2.2配套CSS样式设计三、关键知识点拆解3.1状态初始化策略3.2CSS变量注入原理3.3性能优化实践3.4可访问性最佳实践四、
关于Linux SSH的那些知识点协议捕手 Linux企业应用经验集 linux ssh 运维
以下是LinuxSSH相关知识点的系统整理，涵盖基础概念、配置指南、安全实践及实际案例一、SSH核心知识点协议版本SSH-1（不安全，已淘汰）vsSSH-2（推荐，默认协议）加密机制：非对称加密（RSA/ECDSA）交换密钥+对称加密（AES/ChaCha20）传输数据密钥认证流程客户端生成私钥（~/.ssh/id_rsa）和公钥（~/.ssh/id_rsa.pub）公钥上传至服务器~/.ssh/
MDX语言的软件工程苏墨瀚包罗万象 golang 开发语言后端
MDX语言的软件工程引言在现代软件开发中，技术的进步不断推动着开发流程的变化与优化。MDX（MultidimensionalExpressions）语言作为一种用于查询和操作多维数据集的表达式语言，已在数据分析、商业智能等领域得到了广泛应用。本文将探讨MDX语言在软件工程中的应用，包括其基本概念、工作原理、最佳实践以及在数据分析系统中的具体案例。1.MDX语言概述MDX最初由微软开发，通常用于访问
重构革命：如何通过C#代码优化实现软件的华丽转身墨夶 C#学习资料1 重构 c#开发语言
在软件开发的世界里，代码的质量直接决定了项目的成败。随着业务需求的变化和技术的进步，原有的代码结构可能逐渐变得臃肿、难以维护。这时，代码重构就成为了提升系统性能、增强可读性和简化后续开发工作的关键手段。本文将深入探讨C#代码重构的最佳实践，帮助开发者掌握这一技能，在不改变外部行为的前提下对内部实现进行改进，使程序更加健壮、灵活且易于扩展。一、1.1为什么需要重构？当一个项目随着时间推移而不断增长时
Springboot中的@ConditionalOnBean注解：使用指南与最佳实践上官美丽 java spring boot java mybatis
在使用SpringBoot进行开发时，大家应该都听说过条件注解（ConditionalAnnotations）。其中的@ConditionalOnBean注解就很有趣，它帮助开发者在特定条件下创建和注入Bean，让你的应用更加灵活。今天就来聊聊这个注解的使用场景、工作原理以及最佳实践！什么是@ConditionalOnBean注解？@ConditionalOnBean是SpringBoot中提供的
Python：区块链 Blockchain 入门的技术指南拾荒的小海螺 Python python 区块链开发语言
1、简述区块链（Blockchain）是一种去中心化、不可篡改的分布式账本技术，最初因比特币而广为人知。如今，区块链已发展成为一种可以应用于金融、供应链管理、智能合约等多个领域的技术。本文将简要介绍区块链的基本概念和原理，并通过Python实现一个简化的区块链原型，帮助您快速上手区块链的实践。2、基本原理区块链是一种链式结构，由多个“区块”串联而成。每个区块中包含若干交易信息，并通过加密哈希指向前
Spring Boot 3 新特性实战：从理论到实践潘多编程网络 java 开发语言
引言SpringBoot自发布以来，凭借其简洁的配置和强大的功能，迅速成为Java开发者的首选框架。随着SpringBoot3的发布，开发者们迎来了更多令人兴奋的新特性。本文将深入探讨SpringBoot3的新特性，并通过实战示例展示如何在实际项目中应用这些新功能。1.支持Java17SpringBoot3全面支持Java17，这是Java生态系统中的一个重要里程碑。Java17带来了许多新特性，
AI推动地理信息系统（GIS）软件的创新发展与应用拓展酥脆可口 facebook
摘要地理信息系统（GIS）软件作为空间数据处理与分析的核心工具，在城市规划、资源管理、环境监测等领域发挥着关键作用。本文深入探讨人工智能（AI）如何推动GIS软件的创新发展，分析AI技术在提升空间数据分析能力、优化地图制图、拓展应用场景等方面的重要作用，剖析面临的挑战，并对未来发展趋势进行展望，旨在为GIS行业借助AI实现升级提供理论与实践参考。一、引言传统GIS软件主要依赖基于规则的分析方法和人
C++并发编程有什么最佳实践？ c++
在C++并发编程中，遵循最佳实践可以显著提升代码的效率、可维护性和可扩展性。以下是一些关键的最佳实践：使用线程池管理线程线程池可以预先创建一组线程，并在需要时将任务分配给这些线程。这种方式减少了创建和销毁线程的开销，提高了程序性能。例如：cpp复制autopool=std::make_shared(std::thread::hardware_concurrency());pool->push(st
php 高性能，高并发，有哪些框架，扩展，推荐一下，或者技术的实现有哪些行思理运维 LNMP Linux php 开发语言
以下是针对PHP高性能、高并发场景的框架、扩展及技术实现推荐，结合最新技术趋势和行业实践进行总结：一、高性能框架推荐1.C扩展类框架YAF(YetAnotherFramework)特点：由C语言编写，直接嵌入PHP内核，仅提供核心MVC功能，执行效率极高（RPS可达3000+），适合API网关、秒杀系统等场景213。适用场景：对性能要求极高但功能需求简单的项目，如百度、微博部分业务曾采用其修改版。
解线性方程组 qiuwanchi
package gaodai.matrix; import java.util.ArrayList; import java.util.List; import java.util.Scanner; public class Test { public static void main(String[] args) { Scanner scanner = new Sc
在mysql内部存储代码 annan211 性能 mysql 存储过程触发器
在mysql内部存储代码在mysql内部存储代码，既有优点也有缺点，而且有人倡导有人反对。先看优点： 1 她在服务器内部执行，离数据最近，另外在服务器上执行还可以节省带宽和网络延迟。 2 这是一种代码重用。可以方便的统一业务规则，保证某些行为的一致性，所以也可以提供一定的安全性。 3 可以简化代码的维护和版本更新。 4 可以帮助提升安全，比如提供更细
Android使用Asynchronous Http Client完成登录保存cookie的问题 hotsunshine android
Asynchronous Http Client是android中非常好的异步请求工具除了异步之外还有很多封装比如json的处理，cookie的处理引用 Persistent Cookie Storage with PersistentCookieStore This library also includes a PersistentCookieStore whi
java面试题 Array_06 java 面试
java面试题第一，谈谈final, finally, finalize的区别。 final-修饰符（关键字）如果一个类被声明为final，意味着它不能再派生出新的子类，不能作为父类被继承。因此一个类不能既被声明为 abstract的，又被声明为final的。将变量或方法声明为final，可以保证它们在使用中不被改变。被声明为final的变量必须在声明时给定初值，而在以后的引用中只能
网站加速 oloz 网站加速
前序:本人菜鸟，此文研究总结来源于互联网上的资料，大牛请勿喷！本人虚心学习，多指教. 1、减小网页体积的大小，尽量采用div+css模式，尽量避免复杂的页面结构，能简约就简约。 2、采用Gzip对网页进行压缩； GZIP最早由Jean-loup Gailly和Mark Adler创建，用于UNⅨ系统的文件压缩。我们在Linux中经常会用到后缀为.gz
正确书写单例模式随意而生 java 设计模式单例
　　单例模式算是设计模式中最容易理解，也是最容易手写代码的模式了吧。但是其中的坑却不少，所以也常作为面试题来考。本文主要对几种单例写法的整理，并分析其优缺点。很多都是一些老生常谈的问题，但如果你不知道如何创建一个线程安全的单例，不知道什么是双检锁，那这篇文章可能会帮助到你。　　懒汉式，线程不安全　　当被问到要实现一个单例模式时，很多人的第一反应是写出如下的代码，包括教科书上也是这样
单例模式香水浓 java
懒汉调用getInstance方法时实例化 public class Singleton { private static Singleton instance; private Singleton() {} public static synchronized Singleton getInstance() { if(null == ins
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" AdyZhang apache http server
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" 每次到这一步都很小心防它的端口冲突问题，结果，特意留出来的80端口就是不能用，烦。解决方法确保几处： 1、停止IIS启动 2、把端口80改成其它（譬如90，800，，，什么数字都好） 3、防火墙(关掉试试) 在运行处输入 cmd 回车，转到apa
如何在android 文件选择器中选择多个图片或者视频？ aijuans android
我的android app有这样的需求，在进行照片和视频上传的时候，需要一次性的从照片/视频库选择多条进行上传但是android原生态的sdk中，只能一个一个的进行选择和上传。我想知道是否有其他的android上传库可以解决这个问题，提供一个多选的功能，可以使checkbox之类的，一次选择多个处理方法官方的图片选择器(但是不支持所有版本的androi，只支持API Level
mysql中查询生日提醒的日期相关的sql baalwolf mysql
SELECT sysid,user_name,birthday,listid,userhead_50,CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')),CURDATE(), dayofyear( CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')))-dayofyear(
MongoDB索引文件破坏后导致查询错误的问题 BigBird2012 mongodb
问题描述： MongoDB在非正常情况下关闭时，可能会导致索引文件破坏，造成数据在更新时没有反映到索引上。解决方案：使用脚本，重建MongoDB所有表的索引。 var names = db.getCollectionNames(); for( var i in names ){ var name = names[i]; print(name);
Javascript Promise bijian1013 JavaScript Promise
Parse JavaScript SDK现在提供了支持大多数异步方法的兼容jquery的Promises模式，那么这意味着什么呢，读完下文你就了解了。一.认识Promises “Promises”代表着在javascript程序里下一个伟大的范式，但是理解他们为什么如此伟大不是件简
[Zookeeper学习笔记九]Zookeeper源代码分析之Zookeeper构造过程 bit1129 zookeeper
Zookeeper重载了几个构造函数，其中构造者可以提供参数最多，可定制性最多的构造函数是 public ZooKeeper(String connectString, int sessionTimeout, Watcher watcher, long sessionId, byte[] sessionPasswd, boolea
【Java命令三】jstack bit1129 jstack
jstack是用于获得当前运行的Java程序所有的线程的运行情况(thread dump），不同于jmap用于获得memory dump [hadoop@hadoop sbin]$ jstack Usage: jstack [-l] <pid> (to connect to running process) jstack -F
jboss 5.1启停脚本　动静分离部署 ronin47
以前启动jboss，往各种xml配置文件，现只要运行一句脚本即可。start nohup sh /**/run.sh -c servicename -b ip -g clustername -u broatcast jboss.messaging.ServerPeerID=int -Djboss.service.binding.set=p
UI之如何打磨设计能力? brotherlamp UI ui教程 ui自学 ui资料 ui视频
在越来越拥挤的初创企业世界里，视觉设计的重要性往往可以与杀手级用户体验比肩。在许多情况下，尤其对于 Web 初创企业而言，这两者都是不可或缺的。前不久我们在《右脑革命：别学编程了，学艺术吧》中也曾发出过重视设计的呼吁。如何才能提高初创企业的设计能力呢?以下是 9 位创始人的体会。 1.找到自己的方式如果你是设计师，要想提高技能可以去设计博客和展示好设计的网站如D-lists或
三色旗算法 bylijinnan java 算法
import java.util.Arrays; /** 问题：假设有一条绳子，上面有红、白、蓝三种颜色的旗子，起初绳子上的旗子颜色并没有顺序，您希望将之分类，并排列为蓝、白、红的顺序，要如何移动次数才会最少，注意您只能在绳子上进行这个动作，而且一次只能调换两个旗子。网上的解法大多类似：在一条绳子上移动，在程式中也就意味只能使用一个阵列，而不使用其它的阵列来
警告:No configuration found for the specified action: \'s chiangfai configuration
1.index.jsp页面form标签未指定namespace属性。  <%@taglib prefix="s" uri="/struts-tags"%> ... <s:form action="submit" method="post"&g
redis -- hash_max_zipmap_entries设置过大有问题 chenchao051 redis hash
使用redis时为了使用hash追求更高的内存使用率，我们一般都用hash结构，并且有时候会把hash_max_zipmap_entries这个值设置的很大，很多资料也推荐设置到1000，默认设置为了512，但是这里有个坑 #define ZIPMAP_BIGLEN 254 #define ZIPMAP_END 255 /* Return th
select into outfile access deny问题 daizj mysql txt 导出数据到文件
本文转自：http://hatemysql.com/2010/06/29/select-into-outfile-access-deny%E9%97%AE%E9%A2%98/ 为应用建立了rnd的帐号，专门为他们查询线上数据库用的，当然，只有他们上了生产网络以后才能连上数据库，安全方面我们还是很注意的，呵呵。授权的语句如下： grant select on armory.* to rn
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
<?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('This example should only be run from a Web Brows
美国电影超短200句 dcj3sjt126com 电影
1. I see．我明白了。2. I quit! 我不干了!3. Let go! 放手!4. Me too．我也是。5. My god! 天哪!6. No way! 不行!7. Come on．来吧(赶快)8. Hold on．等一等。9. I agree。我同意。10. Not bad．还不错。11. Not yet．还没。12. See you．再见。13. Shut up!
Java访问远程服务 dyy_gusi httpclient webservice get post
随着webService的崛起，我们开始中会越来越多的使用到访问远程webService服务。当然对于不同的webService框架一般都有自己的client包供使用，但是如果使用webService框架自己的client包，那么必然需要在自己的代码中引入它的包，如果同时调运了多个不同框架的webService，那么就需要同时引入多个不同的clien
Maven的settings.xml配置 geeksun settings.xml
settings.xml是Maven的配置文件，下面解释一下其中的配置含义： settings.xml存在于两个地方： 1.安装的地方：$M2_HOME/conf/settings.xml 2.用户的目录：${user.home}/.m2/settings.xml 前者又被叫做全局配置，后者被称为用户配置。如果两者都存在，它们的内容将被合并，并且用户范围的settings.xml优先。
ubuntu的init与系统服务设置 hongtoushizi ubuntu
转载自： http://iysm.net/?p=178 init Init是位于/sbin/init的一个程序，它是在linux下，在系统启动过程中，初始化所有的设备驱动程序和数据结构等之后，由内核启动的一个用户级程序，并由此init程序进而完成系统的启动过程。 ubuntu与传统的linux略有不同，使用upstart完成系统的启动，但表面上仍维持init程序的形式。运行
跟我学Nginx+Lua开发目录贴 jinnianshilongnian nginx lua
使用Nginx+Lua开发近一年的时间，学习和实践了一些Nginx+Lua开发的架构，为了让更多人使用Nginx+Lua架构开发，利用春节期间总结了一份基本的学习教程，希望对大家有用。也欢迎谈探讨学习一些经验。目录第一章安装Nginx+Lua开发环境第二章 Nginx+Lua开发入门第三章 Redis/SSDB+Twemproxy安装与使用第四章 L
php位运算符注意事项 home198979 位运算 PHP &
$a = $b = $c = 0; $a & $b = 1; $b | $c = 1 问a,b,c最终为多少? 当看到这题时，我犯了一个低级错误，误以为位运算符会改变变量的值。所以得出结果是1 1 0 但是位运算符是不会改变变量的值的，例如： $a=1;$b=2; $a&$b; 这样a,b的值不会有任何改变
Linux shell数组建立和使用技巧 pda158 linux
1.数组定义　　[chengmo@centos5 ~]$ a=(1 2 3 4 5) 　　[chengmo@centos5 ~]$ echo $a 　　1 　　一对括号表示是数组，数组元素用“空格”符号分割开。　　 2.数组读取与赋值　　得到长度：　　[chengmo@centos5 ~]$ echo ${#a[@]} 　　5 　　用${#数组名[@或
hotspot源码(JDK7) ol_beta java HotSpot jvm
源码结构图，方便理解： ├─agent Serviceab
Oracle基本事务和ForAll执行批量DML练习 vipbooks oracle sql
基本事务的使用：从账户一的余额中转100到账户二的余额中去，如果账户二不存在或账户一中的余额不足100则整笔交易回滚 select * from account; -- 创建一张账户表 create table account( -- 账户ID id number(3) not null, -- 账户名称 nam