数据虫巢

数据与广告系列十七：广告的排序与CTR预估（附Github示例代码）

作者·黄崇远

『数据虫巢』

全文共8030字

题图ssyer.com

“ 万年长青的CTR预估。”

本文将涉及广告的排序相关业务，以及CTR预估的模型发展，最后将给出XGB+LR的经典组合解决方案。

本文的示例项目，基于Kaggle上的开源CTR预估数据集，见Github地址（记得给start哈）：

https://github.com/blogchong/data_and_advertisement

前言

在系列第16篇《数据与广告系列十六：广告与游戏》中，我们中断了机器学习广告应用场景的话题，今天我们继续第十五篇的节奏。

在之前我们了解了广告基础属性（性别）的预测，并通过他了解了用机器学习思路解决业务问题的基本流程；随后我们又通过广告中异常检测的话题，学习了CostSensitiveClassification以及Smote过采样等机器学习的知识；紧接着我们对基于标签组合的智能定向话题进行了了解，并结合场景了解和学习了FM算法；接着对于商业兴趣标签的建模构建进行了了解，顺带把XGboost这个神器给学习了。

今天，我们来了解广告领域中算法应用历史最悠久的CTR预估场景，一个广告系统可以没有商业兴趣标签，可以没有智能定向，甚至可以没有基础属性，但只要在效果广告领域范畴内，就少不了CTR的预估。

并且，CTR预估不止在广告领域，在推荐系统场景同样是核心的存在，大致逻辑上是很相似的，只不过场景业务上不一样，有时候优化的目标也有所差异。

CTR预估的作用

我们先来看下整个广告系统的大致架构图。

这张图在《数据与广告系列七：广告与推荐系统技术架构》出现过，不知道大家还是否记得，当时我们是按整体逻辑结构进行讲解的，这里我们不关心整体的逻辑架构，只关心CTR核心在哪个环节起作用。

如图所示，显然CTR预估阶段发生在召回之后，投放之前，很多广告系统会把预估跟排序看成一个阶段，其实无所谓，从底层逻辑的角度看，CTR预估模型是核心影响排序的因素，特别是一些相对初级的广告系统，其实最终核心影响排序的因素就是ctr+cpc出价，其他的诸如广告主质量评分，环境上下文评分都不怎么考虑。

当然，一些硬性策略性的控制还是会做的。比如基础的曝光频度控制，主题广告的适当加权，黑白名单的控制等等。

回到广告排序的问题，从一个User进来之后，需要根据一些过滤性策略，包括频控，黑白名单等条件，在剩余的广告池中，再根据广告的定向条件，进行召回匹配，拿到若干个待排序候选广告，形成一个广告列表。

然后广告列表走排序逻辑，最终根据排序的顺序，取第一个score最高的广告给当前user进行曝光。

在这里，我们假设只做最简单的排序计算考虑，其实就是CTR*CPC，而如果再乘以1000转换过来就是eCPM，即千次展示期望收益。

从这里我们可以看到，其实一个排序逻辑就是最终我们系统所期望的优化目标，即如果是CTR*CPC的计算方式，假设CTR预估又十分准确的情况下，这种机制其实是往平台收益目标去优化的。

道理逻辑很简单，假设抛出了其他因素情况下（定向符合，频控符合），哪个广告能给我带来更高的收益，我就把这次曝光机会给谁（广告）。

CPC每个广告给出来的都是明确的，价高价低一目了然，剩下来就是CTR预估的事了，预估的准确意味着你的平台收益更加的稳定，以及达到理论收益最大值。

所以，让CTR预估的更准就变成了广告系统最最最重要的事，毕竟都是真金白银呐。

但是，有个问题不知道大家有没有考虑过，我们一切以CTR*CPC为核心逻辑作为排序基准，来确定流量曝光给哪个广告，但对于广告主来说并不一定都是好事。

以前面几个我们认真了解过的业务领域比如《数据与广告系列八：广告与二类电商》《数据与广告系列九：本地化广告》《数据与广告系列十六：广告与游戏》来说，本地化广告看的表单填写，所以直接转化是有效表单，本质转化是最终到店的流量；对于二类电商来说，直接转化是有效填单，最终转化是卖了多少商品多少钱；对于游戏来说，直接转化是下载注册，最终转化是付费。

所以，不管怎么看Click都只是第一层的转化，对于平台来说，只要Click了，就收钱，收钱平台收益就高了，没毛病。但是对于广告主来说，Click了也屁用没有，实际上可怕的是部分领域里后端转化与前端转化（CTR）是成反比的，前端转化越高，后端转化越差，我的娘啊。

而对于广告系统来说，平衡多方利益(平台方收益，广告主转化，用户体验，详情参考《数据与广告系列五：广告生态的平衡与人群定向初探》)才能“长治久安”，所以当广告系统发展到了一定阶段，光看着ctr这块肉已经满足不了社会的和谐发展了。

这也就有oCPX动态优化广告的出现，这就是另外一个话题了，但核心打破的确实是传统的排序逻辑，并且可以预见的是，光一个ctr已经够麻烦了，再加入其他衡量因素，预测起来的难度就更大了。

今天，我们不叉题，继续回到CTR预估的话题，到后面总是会遇到oCPX相关场景的。

CTR预估模型的发展

早期说到广告系统是最早将数据和机器学习进行规模化价值挖掘的，就是因为CTR预估很早就将机器学习的一些模型应用于实际的问题解决中了。

所以，其实他由于历史足够久远，久远到广告系统发展了多少年，CTR预估模型就发展了多少年。

早在2010年以前，机器学习发展有限，由于研究的深度以及硬件的发展原因，深度学习相关的领域尚未展露出应有的价值，所以还是传统机器学习的天下。而由于CTR的场景，包括广告和推荐系统，都有一个相对共同的特征，那就是特征高度稀疏，然后由于线上服务，系统对于模型的预测性能要求较高，且工业化场景对于性能要求需要稳定。

能满足这三个条件的传统机器学习算法并不多，线性的LR，由于模型足够简单，可解释性强，且对于高维稀疏特征同样可以应对，性能良好。所以就变成了LR通万法，广告CTR用他，推荐系统排序点击预估用他，人群的Lookalike也用他。

老好用了。

但是LR对于特征的挖掘要求很高，需要我们很好的理解特征，能找到好的特征，且对特征处理的好，模型的表现就相对较好，这严重限制了发展。

2010年，随着FM算法论文的产生，以及紧随其后的FM家族（FFM，FNN等），解决了特征之间特征组合的问题，并且通过数学解法（因子分解）来寻求特征与目标之间的隐藏关系，打破了之前LR模型中严谨的特征工程的难题。

然后一些集成学习的路子，解决了单模型带来的稳定性以及过拟合欠拟合的问题，一些诸如随机森林，GBDT等集成类的模型解决方案应用于CTR预估的场景中。

2016年，谷歌一篇论文指出，可以通过GBDT（Gradient Boost Desision Tree）来解决LR模型特征组合的问题，即使用GBDT或者类似的集成树模型训练，然后拟合好了之后，取每棵树的叶子节点作为新的特征，加入到原始特征之中，再灌入到LR模型中，效果会比纯粹的LR好（谷歌说的，不是我说的）。

这种思路其实跟上上一篇《数据与广告系列十四：智能定向&基于FM的标签组合推荐思路》是一样的，或者说那个思路是借鉴于类似的思想，先用模型拟合好，然后再利用模型的中间结果作为后续阶段的输入。

总之，这种基于模型联级的方案据说很好使，哪怕是当前深度学习大行其道的今天，依然还有很多广告系统把他当成一个稳定的baseline在使用。

然后到了2016年左右（刚好也是深度学习强势的时期），出现了好几个针对性的算法（又是谷歌，谷歌果然是广告界的带头大哥，带节奏带的很溜），包括Wide&Deep Learning，FNN。

他们都有一个特点就是，传统模型与深度模型的联姻，强强结合。比如WDL利用传统的wide模型（比如LR）来学习目标与特征之间强关系，再利用Deep Learning部分（例如MLP）来加强拟合的泛化能力。

而FNN，则跟FM有直接的关系，利用FM模型将特征进行Embedding表示，然后用这个特征来替代原始特征，二阶段使用MLP（多层感知机）来做最终的拟合模型，借用的是GBDT+LR的思路。

总之，整个CTR模型的发展史就是机器学习与深度学习的发展史，毕竟广告业务是目前世界上互联网最大的变现手段之一（广告/游戏/电商），所以，有钱的地方就有动力，太有道理了。

CTR预估：XGBoost+LR实操

PS：微信上看嵌入的代码不是很好看，建议这里只看逻辑脉络，具体的代码上Github上看。

整体而言，有能力上深度学习模型的，多少都会试一下深度学习的一些模型，深度学习的模型理论上具有更强的泛化能力，但同样门技术槛以及调优的难度都更大，实操起来并不一定会比传统模型好。

传统模型发展了足够多的年份，大家摸底摸得也比较透彻了，所以作为基准来说更加的稳定，更具有可控性，所以“残留”的传统模型也依然在生效中，并没有绝迹于江湖（广告/推荐场景）。

今天这篇，我们的实操部分，依然不会把手伸到深度学习领域，我们来学习集成的树模型与LR的模型联级解决方案，而集成模型这块，我们并没有使用传统的GDBT，而是使用我们之前也接触过的XGBoost，不同的配方，同样的效果（可以用GBDT，也可以用LightBGM，或者XGBoost）。

对于数据集，我们使用Kaggle上知名的CTR预估数据集：

https://www.kaggle.com/c/avazu-ctr-prediction。

但是这份数据集太大了，大到了我们自己的小机器无法跑起来，所以我就取了另外一份数据：

https://www.kaggle.com/sulabh4/ctr-prediction-dataset。

据观察，这份数据是从avazu数据集上截取下来的子集，只有二三十兆（999999条记录），或者直接上avazu上随机抽样一部分下来演练也是一样的。

kaggle上的字段说明：

大部分字段通过命名就大概知道什么意思了，然后C系列的字段是数据公开方隐藏含义的类别字段，估计涉及到隐私问题，反正我们就当成正常的一个可用特征即可。

我们直接按click进行样本区分，分为正负样本，数据如下：

如果我们要做的严谨点，我们接下来做对应一些特征的转换，一些非int类型的转换为类别编码，或者更深入点做特征的分析。

整体数据情况如下(注意数据类型)：

将非数值类型的字段进行编码转换：

##接下来对特征进行处理，先将类别特征进行编码
#针对类型类的特征，先进行编码，编码之前构建字典
from sklearn import preprocessing
def label_encode(field,df):
    dic = []
    df_field = df[field]
    list_field = df_field.tolist()
    #构建field字典
    for i in list_field:
        if i not in dic:
            dic.append(i)
    label_field = preprocessing.LabelEncoder()
    label_field.fit(dic)
    df_field_enconde_tmp = label_field.transform(df_field)
    df_field_enconde = pd.DataFrame(df_field_enconde_tmp, index=df.index, columns=[(field+'_enconde')])
    return df_field_enconde
df_site_id_enconde = label_encode('site_id',df)
df_site_domain_enconde = label_encode('site_domain',df)
df_site_category_enconde = label_encode('site_category',df)
df_app_id_enconde = label_encode('app_id',df)
df_app_domain_enconde = label_encode('app_domain',df)
df_app_category_enconde = label_encode('app_category',df)
df_device_id_enconde = label_encode('device_id',df)
df_device_ip_enconde = label_encode('device_ip',df)
df_device_model_enconde = label_encode('device_model',df)

然后特征进行拼接，并作为中间结果保存下来：

pd_input = pd.concat([df[['click','banner_pos','device_type','device_conn_type'
                          ,'C1','C14','C15','C16','C17','C18','C19','C20','C21']]
                      ,df_site_id_enconde
                      ,df_site_domain_enconde
                      ,df_site_category_enconde
                      ,df_app_id_enconde
                      ,df_app_domain_enconde
                      ,df_app_category_enconde
                      ,df_device_id_enconde
                      ,df_device_ip_enconde
                      ,df_device_model_enconde], axis=1)
##处理过的数据保存下来
pd_input.to_csv('./out_put/encode_data.csv', header=True, index=True)

此时，我们第一阶段的特征简单处理结束了， 01_encode_data.ipynb文件的最终结果是拿到简单encode的数据。

接下来第二阶段进行数据集的划分，数据划分逻辑如下：

#对编码之后的数据进行分片
begin_time = time.time()
print(f'Begin Time : {time.strftime("%Y-%m-%d %H:%M:%S", time.localtime(begin_time))}')
#将数据分为train/validata/testdata三部分
df_1 = df[df['click'] == 1]
df_0 = df[df['click'] == 0]
df_1_test =df_1.sample(frac=0.3, random_state=100)
df_0_test =df_0.sample(frac=0.3, random_state=100)
df_1_other = df_1[~df_1.index.isin(df_1_test.index)]
df_0_other = df_0[~df_0.index.isin(df_0_test.index)]
df_1_vali = df_1_other.sample(frac=0.2, random_state=100)
df_0_vali = df_0_other.sample(frac=0.2, random_state=100)
df_1_train = df_1_other[~df_1_other.index.isin(df_1_vali.index)]
df_0_train = df_0_other[~df_0_other.index.isin(df_0_vali.index)]
#合并1/0
df_train = pd.concat([df_1_train,df_0_train], ignore_index=True)
df_vali = pd.concat([df_1_vali,df_0_vali], ignore_index=True)
df_test = pd.concat([df_1_test,df_0_test], ignore_index=True)
print(f'--split data : {time.strftime("%Y-%m-%d %H:%M:%S", time.localtime(time.time()))}')
nums_train = df_train['click'].count()
nums_vali = df_vali['click'].count()
nums_test = df_test['click'].count()
print(f'--split rate train VS vali VS test: {nums_train}:{nums_vali}:{nums_test}')
df_train.to_csv('./out_put/encode_data_train.csv')
df_vali.to_csv('./out_put/encode_data_vali.csv')
df_test.to_csv('./out_put/encode_data_test.csv')
end_time = time.time()
print(f'End Time : {time.strftime("%Y-%m-%d %H:%M:%S", time.localtime(end_time))}')

数据划分比例：

--split rate train VS vali VS test: 559999:140000:300000

第三阶段，进行xgboost的训练，并保存叶子节点的onehot特征，如下为进行xgboost的拟合：

##进行xgboost拟合
begin_time = time.time()
print(f'Begin Time : {time.strftime("%Y-%m-%d %H:%M:%S", time.localtime(begin_time))}')
##受限于机器的资源，这里就不做gridsearch调参了，直接凑合着来(按最小资源消耗来设置参数)
model = XGBClassifier(learning_rate=0.1
                     ,n_estimators=10
                     ,max_depth=3
                     ,scale_pos_weight=1
                     ,min_child_weight=1
                     ,gamma=0
                     ,subsample=1
                     ,colsample_bylevel=1
                     ,objective='binary:logistic'
                     ,n_jobs=4
                     ,seed=100)
eval_set = [(x_vali, y_vali)]
model.fit(x_train, y_train, eval_metric="auc" , eval_set=eval_set, early_stopping_rounds=10)
end_time = time.time()
print(f'End Time : {time.strftime("%Y-%m-%d %H:%M:%S", time.localtime(end_time))}')

这里受限于我那小小的阿里云主机，所以只能按树最少，层级最小的方式去跑了，不然跑不动，穷。

结果打印：

Begin Time : 2020-02-01 19:19:05
[0] validation_0-auc:0.663951
Will train until validation_0-auc hasn't improved in 10 rounds.
[1] validation_0-auc:0.669895
[2] validation_0-auc:0.670909
[3] validation_0-auc:0.671622
[4] validation_0-auc:0.673234
[5] validation_0-auc:0.675165
[6] validation_0-auc:0.675224
[7] validation_0-auc:0.682689
[8] validation_0-auc:0.684437
[9] validation_0-auc:0.687103
End Time : 2020-02-01 19:19:11

并不能算一个非常好的效果，这个结果是非常丢脸的，随便加大树的数量和调大树层级，auc轻松上0.75，为了能让后面的onehot叶子组合特征跑起来可谓是费尽心机啊，这里不管了，假设这个model就已经是最优xgboost的拟合模型了。

对叶子组合特征进行编码，并且分别保留onehot编码特征和与原始特征拼接之后的df：

#我们来拿到xgb的叶子节点的特征
##进行xgboost拟合
begin_time = time.time()
print(f'Begin Time : {time.strftime("%Y-%m-%d %H:%M:%S", time.localtime(begin_time))}')
##apply函数返回的是叶子索引
x_train_leaves = model.apply(x_train).astype(np.int32)
x_test_leaves = model.apply(x_test).astype(np.int32)
#使用nunpy的concatenate来拼接数组，并生成全局的onehot，单一使用train的可能会漏掉编码，test验证的时候出问题
x_leaves = np.concatenate((x_train_leaves,x_test_leaves), axis=0)
print(f'Transform xgb leaves shape: {x_leaves.shape}')
xgb_onehotcoder = OneHotEncoder()
xgb_onehotcoder.fit(x_leaves)
x_train_lr = xgb_onehotcoder.transform(x_train_leaves).toarray()
x_test_lr = xgb_onehotcoder.transform(x_test_leaves).toarray()
print(f'Transform xgb x_train_lr shape: {x_train_lr.shape}')
print(f'Transform xgb x_test_lr shape: {x_test_lr.shape}')
##进行one特征与原始特征的拼接
x_train_lr2 = np.hstack((x_train_lr, x_train.values))
x_test_lr2 = np.hstack((x_test_lr, x_test.values))
print(f'Transform xgb x_train_lr2 shape: {x_train_lr2.shape}')
print(f'Transform xgb x_test_lr2 shape: {x_test_lr2.shape}')
end_time = time.time()
print(f'End Time : {time.strftime("%Y-%m-%d %H:%M:%S", time.localtime(end_time))}')

我们可以看到特征情况如下：

Transform xgb leaves shape: (859999, 10)
Transform xgb x_train_lr shape: (559999, 80)
Transform xgb x_test_lr shape: (300000, 80)
Transform xgb x_train_lr2 shape: (559999, 101)
Transform xgb x_test_lr2 shape: (300000, 101)

这意味着，我们通过xgb的组合特征，额外增加了80个特征，我们继续分别将这些特征灌入到LR中进行train：

###灌入到LR中
begin_time = time.time()
print(f'Begin Time : {time.strftime("%Y-%m-%d %H:%M:%S", time.localtime(begin_time))}')
lr_model = LogisticRegression()
lr_model.fit(x_train_lr, y_train)
lr_model2 = LogisticRegression()
lr_model2.fit(x_train_lr2, y_train)
joblib.dump(lr_model, './model/lr_model.pkl')
joblib.dump(lr_model2, './model/lr_model2.pkl')
end_time = time.time()
print(f'End Time : {time.strftime("%Y-%m-%d %H:%M:%S", time.localtime(end_time))}')

对比三组效果，分别是单独的XGB模型，XGB的叶子特征独立LR模型，特征拼接的LR模型，先构建效果函数：

##效果输出函数
def func_print_score(x_data,y_data,data_type,model_x):
    y_pred = model_x.predict(x_data)


    print(f'==============({data_type})===================')
    confusion = metrics.confusion_matrix(y_data, y_pred)
    print(confusion)


    print('------------------------')
    auc = metrics.roc_auc_score(y_data,y_pred)
    print(f'AUC: {auc}')


    print('------------------------')
    accuracy = metrics.accuracy_score(y_data,y_pred)
    print(f'Accuracy: {accuracy}')


    print('------------------------')
    aupr = metrics.average_precision_score(y_data, y_pred)
    print(f'AUPR: {aupr}')


    print('------------------------')
    report = metrics.classification_report(y_data, y_pred)
    print(report)


    print('=============================================')

分别输出混淆矩阵，AUC，Accuracy，AUPR(AUC有效面积，衡量不均衡分类时非常好用)，以及分类报告，输出结果如下：

==============(testdata-xgb)===================
[[248629 3305]
[ 44416 3650]]
------------------------
AUC: 0.5314093688885991
------------------------
Accuracy: 0.84093
------------------------
AUPR: 0.18790537837217178
------------------------
precision recall f1-score support
0 0.85 0.99 0.91 251934
1 0.52 0.08 0.13 48066
avg / total 0.80 0.84 0.79 300000
=============================================
==============(testdata-xgb-lr)===================
[[247447 4487]
[ 43073 4993]]
------------------------
AUC: 0.5430338904724129
------------------------
Accuracy: 0.8414666666666667
------------------------
AUPR: 0.19828793875544898
------------------------
precision recall f1-score support
0 0.85 0.98 0.91 251934
1 0.53 0.10 0.17 48066
avg / total 0.80 0.84 0.79 300000
=============================================
==============(testdata-xgb-lr2)===================
[[251376 558]
[ 47867 199]]
------------------------
AUC: 0.5009626374208841
------------------------
Accuracy: 0.8385833333333333
------------------------
AUPR: 0.16064502596303487
------------------------
precision recall f1-score support
0 0.84 1.00 0.91 251934
1 0.26 0.00 0.01 48066
avg / total 0.75 0.84 0.77 300000
=============================================

结果数据惨不忍睹，我们将PR曲线打印出来，代码如下：

##测试数据的PR曲线
probas_xgb = model.predict_proba(x_test)
probas_lr = lr_model.predict_proba(x_test_lr)
probas_lr2 = lr_model2.predict_proba(x_test_lr2)
##precision_recall_curve函数
precision_xgb,recall_xgb, thresholds_xgb = metrics.precision_recall_curve(y_test, probas_xgb[:,1])
precision_lr,recall_lr, thresholds_lr = metrics.precision_recall_curve(y_test, probas_lr[:,1])
precision_lr2,recall_lr2, thresholds_lr2 = metrics.precision_recall_curve(y_test, probas_lr2[:,1])
plt.figure(figsize=(8,6))
plt.plot(recall_xgb, precision_xgb, label = 'xgb', alpha = 0.8, color = 'red')
plt.plot(recall_lr, precision_lr, label = 'xgg-lr', alpha = 0.8, color = 'blue')
plt.plot(recall_lr2, precision_lr2, label = 'xgb-lr2', alpha = 0.8, color = 'green')
plt.plot([0,1],[0,1],'k--')
#图例打印
plt.legend(bbox_to_anchor=(1.05, 0), loc = 3, borderaxespad = 1)
plt.xlim([-0.05, 1.05])
plt.ylim([-0.05, 1.05])
plt.xlabel('Recall Rate')
plt.ylabel('Precision Rate')
plt.title('PR Curve')

最后的PR曲线，更惨不忍睹，曲线太秀了，辣眼睛：

从PR曲线的角度看，还不如纯粹的XGB模型效果好，但这个曲线并不能代表任何东西，因为我们所以的流程都是奔着能跑通，以及流程走通为主要目的，如果大家看github上的源码，会发现存在大量的临时gc回收等动作，没办法，我的阿里云试验机子内存以及核太小，只能先把流程跑通再说。

以上所有示例代码，以及项目，代码都放在了Github上（记得给start哈）：

https://github.com/blogchong/data_and_advertisement

总之，大概的流程逻辑如上了。

总结

CTR预估不管是过去，还是未来都是重中之中，这里给出的示例是XGB+LR的组合方案，也算业界一个典型的Baseline方案，熟悉基准方案对于理解CTR预估还是有一定帮助的。

况且对于一些初入广告领域的朋友来说，也是一个不错的练手项目。

而且这里是CTR预估，其实底层核心都是对于目标的拟合，底层方案是可以互通的，比如后面可能涉及到oCPX，以及其他类似的领域。绕来绕去，最后发现了其实业务场景映射下来，很多底层技术都是互通的，而上层的业务更多关注于样本以及特征的构建。

先不说这么多，下个阶段，我们可能将脱离常规的机器学习技术方案了，是的，题目都已经想好了，就叫《广告的召回与LookAlike，万物皆可Embedding》。

参考文献

【01】看了很多资料，大过年的，实在没有精力整理了，改天补上。

文章都看完了，还不点个赞来个赏~

OTHER相关系列文章（数据与广告系列）

《数据与广告系列十一：从性别预测的CASE开始手撕机器学习代码》

《数据与广告系列十二：接上一篇，见习算法工程师教程》

《数据与广告系列十三：广告中的异常预测问题》

《数据与广告系列十四：智能定向&基于FM的标签组合推荐思路》

《数据与广告系列十五：商业兴趣标签建模&XGboost调优实战》

你可能感兴趣的:(数据与广告系列十七：广告的排序与CTR预估（附Github示例代码）)

图神经网络实战（9）——GraphSAGE详解与实现盼小辉丶图神经网络从入门到项目实战图神经网络 GNN pytorch
图神经网络实战（9）——GraphSAGE详解与实现0.前言1.GraphSAGE原理1.1邻居采样1.2聚合2.构建GraphSAGE模型执行节点分类2.1数据集分析2.2构建GraphSAGE模型3.PinSAGE小结系列链接0.前言GraphSAGE是专为处理大规模图而设计的图神经网络(GraphNeuralNetworks,GNN)架构。在科技行业，可扩展性是推动系统增长的关键驱动力。因此
mac homebrew安装失败 jojo付啾啾 git homebrew homebrew安装失败
machomebrew安装失败参考：https://www.zhihu.com/question/35928898亲测有效：如果是brew安装的网络问题，提供一个解决办法：原因是目前GitHub的gist访问不了，所以获取不到安装的脚本文件。我把该脚本文件上传到了giteegist托管平台，执行下面的脚本就可以安装了。/usr/bin/ruby-e"$(curl-fsSLhttps://gitee
合并两个有序数组（Leetcode）每天瞎忙的农民工 Leetcode 算法 leetcode 算法
解题思路：三个指针：$p1:指向nums1中的最后一个非零元素。$p2:指向nums2的最后一个元素。$p:指向nums1的最后一位，用于存储合并后的元素。从后往前填充：比较nums1[$p1]和nums2[$p2]，较大的放入nums1[$p]，指针向前移动。处理剩余元素：如果nums2中还有剩余的元素（p2>=0），直接拷贝到nums1。无需处理nums1剩余的元素：因为nums1的前半部分已
这是我的第一篇博客流川飞 c++
结束摆烂，看看自己的极限在哪里，两年后回来看自己个人介绍：我是一个大一下学期的男生，就读人工智能专业，性格活泼爱笑[face]emoji:008.png[/face]编程目标：能拿到一份满意的offer，能成为很厉害的程序员如何学习：利用晚上的水课和没课的时间学习编程，到一定水平后参加蓝桥杯类的比赛!我打算每周在编程上花费的时间：35h+我最想进入的一家IT公司：马斯克的公司!
【十大排序算法】（一）冒泡排序算法（优化） 2401_84408404 程序员算法排序算法数据结构
intborder=len-1,lastIndex=0;for(inti=0;iarr[j+1]){inttemp=arr[j];arr[j]=arr[j+1];arr[j+1]=temp;lastIndex=j;isSorted=false;}}border=lastIndex;if(isSorted){break;}}}但是，优化第二版仍不是最优方案，上面的两种优化方案只是减少每轮的操作次数，
链表：struct node *next；为什么用指针，为什么要用自身结构体类型？（通俗易懂） WZMeiei 数据结构链表数据结构
1.structnode*next;是什么？结构体的成员：这是一个结构体内部的指针成员，名为next。类型：structnode*表示这个指针指向的类型是structnode（也就是它自己所在的这个结构体类型）。2.为什么要在结构体里定义一个指向自己的指针？链表的核心逻辑：链表中的每个节点（结构体）需要知道“下一个节点是谁”。例子：想象火车车厢的连接方式：每个车厢（节点）有两个部分：数据部分（da
基于 langchain+ollama 创建私有化知识库大语言模型 langchain 知识图谱 LLM 人工智能 llama RAG 知识库
本文实现了基于langchain的本地知识库的基本功能，可离线访问。主要使用了Langchain，ChromaDbOllama。概念介绍什么是RAGRAG是retrieval-augmented-generation的缩写，直译中文的意思是检索增强生成，可以简单理解能让训练好的大模型LLM可以结合外部数据，可以补充或者修正大模型返回的答案，提高答案的准确性。LLM有哪些痛点数据陈旧，一旦训练完成无
STM32MP157A-DK1开发板评估：官方OpenSTLinux烧录 2301_79326616 stm32 单片机嵌入式硬件
介绍：在本篇文章中，我们将详细介绍如何将官方OpenSTLinux操作系统烧录到STM32MP157A-DK1开发板上。我们将逐步说明所需的步骤，并提供相应的源代码以供参考。STM32MP157A-DK1开发板是一款基于STMicroelectronics的STM32MP1系列微处理器的开发板，该系列微处理器结合了Cortex-A7和Cortex-M4内核。OpenSTLinux是STMicroe
Maven依赖问题排查坎坷er Maven maven java
前言：大家好，我是小熊，25届毕业生，目前在一家满意的公司实习。本篇文章为Maven依赖问题排查，刚开始应该是不全面的，但文章会一直更新的。个人简介：大家好，我是小熊，一个想吃鱼的男人目前状况：25届毕业生，在一家满意的公司实习欢迎大家：这里是CSDN，我用来快速回顾知识准备面试的地方，欢迎来到我的博客背景刚进公司实习，使用svn(类似git代码管理工具）拉取公司项目的时候，遇到找不到依赖的问题，
【自学笔记】Oracle基础知识点总览-持续更新 Long_poem 笔记 oracle 数据库
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录Oracle数据库基础知识点总览1.数据库安装与配置2.SQL基础3.PL/SQL基础4.数据库管理5.高级主题总结Oracle数据库基础知识点总览1.数据库安装与配置安装Oracle数据库：下载Oracle安装包，按照向导进行安装。配置监听器：使用netca工具配置监听器，确保客户端可以连接到数据库。创建数据库：使用dbca
如何高效修改多个节点的 config.ini 文件纸鸢666 网络 linux 服务器联盟链区块链
简介在区块链网络中，节点的配置文件（如config.ini）通常定义了节点的运行参数。当你有多个节点时，如果需要修改这些配置文件中的某些设置，手动修改每个节点的配置文件显然是繁琐且易出错的。那么，有没有更简便的方式来完成这一任务呢？答案是肯定的！下面我将介绍几种方法，帮助你高效地修改多个节点的config.ini文件。方法1：使用脚本自动化操作如果你熟悉命令行和脚本语言，可以编写一个简单的脚本来自
# Unity引擎性能优化全景图：从架构级到指令级的技术演进晴空了无痕性能优化 unity 性能优化架构
一、渲染流水线深度重构（核心战场）1.1渲染线程瓶颈突破DrawCall合并阈值实验使用UnityProfiler进行帧分析时发现，DrawCall数量超过1500后移动端FPS呈现线性下降趋势。建议采用动态批处理策略：//动态对象批处理条件判断if(currentBatchSize(version.BundlePath);return;}}}}对象池实时监控开发Unity编辑器扩展实现对象池状态
软件架构设计：架构风格 Chief395 软考：架构师架构
一、架构风格概述定义架构风格是对软件系统整体结构和组织方式的抽象描述，提供了一套通用的设计原则和模式。作用提高系统的可维护性、可扩展性和可复用性。帮助开发团队在设计和实现过程中保持一致性和规范性。常见架构风格分层架构、MVC架构、微服务架构、事件驱动架构、管道-过滤器架构等。二、常见架构风格详解1.分层架构（LayeredArchitecture）特点：将系统划分为多个层次，每层只与相邻层交互。典
DeepSeek怎么用，DeepSeek使用指南最全合集（保姆级教程） xiecoding.cn deepseek deepseek使用指南 deepseek怎么用 deepseek免费教学 deepseek资料合集
DeepSeek是一款由国内顶尖团队开发的人工智能大模型，旨在为用户提供高效、智能的问答和知识服务。作为国产AI模型的代表，DeepSeek不仅在自然语言处理（NLP）领域表现出色，还在多个应用场景中展现了强大的能力。与ChatGPT等国际知名模型相比，DeepSeek在中文语境下的表现尤为突出，能够更好地理解中文的复杂语义和文化背景。DeepSeek使用资源下载为了方便大家更好地学习和使用Dee
5大升级 vs 0顾虑：Nginx Plus新特性解读，企业级功能增强全揭秘墨瑾轩一起学学Nginx【一】nginx github git
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣在当今这个瞬息万变的互联网世界里，NginxPlus就像是一个不断进化的超级英雄，每次更新都带来了新的能力和更强大的力量。今天，我们将深入探讨NginxPlus的最新特性，看看它如何为企业提供更加稳健、高效的服务。准备好迎接这场技术盛宴了吗？让我们一起揭开Ng
线上服务器的文件下载到本地Windows电脑 youhebuke225 Linux 服务器 windows 运维
将线上服务器的文件下载到本地Windows电脑，可以根据具体情况选择以下方法：方法一：使用远程桌面连接（推荐）开启远程桌面功能确保服务器已启用远程桌面（RDP）服务，默认端口为3389。检查服务器防火墙或安全组规则，允许RDP端口的入站连接。连接服务器本地电脑按Win+R，输入mstsc打开远程桌面连接。输入服务器IP地址、用户名和密码，点击“连接”。映射本地磁盘在远程桌面连接窗口中，点击“显示选
Python 使用 Tkinter库设置 tkinter ttk 框架的背景颜色小蜜蜂vs码农 python pycharm
Tkinter设置tkinterttk框架的背景颜色在本文中，我们将介绍如何使用Tkinter在tkinterttk框架中设置背景颜色。Tkinter是Python中常用的GUI工具包，ttk则是Tkinter中的一个模块，提供了一套更加现代化的控件。Tkinter简介Tkinter是Python中内置的GUI工具包，提供了一套方便使用的用户界面组件。它基于Tcl/Tk，允许创建漂亮而交互性强的应
斗罗大陆：武魂觉醒最新可用礼包兑换码大全安卓君 ux
斗罗大陆：武魂觉醒(众神版)是正版小说授权的手游力作，商城充值享0.1折特惠，签到即赠魂师豪礼，VIP轻松白嫖，福利满满不容错过！新玩家入门别忘了领礼包兑换码！兑换码！兑换码！重要提示说三遍！以下安卓君已备好斗罗大陆：武魂觉醒最新兑换码大全，省得你四处寻找，速来领取享用！斗罗大陆：武魂觉醒最新可用礼包兑换码大全1独家礼包2礼包内容：钻石*100、猎魂手令*1、金魂币*300000礼包码：ZVJNQ
CentOS Stream 8 安装Oracle 19C (静默模式) 3301_ centos strream linux Oracle 19C oracle centos 数据库
CentOSStream8安装Oracle19C(静默模式)1.提前准备工作说明:必须严格遵守用户规则去创建目录，否则会导致缺少目录权限进而影响安装！安装以下软件包最新版本(注意：如果打算使用32位客户端应用程序访问64位服务器，则还必须安装（如果可用）此表中列出的包的最新32位版本。)[root@Test2CentOSStream8~]#dnfinstallbcbinutilselfutils-
函数重载(overload) 默认参数 schedule___ cpp
函数重载规则函数名相同参数个数、类型、顺序不同注意返回值类型与函数重载无关调用函数时，实参的隐式类型转换可能会产生二义性。本质采用了namemangling或者叫namedecoration的技术c++编译器会对符号名（函数名）进行改变、修饰不同编译器（MSVC,g++）有不同的生成规则通过ida打开[vs_release_禁止优化]可以看到默认参数规则默认参数只能按照从右到左的顺序函数同时有声明
extern “C“ schedule___ cpp
extern“c”被extern"c"修饰的代码会按照c语言的方式编译如果函数同时有声明和实现，要让函数声明被extern"C"修饰，函数实现可以不被修饰extern"C"voidfun(){cout<<"fun()"<
Datawhale 数学建模导论国赛B学习笔记瓜瓜蛋数学建模学习笔记
贪心算法贪心算法(Greedyalgorithm)（贪婪算法）基本思想：多机调度问题是一个多项式复杂程度的非确定性问题(Non-deterministicPolynomial)，具有一定的复杂程度，当前没有有效的解决方法。相较于其它算法，贪心算法求解不从整体最优上加以考虑,。而是寻求某种意义上的局部最优解，从而做出当下最好的选择。因此，在求解并行机调度问题上，贪心算法容易获得近似最优解的答案，更有
一个简单的学生信息管理系统的Python代码，使用Tkinter GUI库和MySQL数据库。 Usinian python 数据库 mysql 前端后端
以下是一个简单的学生信息管理系统的Python代码，使用TkinterGUI库和MySQL数据库。这个系统允许您添加，更新，删除和查看学生信息。在开始之前，请确保你已安装必要的库，包括pymysql和tkinter。如果你还没有安装它们，您可以在终端中运行以下命令进行安装：pipinstallpymysqlsudoapt-getinstallpython-tk接下来是代码：pythonfromtk
C 语言中的数组与指针：深入剖析与实践应用 Kurbaneli c语言算法
一、引言在C语言的学习旅程中，数组与指针是两个极为重要且强大的概念。它们不仅是C语言高效操作数据的基础，也是C语言能够广泛应用于系统编程、嵌入式开发等领域的关键因素之一。深入理解并熟练掌握数组与指针的使用，对于编写高质量、高性能的C语言程序至关重要。本文将详细介绍C语言中数组与指针的相关知识，并通过丰富的示例代码进行说明。二、数组的基本概念与使用数组的定义：数组是一种构造数据类型，它可以存储多个相
Docker部署常见应用之Oracle数据库 weixin_44585288 Docker 数据库 docker oracle
文章目录安装部署参考文章安装部署使用Docker安装Oracle数据库是一个相对简便的过程，可以避免在本地环境中直接安装Oracle数据库的复杂性。安装Docker环境：确保你的系统上已经安装了Docker，并且Docker服务正在运行。具体的安装方法可以根据你的操作系统查找相应的Docker安装指南。Centos安装可以参考Docker和Docker-Compose安装。获取Oracle镜像：使
聪明办法学python第4次笔记 weixin_44811994 笔记
目录变量Variables新值的数据类型不必与旧值相同变量是一个标签变量命名规则：元组的解包函数Functions`header`用于定义函数的**名称**和**参数**`body`包含函数执行的语句（`statement`）我们使用**函数名**来调用函数函数可以有任意多个参数，也可以一个都没有参数的数量要匹配语句与表达式StatementsandExpressions表达式定义：Anexpre
字节跳动后端日常实习一二+hr面面经（已OC）桜翊字节跳动面试字节跳动
北航计算机大三，这学期打算找个实习，看了一圈大厂发现字节实习生给的薪资最高，福利也挺不错的，就通过内推投了字节的后端实习，很快就收到了面试邀约，从一面到收到offer一共6天，以下是本次面试的面经（部分题目可能记不太清了）一面：上来先是自我介绍，大概介绍了一下学校年级所学课程和做过的项目，然后开始提问面试官先是让我从做过的项目里挑一个来讲，我就挑了之前小学期的一个Spring项目“用户登录状态如何
jdbc连接数据库步骤oracle,jdbc连接oracle数据库的步骤 weixin_39726044
使用E-MapReduce集群sqoop组件同步云外Oracle数据库数据到集群hiveE-MapReduce集群sqoop组件可以同步数据库的数据到集群里，不同的数据库源网络配置有一些差异网络配置。最常用的场景是从rdsmysql同步数据，最近也有用户询问如何同步云外专有Oracle数据库数据到hive。云外专有数据库需要集群所有节点通过公网访问，要创建VPC网络，使用VPC网络...文章鸿初2
字节跳动后端开发一面面经我喝AD钙面经 java 后端面试
2023-08-07字节跳动后端开发一面1自我介绍：学历背景-实习/项目-校园经历-获奖2介绍一下java全栈实习：业务-解决方案-工作-成果-反思3xx功能怎么做的：业务-表设计-前端原型-功能-前后端接口-后端实现4订单管理货物管理怎么做的：xxx5数据存储用的啥：mysql给主键常用字段加索引6货物限量怎么处理：java加锁（锁的比较与选择）/数据库事务（考虑了吗，为什么没用）7单体应用，某
oracle生成ddl语句,oracle导出DDL 杰克小号 oracle生成ddl语句
dbms_metadata.get_ddl[@more@]dbms_metadata.get_ddl1.得到一个表或索引的ddl语句SELECTDBMS_METADATA.GET_DDL('TABLE','DEPT','SCOTT')FROMDUAL;selectdbms_metadata.get_ddl('INDEX','PK_DEPT','SCOTT')fromdual;2.得到一个用户下的所
java封装继承多态等麦田的设计者 java eclipse jvm c encapsulatopn
最近一段时间看了很多的视频却忘记总结了，现在只能想到什么写什么了，希望能起到一个回忆巩固的作用。 1、final关键字译为：最终的 &
F5与集群的区别 bijian1013 weblogic 集群 F5
http请求配置不是通过集群，而是F5；集群是weblogic容器的，如果是ejb接口是通过集群。 F5同集群的差别，主要还是会话复制的问题，F5一把是分发http请求用的，因为http都是无状态的服务，无需关注会话问题，类似
LeetCode[Math] - #7 Reverse Integer Cwind java 题解 Math LeetCode Algorithm
原题链接：#7 Reverse Integer 要求：按位反转输入的数字例1：输入 x = 123, 返回 321 例2：输入 x = -123, 返回 -321 难度：简单分析：对于一般情况，首先保存输入数字的符号，然后每次取输入的末位（x%10）作为输出的高位（result = result*10 + x%10）即可。但
BufferedOutputStream 周凡杨
首先说一下这个大批量，是指有上千万的数据量。例子：有一张短信历史表，其数据有上千万条数据，要进行数据备份到文本文件，就是执行如下SQL然后将结果集写入到文件中！ select t.msisd
linux下模拟按键输入和鼠标被触发 linux
查看/dev/input/eventX是什么类型的事件， cat /proc/bus/input/devices 设备有着自己特殊的按键键码，我需要将一些标准的按键，比如0－9，X－Z等模拟成标准按键，比如KEY_0,KEY-Z等，所以需要用到按键模拟，具体方法就是操作/dev/input/event1文件，向它写入个input_event结构体就可以模拟按键的输入了。 linux/in
ContentProvider初体验肆无忌惮_ ContentProvider
ContentProvider在安卓开发中非常重要。与Activity，Service，BroadcastReceiver并称安卓组件四大天王。在android中的作用是用来对外共享数据。因为安卓程序的数据库文件存放在data/data/packagename里面，这里面的文件默认都是私有的，别的程序无法访问。如果QQ游戏想访问手机QQ的帐号信息一键登录，那么就需要使用内容提供者COnte
关于Spring MVC项目（maven）中通过fileupload上传文件 843977358 mybatis spring mvc 修改头像上传文件 upload
Spring MVC 中通过fileupload上传文件，其中项目使用maven管理。 1.上传文件首先需要的是导入相关支持jar包：commons-fileupload.jar,commons-io.jar 因为我是用的maven管理项目，所以要在pom文件中配置（每个人的jar包位置根据实际情况定） <!-- 文件上传 start by zhangyd-c --&g
使用svnkit api，纯java操作svn，实现svn提交，更新等操作 aigo svnkit
原文：http://blog.csdn.net/hardwin/article/details/7963318 import java.io.File; import org.apache.log4j.Logger; import org.tmatesoft.svn.core.SVNCommitInfo; import org.tmateso
对比浏览器，casperjs，httpclient的Header信息 alleni123 爬虫 crawler header
@Override protected void doGet(HttpServletRequest req, HttpServletResponse res) throws ServletException, IOException { String type=req.getParameter("type"); Enumeration es=re
java.io操作 DataInputStream和DataOutputStream基本数据流百合不是茶 java 流
1，java中如果不保存整个对象，只保存类中的属性，那么我们可以使用本篇文章中的方法，如果要保存整个对象先将类实例化后面的文章将详细写到 2，DataInputStream 是java.io包中一个数据输入流允许应用程序以与机器无关方式从底层输入流中读取基本 Java 数据类型。应用程序可以使用数据输出流写入稍后由数据输入流读取的数据。
车辆保险理赔案例 bijian1013 车险
理赔案例：一货运车，运输公司为车辆购买了机动车商业险和交强险，也买了安全生产责任险，运输一车烟花爆竹，在行驶途中发生爆炸，出现车毁、货损、司机亡、炸死一路人、炸毁一间民宅等惨剧，针对这几种情况，该如何赔付。赔付建议和方案：客户所买交强险在这里不起作用，因为交强险的赔付前提是：“机动车发生道路交通意外事故”；如果是交通意外事故引发的爆炸，则优先适用交强险条款进行赔付，不足的部分由商业
学习Spring必学的Java基础知识(5)—注解 bijian1013 java spring
文章来源：http://www.iteye.com/topic/1123823，整理在我的博客有两个目的：一个是原文确实很不错，通俗易懂，督促自已将博主的这一系列关于Spring文章都学完；另一个原因是为免原文被博主删除，在此记录，方便以后查找阅读。有必要对
【Struts2一】Struts2 Hello World bit1129 Hello world
Struts2 Hello World应用的基本步骤创建Struts2的Hello World应用，包括如下几步： 1.配置web.xml 2.创建Action 3.创建struts.xml，配置Action 4.启动web server，通过浏览器访问配置web.xml <?xml version="1.0" encoding="
【Avro二】Avro RPC框架 bit1129 rpc
1. Avro RPC简介 1.1. RPC RPC逻辑上分为二层，一是传输层，负责网络通信；二是协议层，将数据按照一定协议格式打包和解包从序列化方式来看，Apache Thrift 和Google的Protocol Buffers和Avro应该是属于同一个级别的框架，都能跨语言，性能优秀，数据精简，但是Avro的动态模式（不用生成代码，而且性能很好）这个特点让人非常喜欢，比较适合R
lua　set get cookie ronin47 lua cookie
lua: local access_token = ngx.var.cookie_SGAccessToken if access_token then ngx.header["Set-Cookie"] = "SGAccessToken="..access_token.."; path=/;Max-Age=3000" end
java-打印不大于N的质数 bylijinnan java
public class PrimeNumber { /** * 寻找不大于N的质数 */ public static void main(String[] args) { int n=100; PrimeNumber pn=new PrimeNumber(); pn.printPrimeNumber(n); System.out.print
Spring源码学习-PropertyPlaceholderHelper bylijinnan java spring
今天在看Spring 3.0.0.RELEASE的源码，发现PropertyPlaceholderHelper的一个bug 当时觉得奇怪，上网一搜，果然是个bug，不过早就有人发现了，且已经修复：详见： http://forum.spring.io/forum/spring-projects/container/88107-propertyplaceholderhelper-bug
[逻辑与拓扑]布尔逻辑与拓扑结构的结合会产生什么? comsci 拓扑
如果我们已经在一个工作流的节点中嵌入了可以进行逻辑推理的代码,那么成百上千个这样的节点如果组成一个拓扑网络,而这个网络是可以自动遍历的,非线性的拓扑计算模型和节点内部的布尔逻辑处理的结合,会产生什么样的结果呢? 是否可以形成一种新的模糊语言识别和处理模型呢? 大家有兴趣可以试试,用软件搞这些有个好处,就是花钱比较少,就算不成
ITEYE 都换百度推广了 cuisuqiang Google AdSense 百度推广广告外快
以前ITEYE的广告都是谷歌的Google AdSense，现在都换成百度推广了。为什么个人博客设置里面还是Google AdSense呢？都知道Google AdSense不好申请，这在ITEYE上也不是讨论了一两天了，强烈建议ITEYE换掉Google AdSense。至少，用一个好申请的吧。什么时候能从ITEYE上来点外快，哪怕少点
新浪微博技术架构分析 dalan_123 新浪微博架构
新浪微博在短短一年时间内从零发展到五千万用户，我们的基层架构也发展了几个版本。第一版就是是非常快的，我们可以非常快的实现我们的模块。我们看一下技术特点，微博这个产品从架构上来分析，它需要解决的是发表和订阅的问题。我们第一版采用的是推的消息模式，假如说我们一个明星用户他有10万个粉丝，那就是说用户发表一条微博的时候，我们把这个微博消息攒成10万份，这样就是很简单了，第一版的架构实际上就是这两行字。第
玩转ARP攻击 dcj3sjt126com r
我写这片文章只是想让你明白深刻理解某一协议的好处。高手免看。如果有人利用这片文章所做的一切事情，盖不负责。网上关于ARP的资料已经很多了，就不用我都说了。用某一位高手的话来说，“我们能做的事情很多，唯一受限制的是我们的创造力和想象力”。 ARP也是如此。以下讨论的机子有一个要攻击的机子：10.5.4.178 硬件地址：52:54:4C:98
PHP编码规范 dcj3sjt126com 编码规范
一、文件格式 1. 对于只含有 php 代码的文件，我们将在文件结尾处忽略掉 "?>" 。这是为了防止多余的空格或者其它字符影响到代码。例如：<?php$foo = 'foo';2. 缩进应该能够反映出代码的逻辑结果，尽量使用四个空格，禁止使用制表符TAB，因为这样能够保证有跨客户端编程器软件的灵活性。例
linux 脱机管理（nohup） eksliang linux nohup nohup
脱机管理 nohup 转载请出自出处：http://eksliang.iteye.com/blog/2166699 nohup可以让你在脱机或者注销系统后，还能够让工作继续进行。他的语法如下 nohup [命令与参数] --在终端机前台工作 nohup [命令与参数] & --在终端机后台工作但是这个命令需要注意的是，nohup并不支持bash的内置命令，所
BusinessObjects Enterprise Java SDK greemranqq java BO SAP Crystal Reports
最近项目用到oracle_ADF 从SAP/BO 上调用水晶报表，资料比较少，我做一个简单的分享，给和我一样的新手提供更多的便利。首先，我是尝试用JAVA JSP 去访问的。官方API：http://devlibrary.businessobjects.com/BusinessObjectsxi/en/en/BOE_SDK/boesdk_ja
系统负载剧变下的管控策略 iamzhongyong 高并发
假如目前的系统有100台机器，能够支撑每天1亿的点击量（这个就简单比喻一下），然后系统流量剧变了要，我如何应对，系统有那些策略可以处理，这里总结了一下之前的一些做法。 1、水平扩展这个最容易理解，加机器，这样的话对于系统刚刚开始的伸缩性设计要求比较高，能够非常灵活的添加机器，来应对流量的变化。 2、系统分组假如系统服务的业务不同，有优先级高的，有优先级低的，那就让不同的业务调用提前分组
BitTorrent DHT 协议中文翻译 justjavac bit
前言做了一个磁力链接和BT种子的搜索引擎 {Magnet & Torrent}，因此把 DHT 协议重新看了一遍。 BEP: 5Title: DHT ProtocolVersion: 3dec52cb3ae103ce22358e3894b31cad47a6f22bLast-Modified: Tue Apr 2 16:51:45 2013 -070
Ubuntu下Java环境的搭建 macroli java 工作 ubuntu
配置命令：　　$sudo apt-get install ubuntu-restricted-extras 　　再运行如下命令：　　$sudo apt-get install sun-java6-jdk 　　待安装完毕后选择默认Java. 　　$sudo update- alternatives --config java 　　安装过程提示选择，输入“2”即可，然后按回车键确定。
js字符串转日期（兼容IE所有版本） qiaolevip TO Date String IE
/** * 字符串转时间（yyyy-MM-dd HH:mm:ss） * result （分钟） */ stringToDate : function(fDate){ var fullDate = fDate.split(" ")[0].split("-"); var fullTime = fDate.split("
【数据挖掘学习】关联规则算法Apriori的学习与SQL简单实现购物篮分析 superlxw1234 sql 数据挖掘关联规则
关联规则挖掘用于寻找给定数据集中项之间的有趣的关联或相关关系。关联规则揭示了数据项间的未知的依赖关系，根据所挖掘的关联关系，可以从一个数据对象的信息来推断另一个数据对象的信息。例如购物篮分析。牛奶 ⇒ 面包 [支持度：3%，置信度：40%] 支持度3%：意味3%顾客同时购买牛奶和面包。置信度40%：意味购买牛奶的顾客40%也购买面包。规则的支持度和置信度是两个规则兴
Spring 5.0 的系统需求，期待你的反馈 wiselyman spring
Spring 5.0将在2016年发布。Spring5.0将支持JDK 9。 Spring 5.0的特性计划还在工作中，请保持关注，所以作者希望从使用者得到关于Spring 5.0系统需求方面的反馈。