若只如初見~~

集成学习之随机森林调参

一、scikit-learn随机森林类库概述

在scikit-learn中，RF的分类类是RandomForestClassifier，回归类是RandomForestRegressor。当然RF的变种Extra Trees也有，分类类ExtraTreesClassifier，回归类ExtraTreesRegressor。由于RF和Extra Trees的区别较小，调参方法基本相同，本文只关注于RF的调参。

与GBDT的调参类似，RF需要调参的参数也包括两部分，第一部分是Bagging框架的参数，第二部分是CART决策树的参数。下面我们就对这些参数做一个介绍。

二、RF框架参数

RF的Bagging框架的参数可以和GBDT对比来看，在scikit-learn 梯度提升树(GBDT)调参小结中，GBDT的框架参数比较多，重要的有最大迭代器个数，步长和子采样比例，调参起来比较费力。但是RF则比较简单，这是因为bagging框架里的各个弱学习器之间是没有依赖关系的，这减小了调参的难度。也就是达到同样的调参效果，RF调参时间要比GBDT少一些。

RF重要的Bagging框架的参数，由于RandomForestClassifier和RandomForestRegressor参数绝大部分相同，这里会将它们一起讲，不同点会指出。

n_estimators: 也就是最大的弱学习器的个数。一般来说n_estimators太小，容易欠拟合，n_estimators太大，计算量会太大，并且n_estimators到一定的数量后，再增大n_estimators获得的模型提升会很小，所以一般选择一个适中的数值。默认是100。
oob_score：即是否采用袋外样本来评估模型的好坏。默认识False。个人推荐设置为True，因为袋外分数反应了一个模型拟合后的泛化能力。
criterion: 即CART树做划分时对特征的评价标准。分类模型和回归模型的损失函数是不一样的。分类RF对应的CART分类树默认是基尼系数gini,另一个可选择的标准是信息增益。回归RF对应的CART回归树默认是均方差mse，另一个可以选择的标准是绝对值差mae。一般来说选择默认的标准就已经很好的。

从上面可以看出， RF重要的框架参数比较少，主要需要关注的是 n_estimators，即RF最大的决策树个数。

三、RF决策树参数

下面我们再来看RF的决策树参数，它要调参的参数基本和GBDT相同，如下:

max_features： RF划分时考虑的最大特征数，可以使用很多种类型的值，默认是"auto",意味着划分时最多考虑 $\sqrt{N}$ 个特征；如果是 $\log2$ 意味着划分时最多考虑 $log_2N$ 个特征；如果是"sqrt"或者"auto"意味着划分时最多考虑 $\sqrt{N}$ 个特征。如果是整数，代表考虑的特征绝对数。如果是浮点数，代表考虑特征百分比，即考虑（百分比xN）取整后的特征数。其中N为样本总特征数。一般我们用默认的"auto"就可以了，如果特征数非常多，我们可以灵活使用刚才描述的其他取值来控制划分时考虑的最大特征数，以控制决策树的生成时间。
max_depth： 决策树最大深度，默认可以不输入，如果不输入的话，决策树在建立子树的时候不会限制子树的深度。一般来说，数据少或者特征少的时候可以不管这个值。如果模型样本量多，特征也多的情况下，推荐限制这个最大深度，具体的取值取决于数据的分布。常用的可以取值10-100之间。
min_samples_split： 划分所需最小样本数，这个值限制了子树继续划分的条件，如果某节点的样本数少于min_samples_split，则不会继续再尝试选择最优特征来进行划分。默认是2.如果样本量不大，不需要管这个值。如果样本量数量级非常大，则推荐增大这个值。
min_samples_leaf： 叶子节点最少样本数，这个值限制了叶子节点最少的样本数，如果某叶子节点数目小于样本数，则会和兄弟节点一起被剪枝。默认是1,可以输入最少的样本数的整数，或者最少样本数占样本总数的百分比。如果样本量不大，不需要管这个值。如果样本量数量级非常大，则推荐增大这个值。
min_weight_fraction_leaf： 叶子节点最小的样本权重和，这个值限制了叶子节点所有样本权重和的最小值，如果小于这个值，则会和兄弟节点一起被剪枝。默认是0，就是不考虑权重问题。一般来说，如果我们有较多样本有缺失值，或者分类树样本的分布类别偏差很大，就会引入样本权重，这时我们就要注意这个值了。
max_leaf_nodes： 最大叶子节点数，通过限制最大叶子节点数，可以防止过拟合，默认是"None”，即不限制最大的叶子节点数。如果加了限制，算法会建立在最大叶子节点数内最优的决策树。如果特征不多，可以不考虑这个值，但是如果特征分成多的话，可以加以限制，具体的值可以通过交叉验证得到。
min_impurity_split： 节点划分最小不纯度，这个值限制了决策树的增长，如果某节点的不纯度(基于基尼系数，均方差)小于这个阈值，则该节点不再生成子节点。即为叶子节点。一般不推荐改动默认值1e-7。

上面决策树参数中最重要的包括最大特征数max_features，最大深度max_depth，内部节点再划分所需最小样本数min_samples_split和叶子节点最少样本数min_samples_leaf。

四、RF调参实例

先载入库

import pandas as pd
import numpy as np
from sklearn.ensemble import RandomForestClassifier
from sklearn.grid_search import GridSearchCV
from sklearn import cross_validation, metrics
from sklearn.model_selection import train_test_split 

import matplotlib.pylab as plt
%matplotlib inline

读入数据，先不管任何参数，都用默认的进行拟合：

#留出法
train_x,test_x,train_y,test_y = train_test_split(sourse_x,
                                                 sourse_y,
                                                 train_size=.8,
                                                 random_state=0)
rf0 = RandomForestClassifier(oob_score=True, random_state=10)
rf0.fit(train_x,train_y)
print(rf0.oob_score_)
y_predprob = rf0.predict_proba(test_x)[:,1]
print("AUC Score (Train): %f" % metrics.roc_auc_score(test_y, y_predprob))

输出如下，可见袋外分数已经不是很高，而AUC分数相对较高。

0.7612359550561798
AUC Score (Train): 0.855797

先对n_estimators进行网格搜索

param_test1 = {'n_estimators':list(range(10,80,10))}
gsearch1 = GridSearchCV(estimator = RandomForestClassifier(min_samples_split=100,
                                  min_samples_leaf=20,max_depth=8,max_features='sqrt' ,random_state=10), 
                       param_grid = param_test1, scoring='roc_auc',cv=5)
gsearch1.fit(train_x,train_y)
gsearch1.grid_scores_, gsearch1.best_params_, gsearch1.best_score_

输出如下

([mean: 0.84443, std: 0.04852, params: {'n_estimators': 10},
  mean: 0.84513, std: 0.04432, params: {'n_estimators': 20},
  mean: 0.84728, std: 0.04408, params: {'n_estimators': 30},
  mean: 0.84678, std: 0.04385, params: {'n_estimators': 40},
  mean: 0.84894, std: 0.04377, params: {'n_estimators': 50},
  mean: 0.84892, std: 0.04445, params: {'n_estimators': 60},
  mean: 0.84892, std: 0.04419, params: {'n_estimators': 70}],
 {'n_estimators': 50},
 0.8489386572851073)

这样我们得到了最佳的弱学习器迭代次数，接着我们对决策树最大深度max_depth和内部节点再划分所需最小样本数min_samples_split进行网格搜索。

param_test2 = {'max_depth':list(range(3,14,2)), 'min_samples_split':list(range(50,201,20))}
gsearch2 = GridSearchCV(estimator = RandomForestClassifier(n_estimators= 50, 
                                  min_samples_leaf=20,max_features='sqrt' ,oob_score=True, random_state=10),
   param_grid = param_test2, scoring='roc_auc',iid=False, cv=5)
gsearch2.fit(train_x,train_y)
gsearch2.grid_scores_, gsearch2.best_params_, gsearch2.best_score_

输出如下

([mean: 0.85061, std: 0.04207, params: {'max_depth': 3, 'min_samples_split': 50},
  mean: 0.85007, std: 0.04378, params: {'max_depth': 3, 'min_samples_split': 70},
  mean: 0.85069, std: 0.04298, params: {'max_depth': 3, 'min_samples_split': 90},
  mean: 0.84911, std: 0.04400, params: {'max_depth': 3, 'min_samples_split': 110},
  mean: 0.84819, std: 0.04332, params: {'max_depth': 3, 'min_samples_split': 130},
  mean: 0.84463, std: 0.04037, params: {'max_depth': 3, 'min_samples_split': 150},
  mean: 0.84255, std: 0.04089, params: {'max_depth': 3, 'min_samples_split': 170},
  mean: 0.83875, std: 0.04485, params: {'max_depth': 3, 'min_samples_split': 190},
  mean: 0.84958, std: 0.04185, params: {'max_depth': 5, 'min_samples_split': 50},
  mean: 0.85120, std: 0.04104, params: {'max_depth': 5, 'min_samples_split': 70},
  mean: 0.85097, std: 0.04297, params: {'max_depth': 5, 'min_samples_split': 90},
  mean: 0.84828, std: 0.04357, params: {'max_depth': 5, 'min_samples_split': 110},
  mean: 0.84692, std: 0.04469, params: {'max_depth': 5, 'min_samples_split': 130},
  mean: 0.84405, std: 0.04084, params: {'max_depth': 5, 'min_samples_split': 150},
  mean: 0.84208, std: 0.04236, params: {'max_depth': 5, 'min_samples_split': 170},
  mean: 0.83856, std: 0.04559, params: {'max_depth': 5, 'min_samples_split': 190},
  mean: 0.84924, std: 0.04304, params: {'max_depth': 7, 'min_samples_split': 50},
  mean: 0.85186, std: 0.04071, params: {'max_depth': 7, 'min_samples_split': 70},
  mean: 0.85149, std: 0.04402, params: {'max_depth': 7, 'min_samples_split': 90},
  mean: 0.84724, std: 0.04356, params: {'max_depth': 7, 'min_samples_split': 110},
  mean: 0.84688, std: 0.04493, params: {'max_depth': 7, 'min_samples_split': 130},
  mean: 0.84409, std: 0.04090, params: {'max_depth': 7, 'min_samples_split': 150},
  mean: 0.84208, std: 0.04236, params: {'max_depth': 7, 'min_samples_split': 170},
  mean: 0.83856, std: 0.04559, params: {'max_depth': 7, 'min_samples_split': 190},
  mean: 0.84887, std: 0.04300, params: {'max_depth': 9, 'min_samples_split': 50},
  mean: 0.85194, std: 0.04078, params: {'max_depth': 9, 'min_samples_split': 70},
  mean: 0.85158, std: 0.04410, params: {'max_depth': 9, 'min_samples_split': 90},
  mean: 0.84724, std: 0.04356, params: {'max_depth': 9, 'min_samples_split': 110},
  mean: 0.84688, std: 0.04493, params: {'max_depth': 9, 'min_samples_split': 130},
  mean: 0.84409, std: 0.04090, params: {'max_depth': 9, 'min_samples_split': 150},
  mean: 0.84208, std: 0.04236, params: {'max_depth': 9, 'min_samples_split': 170},
  mean: 0.83856, std: 0.04559, params: {'max_depth': 9, 'min_samples_split': 190},
  mean: 0.84887, std: 0.04300, params: {'max_depth': 11, 'min_samples_split': 50},
  mean: 0.85194, std: 0.04078, params: {'max_depth': 11, 'min_samples_split': 70},
  mean: 0.85158, std: 0.04410, params: {'max_depth': 11, 'min_samples_split': 90},
  mean: 0.84724, std: 0.04356, params: {'max_depth': 11, 'min_samples_split': 110},
  mean: 0.84688, std: 0.04493, params: {'max_depth': 11, 'min_samples_split': 130},
  mean: 0.84409, std: 0.04090, params: {'max_depth': 11, 'min_samples_split': 150},
  mean: 0.84208, std: 0.04236, params: {'max_depth': 11, 'min_samples_split': 170},
  mean: 0.83856, std: 0.04559, params: {'max_depth': 11, 'min_samples_split': 190},
  mean: 0.84887, std: 0.04300, params: {'max_depth': 13, 'min_samples_split': 50},
  mean: 0.85194, std: 0.04078, params: {'max_depth': 13, 'min_samples_split': 70},
  mean: 0.85158, std: 0.04410, params: {'max_depth': 13, 'min_samples_split': 90},
  mean: 0.84724, std: 0.04356, params: {'max_depth': 13, 'min_samples_split': 110},
  mean: 0.84688, std: 0.04493, params: {'max_depth': 13, 'min_samples_split': 130},
  mean: 0.84409, std: 0.04090, params: {'max_depth': 13, 'min_samples_split': 150},
  mean: 0.84208, std: 0.04236, params: {'max_depth': 13, 'min_samples_split': 170},
  mean: 0.83856, std: 0.04559, params: {'max_depth': 13, 'min_samples_split': 190}],
 {'max_depth': 9, 'min_samples_split': 70},
 0.85194030165817)

我们看看我们现在模型的袋外分数

rf1 = RandomForestClassifier(n_estimators= 50, max_depth=9, min_samples_split=70,
                                  min_samples_leaf=20,max_features='sqrt' ,oob_score=True, random_state=10)
rf1.fit(train_x,train_y)
print(rf1.oob_score_)
y_predprob1 = rf1.predict_proba(test_x)[:,1]
print("AUC Score (Train): %f" % metrics.roc_auc_score(test_y, y_predprob1))

输出如下

0.8132022471910112
AUC Score (Train): 0.889526

可见此时我们的袋外分数有一定的提高。也就是时候模型的泛化能力增强了。

对于内部节点再划分所需最小样本数min_samples_split，我们暂时不能一起定下来，因为这个还和决策树其他的参数存在关联。下面我们再对内部节点再划分所需最小样本数min_samples_split和叶子节点最少样本数min_samples_leaf一起调参。

param_test3 = {'min_samples_split':list(range(2,10,1)), 'min_samples_leaf':list(range(2,10,1))}
gsearch3 = GridSearchCV(estimator = RandomForestClassifier(n_estimators= 50, max_depth=9,
                                  max_features='sqrt' ,oob_score=True, random_state=10),
   param_grid = param_test3, scoring='roc_auc',iid=False, cv=5)
gsearch3.fit(train_x,train_y)
gsearch3.grid_scores_, gsearch3.best_params_, gsearch3.best_score_

输出如下

([mean: 0.85195, std: 0.03518, params: {'min_samples_leaf': 2, 'min_samples_split': 2},
  mean: 0.85195, std: 0.03518, params: {'min_samples_leaf': 2, 'min_samples_split': 3},
  mean: 0.85195, std: 0.03518, params: {'min_samples_leaf': 2, 'min_samples_split': 4},
  mean: 0.84882, std: 0.03837, params: {'min_samples_leaf': 2, 'min_samples_split': 5},
  mean: 0.85731, std: 0.03290, params: {'min_samples_leaf': 2, 'min_samples_split': 6},
  mean: 0.85402, std: 0.03649, params: {'min_samples_leaf': 2, 'min_samples_split': 7},
  mean: 0.85446, std: 0.03748, params: {'min_samples_leaf': 2, 'min_samples_split': 8},
  mean: 0.85543, std: 0.03394, params: {'min_samples_leaf': 2, 'min_samples_split': 9},
  mean: 0.85799, std: 0.03434, params: {'min_samples_leaf': 3, 'min_samples_split': 2},
  mean: 0.85799, std: 0.03434, params: {'min_samples_leaf': 3, 'min_samples_split': 3},
  mean: 0.85799, std: 0.03434, params: {'min_samples_leaf': 3, 'min_samples_split': 4},
  mean: 0.85799, std: 0.03434, params: {'min_samples_leaf': 3, 'min_samples_split': 5},
  mean: 0.85799, std: 0.03434, params: {'min_samples_leaf': 3, 'min_samples_split': 6},
  mean: 0.85374, std: 0.03446, params: {'min_samples_leaf': 3, 'min_samples_split': 7},
  mean: 0.85442, std: 0.03244, params: {'min_samples_leaf': 3, 'min_samples_split': 8},
  mean: 0.85389, std: 0.03766, params: {'min_samples_leaf': 3, 'min_samples_split': 9},
  mean: 0.85469, std: 0.03536, params: {'min_samples_leaf': 4, 'min_samples_split': 2},
  mean: 0.85469, std: 0.03536, params: {'min_samples_leaf': 4, 'min_samples_split': 3},
  mean: 0.85469, std: 0.03536, params: {'min_samples_leaf': 4, 'min_samples_split': 4},
  mean: 0.85469, std: 0.03536, params: {'min_samples_leaf': 4, 'min_samples_split': 5},
  mean: 0.85469, std: 0.03536, params: {'min_samples_leaf': 4, 'min_samples_split': 6},
  mean: 0.85469, std: 0.03536, params: {'min_samples_leaf': 4, 'min_samples_split': 7},
  mean: 0.85469, std: 0.03536, params: {'min_samples_leaf': 4, 'min_samples_split': 8},
  mean: 0.85722, std: 0.03514, params: {'min_samples_leaf': 4, 'min_samples_split': 9},
  mean: 0.85888, std: 0.03703, params: {'min_samples_leaf': 5, 'min_samples_split': 2},
  mean: 0.85888, std: 0.03703, params: {'min_samples_leaf': 5, 'min_samples_split': 3},
  mean: 0.85888, std: 0.03703, params: {'min_samples_leaf': 5, 'min_samples_split': 4},
  mean: 0.85888, std: 0.03703, params: {'min_samples_leaf': 5, 'min_samples_split': 5},
  mean: 0.85888, std: 0.03703, params: {'min_samples_leaf': 5, 'min_samples_split': 6},
  mean: 0.85888, std: 0.03703, params: {'min_samples_leaf': 5, 'min_samples_split': 7},
  mean: 0.85888, std: 0.03703, params: {'min_samples_leaf': 5, 'min_samples_split': 8},
  mean: 0.85888, std: 0.03703, params: {'min_samples_leaf': 5, 'min_samples_split': 9},
  mean: 0.86041, std: 0.03527, params: {'min_samples_leaf': 6, 'min_samples_split': 2},
  mean: 0.86041, std: 0.03527, params: {'min_samples_leaf': 6, 'min_samples_split': 3},
  mean: 0.86041, std: 0.03527, params: {'min_samples_leaf': 6, 'min_samples_split': 4},
  mean: 0.86041, std: 0.03527, params: {'min_samples_leaf': 6, 'min_samples_split': 5},
  mean: 0.86041, std: 0.03527, params: {'min_samples_leaf': 6, 'min_samples_split': 6},
  mean: 0.86041, std: 0.03527, params: {'min_samples_leaf': 6, 'min_samples_split': 7},
  mean: 0.86041, std: 0.03527, params: {'min_samples_leaf': 6, 'min_samples_split': 8},
  mean: 0.86041, std: 0.03527, params: {'min_samples_leaf': 6, 'min_samples_split': 9},
  mean: 0.85969, std: 0.03383, params: {'min_samples_leaf': 7, 'min_samples_split': 2},
  mean: 0.85969, std: 0.03383, params: {'min_samples_leaf': 7, 'min_samples_split': 3},
  mean: 0.85969, std: 0.03383, params: {'min_samples_leaf': 7, 'min_samples_split': 4},
  mean: 0.85969, std: 0.03383, params: {'min_samples_leaf': 7, 'min_samples_split': 5},
  mean: 0.85969, std: 0.03383, params: {'min_samples_leaf': 7, 'min_samples_split': 6},
  mean: 0.85969, std: 0.03383, params: {'min_samples_leaf': 7, 'min_samples_split': 7},
  mean: 0.85969, std: 0.03383, params: {'min_samples_leaf': 7, 'min_samples_split': 8},
  mean: 0.85969, std: 0.03383, params: {'min_samples_leaf': 7, 'min_samples_split': 9},
  mean: 0.85937, std: 0.03463, params: {'min_samples_leaf': 8, 'min_samples_split': 2},
  mean: 0.85937, std: 0.03463, params: {'min_samples_leaf': 8, 'min_samples_split': 3},
  mean: 0.85937, std: 0.03463, params: {'min_samples_leaf': 8, 'min_samples_split': 4},
  mean: 0.85937, std: 0.03463, params: {'min_samples_leaf': 8, 'min_samples_split': 5},
  mean: 0.85937, std: 0.03463, params: {'min_samples_leaf': 8, 'min_samples_split': 6},
  mean: 0.85937, std: 0.03463, params: {'min_samples_leaf': 8, 'min_samples_split': 7},
  mean: 0.85937, std: 0.03463, params: {'min_samples_leaf': 8, 'min_samples_split': 8},
  mean: 0.85937, std: 0.03463, params: {'min_samples_leaf': 8, 'min_samples_split': 9},
  mean: 0.85993, std: 0.03915, params: {'min_samples_leaf': 9, 'min_samples_split': 2},
  mean: 0.85993, std: 0.03915, params: {'min_samples_leaf': 9, 'min_samples_split': 3},
  mean: 0.85993, std: 0.03915, params: {'min_samples_leaf': 9, 'min_samples_split': 4},
  mean: 0.85993, std: 0.03915, params: {'min_samples_leaf': 9, 'min_samples_split': 5},
  mean: 0.85993, std: 0.03915, params: {'min_samples_leaf': 9, 'min_samples_split': 6},
  mean: 0.85993, std: 0.03915, params: {'min_samples_leaf': 9, 'min_samples_split': 7},
  mean: 0.85993, std: 0.03915, params: {'min_samples_leaf': 9, 'min_samples_split': 8},
  mean: 0.85993, std: 0.03915, params: {'min_samples_leaf': 9, 'min_samples_split': 9}],
 {'min_samples_leaf': 6, 'min_samples_split': 2},
 0.8604141554873008)

最后我们再对最大特征数max_features做调参

param_test4 = {'max_features':list(range(3,11,1))}
gsearch4 = GridSearchCV(estimator = RandomForestClassifier(n_estimators= 50, max_depth=9, min_samples_split=2,
                                  min_samples_leaf=6 ,oob_score=True, random_state=10),
   param_grid = param_test4, scoring='roc_auc',iid=False, cv=5)
gsearch4.fit(train_x,train_y)
gsearch4.grid_scores_, gsearch4.best_params_, gsearch4.best_score_

输出如下

([mean: 0.85914, std: 0.03765, params: {'max_features': 3},
  mean: 0.85764, std: 0.03818, params: {'max_features': 4},
  mean: 0.86041, std: 0.03527, params: {'max_features': 5},
  mean: 0.85943, std: 0.03136, params: {'max_features': 6},
  mean: 0.85747, std: 0.03662, params: {'max_features': 7},
  mean: 0.85878, std: 0.03528, params: {'max_features': 8},
  mean: 0.85898, std: 0.03439, params: {'max_features': 9},
  mean: 0.85819, std: 0.03643, params: {'max_features': 10}],
 {'max_features': 5},
 0.8604141554873008)

用搜索到的最佳参数来看看最终的模型拟合

rf2 = RandomForestClassifier(n_estimators= 50, max_depth=9, min_samples_split=2,
                                  min_samples_leaf=6,max_features=5 ,oob_score=True, random_state=10)
rf2.fit(train_x,train_y)
print(rf2.oob_score_)
y_predprob2 = rf2.predict_proba(test_x)[:,1]
print("AUC Score (Train): %f" % metrics.roc_auc_score(test_y, y_predprob2))

输出如下

0.8174157303370787
AUC Score (Train): 0.889592

从上图中可以看出此时模型的袋外分数提高程度很小了，这可能与数据有关。

以上为RF调参的总结，如果存在问题，希望大家能指出。

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
【中国国际航空-注册_登录安全分析报告】风控牛验证码接口安全评测系列安全行为验证极验网易易盾智能手机
前言由于网站注册入口容易被黑客攻击，存在如下安全问题：1.暴力破解密码，造成用户信息泄露2.短信盗刷的安全问题，影响业务及导致用户投诉3.带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案，但在机器学习能力提高的当下，连百度这样的大厂都遭受攻击导致点名批评，图形验证及交互验证方式的安全性到底如何？请看具体分析一、中国国际航空PC
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
七.正则化愿风去了
吴恩达机器学习之正则化（Regularization）http://www.cnblogs.com/jianxinzhou/p/4083921.html从数学公式上理解L1和L2https://blog.csdn.net/b876144622/article/details/81276818虽然在线性回归中加入基函数会使模型更加灵活，但是很容易引起数据的过拟合。例如将数据投影到30维的基函数上，模
机器学习-------数据标准化罔闻_spider 数据分析算法机器学习人工智能
什么是归一化，它与标准化的区别是什么？一作用在做训练时，需要先将特征值与标签标准化，可以防止梯度防炸和过拟合；将标签标准化后，网络预测出的数据是符合标准正态分布的—StandarScaler()，与真实值有很大差别。因为StandarScaler()对数据的处理是（真实值-平均值）/标准差。同时在做预测时需要将输出数据逆标准化提升模型精度：标准化/归一化使不同维度的特征在数值上更具比较性，提高分类
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性 aehrutktrjk 人工智能 easyui 前端 python
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性引言在机器学习和自然语言处理领域，选择合适的训练示例对模型性能至关重要。最大边际相关性(MaximalMarginalRelevance,MMR)是一种优秀的示例选择方法，它不仅考虑了示例与输入的相关性，还注重保持所选示例之间的多样性。本文将深入探讨如何使用MMR来选择示例，以提高AI模型的性能和泛化能力。什么是最大边际相关性(MM
LangChain集成指南:如何利用多样化的AI提供商 aehrutktrjk 人工智能 langchain python
LangChain集成指南:如何利用多样化的AI提供商引言在人工智能和机器学习领域,LangChain已成为一个强大而灵活的框架,允许开发者轻松集成各种AI服务提供商。本文将深入探讨LangChain的集成能力,介绍如何利用不同的AI提供商来增强你的应用程序,并提供实用的代码示例。LangChain集成概览LangChain支持多种AI提供商的集成,这些集成可以分为两类:独立包集成:这些提供商有独
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
【机器学习与R语言】1-机器学习简介苹果酱0567 面试题汇总与解析 java 中间件开发语言 spring boot 后端
1.基本概念机器学习：发明算法将数据转化为智能行为数据挖掘VS机器学习：前者侧重寻找有价值的信息，后者侧重执行已知的任务。后者是前者的先期准备过程：数据——>抽象化——>一般化。或者：收集数据——推理数据——归纳数据——发现规律抽象化：训练：用一个特定模型来拟合数据集的过程用方程来拟合观测的数据：观测现象——数据呈现——模型建立。通过不同的格式来把信息概念化一般化：一般化：将抽象化的知识转换成可用
Python前沿技术：机器学习与人工智能 4.0啊 Python 人工智能 python 机器学习
Python前沿技术：机器学习与人工智能一、引言随着科技的飞速发展，机器学习和人工智能（AI）已经成为了计算机科学领域的热门话题。Python作为一门易学易用且功能强大的编程语言，已经成为了这两个领域的首选语言之一。本文将深入探讨Python在机器学习和人工智能领域的应用，以及一些前沿技术和工具。二、Python机器学习基础2.1机器学习概述机器学习是人工智能（AI）的一个关键子集，它的核心在于让
chatgpt赋能python：如何在Python中计算平均值 tulingtest ChatGpt python chatgpt numpy 计算机
如何在Python中计算平均值计算平均值是数据分析、统计和机器学习等许多领域中的常见任务。Python作为一门功能强大且易于学习的编程语言，为计算平均值提供了多种方法。在本文中，我们将介绍如何在Python中计算平均值。什么是平均值简单来说，平均值是一组数字的总和除以数字的数量。例如，对于数字序列1，3，5，7，9，平均值是(1+3+5+7+9)/5=5。平均值在数据分析中非常有用，因为它可以提供
Python 初学者入门必知： Anaconda是什么？有什么作用？怎么使用？懒大王爱吃狼 Python基础 python 开发语言 python基础 python学习 anaconda anaconda安装 python教程
初学者在学习Python时，经常看到的一个名字是Anaconda。究竟什么是Anaconda，为什么它如此受欢迎？在这篇文章中，我们将探讨Anaconda，了解Anaconda的从安装到使用的。Anaconda是一个免费开源的Python和R编程发行版，包含上千个适用于数据科学和机器学习的包。同时，配备了Spyder和Jupyternotebook等工具，初学者可以使用它们来学习Python，使用
每天五分钟玩转深度学习PyTorch：模型参数优化器torch.optim 幻风_huanfeng 深度学习框架pytorch 深度学习 pytorch 人工智能神经网络机器学习优化算法
本文重点在机器学习或者深度学习中，我们需要通过修改参数使得损失函数最小化(或最大化)，优化算法就是一种调整模型参数更新的策略。在pytorch中定义了优化器optim，我们可以使用它调用封装好的优化算法，然后传递给它神经网络模型参数，就可以对模型进行优化。本文是学习第6步(优化器)，参考链接pytorch的学习路线随机梯度下降算法在深度学习和机器学习中，梯度下降算法是最常用的参数更新方法，它的公式
一切皆是映射：AI的去中心化：区块链技术的融合 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
一切皆是映射：AI的去中心化：区块链技术的融合作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：AI，区块链，去中心化，智能合约，共识机制，数据安全，隐私保护，分布式账本技术，机器学习，数据隐私1.背景介绍1.1问题的由来随着人工智能（AI）技术的快速发展，其在各个领域的应用越来越广泛，从自动驾驶、智能医疗到金融服务，AI正在改变着我们的生活。
第五届核磁机器学习班（训练营：2023.6.5~6.17）茗创科技
茗创科技专注于脑科学数据处理，涵盖（EEG/ERP,fMRI,结构像,DTI,ASL,FNIRS）等，欢迎留言讨论及转发推荐，也欢迎了解茗创科技的脑电课程，数据处理服务及脑科学工作站销售业务，可添加我们的工程师（微信号MCKJ-zhouyi或17373158786）咨询。★课程简介★基于血氧水平依赖的功能磁共振成像(fMRI)技术,利用其数据构建的功能性脑网络后,发现脑并不是一个单纯对外界刺激进行
如何有效的学习AI大模型？ Python程序员罗宾学习人工智能语言模型自然语言处理架构
学习AI大模型是一个系统性的过程，涉及到多个学科的知识。以下是一些建议，帮助你更有效地学习AI大模型：基础知识储备：数学基础：学习线性代数、概率论、统计学和微积分等，这些是理解机器学习算法的数学基础。编程技能：掌握至少一种编程语言，如Python，因为大多数AI模型都是用Python实现的。理论学习：机器学习基础：了解监督学习、非监督学习、强化学习等基本概念。深度学习：学习神经网络的基本结构，如卷
Dom 周华华 JavaScript html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
【Spark九十六】RDD API之combineByKey bit1129 spark
1. combineByKey函数的运行机制 RDD提供了很多针对元素类型为(K,V)的API，这些API封装在PairRDDFunctions类中，通过Scala隐式转换使用。这些API实现上是借助于combineByKey实现的。combineByKey函数本身也是RDD开放给Spark开发人员使用的API之一首先看一下combineByKey的方法说明：
msyql设置密码报错：ERROR 1372 (HY000): 解决方法详解 daizj mysql 设置密码
MySql给用户设置权限同时指定访问密码时，会提示如下错误： ERROR 1372 (HY000): Password hash should be a 41-digit hexadecimal number；问题原因：你输入的密码是明文。不允许这么输入。解决办法：用select password('你想输入的密码');查询出你的密码对应的字符串，然后
路漫漫其修远兮吾将上下而求索周凡杨学习思索
王国维在他的《人间词话》中曾经概括了为学的三种境界古今之成大事业、大学问者，罔不经过三种之境界。“昨夜西风凋碧树。独上高楼，望尽天涯路。”此第一境界也。“衣带渐宽终不悔，为伊消得人憔悴。”此第二境界也。“众里寻他千百度，蓦然回首，那人却在灯火阑珊处。”此第三境界也。学习技术，这也是你必须经历的三种境界。第一层境界是说，学习的路是漫漫的，你必须做好充分的思想准备，如果半途而废还不如不要开始。这里，注
Hadoop(二)对话单的操作朱辉辉33 hadoop
Debug： 1、 A = LOAD '/user/hue/task.txt' USING PigStorage(' ') AS (col1,col2,col3); DUMP A; //输出结果前几行示例： (>ggsnPDPRecord(21),,) (-->recordType(0),,) (-->networkInitiation(1),,)
web报表工具FineReport常用函数的用法总结（日期和时间函数）老A不折腾 finereport 报表工具 web开发
web报表工具FineReport常用函数的用法总结（日期和时间函数）说明：凡函数中以日期作为参数因子的，其中日期的形式都必须是yy/mm/dd。而且必须用英文环境下双引号(" ")引用。 DATE DATE(year,month,day):返回一个表示某一特定日期的系列数。 Year:代表年，可为一到四位数。 Month:代表月份。
c++ 宏定义中的##操作符墙头上一根草 C++
#与##在宏定义中的--宏展开 #include <stdio.h> #define f(a,b) a##b #define g(a) #a #define h(a) g(a) int main() { &nbs
分析Spring源代码之，DI的实现 aijuans spring DI 现源代码
(转) 分析Spring源代码之，DI的实现 2012/1/3 by tony 接着上次的讲，以下这个sample [java] view plain copy print
for循环的进化 alxw4616 JavaScript
// for循环的进化 // 菜鸟 for (var i = 0; i < Things.length ; i++) { // Things[i] } // 老鸟 for (var i = 0, len = Things.length; i < len; i++) { // Things[i] } // 大师 for (var i = Things.le
网络编程Socket和ServerSocket简单的使用百合不是茶网络编程基础 IP地址端口
网络编程;TCP/IP协议网络:实现计算机之间的信息共享,数据资源的交换协议:数据交换需要遵守的一种协议,按照约定的数据格式等写出去端口:用于计算机之间的通信每运行一个程序，系统会分配一个编号给该程序，作为和外界交换数据的唯一标识 0~65535 查看被使用的
JDK1.5 生产消费者 bijian1013 java thread 生产消费者 java多线程
ArrayBlockingQueue：一个由数组支持的有界阻塞队列。此队列按 FIFO（先进先出）原则对元素进行排序。队列的头部是在队列中存在时间最长的元素。队列的尾部是在队列中存在时间最短的元素。新元素插入到队列的尾部，队列检索操作则是从队列头部开始获得元素。 ArrayBlockingQueue的常用方法：
JAVA版身份证获取性别、出生日期及年龄 bijian1013 java 性别出生日期年龄
工作中需要根据身份证获取性别、出生日期及年龄，且要还要支持15位长度的身份证号码，网上搜索了一下，经过测试好像多少存在点问题，干脆自已写一个。 CertificateNo.java package com.bijian.study; import java.util.Calendar; import
【Java范型六】范型与枚举 bit1129 java
首先，枚举类型的定义不能带有类型参数，所以，不能把枚举类型定义为范型枚举类，例如下面的枚举类定义是有编译错的 public enum EnumGenerics<T> { //编译错，提示枚举不能带有范型参数 OK, ERROR; public <T> T get(T type) { return null;
【Nginx五】Nginx常用日志格式含义 bit1129 nginx
1. log_format 1.1 log_format指令用于指定日志的格式，格式： log_format name(格式名称) type(格式样式) 1.2 如下是一个常用的Nginx日志格式： log_format main '[$time_local]|$request_time|$status|$body_bytes
Lua 语言 15 分钟快速入门 ronin47 lua 基础
- - 单行注释 - - [[ [多行注释] - - ]] - - - - - - - - - - - 1. 变量 & 控制流 - - - - - - - - - - num = 23 - - 数字都是双精度 str = 'aspythonstring'
java-35.求一个矩阵中最大的二维矩阵 ( 元素和最大 ) bylijinnan java
the idea is from: http://blog.csdn.net/zhanxinhang/article/details/6731134 public class MaxSubMatrix { /**see http://blog.csdn.net/zhanxinhang/article/details/6731134 * Q35 求一个矩阵中最大的二维
mongoDB文档型数据库特点开窍的石头 mongoDB文档型数据库特点
MongoDD: 文档型数据库存储的是Bson文档-->json的二进制特点：内部是执行引擎是js解释器，把文档转成Bson结构，在查询时转换成js对象。 mongoDB传统型数据库对比传统类型数据库：结构化数据，定好了表结构后每一个内容符合表结构的。也就是说每一行每一列的数据都是一样的文档型数据库：不用定好数据结构，
[毕业季节]欢迎广大毕业生加入JAVA程序员的行列 comsci java
一年一度的毕业季来临了。。。。。。。。正在投简历的学弟学妹们。。。如果觉得学校推荐的单位和公司不适合自己的兴趣和专业，可以考虑来我们软件行业，做一名职业程序员。。。软件行业的开发工具中，对初学者最友好的就是JAVA语言了，网络上不仅仅有大量的
PHP操作Excel – PHPExcel 基本用法详解 cuiyadll PHP Excel
导出excel属性设置//Include classrequire_once('Classes/PHPExcel.php');require_once('Classes/PHPExcel/Writer/Excel2007.php');$objPHPExcel = new PHPExcel();//Set properties 设置文件属性$objPHPExcel->getProperties
IBM Webshpere MQ Client User Issue (MCAUSER) darrenzhu IBM jms user MQ MCAUSER
IBM MQ JMS Client去连接远端MQ Server的时候，需要提供User和Password吗？答案是根据情况而定，取决于所定义的Channel里面的属性Message channel agent user identifier (MCAUSER)的设置。 http://stackoverflow.com/questions/20209429/how-mca-user-i
网线的接法 dcj3sjt126com
一、PC连HUB (直连线)A端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。 B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。二、PC连PC （交叉线）A端：(568A)：白绿，绿，白橙，蓝，白蓝，橙，白棕，棕； B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。三、HUB连HUB&nb
Vimium插件让键盘党像操作Vim一样操作Chrome dcj3sjt126com chrome vim
什么是键盘党？键盘党是指尽可能将所有电脑操作用键盘来完成，而不去动鼠标的人。鼠标应该说是新手们的最爱，很直观，指哪点哪，很听话！不过常常使用电脑的人，如果一直使用鼠标的话，手会发酸，因为操作鼠标的时候，手臂不是在一个自然的状态，臂肌会处于绷紧状态。而使用键盘则双手是放松状态，只有手指在动。而且尽量少的从鼠标移动到键盘来回操作，也省不少事。在chrome里安装 vimium 插件
MongoDB查询（2）——数组查询[六] eksliang mongodb MongoDB查询数组
MongoDB查询数组转载请出自出处：http://eksliang.iteye.com/blog/2177292 一、概述 MongoDB查询数组与查询标量值是一样的，例如，有一个水果列表，如下所示： > db.food.find() { "_id" : "001", "fruits" : [ "苹
cordova读写文件（1） gundumw100 JavaScript Cordova
使用cordova可以很方便的在手机sdcard中读写文件。首先需要安装cordova插件：file 命令为： cordova plugin add org.apache.cordova.file 然后就可以读写文件了，这里我先是写入一个文件，具体的JS代码为： var datas=null;//datas need write var directory=&
HTML5 FormData 进行文件jquery ajax 上传到又拍云 ileson jquery Ajax html5 FormData
html5 新东西：FormData 可以提交二进制数据。页面test.html <!DOCTYPE> <html> <head> <title> formdata file jquery ajax upload</title> </head> <body> <
swift appearanceWhenContainedIn:(version1.2 xcode6.4) 啸笑天 version
swift1.2中没有oc中对应的方法： + (instancetype)appearanceWhenContainedIn:(Class <UIAppearanceContainer>)ContainerClass, ... NS_REQUIRES_NIL_TERMINATION; 解决方法：在swift项目中新建oc类如下： #import &
java实现SMTP邮件服务器 macroli java 编程
电子邮件传递可以由多种协议来实现。目前，在Internet 网上最流行的三种电子邮件协议是SMTP、POP3 和 IMAP，下面分别简单介绍。　　◆ SMTP 协议　　简单邮件传输协议(Simple Mail Transfer Protocol,SMTP)是一个运行在TCP/IP之上的协议，用它发送和接收电子邮件。SMTP 服务器在默认端口25上监听。SMTP客户使用一组简单的、基于文本的
mongodb group by having where 查询sql qiaolevip 每天进步一点点学习永无止境 mongo 纵观千象
SELECT cust_id, SUM(price) as total FROM orders WHERE status = 'A' GROUP BY cust_id HAVING total > 250 db.orders.aggregate( [ { $match: { status: 'A' } }, { $group: {
Struts2 Pojo（六） Luob. POJO strust2
注意：附件中有完整案例 1.采用POJO对象的方法进行赋值和传值 2.web配置 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee&q
struts2步骤 wuai struts
1、添加jar包 2、在web.xml中配置过滤器 <filter> <filter-name>struts2</filter-name> <filter-class>org.apache.st

集成学习之随机森林调参

一、scikit-learn随机森林类库概述

二、RF框架参数

三、RF决策树参数

四、RF调参实例

你可能感兴趣的:(机器学习)