Kira_Tseng

房价预测（基于决策树算法）

预测波士顿房价

第一步. 导入数据

在这个项目中，将使用波士顿房屋信息数据来训练和测试一个模型，并对模型的性能和预测能力进行评估。我们希望可以通过该模型实现对房屋的价值预估，提高房地产经纪人的工作效率。

此项目的数据集来自kaggle原始数据，未经过任何处理。该数据集统计了2006年至2010年波士顿个人住宅销售情况，包含2900多条观测数据（其中一半是训练数据，即我们的housedata.csv文件）。更多文档信息可以参考作者的文档，以及项目附件data_description.txt文件（特征描述文件）。

下面区域的代码用以载入一些此项目所需的Python库。

# 载入此项目需要的库
import numpy as np
import pandas as pd
import visuals as vs # Supplementary code 补充的可视化代码

import matplotlib.pyplot as plt
import seaborn as sns
plt.style.use('seaborn') # use seaborn style 使用seaborn风格

import warnings
warnings.filterwarnings('ignore')

%matplotlib inline
print('你已经成功载入所有库！')

你已经成功载入所有库！

加载数据

# 载入波士顿房屋的数据集：使用pandas载入csv，并赋值到data_df
data_df = pd.read_csv('housedata.csv')

# 成功载入的话输出训练数据行列数目
print("Boston housing dataset has {} data points with {} variables each.".format(*data_df.shape))

Boston housing dataset has 1460 data points with 81 variables each.

第二步. 数据分析

这个部分，将对已有的波士顿房地产数据进行初步的观察与处理。

由于这个项目的最终目标是建立一个预测房屋价值的模型，需要将数据集分为特征(features)和目标变量(target variable)。

目标变量：'SalePrice'，是我们希望预测的变量。
特征：除'SalePrice'外的属性都是特征，它们反应了数据点在某些方面的表现或性质。

观察数据

对波士顿房价的数据进行观察,从而掌握更多数据本身的信息。

（1）使用 head方法打印并观察前7条data_df数据

# 打印出前7条data_df
print(data_df.head(7))

   Id  MSSubClass MSZoning  LotFrontage  LotArea Street Alley LotShape  \
0   1          60       RL         65.0     8450   Pave   NaN      Reg   
1   2          20       RL         80.0     9600   Pave   NaN      Reg   
2   3          60       RL         68.0    11250   Pave   NaN      IR1   
3   4          70       RL         60.0     9550   Pave   NaN      IR1   
4   5          60       RL         84.0    14260   Pave   NaN      IR1   
5   6          50       RL         85.0    14115   Pave   NaN      IR1   
6   7          20       RL         75.0    10084   Pave   NaN      Reg   

  LandContour Utilities  ... PoolArea PoolQC  Fence MiscFeature MiscVal  \
0         Lvl    AllPub  ...        0    NaN    NaN         NaN       0   
1         Lvl    AllPub  ...        0    NaN    NaN         NaN       0   
2         Lvl    AllPub  ...        0    NaN    NaN         NaN       0   
3         Lvl    AllPub  ...        0    NaN    NaN         NaN       0   
4         Lvl    AllPub  ...        0    NaN    NaN         NaN       0   
5         Lvl    AllPub  ...        0    NaN  MnPrv        Shed     700   
6         Lvl    AllPub  ...        0    NaN    NaN         NaN       0   

  MoSold YrSold  SaleType  SaleCondition  SalePrice  
0      2   2008        WD         Normal     208500  
1      5   2007        WD         Normal     181500  
2      9   2008        WD         Normal     223500  
3      2   2006        WD        Abnorml     140000  
4     12   2008        WD         Normal     250000  
5     10   2009        WD         Normal     143000  
6      8   2007        WD         Normal     307000  

[7 rows x 81 columns]

（2）Id特征对我们训练数据没有任何用处，在data_df中使用drop方法删除'Id'列数据

# 删除data_df中的Id特征（保持数据仍在data_df中，不更改变量名）
data_df.drop('Id',axis=1,inplace=True)

（3）使用describe方法观察data_df各个特征的统计信息：


data_df.describe()

	MSSubClass	LotFrontage	LotArea	OverallQual	OverallCond	YearBuilt	YearRemodAdd	MasVnrArea	BsmtFinSF1	BsmtFinSF2	...	WoodDeckSF	OpenPorchSF	EnclosedPorch	3SsnPorch	ScreenPorch	PoolArea	MiscVal	MoSold	YrSold	SalePrice
count	1460.000000	1201.000000	1460.000000	1460.000000	1460.000000	1460.000000	1460.000000	1452.000000	1460.000000	1460.000000	...	1460.000000	1460.000000	1460.000000	1460.000000	1460.000000	1460.000000	1460.000000	1460.000000	1460.000000	1460.000000
mean	56.897260	70.049958	10516.828082	6.099315	5.575342	1971.267808	1984.865753	103.685262	443.639726	46.549315	...	94.244521	46.660274	21.954110	3.409589	15.060959	2.758904	43.489041	6.321918	2007.815753	180921.195890
std	42.300571	24.284752	9981.264932	1.382997	1.112799	30.202904	20.645407	181.066207	456.098091	161.319273	...	125.338794	66.256028	61.119149	29.317331	55.757415	40.177307	496.123024	2.703626	1.328095	79442.502883
min	20.000000	21.000000	1300.000000	1.000000	1.000000	1872.000000	1950.000000	0.000000	0.000000	0.000000	...	0.000000	0.000000	0.000000	0.000000	0.000000	0.000000	0.000000	1.000000	2006.000000	34900.000000
25%	20.000000	59.000000	7553.500000	5.000000	5.000000	1954.000000	1967.000000	0.000000	0.000000	0.000000	...	0.000000	0.000000	0.000000	0.000000	0.000000	0.000000	0.000000	5.000000	2007.000000	129975.000000
50%	50.000000	69.000000	9478.500000	6.000000	5.000000	1973.000000	1994.000000	0.000000	383.500000	0.000000	...	0.000000	25.000000	0.000000	0.000000	0.000000	0.000000	0.000000	6.000000	2008.000000	163000.000000
75%	70.000000	80.000000	11601.500000	7.000000	6.000000	2000.000000	2004.000000	166.000000	712.250000	0.000000	...	168.000000	68.000000	0.000000	0.000000	0.000000	0.000000	0.000000	8.000000	2009.000000	214000.000000
max	190.000000	313.000000	215245.000000	10.000000	9.000000	2010.000000	2010.000000	1600.000000	5644.000000	1474.000000	...	857.000000	547.000000	552.000000	508.000000	480.000000	738.000000	15500.000000	12.000000	2010.000000	755000.000000

8 rows × 37 columns

数据预处理

数据不可能是百分百的‘干净’数据（即有用数据），总会在采集整理时有些”失误“、“冗余”，造成“脏”数据，所以要从数据的正确性和完整性这两个方面来清理数据。

正确性：一般是指有没有异常值，比如我们这个数据集中作者的文档所说：
I would recommend removing any houses with more than 4000 square feet from the data set (which eliminates these five unusual observations) before assigning it to students.
建议我们去掉数据中'GrLivArea'中超过4000平方英尺的房屋（具体原因可以参考文档），当然本数据集还有其他的异常点，这里不再处理。
完整性：采集或者整理数据时所产生的空数据造成了数据的完整性缺失，通常我们会使用一定的方法处理不完整的数据。在本例中，我们使用以下两种方法，一是丢弃数据,即选择丢弃过多空数据的特征（或者直接丢弃数据行，前提是NA数据占比不多），二是填补数据，填补的方法也很多，均值中位数众数填充等等都是好方法。

正确性方面

以下代码将使用matplotlib库中的scatter方法绘制'GrLivArea'和'SalePrice'的散点图，x轴为'GrLivArea'，y轴为'SalePrice'，观察数据**

# 绘制散点图
plt.scatter(data_df['GrLivArea'],data_df['SalePrice'])
plt.xlabel('GrLivArea')
plt.ylabel('SalePrice')
plt.show()

**观察所得：通过上图我们可以看到那几个异常值，即'GrLivArea'大于4000，但是'SalePrice'又极低的数据，所以需要从data_df删除这几个异常值。

删除后重新绘制'GrLivArea'和'SalePrice'的关系图，确认异常值已删除。**

# 从data_df中删除 GrLivArea大于4000 且 SalePrice低于300000 的值
index_del = data_df[(data_df['GrLivArea'] > 4000) & (data_df['SalePrice'] < 300000)].index
data_df.drop(index=index_del, inplace=True)

# 重新绘制GrLivArea和SalePrice的关系图，确认异常值已删除
plt.scatter(data_df['GrLivArea'],data_df['SalePrice'])
plt.xlabel('GrLivArea')
plt.ylabel('SalePrice')
plt.show()

完整性方面

筛选出过多空数据的特征，这个项目定为筛选出有超过25%为空数据的特征

limit_percent = 0.25
limit_value = len(data_df) * limit_percent
# 统计并打印出超过25%的空数据的特征
list(data_df.columns[data_df.isna().sum() > limit_value])

['Alley', 'FireplaceQu', 'PoolQC', 'Fence', 'MiscFeature']

接着，查看data_description.txt文件，就会发现，这些并非一定是空缺数据，而没有游泳池，篱笆等也会用NA来表示，那么就不需要删除这些特征了，而是用None来填充NA数据。

以下将使用fillna方法填充空数据。

# 确定所有空特征
missing_columns = list(data_df.columns[data_df.isnull().sum() != 0])
# 确定哪些是类别特征，哪些是数值特征
missing_numerical = list(data_df[missing_columns].dtypes[data_df[missing_columns].dtypes != 'object'].index)
missing_category = [i for i in missing_columns if i not in missing_numerical]
print("missing_numerical:",missing_numerical)
print("missing_category:",missing_category)

missing_numerical: ['LotFrontage', 'MasVnrArea', 'GarageYrBlt']
missing_category: ['Alley', 'MasVnrType', 'BsmtQual', 'BsmtCond', 'BsmtExposure', 'BsmtFinType1', 'BsmtFinType2', 'Electrical', 'FireplaceQu', 'GarageType', 'GarageFinish', 'GarageQual', 'GarageCond', 'PoolQC', 'Fence', 'MiscFeature']

# 需要填充众数的特征
fill_Mode = ['Electrical'] 
# 需要填充None的特征
fill_None = ['Alley', 'MasVnrType', 'BsmtQual', 'BsmtCond', 'BsmtExposure', 'BsmtFinType1', 
             'BsmtFinType2', 'FireplaceQu', 'GarageType', 'GarageFinish', 'GarageQual', 
             'GarageCond', 'PoolQC', 'Fence', 'MiscFeature']
# 需要填充0的特征
fill_0 = ['GarageYrBlt']
# 需要填充中位数的特征
fill_median = ['LotFrontage', 'MasVnrArea']

# 按需填补上面数据
data_df[fill_Mode] = data_df[fill_Mode].fillna(data_df[fill_Mode].mode())
data_df[fill_None] = data_df[fill_None].fillna('None')
data_df[fill_0] = data_df[fill_0].fillna(0)
data_df[fill_median] = data_df[fill_median].fillna(data_df[fill_median].mean())

特征分析

有这么一句话在业界广泛流传：特征数据决定了机器学习的上限，而模型和算法只是逼近这个上限而已。特征工程，是整个数据分析过程中不可缺少的一个环节，其结果质量直接关系到模型效果和最终结论。从上面两步中我们得到了“干净”的数据，但是data_df总共有81个特征，应当剔除那些无关紧要的特征（噪声），使用真正关键的特征来进行模型训练。现在需要我们对这些庞大的数据进行分析，提取出与目标最为关联的数据。

绘制'SalePrice'的直方图，观察该直方图属于什么分布

# 绘制直方图
plt.hist(data_df['SalePrice'])
plt.xlabel('SalePrice')
plt.show()

观察结论：'SalePrice'属于正偏态分布。

如果特征极其多，很难清晰的看到特征与目标变量之间的关系，就需要利用统计知识来进行多变量分析了。常用的方法可使用热图heatmap结合corr方法来进行客观分析，热图Heatmap可以用颜色变化来反映变量之间的相关性二维矩阵或说相关性表格中的数据信息，它可以直观地将数据值的大小以定义的颜色深浅表示出来。

这个项目，为了简化训练，将以相关性绝对值大于0.5为界来选取所需要的特征。

corrmat = data_df.corr().abs()
top_corr = corrmat[corrmat["SalePrice"]>0.5].sort_values(by = ["SalePrice"], ascending = False).index
cm = abs(np.corrcoef(data_df[top_corr].values.T))
f, ax = plt.subplots(figsize=(20, 9))
sns.set(font_scale=1.3)
hm = sns.heatmap(cm, cbar=True, annot=True,
                 square=True, fmt='.2f', annot_kws={'size': 13}, 
                 yticklabels=top_corr.values, xticklabels=top_corr.values);
data_df = data_df[top_corr]

接下来，我们从创造性方面来对我们的特征进行“改造”。

创造性：创造性主要是说两种情况，一种是对现有数据的处理，比如对类别的独热编码（One-hotEncoder）或者标签编码（LabelEncoder），数值的区间缩放，归一化，标准化等等。另一种就是根据某一个或多个特征创造一个新的特征，例如某特征按组分类(groupby)后，或者某些特征组合后来创造新特征等等。

因为筛选出来的特征都为数值类型特征，所以只做标准化的操作：这个项目是一个回归类型的项目，而回归算法对标准正态分步预测较为准确，从目标数据可以看出数据是一个偏态分布，那么将使用log将数据从偏态分布转换为标准正态分布，最后进行标准化。

from scipy.special import boxcox1p
from sklearn.preprocessing import StandardScaler

data_df['SalePrice'] = np.log1p(data_df['SalePrice'])
numeric_features = list(data_df.columns)
numeric_features.remove('SalePrice')
for feature in numeric_features:
    #all_data[feat] += 1
    data_df[feature] = boxcox1p(data_df[feature], 0.15)

scaler = StandardScaler()
scaler.fit(data_df[numeric_features])
data_df[numeric_features] = scaler.transform(data_df[numeric_features])

第三步. 建立模型

。

定义衡量标准

如果不能对模型的训练和测试的表现进行量化地评估，就很难衡量模型的好坏。通常需要定义一些衡量标准，这些标准可以通过对某些误差或者拟合程度的计算来得到。在这个项目中，将通过运算决定系数 $R^2$ 来量化模型的表现。模型的决定系数是回归分析中十分常用的统计信息，经常被当作衡量模型预测能力好坏的标准。

$R^2$ 的数值范围从0至1，表示目标变量的预测值和实际值之间的相关程度平方的百分比。一个模型的 $R^2$ 值为0还不如直接用平均值来预测效果好；而一个 $R^2$ 值为1的模型则可以对目标变量进行完美的预测。从0至1之间的数值，则表示该模型中目标变量中有百分之多少能够用特征来解释。模型也可能出现负值的 $R^2$ ，这种情况下模型所做预测有时会比直接计算目标变量的平均值差很多。

在下方代码的 performance_metric 函数中，将实现：

使用 sklearn.metrics 中的 r2_score 来计算 y_true 和 y_predict 的 $R^2$ 值，作为对其表现的评判。
将他们的表现评分储存到 score 变量中。

# 引入 'r2_score'
from sklearn.metrics import r2_score

def performance_metric(y_true, y_predict):
    """ Calculates and returns the performance score between 
        true and predicted values based on the metric chosen. """
    
    # 计算 'y_true' 与 'y_predict' 的r2值
    score = r2_score(y_true, y_predict) 
    
    # 返回这一分数
    return score

拟合程度

假设一个数据集有五个数据且某一模型做出下列目标变量的预测：

真实数值	预测数值
3.0	2.5
-0.5	0.0
2.0	2.1
7.0	7.8
4.2	5.3

提示： $R^2$ 分数是指可以从自变量中预测的因变量的方差比例。换一种说法：

$R^2$ 为0意味着因变量不能从自变量预测。
$R^2$ 为1意味着可以从自变量预测因变量。
$R^2$ 在0到1之间表示因变量可预测的程度。
$R^2$ 为0.40意味着 Y 中40％的方差可以从 X 预测。

下方的代码将使用 performance_metric 函数来计算 y_true 和 y_predict 的决定系数。

# 计算这一模型的表现
score = performance_metric([3, -0.5, 2, 7, 4.2], [2.5, 0.0, 2.1, 7.8, 5.3])
print("Model has a coefficient of determination, R^2, of {:.3f}.".format(score))

Model has a coefficient of determination, R^2, of 0.923.

结论：这个模型已经成功地描述目标变量的变化了。因为 $R^2$ 分数已高达0.923，说明因变量的可预测程度非常高。

数据分割与重排

接下来，将分割波士顿房屋数据集，包括特征与目标变量、训练集和测试集。通常在这个过程中，数据也会被重排，以消除数据集中由于顺序而产生的偏差。

将data_df分割为特征和目标变量

# 分割 
labels = data_df['SalePrice']  #TODO：提取SalePrice作为labels
features = data_df.drop(['SalePrice'], axis=1)  #TODO：提取除了SalePrice以外的特征赋值为features

下方代码将实现：

使用 sklearn.model_selection 中的 train_test_split，将 features 和 prices 的数据都分成用于训练的数据子集和用于测试的数据子集。
- 分割比例为：80%的数据用于训练，20%用于测试；
- 选定一个数值以设定 train_test_split 中的 random_state ，这会确保结果的一致性；
将分割后的训练集与测试集分配给 X_train, X_test, y_train 和 y_test。

# 引入 'train_test_split'
from sklearn.model_selection import train_test_split

# 打乱并分割训练集与测试集
X_train, X_test, y_train, y_test = train_test_split(features, labels, test_size=0.2, random_state=1)

# 成功~
print("Training and testing split was successful.")

Training and testing split was successful.

训练及测试

将数据集按一定比例分为训练用的数据集和测试用的数据集对学习算法能在一定程度上避免过拟合。
如果用模型已经见过的数据，例如部分训练集数据进行测试，会使得计算准确率时，这个得分会不可靠。

第四步. 分析模型的表现

在项目的第四步，我们来观察不同参数下，模型在训练集和验证集上的表现。这里，我们专注于一个特定的算法（带剪枝的决策树DecisionTreeRegressor）和这个算法的一个参数 'max_depth'。
接下来，用全部训练集训练，选择不同'max_depth' 参数，观察这一参数的变化如何影响模型的表现。并画出模型的表现来分析。

学习曲线

下方区域内的代码会输出四幅图像，它们是一个决策树模型在不同最大深度下的表现。每一条曲线都直观得显示了随着训练数据量的增加，模型学习曲线在训练集评分和验证集评分的变化，评分使用决定系数 $R^2$ 。曲线的阴影区域代表的是该曲线的不确定性（用标准差衡量）。

# Produce learning curves for varying training set sizes and maximum depths
vs.ModelLearning(features, labels)

学习曲线结论观察

对于上述图像中的最大深度为 3 的那个，随着训练数据量的增加，训练集曲线的评分减少，验证集曲线的增加。
如果有更多的训练数据，也无法提升模型的表现，因训练集曲线和验证集曲线已相交在一个数值。

复杂度曲线

下列代码内的区域会输出一幅图像，它展示了一个已经经过训练和验证的决策树模型在不同最大深度条件下的表现。这个图形将包含两条曲线，一个是训练集的变化，一个是验证集的变化。跟学习曲线相似，阴影区域代表该曲线的不确定性，模型训练和测试部分的评分都用的 performance_metric 函数。

vs.ModelComplexity(X_train, y_train)

偏差（bias）与方差（variance）之间的权衡取舍

提示： 高偏差表示欠拟合（模型过于简单），而高方差表示过拟合（模型过于复杂，以至于无法泛化）。

观察结论：

当模型以最大深度 1训练时，模型的预测出现了很大的偏差。
当模型以最大深度10训练时，模型的预测出现了很大的方差。
当模型以最大深度 1训练时，训练集得分和验证集得分都较低，可见是欠拟合的情况。当模型以最大深度10训练时，训练集得分极高和验证集得分不太高，而两个得分相差甚大，可见是过拟合的情况。

最优模型的猜测

结合复杂度曲线，可见最大深度是 4 的模型能够最好地对未见过的数据进行预测。
依据：随着最大深度的增加，训练集得分和验证集得分都在增加，但当最大深度超过4后，验证集得分反而有下降的趋势，说明模型变得越来越复杂，逐渐变得过拟合。

第五步. 评估模型的表现

在项目的最后一节中，将构建一个模型，并使用 fit_model 中的优化模型去预测客户特征集。

网格搜索（Grid Search）

网格搜索法是穷举所有参数的组合，找出使模型得分最高的那个组合。比如在决策树模型里，分别用几个不同的深度参数去训练模型并计算其测试集得分，测试集得分最高模型对应的深度参数便是最优参数。
优化模型方法：尝试所有参数的组合，以发现能使模型性能最好的参数组合。

交叉验证

K折交叉验证法（k-fold cross-validation）是随机将训练集划分成K份，依次将其中的一份作为验证集，其余的作为训练集，训练K个模型，最后选择模型表现得最好的那一个。
GridSearchCV 是通过交叉验证得到每个参数组合的得分，以确定最优的参数组合。
GridSearchCV 中的'cv_results_'属性能生成一个字典，记录每组网格参数每次的训练结果，包括训练/验证时间、训练/验证评估分数以及相关时间和评分的统计信息。
K折交叉验证可以尽可能地尝试所有的数据集划分方式，使网格搜索的结果可信度更高。K折交叉验证取多次结果的平均值可以避免样本划分不合理的情况。

训练最优模型

在这一步中，将使用决策树算法训练一个模型。为了得出的是一个最优模型，需要使用网格搜索法训练模型，以找到最佳的 'max_depth' 参数。可以把'max_depth' 参数理解为决策树算法在做出预测前，允许其对数据提出问题的数量。

在下方 fit_model 函数中，将实现：

定义 'cross_validator' 变量: 使用 sklearn.model_selection 中的 KFold 创建一个交叉验证生成器对象;
定义 'regressor' 变量: 使用 sklearn.tree 中的 DecisionTreeRegressor 创建一个决策树的回归函数;
定义 'params' 变量: 为 'max_depth' 参数创造一个字典，它的值是从1至10的数组;
定义 'scoring_fnc' 变量: 使用 sklearn.metrics 中的 make_scorer 创建一个评分函数；
将 ‘performance_metric’ 作为参数传至这个函数中；
定义 'grid' 变量: 使用 sklearn.model_selection 中的 GridSearchCV 创建一个网格搜索对象；将变量'regressor', 'params', 'scoring_fnc'和 'cross_validator' 作为参数传至这个对象构造函数中；

# Import 'make_scorer', 'DecisionTreeRegressor', and 'GridSearchCV'
from sklearn.metrics import make_scorer
from sklearn.tree import DecisionTreeRegressor
from sklearn.model_selection import GridSearchCV
from sklearn.model_selection import KFold



def fit_model(X, y):
    """ Performs grid search over the 'max_depth' parameter for a 
        decision tree regressor trained on the input data [X, y]. """
    
    cross_validator = KFold(n_splits=10)
    
    # Create a decision tree regressor object
    regressor = DecisionTreeRegressor(random_state=1)

    # Create a dictionary for the parameter 'max_depth' with a range from 1 to 10
    params = {'max_depth':[i for i in range(1, 11)]}

    # Transform 'performance_metric' into a scoring function using 'make_scorer' 
    scoring_fnc = make_scorer(performance_metric)

    # Create the grid search cv object --> GridSearchCV()
    # Make sure to include the right parameters in the object:
    # (estimator, param_grid, scoring, cv) which have values 'regressor', 'params', 'scoring_fnc', and 'cross_validator' respectively.
    grid = GridSearchCV(regressor, params, scoring_fnc, cv = cross_validator)

    # Fit the grid search object to the data to compute the optimal model
    grid = grid.fit(X, y)

    # Return the optimal model after fitting the data
    return grid.best_estimator_

第六步. 做出预测

当我们用数据训练出一个模型，它就可用于对新的数据进行预测。在我们的例子–决策树回归函数中，模型已经学会对新输入的数据“提问”，并返回对目标变量的预测值。现在可以用这些预测来获取未知目标变量的数据的信息，但是，输入的新数据必须不能是已有训练数据之中的。

最优模型

下方代码将决策树回归函数代入训练数据的集合，以得到最优化的模型。

# Fit the training data to the model using grid search
reg = fit_model(X_train, y_train)

# Produce the value for 'max_depth'
print("Parameter 'max_depth' is {} for the optimal model.".format(reg.get_params()['max_depth']))

Parameter 'max_depth' is 6 for the optimal model.

最终，使用确认好的参数来对测试数据进行预测，并来看看训练结果如何。

depth = 6
regressor = DecisionTreeRegressor(max_depth = depth)
regressor.fit(X_train, y_train)
y_pred = regressor.predict(X_test)
score = performance_metric(y_test, y_pred)
print("The R2 score is ",score)

The R2 score is  0.7520017488593774

训练结果情况：

模型的效果并不理想。
改进：1、需要更多的特征来训练模型；2、数据预处理时，空值的填充用错数值；3、试试换成线性回归模型。

你可能感兴趣的:(房价预测（基于决策树算法）)

《Kubernetes部署篇：基于麒麟V10+ARM64架构部署harbor v2.4.0镜像仓库》东城绝神《Linux运维实战总结》arm64 harbor
总结：整理不易，如果对你有帮助，可否点赞关注一下？更多详细内容请参考：企业级K8s集群运维实战一、环境信息K8S版本操作系统CPU架构服务版本1.26.15KylinLinuxAdvancedServerV10ARM64harborv2.4.0二、部署操作2.1、资源包下载说明：如果你从别处找来的镜像，redis提示报错ignore-warningsARM64-COW-BUG，可以重新编译redi
ApexCharts 图表入门例子后端java
常见的图形库系列常见的图形库概览-00-overview常见的图形库概览-01-Chart.js入门例子常见的图形库概览-03-D3.js入门例子HighCharts交互式图表-01-入门介绍Plotly函数图像绘制ApexCharts图表入门例子Victory图表基于React，适合React项目，支持移动端Recharts入门例子AntVG2入门例子图表库C3.js入门例子图表库GoogleC
新能源行业必会基础知识-----电力现货市场理论篇-----电力市场概述-----电力市场模式选择殷丿grd_志鹏新能源新能源电力市场经济学电力现货行业知识
新能源行业必会基础知识-----电力现货市场理论篇-----主目录-----持续更新https://blog.csdn.net/grd_java/article/details/143364261这本书是2023年出版的，是当下了解国内电力市场最好的途径了。还是推荐大家买来这本书进行阅读观看，最好作为随身携带的查阅工具书。内容均为阅读此书后，基于个人理解进行的总结，如有错误还请指正。推荐搭配书本阅
英伟达打造个人 AI 超级计算机：Project DIGITS 震撼登场
手掌大小的超级计算机Nvidia在CES2025上为桌面用户推出了一款大小和手掌差不多的超级计算机——ProjectDIGITSAI超级计算机。虽然它的大小和一个手掌差不多，但性能方面可以说是强到惊人。ProjectDIGITSProjectDIGITSProjectDIGITS搭载全新的GB10GraceBlackwell超级芯片，这是一款基于NVIDIAGraceBlackwell架构的片上系
Linux网络 TCP socket 我要满血复活网络 linux tcp/ip
TCP简介TCP（TransmissionControlProtocol）是一种面向连接的、可靠的、基于字节流的传输层通信协议。它位于OSI模型的第四层，主要为应用层提供数据传输服务。TCP通过三次握手建立连接，确保数据在发送和接收过程中的准确性和顺序性。TCP的主要特点可靠性：TCP通过序列号、确认应答、超时重传等机制保证数据可靠传输。面向连接：通信双方在传输数据前需要建立连接，通信结束后释放连
人类大脑与大规模神经网络的对比及未来展望东方佑量子变法神经网络人工智能深度学习
引言随着人工智能（AI）技术的迅猛发展，研究人员不断尝试构建更加复杂和强大的模型，以期实现与人类大脑相媲美的智能水平。本文将探讨当前大规模神经网络（LLM,LargeLanguageModels）的发展现状，并基于现有数据对未来进行预测。特别地，我们将分析达到人类大脑突触连接规模所需的时间框架、可能面临的挑战以及使用转义词表技术所带来的优势。人类大脑的基本结构人类大脑是一个极其复杂的系统，包含大约
java ssm基于微信小程序的小说图书阅读系统网上书城论坛交流（源码+文档+运行视频+讲解视频） QQ2279239102 SSM 微信小程序 java 微信小程序开发语言 SSM vue.js
文章目录系列文章目录目的前言一、详细视频演示二、项目部分实现截图三、技术栈后端框架SSM前端框架vueSSM框架详细介绍系统测试微信小程序介绍四、代码参考源码获取目的摘要：基于JavaSsm与微信小程序的小说图书阅读系统，为书虫打造沉浸式阅读天地，兼设论坛交流，丰富阅读体验，促进文学交流。网上书城汇聚海量小说、图书，分类精细，搜索便捷，用户通过微信小程序阅读，支持字体、背景调节，书签、笔记功能方便
SVM模型实战1 浊酒南街 #支持向量机机器学习 python
目录前言实战前言这里有一份手写体字母识别的数据，我们采用网格搜索法，分别测试LinearSVC和SVC模型，最终选择SVC模型，并计算预测结果的准确性。实战#导入第三方模块fromsklearnimportsvmimportpandasaspdfromsklearnimportmodel_selectionfromsklearnimportmetrics#读取外部数据letters=pd.read
如何在 Linux 上安装 C 和 GCC 编译器？新华编程 C语言教程 linux c语言
概述Linux是一组开源的类UNIX操作系统，Ubuntu是一种基于Linux的操作系统，通常用于运行基于Linux的应用程序。要在Linux上安装C并在Ubuntu上构建和运行C程序文件，我们需要安装GCC编译器。在Ubuntu存储库中，GCC编译器是我们需要安装的构建基本包的一部分。我们知道在Linux上安装C语言可能看起来令人生畏，但不要担心;我们已经为您提供了分步指南！在Linux中使用终
基于 Android 的个人健康管理 APP 设计与实现赵谨言论文毕业设计经验分享
标题:基于Android的个人健康管理APP设计与实现内容:1.摘要本文介绍了一款基于Android的个人健康管理APP的设计与实现。首先，文章介绍了该APP的背景和目的，即帮助用户更好地管理个人健康。接着，文章详细描述了该APP的设计和实现过程，包括需求分析、系统设计、数据库设计、界面设计和功能实现等方面。然后，文章介绍了该APP的测试和优化过程，包括功能测试、性能测试和用户体验测试等方面。最后
深圳云盟智慧科技公司智慧停车管理系统GetVideo存在SQL注入漏洞缘梦未来漏洞复现科技安全 web安全
免责声明:本文旨在提供有关特定漏洞的深入信息，帮助用户充分了解潜在的安全风险。发布此信息的目的在于提升网络安全意识和推动技术进步，未经授权访问系统、网络或应用程序，可能会导致法律责任或严重后果。因此，作者不对读者基于本文内容所采取的任何行为承担责任。读者在使用本文信息时，必须严格遵循适用的法律法规及服务协议，自行承担一切风险与责任。如涉及侵权，请及时与我们联系，我们将尽快处理并删除相关内容。0x0
高效消息传递架构：基于 RabbitMQ 与 C# 实现分布式系统的异步通信与解耦威哥说编程开发语言后端 rabbitmq
在现代分布式系统中，消息队列作为一种核心的通信机制，广泛应用于系统间的异步通信、解耦以及负载均衡等场景。特别是对于需要处理高吞吐量、低延迟和高度可扩展的应用，采用成熟的消息队列中间件如RabbitMQ，可以显著提高系统的可靠性、灵活性和可维护性。与C#结合使用时，开发者可以充分利用其强大的类型系统、丰富的库支持和异步编程能力，构建高效、响应快速的分布式系统架构。本文将深入探讨如何利用RabbitM
Python操作MongoDB看这一篇就够了 Python3.7 Python进阶 python
MongoDB是由C++语言编写的非关系型数据库，是一个基于分布式文件存储的开源数据库系统，其内容存储形式类似JSON对象，它的字段值可以包含其他文档、数组及文档数组，非常灵活。在这一节中，我们就来看看Python3下MongoDB的存储操作。1.准备工作在开始之前，请确保已经安装好了MongoDB并启动了其服务，并且安装好了Python的PyMongo库。2.连接MongoDB连接MongoDB
Spring Boot 框架整体启动流程详解阿提说说 Spring Boot 3.x 精讲 java spring spring boot 3
基于SpringBoot版本：3.1Java:17SpringBoot的入口即为xxApplication类的main方法：@SpringBootApplicationpublicclassSpringBootDemoApplication{publicstaticvoidmain(String[]args){SpringApplication.run(SpringBootDemoApplicat
从自然语言到提示词：编程范式的革命 AI天才研究院计算机软件编程原理与应用实践大数据AI人工智能 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
从自然语言到提示词：编程范式的革命关键词：编程范式、自然语言处理、提示词编程、人工智能、算法原理摘要：随着人工智能技术的不断发展，编程范式正经历着从自然语言处理向基于提示词的人工智能编程模式的转变。本文旨在探讨这一转变的背景、动机、原理及其在软件开发实践和工程方法论中的影响。文章将逐步分析自然语言处理和提示词编程的核心概念，讲解算法原理和数学模型，并通过实际案例展示编程范式转变的应用效果。第一部分
基于多模态信息抽取的菜品知识图谱构建思维导图-java架构用心去追梦 java 架构开发语言
构建一个基于多模态信息抽取的菜品知识图谱，特别是在Java架构下的实现，可以按照以下结构来组织思维导图的内容。这个思维导图将帮助理解从数据获取、处理到知识图谱构建的关键步骤，并且涵盖技术选型和系统设计。思维导图结构1.项目背景知识图谱的意义提升搜索体验推荐系统优化菜品知识图谱的目标食材关联菜系分类健康饮食建议2.多模态数据收集文本数据源美食博客和论坛配方网站图像数据源社交媒体图片餐厅菜单照片视频数
大型游戏服务器架构该怎么设计？云网站长小陈设计游戏架构
一、游戏服务器特征游戏服务器，是一个会长期运行程序，并且它还要服务于多个不定时，不定点的网络请求。所以这类服务的特点是要特别关注稳定性和性能。这类程序如果需要多个协作来提高承载能力，则还要关注部署和扩容的便利性；同时，还需要考虑如何实现某种程度容灾需求。由于多进程协同工作，也带来了开发的复杂度，这也是需要关注的问题。功能约束，是架构设计决定性因素。基于游戏业务的功能特征，对服务器端系统来说，有以下
gradio库的基本使用 Echo..... python python
Gradio（通过pipinstallgradio安装）是一个用于创建交互式界面的Python库。它允许你基于预训练模型、函数或任意代码块创建实时演示和部署模型的图形用户界面（GUI）。使用Gradio库，你可以轻松创建Web界面，用于输入数据、调用模型、显示结果，并为用户提供与模型交互的功能。它支持多种输入类型（如文本框、图片上传、滑块等）和输出展示方式（如图像展示、文本展示等）。你可以根据需要
【AI中数学-概率论-综合实例-包括python实现】预测的守望者：动态贝叶斯网络在风险预警中的应用云博士的AI课堂 AI中的数学人工智能概率论 python 贝叶斯网络机器学习 AI数学
第四章：概率论-综合实例第2节预测的守望者：动态贝叶斯网络在风险预警中的应用在许多现实世界的应用中，预测和风险评估通常不仅依赖于静态的输入数据，而是需要考虑时间维度和动态变化。动态贝叶斯网络（DBN,DynamicBayesianNetwork）作为一种扩展了传统贝叶斯网络的工具，可以有效地处理时间序列数据，并进行时序预测。与静态贝叶斯网络不同，DBN能够通过建模系统状态随时间的变化，揭示出更为复
推荐项目：Kaggle - House Prices: Advanced Regression Techniques 秦贝仁Lincoln
推荐项目：Kaggle-HousePrices:AdvancedRegressionTechniques去发现同类优质开源项目:https://gitcode.com/在这个数字化的时代，数据分析已经成为各行各业不可或缺的技能，尤其在房地产领域，精准的房价预测能带来巨大的商业价值。这就是我们要向你推荐的开源项目——Kaggle-HousePrices:AdvancedRegressionTechn
DOTS Unity.Physics物理引擎碰撞事件处理 Unity_RAIN unity 游戏引擎
最近DOTS发布了正式的版本,同时基于DOTS的理念实现了一套高性能的物理引擎，今天我们给大家分享和介绍一下这个物理引擎的碰撞事件处理以及核心相关概念。Unity.Physics物理引擎的主要流程与PipelineUnity.Physics物理引擎做仿真迭代计算的时候主要通过以下步骤来执行:step1:从entity里面的ECS组件中获取我们当前的物体的状态数据;step2:做粗略的broadph
基于OpenCV的道路损伤识别 Srlua小谢传知代码论文复现 python 图形图像
✨✨欢迎大家来访Srlua的博文（づ￣3￣）づ╭❤～✨✨欢迎各位亲爱的读者，感谢你们抽出宝贵的时间来阅读我的文章。我是Srlua小谢，在这里我会分享我的知识和经验。希望在这里，我们能一起探索IT世界的奥妙，提升我们的技能。记得先点赞后阅读哦~所属专栏：传知代码论文复现欢迎访问我的主页：Srlua小谢获取更多信息和资源。✨✨目录一、背景介绍二、算法原理（一）中值滤波（二）直方图均衡化（三）调节阈值（
【Fabric环境搭建，复制粘贴即可实现】Fabric网络搭建保姆级教程，亲测速通安装 Sao_E 我的小成就 fabric linux 区块链信任链
Fabric网络搭建与应用（实现官方文档的资产转移案例）文章目录Fabric网络搭建与应用（实现官方文档的资产转移案例）1.环境准备Git安装安装cURL安装Docker和Docker-compose安装Go2、Fabric源码安装下载源码修改安装脚本执行安装脚本3、启动test-network测试网络1.环境准备本文是基于Vmware和Ubuntu20的Fabric2.5环境搭建Git安装sud
UE学习日志#8 GAS--ASC源码简要分析5 GameplayEffects: Primary outward facing API for other systems P2 学游戏开发的 UE学习日志学习游戏引擎
注：1.这个分类是按照源码里的注释分类的2.本篇是通读并给出一些注释形式的，并不涉及结构性的分析3.看之前要对UE的GAS系统的定义有初步了解4.因为都是接口函数，有些没细看的研究那一部分的时候会细看8OnPredictiveGameplayCueCatchupCall预测性添加的GC，移除标签并尝试InvokeGC事件ByTag/**Calledforpredictivelyaddedgamep
基于 Github Actions 和 Docker 的前端项目CI/CD Single 部署打包 github docker 前端 ci/cd
一、项目背景最近在写一个管理系统项目的时候出现了一些比较麻烦的问题，由于进度比较赶，项目虽然上线了，但是还需要继续开发，这就涉及到频繁的构建和部署。首先讲一下没使用CI/CD之前的部署方式:首先使用pnpmbuild，拿到项目的打包产物.output文件夹将.output文件夹压缩，并通过服务器可视化工具宝塔，将压缩包上传到指定文件夹下第一次部署时使用pm2命令pm2start./.output/
如何绕过 NaughtCoin 合约的时间锁（TimeLock）限制：基于 ERC20 的攻击合约分析纸鸢666 合约破解案例区块链 solidity 智能合约
简介在这个博客中，我们将探讨如何绕过一个ERC20合约中的时间锁机制（TimeLock），以便在锁定期内转移代币。我们以NaughtCoin合约为例，展示了如何编写攻击合约，并详细分析了如何解决出现的授权错误问题。我们会分步骤地解释这一过程，确保您能够理解如何利用ERC20标准进行安全性分析和合约攻击。背景：NaughtCoin合约假设我们有一个ERC20代币NaughtCoin，并且其中实现了一
Multicoin Capital：预测再变，这 7 个趋势不变 web3比特币区块链智能合约
作者：Techub精选编译撰文：MulticoinCapital合伙人团队编译：Yangz，TechubNews亚马逊创始人杰夫·贝索斯关于未来趋势的论述常发人深省。贝索斯认为，「未来10年会发生什么变化」是个有趣，但也十分普通的问题。相反，在他看来，「未来10年什么不会改变」更为重要。本周早些时候，我们发表了一篇「千篇一律」的风险投资文章，介绍了我们的投资团队期待在2025年看到的新兴领域。本着
2024中国CRM排行榜数据库算法
市场概述：随着数字化转型的深入推进，中国CRM（客户关系管理）市场在2024年呈现出蓬勃发展的态势。企业对于提升客户服务质量、优化运营效率的需求持续增长，推动了CRM解决方案的快速发展和创新。评估标准：本次排名主要基于以下几个核心维度进行综合评估：产品功能完整性和创新性技术架构先进性客户满意度和市场口碑本地化服务能力解决方案成熟度生态系统建设情况2024年中国CRM系统排行榜第一梯队：市场领导者1
销售易CRM：引领数字化转型，助力企业智能增长人工智能程序员
在全球数字化浪潮下，企业对智能化、数字化转型的需求愈发迫切。销售易CRM作为中国领先的企业级智能CRM解决方案提供商，凭借其强大的产品能力、丰富的行业经验和卓越的服务品质，成为众多知名企业的首选合作伙伴。本文将深入分析销售易CRM的核心优势，以及其如何助力企业实现数字化转型与业务增长。一、销售易CRM的核心优势领先的技术实力销售易CRM基于自主研发的新一代智能商业引擎，将人工智能、大数据分析等前沿
AI Agent 原理解析及应用场景深度洞察 power-辰南大模型算法实战工程人工智能 ai agent 大模型
在当今科技飞速发展的时代，AIAgent作为人工智能领域的重要分支，正以其独特的智能特性和广泛的应用潜力，逐渐渗透到各个行业和我们生活的方方面面。它为解决复杂问题、提升系统效率和实现智能化交互提供了全新的途径。本文将深入剖析AIAgent的原理，并详细探讨其在多个领域的关键应用场景。一、AIAgent的定义与基本概念AIAgent，即人工智能代理，是一种能够感知其所处环境，并基于所感知的信息自主地
Java开发中，spring mvc 的线程怎么调用？小麦麦子 spring mvc
今天逛知乎，看到最近很多人都在问spring mvc 的线程http://www.maiziedu.com/course/java/ 的启动问题，觉得挺有意思的，那哥们儿问的也听仔细，下面的回答也很详尽，分享出来，希望遇对遇到类似问题的Java开发程序猿有所帮助。问题：在用spring mvc架构的网站上，设一线程在虚拟机启动时运行，线程里有一全局
maven依赖范围 bitcarter maven
1.test 测试的时候才会依赖，编译和打包不依赖，如junit不被打包 2.compile 只有编译和打包时才会依赖 3.provided 编译和测试的时候依赖，打包不依赖，如：tomcat的一些公用jar包 4.runtime 运行时依赖，编译不依赖 5.默认compile 依赖范围compile是支持传递的，test不支持传递 1.传递的意思是项目A，引用
Jaxb org.xml.sax.saxparseexception : premature end of file darrenzhu xml premature JAXB
如果在使用JAXB把xml文件unmarshal成vo(XSD自动生成的vo)时碰到如下错误： org.xml.sax.saxparseexception : premature end of file 很有可能时你直接读取文件为inputstream，然后将inputstream作为构建unmarshal需要的source参数。InputSource inputSource = new In
CSS Specificity 周凡杨 html 权重 Specificity css
有时候对于页面元素设置了样式，可为什么页面的显示没有匹配上呢？ because specificity CSS 的选择符是有权重的，当不同的选择符的样式设置有冲突时，浏览器会采用权重高的选择符设置的样式。规则： HTML标签的权重是1 Class 的权重是10 Id 的权重是100
java与servlet g21121 servlet
servlet 搞java web开发的人一定不会陌生，而且大家还会时常用到它。下面是java官方网站上对servlet的介绍： java官网对于servlet的解释写道 Java Servlet Technology Overview Servlets are the Java platform technology of choice for extending and enha
eclipse中安装maven插件 510888780 eclipse maven
1.首先去官网下载 Maven： http://www.apache.org/dyn/closer.cgi/maven/binaries/apache-maven-3.2.3-bin.tar.gz 下载完成之后将其解压，我将解压后的文件夹：apache-maven-3.2.3，并将它放在 D:\tools目录下，即 maven 最终的路径是：D:\tools\apache-mave
jpa@OneToOne关联关系布衣凌宇 jpa
Nruser里的pruserid关联到Pruser的主键id，实现对一个表的增删改，另一个表的数据随之增删改。 Nruser实体类 //***************************************************************** @Entity @Table(name="nruser") @DynamicInsert @Dynam
我的spring学习笔记11-Spring中关于声明式事务的配置 aijuans spring 事务配置
这两天学到事务管理这一块，结合到之前的terasoluna框架，觉得书本上讲的还是简单阿。我就把我从书本上学到的再结合实际的项目以及网上看到的一些内容，对声明式事务管理做个整理吧。我看得Spring in Action第二版中只提到了用TransactionProxyFactoryBean和<tx:advice/>,定义注释驱动这三种，我承认后两种的内容很好，很强大。但是实际的项目当中
java 动态代理简单实现 antlove java handler proxy dynamic service
dynamicproxy.service.HelloService package dynamicproxy.service; public interface HelloService { public void sayHello(); } dynamicproxy.service.impl.HelloServiceImpl package dynamicp
JDBC连接数据库百合不是茶 JDBC编程 JAVA操作oracle数据库
如果我们要想连接oracle公司的数据库，就要首先下载oralce公司的驱动程序，将这个驱动程序的jar包导入到我们工程中; JDBC链接数据库的代码和固定写法; 1,加载oracle数据库的驱动; &nb
单例模式中的多线程分析 bijian1013 java thread 多线程 java多线程
谈到单例模式，我们立马会想到饿汉式和懒汉式加载，所谓饿汉式就是在创建类时就创建好了实例，懒汉式在获取实例时才去创建实例，即延迟加载。饿汉式： package com.bijian.study; public class Singleton { private Singleton() { } // 注意这是private 只供内部调用 private static
javascript读取和修改原型特别需要注意原型的读写不具有对等性 bijian1013 JavaScript prototype
对于从原型对象继承而来的成员，其读和写具有内在的不对等性。比如有一个对象A，假设它的原型对象是B，B的原型对象是null。如果我们需要读取A对象的name属性值，那么JS会优先在A中查找，如果找到了name属性那么就返回；如果A中没有name属性，那么就到原型B中查找name，如果找到了就返回；如果原型B中也没有
【持久化框架MyBatis3六】MyBatis3集成第三方DataSource bit1129 dataSource
MyBatis内置了数据源的支持，如： <environments default="development"> <environment id="development"> <transactionManager type="JDBC" /> <data
我程序中用到的urldecode和base64decode,MD5 bitcarter c MD5 base64decode urldecode
这里是base64decode和urldecode，Md5在附件中。因为我是在后台所以需要解码： string Base64Decode(const char* Data,int DataByte,int& OutByte) { //解码表 const char DecodeTable[] = { 0, 0, 0, 0, 0, 0
腾讯资深运维专家周小军：QQ与微信架构的惊天秘密 ronin47
社交领域一直是互联网创业的大热门，从PC到移动端，从OICQ、MSN到QQ。到了移动互联网时代，社交领域应用开始彻底爆发，直奔黄金期。腾讯在过去几年里，社交平台更是火到爆，QQ和微信坐拥几亿的粉丝，QQ空间和朋友圈各种刷屏，写心得，晒照片，秀视频，那么谁来为企鹅保驾护航呢？支撑QQ和微信海量数据背后的架构又有哪些惊天内幕呢？本期大讲堂的内容来自今年2月份ChinaUnix对腾讯社交网络运营服务中心
java-69-旋转数组的最小元素。把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素 bylijinnan java
public class MinOfShiftedArray { /** * Q69 旋转数组的最小元素 * 把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素。 * 例如数组{3, 4, 5, 1, 2}为{1, 2, 3, 4, 5}的一个旋转，该数组的最小值为1。 */ publ
看博客，应该是有方向的 Cb123456 反省看博客
看博客，应该是有方向的: 我现在就复习以前的，在补补以前不会的，现在还不会的，同时完善完善项目，也看看别人的博客. 我刚突然想到的: 1.应该看计算机组成原理，数据结构，一些算法，还有关于android,java的。 2.对于我，也快大四了，看一些职业规划的，以及一些学习的经验，看看别人的工作总结的. 为什么要写
[开源与商业]做开源项目的人生活上一定要朴素,尽量减少对官方和商业体系的依赖 comsci 开源项目
为什么这样说呢？因为科学和技术的发展有时候需要一个平缓和长期的积累过程，但是行政和商业体系本身充满各种不稳定性和不确定性，如果你希望长期从事某个科研项目，但是却又必须依赖于某种行政和商业体系，那其中的过程必定充满各种风险。。。所以，为避免这种不确定性风险，我
一个 sql优化（[精华] 一个查询优化的分析调整全过程！很值得一看） cwqcwqmax9 sql
见 http://www.itpub.net/forum.php?mod=viewthread&tid=239011 Web翻页优化实例提交时间: 2004-6-18 15:37:49 回复发消息环境： Linux ve
Hibernat and Ibatis dashuaifu Hibernate ibatis
Hibernate VS iBATIS 简介 Hibernate 是当前最流行的O/R mapping框架，当前版本是3.05。它出身于sf.net，现在已经成为Jboss的一部分了 iBATIS 是另外一种优秀的O/R mapping框架，当前版本是2.0。目前属于apache的一个子项目了。相对Hibernate“O/R”而言，iBATIS 是一种“Sql Mappi
备份MYSQL脚本 dcj3sjt126com mysql
#!/bin/sh # this shell to backup mysql #[email protected] (QQ:1413161683 DuChengJiu) _dbDir=/var/lib/mysql/ _today=`date +%w` _bakDir=/usr/backup/$_today [ ! -d $_bakDir ] && mkdir -p
iOS第三方开源库的吐槽和备忘 dcj3sjt126com ios
转自 ibireme的博客做iOS开发总会接触到一些第三方库，这里整理一下，做一些吐槽。目前比较活跃的社区仍旧是Github，除此以外也有一些不错的库散落在Google Code、SourceForge等地方。由于Github社区太过主流，这里主要介绍一下Github里面流行的iOS库。首先整理了一份 Github上排名靠
html wlwmanifest.xml eoems html xml
所谓优化wp_head()就是把从wp_head中移除不需要元素，同时也可以加快速度。步骤：加入到function.php remove_action('wp_head', 'wp_generator'); //wp-generator移除wordpress的版本号，本身blog的版本号没什么意义，但是如果让恶意玩家看到，可能会用官网公布的漏洞攻击blog remov
浅谈Java定时器发展 hacksin java 并发 timer 定时器
java在jdk1.3中推出了定时器类Timer,而后在jdk1.5后由Dou Lea从新开发出了支持多线程的ScheduleThreadPoolExecutor，从后者的表现来看，可以考虑完全替代Timer了。 Timer与ScheduleThreadPoolExecutor对比： 1. Timer始于jdk1.3,其原理是利用一个TimerTask数组当作队列
移动端页面侧边导航滑入效果 ini jquery Web html5 css javascirpt
效果体验：http://hovertree.com/texiao/mobile/2.htm可以使用移动设备浏览器查看效果。效果使用到jquery-2.1.4.min.js，该版本的jQuery库是用于支持HTML5的浏览器上，不再兼容IE8以前的浏览器，现在移动端浏览器一般都支持HTML5，所以使用该jQuery没问题。HTML文件代码： <!DOCTYPE html> <h
AspectJ+Javasist记录日志 kane_xie aspectj javasist
在项目中碰到这样一个需求，对一个服务类的每一个方法，在方法开始和结束的时候分别记录一条日志，内容包括方法名，参数名+参数值以及方法执行的时间。 @Override public String get(String key) { // long start = System.currentTimeMillis(); // System.out.println("Be
redis学习笔记 MJC410621 redis NoSQL
1)nosql数据库主要由以下特点：非关系型的、分布式的、开源的、水平可扩展的。 1，处理超大量的数据 2，运行在便宜的PC服务器集群上， 3，击碎了性能瓶颈。 1)对数据高并发读写。 2)对海量数据的高效率存储和访问。 3)对数据的高扩展性和高可用性。 redis支持的类型： Sring 类型 set name lijie get name lijie set na
使用redis实现分布式锁 qifeifei
在多节点的系统中，如何实现分布式锁机制，其中用redis来实现是很好的方法之一，我们先来看一下jedis包中，有个类名BinaryJedis,它有个方法如下： public Long setnx(final byte[] key, final byte[] value) { checkIsInMulti(); client.setnx(key, value); ret
BI并非万能，中层业务管理报表要另辟蹊径张老师的菜大数据 BI 商业智能信息化
BI是商业智能的缩写，是可以帮助企业做出明智的业务经营决策的工具，其数据来源于各个业务系统，如ERP、CRM、SCM、进销存、HER、OA等。 BI系统不同于传统的管理信息系统，他号称是一个整体应用的解决方案，是融入管理思想的强大系统：有着系统整体的设计思想，支持对所有
安装rvm后出现rvm not a function 或者ruby -v后提示没安装ruby的问题 wudixiaotie function
1.在~/.bashrc最后加入 [[ -s "$HOME/.rvm/scripts/rvm" ]] && source "$HOME/.rvm/scripts/rvm" 2.重新启动terminal输入： rvm use ruby-2.2.1 --default 把当前安装的ruby版本设为默