右禺

房价租金预测竞赛总结1：数据探索性分析

任务要求
数据概况

数据集字段说明

评分指标
数据分析

总体情况
类别特征和数值特征
缺失值分析
单调特征列分析
特征unique分析
统计特征值频次大于100的特征
label分布

编码问题

任务要求

比赛要求参赛选手根据给定的数据集，建立模型，预测房屋租金。
赛题连接：房价租金预测

数据概况

数据集中的数据类别包括租赁房源、小区、二手房、配套、新房、土地、人口、客户、真实租金等。

数据集字段说明

对于小区信息中，关于city、region、plate三者的关系：city>region>plate。
土地数据中，土地楼板面积是指在土地上建筑的房屋总面积。

评分指标

回归结果评价标准采用R-Square。
$\text { score }=1-\frac{\sum_{i=1}^{m}\left(\widehat{y}_{i}-y_{i}\right)^{2}}{\sum_{i=1}^{m}\left(y_{i}-\bar{y}\right)^{2}}$
其中， $y_{i}$ 表示真实值， $\widehat{y}_{i}$ 表示预测值， $\bar{y}$ 表示样本均值。得分越高拟合效果越好。
$R^{2}$ 用于度量因变量的变异中可由自变量解释部分所占的比例，取值范围是 0~1， $R^{2}$ 越接近1，表明回归平方和占总平方和的比例越大，回归线与各观测点越接近，用x的变化来解释y值变化的部分就越多，回归的拟合程度就越好。所以 $R^{2}$ 也称为拟合优度（Goodness of Fit）的统计量。

数据分析

导入数据分析所用的包

import warnings
warnings.filterwarnings('ignore')

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

总体情况

导入数据

# 载入数据
data_train = pd.read_csv('../data/train_data.csv')
data_train['Type'] = 'Train'
data_test = pd.read_csv('../data/test_a.csv')
data_test['Type'] = 'Test'
data_all = pd.concat([data_train, data_test], ignore_index=True)
# 总体情况一览
print(data_train.info())
print(data_train.describe())
print(data_train.head())

结果：

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 41440 entries, 0 to 41439
Data columns (total 52 columns):
ID                    41440 non-null int64
area                  41440 non-null float64
rentType              41440 non-null object
houseType             41440 non-null object
houseFloor            41440 non-null object
totalFloor            41440 non-null int64
houseToward           41440 non-null object
houseDecoration       41440 non-null object
communityName         41440 non-null object
city                  41440 non-null object
region                41440 non-null object
plate                 41440 non-null object
buildYear             41440 non-null object
saleSecHouseNum       41440 non-null int64
subwayStationNum      41440 non-null int64
busStationNum         41440 non-null int64
interSchoolNum        41440 non-null int64
schoolNum             41440 non-null int64
privateSchoolNum      41440 non-null int64
hospitalNum           41440 non-null int64
drugStoreNum          41440 non-null int64
gymNum                41440 non-null int64
bankNum               41440 non-null int64
shopNum               41440 non-null int64
parkNum               41440 non-null int64
mallNum               41440 non-null int64
superMarketNum        41440 non-null int64
totalTradeMoney       41440 non-null int64
totalTradeArea        41440 non-null float64
tradeMeanPrice        41440 non-null float64
tradeSecNum           41440 non-null int64
totalNewTradeMoney    41440 non-null int64
totalNewTradeArea     41440 non-null int64
tradeNewMeanPrice     41440 non-null float64
tradeNewNum           41440 non-null int64
remainNewNum          41440 non-null int64
supplyNewNum          41440 non-null int64
supplyLandNum         41440 non-null int64
supplyLandArea        41440 non-null float64
tradeLandNum          41440 non-null int64
tradeLandArea         41440 non-null float64
landTotalPrice        41440 non-null int64
landMeanPrice         41440 non-null float64
totalWorkers          41440 non-null int64
newWorkers            41440 non-null int64
residentPopulation    41440 non-null int64
pv                    41422 non-null float64
uv                    41422 non-null float64
lookNum               41440 non-null int64
tradeTime             41440 non-null object
tradeMoney            41440 non-null float64
Type                  41440 non-null object
dtypes: float64(10), int64(30), object(12)
memory usage: 16.4+ MB
None
                 ID          area  ...       lookNum    tradeMoney
count  4.144000e+04  41440.000000  ...  41440.000000  4.144000e+04
mean   1.001221e+08     70.959409  ...      0.396260  8.837074e+03
std    9.376566e+04     88.119569  ...      1.653932  5.514287e+05
min    1.000000e+08      1.000000  ...      0.000000  0.000000e+00
25%    1.000470e+08     42.607500  ...      0.000000  2.800000e+03
50%    1.000960e+08     65.000000  ...      0.000000  4.000000e+03
75%    1.001902e+08     90.000000  ...      0.000000  5.500000e+03
max    1.003218e+08  15055.000000  ...     37.000000  1.000000e+08

[8 rows x 40 columns]

ID    area rentType houseType  ... lookNum   tradeTime tradeMoney   Type
0  100309852   68.06     未知方式    2室1厅1卫  ...       0  2018/11/28     2000.0  Train
1  100307942  125.55     未知方式    3室2厅2卫  ...       1  2018/12/16     2000.0  Train
2  100307764  132.00     未知方式    3室2厅2卫  ...       1  2018/12/22    16000.0  Train
3  100306518   57.00     未知方式    1室1厅1卫  ...       9  2018/12/21     1600.0  Train
4  100305262  129.00     未知方式    3室2厅3卫  ...       0  2018/11/18     2900.0  Train

[5 rows x 52 columns]

该数据集一共包括41400个样本，共有51个特征，其中50个特征是自变量变量，因变量是tradeMoeny。该问题属于典型的回归问题。
目标变量（因变量）是float型数据，自变量大多数数据都是int或float型；有部分字段是object型，即文本型中文或英文的，如rentType字段。

类别特征和数值特征

通过数据信息能够看出类别型特征一共有11个

categorical_feas = ['rentType','houseType','houseFloor','region','plate',
                    'houseToward','houseDecoration','communityName','city',
                    'buildYear','tradeTime']

连续型特征(包括因变量)一共有40个

numerical_feas=['ID','area','totalFloor','saleSecHouseNum','subwayStationNum',
    'busStationNum','interSchoolNum','schoolNum','privateSchoolNum','hospitalNum',
    'drugStoreNum','gymNum','bankNum','shopNum','parkNum','mallNum','superMarketNum',
    'totalTradeMoney','totalTradeArea','tradeMeanPrice','tradeSecNum','totalNewTradeMoney',
    'totalNewTradeArea','tradeNewMeanPrice','tradeNewNum','remainNewNum','supplyNewNum',
    'supplyLandNum','supplyLandArea','tradeLandNum','tradeLandArea','landTotalPrice',
    'landMeanPrice','totalWorkers','newWorkers','residentPopulation','pv','uv',
    'tradeMoney','lookNum']

缺失值分析

# 缺失值分析
def missing_values(df):
    alldata_na = pd.DataFrame(df.isnull().sum(),columns={'missingNum'})
    alldata_na['existNum'] = len(df) - alldata_na['missingNum']
    alldata_na['sum'] = len(df)
    alldata_na['missingRatio'] = alldata_na['missingNum']/len(df)
    alldata_na['dtype'] = df.dtypes
    # ascending:默认True升序排列，False降序排列
    alldata_na = alldata_na[alldata_na['missingNum']>0].reset_index().sort_values(by=['missingNum','index'],ascending=[False,True])
    alldata_na.set_index('index',inplace=True)
    return alldata_na

alldata_na = missing_values(data_train)

结果

       missingNum  existNum    sum  missingRatio    dtype
index                                                    
pv             18     41422  41440      0.000434  float64
uv             18     41422  41440      0.000434  float64

通过编写函数确定训练集中的那些特征存在缺失值，分别缺失了多少数据，缺失的比例有多大，以及这些缺失数据是否是随机缺失还是存在某种联系。
简要分析，在该训练集中，只有两个特征存在缺失值分别是’pv’和’uv’，并且分别缺失了18个数据，分别占总数据的0.043%，通过查看原始数据得知缺失的数据来自同一个小区。该后续的分析中可以考虑先剔除这两个特征或者剔除这18个样本，先进行分析。

单调特征列分析

# 单调特征列分析
def increasing(vals):
    cnt = 0
    len_ = len(vals)
    for i in range(len_-1):
        if vals[i+1] > vals[i]:
            cnt += 1
    return cnt

fea_cols = [col for col in data_train.columns]
for col in fea_cols:
    cnt = increasing(data_train[col].values)
    if cnt / data_train.shape[0] >= 0.55:
        print('单调特征：', col)
        print('单调特征值个数：', cnt)
        print('单调特征值比例：', cnt/data_train.shape[0])

结果

单调特征： tradeTime
单调特征值个数： 24085
单调特征值比例： 0.5812017374517374

通过编写函数确定存在单调递增的特征，即是否存在一列数据单调递增。

单调特征为什么采用这种判断方法，如果入局之间被随机打乱，那这种方式不就失败了吗？
结果显示，存在一个单调递增的特征：tradeTime，为时间列。
时间列在特征工程的时候，不同的情况下能有很多的变种形式，比如按年月日分箱，或者按不同的维度在时间上聚合分组，等等

特征unique分析

# 特征unique分布
print('特征unique分布')        
for feature in categorical_feas:
    print(feature + "的特征分布如下：")
    print(data_train[feature].value_counts())

结果

rentType的特征分布如下：
未知方式    30759
整租       5472
合租       5204
--          5
Name: rentType, dtype: int64
houseType的特征分布如下：
1室1厅1卫    9805
2室1厅1卫    8512
2室2厅1卫    6783
3室1厅1卫    3992
3室2厅2卫    2737
4室1厅1卫    1957


9室2厅5卫       1
3室2厅5卫       1
5室4厅5卫       1
7室1厅3卫       1
Name: houseType, Length: 104, dtype: int64
houseFloor的特征分布如下：
中    15458
高    14066
低    11916
Name: houseFloor, dtype: int64
region的特征分布如下：
RG00002    11437
RG00005     5739
RG00003     4186
RG00010     3640
RG00012     3368
RG00004     3333
RG00006     1961
RG00007     1610
RG00008     1250
RG00013     1215
RG00001     1157
RG00014     1069
RG00011      793
RG00009      681
RG00015        1
Name: region, dtype: int64
plate的特征分布如下：
BK00031    1958
BK00033    1837
BK00045    1816
BK00055    1566
BK00056    1516

BK00044      98
BK00016      40
BK00036      33
BK00058      15
BK00032       3
BK00001       1
Name: plate, Length: 66, dtype: int64
houseToward的特征分布如下：
南       34377
南北       2254
北        2043
暂无数据      963
东南        655
东         552
西         264
西南        250
西北         58
东西         24
Name: houseToward, dtype: int64
houseDecoration的特征分布如下：
其他    29040
精装    10918
简装     1171
毛坯      311
Name: houseDecoration, dtype: int64
communityName的特征分布如下：
XQ01834    358
XQ01274    192
XQ02273    188
XQ03110    185
XQ02337    173
XQ01389    166

XQ03838      1
XQ04064      1
XQ00112      1
XQ01385      1
XQ03573      1
XQ01911      1
Name: communityName, Length: 4236, dtype: int64
city的特征分布如下：
SH    41440
Name: city, dtype: int64
buildYear的特征分布如下：
1994    2851
暂无信息    2808
2006    2007
2007    1851
2008    1849
2005    1814
2010    1774

1961       2
1926       2
1951       1
1962       1
1950       1
Name: buildYear, Length: 80, dtype: int64
tradeTime的特征分布如下：
2018/3/3      543
2018/3/4      487
2018/3/11     410
2018/3/10     400
2018/3/24     341
2018/3/18     339

2018/1/4       14
2018/1/18      14
2018/1/2        5
2018/2/13       4
2018/2/20       2
2018/2/19       1
2018/2/17       1
Name: tradeTime, Length: 361, dtype: int64

用自带函数value_counts() 来得到每个类别型变量的种类分布；并且简单画出柱状图直观地显示各变量的种类分布。

通过统计数字和柱状图，可以发现：
rentType：4种，且绝大多数是无用的未知方式；
houseType：104种，绝大多数在3室及以下；
houseFloor：3种，分布较为均匀；
region： 15种；
plate： 66种；
houseToward： 10种；
houseDecoration： 4种，一大半是其他；
buildYear： 80种；
communityName： 4236种，且分布较为稀疏；

此步骤是为之后数据处理和特征工程做准备，先理解每个字段的含义以及分布，之后需要根据实际含义对分类变量做不同的处理。

统计特征值频次大于100的特征

# 统计特征值频次大于100的特征
print('统计特征值频次大于100的特征')
for feature in categorical_feas:
    df_value_counts = pd.DataFrame(data_train[feature].value_counts())
    df_value_counts = df_value_counts.reset_index()
    df_value_counts.columns = [feature,'counts']  # 改变列名
    print(df_value_counts[df_value_counts['counts']>=100])

结果

  rentType  counts
0     未知方式   30759
1       整租    5472
2       合租    5204
   houseType  counts
0     1室1厅1卫    9805
1     2室1厅1卫    8512
2     2室2厅1卫    6783
3     3室1厅1卫    3992
4     3室2厅2卫    2737
5     4室1厅1卫    1957
6     3室2厅1卫    1920
7     1室0厅1卫    1286
8     1室2厅1卫     933
9     2室2厅2卫     881
10    4室2厅2卫     435
11    2室0厅1卫     419
12    4室2厅3卫     273
13    5室1厅1卫     197
14    2室1厅2卫     155
15    3室2厅3卫     149
16    3室1厅2卫     135
  houseFloor  counts
0          中   15458
1          高   14066
2          低   11916
     region  counts
0   RG00002   11437
1   RG00005    5739
2   RG00003    4186
3   RG00010    3640
4   RG00012    3368
5   RG00004    3333
6   RG00006    1961
7   RG00007    1610
8   RG00008    1250
9   RG00013    1215
10  RG00001    1157
11  RG00014    1069
12  RG00011     793
13  RG00009     681
      plate  counts
0   BK00031    1958
1   BK00033    1837
2   BK00045    1816
3   BK00055    1566
4   BK00056    1516
5   BK00052    1375
6   BK00017    1305
7   BK00041    1266
8   BK00054    1256
9   BK00051    1253
10  BK00046    1227
11  BK00035    1156
12  BK00042    1137
13  BK00009    1016
14  BK00050     979
15  BK00043     930
16  BK00026     906
17  BK00047     880
18  BK00034     849
19  BK00013     834
20  BK00053     819
21  BK00028     745
22  BK00040     679
23  BK00060     671
24  BK00010     651
25  BK00029     646
26  BK00062     618
27  BK00022     614
28  BK00018     613
29  BK00064     590
30  BK00005     549
31  BK00003     523
32  BK00014     500
33  BK00019     498
34  BK00061     477
35  BK00011     455
36  BK00037     444
37  BK00012     412
38  BK00038     398
39  BK00024     397
40  BK00020     384
41  BK00002     357
42  BK00065     348
43  BK00027     344
44  BK00039     343
45  BK00063     281
46  BK00057     278
47  BK00015     253
48  BK00006     231
49  BK00021     226
50  BK00007     225
51  BK00066     219
52  BK00030     219
53  BK00049     211
54  BK00008     210
55  BK00004     189
56  BK00048     165
57  BK00025     157
58  BK00023     127
59  BK00059     122
  houseToward  counts
0           南   34377
1          南北    2254
2           北    2043
3        暂无数据     963
4          东南     655
5           东     552
6           西     264
7          西南     250
  houseDecoration  counts
0              其他   29040
1              精装   10918
2              简装    1171
3              毛坯     311
   communityName  counts
0        XQ01834     358
1        XQ01274     192
2        XQ02273     188
3        XQ03110     185
4        XQ02337     173
5        XQ01389     166
6        XQ01658     163
7        XQ02789     152
8        XQ01561     151
9        XQ00530     151
10       XQ01339     132
11       XQ00826     122
12       XQ01873     122
13       XQ02296     121
14       XQ01232     119
15       XQ01401     118
16       XQ02441     117
17       XQ00196     115
18       XQ01207     109
19       XQ02365     109
20       XQ01410     108
21       XQ00852     105
22       XQ01672     103
23       XQ02072     103
  city  counts
0   SH   41440
   buildYear  counts
0       1994    2851
1       暂无信息    2808
2       2006    2007
3       2007    1851
4       2008    1849
5       2005    1814
6       2010    1774
7       1995    1685
8       1993    1543
9       2011    1498
10      2004    1431
11      2009    1271
12      2014    1238
13      2003    1156
14      1997    1125
15      2002    1120
16      2012    1049
17      1996     991
18      2000     925
19      2001     898
20      2015     840
21      1999     822
22      1998     733
23      2013     714
24      1987     632
25      1983     612
26      1991     545
27      1984     493
28      1980     452
29      1990     431
30      1988     423
31      1989     419
32      1985     359
33      1982     344
34      1986     320
35      1992     308
36      1976     251
37      1957     227
38      1981     221
39      1956     153
40      1977     153
41      2016     140
42      1978     133
43      1958     122
44      1979     116
45      1954     101
      tradeTime  counts
0      2018/3/3     543
1      2018/3/4     487
2     2018/3/11     410
3     2018/3/10     400
4     2018/3/24     341
5     2018/3/18     339
6      2018/3/1     332
7     2018/3/17     328
8      2018/3/5     296
9     2018/2/25     292
10     2018/3/8     291
11    2018/3/25     283
12     2018/3/2     276
13     2018/3/9     272
14    2018/3/12     260
15    2018/3/31     258
16     2018/3/7     252
17    2018/6/10     250
18    2018/8/19     234
19     2018/3/6     229
20    2018/7/29     225
21    2018/2/28     223
22     2018/7/1     221
23    2018/8/26     220
24    2018/3/15     218
25    2018/5/20     218
26    2018/5/27     217
27    2018/7/14     210
28    2018/4/22     210
29    2018/6/23     209
..          ...     ...
154    2018/6/1     106
155  2018/11/24     106
156   2018/8/16     106
157   2018/6/29     106
158   2018/12/1     105
159   2018/8/29     105
160    2018/8/2     105
161    2018/6/7     105
162   2018/4/24     104
163   2018/6/13     104
164   2018/5/18     104
165  2018/11/11     104
166   2018/6/15     104
167   2018/4/12     103
168   2018/4/23     103
169   2018/9/24     103
170    2018/5/4     102
171    2018/5/2     102
172    2018/5/7     102
173   2018/4/11     102
174   2018/4/20     102
175   2018/7/10     102
176   2018/9/13     101
177   2018/4/28     101
178   2018/8/27     101
179    2018/7/4     100
180   2018/5/25     100
181  2018/11/25     100
182    2018/9/6     100
183    2018/9/3     100

[184 rows x 2 columns]

此步骤和特征nunique分布结合步骤结合起来看，有一些小于100的是可以直接统一归类为其他的

label分布

# label分布
print('label分布')
fig,axes = plt.subplots(2,3,figsize=(20,5))
fig.set_size_inches(20,12)
sns.distplot(data_train['tradeMoney'],ax=axes[0][0])
sns.distplot(data_train[(data_train['tradeMoney']<20000)]['tradeMoney'],ax=axes[0][1])

sns.distplot(data_train[(data_train['tradeMoney']>=20000) & 
                       (data_train['tradeMoney']<50000)]['tradeMoney'],ax=axes[0][2])
    
sns.distplot(data_train[(data_train['tradeMoney']>=50000) & 
                        (data_train['tradeMoney']<100000)]['tradeMoney'],ax=axes[1][0])
    
sns.distplot(data_train[(data_train['tradeMoney']>=100000)]['tradeMoney'],ax=axes[1][1])

print("money<=10000",len(data_train[(data_train['tradeMoney']<=10000)]['tradeMoney']))
print("10000,len(data_train[(data_train['tradeMoney']>10000)&(data_train['tradeMoney']<=20000)]['tradeMoney']))
print("20000,len(data_train[(data_train['tradeMoney']>20000)&(data_train['tradeMoney']<=50000)]['tradeMoney']))
print("50000,len(data_train[(data_train['tradeMoney']>50000)&(data_train['tradeMoney']<=100000)]['tradeMoney']))
print("100000,len(data_train[(data_train['tradeMoney']>100000)]['tradeMoney']))

结果

money<=10000 38964
10000<money<=20000 1985
20000<money<=50000 433
50000<money<=100000 39
100000<money 19

将目标变量tradeMoney分组，并查看每组间的分布；
可以看出绝大多数都是集中在10000元以内的，并且从图中可以看到该分布是右偏的。

编码问题

对11种类别型变量分别考虑进行编码，
rentType：对出租方式来讲，除了“未知方式”、“整租”、“合租”，还有一种"–"，只有5个，样本量较少，而且在测试集数据中也没有该种类型的出租方式，因此可以将其作为异常值处理。
‘houseType’：房屋类型，用于说明几室几厅几卫，具有大小关系，因此采用分别给室厅卫赋予权重，进行加权。

‘houseFloor’：房屋楼层只有高中低三种，而且具有大小关系，可以设为3,2,1。

‘houseToward’：房屋朝向有10种类型，其中有一种是“未知类型”，类型之间没有大小关系，因此可以采用onehat编码。

‘houseDecoration’：房屋装修有四种类型：“其它”、“精装”、“简装”、“毛坯”，之间有等级关系，但存在其它，可以默认为“其它”应该介于“毛坯”和“简装”之间，因此四者关系设为2,4，3,1。
‘communityName’, 小区名称，一共4236个，认为小区名称与ID类似，因此这个特征不参与训练。

‘city’：与ID类似。

‘region’：与ID 类似。

‘plate’：与ID类似。

‘buildYear’：建筑年份，转换为数值型，需要归一化处理。

’tradeTime’：交易时间，建议转换为年月日。

【数据竞赛】5行代码提升GBDT，提升巨大！风度78 广告人工智能机器学习大数据数据分析
看过我历史文章的都知道，以lightgbm，xgboost，catboost为代表的GBDT，在部分工业界场景的表格数据集上，一直一览众山小。如果你打过kaggle应该一定都知道，大家心照不宣的表格一把梭中的第一把。(一把梭的意思就是，基本上可以闭着眼用，肯定有用。)他就是category特征的频度统计了，你也可以称为valuecounts等，用pandas实现起来也很简单。我拿个简单的3列表格，
让OpenAI GPT3替我写数据竞赛代码！ AI Studio 人工智能 gpt-3 人工智能机器学习
★★★本文源自AlStudio社区精品项目，【点击此处】查看更多精品内容>>>让OpenAIGPT3替我写数据竞赛代码！OpenAI与ChatGPTOpenAI是在美国成立的人工智能研究公司，核心宗旨在于实现安全的通用人工智能(AGI)。他们开发的ChatGPT是一个最先进的自然语言处理模型，可以实时生成类似人类的文本。ChatGPT是从GPT-3.5系列中的一个模型进行微调的，该模型于2022年
除了Kaggle，这里还有一些高质量的数据科学竞赛平台 Python数据之道算法大数据编程语言 python 机器学习
选自towardsdatascience作者：ParulPande机器之心编译参与：李诗萌、王淑婷除了大名鼎鼎的kaggle，数据科学家可以参加的数据竞赛平台其实还蛮多的。有些比赛平台不仅提供比赛，还让你有机会自己创办比赛。有些比赛由公司赞助，有些由政府机构赞助。参加这些比赛不仅能让你的能力获得认可，还可以获得一些不菲的奖金呢~在听了上百节慕课（MOOC）、看了上千本书和笔记、聆听了上百万人对数据
【BetterBench】2024年都有哪些数学建模竞赛和大数据竞赛？ Better Bench 数学建模入门到精通数学建模大数据数据挖掘竞赛时间 2024年
2024年每个月有哪些竞赛？2024年32个数学建模和数据挖掘竞赛重磅来袭！！！2024年数学建模和数学挖掘竞赛时间目录汇总一月（1）2024年第二届“华数杯”国际大学生数学建模竞赛报名时间：即日起至2024年1月16日比赛时间：2024年1月17日（周三）06:00至1月21日（周日）09:00费用：200元报名地址：https://www.saikr.com/vse/mcmicm/2024不能
论文、期刊、学术数据获取渠道--竞赛篇（一） SMILE_9025
hwr大数据时代中的金融统计今天还在为写论文做学术找不到数据而发愁吗？其实数据集的获取有很多的渠道，主要是需要的是哪种数据，现小编就总结了一些数据集的获取渠道，在写论文或者做学术，甚至工作中的时候，都可以通过不同的渠道去寻找自身需要的数据。下面将介绍三个大数据竞赛平台，里面有很多的大数据竞赛，并会提供相应的数据，感兴趣的小伙伴可以去试试。数据获取01KAGGLE02DATAFOUNTAIN03KE
bagging：随机森林金鸡湖最后的张万森集成学习机器学习随机森林机器学习集成学习
前言集成学习（Ensemblelearning）是机器学习中最先进、最有效、最具研究价值的领域之一，这类方法会训练多个弱评估器（baseestimators），并将它们输出的结果以某种方式结合起来解决一个问题。目前来看，集成学习是：当代工业应用中，唯一能与深度学习算法分庭抗礼的算法；数据竞赛高分榜统治者，KDDcup、Kaggle、天池、DC冠军队御用算法；在搜索、推荐、广告等众多领域，事实上的工
大数据竞赛MR培训与题型背帆大数据大数据 mr hadoop
MapReduce编程模板1.自定义Mapper类继承类并重写map方法：importorg.apache.hadoop.io.IntWritable;importorg.apache.hadoop.io.LongWritable;importorg.apache.hadoop.io.Text;importorg.apache.hadoop.mapreduce.Mapper;importjava.
看看CHAT是怎么写MPP开发和调度策略慕斯女神大数据人工智能 chatgpt 学习生活
CHAT回复：MPP（MassivelyParallelProcessing）开发和调度策略是一种并行处理技术，主要用于大规模数据仓库和数据竞赛应用。1.数据分布：这是MPP系统的主要特点，也是其能够提高性能和吞吐量的主要原因。通常，数据会根据某种散列或范围算法被平均分布到多个节点上。选择合适的数据分布键可以帮助减少跨节点的数据移动，优化查询性能。2.查询推送下来：在MPP系统中，尽可能将计算推送
【TIANCHI】天池大数据竞赛（学习赛）--- 淘宝用户购物行为数据可视化分析 WaKuWuku python 机器学习
目录前言一、数据集的来源和各个字段的意义二、数据分析1.引入库2.读入数据3.查看数据数量级4.PV（PageView）/UV访问量5.漏斗模型6.用户购买商品的频次分析。7.ARPPU(averagerevenueperpayinguser)计算ARPPUARPPU出图8.复购情况分析计算用户购买频次复购周期分析总结前言本人代码萌新一枚，目前还在学习python中，这篇文章是我本人对天池大数据竞
关于淘宝用户行为分析及其可视化案例 ChenDaX python sql 数据分析
目录一、数据导入二、数据预处理三、数据分析漏斗模型分析AARRR模型分析Acquisition获取（游戏行业需要分析DNU/DOU/DAU）Activation活跃度计算跳出率计算关键页跳出率时间维度分析用户活跃度情况Rretention留存率Referral用户推荐Reveune用户收益RFM用户细分模型分析一、数据导入数据来源：可视化大赛-天池大数据竞赛-天池大赛-阿里云天池使用工具：Mysq
机器学习 - 竞赛网站，算法刷题网站（持续更新） huanbia 机器学习竞赛网站算法刷题
数据竞赛类网站Kaggle阿里巴巴天池大数据比赛DataCastleCCF大数据与计算智能大赛Di-Tech算法大赛KDD-CupKDnuggetsCompetition赛氪网DrivenDataCompetition上海SODA大赛TopCoder大赛网数字城市大赛数据科学&机器学习的在线学习资源慕课网数据科学家快报数据分析网一起大数据36大数据数据科学研习社爱可可-爱生活好东西传送门机器学习日
机器学习 - 竞赛网站，算法刷题网站 ctrigger
数据竞赛类网站Kaggle阿里巴巴天池大数据比赛DataCastleCCF大数据与计算智能大赛Di-Tech算法大赛KDD-CupKDnuggetsCompetition全国高校云计算应用创新大赛ByteCup国际机器学习竞赛WID数据竞赛数据火车竞赛网站DrivenDataCompetition上海SODA大赛赛氪网TopCoder大赛网kaggle竞赛冠军源代码数据科学&机器学习的在线学习资源
【转】机器学习 - 竞赛网站，算法刷题网站 7-clock 机器学习转载竞赛刷题
转载仅为个人记录使用请访问源地址：https://blog.csdn.net/zk_j1994/article/details/76019650更新：1.天池2.CCF大数据与计算智能3.Di-Tech算法大赛4.全国高校云计算应用创新大赛5.WID数据竞赛6.数据火车竞赛网站数据竞赛类网站Kaggle阿里巴巴天池大数据比赛DataCastleCCF大数据与计算智能大赛Di-Tech算法大赛KDD
电商零售商家需求预测及库存优化问题（第1问）王小葱鸭机器学习人工智能
电商零售商家需求预测及库存优化问题数据和题目来源于2023年MathorCup高校数学建模挑战赛——大数据竞赛只有第一问，使用ARIMA做预测，使用聚类算法做特征相似性1数据读取和处理1.1清除重复值注意附件4要去重，原来是56条数据，去重后是54条数据。print(fujian1_df.shape)fujian1_df=fujian1_df.drop_duplicates()print(fuji
2022年MathorCup大数据竞赛B题北京移动用户体验影响因素研究求解全过程文档及程序数模竞赛Paid answer Mathorcup大数据竞赛数据分析数学建模大数据数学建模数据分析数学建模数据分析 mathorcup大数据竞赛
2022年MathorCup高校数学建模挑战赛—大数据竞赛B题北京移动用户体验影响因素研究原题再现：移动通信技术飞速发展，给人们带来了极大便利，人们也越来越离不开移动通信技术带来的各种便捷。随着网络不断的建设，网络覆盖越来越完善。各个移动运营商，越来越重视客户的网络使用体验，从而进一步提升网络服务质量。客户满意度是客户对运营商产品服务的满意程度，反映了客户期望与实际感知的产品服务之间的差异
2022年职业院校技能大赛-大数据赛题解析 xlw2003 大数据 spark flume kafka redis
最新上线2022年7月20日新发布任务书1和任务书7解析。2022国赛专区（7.20更新）2022年高职大数据国赛（7.20更新），任务书详解与参考实现。2022(7.20更新)高职大数据竞赛-官方电商样例数据说明2022(7.20更新)高职大数据竞赛(任务书一)-离线数据处理任务一：数据抽取2022(7.20更新)高职大数据竞赛(任务书一)-离线数据处理任务二：数据清洗2022(7.20更新)高
2011-2022年高职大数据竞赛-赛题内容 xlw2003 大数据 Spark hadoop flink 高职大数据竞赛
本系列共分五篇，内容分别为：第一部分赛题内容第二部分任务剖析第三部分赛题模拟实现-离线数据抽取第四部分赛题模拟实现-离线数据统计第五部分赛题模拟实现-数据采集与实时计算第六部分赛题模拟实现-数据可视化第一部分竞赛内容赛项以大数据技术与应用为核心内容和工作基础，重点考查参赛选手基于Spark、Flink平台环境下，充分利用SparkCore、SparkSQL、Flume、Kafka、Flink等技术
2011-2022年高职大数据竞赛-赛题任务剖析 xlw2003 Spark Flink hadoop spark flume kafka flink
本系列共分五篇，内容分别为：第一部分赛题内容第二部分任务剖析第三部分赛题模拟实现-离线数据抽取第四部分赛题模拟实现-离线数据统计第五部分赛题模拟实现-数据采集与实时计算第六部分赛题模拟实现-数据可视化（一）任务一：大数据平台环境搭建具体内容按照大数据分析平台需求，需要完成Hadoop完全分布式、Spark安装配置、Flink安装配置、Hive安装配置、Kafka安装配置、Flume安装配置。分析H
机器学习算法竞赛平台整理厨师长爱炼丹机器学习机器学习算法人工智能
平台名网址比赛时间科赛网Heywhale和鲸（官网）-数据科学协同平台天池天池大数据众智平台-阿里云天池DataFountain权威的大数据竞赛平台-DataFountainKaggleKaggle:YourMachineLearningandDataScienceCommunityDataCastleDC竞赛——领先的大数据与人工智能竞赛平台JDATAJDATA智汇平台6月腾讯广告算法大赛202
AI优秀企业案例——机器人流程自动化：达观数据RPA AI 智能服务 AI行业研究分析机器人自动化 rpa
通过学习业内领先公司的最佳实践，我们可以更好地将它们应用到我们自己的公司和业务中。特别是第三部分，提供了大量应用案例，让我们一起期待看到这些案例的结尾。1.简介达观数据是一家专注于智能文本机器人的国家高新技术企业，荣获中国人工智能领域最高奖“吴文俊人工智能奖”、中国青年创新创业大赛总冠军、ACMCIKM算法竞赛全球冠军、EMIHackathon数据竞赛全球冠军、全球三十大最佳创业公司、中国人工智能
2021年全国大学生数学建模竞赛 C题分析 mldl_ 数据建模
2021年全国大学生数据竞赛C题~~~C题生产企业原材料的订购与运输某建筑和装饰板材的生产企业所用原材料主要是木质纤维和其他植物素纤维材料,总体可分为A，B，C三种类型。该企业每年按48周安排生产，需要提前制定24周的原材料订购和转运计划，即根据产能要求确定需要订购的原材料供应商（称为“供应商”）和相应每周的原材料订购数量（称为“订货量”），确定第三方物流公司（称为“转运商”）并委托其将供应商每周
python机器学习笔记：ID3决策树算法实战 iFlyAI 机器学习人工智能推荐算法决策树机器学习算法
ID3算法是一种贪心算法，用来构造决策树，ID3算法起源于概念学习系统（CLS），以信息熵的下降速度为选取测试属性的标准，即在每一个节点选取还尚未被用来划分的具有最高信息增益的属性作为划分标准，然后继续这个过程，直到生成的决策树能完美的分类训练样例。在此之前，推荐大家可以多在FlyAI竞赛服务平台多参加训练和竞赛，以此来提升自己的能力。FlyAI是为AI开发者提供数据竞赛并支持GPU离线训练的一站
TensorFlow2.0 Keras介绍 weixin_40744639 tensorflow 学习 TensorFlow Keras
Keras简介keras现在是一个非常流行的工具库，包括tensorflow已经把keras合并到了自己的主代码当中了，大家可以直接tf.keras就可以直接调用其中的工具库了。单独讲keras的原因是因为keras有他独特的应用场景如实验室、数据竞赛等小型环境中，使用keras,工程师们可以将更多时间花在设计网络模型上而不是coding上，而且keras是所有工具库当中最容易上手的工具库之一。K
【2023年MathorCup高校数学建模挑战赛-大数据竞赛】赛道A：基于计算机视觉的坑洼道路检测和识别 python 代码解析 Better Bench 数学建模入门到精通数学建模大数据计算机视觉坑洼道路检测图像分类
【2023年MathorCup高校数学建模挑战赛-大数据竞赛】赛道A：基于计算机视觉的坑洼道路检测和识别python代码解析1题目坑洼道路检测和识别是一种计算机视觉任务，旨在通过数字图像（通常是地表坑洼图像）识别出存在坑洼的道路。这对于地．质勘探、航天科学和自然灾害等领域的研究和应用具有重要意义。例如，它可以帮助在地球轨道上识别坑洼，以及分析和模拟地球表面的形态。在坑洼道路检测任务中，传统的分类算
人工智能——猫狗大战 hahahd3 人工智能
人工智能——猫狗大战简介代码运行AI研习社测试总结简介Catsvs.Dogs（猫狗大战）是Kaggle大数据竞赛某一年的一道赛题，利用给定的数据集，用算法实现猫和狗的识别。我们希望通过对计算机进行大量的图片训练，使计算机可以学习识别到猫、狗的特征，最终可以对大量的未知图片进行分类。这就涉及到计算机视觉中的图像分类问题。图像分类，计算机视觉研究领域之一，计算机通过学习图像本身的特征将不同类别的图像区
【2023Mathorcup大数据】B题电商零售商家需求预测及库存优化问题 python代码解析 Better Bench 数学建模入门到精通数学建模妈妈杯大数据 mathorcup大数据电商零售需求预测库存优化问题
【2023Mathorcup大数据】B题电商零售商家需求预测及库存优化问题python代码解析1题目2023年MathorCup高校数学建模挑战赛——大数据竞赛赛道B：电商零售商家需求预测及库存优化问题电商平台存在着上千个商家，他们会将商品货物放在电商配套的仓库，电商平台会对这些货物进行统一管理。通过科学的管理手段和智能决策，大数据智能驱动的供应链可以显著降低库存成本，同时保证商品的按时履约。一般
2015阿里天池大数据竞赛解题源码 zhangxueyang1 综合
转自：http://sanwen8.cn/p/151ompp.html这篇文章记录2015阿里天池大数据竞赛中，CSDN博主@wphh的一些代码，由于代码分享时比赛正在进行中，基于规则，仅分享一个naivesolution，下面是代码的一些说明。有兴趣的请看代码注释。阿里天池大数据竞赛网址：http://tianchi.aliyun.com/competition/index.htm?spm=51
2023 年 MathorCup 高校数学建模挑战赛大数据竞赛（B题）|电商零售商家需求预测及库存优化问题|建模秘籍&文章代码思路大全 Mmmath_secret 数学建模大数据
铛铛！小秘籍来咯！小秘籍希望大家都能轻松建模呀，mathorcup比赛也会持续给大家放松思路滴~抓紧小秘籍，我们出发吧~来看看MathorCup大数据竞赛的B题问题重述问题一：需求量预测问题描述：根据历史六个月的需求量数据，预测各商家在各仓库的商品在2023年5月16日至2023年5月30日期间的需求量。需求量是商家、仓库和商品的组合，预测需要考虑不同组合的需求。数据：历史需求量数据（附件1）、商
2023年第四届MathorCup高校数学建模挑战赛——大数据竞赛A题热心网友俣先生数学建模大数据
赛道A：基于计算机视觉的坑洼道路检测和识别坑洼道路检测和识别是一种计算机视觉任务，旨在通过数字图像(通常是地表坑洼图像)识别出存在坑洼的道路。这对于地质勘探、航天科学和自然灾害等领域的研究和应用具有重要意义。例如，它可以帮助在地球轨道上识别坑洼，以及分析和模拟地球表面的形态。在坑洼道路检测任务中，传统的分类算法往往不能取得很好的效果，因为坑洼图像的特征往往是非常复杂和多变的。然而，近年来深度学习技
2023年MathorCup大数据竞赛赛道A：基于计算机视觉的坑洼道路检测和识别思路论文6 Hello NiKo 计算机视觉人工智能 2023 MathorCup 大数据竞赛思路论文
本专栏提供相关国内外论文文献参考,每题大约十几篇,持续更新学习自动捕捉全球道路场景图像中的坑洼在世界上任何铺砌方式中存在的几种道路危险中，坑洼是最烦人的之一，也涉及更高的维护成本。人们对自动检测这些技术和研究进步带来的危害。我们的研究工作从真实世界的道路图像中解决坑洼检测的挑战场景。主要的新颖性在于应用最新进展人工智能学习坑洼的视觉外观。我们构建了一个大型数据集带有坑洼注释的图像。它们包含来自不同
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 ([email protected]), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu

房价租金预测竞赛总结1：数据探索性分析