mumumuw

基于随机森林模型的红酒品质分析

文章目录

一、数据获取
- 1.1数据集基本信息
- 1.2数据具体情况
- 1.3导入数据集
二、预处理和探索
- 2.1查看数据基本情况
- 2.2处理数据集
- 2.3探索特征属性和目标属性的相关性
- 2.4清洗数据
- 2.5选取训练和测试数据
- 2.6标准化处理
三、机器学习建模
- 3.1机器学习模型选择
- 3.2训练模型
- 3.3预测结果判断
四、调参
五、整体代码
六、参考材料

一、数据获取

数据集：Wine Quality Data Set UCI葡萄酒数据集https://archive.ics.uci.edu/ml/datasets/wine+quality

通过网站上数据集的摘要了解数据集的基本情况吗，发现UCI葡萄酒数据集包括两份：葡萄牙北部的红色和白色葡萄酒样本

该样本常用于数据分析和机器学习分类等任务

选择红葡萄酒数据集进行分析

1.1数据集基本信息

Attribute Information:			#数据集中各属性的说明

For more information, read [Cortez et al., 2009].

Input variables (based on physicochemical tests):			#输入变量（特征属性），基于物理化学测试
1 - fixed acidity
2 - volatile acidity
3 - citric acid
4 - residual sugar				#残糖
5 - chlorides
6 - free sulfur dioxide
7 - total sulfur dioxide
8 - density
9 - pH							#pH值
10 - sulphates
11 - alcohol					#酒精度

Output variable (based on sensory data):					#输出变量（目标属性）
12 - quality (score between 0 and 10)		#葡萄酒的质量评分

1.2数据具体情况

1.3导入数据集

数据有表头，数据间用;隔开

利用pandas完成数据的读取和预处理

利用pandas模块中的read_csv()函数，并将其参数sep的值设为’;'就可以读取数据

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import GridSearchCV
import warnings
warnings.filterwarnings('ignore') 

try:        #读取数据
    wine = pd.read_csv('winequality-red.csv', sep = ';')    #将数据存在wine中，wine为DataFrame对象
except:
    print("Cannot find the file!")

二、预处理和探索

2.1查看数据基本情况

wine.info()  #查看数据基本情况
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1599 entries, 0 to 1598
Data columns (total 12 columns):
fixed acidity           1599 non-null float64
volatile acidity        1599 non-null float64
citric acid             1599 non-null float64
residual sugar          1599 non-null float64
chlorides               1599 non-null float64
free sulfur dioxide     1599 non-null float64
total sulfur dioxide    1599 non-null float64
density                 1599 non-null float64
pH                      1599 non-null float64
sulphates               1599 non-null float64
alcohol                 1599 non-null float64
quality                 1599 non-null int64
dtypes: float64(11), int64(1)
memory usage: 150.0 KB

2.2处理数据集

检查重复记录duplicated()检查Series或DataFrame对象是否有重复记录——有True，无False,返回结果用sum()方法计算总和就能获得重复的行数

wine.duplicated().sum()  #检查DataFrame是否有重复记录，并用sum()计算重复行数
Out[3]: 240

wine=wine.drop_duplicates()  #若有重复记录删除并重新赋值给wine对象

wine
Out[5]: 
      fixed acidity  volatile acidity   ...     alcohol  quality
0               7.4             0.700   ...         9.4        5
1               7.8             0.880   ...         9.8        5
2               7.8             0.760   ...         9.8        5
3              11.2             0.280   ...         9.8        6
5               7.4             0.660   ...         9.4        5
6               7.9             0.600   ...         9.4        5
7               7.3             0.650   ...        10.0        7
8               7.8             0.580   ...         9.5        7
9               7.5             0.500   ...        10.5        5
10              6.7             0.580   ...         9.2        5
12              5.6             0.615   ...         9.9        5
13              7.8             0.610   ...         9.1        5
14              8.9             0.620   ...         9.2        5
15              8.9             0.620   ...         9.2        5
16              8.5             0.280   ...        10.5        7
17              8.1             0.560   ...         9.3        5
18              7.4             0.590   ...         9.0        4
19              7.9             0.320   ...         9.2        6
20              8.9             0.220   ...         9.4        6
21              7.6             0.390   ...         9.7        5
22              7.9             0.430   ...         9.5        5
23              8.5             0.490   ...         9.4        5
24              6.9             0.400   ...         9.7        6
25              6.3             0.390   ...         9.3        5
26              7.6             0.410   ...         9.5        5
28              7.1             0.710   ...         9.4        5
29              7.8             0.645   ...         9.8        6
30              6.7             0.675   ...        10.1        5
31              6.9             0.685   ...        10.6        6
32              8.3             0.655   ...         9.8        5
            ...               ...   ...         ...      ...
1566            6.7             0.160   ...        11.2        6
1568            7.0             0.560   ...         9.2        5
1569            6.2             0.510   ...        11.5        6
1570            6.4             0.360   ...        12.4        6
1571            6.4             0.380   ...        11.1        6
1572            7.3             0.690   ...         9.5        5
1573            6.0             0.580   ...        12.5        6
1574            5.6             0.310   ...        10.5        6
1575            7.5             0.520   ...        11.8        6
1576            8.0             0.300   ...        10.8        6
1577            6.2             0.700   ...        11.9        6
1578            6.8             0.670   ...        11.3        6
1579            6.2             0.560   ...        11.3        5
1580            7.4             0.350   ...        11.9        6
1582            6.1             0.715   ...        11.9        5
1583            6.2             0.460   ...         9.8        5
1584            6.7             0.320   ...        11.6        7
1585            7.2             0.390   ...        11.5        6
1586            7.5             0.310   ...        11.4        6
1587            5.8             0.610   ...        10.9        6
1588            7.2             0.660   ...        12.8        6
1589            6.6             0.725   ...         9.2        5
1590            6.3             0.550   ...        11.6        6
1591            5.4             0.740   ...        11.6        6
1592            6.3             0.510   ...        11.0        6
1593            6.8             0.620   ...         9.5        6
1594            6.2             0.600   ...        10.5        5
1595            5.9             0.550   ...        11.2        6
1597            5.9             0.645   ...        10.2        5
1598            6.0             0.310   ...        11.0        6

[1359 rows x 12 columns]

简单查看目标属性quality,并查看quality属性每一类的分布情况，发现符合正态分布

wine.describe()  #查看数据基本信息
Out[6]: 
       fixed acidity  volatile acidity     ...           alcohol      quality
count    1359.000000       1359.000000     ...       1359.000000  1359.000000
mean        8.310596          0.529478     ...         10.432315     5.623252
std         1.736990          0.183031     ...          1.082065     0.823578
min         4.600000          0.120000     ...          8.400000     3.000000
25%         7.100000          0.390000     ...          9.500000     5.000000
50%         7.900000          0.520000     ...         10.200000     6.000000
75%         9.200000          0.640000     ...         11.100000     6.000000
max        15.900000          1.580000     ...         14.900000     8.000000

[8 rows x 12 columns]

wine.quality.value_counts()  #查看quality属性具体每一类有多少个值
Out[8]: 
5    577
6    535
7    167
4     53
8     17
3     10
Name: quality, dtype: int64

2.3探索特征属性和目标属性的相关性

通过相关性发现与volatile acidity和alcohol相关性比较大，前者为负相关，后者为正相关

再通过绘图查看每个quality值对应的volatile acidity和alcohol属性的均值的分布情况,直观的查看他们之间的相关性——使用seaborn模块的barplot()函数来处理

wine.corr().quality  #wine与属性之间的相关性
Out[11]: 
fixed acidity           0.119024
volatile acidity       -0.395214
citric acid             0.228057
residual sugar          0.013640
chlorides              -0.130988
free sulfur dioxide    -0.050463
total sulfur dioxide   -0.177855
density                -0.184252
pH                     -0.055245
sulphates               0.248835
alcohol                 0.480343
quality                 1.000000
Name: quality, dtype: float64

sns.barplot(x='quality',y='volatile acidity',data=wine)  #通过绘图查看均值的分布情况，了解相关性

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-deS3JuHd-1680958755074)(D:\typora\photo\volatile acidity.png)]

看到quality为8对应volatile acidity所有值的均值接近0.6，综合全部发现volatile acidity值越高，quality值越低

sns.barplot(x='quality',y='alcohol',data=wine)  #通过绘图查看均值的分布情况，了解相关性

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-JbQFA3RY-1680958755074)(D:\typora\photo\alcohol.png)]

看到quality为8对应alcohol所有值的均值接近12，综合全部发现alcohol值越高，quality值越高

属性与记录较少，不做数据归约

2.4清洗数据

若有一批新的红葡萄酒数据，通过物理化学测试得知fixed acidity、volatile acid、citric acid、residual sugar、chlorides、free sulfur dioxide、total sulfur dioxide、density 、pH、sulphates、alcohol去求quality

从数据分析得知quality值主要为6个3~8，类别较多，分类难度大，将多分类问题改为二分类问题

可将quality值[3,8]划分为两部分：[3,6]为质量一般，[7,8]质量很好，进行二值化处理，简化问题，判断新酒是属于质量一般/很好

以下程序将quality值进行3分类为low, medium, high

print(wine.info())
print(wine.describe())
wine = wine.drop_duplicates()

wine['quality'].value_counts().plot(kind = 'pie', autopct = '%.2f')
plt.show()

print(wine.corr().quality)

plt.subplot(121)
sns.barplot(x = 'quality', y = 'volatile acidity', data = wine)
plt.subplot(122)
sns.barplot(x = 'quality', y = 'alcohol', data = wine)
plt.show()

from sklearn.preprocessing import LabelEncoder
bins = (2, 4, 6, 8)  #设置待划分数据的bins，bin划分数据的方式为构成左开右闭区间,所以划分结果为(2,4](4,6](6,8]
group_names  = ['low', 'medium', 'high']  #定义bins划分后的组名
wine['quality_lb'] = pd.cut(wine['quality'], bins = bins, labels = group_names)  #使用pandas模块中的cut()函数将数据分箱

属性中多出quality_lb表示最后质量情况

wine
Out[15]: 
      fixed acidity  volatile acidity     ...      quality  quality_lb
0               7.4             0.700     ...            5      medium
1               7.8             0.880     ...            5      medium
2               7.8             0.760     ...            5      medium
3              11.2             0.280     ...            6      medium
5               7.4             0.660     ...            5      medium
6               7.9             0.600     ...            5      medium
7               7.3             0.650     ...            7        high
8               7.8             0.580     ...            7        high
9               7.5             0.500     ...            5      medium
10              6.7             0.580     ...            5      medium
12              5.6             0.615     ...            5      medium
13              7.8             0.610     ...            5      medium
14              8.9             0.620     ...            5      medium
15              8.9             0.620     ...            5      medium
16              8.5             0.280     ...            7        high
17              8.1             0.560     ...            5      medium
18              7.4             0.590     ...            4         low
19              7.9             0.320     ...            6      medium
20              8.9             0.220     ...            6      medium
21              7.6             0.390     ...            5      medium
22              7.9             0.430     ...            5      medium
23              8.5             0.490     ...            5      medium
24              6.9             0.400     ...            6      medium
25              6.3             0.390     ...            5      medium
26              7.6             0.410     ...            5      medium
28              7.1             0.710     ...            5      medium
29              7.8             0.645     ...            6      medium
30              6.7             0.675     ...            5      medium
31              6.9             0.685     ...            6      medium
32              8.3             0.655     ...            5      medium
            ...               ...     ...          ...         ...
1566            6.7             0.160     ...            6      medium
1568            7.0             0.560     ...            5      medium
1569            6.2             0.510     ...            6      medium
1570            6.4             0.360     ...            6      medium
1571            6.4             0.380     ...            6      medium
1572            7.3             0.690     ...            5      medium
1573            6.0             0.580     ...            6      medium
1574            5.6             0.310     ...            6      medium
1575            7.5             0.520     ...            6      medium
1576            8.0             0.300     ...            6      medium
1577            6.2             0.700     ...            6      medium
1578            6.8             0.670     ...            6      medium
1579            6.2             0.560     ...            5      medium
1580            7.4             0.350     ...            6      medium
1582            6.1             0.715     ...            5      medium
1583            6.2             0.460     ...            5      medium
1584            6.7             0.320     ...            7        high
1585            7.2             0.390     ...            6      medium
1586            7.5             0.310     ...            6      medium
1587            5.8             0.610     ...            6      medium
1588            7.2             0.660     ...            6      medium
1589            6.6             0.725     ...            5      medium
1590            6.3             0.550     ...            6      medium
1591            5.4             0.740     ...            6      medium
1592            6.3             0.510     ...            6      medium
1593            6.8             0.620     ...            6      medium
1594            6.2             0.600     ...            5      medium
1595            5.9             0.550     ...            6      medium
1597            5.9             0.645     ...            5      medium
1598            6.0             0.310     ...            6      medium

[1359 rows x 13 columns]

字符串不方便计算，使用preprocessing模块的LabelEncoder()函数分配标签

lb_quality = LabelEncoder()  #为quality_lb属性分配标签0，1，2对应low，medium，high   
wine['label'] = lb_quality.fit_transform(wine['quality_lb'])   #label属性为具体标签

属性中出现label表示具体质量登记标签

wine
Out[19]: 
      fixed acidity  volatile acidity  ...    quality_lb  label
0               7.4             0.700  ...        medium      2
1               7.8             0.880  ...        medium      2
2               7.8             0.760  ...        medium      2
3              11.2             0.280  ...        medium      2
5               7.4             0.660  ...        medium      2
6               7.9             0.600  ...        medium      2
7               7.3             0.650  ...          high      0
8               7.8             0.580  ...          high      0
9               7.5             0.500  ...        medium      2
10              6.7             0.580  ...        medium      2
12              5.6             0.615  ...        medium      2
13              7.8             0.610  ...        medium      2
14              8.9             0.620  ...        medium      2
15              8.9             0.620  ...        medium      2
16              8.5             0.280  ...          high      0
17              8.1             0.560  ...        medium      2
18              7.4             0.590  ...           low      1
19              7.9             0.320  ...        medium      2
20              8.9             0.220  ...        medium      2
21              7.6             0.390  ...        medium      2
22              7.9             0.430  ...        medium      2
23              8.5             0.490  ...        medium      2
24              6.9             0.400  ...        medium      2
25              6.3             0.390  ...        medium      2
26              7.6             0.410  ...        medium      2
28              7.1             0.710  ...        medium      2
29              7.8             0.645  ...        medium      2
30              6.7             0.675  ...        medium      2
31              6.9             0.685  ...        medium      2
32              8.3             0.655  ...        medium      2
            ...               ...  ...           ...    ...
1566            6.7             0.160  ...        medium      2
1568            7.0             0.560  ...        medium      2
1569            6.2             0.510  ...        medium      2
1570            6.4             0.360  ...        medium      2
1571            6.4             0.380  ...        medium      2
1572            7.3             0.690  ...        medium      2
1573            6.0             0.580  ...        medium      2
1574            5.6             0.310  ...        medium      2
1575            7.5             0.520  ...        medium      2
1576            8.0             0.300  ...        medium      2
1577            6.2             0.700  ...        medium      2
1578            6.8             0.670  ...        medium      2
1579            6.2             0.560  ...        medium      2
1580            7.4             0.350  ...        medium      2
1582            6.1             0.715  ...        medium      2
1583            6.2             0.460  ...        medium      2
1584            6.7             0.320  ...          high      0
1585            7.2             0.390  ...        medium      2
1586            7.5             0.310  ...        medium      2
1587            5.8             0.610  ...        medium      2
1588            7.2             0.660  ...        medium      2
1589            6.6             0.725  ...        medium      2
1590            6.3             0.550  ...        medium      2
1591            5.4             0.740  ...        medium      2
1592            6.3             0.510  ...        medium      2
1593            6.8             0.620  ...        medium      2
1594            6.2             0.600  ...        medium      2
1595            5.9             0.550  ...        medium      2
1597            5.9             0.645  ...        medium      2
1598            6.0             0.310  ...        medium      2

[1359 rows x 14 columns]

用value_counts()方法再统计新类别的分布

wine.label.value_counts()
Out[20]: 
2    1112
0     184
1      63
Name: label, dtype: int64

对数据进行处理

wine_copy = wine.copy()
wine.drop(['quality', 'quality_lb'], axis = 1, inplace = True)  #对wine数据属性进行简化，留下label属性

通过数据选择的方式将特征属性和目标属性分开存入X，y

X = wine.iloc[:,:-1]  #存储特征属性
y = wine.label  #存储目标属性

X
Out[22]: 
      fixed acidity  volatile acidity   ...     sulphates  alcohol
0               7.4             0.700   ...          0.56      9.4
1               7.8             0.880   ...          0.68      9.8
2               7.8             0.760   ...          0.65      9.8
3              11.2             0.280   ...          0.58      9.8
5               7.4             0.660   ...          0.56      9.4
6               7.9             0.600   ...          0.46      9.4
7               7.3             0.650   ...          0.47     10.0
8               7.8             0.580   ...          0.57      9.5
9               7.5             0.500   ...          0.80     10.5
10              6.7             0.580   ...          0.54      9.2
12              5.6             0.615   ...          0.52      9.9
13              7.8             0.610   ...          1.56      9.1
14              8.9             0.620   ...          0.88      9.2
15              8.9             0.620   ...          0.93      9.2
16              8.5             0.280   ...          0.75     10.5
17              8.1             0.560   ...          1.28      9.3
18              7.4             0.590   ...          0.50      9.0
19              7.9             0.320   ...          1.08      9.2
20              8.9             0.220   ...          0.53      9.4
21              7.6             0.390   ...          0.65      9.7
22              7.9             0.430   ...          0.91      9.5
23              8.5             0.490   ...          0.53      9.4
24              6.9             0.400   ...          0.63      9.7
25              6.3             0.390   ...          0.56      9.3
26              7.6             0.410   ...          0.59      9.5
28              7.1             0.710   ...          0.55      9.4
29              7.8             0.645   ...          0.59      9.8
30              6.7             0.675   ...          0.54     10.1
31              6.9             0.685   ...          0.57     10.6
32              8.3             0.655   ...          0.66      9.8
            ...               ...   ...           ...      ...
1566            6.7             0.160   ...          0.71     11.2
1568            7.0             0.560   ...          0.59      9.2
1569            6.2             0.510   ...          0.57     11.5
1570            6.4             0.360   ...          0.93     12.4
1571            6.4             0.380   ...          0.65     11.1
1572            7.3             0.690   ...          0.51      9.5
1573            6.0             0.580   ...          0.67     12.5
1574            5.6             0.310   ...          0.48     10.5
1575            7.5             0.520   ...          0.64     11.8
1576            8.0             0.300   ...          0.78     10.8
1577            6.2             0.700   ...          0.60     11.9
1578            6.8             0.670   ...          0.67     11.3
1579            6.2             0.560   ...          0.60     11.3
1580            7.4             0.350   ...          0.60     11.9
1582            6.1             0.715   ...          0.50     11.9
1583            6.2             0.460   ...          0.62      9.8
1584            6.7             0.320   ...          0.80     11.6
1585            7.2             0.390   ...          0.84     11.5
1586            7.5             0.310   ...          0.85     11.4
1587            5.8             0.610   ...          0.66     10.9
1588            7.2             0.660   ...          0.78     12.8
1589            6.6             0.725   ...          0.54      9.2
1590            6.3             0.550   ...          0.82     11.6
1591            5.4             0.740   ...          0.56     11.6
1592            6.3             0.510   ...          0.75     11.0
1593            6.8             0.620   ...          0.82      9.5
1594            6.2             0.600   ...          0.58     10.5
1595            5.9             0.550   ...          0.76     11.2
1597            5.9             0.645   ...          0.71     10.2
1598            6.0             0.310   ...          0.66     11.0

[1359 rows x 11 columns]

y
Out[23]: 
0       2
1       2
2       2
3       2
5       2
6       2
7       0
8       0
9       2
10      2
12      2
13      2
14      2
15      2
16      0
17      2
18      1
19      2
20      2
21      2
22      2
23      2
24      2
25      2
26      2
28      2
29      2
30      2
31      2
32      2
       ..
1566    2
1568    2
1569    2
1570    2
1571    2
1572    2
1573    2
1574    2
1575    2
1576    2
1577    2
1578    2
1579    2
1580    2
1582    2
1583    2
1584    0
1585    2
1586    2
1587    2
1588    2
1589    2
1590    2
1591    2
1592    2
1593    2
1594    2
1595    2
1597    2
1598    2
Name: label, Length: 1359, dtype: int64

2.5选取训练和测试数据

将数据划分为数据集和训练集，使用train_test_split()函数，该函数可随机地从样本中按比例选取训练数据和测试数据，test_size参数用来设置测试集的比例

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2)  #设置测试集比例为20%

2.6标准化处理

数据规范化处理，对特征属性的训练集和测试集用scale()函数进行了标准化处理

from sklearn.preprocessing import scale     
X_train = scale(X_train)
X_test = scale(X_test)

三、机器学习建模

3.1机器学习模型选择

随机森林(Random Forest)是一中机器学习模型，是一种集成学习(Ensemble Learning)算法

集成学习即构建并结合多个学习器来完成学习任务

随机森林模型属于并行式集成学习代表Bagging类型

具体做法为：对原始数据集进行多次随机采样，得到多个不同的采样集，然后基于每个采样集训练一个决策树基学习器，再将这些基学习器进行结合，最终通过投票或取均值等方式使得模型获得较高的精准度和泛化性能

3.2训练模型

利用RandomForestClassifier()函数构建一个分类器，n_estimators参数是指在利用最大投票数或均值来预测前想要建立决策时的子树的数量（因为是基学习器），通常较多的子树，可以让模型有更好的性能

from sklearn.metrics import confusion_matrix

rfc = RandomForestClassifier(n_estimators = 200)  #构建分类器
rfc.fit(X_train, y_train)  #基于训练集进行学习
y_pred = rfc.predict(X_test)  #利用predict()方法，基于测试集的X部分数据(X_test)进行预测
print(confusion_matrix(y_test, y_pred))  #将预测效果与实际的y值比较，用常规的混淆矩阵来观察

3.3预测结果判断

混淆矩阵是一种算法性能的可视化呈现，每一列代表预测值，每一行代表实际的类别

#分类结果的混淆矩阵
[[ 16   0  19]		#16为类别0（high）判断正确的个数，19为本来是类别0但被误判为类别2，类别0的总个数为16+19
 [  0   1  10]
 [  8   1 217]]

对角线上的个数为正确判断出类别的数据记录条数，其他位置为类别误判的条数，对角线上的值占总数越大表示分类效果越好

四、调参

用GridSearchCV去调参需要人工选择的参数成为超参数(随机森林当中决策树的个数即前面的n_estinmators参数对应的值)

GridSearchCV函数实则为暴力搜索，将参数输入就可以给出最优化的结果和参数，适用于小数据集

grid_rfc = GridSearchCV(rfc, param_rfc, iid = False, cv = 5)  #调参
grid_rfc.fit(X_train, y_train)
best_param_rfc = grid_rfc.best_params_
print(best_param_rfc)  #保存取得最佳结果的参数的组合
#基于最佳参数组合重新训练模型，预测结果
rfc = RandomForestClassifier(n_estimators = best_param_rfc['n_estimators'], criterion = best_param_rfc['criterion'], random_state=0)
rfc.fit(X_train, y_train)
y_pred = rfc.predict(X_test)
print(confusion_matrix(y_test, y_pred))

{'criterion': 'gini', 'n_estimators': 60}
[[ 16   0  30]
 [  0   0  13]
 [  6   0 207]]

五、整体代码

# -*- coding: utf-8 -*-
"""
winequality-red data mining

@author: Dazhuang
"""
# url: https://archive.ics.uci.edu/ml/datasets/Wine+Quality
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import GridSearchCV
import warnings
warnings.filterwarnings('ignore') 

try:        #读取数据
    wine = pd.read_csv('winequality-red.csv', sep = ';')    #将数据存在wine中，wine为DataFrame对象
except:
    print("Cannot find the file!")

print(wine.info())
print(wine.describe())
wine = wine.drop_duplicates()

wine['quality'].value_counts().plot(kind = 'pie', autopct = '%.2f')
plt.show()

print(wine.corr().quality)

plt.subplot(121)
sns.barplot(x = 'quality', y = 'volatile acidity', data = wine)
plt.subplot(122)
sns.barplot(x = 'quality', y = 'alcohol', data = wine)
plt.show()

from sklearn.preprocessing import LabelEncoder
bins = (2, 4, 6, 8)  #设置待划分数据的bins，bin划分数据的方式为构成左开右闭区间,所以划分结果为(2,4](4,6](6,8]
group_names  = ['low', 'medium', 'high']  #定义bins划分后的组名
wine['quality_lb'] = pd.cut(wine['quality'], bins = bins, labels = group_names)  #使用pandas模块中的cut()函数将数据分箱

lb_quality = LabelEncoder()  #字符串不方便计算，为quality_lb属性分配标签0，1，2对应low，medium，high   
wine['label'] = lb_quality.fit_transform(wine['quality_lb'])   #label属性为具体标签

print(wine.label.value_counts())

wine_copy = wine.copy()
wine.drop(['quality', 'quality_lb'], axis = 1, inplace = True)  #对wine数据属性进行简化，留下label属性

X = wine.iloc[:,:-1]  #存储特征属性
y = wine.label  #存储目标属性

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2)  #设置测试集比例为20%

from sklearn.preprocessing import scale     
X_train = scale(X_train)
X_test = scale(X_test)

from sklearn.metrics import confusion_matrix

rfc = RandomForestClassifier(n_estimators = 200)  #构建分类器
rfc.fit(X_train, y_train)  #基于训练集进行学习
y_pred = rfc.predict(X_test)  #利用predict()方法，基于测试集的X部分数据(X_test)进行预测
print(confusion_matrix(y_test, y_pred))  #将预测效果与实际的y值比较，用常规的混淆矩阵来观察

param_rfc = {  #选择要调参的参数
            "n_estimators": [10,20,30,40,50,60,70,80,90,100,150,200],
            "criterion": ["gini", "entropy"]
            }
grid_rfc = GridSearchCV(rfc, param_rfc, iid = False, cv = 5)  #调参
grid_rfc.fit(X_train, y_train)
best_param_rfc = grid_rfc.best_params_
print(best_param_rfc)  #保存取得最佳结果的参数的组合
#基于最佳参数组合重新训练模型，预测结果
rfc = RandomForestClassifier(n_estimators = best_param_rfc['n_estimators'], criterion = best_param_rfc['criterion'], random_state=0)
rfc.fit(X_train, y_train)
y_pred = rfc.predict(X_test)
print(confusion_matrix(y_test, y_pred))

六、参考材料

[1]用Python玩转数据

你可能感兴趣的:(用Python玩转数据学习记录,随机森林,python,pandas)

从零构建智能ai语音助手：ESP32s3+Python+大语言模型实战指南
从零构建智能ai语音助手：ESP32s3+Python+大语言模型实战指南一、项目概述大家好！今天给大家带来一个干货满满的实战项目——基于ESP32S3硬件和Python后端的智能语音助手系统。这个项目将物联网技术与AI技术完美结合，打造一个可以实时对话、意图识别的智能语音交互系统。相比传统的离线语音系统只能识别固定命令词，我们这套系统可以：实现自然语言理解，支持多种表达方式无需预设固定命令词，更
视觉算法之卷积神经网络清风AI 深度学习算法详解及代码复现计算机视觉 cnn 神经网络深度学习 python 课程设计毕业设计
定义与特点卷积神经网络(ConvolutionalNeuralNetwork,CNN)是一种专为处理具有网格结构的数据而设计的深度学习模型。其独特的结构和功能使其在图像处理、语音识别等领域展现出卓越的性能:CNN的核心设计理念源于对生物视觉系统的模仿。通过模拟大脑皮层中视网膜和视觉皮层的层次化结构,CNN能够有效地捕捉图像中的局部特征并逐步抽象为高层语义信息。这种设计使得CNN特别擅长处理图像和音
nRF52832 低功耗设计与优化 mftang zephyr架构蓝牙应用笔记 Nordic MCU系列笔记 Zephyr RTOS zephyr架构蓝牙应用笔记
目录概述1技术背景2优化策略2.1系统级电源管理2.2时钟系统优化2.3GPIO配置优化3蓝牙协议栈优化3.1连接参数优化3.2广播优化4电源管理实践4.1功耗状态转换图4.2典型功耗分布5低功耗设计最佳实践5.1事件驱动架构5.2定时任务管理5.3数据批处理6高级优化技术6.1电压调节优化6.2RAM保持策略6.3动态功耗分析7功耗测量与验证8常见问题解决8.1功耗高于预期8.2唤醒延迟过长8.
mac 安装docker,完美解决 Ai君臣 docker docker macos 运维
1、下载安装最可靠brewinstall不建议用，如果用brewinstall正常，那就不用看后面的2、现象docker.errors.DockerException:ErrorwhilefetchingserverAPIversion:(‘Connectionaborted.‘,File原因：就是docker没安装好macos版本：macosCatalina10.15到这个网站DockerDes
第二十八：Fiddler抓包-抓取Android7.0以上的Https包(三)-夜神模拟器+Xposed+JustTrustMe 卢卡平头哥 Fiddler fiddler https android
一.简介1.二次加密：有的APP，在涉及到关键数据通信时，会将正文二次加密后才通过HTTPS发送1.1.抓包抓到的是一堆二进制base642.自带HTTPClient：像支付宝那样的变态，自己带一个基于so的HTTPClient库2.1.对于关键数据，都不走URLConnection和OkHttp，而是走自己的HTTPClient库2.2.甚至一些
教你如何用 localStorage+Vue 状态管理玩转数据持久化！
收藏点赞关注不迷路！教你如何用localStorage+Vue状态管理玩转数据持久化！在Vue项目中，我们经常使用状态管理（如Vuex或Pinia）来管理用户登录状态、主题、页面设置等全局数据。但很多朋友会遇到一个问题：“我刷新页面之后，状态就丢了啊！”这时候，localStorage就是你的好搭档！它能让你在用户刷新页面或关闭浏览器后，还能保留关键数据。今天我们就来聊聊：如何优雅地将localS
Python 领域 pytest 的测试用例的可维护性设计
Python领域pytest的测试用例的可维护性设计关键词：pytest、测试用例、可维护性、测试框架、自动化测试、测试设计模式、重构摘要：本文深入探讨了如何在Python测试框架pytest中设计可维护的测试用例。我们将从测试用例可维护性的核心原则出发，分析pytest的特性和最佳实践，介绍多种提高测试代码可维护性的设计模式和技巧。文章包含实际代码示例、项目实战案例以及可维护性评估指标，帮助开发
数据链路层 Ragef 网络 MTU ARP
目录以太网以太网帧格式MTUMTU与IP、UDP\TCP的影响IPUDPTCPARP协议ARP工作流程ARP数据报的格式以太网"以太网"不是一种具体的网络,而是一种技术标准以太网是当前应用最广泛的局域网技术;和以太网并列的还有令牌环网,无线LAN等以太网帧格式帧格式如下图所示：目的地址：接收方的MAC地址，用于标识帧的目的地。源地址：发送方的MAC地址，用于标识帧的来源。类型：这个字段指示帧中封装
FastAPI依赖注入：构建高可维护API的核心理念与实战源滚滚AI编程 fastapi log4j
依赖注入（DependencyInjection,DI）作为FastAPI的核心设计模式，通过解耦组件依赖关系、提升代码复用性和可测试性，已成为现代API开发的基石。本文将深入解析其工作原理、高级特性及企业级应用场景。一、依赖注入的核心价值解耦与模块化将数据库连接、认证逻辑等基础设施与业务逻辑分离，避免代码冗余。示例：路由函数无需手动创建数据库连接，通过Depends(get_db)自动注入[ci
【AI大模型】深入解析预训练：大模型时代的核心引擎我爱一条柴ya 学习AI记录深度学习人工智能 ai python AI编程算法
预训练已成为现代人工智能，尤其是自然语言处理和计算机视觉领域的基石技术。它彻底改变了模型开发范式，催生了BERT、GPT等革命性模型。本文将系统阐述预训练的核心概念、原理、方法、应用及挑战。一、预训练的本质：为何需要它？核心问题：数据标注的瓶颈监督学习依赖海量高质量标注数据，获取成本极高（时间、金钱、专业知识）。对于复杂任务（如理解语义、生成文本），标注难度呈指数级上升。标注数据稀缺导致模型泛化能
MySQL存储结构深度解析：Buffer Pool与Page管理 hdzw20 mysql复习 mysql 数据库
MySQL存储结构解析：BufferPool与Page管理在MySQL的InnoDB存储引擎中，BufferPool是其核心组件之一，它极大地提升了数据库的性能。理解BufferPool的内部结构和工作机制，对于优化MySQL数据库至关重要。本文将讨论BufferPool的结构、三大链表、改进型LRU算法以及ChangeBuffer机制。1.BufferPool结构：控制块与缓存页BufferPo
广州曼顿2P数字微断：保护电力设备的安全守护者 mdkk678 安全
在现代社会，电力设备的安全运行对各行各业至关重要。然而，电力系统中存在各种电压波动、过载和短路等问题，可能对设备造成损害。为了保护电力设备免受这些问题的影响，广州曼顿推出了2P数字微断器。本文将介绍这一创新产品的特点和优势，以及它对电力设备的保护作用。广州曼顿科技有限公司专注用户侧智慧数字电气产品研制，以及智慧电能服务大数据云平台建设。基于人工智能技术，大幅提升人触电时的生命安全保障，以及电气火灾
Python爬虫小白入门指南，成为大牛必须经历的三个阶段
学习任何一门技术，都应该带着目标去学习，目标就像一座灯塔，指引你前进，很多人学着学着就学放弃了，很大部分原因是没有明确目标，所以，一定要明确学习目的，在你准备学爬虫前，先问问自己为什么要学习爬虫。有些人是为了一份工作，有些人是为了好玩，也有些人是为了实现某个黑科技功能。不过可以肯定的是，学会了爬虫能给你的工作提供很多便利。小白入门必读作为零基础小白，大体上可分为三个阶段去实现。第一阶段是入门，掌握
如何设计可扩展的后端系统架构？破碎的天堂鸟学习教程系统架构
设计可扩展的后端系统架构需综合考虑核心原则、架构模式、扩展策略、数据存储、容错机制及监控体系。以下是基于行业实践的详细指南：一、可扩展架构的核心原则无状态性（Statelessness）服务不保存客户端状态，请求可被任意实例处理，便于水平扩展。实现：通过负载均衡器（如Nginx、HAProxy）分发请求至多个无状态实例。松散耦合（LooseCoupling）模块间通过API或消息队列通信，减少依赖
一文详解：使用HTTPS有哪些优势？ JoySSL303 https 网络协议 http ssl 网络
互联网发展到今天，HTTP协议的明文传输会让用户存在非常大的安全隐患。试想一下，假如你在一个HTTP协议的网站上面购物，你需要在页面上输入你的银行卡号和密码，然后你把数据提交到服务器实现购买。假如这个环节稍有不慎，你的传输数据被第三者给截获了，由于HTTP明文数据传输的原因，你的银行卡号和密码，将会被这个截获人所得到。现在你还敢在一个HTTP的网站上面购物吗？你还会在一个HTTP的网站上面留下你的
AI+区块链：代购系统如何破解碳足迹追踪“数据黑箱”？
绿色电商趋势：代购系统如何实现碳足迹追踪与可持续物流？在全球气候危机与可持续发展目标的双重驱动下，绿色电商正从概念走向实践。作为跨境电商的核心环节，代购系统如何通过技术创新实现碳足迹追踪与可持续物流，成为行业突破增长瓶颈、构建差异化竞争力的关键。本文结合技术架构、行业实践与未来趋势，解析代购系统在绿色转型中的路径选择。一、碳足迹追踪：从数据孤岛到全链路透明1.技术架构：区块链+IoT构建可信数据链
Three.js 实现导出模型文件（.glb,.gltf）功能 GLTFExporter
Three.js提供了导出（.glb,.gltf）文件的APIGLTFExporter用于实现场景内容导出模型文件的功能导出模型文件主要使用parse方法，该方法接收三个参数：1.scene：要导出的场景对象。2.onComplete：解析完成后的回调函数，接收一个参数result，表示解析后的glTF数据。3.options：可选参数，用于配置导出的选项。下面是options的一些常用参数选项：
python 包管理工具uv
uv--versionuvpythonfinduvpythonlistexportUV_DEFAULT_INDEX="https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple"#换成私有的repoexportUV_HTTP_TIMEOUT=120uvpythoninstall3.12uvvenvmyenv--python3.12--seeduvhtt
Python通关秘籍之基础教程(一） Smile丶Life丶 Python 通关指南：从零基础到高手之路 python 开发语言后端
引言在编程的世界里，Python就像一位温和而强大的导师，它以简洁优雅的语法和强大的功能吸引着无数初学者和专业人士。无论你是想开发网站、分析数据、构建人工智能，还是仅仅想学习编程思维，Python都是你的理想选择。Python的魅力在于它的易读性和广泛的应用场景。它的代码就像英语句子一样自然，即使是完全没有编程经验的人也能快速上手。同时，Python拥有庞大的生态系统，从Web开发（Django、
Python 包管理工具（uv） cliffordl python python uv 开发语言
Python虚拟环境（conda）Python虚拟环境（venv）Python包管理工具（uv）文章目录1.uv的特点2.安装uv2.1.使用官方推荐方式2.2.使用pip安装（Python>=3.8）2.3.使用conda/mamba安装3.基本使用方法3.1.初始化项目并创建虚拟环境3.1.1.CMD运行结果3.1.2.VScode运行结果3.2.安装依赖3.3.生成依赖文件3.4.使用pyp
Python协程从入门到精通：9个案例解析yield、gevent与asyncio实战 python_chai Python python 开发语言协程并发 yield生成器 gerrnlet gevent
引言痛点分析：传统多线程在高并发场景下的性能瓶颈。协程优势：轻量级、高并发、低资源消耗。本文目标：通过9个代码案例，系统讲解协程的核心技术和应用场景。目录引言1.协程基础：理解yield生成器1.1yield的暂停与恢复机制1.2生产者-消费者模型实战1.3双向通信：send()方法详解2.手动协程控制：greenlet进阶2.1greenlet的显式切换原理2.2多任务协作案例3.自动化协程：g
数据结构：位图顾小玙数据结构算法
目录问题引入位图定义相关整型位操作疑点位运算C++库里的bitset实现应用优缺点问题引入有一道经典的面试题：有40亿个无序无符号整数，要求你高效判断一个数是否在这堆数中。想法一：暴力查找似乎能够解决问题，但显然找一次就要消耗O(N)的时间，这是不能接受的；想法二：问题的本质是查找，因此想到使用高效的二分查找：先进行一次O(NlogN)的排序，之后的每次查找都只要O(logN)。想法二的改进很不错
PHP安全编程实践系列（三）：安全会话管理与防护策略软考和人工智能学堂 php #php程序设计经验 php 安全开发语言
前言会话管理是Web应用安全的核心环节，不安全的会话实现可能导致用户账户被劫持、敏感数据泄露等严重后果。本文将深入探讨PHP中的会话安全机制，分析常见会话攻击手段，并提供全面的防护策略和实践方案。一、会话安全基础1.1PHP会话机制工作原理理论：PHP会话是通过会话ID（SessionID）在服务器和客户端之间维持状态的一种机制。关键流程包括：会话初始化：session_start()调用会话ID
Python爬虫在社交平台数据挖掘中的应用：深入探索用户互动程序员威哥 python 爬虫数据挖掘
引言社交媒体已经成为全球用户互动的主要平台，每天都有大量的信息生成，用户之间的互动行为如点赞、评论、分享、转发等构成了宝贵的数据资源。如何利用这些互动数据为商业决策、用户行为分析以及产品优化提供支持，已经成为数据科学与大数据分析领域的一个重要课题。Python作为一款强大的编程语言，凭借其丰富的爬虫库和数据分析工具，已经成为挖掘社交平台数据的重要工具。在本文中，我们将通过Python爬虫技术，深入
Python 爬虫实战：精准抓取母婴电商平台数据，深入分析用户评价洞察市场趋势程序员威哥最新爬虫实战项目 python 爬虫开发语言
前言随着生活水平的提高，越来越多的年轻父母开始关注母婴产品的质量和品牌。而母婴电商平台成为了他们选择和购买产品的主要渠道之一。母婴产品市场也因此变得异常活跃且充满竞争。在这样的市场环境下，用户评价不仅反映了产品的实际质量，也揭示了消费者的需求和偏好，成为品牌决策的核心依据之一。Python爬虫是获取电商平台用户评价数据、产品详情、价格等关键信息的强大工具。通过抓取和分析这些数据，品牌商可以实时了解
*Python爬虫应用：从社交媒体数据中提取有价值的用户行为洞察程序员威哥 python 爬虫媒体
引言在现代数字化时代，社交媒体已成为获取用户行为数据的重要来源。每秒钟，数百万条信息在平台上传播，用户的互动行为——点赞、评论、分享、关注等，构成了大量宝贵的行为数据。企业和个人通过分析这些数据，不仅可以理解用户需求、改进产品，还能精准制定营销策略。然而，如何高效地抓取、分析并从中提取有价值的用户行为洞察？这正是Python爬虫和数据分析技术的优势所在。本文将介绍如何利用Python爬虫从社交媒体
Python异步编程终极指南：用协程与事件循环重构你的高并发系统
title:Python异步编程终极指南：用协程与事件循环重构你的高并发系统date:2025/2/24updated:2025/2/24author:cmdragonexcerpt:深入剖析Python异步编程的核心机制。你将掌握：\n事件循环的底层实现原理与调度算法\nasync/await协程的6种高级用法模式\n异步HTTP请求的性能优化技巧（速度提升15倍+）\n常见异步陷阱的26种解决
python 异步编程：协程与 asyncio 花_城 Python 开发语言后端异步协程
文章目录一、协程（coroutine）1.1协程的概念1.2实现协程的方式二、asyncio异步编程2.1事件循环2.2快速上手2.3运行协程2.4await关键字2.5可等待对象2.5.1协程2.5.2任务（Task）2.5.3asyncio.Future三、concurrent.futures.Future（补充）3.1爬虫案例（asyncio+不支持异步的模块）四、asyncio异步迭代器五
【实战派×学院派】32｜上线后一堆优化需求，到底是 Bug 还是改进？郭菁菁 (BA/PM)实战派常踩的坑学院派如何补上 bug 业务分析需求分析 BA
学院派：用Bug/Enhancement分类机制+优化反馈池+二次迭代评审机制，避免优化失控、节奏紊乱你是不是也遇到过这样的场景：“这个报表逻辑不太合理，麻烦调整下。”“那个按钮位置不合适，顺便挪一挪吧。”“这个功能可以加个提醒吗？体验会好一点。”项目刚上线没多久，各路优化意见像潮水一样涌来。最让人头疼的是：到底这些算Bug（缺陷）还是Enhancement（优化改进）？该优先处理哪个？哪些该打回
突破性能瓶颈，几个高性能Python网络框架，高效实现网络应用
引言随着互联网和大数据时代的到来，高性能网络应用的需求日益增加。Python作为一种流行的编程语言，在高性能网络编程领域也具有广泛的应用。本文将深入探讨基于Python的几种高性能网络框架，分析它们各自的优势和适用场景，帮助开发者选择最适合自己需求的网络框架这里插播一条粉丝福利，如果你正在学习Python或者有计划学习Python，想要突破自我，对未来十分迷茫的，可以点击这里获取最新的Python
Nginx负载均衡 510888780 nginx 应用服务器
Nginx负载均衡一些基础知识: nginx 的 upstream目前支持 4 种方式的分配 1)、轮询（默认）每个请求按时间顺序逐一分配到不同的后端服务器，如果后端服务器down掉，能自动剔除。 2)、weight 指定轮询几率，weight和访问比率成正比
RedHat 6.4 安装 rabbitmq bylijinnan erlang rabbitmq redhat
在 linux 下安装软件就是折腾，首先是测试机不能上外网要找运维开通，开通后发现测试机的 yum 不能使用于是又要配置 yum 源，最后安装 rabbitmq 时也尝试了两种方法最后才安装成功机器版本： [root@redhat1 rabbitmq]# lsb_release LSB Version: :base-4.0-amd64:base-4.0-noarch:core
FilenameUtils工具类 eksliang FilenameUtils common-io
转载请出自出处：http://eksliang.iteye.com/blog/2217081 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
xml文件解析SAX 不懂事的小屁孩 xml
xml文件解析:xml文件解析有四种方式， 1.DOM生成和解析XML文档(SAX是基于事件流的解析) 2.SAX生成和解析XML文档(基于XML文档树结构的解析) 3.DOM4J生成和解析XML文档 4.JDOM生成和解析XML 本文章用第一种方法进行解析，使用android常用的DefaultHandler import org.xml.sax.Attributes;
通过定时任务执行mysql的定期删除和新建分区，此处是按日分区酷的飞上天空 mysql
使用python脚本作为命令脚本，linux的定时任务来每天定时执行 #!/usr/bin/python # -*- coding: utf8 -*- import pymysql import datetime import calendar #要分区的表 table_name = 'my_table' #连接数据库的信息 host,user,passwd,db =
如何搭建数据湖架构？听听专家的意见蓝儿唯美架构
Edo Interactive在几年前遇到一个大问题：公司使用交易数据来帮助零售商和餐馆进行个性化促销，但其数据仓库没有足够时间去处理所有的信用卡和借记卡交易数据 “我们要花费27小时来处理每日的数据量，”Edo主管基础设施和信息系统的高级副总裁Tim Garnto说道：“所以在2013年，我们放弃了现有的基于PostgreSQL的关系型数据库系统，使用了Hadoop集群作为公司的数
spring学习——控制反转与依赖注入 a-john spring
控制反转（Inversion of Control，英文缩写为IoC）是一个重要的面向对象编程的法则来削减计算机程序的耦合问题，也是轻量级的Spring框架的核心。控制反转一般分为两种类型，依赖注入（Dependency Injection，简称DI）和依赖查找（Dependency Lookup）。依赖注入应用比较广泛。
用spool+unixshell生成文本文件的方法 aijuans xshell
例如我们把scott.dept表生成文本文件的语句写成dept.sql,内容如下: 　　set pages 50000; 　　set lines 200; 　　set trims on; 　　set heading off; 　　spool /oracle_backup/log/test/dept.lst; 　　select deptno||','||dname||','||loc
1、基础--名词解析(OOA/OOD/OOP) asia007 学习基础知识
OOA:Object-Oriented Analysis（面向对象分析方法）是在一个系统的开发过程中进行了系统业务调查以后，按照面向对象的思想来分析问题。OOA与结构化分析有较大的区别。OOA所强调的是在系统调查资料的基础上，针对OO方法所需要的素材进行的归类分析和整理，而不是对管理业务现状和方法的分析。　　OOA（面向对象的分析）模型由5个层次（主题层、对象类层、结构层、属性层和服务层）
浅谈java转成json编码格式技术百合不是茶 json编码 java转成json编码
json编码;是一个轻量级的数据存储和传输的语言在java中需要引入json相关的包,引包方式在工程的lib下就可以了 JSON与JAVA数据的转换（JSON 即 JavaScript Object Natation，它是一种轻量级的数据交换格式，非常适合于服务器与 JavaScript 之间的数据的交
web.xml之Spring配置(基于Spring+Struts+Ibatis) bijian1013 java web.xml SSI spring配置
指定Spring配置文件位置 <context-param> <param-name>contextConfigLocation</param-name> <param-value> /WEB-INF/spring-dao-bean.xml,/WEB-INF/spring-resources.xml, /WEB-INF/
Installing SonarQube（Fail to download libraries from server） sunjing Install Sonar
1. Download and unzip the SonarQube distribution 2. Starting the Web Server The default port is "9000" and the context path is "/". These values can be changed in &l
【MongoDB学习笔记十一】Mongo副本集基本的增删查 bit1129 mongodb
一、创建复本集假设mongod,mongo已经配置在系统路径变量上，启动三个命令行窗口，分别执行如下命令： mongod --port 27017 --dbpath data1 --replSet rs0 mongod --port 27018 --dbpath data2 --replSet rs0 mongod --port 27019 -
Anychart图表系列二之执行Flash和HTML5渲染白糖_ Flash
今天介绍Anychart的Flash和HTML5渲染功能 HTML5 Anychart从6.0第一个版本起，已经逐渐开始支持各种图的HTML5渲染效果了，也就是说即使你没有安装Flash插件，只要浏览器支持HTML5，也能看到Anychart的图形（不过这些是需要做一些配置的）。这里要提醒下大家，Anychart6.0版本对HTML5的支持还不算很成熟，目前还处于
Laravel版本更新异常4.2.8-> 4.2.9 Declaration of ... CompilerEngine ... should be compa bozch laravel
昨天在为了把laravel升级到最新的版本，突然之间就出现了如下错误： ErrorException thrown with message "Declaration of Illuminate\View\Engines\CompilerEngine::handleViewException() should be compatible with Illuminate\View\Eng
编程之美-NIM游戏分析-石头总数为奇数时如何保证先动手者必胜 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class Nim { /**编程之美 NIM游戏分析问题：有N块石头和两个玩家A和B，玩家A先将石头随机分成若干堆，然后按照BABA...的顺序不断轮流取石头，能将剩下的石头一次取光的玩家获胜，每次取石头时，每个玩家只能从若干堆石头中任选一堆，
lunce创建索引及简单查询 chengxuyuancsdn 查询创建索引 lunce
import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Docume
[IT与投资]坚持独立自主的研究核心技术 comsci it
和别人合作开发某项产品....如果互相之间的技术水平不同,那么这种合作很难进行,一般都会成为强者控制弱者的方法和手段..... 所以弱者,在遇到技术难题的时候,最好不要一开始就去寻求强者的帮助,因为在我们这颗星球上,生物都有一种控制其
flashback transaction闪回事务查询 daizj oracle sql 闪回事务
闪回事务查询有别于闪回查询的特点有以下3个：（1）其正常工作不但需要利用撤销数据，还需要事先启用最小补充日志。（2）返回的结果不是以前的“旧”数据，而是能够将当前数据修改为以前的样子的撤销SQL（Undo SQL）语句。（3）集中地在名为flashback_transaction_query表上查询，而不是在各个表上通过“as of”或“vers
Java I/O之FilenameFilter类列举出指定路径下某个扩展名的文件游其是你 FilenameFilter
这是一个FilenameFilter类用法的例子，实现的列举出“c:\\folder“路径下所有以“.jpg”扩展名的文件。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
C语言学习五函数，函数的前置声明以及如何在软件开发中合理的设计函数来解决实际问题 dcj3sjt126com c
# include <stdio.h> int f(void) //括号中的void表示该函数不能接受数据，int表示返回的类型为int类型 { return 10; //向主调函数返回10 } void g(void) //函数名前面的void表示该函数没有返回值 { //return 10; //error 与第8行行首的void相矛盾 } in
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Pl dcj3sjt126com centos
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again 处理很简单，修改文件“/etc/yum.repos.d/epel.repo”，将baseurl的注释取消， mirrorlist注释掉。即可。 &n
单例模式 shuizhaosi888 单例模式
单例模式懒汉式 public class RunMain { /** * 私有构造 */ private RunMain() { } /** * 内部类，用于占位，只有 */ private static class SingletonRunMain { priv
Spring Security（09）——Filter 234390216 Spring Security
Filter 目录 1.1 Filter顺序 1.2 添加Filter到FilterChain 1.3 DelegatingFilterProxy 1.4 FilterChainProxy 1.5
公司项目NODEJS实践0.1 逐行分析JS源代码 mongodb nginx ubuntu nodejs
一、前言前端如何独立用nodeJs实现一个简单的注册、登录功能，是不是只用nodejs+sql就可以了？其实是可以实现，但离实际应用还有距离，那要怎么做才是实际可用的。网上有很多nod
java.lang.Math liuhaibo_ljf java Math lang
System.out.println(Math.PI); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1)); System.out.println(Math.abs(111111111)); System.out.println(Mat
linux下时间同步 nonobaba ntp
今天在linux下做hbase集群的时候，发现hmaster启动成功了，但是用hbase命令进入shell的时候报了一个错误 PleaseHoldException: Master is initializing，查看了日志，大致意思是说master和slave时间不同步，没办法，只好找一种手动同步一下，后来发现一共部署了10来台机器，手动同步偏差又比较大，所以还是从网上找现成的解决方
ZooKeeper3.4.6的集群部署 roadrunners zookeeper 集群部署
ZooKeeper是Apache的一个开源项目，在分布式服务中应用比较广泛。它主要用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步、集群管理、配置文件管理、同步锁、队列等。这里主要讲集群中ZooKeeper的部署。 1、准备工作我们准备3台机器做ZooKeeper集群，分别在3台机器上创建ZooKeeper需要的目录。数据存储目录
Java高效读取大文件 tomcat_oracle java
　　读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法：　　Files.readLines(new File(path), Charsets.UTF_8); 　　FileUtils.readLines(new File(path)); 　　这种方法带来的问题是文件的所有行都被存放在内存中，当文件足够大时很快就会导致
微信支付api返回的xml转换为Map的方法 xu3508620 xml map 微信api
举例如下： <xml> <return_code><![CDATA[SUCCESS]]></return_code> <return_msg><![CDATA[OK]]></return_msg> <appid><