肥～吉～

零基础入门数据挖掘 Task02：数据的探索性分析（EDA）

Task02：数据的探索性分析（EDA）

赛题：零基础入门数据挖掘 - 二手车交易价格预测
地址：https://tianchi.aliyun.com/competition/entrance/231784/information

参考资料

探索性数据分析
数据处理之二——数据探索性分析（EDA）
探索性数据分析(EDA)

1 EDA目标

探索性数据分析（Exploratory Data Analysis，EDA）是指对已有数据在尽量少的先验假设下通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。常用的手段包括定量分析和可视化技术。

EDA常用的一些常见问题：

数据的典型值是多少(均值，中位数等)？
典型值的不确定性是什么？
一组数据的良好分布拟合是什么？
数据的分位数是多少？
一个工程上的修改是否有作用？
一个因子是否有影响？
最重要的因素是什么？
来自不同实验室的测量结果是否相等？
将响应变量与一组因子变量相关联的最佳函数是什么？
什么是最好的因子设置？
我们可以将时间相关数据中的信号与噪声分离吗？
我们可以从多变量数据中提取任何结构吗？
数据是否有离群值？

通过EDA可以实现：

得到数据的直观表现
发现潜在的结构
提取重要的变量
处理异常值
检验统计假设
建立初步模型
决定最优因子的设置

2 代码示例

2.1 载入各种数据科学以及可视化库:

pandas是基于NumPy 的一种工具，该工具是为了解决数据分析任务而创建的。Pandas纳入了大量库和一些标准的数据模型，提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。
NumPy是使用Python进行科学计算的基础包, 代表 “Numeric Python”。它是一个由多维数组对象和用于处理数组的例程集合组成的库，多用在大型,多维数组上执行数值运算。
Matplotlib 是一个 Python 的 2D绘图库，它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形。直方图，功率谱，条形图，错误图，散点图等。pyplot是Matplotlib 软件包中子包，提供了一个类似MATLAB的绘图框架。
Seaborn是在matplotlib的基础上进行了更高级的API封装，从而使得作图更加容易，在大多数情况下使用seaborn能做出很具有吸引力的图，而使用matplotlib就能制作具有更多特色的图。应该把Seaborn视为matplotlib的补充，而不是替代物。
missingno库提供了一个灵活易用的可视化工具来观察数据缺失情况，是基于matplotlib的，接受pandas数据源

#导入warnings包，忽略警告语句
import warnings
warnings.filterwarnings('ignore')

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import missingno as msno

2.2载入数据：

read_csv读文件方式，默认是以逗号“，”作为分割符；若是以其它分隔符，比如制表符“/t”，则需要显示的指定分隔符。如：pd.read_csv(filename,sep=’/t’)

#载入数据集和测试集
#这里的sep=‘ ’指的是将分隔符设为空格
Train_data = pd.read_csv('used_car_train_20200313.csv', sep=' ')
Test_data = pd.read_csv('used_car_testA_20200313.csv', sep=' ')

简略观察数据（要养成看数据集的head()以及shape的习惯）

#简略观察数据(head()+shape)
#head():观察前五行数据; tail():观察后五行数据
Train_data.head().append(Train_data.tail())

Train_data.shape

下面是查看测试集的head()以及shape，结果略。

Test_data.head().append(Test_data.tail()) 
Test_data.shape

2.3数据总览:

describe中有每列的统计量，个数count、平均值mean、方差std、最小值min、中位数25% 50% 75% 、以及最大值看这个信息主要是瞬间掌握数据的大概的范围以及每个值的异常值的判断，比如有的时候会发现999 9999 -1 等值这些其实都是nan的另外一种表达方式，有的时候需要注意下。
- 格式：describe( percentiles=None, include=None, exclude=None)
- 注：include=‘all’,代表对所有列进行统计，如果不加这个参数，则只对数值列进行统计
info通过info来了解数据每列的type，有助于了解是否存在除了nan以外的特殊符号异常

#通过describe()来熟悉数据的相关统计量
Train_data.describe()

这里试了下用include='all’这个参数，得知describe（）统计出的列是不一样的，会将所有类型的列都进行统计，包括object类型。如没有，则只对数值列进行统计。

# include='all',代表对所有列进行统计，如果不加这个参数，则只对数值列进行统计(notRepairedDamage列是object类型)
Test_data.describe(include='all')

#通过info()来熟悉数据类型
Train_data.info() 
Test_data.info()

结果略。

2.4判断数据缺失和异常

.isnull().sum()将列中为空的个数统计出来，即，计算缺省值

#看每列的存在nan情况
#使用isnull()函数得到true或者false
Train_data.isnull().sum()
Test_data.isnull().sum()

Test_data.isnull().sum()

接下来对含有nan的信息进行可视化
- 这里使用了sort_value函数来进行排序，默认为升序排序；设置inplace=True用排序后的数据集替换原来的数据，默认False是不替换
- 直观的了解哪些列存在 “nan”的主要目的在于看 nan存在的个数是否真的很大，如果很小一般选择填充，如果使用lgb等树模型可以直接空缺，让树自己去优化，但如果nan存在的过多、可以考虑删掉

# nan可视化
missing = Train_data.isnull().sum()
missing = missing[missing>0]
missing.sort_values(inplace=True) 
missing.plot.bar()

可视化缺省值

# 可视化看下缺省值
msno.matrix(Train_data.sample(250)) # sample（250）表示抽取表格中250个样本

上图是代码运行后得到的结果，白线越多，代表缺失值越多

msno.bar(Train_data.sample(1000))

利用条形图可以更直观的看出每个变量缺失的比例和数量情况。

msno.matrix(Test_data.sample(250))

我们可以一目了然的看到每个变量的缺失情况：测试集的缺省和训练集的差不多情况, 可视化有三列有缺省，fuelType缺省得最多, 参考缺失值可视化处理–missingno

msno.bar(Test_data.sample(1000))

异常值检测

Train_data.info()

还记得前面的describe()统计信息时，由于notRepairedDamage列是object类型，所以没有统计进去。所以，当发现有object类型的字段时，应该单独拿出来看一下其取值情况，以防存在数值脏乱情况，应该对数据保持一种怀疑的态度，以防人为标注的时候出现的错误等。数据的检查与修正还是挺重要的，可参考数据竞赛修炼笔记之工业化工生产预测

# 看看object这个字段的取值情况
Train_data['notRepairedDamage'].value_counts()

可以看出里面有个’-’，这个也代表着缺失。因为很多模型对nan有直接的处理，这里我们可以先不做处理，先替换为nan，所以字符串类型的要小心缺失的，格式不规范的情况大有存在，格式不规范的情况可以看数据竞赛修炼笔记之工业化工生产预测，从那这面可真正体会到怀疑数据的重要性。

#将-替换成nan
Train_data['notRepairedDamage'].replace('-', np.nan, inplace=True)

#重新查看缺省值
Train_data.isnull().sum()

这时，发现缺省值最多的是这个notRepairedDamage字段。

# 对测试集进行同样的操作
Test_data['notRepairedDamage'].replace('-',np.nan,inplace=True)

# 观察其他数据
Train_data["seller"].value_counts()

# 观察其他数据
Train_data["offerType"].value_counts()

以上两个类别特征严重倾斜（销售方几乎为个体，报价类型全部为提供），一般不会对预测有什么帮助，故这边先删掉

del Train_data['seller']
del Train_data['offerType']
del Test_data['seller']
del Test_data['offerType']

2.5 了解预测值的分布

Train_data['price'].value_counts()

从上面统计可以看出price的分布不均匀，所以接下来通过画图来可视化一下

#直方图可视化一下
plt.hist(Train_data['price'])
plt.show()

从图中可以看出，频数里大于20000的值极少，所以这里也可以把这些当作特殊得值（异常值）直接用填充或者删掉，再往下进行。不过直接删掉有点风险，毕竟这是个回归问题，得出的效果可能很差，需要在baseline中试一下。

#总体分布概况(无界约翰逊分布等)
import scipy.stats as st
y = Train_data['price']

plt.figure(1)
plt.title('Johnson SU')
sns.distplot(y,kde=False,fit=st.johnsonsu)

plt.figure(2)
plt.title('Normal')
sns.distplot(y,kde=False,fit=st.norm)

plt.figure(3)
plt.title('Log Normal')
sns.distplot(y,kde=False,fit=st.lognorm)

seaborn中的distplot主要功能是绘制单变量的直方图，该函数结合了matplotlib中的 hist函数（自动计算一个默认的合适的bin大小）、seaborn的kdeplot()和rugplot()函数。它还可以拟合scipy.stats分布并在数据上绘制估计的PDF（概率分布函数）。

kde：bool型变量，控制是否绘制高斯核密度估计图，默认为True
fit：传入scipy.stats中的分布类型，用于在观察变量上抽取相关统计特征来强行拟合指定的分布，默认为None，即不进行拟合

图中的Johnson SU为约翰逊分布，是一种经过约翰变换后服从正态分布概率的随机变量的概率分布；normal为正态分布；lognormal为对数正态分布。通过结果我们可以看到，价格不服从正态分布，所以在进行回归之前，它必须进行转换（为什么做回归分析需要满足正态分布？？）。虽然对数变换做得很好，但最佳拟合是无界约翰逊分布(经约翰变换后服从正态分布的随机变量的概率分布)

#查看skewness（偏度） and kurtosis（峰度）
sns.distplot(Train_data['price']);
print("Skewness: %f" % Train_data['price'].skew())
print("Kurtosis: %f" % Train_data['price'].kurt())

在这里计算了price的skewness（偏度）和 kurtosis（峰度）

偏度（skewness） 也称为偏态、偏态系数，是统计数据分布偏斜方向和程度的度量，是统计数据分布非对称程度的数字特征。
峰度（Kurtosis） 与偏度类似，是描述总体中所有取值分布形态陡缓程度的统计量。这个统计量需要与正态分布相比较，峰度为0表示该总体数据分布与正态分布的陡缓程度相同；峰度大于0表示该总体数据分布与正态分布相比较为陡峭，为尖顶峰；峰度小于0表示该总体数据分布与正态分布相比较为平坦，为平顶峰。峰度的绝对值数值越大表示其分布形态的陡缓程度与正态分布的差异程度越大。

#查看Train_data的skewness（偏度） and kurtosis（峰度）
Train_data.skew(), Train_data.kurt()

#绘制Train_data各属性的偏度
sns.distplot(Train_data.skew(),color='blue',axlabel ='Skewness')

#绘制Train_data各属性的峰度
sns.distplot(Train_data.kurt(),color='orange',axlabel ='Kurtness')

峰度Kurt代表数据分布顶的尖锐程度,偏度skew简单来说就是数据的不对称程度。skew、kurt说明参考数据的偏度和峰度——df.skew()、df.kurt()

#查看price的具体频数
plt.hist(Train_data['price'], orientation = 'vertical',color ='red')
plt.show()

price大于20000的值极少，其实这里也可以把这些当作特殊得值（异常值）直接用填充或者删掉，在前面进行。不过直接删掉有点风险，毕竟这是个回归问题，得出的效果可能很差，需要在baseline中试一下。

# log变换 z之后的分布较均匀，可以进行log变换进行预测，这也是预测问题常用的trick
plt.hist(np.log(Train_data['price']), orientation = 'vertical',color ='red') 
plt.show()

这里用log取对数变换之后的分布较为均匀，所以，可以进行log变换再进行预测，这是预测问题常用的小技巧！

2.6 特征分为类别特征和数字特征，并对类别特征查看unique分布

name - 汽车编码
regDate - 汽车注册时间
model - 车型编码
brand - 品牌
bodyType - 车身类型
fuelType - 燃油类型
gearbox - 变速箱
power - 汽车功率
kilometer - 汽车行驶公里
notRepairedDamage - 汽车有尚未修复的损坏
regionCode - 看车地区编码
seller - 销售方 【已删】
offerType - 报价类型 【已删】
creatDate - 广告发布时间
price - 汽车价格
v_0', 'v_1', 'v_2', 'v_3', 'v_4', 'v_5', 'v_6', 'v_7', 'v_8', 'v_9', 'v_10', 'v_11', 'v_12', 'v_13','v_14'【匿名特征，包含v0-14在内15个匿名特征】

分离price预测值

Y_train = Train_data['price']

人为（手动）区分数字变量和分类变量
在初步观察数据字段含义时，就应该留意字段中的数字变量和类别变量，通过观测每一个字段的含义和具体数据的字段类型信息去均衡。这里之所以不用下面注释掉的那种方式，是因为这里的类别字段都类似LabelEncoder的处理了，虽然是0,1这种类别，但都已经成了数值型，所以我们需要人为设定把它们分出来。
- LableEncoder是将类别数据数字化的方法，使用0到n_classes-1之间的值对目标标签进行编码；
- OneHotEncoder也是类别数据数字化的方法，可以把数据分成多个不同的列，但每一列都用0或1来表示。

# 这个区别方式适用于没有直接label coding的数据
# 这里不适用，需要人为根据实际含义来区分
# 数字特征
# numeric_features = Train_data.select_dtypes(include=[np.number])
# numeric_features.columns
# # 类型特征
# categorical_features = Train_data.select_dtypes(include=[np.object])
# categorical_features.columns

#人为设定
numeric_features = ['power', 'kilometer', 'v_0', 'v_1', 'v_2', 'v_3', 'v_4', 'v_5', 'v_6', 'v_7', 'v_8', 'v_9', 'v_10', 'v_11', 'v_12', 'v_13','v_14' ]

#这里去掉了日期变量
categorical_features = ['name', 'model', 'brand', 'bodyType', 'fuelType', 'gearbox', 'notRepairedDamage', 'regionCode',]

接下来对Train_data和Test_data中的类别特征进行统计

# Train_data特征nunique分布
for cat_fea in categorical_features:
    print(cat_fea + "的特征分布如下：")
    print("{}特征有个{}不同的值".format(cat_fea, Train_data[cat_fea].nunique()))
    print(Train_data[cat_fea].value_counts())

# Test_data特征nunique分布
for cat_fea in categorical_features:
    print(cat_fea + "的特征分布如下：")
    print("{}特征有个{}不同的值".format(cat_fea, Test_data[cat_fea].nunique()))
    print(Test_data[cat_fea].value_counts())

2.7 数字特征分析

#把price加入数字特征列表中
numeric_features.append('price')

计算各属性与price的相关性

#相关性分析
price_numeric = Train_data[numeric_features]
correlation = price_numeric.corr()
#对相关性矩阵中的price列进行降序排序
print(correlation['price'].sort_values(ascending = False),'\n')

绘制相关性的热力图
使用了heatmap()函数；square=True设置为正方形；vmax, vmin为热力图颜色取值的最大值，最小值

f,ax = plt.subplots(figsize = (7, 7))
plt.title('Correlation of Numeric Features with Price',y=1,size=16)
sns.heatmap(correlation,square = True,vmax=0.8)

#在计算完相关性后将数字特征中的price删除
del price_numeric['price']

计算特征值的偏度和峰度

#查看几个特征得 偏度和峰值
for col in numeric_features:
    print('{:15}'.format(col), #字符宽度为15
          'Skewness: {:05.2f}'.format(Train_data[col].skew()) , #字符宽度为5，并保留两位小数
          '   ' ,
          'Kurtosis: {:06.2f}'.format(Train_data[col].kurt())  #字符宽度为6，并保留两位小数
         )

每个数字特征的分布可视化
- 使用melt()函数将列名转换成列数据，这是个转换函数，可参考Pandas_规整数据_转换数据_melt()
- 再使用FaceGrid和map绘制出每个属性的分布图

#每个数字特征得分布可视化
f = pd.melt(Train_data, value_vars=numeric_features)
g = sns.FacetGrid(f, col="variable",  col_wrap=5, sharex=False, sharey=False)
g = g.map(sns.distplot, "value")

从这里可以看到数值特征的分布情况，可以看出匿名特征相对分布均匀

使用paiplot展示两两属性之间的关系

#每个数字特征得分布可视化
#数字特征相互之间的关系可视化
sns.set()
columns = ['price', 'v_12', 'v_8' , 'v_0', 'power', 'v_5',  'v_2', 'v_6', 'v_1', 'v_14']
sns.pairplot(Train_data[columns],size = 2 ,kind ='scatter',diag_kind='kde')
plt.show()

多变量互相回归关系可视化
可视化更多学习可参考很不错的文章Seaborn-05-Pairplot多变量图

#多变量互相回归关系可视化
fig, ((ax1, ax2), (ax3, ax4), (ax5, ax6), (ax7, ax8), (ax9, ax10)) = plt.subplots(nrows=5, ncols=2, figsize=(24, 20))
# ['v_12', 'v_8' , 'v_0', 'power', 'v_5',  'v_2', 'v_6', 'v_1', 'v_14']
v_12_scatter_plot = pd.concat([Y_train,Train_data['v_12']],axis = 1)
sns.regplot(x='v_12',y = 'price', data = v_12_scatter_plot,scatter= True, fit_reg=True, ax=ax1)

v_8_scatter_plot = pd.concat([Y_train,Train_data['v_8']],axis = 1)
sns.regplot(x='v_8',y = 'price',data = v_8_scatter_plot,scatter= True, fit_reg=True, ax=ax2)

v_0_scatter_plot = pd.concat([Y_train,Train_data['v_0']],axis = 1)
sns.regplot(x='v_0',y = 'price',data = v_0_scatter_plot,scatter= True, fit_reg=True, ax=ax3)

power_scatter_plot = pd.concat([Y_train,Train_data['power']],axis = 1)
sns.regplot(x='power',y = 'price',data = power_scatter_plot,scatter= True, fit_reg=True, ax=ax4)

v_5_scatter_plot = pd.concat([Y_train,Train_data['v_5']],axis = 1)
sns.regplot(x='v_5',y = 'price',data = v_5_scatter_plot,scatter= True, fit_reg=True, ax=ax5)

v_2_scatter_plot = pd.concat([Y_train,Train_data['v_2']],axis = 1)
sns.regplot(x='v_2',y = 'price',data = v_2_scatter_plot,scatter= True, fit_reg=True, ax=ax6)

v_6_scatter_plot = pd.concat([Y_train,Train_data['v_6']],axis = 1)
sns.regplot(x='v_6',y = 'price',data = v_6_scatter_plot,scatter= True, fit_reg=True, ax=ax7)

v_1_scatter_plot = pd.concat([Y_train,Train_data['v_1']],axis = 1)
sns.regplot(x='v_1',y = 'price',data = v_1_scatter_plot,scatter= True, fit_reg=True, ax=ax8)

v_14_scatter_plot = pd.concat([Y_train,Train_data['v_14']],axis = 1)
sns.regplot(x='v_14',y = 'price',data = v_14_scatter_plot,scatter= True, fit_reg=True, ax=ax9)

v_13_scatter_plot = pd.concat([Y_train,Train_data['v_13']],axis = 1)
sns.regplot(x='v_13',y = 'price',data = v_13_scatter_plot,scatter= True, fit_reg=True, ax=ax10)

2.8 类型特征分析

categorical_features

#unique分布
for fea in categorical_features:
    print(Train_data[fea].nunique())

从上面可以看出，name和regionCode的类别太稀疏了，所以先去掉，因为后面要可视化，不画稀疏的

接下来进行类别特征的各种可视化技巧
- 类别特征箱形图可视化

#类别特征箱形图可视化

# 因为 name和 regionCode的类别太稀疏了，这里我们把不稀疏的几类画一下
categorical_features = ['model',
 'brand',
 'bodyType',
 'fuelType',
 'gearbox',
 'notRepairedDamage']
for c in categorical_features:
    Train_data[c] = Train_data[c].astype('category')
    if Train_data[c].isnull().any():
        Train_data[c] = Train_data[c].cat.add_categories(['MISSING'])
        Train_data[c] = Train_data[c].fillna('MISSING')

def boxplot(x, y, **kwargs):
    sns.boxplot(x=x, y=y)
    x=plt.xticks(rotation=90)

f = pd.melt(Train_data, id_vars=['price'], value_vars=categorical_features)
g = sns.FacetGrid(f, col="variable",  col_wrap=2, sharex=False, sharey=False, size=5)
g = g.map(boxplot, "value", "price")

#类别特征的小提琴图可视化 
catg_list = categorical_features 
target = 'price' 
for catg in catg_list :
    sns.violinplot(x=catg, y=target, data=Train_data)
    plt.show()

白点代表中位数Q2（即数据中有一半大于中位数，在其之上，另一半小于中位数，在其之下）；
黑色矩形是下四分位数到上四分位数的范围，矩形上边缘为上四分位数Q3，代表数据中有四分之一的数目大于上四分位数，下边缘为下四分位数Q1，代表数据中有四分之一的数目小于下四分位数；四分位间距IQR（上四分位数和下四分为数间距）长短代表非异常数据的分散和对称程度，长则分散，短则集中；
上下贯穿小提琴图的黑线代表最小非异常值min到最大非异常值max的区间，线上下端分别代表上限和下限，超出此范围为异常数据；
黑色矩形外部形状为核密度估计，图形纵轴方向长度代表数据弥散程度，横轴方向长度代表在某纵坐标位置数据分布量。

#类别特征的柱形图可视化
def bar_plot(x, y, **kwargs):
    sns.barplot(x=x, y=y)
    x=plt.xticks(rotation=90)

f = pd.melt(Train_data, id_vars=['price'], value_vars=categorical_features)
g = sns.FacetGrid(f, col="variable",  col_wrap=2, sharex=False, sharey=False, size=5)
g = g.map(bar_plot, "value", "price")

#类别特征的每个类别频数可视化(count_plot)
def count_plot(x,  **kwargs):
    sns.countplot(x=x)
    x=plt.xticks(rotation=90)

f = pd.melt(Train_data,  value_vars=categorical_features)
g = sns.FacetGrid(f, col="variable",  col_wrap=2, sharex=False, sharey=False, size=5)
g = g.map(count_plot, "value")

这个图还是挺好用的，可以可视化每一个类别特征的取值分布和数量，便于筛选异常

2.9 用pandas_profiling生成数据报告

pandas_profiling基于pandas的DataFrame数据类型，可以简单快速地进行探索性数据分析，使用函数ProfileReport生成一份数据探索性报告。

对于数据集的每一列，pandas_profiling会提供以下统计信息：

1、概要：数据类型，唯一值，缺失值，内存大小
2、分位数统计：最小值、最大值、中位数、Q1、Q3、最大值，值域，四分位

3、描述性统计：均值、众数、标准差、绝对中位差、变异系数、峰值、偏度系数

4、最频繁出现的值，直方图/柱状图

5、相关性分析可视化：突出强相关的变量，Spearman, Pearson矩阵相关性色阶图

并且这个报告可以导出为HTML，非常方便查看。

import pandas_profiling
pfr = pandas_profiling.ProfileReport(Train_data)
pfr.to_file("./example.html")

3 总结

以下总结来自Datawhale团队车哥：

所给出的EDA步骤为广为普遍的步骤，在实际的不管是工程还是比赛过程中，这只是最开始的一步，也是最基本的一步。接下来一般要结合模型的效果以及特征工程等来分析数据的实际建模情况，根据自己的一些理解，查阅文献，对实际问题做出判断和深入的理解。最后不断进行EDA与数据处理和挖掘，来到达更好的数据结构和分布以及较为强势相关的特征。
数据探索有利于我们发现数据的一些特性，数据之间的关联性，对于后续的特征构建是很有帮助的。

对于数据的初步分析（直接查看数据，或.sum(), .mean()，.descirbe()等统计函数）可以从：样本数量，训练集数量，是否有时间特征，是否是时许问题，特征所表示的含义（非匿名特征），特征类型（字符类似，int，float，time），特征的缺失情况（注意缺失的在数据中的表现形式，有些是空的有些是”NAN”符号等），特征的均值方差情况。
分析记录某些特征值缺失占比30%以上样本的缺失处理，有助于后续的模型验证和调节，分析特征应该是填充（填充方式是什么，均值填充，0填充，众数填充等），还是舍去，还是先做样本分类用不同的特征模型去预测。
对于异常值做专门的分析，分析特征异常的label是否为异常值（或者偏离均值较远或者事特殊符号）,异常值是否应该剔除，还是用正常值填充，是记录异常，还是机器本身异常等。
对于Label做专门的分析，分析标签的分布情况等。
进步分析可以通过对特征作图，特征和label联合做图（统计图，离散图），直观了解特征的分布情况，通过这一步也可以发现数据之中的一些异常值等，通过箱型图分析一些特征值的偏离情况，对于特征和特征联合作图，对于特征和label联合作图，分析其中的一些关联性。

你可能感兴趣的:(零基础入门数据挖掘 Task02：数据的探索性分析（EDA）)

老家的快乐王文哲同学
今天我和奶奶家我认识的小朋友们一起玩了，我们玩的非常开心，我们都玩累了，然后我自己一个人给他们买东西吃去了。我们玩了很多游戏，每一个游戏玩的都是热热闹闹热火朝天，如果要把我们四个人再多几个人的话一定会更快乐，于是我就把所有我认识的朋友全就来玩了。果然是热热闹闹的呀，然后我们就回家了。
复刻手表价格一般多少钱，复刻手表价格大全一览表腕表鞋屋
复刻手表价格一般多少钱，作为一名钟表专家，我对手表的品质和价值非常敏锐。当我们要购买一款复刻手表时，我们更注重的是它的品质和价值，而不仅仅是它的外观。微信:83134811(下单赠送精美礼品)复刻手表价格一般多少钱复刻手表价格相对来说要比正品手表便宜不少，据我了解复刻手表一般正常价位在2000元左右，如果是顶级复刻手表的话一般价格在4000元就可以买到。为什么大家复刻手表价格那么贵，因为顶级复刻表
《红楼梦》第三十三回：手足小动眈眈唇舌，不肖种种大承笞挞，我的读书分享清水秋
《红楼梦》第三十三回：手足小动眈眈唇舌，不肖种种大承笞挞。这一回里：忠顺府长史官代替忠顺王爷来找贾政询问琪官的下落，贾政不知道琪官将自己贴身的汗巾赠予宝玉。史官当着贾政的面，当场点破了这件事。史官问起琪官的最新住处，宝玉说在东郊离城二十里有个什么紫檀堡，他在那里置了几亩田地和几件房舍。史官说他去那里找找看，没找到还要问宝玉。贾环听闻金钏投井而死，就添油加醋的对贾政说：金钏的死与宝玉脱不了干系，还说
Python 2和Python 3的区别？山禾家的猫
Python社区，有这么个怪问题：“学Python到底是学2还是学3？”这个问题就像月经一样每隔断时间就出现在你面前，也成了很多初学者的选择困惑，这个问题的“始作俑者”当然是Python它爹，大家众说纷纭，有说Python2是主流，大公司都在用，你应该学2。也有说Python3才是未来主流，大多数第三方框架已基本支持Python3。个人看法是Python2还会存在很长一段时间（只要那些用Pytho
Java 二维数组详解：从基础语法到实战应用，彻底掌握多维数据结构大葱白菜 java合集开发语言 java 后端学习个人开发
作为一名Java开发工程师，你一定在实际开发中遇到过需要处理表格、矩阵、图像像素、游戏地图等场景。这时候，二维数组（2DArray）就派上用场了。本文将带你全面掌握：Java中二维数组的定义与初始化方式二维数组的内存结构与访问机制二维数组的遍历、修改与扩容技巧二维数组在实际业务中的应用场景二维数组与集合类（如List>）的互转常见误区与最佳实践并通过丰富的代码示例和真实项目场景讲解，帮助你写出更高
Python基础和高级【抽取复习】斟的是酒中桃 python 学习
1.Python的深拷贝和浅拷贝有什么区别？浅拷贝【ls.copy()】：将列表的不可变对象【值】复制一份，同时引用其中的可变对象【列表】，共用一个内存地址深拷贝【ls=copy.deepcopy(list)】：完全的复制原可变对象，生成新的可变对象，两个对象互相独立2.列表和元组的区别是什么？1.列表概念：有序序列，使用[]定义，元素之间用，隔开有序序列增删改操作：可以增删改列表的任意元素不可变
《论语》日日谈第63期 wuhuaping9807
《论语》日日谈第63期本章为《论语》：雍也篇第六篇第九章【原文】季氏使闵子骞为费宰①。闵子骞曰．“善为我辞焉。如有复我者，则吾必在汶上矣②。”【注释】①闵子骞(qiān)：孔子的学生，姓闵，名损，字骞。费．季氏的封邑，在今山东省费县西北。②汶：汶水，即今山东大汶河。汶上，暗指齐国。【翻译】季氏派人通知闵子骞，让他当季氏采邑费城的长官。闵子骞告诉来人说：“好好地为我推辞掉吧！如果再有人为这事来找我，
FPGA相关通信问题详解霖12 fpga开发笔记信号处理信息与通信学习开发语言
首先感谢大佬@征途黯然.-CSDN博客的就我的上篇文章《FPGA通信设计十问》提出的问题，我在此做出回复一.解释FFT（快速傅里叶变换）如何在FPGA的IP核中高效实现FFT作为将时域信号转换为频域的核心算法，其在FPGA中的高效实现依赖于硬件架构与算法特性的深度适配。1.流水线架构：提升吞吐量FFT的核心是“蝶形运算”，其计算过程可分解为log2(N)级（N为FFT点数），每级包含N/2次蝶形运
机器学习基础：从数据到智能的入门指南
一、何谓机器学习在我们的日常生活中，机器学习的身影无处不在。当你打开购物软件，它总能精准推荐你可能喜欢的商品；当你解锁手机，人脸识别瞬间完成；当你使用语音助手，它能准确理解你的指令。这些背后，都离不开机器学习的支撑。机器学习是一门让计算机能够从数据中学习并改进的学科。随着传感器技术的飞速发展，我们身边充满了各种传感器，如手机中的摄像头、麦克风，交通监控中的传感器等，它们收集了海量的数据。这些数据就
网关有什么用？如何选择合适的网关？ IT孟德架构兵法微服务云原生
大家好，我是IT孟德，YoucancallmeAman(阿瞒，阿弥陀佛的ē，Not阿门的ā)，一个喜欢所有对象（热爱技术）的男人。我正在创作架构专栏，秉承ITer开源精神分享给志同道合（爱江山爱技术更爱美人）的朋友。专栏更新不求速度但求质量（曹大诗人传世作品必属精品，请脑补一下《短歌行》：对酒当歌，红颜几何？譬如媳妇，吾不嫌多...青青罗裙，一见动心，但为佳人，挂念至今...），用朴实无华、通俗易
HTTPS协议的应用场景分析 Arwen303 https 网络协议 http
HTTPS协议的应用场景分析一、Web服务与交互网页浏览场景：用户通过浏览器访问各类网站（如门户网站、资讯平台），传输HTML、CSS、JavaScript等静态资源。应用：主流网站普遍采用HTTPS，确保页面内容安全加载。例如，Wikipedia、新浪等站点通过HTTPS防止内容被篡改。安全需求：防止页面被中间人劫持植入恶意广告或脚本。在线表单与用户登录场景：用户提交注册表单、登录账号时传输用户
Vue3递归组件详解：构建动态树形结构的终极方案编程随想▿ Vue3 vue.js 前端 javascript 前端框架
目录一、什么是递归组件？二、Vue3递归组件实现步骤1.基础实现2.关键点解析三、动态数据实战：渲染树形菜单四、Vue3递归组件的核心注意事项五、高级技巧：异步递归组件六、常见问题排查结语一、什么是递归组件？递归组件是指在组件内部调用自身的特殊组件。它适用于处理嵌套树形数据结构的场景，例如：文件目录系统多级导航菜单组织架构图嵌套评论列表在Vue3中，递归组件通过name属性标识自身，实现模板自引用
如何成为领导者沁心雅苑
一、欲抑先扬说出令人不快的事情之前先给对方一些肯定，更容易让对方接受。二、纠正错误有效方式：间接的引起对方的注意。不能直接纠正他人错误，表达意见习惯以称赞开始，千万不能以‘’但是‘’转折，以批评收尾，可以试着用‘’而且‘’或不用连接词。应间接的引起他的重视。三、批评对方之前，先谈谈你自己的过错。批评他人之前先承认自己的诸多缺点，批评的话就没有那么刺耳了。谦逊和赞美技巧在人际关系中创造奇迹。四、引导
日精进京心达张新波
想挣钱，就要学会说话技术高，配件好，得让人收到你的好为什么4S店销售员都要戴录音笔，就是防止说错话为什么该做的项目没谈成？是因为客户没有收到。努力练习五油一水和十三项易损配件专业知识。体验：酒香也怕巷子深、好酒也要会吆喝
[Python]Python中if-else的语法，用法示例 LN花开富贵 Python python 学习笔记嵌入式单片机 opencv
Python中多条件判断通过if-elif-else结构实现，elif是elseif的缩写。一、基础语法结构if条件1:#条件1为真时执行的代码块elif条件2:#条件2为真时执行的代码块elif条件3:#条件3为真时执行的代码块else:#所有条件均不满足时执行的代码块顺序判断，当第一个条件满足时其对应的代码块会被执行，后续elif的条件不在检查，如果都是if语句，那么执行完第一个if后后面的i
2019-04-07 北座城市
今天，我感悟到了生活的种种，似乎我读明白了生活这本书，但又感觉欠缺，我想我所欠缺的应该是我的能力吧，也就是我重新开始追求生活的权利，总而言之，我要努力，人生这本书真的很复杂，其实，这也是我们这一生都要学会去和解和原谅。
氧惠app能赚钱吗?怎么赚钱?氧惠app下载氧惠好物
氧惠（顶级邀请码005500）除了给到了免费注册会员超百万的海量优惠券，超高自购返和分享赚佣金，0元购，1元包邮等权益之外，并且氧惠还会给付费会员提供更多优质服务和会员权益，氧惠把90%的利润全部分配给消费者和推广者。虽然社交电商平台概念早已出炉，可真正能帮会员通过商品社交裂变实现省钱甚至赚钱愿望的平台始终凤毛麟角。氧惠是什么，全天候商品特惠加上精准导购。氧惠承载电商平台店铺，你在旅游，顾客在网购
最初的梦想王珍晶
我在十七八岁的时候，最理想的职业就是读书看报听广播写字，可以成为一名作家，为此临近毕业时留言册上都是写满了当作家的寄语。图片发自App我记得在读中专的时候，在西双版纳州州广播电台叫《王牌午间》的文艺节目，哇，我那个热度有多高，回想起来真的是佩服自己，每天中午吃好饭就趴在床上的小箱子上写写写，就是老师在讲课的时候，我也是沉浸在自己的故事里，那两年中真的是就像着了迷一样。记得有一次课上，会计任课的谢老
约客 ea4f19149938
问你一句：你有没有要等的人？八百年前的南宋，有一个诗人就在等他想等的人。可惜，他等的人一直没有来。于是诗人提笔写下当时的心情，成就了这首惊艳世人八百年的夏夜约客诗！它就是宋朝开国皇帝赵匡胤的八世孙——诗人赵师秀生前写得最好的一首诗——《约客》。让我们一起走进那个久等人不来的惆怅雨夜吧！约客南宋·赵师秀黄梅时节家家雨，青草池塘处处蛙。有约不来过夜半，闲敲棋子落灯花。赏析：与人约会而久候不至，难免焦躁
拼多多卖货如何才能赚佣金？拼多多挣佣金要怎么做？氧惠导师
淘宝上是有一个淘客宝的，大家可以在里面赚取佣金，其实拼多多也是有类似功能的。那么拼多多挣佣金应该怎么做?怎么通过卖货赚佣金了?文章接下来就给大家解答一下这两个问题。➤推荐网购薅羊毛app“氧惠”，一个领隐藏优惠券+现金返利的平台。氧惠只提供领券返利链接，下单全程都在淘宝、京东、拼多多等原平台，更支持抖音、快手电商、外卖红包返利等。（应用市场搜“氧惠”下载，邀请码:521521，全网优惠上氧惠！）➤
Sequential Thinking：AI深度思考的新范式及其与CoT、ReAct的对比分析码字的字节人工智能 Sequential CoT ReAct
引言：AI深度思考的演进与SequentialThinking的崛起在人工智能技术快速发展的今天，AI模型的思考能力正经历着从简单应答到深度推理的革命性转变。这一演进过程不仅反映了技术本身的进步，更体现了人类对机器智能认知边界的持续探索。早期的大语言模型虽然能够生成流畅的文本，但在处理复杂问题时往往表现出"浅思考"的局限性——答案可能看似合理，却缺乏严谨的推理过程和系统性考量。例如，2022年的一
冯唐总结最俗成功十要素寄于心
脱不花知识短视频里刷到：一命二运三风水，四积阴德五读书，六名七相八敬神，九交贵人十养生。这是冯唐总结出来的一个人要取得成功最俗的十要素。一命就DNA基因。猪八戒再修炼也成不了孙悟空，这是基因决定的。二运是时机，就是我们有没有抓住关键的时机。运气它不是一个个人孤立的事件，而是有没有投身到一个关键的时代机遇里面去。三风水是指你有没有处在一个合适的环境当中，比如说行业，如果你在正确的时间处在了一个正确的
只有做最好的自己才能吸引来最好的别人雷继伟668
陈果说：“只有同等能量的人才会相互吸引、相互识别、相互欣赏”。你若盛开，蝴蝶自来。所以，如果你想要遇到非常优秀的朋友、知己、亦或是情侣，请你静静地成长，美美的绽放。待你盛开，优秀的人自然会被你吸引而来，与你为友、陪你作伴、携你前行！读书、思考、践行，一定能让你成为更好的自己。读书，就是将别人的思想变成一块块垫脚石，筑起自己的思想殿堂。在大多数人的生活中，自己的身边都会有一些非常优秀的人。她们美的貌
Windows环境Chrome安装提示无可用更新问题解决【2024年版】 zrhsmile Windows chrome windows
现象卸载了Chrome浏览器之后，通过腾讯管家安装Chrome浏览器，发现都无法一键安装或安装【注：一键安装或安装，都没有任何反应】如果可以科学上网，发现通过下载Google的网址，下载Chrome浏览器的安装软件ChromeSetup.exe，也无法安装。提示：“无可用的更新”或“与服务器的连接意外终止”原因出现这个问题的原因是因为安装程序是和google直连的或者杀毒软件阻止了连接解决方案【亲
【k8s学习】Kubernetes新手学习，4小时视频笔记总结伊丽莎白2015
【学习视频地址】KubernetesTutorialforBeginnersFULLCOURSEin4Hours视频不一定打得开，不过我笔记也很详细了。【笔记内容】1-【k8s学习】Kubernetes学习——核心组件和架构2-【k8s学习】minikube、kubectl、yaml配置文件的介绍3-【k8s学习】在minikube上布署MongoDB和MongoExpress4-【k8s学习】k
纸板制造学习3·DOE实验（如正交试验）优化压力组合 xinzheng新政制造学习
·DOE实验（如正交试验）优化压力组合DOE（DesignofExperiments，实验设计）是一种通过科学规划实验方案，系统分析多因素对结果影响的方法，正交试验是其核心工具之一。在纸板生产中，DOE可通过少量实验快速找到气缸压力、原纸克重等变量的最优组合，提升效率与质量。以下是简要科普：一、DOE的核心目标识别关键因素：确定哪些变量（如热板压力、原纸克重）对结果（如纸板厚度、粘合强度）影响最大
时间的节点线团家当时
《时生》—整本书最喜欢的就是这个名字，作者想要表达的大概是生命在时空岁月中的成长吧。这是一个老套的时空穿梭故事，讲述了一个17岁即将面临死亡的少年穿越时空找到二十年前不求上进一塌糊涂的父亲，努力拯救父亲踏上人生正途，帮助父亲找到自我并结识母亲的故事。我是在一种很平静的状态下读完的，几乎没有情绪的波澜起伏。甚至能猜到故事的承转起伏，或许是近些年穿越题材的作品太多，新鲜感尽失导致吧！第一次读东野先生的
Gradle：Cannot add task ‘clean‘ as a task with that name already exists. 海阔天空6688 开发工具 Android gradle android
Gradle编译项目报错：Cannotaddtask'clean'asataskwiththatnamealreadyexists.提示的是gradle中的clean方法已经存在了，冲突了，把项目中build.gradle的clean方法注释掉或者删掉重新编译就也可以了。buildscript{repositories{}dependencies{classpath'com.android.too
你真的会阅读吗-如何阅读更高效？ sherri_方_0215
——关于阅读方法的主题阅读学习力是元能力。即一切认知思想行动的基础。现代社会，我们学习的渠道包括人、网、事和书。读书是我们重要的一种阅读方式，比其他方式跟简单、成本更低，而且系统化程度更高。阅读，指从文字或符号获得知识或信息的方法，可以是阅读文章或书籍。根据目的可将阅读分为娱乐类和致用类。这里主要指致用类阅读，是一种需要方法的阅读。前者目的在于消磨时间，只要看得舒服就行。阅读一本书，就像参加一门老
逃 Chris的另一个世界
逃是种最基本的防御措施，很多时候虽然没有实质性的危险，但是肌体的误判（或者即便是小概率的发生，但肌体所不能承受的）这时会进入回避状态。它本身没有错，错在你是包容等一等它再次确认情况还是简单粗暴的打压。放心吧，后者是徒劳的。只会越来越让自己崩溃而无法专注高效做事。
linux系统服务器下jsp传参数乱码 3213213333332132 java jsp linux windows xml
在一次解决乱码问题中，发现jsp在windows下用js原生的方法进行编码没有问题，但是到了linux下就有问题， escape,encodeURI,encodeURIComponent等都解决不了问题但是我想了下既然原生的方法不行，我用el标签的方式对中文参数进行加密解密总该可以吧。于是用了java的java.net.URLDecoder,结果还是乱码，最后在绝望之际，用了下面的方法解决了
Spring 注解区别以及应用 BlueSkator spring
1. @Autowired @Autowired是根据类型进行自动装配的。如果当Spring上下文中存在不止一个UserDao类型的bean，或者不存在UserDao类型的bean，会抛出 BeanCreationException异常，这时可以通过在该属性上再加一个@Qualifier注解来声明唯一的id解决问题。 2. @Qualifier 当spring中存在至少一个匹
printf和sprintf的应用 dcj3sjt126com PHP sprintf printf
<?php printf('b: %b c: %c d: %d <bf>f: %f', 80,80, 80, 80); echo ' '; printf('%0.2f %+d %0.2f ', 8, 8, 1235.456); printf('th
config.getInitParameter 171815164 parameter
web.xml <servlet> <servlet-name>servlet1</servlet-name> <jsp-file>/index.jsp</jsp-file> <init-param> <param-name>str</param-name>
Ant标签详解--基础操作 g21121 ant
Ant的一些核心概念： build.xml：构建文件是以XML 文件来描述的，默认构建文件名为build.xml。 project：每个构建文
[简单]代码片段_数据合并 53873039oycg 代码
合并规则:删除家长phone为空的记录,若一个家长对应多个孩子,保留一条家长记录,家长id修改为phone,对应关系也要修改。代码如下:
java 通信技术云端月影 Java 远程通信技术
在分布式服务框架中，一个最基础的问题就是远程服务是怎么通讯的，在Java领域中有很多可实现远程通讯的技术，例如：RMI、MINA、ESB、Burlap、Hessian、SOAP、EJB和JMS等，这些名词之间到底是些什么关系呢，它们背后到底是基于什么原理实现的呢，了解这些是实现分布式服务框架的基础知识，而如果在性能上有高的要求的话，那深入了解这些技术背后的机制就是必须的了，在这篇blog中我们将来
string与StringBuilder 性能差距到底有多大 aijuans
之前也看过一些对string与StringBuilder的性能分析，总感觉这个应该对整体性能不会产生多大的影响，所以就一直没有关注这块！由于学程序初期最先接触的string拼接，所以就一直没改变过自己的习惯！
今天碰到 java.util.ConcurrentModificationException 异常 antonyup_2006 java 多线程工作 IBM
今天改bug，其中有个实现是要对map进行循环，然后有删除操作，代码如下： Iterator<ListItem> iter = ItemMap.keySet.iterator(); while(iter.hasNext()){ ListItem it = iter.next(); //...一些逻辑操作 ItemMap.remove(it); } 结果运行报Con
PL/SQL的类型和JDBC操作数据库百合不是茶 PL/SQL表标量类型游标 PL/SQL记录
PL/SQL的标量类型: 字符,数字,时间,布尔,%type五中类型的 --标量：数据库中预定义类型的变量 --定义一个变长字符串 v_ename varchar2(10); --定义一个小数,范围 -9999.99~9999.99 v_sal number(6,2); --定义一个小数并给一个初始值为5.4 :=是pl/sql的赋值号
Mockito：一个强大的用于 Java 开发的模拟测试框架实例 bijian1013 mockito 单元测试
Mockito框架： Mockito是一个基于MIT协议的开源java测试框架。 Mockito区别于其他模拟框架的地方主要是允许开发者在没有建立“预期”时验证被测系统的行为。对于mock对象的一个评价是测试系统的测
精通Oracle10编程SQL(10)处理例外 bijian1013 oracle 数据库 plsql
/* *处理例外 */ --例外简介 --处理例外-传递例外 declare v_ename emp.ename%TYPE; begin SELECT ename INTO v_ename FROM emp where empno=&no; dbms_output.put_line('雇员名：'||v_ename); exceptio
【Java】Java执行远程机器上Linux命令 bit1129 linux命令
Java使用ethz通过ssh2执行远程机器Linux上命令，封装定义Linux机器的环境信息 package com.tom; import java.io.File; public class Env { private String hostaddr; //Linux机器的IP地址 private Integer po
java通信之Socket通信基础白糖_ java socket 网络协议
正处于网络环境下的两个程序，它们之间通过一个交互的连接来实现数据通信。每一个连接的通信端叫做一个Socket。一个完整的Socket通信程序应该包含以下几个步骤： ①创建Socket； ②打开连接到Socket的输入输出流； ④按照一定的协议对Socket进行读写操作； ④关闭Socket。 Socket通信分两部分：服务器端和客户端。服务器端必须优先启动，然后等待soc
angular.bind boyitech AngularJS angular.bind AngularJS API bind
angular.bind 描述：上下文，函数以及参数动态绑定，返回值为绑定之后的函数. 其中args是可选的动态参数，self在fn中使用this调用。使用方法： angular.bind(se
java-13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 bylijinnan java
import java.util.ArrayList; import java.util.List; public class KickOutBadGuys { /** * 题目：13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 * Maybe you can find out
Redis.conf配置文件及相关项说明（自查备用） Kai_Ge redis
Redis.conf配置文件及相关项说明 # Redis configuration file example # Note on units: when memory size is needed, it is possible to specifiy # it in the usual form of 1k 5GB 4M and so forth: #
[强人工智能]实现大规模拓扑分析是实现强人工智能的前奏 comsci 人工智能
真不好意思,各位朋友...博客再次更新... 节点数量太少,网络的分析和处理能力肯定不足,在面对机器人控制的需求方面,显得力不从心.... 但是,节点数太多,对拓扑数据处理的要求又很高,设计目标也很高,实现起来难度颇大...
记录一些常用的函数 dai_lm java
public static String convertInputStreamToString(InputStream is) { StringBuilder result = new StringBuilder(); if (is != null) try { InputStreamReader inputReader = new InputStreamRead
Hadoop中小规模集群的并行计算缺陷 datamachine mapreduce hadoop 并行计算
注：写这篇文章的初衷是因为Hadoop炒得有点太热，很多用户现有数据规模并不适用于Hadoop，但迫于扩容压力和去IOE（Hadoop的廉价扩展的确非常有吸引力）而尝试。尝试永远是件正确的事儿，但有时候不用太突进，可以调优或调需求，发挥现有系统的最大效用为上策。 -----------------------------------------------------------------
小学4年级英语单词背诵第二课 dcj3sjt126com english word
egg 蛋 twenty 二十 any 任何 well 健康的，好 twelve 十二 farm 农场 every 每一个 back 向后，回 fast 快速的 whose 谁的 much 许多 flower 花 watch 手表 very 非常，很 sport 运动 Chinese 中国的
自己实践了github的webhooks, linux上面的权限需要注意 dcj3sjt126com github webhook
环境, 阿里云服务器 1. 本地创建项目, push到github服务器上面 2. 生成www用户的密钥 sudo -u www ssh-keygen -t rsa -C "[email protected]" 3. 将密钥添加到github帐号的SSH_KEYS里面 3. 用www用户执行克隆, 源使
Java冒泡排序蕃薯耀冒泡排序 Java冒泡排序 Java排序
冒泡排序 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 10:40:14 星期二 http://fanshuyao.iteye.com/
Excle读取数据转换为实体List【基于apache-poi】 hanqunfeng apache
1.依赖apache-poi 2.支持xls和xlsx 3.支持按属性名称绑定数据值 4.支持从指定行、列开始读取 5.支持同时读取多个sheet 6.具体使用方式参见org.cpframework.utils.excelreader.CP_ExcelReaderUtilTest.java 比如： Str
3个处于草稿阶段的Javascript API介绍 jackyrong JavaScript
原文： http://www.sitepoint.com/3-new-javascript-apis-may-want-follow/?utm_source=html5weekly&utm_medium=email 本文中，介绍3个仍然处于草稿阶段，但应该值得关注的Javascript API. 1) Web Alarm API &
6个创建Web应用程序的高效PHP框架 lampcy Web 框架 PHP
以下是创建Web应用程序的PHP框架，有coder bay网站整理推荐： 1. CakePHP CakePHP是一个PHP快速开发框架，它提供了一个用于开发、维护和部署应用程序的可扩展体系。CakePHP使用了众所周知的设计模式，如MVC和ORM，降低了开发成本，并减少了开发人员写代码的工作量。 2. CodeIgniter CodeIgniter是一个非常小且功能强大的PHP框架，适合需
评"救市后中国股市新乱象泛起"谣言 nannan408
首先来看百度百家一位易姓作者的新闻：三个多星期来股市持续暴跌，跌得投资者及上市公司都处于极度的恐慌和焦虑中，都要寻找自保及规避风险的方式。面对股市之危机，政府突然进入市场救市，希望以此来重建市场信心，以此来扭转股市持续暴跌的预期。而政府进入市场后，由于市场运作方式发生了巨大变化，投资者及上市公司为了自保及为了应对这种变化，中国股市新的乱象也自然产生。首先，中国股市这两天
页面全屏遮罩的实现方式 Rainbow702 html css 遮罩 mask
之前做了一个页面，在点击了某个按钮之后，要求页面出现一个全屏遮罩，一开始使用了position:absolute来实现的。当时因为画面大小是固定的，不可以resize的，所以，没有发现问题。最近用了同样的做法做了一个遮罩，但是画面是可以进行resize的，所以就发现了一个问题，当画面被reisze到浏览器出现了滚动条的时候，就发现，用absolute 的做法是有问题的。后来改成fixed定位就
关于angularjs的点滴 tntxia AngularJS
angular是一个新兴的JS框架，和以往的框架不同的事，Angularjs更注重于js的建模，管理，同时也提供大量的组件帮助用户组建商业化程序，是一种值得研究的JS框架。 Angularjs使我们可以使用MVC的模式来写JS。Angularjs现在由谷歌来维护。这里我们来简单的探讨一下它的应用。首先使用Angularjs我
Nutz--->>反复新建ioc容器的后果 xiaoxiao1992428 DAO mvc IOC nutz
问题： public class DaoZ { public static Dao dao() { // 每当需要使用dao的时候就取一次 Ioc ioc = new NutIoc(new JsonLoader("dao.js")); return ioc.get(