珞沫

二手车交易价格实战

二手车交易价格实战-数据挖掘

一.赛题理解

1.1赛题材料
1.2分析

二、 EDA-数据探索性分析

2.1加载数据
2.2数据概括
2.3数据缺失与异常

2.3.1分析数据
2.3.2缺失与异常处理

2.4预测值分布

2.5特征分析
2.5.1数字特征分析
2.5.2类别特征分析

三.总结

一.赛题理解

1.1赛题材料

赛题：零基础入门数据挖掘 - 二手车交易价格预测

链接：https://tianchi.aliyun.com/competition/entrance/231784/introduction?spm=5176.12281957.1004.1.38b02448ausjSX

问题：赛题以二手车市场为背景，要求选手预测二手汽车的交易价格，这是一个典型的回归问题。

数据：该数据来自某交易平台的二手车交易记录，总数据量超过40w，包含31列变量信息，其中15列为匿名变量。为了保证比赛的公平性，将会从中抽取15万条作为训练集，5万条作为测试集A，5万条作为测试集B，同时会对name、model、brand和regionCode等信息进行脱敏。

评价标准：评价标准为MAE(Mean Absolute Error)。
enter image description here
MAE越小，说明模型预测得越准确。

1.2分析

1.此题为传统的数据挖掘问题，通过数据科学以及机器学习深度学习的办法来进行建模得到结果。
2.此题是一个典型的回归问题。
3.主要应用xgb、lgb、catboost，以及pandas、numpy、matplotlib、seabon、sklearn、keras等等数据挖掘常用库或者框架来进行数据挖掘任务。
4.通过EDA来挖掘数据的联系和自我熟悉数据。

二、 EDA-数据探索性分析

EDA (Exploratory Data Analysis)，即对数据进行探索性的分析。在数据清洗和特征工程之前，通过作图，制表等方式对数据进行特征（统计性特征，分布型特征，相关性）分析。

当了解了数据集之后我们下一步就是要去了解变量间的相互关系以及变量与预测值之间的存在关系。

引导数据科学从业者进行数据处理以及特征工程的步骤,使数据集的结构和特征集让接下来的预测问题更加可靠。

完成对于数据的探索性分析，并对于数据进行一些图表或者文字总结并打卡。

前期准备：导入所需的包

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import missingno as msno

numpy:Python科学计算库，主要功能之一是用来操作数组和矩阵.

pandas:提供了大量能使我们快速便捷地处理数据的函数和方法.

matplotlib:可视化

seaborn：基于matplotlib的图形可视化python包，提供了一种高度交互式界面，便于用户能够做出各种有吸引力的统计图表.

missingno：缺失值可视化

2.1加载数据

Train_data=pd.read_csv('E:\Train_data.csv',sep=' ')
Test_data=pd.read_csv('E:\Test_data.csv',sep=' ')

pandas加载与数据预处理：https://blog.csdn.net/weixin_43697287/article/details/86365049

2.2数据概括

#数据大小（行数与列数）
print('Train_data.shape:',Train_data.shape)
print('Test_data.shape:',Test_data.shape)

Train_data.shape: (150000, 31)
Test_data.shape: (50000, 30)

#索引，数据类型和内存信息
print('Train_data.info:',Train_data.info())
print('Test_data.info:',Test_data.info())


RangeIndex: 150000 entries, 0 to 149999
Data columns (total 31 columns):
SaleID               150000 non-null int64
name                 150000 non-null int64
regDate              150000 non-null int64
model                149999 non-null float64
brand                150000 non-null int64
bodyType             145494 non-null float64
fuelType             141320 non-null float64
gearbox              144019 non-null float64
power                150000 non-null int64
kilometer            150000 non-null float64
notRepairedDamage    150000 non-null object
regionCode           150000 non-null int64
seller               150000 non-null int64
offerType            150000 non-null int64
creatDate            150000 non-null int64
price                150000 non-null int64
v_0                  150000 non-null float64
v_1                  150000 non-null float64
v_2                  150000 non-null float64
v_3                  150000 non-null float64
v_4                  150000 non-null float64
v_5                  150000 non-null float64
v_6                  150000 non-null float64
v_7                  150000 non-null float64
v_8                  150000 non-null float64
v_9                  150000 non-null float64
v_10                 150000 non-null float64
v_11                 150000 non-null float64
v_12                 150000 non-null float64
v_13                 150000 non-null float64
v_14                 150000 non-null float64
dtypes: float64(20), int64(10), object(1)
memory usage: 35.5+ MB
Train_data.info: None

RangeIndex: 50000 entries, 0 to 49999
Data columns (total 30 columns):
SaleID               50000 non-null int64
name                 50000 non-null int64
regDate              50000 non-null int64
model                50000 non-null float64
brand                50000 non-null int64
bodyType             48587 non-null float64
fuelType             47107 non-null float64
gearbox              48090 non-null float64
power                50000 non-null int64
kilometer            50000 non-null float64
notRepairedDamage    50000 non-null object
regionCode           50000 non-null int64
seller               50000 non-null int64
offerType            50000 non-null int64
creatDate            50000 non-null int64
v_0                  50000 non-null float64
v_1                  50000 non-null float64
v_2                  50000 non-null float64
v_3                  50000 non-null float64
v_4                  50000 non-null float64
v_5                  50000 non-null float64
v_6                  50000 non-null float64
v_7                  50000 non-null float64
v_8                  50000 non-null float64
v_9                  50000 non-null float64
v_10                 50000 non-null float64
v_11                 50000 non-null float64
v_12                 50000 non-null float64
v_13                 50000 non-null float64
v_14                 50000 non-null float64
dtypes: float64(20), int64(9), object(1)
memory usage: 11.4+ MB
Test_data.info: None

2.3数据缺失与异常

2.3.1分析数据

analyze= []
for col in Train_data.columns:
    analyze.append((col, Train_data[col].nunique(), Train_data[col].isnull().sum() * 100 / Train_data.shape[0],Train_data[col].value_counts(normalize=True, dropna=False).values[0] * 100, Train_data[col].dtype))
analyze_df = pd.DataFrame(analyze, columns=['Feature', 'Unique_values', 'Percentage of missing values','Percentage of values in the biggest category', 'type'])
analyze_df.sort_values('Percentage of missing values', ascending=False, inplace=True)
analyze_df

	Feature	Unique_values	Percentage of missing values	Percentage of values in the biggest category	type
6	fuelType	7	5.786667	61.104000	float64
7	gearbox	2	3.987333	74.415333	float64
5	bodyType	8	3.004000	27.613333	float64
3	model	248	0.000667	7.841333	float64
0	SaleID	150000	0.000000	0.000667	int64
24	v_8	142451	0.000000	1.064667	float64
20	v_4	143998	0.000000	0.013333	float64
21	v_5	139624	0.000000	2.990000	float64
22	v_6	109766	0.000000	23.643333	float64
23	v_7	138709	0.000000	3.644667	float64
27	v_11	143997	0.000000	0.013333	float64
25	v_9	140617	0.000000	2.324000	float64
26	v_10	143997	0.000000	0.013333	float64
18	v_2	143997	0.000000	0.013333	float64
28	v_12	143997	0.000000	0.013333	float64
29	v_13	143998	0.000000	0.013333	float64
19	v_3	143998	0.000000	0.013333	float64
15	price	3763	0.000000	1.558000	int64
17	v_1	143998	0.000000	0.013333	float64
16	v_0	143997	0.000000	0.013333	float64
1	name	99662	0.000000	0.188000	int64
14	creatDate	96	0.000000	3.898667	int64
13	offerType	1	0.000000	100.000000	int64
12	seller	2	0.000000	99.999333	int64
11	regionCode	7905	0.000000	0.246000	int64
10	notRepairedDamage	3	0.000000	74.240667	object
9	kilometer	13	0.000000	64.584667	float64
8	power	566	0.000000	8.552667	int64
4	brand	40	0.000000	20.986667	int64
2	regDate	3894	0.000000	0.120000	int64
30	v_14	143998	0.000000	0.013333	float64

nunique() 方法用于获取 'Team’列中所有唯一值的数量。

观察上图可发现发现价格、功率、行驶里程有0值，在实际中是很不现实的，后续需分析是异常还是脱敏后的正常值。

只有notRepairedDamage的格式为object。
notRepairedDamage在赛题中说明只有0和1两类，统计却出现3类。
offerType在赛题中说明有0和1两类，统计只有1类。 seller2类中有1大类占据极大部分（百分之99多），存在严重的倾斜。

2.3.2缺失与异常处理

异常处理

Train_data['notRepairedDamage'].value_counts()

0.0    111361
-       24324
1.0     14315
Name: notRepairedDamage, dtype: int64

Test_data['notRepairedDamage'].value_counts()

0.0    37249
-       8031
1.0     4720
Name: notRepairedDamage, dtype: int64

经上述的展开，发现notRepairedDamage里有空格，故将其分为了三类。因为很多模型对nan有直接的处理，这里我们先不做处理，先替换成nan

Train_data['notRepairedDamage'].replace('-', np.nan, inplace=True)
Test_data['notRepairedDamage'].replace('-', np.nan, inplace=True)

Train_data['notRepairedDamage'].value_counts()

0.0    111361
1.0     14315
Name: notRepairedDamage, dtype: int64

offerType，seller两个字段对价格影响特别小，可删除

del Train_data["seller"]
del Train_data["offerType"]
del Test_data["seller"]
del Test_data["offerType"]

缺失处理

# 缺失值可视化
missing = Train_data.isnull().sum()
missing = missing[missing > 0]#获取空值>0的列
missing.sort_values(inplace=True)#排序
missing.plot.bar()

msno.matrix(Train_data.sample(250))#msno矩阵查看缺失值

msno.bar(Train_data.sample(1000))#msno 条形图查看缺失值

缺失值可视化后可以发现bodyType、fuelType、gearbox缺失值比较多，后续需要对这些字段缺失值进行处理

2.4预测值分布

Train_data['price']

0         1850
1         3600
2         6222
3         2400
4         5200
          ... 
149995    5900
149996    9500
149997    7500
149998    4999
149999    4700
Name: price, Length: 150000, dtype: int64

Train_data['price'].value_counts()

500      2337
1500     2158
1200     1922
1000     1850
2500     1821
         ... 
25321       1
8886        1
8801        1
37920       1
8188        1
Name: price, Length: 3763, dtype: int64

## 1) 价格总体分布概况
import scipy.stats as st
y = Train_data['price']
plt.figure(1); plt.title('Johnson SU')
sns.distplot(y, kde=False, fit=st.johnsonsu)
plt.figure(2); plt.title('Normal')
sns.distplot(y, kde=False, fit=st.norm)
plt.figure(3); plt.title('Log Normal')
sns.distplot(y, kde=False, fit=st.lognorm)

观察总体分布，发现Johnson SU拟合效果较好，价格数据分布存在右偏，说明存在过大的极端值。

查看数据的偏度和峰度
skew、kurt说明参考https://www.cnblogs.com/wyy1480/p/10474046.html

#查看skewness and kurtosis
sns.distplot(Train_data['price']);
print("Skewness: %f" % Train_data['price'].skew())
print("Kurtosis: %f" % Train_data['price'].kurt())

Skewness: 3.346487
Kurtosis: 18.995183

从偏度值大于0也可得知数据右偏。从价格分布中可以看出价格大于40000后的二手车数量极少。

#查看预测值的具体频数
plt.hist(Train_data['price'], orientation = 'vertical',histtype = 'bar', color ='red')

(array([1.23906e+05, 1.89270e+04, 4.91800e+03, 1.34000e+03, 4.71000e+02,
        1.88000e+02, 1.24000e+02, 6.00000e+01, 4.80000e+01, 1.80000e+01]),
 array([1.10000e+01, 1.00098e+04, 2.00086e+04, 3.00074e+04, 4.00062e+04,
        5.00050e+04, 6.00038e+04, 7.00026e+04, 8.00014e+04, 9.00002e+04,
        9.99990e+04]),
 )

#查看预测值的箱型图
Train_data['price'].plot(kind='box')

再利用箱型图，频数图查看具体的分布划分，看出价格大于20000则为异常值。

将价格大于20000的数据剔除，再重新画图

Train_data[Train_data['price']<=20000]['price'].hist()

# log变换 z之后的分布较均匀，可以进行log变换进行预测，这也是预测问题常用的trick
plt.hist(np.log(Train_data['price']), orientation = 'vertical',histtype = 'bar', color ='red') 
plt.show()

2.5特征分析

特征数据分为定类数据、定序数据、定距数据、定比数据四类，需要分别分析。

在本次赛题中提供的数据类型有定类数据和定距数据。

numeric_features = ['power', 'kilometer', 'v_0', 'v_1', 'v_2', 'v_3', 'v_4', 'v_5', 'v_6', 'v_7', 'v_8', 'v_9', 'v_10', 'v_11', 'v_12', 'v_13','v_14' ]

categorical_features = ['name', 'model', 'brand', 'bodyType', 'fuelType', 'gearbox', 'notRepairedDamage', 'regionCode',]

2.5.1数字特征分析

numeric_features.append('price')#添加price特征

## 1) 相关性分析
numeric_feature_price=Train_data[numeric_features]
colormap = plt.cm.magma
plt.figure(figsize=(16,14))
plt.title('Pearson correlation of continuous features', y=1.05, size=15)
sns.heatmap(numeric_feature_price.corr(),linewidths=0.1,vmax=1.0, square=True, 
            cmap=colormap, linecolor='white', annot=True)

correction=numeric_feature_price.corr()

print(correlation['price'].sort_values(ascending = False),'\n')

price        1.000000
v_12         0.692823
v_8          0.685798
v_0          0.628397
power        0.219834
v_5          0.164317
v_2          0.085322
v_6          0.068970
v_1          0.060914
v_14         0.035911
v_13        -0.013993
v_7         -0.053024
v_4         -0.147085
v_9         -0.206205
v_10        -0.246175
v_11        -0.275320
kilometer   -0.440519
v_3         -0.730946
Name: price, dtype: float64

从相关性图表中，可以看到不同定距数据之间的相关性大小。
从中可挑选出与价格相关性较大的特征，剔除相关性为0的特征。
此外回归预测中需要解决共线性特征。v_6与v_1相关性为1，需判断是否为重复列。此外v0-v14的大部分特征的相关性系数比较大，需要进行降维处理。

## 2) 查看几个特征得 偏度和峰值
for col in numeric_features:
    print('{:15}'.format(col), 
          'Skewness: {:05.2f}'.format(Train_data[col].skew()) , 
          '   ' ,
          'Kurtosis: {:06.2f}'.format(Train_data[col].kurt())  
         )

power           Skewness: 65.86     Kurtosis: 5733.45
kilometer       Skewness: -1.53     Kurtosis: 001.14
v_0             Skewness: -1.32     Kurtosis: 003.99
v_1             Skewness: 00.36     Kurtosis: -01.75
v_2             Skewness: 04.84     Kurtosis: 023.86
v_3             Skewness: 00.11     Kurtosis: -00.42
v_4             Skewness: 00.37     Kurtosis: -00.20
v_5             Skewness: -4.74     Kurtosis: 022.93
v_6             Skewness: 00.37     Kurtosis: -01.74
v_7             Skewness: 05.13     Kurtosis: 025.85
v_8             Skewness: 00.20     Kurtosis: -00.64
v_9             Skewness: 00.42     Kurtosis: -00.32
v_10            Skewness: 00.03     Kurtosis: -00.58
v_11            Skewness: 03.03     Kurtosis: 012.57
v_12            Skewness: 00.37     Kurtosis: 000.27
v_13            Skewness: 00.27     Kurtosis: -00.44
v_14            Skewness: -1.19     Kurtosis: 002.39
price           Skewness: 03.35     Kurtosis: 019.00

## 3) 每个数字特征得分布可视化
f = pd.melt(Train_data, value_vars=numeric_features)
g = sns.FacetGrid(f, col="variable",  col_wrap=2, sharex=False, sharey=False)
g = g.map(sns.distplot, "value")

v0-v4的特征分布相对均匀。而power的偏度和峰度特别大，右偏且特别峰顶尖锐。因此，需具体查看power的数据分布。

plt.figure(figsize=[16,4])
plt.subplot(1,2,1)
Train_data['power'].plot(kind='box')
plt.subplot(1,2,2)
Train_data['power'].hist()

从power的箱型图和直方图中可以看到，power大于2500的二手车数量非常少，
将power大于2500的数据剔除继续画图，发现仍然存在异常的值，结合赛题的字段说明中，
power的范围为[0,600]，因此，将power大于600的剔除，继续画图观察。
并将power进行log转换，发现数据有2部分。左边为0的同样是异常值，汽车功率不可能为0。因此，后续将对power大于600及为0的值进行异常值处理，
并对power进行log转换。

plt.figure(figsize=[16,4])
plt.subplot(1,2,1)
Train_data[Train_data['power']<=2500]['power'].plot(kind='box')
plt.subplot(1,2,2)
Train_data[Train_data['power']<=2500]['power'].hist()

plt.figure(figsize=[16,4])
plt.subplot(1,3,1)
Train_data[Train_data['power']<=600]['power'].plot(kind='box')
plt.subplot(1,3,2)
Train_data[Train_data['power']<=600]['power'].hist()
plt.subplot(1,3,3)
np.log(Train_data[Train_data['power']<=600]['power']+1).hist()

## 4) 数字特征相互之间的关系可视化
sns.set()
columns = ['price', 'v_12', 'v_8' , 'v_0', 'power', 'v_5',  'v_2', 'v_6', 'v_1', 'v_14']
sns.pairplot(Train_data[columns],height = 2 ,kind ='scatter',diag_kind='kde')
plt.show()

Y_train = Train_data['price']

## 5) 多变量互相回归关系可视化
fig, ((ax1, ax2), (ax3, ax4), (ax5, ax6), (ax7, ax8), (ax9, ax10)) = plt.subplots(nrows=5, ncols=2, figsize=(24, 20))
# ['v_12', 'v_8' , 'v_0', 'power', 'v_5',  'v_2', 'v_6', 'v_1', 'v_14']
v_12_scatter_plot = pd.concat([Y_train,Train_data['v_12']],axis = 1)
sns.regplot(x='v_12',y = 'price', data = v_12_scatter_plot,scatter= True, fit_reg=True, ax=ax1)

v_8_scatter_plot = pd.concat([Y_train,Train_data['v_8']],axis = 1)
sns.regplot(x='v_8',y = 'price',data = v_8_scatter_plot,scatter= True, fit_reg=True, ax=ax2)

v_0_scatter_plot = pd.concat([Y_train,Train_data['v_0']],axis = 1)
sns.regplot(x='v_0',y = 'price',data = v_0_scatter_plot,scatter= True, fit_reg=True, ax=ax3)

power_scatter_plot = pd.concat([Y_train,Train_data['power']],axis = 1)
sns.regplot(x='power',y = 'price',data = power_scatter_plot,scatter= True, fit_reg=True, ax=ax4)

v_5_scatter_plot = pd.concat([Y_train,Train_data['v_5']],axis = 1)
sns.regplot(x='v_5',y = 'price',data = v_5_scatter_plot,scatter= True, fit_reg=True, ax=ax5)

v_2_scatter_plot = pd.concat([Y_train,Train_data['v_2']],axis = 1)
sns.regplot(x='v_2',y = 'price',data = v_2_scatter_plot,scatter= True, fit_reg=True, ax=ax6)

v_6_scatter_plot = pd.concat([Y_train,Train_data['v_6']],axis = 1)
sns.regplot(x='v_6',y = 'price',data = v_6_scatter_plot,scatter= True, fit_reg=True, ax=ax7)

v_1_scatter_plot = pd.concat([Y_train,Train_data['v_1']],axis = 1)
sns.regplot(x='v_1',y = 'price',data = v_1_scatter_plot,scatter= True, fit_reg=True, ax=ax8)

v_14_scatter_plot = pd.concat([Y_train,Train_data['v_14']],axis = 1)
sns.regplot(x='v_14',y = 'price',data = v_14_scatter_plot,scatter= True, fit_reg=True, ax=ax9)

v_13_scatter_plot = pd.concat([Y_train,Train_data['v_13']],axis = 1)
sns.regplot(x='v_13',y = 'price',data = v_13_scatter_plot,scatter= True, fit_reg=True, ax=ax10)

此处是多变量之间的关系可视化，
可视化更多学习可参考很不错的文章 https://www.jianshu.com/p/6e18d21a4cad¶

2.5.2类别特征分析

## 1) unique分布
for fea in categorical_features:
    print(Train_data[fea].nunique())

categorical_features

['name',
 'model',
 'brand',
 'bodyType',
 'fuelType',
 'gearbox',
 'notRepairedDamage',
 'regionCode']

## 2) 类别特征箱形图可视化

# 因为 name和 regionCode的类别太稀疏了，这里我们把不稀疏的几类画一下
categorical_features = ['model',
 'brand',
 'bodyType',
 'fuelType',
 'gearbox',
 'notRepairedDamage']
for c in categorical_features:
    Train_data[c] = Train_data[c].astype('category')
    if Train_data[c].isnull().any():
        Train_data[c] = Train_data[c].cat.add_categories(['MISSING'])
        Train_data[c] = Train_data[c].fillna('MISSING')

def boxplot(x, y, **kwargs):
    sns.boxplot(x=x, y=y)
    x=plt.xticks(rotation=90)

f = pd.melt(Train_data[Train_data['price']<=2000], id_vars=['price'], value_vars=categorical_features)
g = sns.FacetGrid(f, col="variable",  col_wrap=2, sharex=False, sharey=False, height=5)
g = g.map(boxplot, "value", "price")

## 3) 类别特征的小提琴图可视化
catg_list = categorical_features
target = 'price'
for catg in catg_list :
    sns.violinplot(x=catg, y=target, data=Train_data[Train_data['price']<=2000])
    plt.show()

分析日期与价格关系

df_Train=Train_data.loc[:,['regDate','creatDate','price']]
#转换日期格式
df_Train['regDate']=df_Train['regDate'].astype(str)
df_Train['creatDate']=df_Train['creatDate'].astype(str)
df_Train['regyear']=df_Train['regDate'].str[0:4]
df_Train['creatyear']=df_Train['creatDate'].str[0:4]
df_Train['regmonth']=df_Train['regDate'].str[4:6]
df_Train['creatmonth']=df_Train['creatDate'].str[4:6]

df_Train['creatyear'].value_counts()

2016    149982
2015        18
Name: creatyear, dtype: int64

用pandas_profiling生成数据报告

用pandas_profiling生成一个较为全面的可视化和数据报告(较为简单、方便) 最终打开html文件即可

#import pandas_profiling
#pfr = pandas_profiling.ProfileReport(Train_data)
#pfr.to_file("./example.html")

三.总结

所给出的EDA步骤为广为普遍的步骤，在实际的不管是工程还是比赛过程中，这只是最开始的一步，也是最基本的一步。
接下来一般要结合模型的效果以及特征工程等来分析数据的实际建模情况，根据自己的一些理解，查阅文献，对实际问题做出判断和深入的理解。
最后不断进行EDA与数据处理和挖掘，来到达更好的数据结构和分布以及较为强势相关的特征

参考资料：
https://tianchi.aliyun.com/notebook-ai/detail?postId=95457

你可能感兴趣的:(二手车交易价格实战)

自然语言处理NLP入门 -- 第十节简单的聊天机器人山海青风 #自然语言处理自然语言处理 chatgpt
一、为什么要做聊天机器人？在互联网时代，我们日常接触到的“在线客服”“自动问答”等，大多是以聊天机器人的形式出现。它能帮我们快速回复常见问题，让用户获得及时的帮助，并在一定程度上减少人工客服的压力。同时，聊天机器人也是了解自然语言处理（NLP）最好的实战项目之一。因为它整合了文字理解（NLU）、对话管理、文本生成（NLG）等多方面知识，既能看到很直观的对话效果，也能结合深度学习模型让机器人变得更智
Python实用技巧：轻松上手自动化数据爬取与存储傻啦嘿哟 python 自动化开发语言
目录一、准备阶段：确定目标与安装工具1.确定目标网站2.安装Python及必要库二、编写爬虫程序：发送请求与解析网页1.发送HTTP请求2.解析网页内容三、处理反爬虫机制：应对挑战与策略1.设置请求头2.使用代理IP四、数据存储与处理：保存与分析数据1.存储为文本文件2.存储为数据库3.存储为Excel文件五、实战案例：爬取电商平台商品价格1.分析目标网站2.编写爬虫程序3.运行爬虫程序六、优化与
本地大模型编程实战(27)初探langgraph的流式输出火云牌神 AI编程实战 langchain agent 智能体流式输出 LLM
对于LLM(大语言模型)，流式传输已成为一种越来越受欢迎的功能。其理念是在LLM生成令牌时就快速返回，而不是等待创建完整响应后再返回全部内容。对于简单的场景，流式传输实际上非常容易实现，但当涉及到智能体之类的应用时，它会变得复杂，这些智能体有自己的运行逻辑，可能会阻止我们尝试进行流式传输。本文将探讨langchain的流式输出，后面将实现智能体最终结果的流式输出。本次演练将全部使用qwen2.5:
本地大模型编程实战(09)自制聊天机器人(3) 火云牌神 AI编程实战 python langchain llama deepseek
文章目录准备自动裁剪聊天历史聊天机器人定义提示词模板定义state构建app测试流式输出总结代码本文将实现一个比较完善的聊天机器人的主要功能。包括：使用LangGraph构建聊天机器人自动裁剪聊天历史管理聊天会话的方法以流的方式输出回复我们将同时使用llama3.1和deepseek做演示。由于langchain可能对不同大模型支持程度不同以及其它限制，所以这个对比并不能说明哪个模型更好。准备在正
本地大模型编程实战(11)与外部工具交互(2) 火云牌神 AI编程实战 python langchain llama deepseek
文章目录准备定义工具方法创建提示词生成工具方法实参以`json`格式返回实参自定义`JsonOutputParser`返回`json`调用工具方法定义通用方法用链返回结果返回结果中包含工具输入总结代码在使用LLM(大语言模型)时，经常需要调用一些自定义的工具方法完成特定的任务，比如：执行一些特殊算法、查询天气预报、旅游线路等。很多大模型都具备使用这些工具方法的能力，Langchain也为这些调用提
本地大模型编程实战(25)用langgraph实现基于SQL数据构建的问答系统(4) 火云牌神 AI编程实战 sql langgraph LLM deepseek qwen
本文将演练使用基于langgraph链，对结构化数据库SQlite进行查询的方法。该系统建立以后，我们不需要掌握专业的SQL技能，可以用自然语言询问有关数据库中数据的问题并返回答案。使大语言模型(LLM)查询结构化数据与非结构化文本数据有所不同。查询非结构化数据时，通常需要将待查询的文本嵌入到向量数据库中；而查询结构化数据的方法则是让LLM编写和执行DSL（例如SQL）进行查询。在用langcha
基于 Pytorch 的全卷积网络人脸表情识别：从数据到部署的实战之旅那年一路北 Pytorch理论+实践 pytorch 网络人工智能
前言：本文将详细介绍基于Pytorch框架，利用全卷积网络进行人脸表情识别的完整过程，涵盖从数据集的准备、模型的设计与训练，再到模型的部署与预测，通过代码实现以及详细讲解，帮助读者深入理解并掌握这一技术。一、引言人脸表情是人类情感交流的重要方式，不同的表情能够传达出丰富的情感信息。人脸表情识别在智能交互、安防监控、心理健康分析等众多领域有着广泛的应用前景。随着深度学习技术的发展，基于卷积神经网络的
uview2.0封装http请求实战以及常见请求传参实录卖柴火的小伙子 http 前端 uview2.0 uniapp post传参
1.前言2.使用步骤2.1配置请求拦截器以及api集中管理配置2.2main.js中进行引入请求拦截器2.3页面中引入请求方法并使用1.前言uview2.0是uniapp开发中使用频率相对来讲比较高的一款框架,今天从实战角度介绍一下关于http请求uview是如何进行封装.该插件支持post、get、put和delete，以及上传下载等请求，有如下特点：基于Promise对象实现更简单的reque
物联网智能项目实战：从概念到实现程序猿！=程序员物联网
引言物联网（IoT）正在以前所未有的速度改变着我们的生活，从智能家居到工业自动化，物联网的应用无处不在。作为一名嵌入式工程师，掌握物联网技术并将其应用于实际项目中，是提升自身竞争力的关键。本文将带你从零开始，一步步完成一个物联网智能项目的开发，涵盖项目构思、硬件选型、软件开发、云平台接入等关键环节。一、项目构思首先，我们需要明确项目的目标和功能。以下是一些物联网智能项目的灵感来源：智能家居:智能灯
UniApp 中封装 HTTP 请求与 Token 管理（附Demo）码农研究僧前端/小程序 uniapp vue3 js request token
目录1.基本知识2.Demo3.拓展1.基本知识从实战代码中学习，上述实战代码来源：芋道源码/yudao-mall-uniapp该代码中，通过自定义request函数对HTTP请求进行了统一管理，并且结合了Token认证机制请求封装原理，request函数是对uni.request的一个封装：动态设置请求头：根据config的配置，决定是否需要在请求头中附加Authorization（Bearer
uniapp 系统学习，从入门到实战（五）—— 组件库与常用 UI 组件小那同学 uniapp uni-app
全篇大概7000字(含代码)，建议阅读时间30minUniApp基于Vue.js的跨平台特性，提供了丰富的内置组件和灵活的扩展能力。本文将从内置组件、扩展组件库和自定义组件开发三个维度，系统解析UniApp的组件生态，并结合实际开发场景提供实践建议。目录内置组件扩展组件库自定义组件开发总结1.内置组件UniApp内置组件经过多端适配，可自动转换为原生控件，确保一致性和性能。以下是核心分类及使用要点
【MySQL】基础实战篇(2)—数据查询操作 m0_74824496 面试学习路线阿里巴巴 mysql 数据库
前言数据查询是数据库管理系统应用的主要内容，也是用户对数据库最频繁、最常见的操作请求。数据查询可以根据用户提供的限定条件，从已存在的数据表中检索用户需要的数据。MySQL使用SELECT语句既可以完成简单的单表查询、联合查询，也可以完成复杂的联接查询、子查询，从数据库中检索符合用户需求的数据，并将结果集以表格的形式返回给用户。这里写目录标题前言学习目标单表查询查询语句的基本用法字段的别名DISTI
单卡挑战千亿模型！深度求索MoE架构实战指南：从理论到开源工具全解析小诸葛IT课堂架构
引言：为什么需要单GPU训练千亿参数模型？随着大模型参数规模突破千亿级别，训练成本与算力需求呈指数级增长。传统密集架构（DenseModel）在单卡训练中面临显存不足、计算效率低等问题。**混合专家模型（MixtureofExperts,MoE）**通过稀疏激活机制，成为突破单卡训练瓶颈的关键技术。本文将结合深度求索（DeepSeek）的MoE架构实战经验，详解如何用单个GPU训练千亿参数模型，并
列表推导式与生成器表达式（深度实战版） Bruce_xiaowei 笔记编程总结经验 python 数据结构
列表推导式与生成器表达式（深度实战版）一、列表推导式：不只是语法糖1.底层原理剖析#编译后的字节码对比deftraditional_loop():result=[]foriinrange(5):result.append(i*2)returnresultdeflist_comprehension():return[i*2foriinrange(5)]#使用dis模块查看字节码差异importdis
SQL 实战—递归 SQL：层级结构查询与处理树形数据 m0_74823239 面试学习路线阿里巴巴 sql java 数据库
在数据库中，树形或层级结构的数据非常常见，如组织架构、分类目录、评论回复等。SQL提供了递归查询的能力，通过递归通用表表达式（CTE），可以高效地查询和处理树形数据。本文将通过实际案例详细讲解递归SQL的应用。一、递归SQL基本概念1.什么是递归SQL？递归SQL是指在SQL查询中，自我引用以遍历层级结构或处理递归关系的一种方式。MySQL8.0、PostgreSQL和SQLServer等数据库均
【Java基础】深入剖析Java中构造器、实例变量、静态变量、代码块的执行顺序！原理+实战，一文搞定！工一木子 Java基础知识系列 Java java 开发语言
深入剖析Java中构造器、实例变量、静态变量、代码块的执行顺序！原理+实战，一文搞定！在Java编程中，构造器、实例变量、静态变量、实例代码块和静态代码块的执行顺序是一个经典且重要的知识点。无论是日常开发还是面试，理解这些内容的执行顺序都至关重要。今天，我们将通过原理分析和实战代码，彻底搞懂这些内容的执行顺序，并附上详细的代码示例，帮助你轻松掌握！1.核心概念回顾在深入分析之前，我们先回顾一下这些
【折线图 Line】——5 花花 Show Python pyecharts—从0到精通信息可视化数据分析 python
解锁数据可视化的魔法钥匙——pyecharts实战指南在这个数据为王的时代，每一次点击、每一次交易、每一份报告背后都隐藏着无尽的故事与洞察。但你是否曾苦恼于如何将这些冰冷的数据转化为直观、吸引人的视觉盛宴？欢迎来到《pyecharts图形绘制大师班》在这里，你将不再受限于单调的表格和图表，而是学会如何运用pyecharts这一强大的Python数据可视化库，将复杂的数据转化为令人惊叹的交互式图形。
RabbitMQ 学习路线与知识总结千里码！后端技术消息队列 java rabbitmq 学习分布式
以下是RabbitMQ学习路线与知识总结，结合Mermaid生成的脑图，帮助你系统掌握核心概念和实战技巧。编程相关书籍分享：https://blog.csdn.net/weixin_47763579/article/details/145855793DeepSeek使用技巧pdf资料分享：https://blog.csdn.net/weixin_47763579/article/details/1
DDD架构实战：用Java实现一个电商订单系统，快速掌握领域驱动设计工一木子软件架构系统设计系统架构软件工程 DDD架构系统设计领域驱动设计
引言你是否曾为复杂的业务逻辑感到头疼？是否在面对需求变更时感到无力？今天，我们将带你深入**领域驱动设计（DDD）**的世界，通过一个简单的电商订单系统实战项目，快速掌握DDD的核心思想与实现方法！无论你是初学者还是有一定经验的开发者，这篇文章都将为你提供清晰的指导和实用的代码示例。读完本文，你将能够：理解DDD的核心概念与分层架构。掌握如何用Java实现一个DDD风格的电商订单系统。学会如何通过
一文快速实战Kotlin协程与Flow 陈禹潼 kotlin 开发语言 android java
前言不知道大家有没有跟我一样的感受：即使自己用心在网上学过协程和Flow了，但过了一段时间就又忘掉了。这大部分的原因其实是因为我们缺少实战。我平时工作里根本就接触不到协程和Flow，自己又不敢硬往上写，万一出问题了咋整？所以一直就处于理论学习阶段，导致我学了就跟没学一样。今天就带大家一起来解决这个问题，通过几个简单的Demo和实战，巩固我们Kotlin协程和Flow的知识体系，从而能更有信心地用到
Java基于SpringBoot的校园心声墙小程序（附源码，文档） stormjun 小程序毕业设计 java spring boot 小程序校园心声墙小程序
基于SpringBoot的校园心声墙小程序博主介绍：✌stormjun、8年大厂程序员经历。全网粉丝15w+、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌文末获取源码联系精彩专栏推荐订阅不然下次找不到哟Java项目精品实战案例《100套》Java微信小程序项目实战《100套》Python项目实战《100套》感兴趣的可以先收藏起来，还有大家
如何在简历中巧妙展现你的兴趣爱好贵州数擎科技有限公司面试跳槽
大家好！我是[数擎AI]，一位热爱探索新技术的前端开发者，在这里分享前端和Web3D、AI技术的干货与实战经验。如果你对技术有热情，欢迎关注我的文章，我们一起成长、进步！开发领域：前端开发|AI应用|Web3D|元宇宙技术栈：JavaScript、React、ThreeJs、WebGL、Go经验经验：6年+前端开发经验，专注于图形渲染和AI技术开源项目：智简未来、晓智元宇宙、数字孪生引擎在简历中展
使用 Three.js 转换 GLSL 粒子效果着色器贵州数擎科技有限公司 javascript 着色器开发语言
大家好！我是[数擎AI]，一位热爱探索新技术的前端开发者，在这里分享前端和Web3D、AI技术的干货与实战经验。如果你对技术有热情，欢迎关注我的文章，我们一起成长、进步！开发领域：前端开发|AI应用|Web3D|元宇宙技术栈：JavaScript、React、ThreeJs、WebGL、Go经验经验：6年+前端开发经验，专注于图形渲染和AI技术开源项目：AI简历、元宇宙、数字孪生在这篇博客中，我们
侯捷C++课程学习笔记：深入探索C++内存管理机制清水白石008 c++学习笔记
侯捷C++课程学习笔记：深入探索C++内存管理机制引言有幸参与“学C++，赢好礼”——侯捷C++系列精品课学习笔记征文活动，我深感荣幸。侯捷老师作为C++教育界的泰斗，其课程深入浅出，实战性强，引领我们开发者真正理解C++的精髓。在学习侯捷C++系列课程的过程中，我受益匪浅，尤其是在内存管理这一核心领域，更是有了系统而深刻的认识。本文将围绕侯捷C++课程的学习内容，结合个人心得体会，深入探讨C++
实战：基于Pandas的房价数据分析全流程深度解析（附高阶技巧与数学推导）（十二） WHCIS Pandas pandas 数据分析 python
一、项目深度解析框架1.1分析维度全景图数据加载元数据分析数据清洗特征工程多维分析模型准备自动化报告1.2高阶分析工具链数据清洗：Missingno高级可视化、Optuna自动超参优化特征工程：TsFresh时序特征生成、FeatureTools自动化特征衍生可视化：Plotly动态交互、Altair声明式语法报告：JupyterNotebook魔法命令、Voila仪表板二、数据加载的工程级优化2
MySQL × 向量数据库：大模型时代的黄金组合实战指南 mysql人工智能
一、大模型时代的数据存储革命1.1传统架构的局限性--传统商品表结构CREATETABLEproducts(idINTPRIMARYKEY,titleVARCHAR(255),descriptionTEXT,category_idINT);--典型关键词搜索SELECT*FROMproductsWHEREtitleLIKE'%智能手机%'ORdescriptionLIKE'%旗舰机型%';痛点分析
为什么面试狂问Redis，阿里面试官把我问到哑口无言… 2501_90433130 面试 redis 职场和发展
Redis我们在工作中经常会用到，但是为什么要用、redis的一些场景和实战问题，90%以上的人都不是很懂。曾经自己去面试阿里，就被Redis问题问到哑口无言…事后我专门去恶补了Redis，现在算是比较精通了。作为目前主流的NoSQL技术，redis在Java互联网中得到了非常广泛的使用，个时代码代码的秃头人员，对Redis肯定是不陌生的，如果连Redis都没用过，还真不好意思出去面试，指不定被面
GitHub 星标10W+的大模型书籍：《轻松入门大模型应用开发：GPT-4 和 ChatGPT 实战指南》，25年一书通关LLM大模型程序员丸子人工智能语言模型自然语言处理大模型 AI LLM 大模型应用
当下大模型这么火，还有人很多人想加入进来，但是不知道怎么去学习，那么今天我就给大家分享一本适合所有人的一本神仙级入门大模型的书籍，小白也能学会。它是由奥利维耶·卡埃朗和玛丽-艾丽斯·布莱特合著的一本《大模型应用开发极简入门：基于GPT-4和ChatGPT》，为初学者提供一份清晰、全面的“可用知识”，帮助读者快速了解GPT-4和ChatGPT的工作原理及优势。此书使用流行的Python编程语言来构建
小红书电商运营，97节小红书vip内部课，带你实现小红书赚钱 LooKMeG 大数据教育电商
本套小红书电商运营VIP课程系统解析平台运营全流程，包含97节实战教学视频深度讲解垂直账号打造、数据选品策略、爆款图文创作等核心技能。课程涵盖店铺开设流程优化、考古加选品工具应用、灰豚数据分析实操，重点突破流量获取、笔记违规规避、直播脚本设计等实操难点。教学内容涉及AI图片生成、Live动图制作、私域变现布局等前沿技术，配套ERP软件使用指南与主播能力培养方案，帮助学员掌握小红书站内外选品技巧、高
玩转Java微服务：架构设计与实战进阶终极指南 Light60 低代码实战篇技能篇 Java微服务 Spring Cloud 分布式架构容器化部署服务治理
摘要本文深入解析Java微服务核心原理与落地实践，涵盖SpringCloudAlibaba生态体系实战技巧。通过全链路代码示例演示服务注册发现、分布式配置、熔断限流等关键模块实现，结合电商案例阐述DDD领域驱动设计在微服务拆分的应用。提供可落地的性能优化方案与云原生演进路线，助您构建高可用、易扩展的现代化分布式系统。关键词：Java微服务、SpringCloud、分布式架构、容器化部署、服务治理一
jdk tomcat 环境变量配置 Array_06 java jdk tomcat
Win7 下如何配置java环境变量 1。准备jdk包，win7系统，tomcat安装包（均上网下载即可） 2。进行对jdk的安装，尽量为默认路径（但要记住啊！！以防以后配置用。。。） 3。分别配置高级环境变量。电脑-->右击属性-->高级环境变量-->环境变量。分别配置 : path &nbs
Spring调SDK包报java.lang.NoSuchFieldError错误 bijian1013 java spring
在工作中调另一个系统的SDK包，出现如下java.lang.NoSuchFieldError错误。 org.springframework.web.util.NestedServletException: Handler processing failed; nested exception is java.l
LeetCode[位运算] - #136 数组中的单一数 Cwind java 题解位运算 LeetCode Algorithm
原题链接：#136 Single Number 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现两次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：题目限定了线性的时间复杂度，同时不使用额外的空间，即要求只遍历数组一遍得出结果。由于异或运算 n XOR n = 0, n XOR 0 = n，故将数组中的每个元素进
qq登陆界面开发 15700786134 qq
今天我们来开发一个qq登陆界面，首先写一个界面程序，一个界面首先是一个Frame对象，即是一个窗体。然后在这个窗体上放置其他组件。代码如下： public class First { public void initul(){ jf=ne
Linux的程序包管理器RPM 被触发 linux
在早期我们使用源代码的方式来安装软件时，都需要先把源程序代码编译成可执行的二进制安装程序，然后进行安装。这就意味着每次安装软件都需要经过预处理-->编译-->汇编-->链接-->生成安装文件--> 安装，这个复杂而艰辛的过程。为简化安装步骤，便于广大用户的安装部署程序，程序提供商就在特定的系统上面编译好相关程序的安装文件并进行打包，提供给大家下载，我们只需要根据自己的
socket通信遇到EOFException 肆无忌惮_ EOFException
java.io.EOFException at java.io.ObjectInputStream$PeekInputStream.readFully(ObjectInputStream.java:2281) at java.io.ObjectInputStream$BlockDataInputStream.readShort(ObjectInputStream.java:
基于spring的web项目定时操作知了ing java Web
废话不多说，直接上代码，很简单配置一下项目启动就行 1，web.xml <?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="h
树形结构的数据库表Schema设计矮蛋蛋 schema
原文地址： http://blog.csdn.net/MONKEY_D_MENG/article/details/6647488 程序设计过程中，我们常常用树形结构来表征某些数据的关联关系，如企业上下级部门、栏目结构、商品分类等等，通常而言，这些树状结构需要借助于数据库完成持久化。然而目前的各种基于关系的数据库，都是以二维表的形式记录存储数据信息，
maven将jar包和源码一起打包到本地仓库 alleni123 maven
http://stackoverflow.com/questions/4031987/how-to-upload-sources-to-local-maven-repository <project> ... <build> <plugins> <plugin> <groupI
java IO操作与 File 获取文件或文件夹的大小，可读，等属性！！！百合不是茶
类 File File是指文件和目录路径名的抽象表示形式。 1，何为文件：标准文件（txt doc mp3...）目录文件（文件夹）虚拟内存文件 2，File类中有可以创建文件的 createNewFile（）方法,在创建新文件的时候需要try{} catch(）{}因为可能会抛出异常；也有可以判断文件是否是一个标准文件的方法isFile();这些防抖都
Spring注入有继承关系的类（2） bijian1013 java spring
被注入类的父类有相应的属性，Spring可以直接注入相应的属性，如下所例：1.AClass类 package com.bijian.spring.test4; public class AClass { private String a; private String b; public String getA() { retu
30岁转型期你能否成为成功人士 bijian1013 成长励志
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
【Velocity四】Velocity与Java互操作 bit1129 velocity
Velocity出现的目的用于简化基于MVC的web应用开发，用于替代JSP标签技术，那么Velocity如何访问Java代码.本篇继续以Velocity三http://bit1129.iteye.com/blog/2106142中的例子为基础， POJO package com.tom.servlets; public
【Hive十一】Hive数据倾斜优化 bit1129 hive
什么是Hive数据倾斜问题操作：join,group by,count distinct 现象：任务进度长时间维持在99%（或100%），查看任务监控页面，发现只有少量（1个或几个）reduce子任务未完成；查看未完成的子任务，可以看到本地读写数据量积累非常大，通常超过10GB可以认定为发生数据倾斜。原因：key分布不均匀倾斜度衡量：平均记录数超过50w且
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua csrf
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-3.求子数组的最大和 bylijinnan java
package beautyOfCoding; public class MaxSubArraySum { /** * 3.求子数组的最大和题目描述：输入一个整形数组，数组里有正数也有负数。数组中连续的一个或多个整数组成一个子数组，每个子数组都有一个和。求所有子数组的和的最大值。要求时间复杂度为O(n)。例如输入的数组为1, -2, 3, 10, -4,
Netty源码学习-FileRegion bylijinnan java netty
今天看org.jboss.netty.example.http.file.HttpStaticFileServerHandler.java 可以直接往channel里面写入一个FileRegion对象，而不需要相应的encoder： //pipeline（没有诸如“FileRegionEncoder”的handler）： public ChannelPipeline ge
使用ZeroClipboard解决跨浏览器复制到剪贴板的问题 cngolon 跨浏览器复制到粘贴板 Zero Clipboard
Zero Clipboard的实现原理 Zero Clipboard 利用透明的Flash让其漂浮在复制按钮之上，这样其实点击的不是按钮而是 Flash ，这样将需要的内容传入Flash，再通过Flash的复制功能把传入的内容复制到剪贴板。 Zero Clipboard的安装方法首先需要下载 Zero Clipboard的压缩包，解压后把文件夹中两个文件：ZeroClipboard.js
单例模式 cuishikuan 单例模式
第一种（懒汉，线程不安全）： public class Singleton { 2 private static Singleton instance; 3 pri
spring+websocket的使用 dalan_123
一、spring配置文件 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.or
细节问题：ZEROFILL的用法范围。 dcj3sjt126com mysql
1、zerofill把月份中的一位数字比如1，2，3等加前导0 mysql> CREATE TABLE t1 (year YEAR(4), month INT(2) UNSIGNED ZEROFILL, -> day
Android开发10——Activity的跳转与传值 dcj3sjt126com Android开发
Activity跳转与传值，主要是通过Intent类，Intent的作用是激活组件和附带数据。一、Activity跳转方法一Intent intent = new Intent(A.this, B.class); startActivity(intent) 方法二Intent intent = new Intent();intent.setCla
jdbc 得到表结构、主键 eksliang jdbc 得到表结构、主键
转自博客：http://blog.csdn.net/ocean1010/article/details/7266042 假设有个con DatabaseMetaData dbmd = con.getMetaData(); rs = dbmd.getColumns(con.getCatalog(), schema, tableName, null); rs.getSt
Android 应用程序开关GPS gqdy365 android
要在应用程序中操作GPS开关需要权限： <uses-permission android:name="android.permission.WRITE_SECURE_SETTINGS" /> 但在配置文件中添加此权限之后会报错，无法再eclipse里面正常编译，怎么办？ 1、方法一：将项目放到Android源码中编译； 2、方法二：网上有人说cl
Windows上调试MapReduce zhiquanliu mapreduce
1.下载hadoop2x-eclipse-plugin https://github.com/winghc/hadoop2x-eclipse-plugin.git 把 hadoop2.6.0-eclipse-plugin.jar 放到eclipse plugin 目录中。 2.下载 hadoop2.6_x64_.zip http://dl.iteye.com/topics/download/d2b
如何看待一些知名博客推广软文的行为？ justjavac 博客
本文来自我在知乎上的一个回答：http://www.zhihu.com/question/23431810/answer/24588621 互联网上的两种典型心态：当初求种像条狗，如今撸完嫌人丑当初搜贴像条犬，如今读完嫌人软你为啥感觉不舒服呢？难道非得要作者把自己的劳动成果免费给你用，你才舒服？就如同 Google 关闭了 Gooled Reader，那是
sql优化总结 macroli sql
为了是自己对sql优化有更好的原则性，在这里做一下总结，个人原则如有不对请多多指教。谢谢！要知道一个简单的sql语句执行效率，就要有查看方式，一遍更好的进行优化。一、简单的统计语句执行时间 declare @d datetime ---定义一个datetime的变量set @d=getdate() ---获取查询语句开始前的时间select user_id
Linux Oracle中常遇到的一些问题及命令总结超声波 oracle linux
1.linux更改主机名 (1)#hostname oracledb　　　　临时修改主机名 (2) vi /etc/sysconfig/network 　　修改hostname (3) vi /etc/hosts　　　　　　　　修改IP对应的主机名 2.linux重启oracle实例及监听的各种方法（注意操作的顺序应该是先监听，后数据库实例） &nbs
hive函数大全及使用示例 superlxw1234 hadoop hive函数
具体说明及示例参见附件文档。文档目录：目录一、关系运算： 4 1. 等值比较: = 4 2. 不等值比较: <> 4 3. 小于比较: < 4 4. 小于等于比较: <= 4 5. 大于比较: > 5 6. 大于等于比较: >= 5 7. 空值判断: IS NULL 5
Spring 4.2新特性-使用@Order调整配置类加载顺序 wiselyman spring 4
4.1 @Order Spring 4.2 利用@Order控制配置类的加载顺序 4.2 演示两个演示bean package com.wisely.spring4_2.order; public class Demo1Service { } package com.wisely.spring4_2.order; public class