小安同学apj

kaggle-House Prices: Advanced Regression Techniques房价预测

比赛介绍：
刚上研究生的时候就听过kaggle这个网站，但当时看它全是英文版的网站，就没太放在心上，因为英文水平确实是不咋地，最近才发现，kaggle确实是一个非常好的学习网站，因为它的用户量非常大，并且还有很多用户分享的内核-kernels，我们可以从中获得很多经验-如果做一个完成的项目，有哪些步骤，预处理、特征工程、建立模型等等，这是本人在kaggle上玩的第二个入门项目，嘻嘻，下面正是开始讲解，文笔有限，敬请见谅，欢迎指正：

首先放上比赛地址：https://www.kaggle.com/c/house-prices-advanced-regression-techniques

简介：给定训练集和测试集，训练集总共有房子的很多特征(面积，房价数等等），并且还有房价，然后通过训练集去建立模型预测测试集中的房子的房价。

特征说明：
SalePrice - the property's sale price in dollars. This is the target variable that you're trying to predict.：房价
MSSubClass: The building class：建筑种类（20，30，40等等，也不知道啥意思）
MSZoning: The general zoning classification：分区分类（5类：RH,C(all),RL等等）
LotFrontage: Linear feet of street connected to property：与财产相连的街道的直线尺（20，30，234+NA)
LotArea: Lot size in square feet:面积（8450，11200...)
Street: Type of road access：道路通道类别（Grvi Pave两类）
Alley: Type of alley access：通道类型（Grvi Pave两类+NA）
LotShape: General shape of property:财产形状（4类：IR1,IR2...)
LandContour: Flatness of the property:平坦性（4类：Lvl...）
Utilities: Type of utilities available可用的工具种类（2类：Allpub...）
LotConfig: Lot configuration配置（5类：corner...)
LandSlope: Slope of property倾斜属性(3类：Gtl...）
Neighborhood: Physical locations within Ames city limits埃姆斯市范围内的物理位置：好多类（dlegg...)
Condition1: Proximity to main road or railroad靠近主干路或铁路（Norm,Alidg...)
Condition2: Proximity to main road or railroad (if a second is present)靠近主干路或铁路（如果有第二条）
BldgType: Type of dwelling：住宅类型（5类）
HouseStyle: Style of dwelling：住宅风格（7类左右）
OverallQual: Overall material and finish quality整体材料和成品质量：1-10之间
OverallCond: Overall condition rating总体状况评级：1-9之间
YearBuilt: Original construction dateYear建于某某年：2031
RemodAdd: Remodel date：改变日期2001
RoofStyle: Type of roof：屋顶风格（5类:Gable...）
RoofMatl: Roof material:屋顶材料（8类左右)
Exterior1st: Exterior covering on house房屋外墙：（好几类呢也）
Exterior2nd: Exterior covering on house (if more than one material)：（第二种材料，多了个None，有些就一种材料）
MasVnrType: Masonry veneer type表层砌体类型：（4类+None）
MasVnrArea: Masonry veneer area in square feet：砖石面积：（0，各种数字1，300，还有NA）
ExterQual: Exterior material quality外部材质：（4类，四个看不懂的英文缩写）
ExterCond: Present condition of the material on the exterior外观材料的现状：由高到低，5类
Foundation: Type of foundation地基类型:几类看不懂的类型(wood...)
BsmtQual: Height of the basement地下室的高度:由高到低：5类
BsmtCond: General condition of the basement地下室现状：同上，5类
BsmtExposure: Walkout or garden level basement walls户外或花园水平的地下室墙壁，同上，5类
BsmtFinType1: Quality of basement finished area地下室装修区域质量：好几类
BsmtFinSF1: Type 1 finished square feet：1型面积
BsmtFinType2: Quality of second finished area (if present)：第二种质量
BsmtFinSF2: Type 2 finished square feet：2型面积
BsmtUnfSF: Unfinished square feet of basement area未完工的地下室面积
TotalBsmtSF: Total square feet of basement area地下面积的总面积
Heating: Type of heating：加热方式：好几种
HeatingQC: Heating quality and condition加热质量及条件：5种
CentralAir: Central air conditioning中央空调（N/Y)有或者没有yes or no
Electrical: Electrical system电气系统:好几种
1stFlrSF: First Floor square feet第一层面积
2ndFlrSF: Second floor square feet第二层面积
LowQualFinSF: Low quality finished square feet (all floors)低品质成品平方英尺(所有楼层)：各种数字
GrLivArea: Above grade (ground) living area square feet地面以上居住面积平方英尺
BsmtFullBath: Basement full bathrooms地下室全浴室（0-3）
BsmtHalfBath: Basement half bathrooms半地下室卫生间（0-2）
FullBath: Full bathrooms above grade高档全浴室（0-3）
HalfBath: Half baths above grade半浴缸以上（0-2）
Bedroom: Number of bedrooms above basement level地下室以上的卧室数：0-8
Kitchen: Number of kitchens厨房数量
KitchenQual: Kitchen quality厨房质量：5个
TotRmsAbvGrd: Total rooms above grade (does not include bathrooms)房间总数(不含卫生间)
Functional: Home functionality rating家庭功能评级（min,mod...）
Fireplaces: Number of fireplaces壁炉数量
FireplaceQu: Fireplace quality壁炉质量
GarageType: Garage location车库位置（好几类)
GarageYrBlt: Year garage was built车库建造年份
GarageFinish: Interior finish of the garage车库内部装修
GarageCars: Size of garage in car capacity车库容量的大小0-4
GarageArea: Size of garage in square feet车库面积
GarageQual: Garage quality车库质量
GarageCond: Garage condition车库条件，好几类
PavedDrive: Paved driveway道路车道（N/P/Y)
WoodDeckSF: Wood deck area in square feet木甲板面积
OpenPorchSF: Open porch area in square feet开放式门廊面积(平方英尺)
EnclosedPorch: Enclosed porch area in square feet3:3英尺的封闭式玄关区域
SsnPorch: Three season porch area in square feet三季门廊面积平方英尺
ScreenPorch: Screen porch area in square feet屏风门廊面积(平方英尺)
PoolArea: Pool area in square feet游泳池面积(平方英尺)
PoolQC: Pool quality泳池质量
Fence: Fence quality栅栏质量
MiscFeature: Miscellaneous feature not covered in other categories其他类别中未涉及的杂项功能
MiscVal: $Value of miscellaneous feature杂项特征值0-15500
MoSold: Month
SoldYrSold: Year
SoldSaleType: Type of sale：看不懂的好几类
SaleCondition: Condition of sale销售质量

1. 数据预处理

导入相应库：

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt#三大基本库

导入数据：

train=pd.read_csv("data/train.csv")
test=pd.read_csv("data/test.csv")

查看训练集的前5行：

print(train.head(5))

发现中间省略了很多列，输入以下代码，显示全部列：

pd.set_option("display.max_columns",None)
pd.set_option("display.max_rows",None)
pd.set_option("max_colwidth",100)

查看训练集和测试集的形状：

print(train.shape,test.shape) #(1460, 81) (1459, 80)

可知训练集有1460行，81个特征；测试集有1459行，有80个特征，除了价格，这正是咱们要预测的特征。

对ID列的处理：

train_Id=train.Id
test_Id=test.Id #保存ID

#删除ID列
train.drop("Id",axis=1,inplace=True)
test.drop("Id",axis=1,inplace=True)

print(train.shape,test.shape) #(1460, 80) (1459, 79)

2.数据可视化

可视化面积（GrLivArea）和销售价格（SalePrice）间的关系

#data processing
plt.figure(1)
plt.scatter(x=train['GrLivArea'],y=train['SalePrice'])
plt.ylabel('SalePrice',fontsize=13)
plt.xlabel("GrLivArea",fontsize=13)
plt.show()

从上图得知：右下角的两个值为异常值，面积很大，但是价格却很低，不符合总体规律，可能是什么农场之类的，因此我们应该去掉这两行数据。

train=train.drop(train[(train['GrLivArea']>4000)&(train['SalePrice']<300000)].index)

查看销售价格（SalePrice）的分布情况

import seaborn as sns
color =sns.color_palette()
sns.set_style('darkgrid')

from scipy import stats
from scipy.stats import norm,skew


plt.figure(2)
sns.distplot(train['SalePrice'],fit=norm)

(mu, sigma) = norm.fit(train['SalePrice'])
plt.legend(['Normal dist. ($\mu=$ {:.2f} and $\sigma=$ {:.2f} )'.format(mu, sigma)],
            loc='best')
plt.ylabel('Frequency')
plt.title('SalePrice distribution')
plt.show()

#skew:偏度 =0正太分布 >0正偏
#kurt:峰度 >0尖顶峰，<0平顶峰
print("skewness: %f" % train['SalePrice'].skew())
print("kurtosis: %f" % train['SalePrice'].kurt())
#skewness: 1.882876
#kurtosis: 6.536282

plt.figure(3)
res = stats.probplot(train['SalePrice'], plot=plt)
plt.show()

对SalePrice取对数，让其符合正太分布：

train['SalePrice']=np.log1p(train['SalePrice'])
plt.figure(4)
sns.distplot(train['SalePrice'],fit=norm)
(mu, sigma) = norm.fit(train['SalePrice'])
plt.legend(['Normal dist. ($\mu=$ {:.2f} and $\sigma=$ {:.2f} )'.format(mu, sigma)],
            loc='best')
plt.ylabel('Frequency')
plt.title('SalePrice distribution')
plt.show()

可视化特征之间的相关性：

#saleprice correlation matrix
#找与price最相关的10个量
k=10
#10个cloumn names
cols=corrmat.nlargest(k,'SalePrice')['SalePrice'].index
cm=np.corrcoef(train[cols].values.T)
print(cm)#一个二维矩阵
sns.set(font_scale=1.25)
hm = sns.heatmap(cm, cbar=True, annot=True, square=True, fmt='.2f',
                 annot_kws={'size': 10}, yticklabels=cols.values, xticklabels=cols.values)
plt.show()

由上图可知：与价格相关性最大的10个变量分别是：如上图所示的10个坐标值。

3. 缺失值的处理

缺失值概览：

#missing data
#对每一列总共有多少个缺失值进行排序：total
total=train.isnull().sum().sort_values(ascending=False)
#缺失值占总缺失的总数
percent=(train.isnull().sum()/train.isnull().count()).sort_values(ascending=False)
missing_data=pd.concat([total,percent],axis=1,keys=['Total','Percent'])
print(missing_data.head(20))

结果如下：

   Total Percent
PoolQC    1453 0.995205
MiscFeature 1406 0.963014
Alley 1369 0.937671
Fence 1179 0.807534
FireplaceQu 690 0.472603
LotFrontage 259 0.177397
GarageCond 81 0.055479
GarageType 81 0.055479
GarageYrBlt 81 0.055479
GarageFinish 81 0.055479
GarageQual 81 0.055479
BsmtExposure 38 0.026027
BsmtFinType2 38 0.026027
BsmtFinType1 37 0.025342
BsmtCond    37 0.025342
BsmtQual 37 0.025342
MasVnrArea 8 0.005479
MasVnrType    8 0.005479
Electrical    1 0.000685
Utilities 0 0.000000

处理一：

根据上述结果，发现Electrical这一列只有一个缺失值，所以删除有缺失值的这一行，然后删除>=8的列

#dealing with missing data
train=train.drop((missing_data[missing_data['Total']>1]).index,1)
train=train.drop(train.loc[train['Electrical'].isnull()].index)
print(train.isnull().sum().max()) #输出为0,意味着没有缺失值了

处理二：

首先合并train和test，然后删除SalePrice这一列：

ntrain=train.shape[0] #列数
ntest=test.shape[0] #列数
y_train=train.SalePrice.values  
all_data=pd.concat((train,test)).reset_index(drop=True)
print(all_data.shape) #合并train和test
all_data.drop(['SalePrice'],axis=1,inplace=True) 
print(all_data.shape) #删除SalePrice

#imputing missing values
all_data['PoolQC']=all_data['PoolQC'].fillna('None')
all_data["MiscFeature"] = all_data["MiscFeature"].fillna("None")
all_data["Alley"] = all_data["Alley"].fillna("None")
all_data["Fence"] = all_data["Fence"].fillna("None")
all_data["FireplaceQu"] = all_data["FireplaceQu"].fillna("None")
for col in ('GarageType', 'GarageFinish', 'GarageQual', 'GarageCond'):
    all_data[col] = all_data[col].fillna('None')
for col in ('GarageYrBlt', 'GarageArea', 'GarageCars'):
    all_data[col] = all_data[col].fillna(0)
for col in ('BsmtFinSF1', 'BsmtFinSF2', 'BsmtUnfSF','TotalBsmtSF', 'BsmtFullBath', 'BsmtHalfBath'):
    all_data[col] = all_data[col].fillna(0)
for col in ('BsmtQual', 'BsmtCond', 'BsmtExposure', 'BsmtFinType1', 'BsmtFinType2'):
    all_data[col] = all_data[col].fillna('None')
all_data["MasVnrType"] = all_data["MasVnrType"].fillna("None")
all_data["MasVnrArea"] = all_data["MasVnrArea"].fillna(0)

all_data['MSZoning'] = all_data['MSZoning'].fillna(all_data['MSZoning'].mode()[0])

all_data["LotFrontage"] = all_data.groupby("Neighborhood")["LotFrontage"].transform(
    lambda x: x.fillna(x.median()))


all_data = all_data.drop(['Utilities'], axis=1)

all_data["Functional"] = all_data["Functional"].fillna("Typ")
#设置为最常见的值
all_data['Electrical'] = all_data['Electrical'].fillna(all_data['Electrical'].mode()[0])
all_data['KitchenQual'] = all_data['KitchenQual'].fillna(all_data['KitchenQual'].mode()[0])
all_data['SaleType'] = all_data['SaleType'].fillna(all_data['SaleType'].mode()[0])
all_data['Exterior1st'] = all_data['Exterior1st'].fillna(all_data['Exterior1st'].mode()[0])
all_data['Exterior2nd'] = all_data['Exterior2nd'].fillna(all_data['Exterior2nd'].mode()[0])
all_data['MSSubClass'] = all_data['MSSubClass'].fillna("None")

all_data_na = (all_data.isnull().sum() / len(all_data)) * 100
all_data_na = all_data_na.drop(all_data_na[all_data_na == 0].index).sort_values(ascending=False)
missing_data = pd.DataFrame({'Missing Ratio' :all_data_na})
print(missing_data.head())
#现在没有缺失值了

4. 特征工程

字符串>数字：

#MSSubClass=The building class
all_data['MSSubClass'] = all_data['MSSubClass'].apply(str)


#Changing OverallCond into a categorical variable
all_data['OverallCond'] = all_data['OverallCond'].astype(str)


#Year and month sold are transformed into categorical features.
all_data['YrSold'] = all_data['YrSold'].astype(str)
all_data['MoSold'] = all_data['MoSold'].astype(str)

from sklearn.preprocessing import LabelEncoder
cols=('FireplaceQu', 'BsmtQual', 'BsmtCond', 'GarageQual', 'GarageCond', 
        'ExterQual', 'ExterCond','HeatingQC', 'PoolQC', 'KitchenQual', 'BsmtFinType1', 
        'BsmtFinType2', 'Functional', 'Fence', 'BsmtExposure', 'GarageFinish', 'LandSlope',
        'LotShape', 'PavedDrive', 'Street', 'Alley', 'CentralAir', 'MSSubClass', 'OverallCond', 
        'YrSold', 'MoSold')
#字符转数字
for c in cols:
    lbl = LabelEncoder() 
    lbl.fit(list(all_data[c].values)) 
    all_data[c] = lbl.transform(list(all_data[c].values))


print(all_data.head(5))

#增加新的列：
all_data['TotalSF'] = all_data['TotalBsmtSF'] + all_data['1stFlrSF'] + all_data['2ndFlrSF']
#提取数值型数据的索引
numeric_feats=all_data.dtypes[all_data.dtypes !='object'].index
#删除包含缺失数据的行，sort_values：按值进行排序
skewed_feats=all_data[numeric_feats].apply(lambda x:skew(x.dropna())).sort_values(ascending=False)

skewness = pd.DataFrame({'Skew' :skewed_feats})

skewness = skewness[abs(skewness) > 0.75]

from scipy.special import boxcox1p
skewed_features = skewness.index
lam = 0.15
for feat in skewed_features:
    #all_data[feat] += 1
    print(feat)
    all_data[feat] = boxcox1p(all_data[feat], lam)


all_data = pd.get_dummies(all_data)
print(all_data.shape)

train = all_data[:ntrain]
test = all_data[ntrain:]

5. 模型的建立

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
Python实现关联规则推荐这孩子谁懂哈 Python Machine Learning python 关联规则机器学习
1.什么关联规则关联规则（AssociationRules）是反映一个事物与其他事物之间的相互依存性和关联性，如果两个或多个事物之间存在一定的关联关系，那么，其中一个事物就能通过其他事物预测到。关联规则是数据挖掘的一个重要技术，用于从大量数据中挖掘出有价值的数据项之间的相关关系。关联规则挖掘的最经典的例子就是沃尔玛的啤酒与尿布的故事，通过对超市购物篮数据进行分析，即顾客放入购物篮中不同商品之间的关
从门氏元素周期表看三皇五帝在关中论霜叶红似二月花y
世间所有物质，都是由不同元素组成的，科学家们”认识物质初期，所有元素也是多年逐一认识的。著名的俄罗斯化学家门捷列耶夫(DmitriMendeleev1834－1907)，在1869年首创的元素周期表，想必大家都很熟悉。他是怎么发现元素周期规律并制成表的？最权威的说法是他自己笔记中所记载的，是他做梦所得。门氏元素周期表这个表开始并不完善，但已经有个雏形了。当时只有已知的63种元素。但门氏预测应该有1
3.1 损失函数和优化：损失函数做只小考拉
用一个函数把W当做输入，然后看一下得分，定量地估计W的好坏，这个函数被称为“损失函数”。损失函数用于度量W的好坏。有了损失函数的概念后，就可以定量的衡量W到底是好还是坏，要找到一种有效的方法来从W的可行域里，找到W取何值时情况最不坏，，这个过程将会是一个优化过程。损失函数L_i定义：通过函数f给出预测的分数和真实的目标（或者说是标签y），可以定量的描述训练样本预测的好不好，最终的损失函数是在整个数
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
BP神经网络的传递函数大胜归来19 MATLAB
BP网络一般都是用三层的，四层及以上的都比较少用；传输函数的选择，这个怎么说，假设你想预测的结果是几个固定值，如1,0等，满足某个条件输出1，不满足则0的话，首先想到的是hardlim函数，阈值型的，当然也可以考虑其他的；然后，假如网络是用来表达某种线性关系时，用purelin---线性传输函数；若是非线性关系的话，用别的非线性传递函数，多层网络时，每层不一定要用相同的传递函数，可以是三种配合，可
机器学习-------数据标准化罔闻_spider 数据分析算法机器学习人工智能
什么是归一化，它与标准化的区别是什么？一作用在做训练时，需要先将特征值与标签标准化，可以防止梯度防炸和过拟合；将标签标准化后，网络预测出的数据是符合标准正态分布的—StandarScaler()，与真实值有很大差别。因为StandarScaler()对数据的处理是（真实值-平均值）/标准差。同时在做预测时需要将输出数据逆标准化提升模型精度：标准化/归一化使不同维度的特征在数值上更具比较性，提高分类
PAT Advanced 1015. Reversible Primes (C语言实现) OliverLew
我的PAT系列文章更新重心已移至Github，欢迎来看PAT题解的小伙伴请到GithubPages浏览最新内容。此处文章目前已更新至与GithubPages同步。欢迎star我的repo。题目Areversibleprimeinanynumbersystemisaprimewhose"reverse"inthatnumbersystemisalsoaprime.Forexampleinthedec
【徐远房产投资规划课（7）】（02.18）：技术进步会逆转城市聚集吗？格式化_001
微信图片_20181005125538.png声明以下内容来自徐远的分享。徐远介绍徐远：北京大学金融学教授，美国杜克大学经济学博士。其研究领域：宏观经济、金融经济、经济政策、房地产、城市化......本节思维框架新技术的出现新技术是否会引起房价下跌历史经验人们的交流是分不同层次的总结新技术的出现昨天的课程里，我给你重点讲了城市化对房价的影响。我们平常说房价高，其实主要说的是大城市的房价高。大城市聚
Python和R均方根误差平均绝对误差算法模型亚图跨际 Python 交叉知识 R 回归模型误差指标归一化均方根误差生态状态指标神经网络成本误差气体排放气候模型多项式拟合
要点回归模型误差评估指标归一化均方根误差生态状态指标神经网络成本误差计算气体排放气候算法模型Python误差指标均方根误差和平均绝对误差均方根偏差或均方根误差是两个密切相关且经常使用的度量值之一，用于衡量真实值或预测值与观测值或估计值之间的差异。估计器θ^\hat{\theta}θ^相对于估计参数θ\thetaθ的RMSD定义为均方误差的平方根：RMSD⁡(θ^)=MSE⁡(θ^)=E((θ^−θ
python数据分析知识点大全编程零零七 python数据分析 python 开发语言 python数据分析数据分析知识点大全 python数据分析知识点 python教程 python基础
Python数据分析知识点大全可以归纳为以下几个主要方面：一、基础概念与目的数据分析定义：数据分析是指用适当的统计分析方法对收集来的大量数据进行分析，提取有用信息和形成结论，对数据加以详细研究和概括总结的过程。其目的在于从数据中挖掘规律、验证猜想、进行预测。Python在数据分析中的优势：Python因其易学性、快速开发、丰富的扩展库（如NumPy、Pandas等）和成熟的框架，成为数据分析领域的
Chat GPT带来的几点思考淡定的胡萝卜
OpenAI公司推出的ChatGPT引起了广泛关注，网上出现各类专家开始预测随着ChatGDP的普及，将会有哪些行业的人面临失业，引发人们的焦虑。不可否认它会给我们的教育行业、媒体行业、学术界等众多行业产生影响，面对这些影响，我们该如何看待呢？近期我阅读了不少相关文章，引发的几点思考，想与大家分享。ChatGPT将会倒逼传统教育的改革。中国传统教育是教师对知识点的传授、学生对知识点的掌握，不仅量多
数据分析-24-时间序列预测之基于keras的VMD-LSTM和VMD-CNN-LSTM预测风速皮皮冰燃数据分析数据分析
文章目录1普通的LSTM模型1.1数据重采样1.2数据标准化1.3切分窗口1.4划分数据集1.5建立模型1.6预测效果2VMD-LSTM模型2.1VMD分解时间序列2.2对每一个IMF建立LSTM模型2.2.1IMF1—LSTM2.2.2IMF2-LSTM2.2.3统一代码2.3评估效果3CNN-LSTM模型3.1数据预处理3.2建立模型3.3效果预测4VMD-CNN-LSTM模型4.1VMD分解
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
数字化供应链架构、全景管理、全流程贯通整体解决方案：供应链管理就是利用管理工具、IT技术将企业引入外部资源的过程精细化、标准化管理，实现高效益低成本运营。数字化建设方案数字化转型数据治理主数据数据仓库智能制造数字工厂制造业数字化转型工业互联网供应链数字仓储智慧物流智慧仓储物流园区架构大数据
数字化供应链架构、全景管理、全流程贯通方案数字化供应链架构、全景管理、全流程贯通方案项目背景与目标供应链管理现状及挑战数字化供应链架构概念及优势全景管理与全流程贯通目标预期成果与效益智能管理机制建设需求预测与智能分析应用合同管理智能化提升举措仓储管理自动化和机器人技术应用物流配送优化策略周边系统整合与数据贯通现有系统梳理及评估报告数据接口标准制定和实施计划流程对接和数据交互机制设计监控和报警机制完
商业预测初识R hongyanwin r语言预测
1.打开帮助文档首页，查阅其中的“IntroductiontoR”helpRhelp2.安装vcd包install.packages("vcd")3.列出此包中可用的函数和数据集ls("package:vcd")/data(package="vcd")4.载入包并阅读数据集Arthritis的描述library("v.d")/?Arthritis5.显示数据集Arthritis的内容查看数据集结构
我还单身，你们就想在我身体里谈恋爱网易王三三
又到每周六的「三三马克Sansan'sMark」栏目。给新朋友们简单介绍下，这个栏目定位如其名——为周末生活提供姿势，不管看不看，先马了再说。关于周末干什么，查拉图斯特拉如是说：“可以失格，但别失逼格。”我们会为大家推荐私藏的书影音番剧游戏，希望你们喜欢。周末愉快！说在前头，激情预测本番成为七月霸权（喂11区拿科普题材来做新番不是第一次了，之前就有过《萌菌物语》、《摇曳露营》、《血型君》（这应该是
【五十五，模型加载-2 模型文件格式】 Woodlouse
Obj和mtl文件ObjObj文件是3D模型文件格式，由Alias|Wavefront公司为3D建模和动画软件AdvancedVisualizer开发的一种标准，用于3D软件模型互导。包含数据信息：顶点坐标信息顶点的纹理坐标信息顶点法向量信息mtlmtl文件定义材质信息，包含数据信息：纹理贴图环境光镜面光散射光Obj文件格式obj文件中的信息以行为单位表示一条数据，可以根据行开头的字符判断后续数据
什么是AIGC？有哪些免费工具？ chent_某位 AIGC
AIGC（AIGeneratedContent），即“人工智能生成内容”，是指通过人工智能技术自动生成各种类型的数字内容。AIGC让机器能够根据输入的信息或数据生成符合人类需求的文本、图像、音频、视频等内容，极大提高了内容创作的效率。AIGC的背景与起源随着深度学习和自然语言处理技术的快速发展，人工智能已经不再局限于简单的任务，如分类、预测和数据分析，而是具备了生成内容的能力。生成式AI模型，如O
利用发电量和气象数据分析来判断光伏仿真系统的准确性鹧鸪云光伏与储能软件开发数据分析数据挖掘光伏发电大数据光伏新能源
随着光伏产业的迅速发展，光伏仿真系统通过集成气象数据分析、发电量分析、投融资分析及损耗估算等功能，为光伏项目的全生命周期管理提供了科学依据。光伏仿真系统集成了气象数据分析、发电量预测、投融资分析、损耗估算及光伏设计等功能。其中，气象数据分析是仿真系统的基石，通过整合权威的气象数据（如Meteonorm、Nasa等），模拟光伏电站所在区域的历史气象条件及未来气象预测。基于这些气象数据，发电量分析功能
对于在爱情中的情侣来说三观和信任真的有那么重要吗小易趣旅游
我一直认为命运是注定的，有些事情你不能一个人改变。有一定数量的聚会和分散活动。在许多情况下，关系的开始和结束都是可追溯的。如果两个人要长期生活在一起，他们必须默契相处并在许多事情上达成共识。两个人在一起的原因仅仅是他们想携手走未来的道路，并且一路上会有很多变化。有些事情是不可预测的，无法干预。因此，一旦在一个关系中存在这三个表现，矛盾就会不断放大，两个人的命运就会精疲力尽。1.缺乏信任和相互怀疑实
视频也能分割？！在云服务器上部署最新视觉大模型SAM2教程、详细代码注释和视频演示 Hanley_Yeung 图像处理人工智能 python 人工智能 python 深度学习 SAM2 计算机视觉图像分割
使用SAM2进行视频分割本笔记本展示了如何使用SAM2在视频中进行交互式分割。它将涵盖以下内容：在帧上添加点击以获取和细化masklets（时空掩码）在整个视频中传播点击以获取_masklets同时分割和跟踪多个目标我们使用术语_segment_或_mask_来指代单个帧上对象的模型预测，_masklet_指代整个视频中的时空掩码。如果使用Jupyter在本地运行，请首先根据安装说明在您的环境中安
刘强东突然宣布!一场风暴即将到来!马云是怎么应对的? 深呼吸_5e64
为期3天的2018中国互联网大会12日在北京闭幕，与会专家学者就互联网前沿技术、产业发展态势话题进行了研讨。万物互联将给家庭生活带来哪些变化?有专家表示，人工智能总体上由数据驱动，没有数据，它无法进行配对训练、识别、预测，人们也享受不到它提供的精准、智慧的服务。但随着越来越多的数据被收集、被分析，信息泄露的风险随之增加。刘强东:真的不敢相信，这个时代变化之快让人无法想象!创新!创新!再创新!一个个
平滑法时间序列模型原理及Python实践 AI智博信息数据分析与挖掘 python 人工智能
平滑法时间序列模型原理主要涉及通过一定的算法对时间序列数据进行平滑处理，以消除或减弱数据中的随机波动和噪声，从而揭示出数据中的长期趋势和季节性变化，进而对未来数据进行预测。以下是平滑法时间序列模型的详细原理：一、基本原理平滑法时间序列模型基于对历史数据的平滑处理，通过对数据的平均或加权平均，去除数据中的随机波动，使得时间序列数据更加平滑，便于分析和预测。这种方法能够帮助我们更好地理解数据的长期趋势
相信命运9 哭丧难得
“玄学”，我曾经最常用的说辞。“玄学”是对未来发生事情的预测，以及用微妙改变来使未来转变的行动。举个例子，抽奖和考试，本应无直接联系，但是若抽了奖，便是用了“人品”，没抽到那么就可以保留“人品”，甚至把抽奖的“人品”用在考试上。平时注意积德，并且遵守对自己的承诺，那么“人品”就不会差，事情也就顺利。我对“玄学”半信半疑，大多数时候，“玄学”都起了作用，但是我也怀疑这只是我在事后将一切联系起来。大家
基于Python爬虫四川成都二手房数据可视化系统设计与实现(Django框架) 研究背景与意义、国内外研究现状_django商品房数据分析论文(1) 莫莫Android开发信息可视化 python 爬虫
3.国外研究现状在国外，二手房数据可视化也是一个热门的研究领域。以美国为例，有很多公司和网站提供了专门的二手房数据可视化工具，如Zillow、Redfin等。这些工具通常提供房价趋势图、房价分布图、房源信息等功能，帮助用户更好地了解房市动态。综上所述，虽然国内外在二手房数据可视化方面已经有了一些研究成果，但对于四川成都地区的二手房市场还没有相关的研究和可视化系统。因此，本研究旨在设计并实现一个基于
今年万圣节消费预测有望创新高，你开始准备了吗？ IPFoxy666 ip
据调查数据显示，2024年大部分美国消费者将会在11月之前开始假日购物，同时，预计美国消费者在今年万圣节的支出会创新高。对于跨境电商卖家来说，节日活动一直是店铺曝光和产品销量增长的大好机会，一定要做足准备。一、分析市场需求2023年的万圣节购物活动期间，糖果、服装和装饰品的销售额超过120亿美元。根据近期的数据调查，大部分的消费者今年计划在这些商品上花费更多。因此要重视万圣节必备的大热品类，关注以
淘宝/天猫获取sku详细信息 API weixin_43841111 api python java php javascript 大数据数据库架构
在电商领域，准确获取商品的SKU详细信息至关重要。对于商家来说，它有助于管理库存、制定营销策略和优化商品展示。对于开发者和第三方平台而言，可以通过获取SKU详细信息实现商品信息整合、价格比较、订单管理等功能。例如，一个电商数据分析平台可以利用该API收集不同商品的SKU信息，进行市场趋势分析和销售预测。一、技术实现原理接口调用方式：通常采用RESTfulAPI风格，通过发送HTTP请求来获取SKU
java Illegal overloaded getter method with ambiguous type for propert的解决 zwllxs java jdk
好久不来iteye,今天又来看看，哈哈,今天碰到在编码时，反射中会抛出 Illegal overloaded getter method with ambiguous type for propert这么个东东，从字面意思看，是反射在获取getter时迷惑了，然后回想起java在boolean值在生成getter时，分别有is和getter，也许我们的反射对象中就有is开头的方法迷惑了jdk，
IT人应当知道的10个行业小内幕 beijingjava 工作互联网
10. 虽然IT业的薪酬比其他很多行业要好，但有公司因此视你为其“佣人”。　　尽管IT人士的薪水没有互联网泡沫之前要好，但和其他行业人士比较，IT人的薪资还算好点。在接下的几十年中，科技在商业和社会发展中所占分量会一直增加，所以我们完全有理由相信，IT专业人才的需求量也不会减少。　　然而，正因为IT人士的薪水普遍较高，所以有些公司认为给了你这么多钱，就把你看成是公司的“佣人”，拥有你的支配
java 实现自定义链表 CrazyMizzz java 数据结构
1.链表结构链表是链式的结构 2.链表的组成链表是由头节点，中间节点和尾节点组成节点是由两个部分组成： 1.数据域 2.引用域 3.链表的实现 &nbs
web项目发布到服务器后图片过一会儿消失麦田的设计者 struts2 上传图片永久保存
作为一名学习了android和j2ee的程序员，我们必须要意识到，客服端和服务器端的交互是很有必要的，比如你用eclipse写了一个web工程，并且发布到了服务器（tomcat）上，这时你在webapps目录下看到了你发布的web工程，你可以打开电脑的浏览器输入http://localhost:8080/工程/路径访问里面的资源。但是，有时你会突然的发现之前用struts2上传的图片
CodeIgniter框架Cart类 name 不能设置中文的解决方法 IT独行者 CodeIgniter Cart 框架　
今天试用了一下CodeIgniter的Cart类时遇到了个小问题，发现当name的值为中文时，就写入不了session。在这里特别提醒一下。在CI手册里也有说明，如下： $data = array( 'id' => 'sku_123ABC', 'qty' => 1, '
linux回收站 _wy_ linux 回收站
今天一不小心在ubuntu下把一个文件移动到了回收站，我并不想删，手误了。我急忙到Nautilus下的回收站中准备恢复它，但是里面居然什么都没有。后来我发现这是由于我删文件的地方不在HOME所在的分区，而是在另一个独立的Linux分区下，这是我专门用于开发的分区。而我删除的东东在分区根目录下的.Trash-1000/file目录下，相关的删除信息（删除时间和文件所在
jquery回到页面顶端知了ing html jquery css
html代码： <h1 id="anchor">页面标题</h1> <div id="container">页面内容</div> <p><a href="#anchor" class="topLink">回到顶端</a><
B树、B-树、B+树、B*树矮蛋蛋 B树
原文地址： http://www.cnblogs.com/oldhorse/archive/2009/11/16/1604009.html B树即二叉搜索树： 1.所有非叶子结点至多拥有两个儿子（Left和Right）； &nb
数据库连接池 alafqq 数据库连接池
http://www.cnblogs.com/xdp-gacl/p/4002804.html @Anthor:孤傲苍狼数据库连接池用MySQLv5版本的数据库驱动没有问题，使用MySQLv6和Oracle的数据库驱动时候报如下错误： java.lang.ClassCastException: $Proxy0 cannot be cast to java.sql.Connec
java泛型百合不是茶 java泛型
泛型在Java SE 1.5之前，没有泛型的情况的下，通过对类型Object的引用来实现参数的“任意化”，任意化的缺点就是要实行强制转换，这种强制转换可能会带来不安全的隐患泛型的特点：消除强制转换确保类型安全向后兼容简单泛型的定义：泛型：就是在类中将其模糊化，在创建对象的时候再具体定义 class fan
javascript闭包[两个小测试例子] bijian1013 JavaScript JavaScript
一.程序一 <script> var name = "The Window"; var Object_a = { 　　name : "My Object", 　　getNameFunc : function(){ var that = this; 　　　　return function(){ 　　　　
探索JUnit4扩展：假设机制（Assumption） bijian1013 java Assumption JUnit 单元测试
一.假设机制（Assumption）概述理想情况下，写测试用例的开发人员可以明确的知道所有导致他们所写的测试用例不通过的地方，但是有的时候，这些导致测试用例不通过的地方并不是很容易的被发现，可能隐藏得很深，从而导致开发人员在写测试用例时很难预测到这些因素，而且往往这些因素并不是开发人员当初设计测试用例时真正目的，
【Gson四】范型POJO的反序列化 bit1129 POJO
在下面这个例子中，POJO(Data类)是一个范型类，在Tests中，指定范型类为PieceData，POJO初始化完成后，通过 String str = new Gson().toJson(data); 得到范型化的POJO序列化得到的JSON串，然后将这个JSON串反序列化为POJO import com.google.gson.Gson; import java.
【Spark八十五】Spark Streaming分析结果落地到MySQL bit1129 Stream
几点总结： 1. DStream.foreachRDD是一个Output Operation，类似于RDD的action，会触发Job的提交。DStream.foreachRDD是数据落地很常用的方法 2. 获取MySQL Connection的操作应该放在foreachRDD的参数（是一个RDD[T]=>Unit的函数类型)，这样，当foreachRDD方法在每个Worker上执行时，
NGINX + LUA实现复杂的控制 ronin47 nginx lua
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-递归判断数组是否升序 bylijinnan java
public class IsAccendListRecursive { /*递归判断数组是否升序 * if a Integer array is ascending,return true * use recursion */ public static void main(String[] args){ IsAccendListRecursiv
Netty源码学习-DefaultChannelPipeline2 bylijinnan java netty
Netty3的API http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/ChannelPipeline.html 里面提到ChannelPipeline的一个“pitfall”：如果ChannelPipeline只有一个handler（假设为handlerA）且希望用另一handler（假设为handlerB）来
Java工具之JPS chinrui java
JPS使用熟悉Linux的朋友们都知道，Linux下有一个常用的命令叫做ps（Process Status)，是用来查看Linux环境下进程信息的。同样的，在Java Virtual Machine里面也提供了类似的工具供广大Java开发人员使用，它就是jps（Java Process Status)，它可以用来
window.print分页打印 ctrain window
function init() { var tt = document.getElementById("tt"); var childNodes = tt.childNodes[0].childNodes; var level = 0; for (var i = 0; i < childNodes.length; i++) {
安装hadoop时执行jps命令Error occurred during initialization of VM daizj jdk hadoop jps
在安装hadoop时，执行JPS出现下面错误 [slave16][email protected]:/tmp/hsperfdata_hdfs# jps Error occurred during initialization of VM java.lang.Error: Properties init: Could not determine current working
PHP开发大型项目的一点经验 dcj3sjt126com PHP 重构
一、变量最好是把所有的变量存储在一个数组中，这样在程序的开发中可以带来很多的方便，特别是当程序很大的时候。变量的命名就当适合自己的习惯，不管是用拼音还是英语，至少应当有一定的意义，以便适合记忆。变量的命名尽量规范化，不要与PHP中的关键字相冲突。二、函数 PHP自带了很多函数，这给我们程序的编写带来了很多的方便。当然，在大型程序中我们往往自己要定义许多个函数，几十
android笔记之--向网络发送GET/POST请求参数 dcj3sjt126com android
使用GET方法发送请求 private static boolean sendGETRequest (String path, Map<String, String> params) throws Exception{ //发送地http://192.168.100.91:8080/videoServi
linux复习笔记之bash shell (3) 通配符 eksliang linux 通配符 linux通配符
转载请出自出处： http://eksliang.iteye.com/blog/2104387 在bash的操作环境中有一个非常有用的功能，那就是通配符。下面列出一些常用的通配符，如下表所示符号意义 * 万用字符，代表0个到无穷个任意字符 ? 万用字符，代表一定有一个任意字符 [] 代表一定有一个在中括号内的字符。例如：[abcd]代表一定有一个字符，可能是a、b、c
Android关于短信加密 gqdy365 android
关于Android短信加密功能，我初步了解的如下（只在Android应用层试验）： 1、因为Android有短信收发接口，可以调用接口完成短信收发；发送过程：APP（基于短信应用修改）接受用户输入号码、内容——>APP对短信内容加密——>调用短信发送方法Sm
asp.net在网站根目录下创建文件夹 hvt .net C#hovertree asp.net Web Forms
假设要在asp.net网站的根目录下建立文件夹hovertree,C#代码如下： string m_keleyiFolderName = Server.MapPath("/hovertree"); if (Directory.Exists(m_keleyiFolderName)) { //文件夹已经存在 return; } else { try { D
一个合格的程序员应该读过哪些书 justjavac 程序员书籍
编者按：2008年8月4日，StackOverflow 网友 Bert F 发帖提问：哪本最具影响力的书，是每个程序员都应该读的？ “如果能时光倒流，回到过去，作为一个开发人员，你可以告诉自己在职业生涯初期应该读一本，你会选择哪本书呢？我希望这个书单列表内容丰富，可以涵盖很多东西。” 很多程序员响应，他们在推荐时也写下自己的评语。以前就有国内网友介绍这个程序员书单，不过都是推荐数
单实例实践跑龙套_az 单例
1、内部类 public class Singleton { private static class SingletonHolder { public static Singleton singleton = new Singleton(); } public Singleton getRes
PO VO BEAN 理解 q137681467 VO DTO po
PO：全称是 persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。 BO：全称是 business object:业务对象主要作用是把业务逻辑封装为一个对象。这个对
战胜惰性，暗自努力金笛子努力
偶然看到一句很贴近生活的话：“别人都在你看不到的地方暗自努力，在你看得到的地方，他们也和你一样显得吊儿郎当，和你一样会抱怨，而只有你自己相信这些都是真的，最后也只有你一人继续不思进取。”很多句子总在不经意中就会戳中一部分人的软肋，我想我们每个人的周围总是有那么些表现得“吊儿郎当”的存在，是否你就真的相信他们如此不思进取，而开始放松了对自己的要求随波逐流呢？我有个朋友是搞技术的，平时嘻嘻哈哈，以
NDK/JNI二维数组多维数组传递 wenzongliang 二维数组 jni NDK
多维数组和对象数组一样处理，例如二维数组里的每个元素还是一个数组用jArray表示，直到数组变为一维的，且里面元素为基本类型，去获得一维数组指针。给大家提供个例子。已经测试通过。 Java_cn_wzl_FiveChessView_checkWin( JNIEnv* env,jobject thiz,jobjectArray qizidata) { jint i,j; int s