如果使用过程中需要查资料可以直接去官网查Api和使用教程 网址:https://www.tensorflow.org/api_docs/python/tf?hl=zh-cn
今天使用 全连接网络 就是数学中断 y=kx+b模式
1导入模块
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import tensorflow as tf
from tensorflow.keras import layers
import tensorflow.keras
import warnings
warnings.filterwarnings("ignore")
2建一个两个隐藏层的 网络模型
model = tf.keras.Sequential()
model.add(layers.Dense(16))
model.add(layers.Dense(32))
model.add(layers.Dense(1))
3 配置网络 和训练
model.compile(optimizer=tf.keras.optimizers.SGD(0.001),
loss='mean_squared_error')
model.fit(input_features, labels, validation_split=0.25, epochs=10, batch_size=64)
完整代码如下 :
#%% md
### 回归问题预测
- Tensorflow2版本中将大量使用keras的简介建模方法
#%%
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import tensorflow as tf
from tensorflow.keras import layers
import tensorflow.keras
import warnings
warnings.filterwarnings("ignore")
#%%
features = pd.read_csv('temps.csv')
#看看数据长什么样子
features.head()
#%% md
数据表中
* year,moth,day,week分别表示的具体的时间
* temp_2:前天的最高温度值
* temp_1:昨天的最高温度值
* average:在历史中,每年这一天的平均最高温度值
* actual:这就是我们的标签值了,当天的真实最高温度
* friend:这一列可能是凑热闹的,你的朋友猜测的可能值,咱们不管它就好了
#%%
print('数据维度:', features.shape)
#%%
# 处理时间数据
import datetime
# 分别得到年,月,日
years = features['year']
months = features['month']
days = features['day']
# datetime格式
dates = [str(int(year)) + '-' + str(int(month)) + '-' + str(int(day)) for year, month, day in zip(years, months, days)]
dates = [datetime.datetime.strptime(date, '%Y-%m-%d') for date in dates]
#%%
dates[:5]
#%%
# 准备画图
# 指定默认风格
plt.style.use('fivethirtyeight')
# 设置布局
fig, ((ax1, ax2), (ax3, ax4)) = plt.subplots(nrows=2, ncols=2, figsize = (10,10))
fig.autofmt_xdate(rotation = 45)
# 标签值
ax1.plot(dates, features['actual'])
ax1.set_xlabel(''); ax1.set_ylabel('Temperature'); ax1.set_title('Max Temp')
# 昨天
ax2.plot(dates, features['temp_1'])
ax2.set_xlabel(''); ax2.set_ylabel('Temperature'); ax2.set_title('Previous Max Temp')
# 前天
ax3.plot(dates, features['temp_2'])
ax3.set_xlabel('Date'); ax3.set_ylabel('Temperature'); ax3.set_title('Two Days Prior Max Temp')
# 我的逗逼朋友
ax4.plot(dates, features['friend'])
ax4.set_xlabel('Date'); ax4.set_ylabel('Temperature'); ax4.set_title('Friend Estimate')
plt.tight_layout(pad=2)
#%%
# 独热编码
features = pd.get_dummies(features)
features.head(5)
#%%
# 标签
labels = np.array(features['actual'])
# 在特征中去掉标签
features= features.drop('actual', axis = 1)
# 名字单独保存一下,以备后患
feature_list = list(features.columns)
# 转换成合适的格式
features = np.array(features)
#%%
features.shape
#%%
from sklearn import preprocessing
input_features = preprocessing.StandardScaler().fit_transform(features)
#%%
input_features[0]
#%% md
### 基于Keras构建网络模型
一些常用参数已经列出,如下所示:
#%% md
- activation:激活函数的选择,一般常用relu
- kernel_initializer,bias_initializer:权重与偏置参数的初始化方法,有时候不收敛换种初始化就突然好使了。。。玄学
- kernel_regularizer,bias_regularizer:要不要加入正则化,
- inputs:输入,可以自己指定,也可以让网络自动选
- units:神经元个数
#%% md
按顺序构造网络模型
#%%
model = tf.keras.Sequential()
model.add(layers.Dense(16))
model.add(layers.Dense(32))
model.add(layers.Dense(1))
#%% md
compile相当于对网络进行配置,指定好优化器和损失函数等
#%%
#SGD 梯度下降优化器
#优化器相关的文档 https://zhuanlan.zhihu.com/p/32230623
model.compile(optimizer=tf.keras.optimizers.SGD(0.001),
loss='mean_squared_error')
#%%
model.fit(input_features, labels, validation_split=0.25, epochs=10, batch_size=64)
#%%
input_features.shape
#%% md
似乎存在一些问题,模型还没有完全收敛,能不能调些参数呢
#%%
model.summary()
#%% md
### 更改初始化方法后
#%%
model = tf.keras.Sequential()
model.add(layers.Dense(16,kernel_initializer='random_normal'))
model.add(layers.Dense(32,kernel_initializer='random_normal'))
model.add(layers.Dense(1,kernel_initializer='random_normal'))
#%%
model.compile(optimizer=tf.keras.optimizers.SGD(0.001),
loss='mean_squared_error')
model.fit(input_features, labels, validation_split=0.25, epochs=100, batch_size=64)
#%% md
### 加入正则化惩罚项
#%%
model = tf.keras.Sequential()
model.add(layers.Dense(16,kernel_initializer='random_normal',kernel_regularizer=tf.keras.regularizers.l2(0.03)))
model.add(layers.Dense(32,kernel_initializer='random_normal',kernel_regularizer=tf.keras.regularizers.l2(0.03)))
model.add(layers.Dense(1,kernel_initializer='random_normal',kernel_regularizer=tf.keras.regularizers.l2(0.03)))
model.compile(optimizer=tf.keras.optimizers.SGD(0.001),
loss='mean_squared_error')
model.fit(input_features, labels, validation_split=0.25, epochs=100, batch_size=64)
#%% md
### 预测模型结果
#%%
predict = model.predict(input_features)
#%%
predict.shape
#%% md
### 测试结果并进行展示
#%%
# 转换日期格式
dates = [str(int(year)) + '-' + str(int(month)) + '-' + str(int(day)) for year, month, day in zip(years, months, days)]
dates = [datetime.datetime.strptime(date, '%Y-%m-%d') for date in dates]
# 创建一个表格来存日期和其对应的标签数值
true_data = pd.DataFrame(data = {'date': dates, 'actual': labels})
# 同理,再创建一个来存日期和其对应的模型预测值
months = features[:, feature_list.index('month')]
days = features[:, feature_list.index('day')]
years = features[:, feature_list.index('year')]
test_dates = [str(int(year)) + '-' + str(int(month)) + '-' + str(int(day)) for year, month, day in zip(years, months, days)]
test_dates = [datetime.datetime.strptime(date, '%Y-%m-%d') for date in test_dates]
predictions_data = pd.DataFrame(data = {'date': test_dates, 'prediction': predict.reshape(-1)})
#%%
# 真实值
plt.plot(true_data['date'], true_data['actual'], 'b-', label = 'actual')
# 预测值
plt.plot(predictions_data['date'], predictions_data['prediction'], 'ro', label = 'prediction')
plt.xticks(rotation = '60');
plt.legend()
# 图名
plt.xlabel('Date'); plt.ylabel('Maximum Temperature (F)'); plt.title('Actual and Predicted Values');
#%%
#%%