编程歆妍

如何用 13 种模型预测天气预报？程序员教你用代码来实现

天气数据集爬取

爬取思路：

确定目标（目标网站：大同历史天气预报 2020年5月份）
请求网页（第三方库 requests）
解析网页（数据提取）
保存数据（这里以 .csv 格式存储到本地）

import requests

from bs4 import BeautifulSoup

import pandas as pd

def get_data (url) :

# 请求网页（第三方 requests）

resp = requests.get(url)

# 对于获取到的 HTML 二进制文件进行 'gbk' 转码成字符串文件

html = resp.content.decode( 'gbk' )

# 通过第三方库 BeautifulSoup 缩小查找范围（同样作用的包库还有re模块、xpath等）

soup = BeautifulSoup(html, 'html.parser' )

# 获取 HTML 中所有…标签，因为我们需要的数据全部在此标签中存放

tr_list = soup.find_all( 'tr' )

# 初始化日期dates、气候contains、温度temp值

dates,contains,temp = [],[],[]

for data in tr_list[ 1 :]: # 不要表头

# 数据值拆分，方便进一步处理（这里可以将获得的列表输出[已注释]，不理解的读者可运行查看)

sub_data = data.text.split()

# print(sub_data)

# 观察上一步获得的列表，这里只想要获得列表中第二个和第三个值，采用切片法获取

dates.append(sub_data[ 0 ])

contains.append( ',' .join(sub_data[ 1 : 3 ]))

# print(contains)

# 同理采用切片方式获取列表中的最高、最低气温

temp.append( ',' .join(sub_data[ 3 : 6 ]))

# print(temp)

# 使用 _data 表存放日期、天气状况、气温表头及其值

_data = pd.DataFrame()

# 分别将对应值传入 _data 表中

_data[ '日期' ] = dates

_data[ '天气状况' ] = contains

_data[ '气温' ] = temp

return _data

# 爬取目标网页（大同市2020年5月份天气[网站：天气后报]）

data_5_month = get_data( 'http://www.tianqihoubao.com/lishi/datong/month/202005.html' )

# 拼接所有表并重新设置行索引（若不进行此步操作，可能或出现多个标签相同的值）

data = pd.concat([data_5_month]).reset_index(drop = True )

# 将 _data 表以 .csv 格式存入指定文件夹中，并设置转码格式防止乱花（注：此转码格式可与 HTML 二进制转字符串的转码格式不同）

data.to_csv( 'F:/DaTong5Mouth.csv' ,encoding= 'utf-8' )

数据可视化

数据可视化用到了可视化工具。

其要点包含有：读取数据、数据清洗、数据处理、可视化工具的使用。

# 数据可视化

from matplotlib import pyplot as plt

import pandas as pd

# 解决显示中文问题

plt.rcParams[ 'font.sans-serif' ] = [ 'SimHei' ]

# 第一步：数据读取

data = pd.read_csv( 'F:/DaTong5Mouth.csv' )

# 第二步：数据处理（由于我们知道文本内容，不存在脏数据，故忽略数据清理步骤）

data[ '最高气温' ] = data[ '气温' ].str.split( '/' ,expand= True )[ 0 ]

data[ '最低气温' ] = data[ '气温' ].str.split( '/' ,expand= True )[ 1 ]

data[ '最高气温' ] = data[ '最高气温' ].map( lambda x:x.replace( '℃,' , '' ))

data[ '最低气温' ] = data[ '最低气温' ].map( lambda x:x.replace( '℃,' , '' ))

dates = data[ '日期' ]

highs = data[ '最高气温' ]

lows = data[ '最低气温' ]

# 画图（折线图）

# 设置画布大小及比例

fig = plt.figure(dpi= 128 ,figsize=( 10 , 6 ))

# 设置最高温最低温线条颜色及宽度等信息

L1,=plt.plot(dates,lows,label= '最低气温' )

L2,=plt.plot(dates,highs,label= '最高气温' )

plt.legend(handles=[L1,L2],labels=[ '最高气温' , '最低气温' ], loc= 'best' ) # 添加图例

# 图表格式

# 设置图形格式

plt.title( '2020年5月上旬大同天气' ,fontsize= 25 ) # 字体大小设置为25

plt.xlabel( '日期' ,fontsize= 10 ) # x轴显示“日期”，字体大小设置为10

fig.autofmt_xdate() # 绘制斜的日期标签，避免重叠

plt.ylabel( '气温' ,fontsize= 10 ) # y轴显示“气温”，字体大小设置为10

plt.tick_params(axis= 'both' ,which= 'major' ,labelsize= 10 )

# plt.plot(highs,lows,label = '最高气温')

# 修改刻度

plt.xticks(dates[:: 1 ]) # 由于数据不多，将每天的数据全部显示出来

# 显示折线图

plt.show()

模型预测数据

1、单变量线性回归

模型一：单变量线性回归模型

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

# 解决中文问题（若没有此步骤，表名字及横纵坐标中的汉语将无法显示[具体会显示矩形小方格]）

plt.rcParams[ 'font.sans-serif' ] = [ 'SimHei' ]

# 将数据从上一步存入的 .csv 格式文件中读取

data = pd.read_csv( r'F:\DaTong5Mouth.csv' )

# 由于最高气温与最低气温中有 / 分隔，故将其分开，即“气温”列由一列变为两列——“最高气温”和“最低气温”

data[ '最高气温' ] = data[ '气温' ].str.split( '/' ,expand= True )[ 0 ]

# 我们要对数值进行分析，所以将多余的单位 ℃ 从列表中去掉，只保留数值部分

data[ '最高气温' ] = data[ '最高气温' ].map( lambda x:x.replace( '℃,' , '' ))

# 日次操作同理，这里不再赘述

data[ '日期' ] = data[ '日期' ].map( lambda x:x.replace( '2020年05月0' , '' ))

data[ '日期' ] = data[ '日期' ].map( lambda x:x.replace( '日' , '' ))

# 不理解的小伙伴可运行下两行代码查看运行结果（这里先注释掉了）

# print(data['日期'])

# print(data['最高气温'])

def initPlot () :

# 先准备好一块画布

plt.figure()

# 生成图表的名字

plt.title( '2020年5月上旬大同天气' )

# 横坐标名字

plt.xlabel( '日期' )

# 纵坐标名字

plt.ylabel( '当日最高气温' )

# 表内有栅格（不想要栅格把此行注释掉即可）

plt.grid( True )

return plt

plt = initPlot() # 画图

# 传入对应日期及其最高气温参数

xTrain = np.array([ 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 ])

yTrain = np.array([ 33 , 35 , 28 , 20 , 26 , 27 , 23 , 22 , 22 ])

# k是黑色，.是以点作为图上显示

plt.plot(xTrain, yTrain, 'k.' )

# 将图显示出来

plt.show()

可以看到：

最高气温随着日期的变化，大致呈现线性变化（最近气温下降）；
如果根据现有的训练数据能够拟合出一条直线，使之与这些训练数据的各点都比较接近，那么根据该直线，就可以计算出在10号或者11号的温度情况（气温受到影响因素较多，故这里仅预测为数不多的数据）。

解决方案：

采用Python scikit-learn库中提供的sklearn.linear_model.LinearRegression对象来进行线性拟合。
根据判别函数，绘制拟合直线，并同时显示训练数据点。
拟合的直线较好的穿过训练数据，根据新拟合的直线，可以方便的求出最近日期下对应的最高气温(预测结果)。

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

from sklearn.linear_model import LinearRegression

# 解决中文问题（若没有此步骤，表名字及横纵坐标中的汉语将无法显示[具体会显示矩形小方格]）

plt.rcParams[ 'font.sans-serif' ] = [ 'SimHei' ]

# 将数据从上一步存入的 .csv 格式文件中读取

data = pd.read_csv( r'F:\DaTong5Mouth.csv' )

# 由于最高气温与最低气温中有 / 分隔，故将其分开，即“气温”列由一列变为两列——“最高气温”和“最低气温”

data[ '最高气温' ] = data[ '气温' ].str.split( '/' ,expand= True )[ 0 ]

# 我们要对数值进行分析，所以将多余的单位 ℃ 从列表中去掉，只保留数值部分

data[ '最高气温' ] = data[ '最高气温' ].map( lambda x:x.replace( '℃,' , '' ))

# 日次操作同理，这里不再赘述

data[ '日期' ] = data[ '日期' ].map( lambda x:x.replace( '2020年05月0' , '' ))

data[ '日期' ] = data[ '日期' ].map( lambda x:x.replace( '日' , '' ))

# 不理解的小伙伴可运行下两行代码查看运行结果（这里先注释掉了）

# print(data['日期'])

# print(data['最高气温'])

# 传入对应日期及其最高气温参数

# # 应以矩阵形式表达(对于单变量，矩阵就是列向量形式)

xTrain = np.array([ 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 ])[:, np.newaxis]

# 为方便理解，也转换成列向量

yTrain = np.array([ 33 , 35 , 28 , 20 , 26 , 27 , 23 , 22 , 22 ])

# 创建模型对象

model = LinearRegression()

# 根据训练数据拟合出直线(以得到假设函数)

hypothesis = model.fit(xTrain, yTrain)

# 截距

print( "theta0=" , hypothesis.intercept_)

# 斜率

print( "theta1=" , hypothesis.coef_)

# 预测2020年5月10日的最高气温

print( "预测2020年5月10日的最高气温：" , model.predict([[ 10 ]]))

# 也可以批量预测多个日期的气温，注意要以列向量形式表达（有余数据集量少，故间隔时间长气温可能有较大差异）

# 此处仅利用模型表示，不代表真实值（假设要预测10号、11号、12号的天气）

xNew = np.array([ 0 , 10 , 11 , 12 ])[:, np.newaxis]

yNew = model.predict(xNew)

print( "预测新数据：" , xNew)

print( "预测结果：" , yNew)

def initPlot () :

# 先准备好一块画布

plt.figure()

# 生成图表的名字

plt.title( '2020年5月上旬大同天气' )

# 横坐标名字

plt.xlabel( '日期' )

# 纵坐标名字

plt.ylabel( '当日最高气温' )

# 表内有栅格（不想要栅格把此行注释掉即可）

plt.grid( True )

return plt

plt = initPlot() # 画图

# k是黑色，.是以点作为图上显示

plt.plot(xTrain, yTrain, 'k.' )

# 画出通过这些点的连续直线

plt.plot(xNew, yNew, 'g--' )

# 将图显示出来

plt.show()

模型评价：

拟合出来的判别函数效果如何：对训练数据的贴合度如何？对新数据的预测准确度如何？

可通过残差(residuals)和R方(r-squared)判断，在Python中如何对单变量线性回归模型的效果进行评估。

手动计算：

假设hpyTrain代表针对训练数据的预测最高气温值，hpyTest代表针对测试数据的预测最高气温值。

训练数据残差平方和：ssResTrain = sum((hpyTrain - yTrain) ** 2)
测试数据残差平方和：ssResTest = sum((hpyTest - yTest) ** 2)
测试数据偏差平方和：ssTotTest = sum((yTest - np.mean(yTest)) ** 2)
R方：Rsquare = 1 -ssResTest / ssTotTest

LinearRegression对象提供的方法：

训练数据残差平方和：model._residues
R方：model.score(xTest,yTest)

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

from sklearn.linear_model import LinearRegression

# 解决中文问题（若没有此步骤，表名字及横纵坐标中的汉语将无法显示[具体会显示矩形小方格]）

plt.rcParams[ 'font.sans-serif' ] = [ 'SimHei' ]

# 将数据从上一步存入的 .csv 格式文件中读取

data = pd.read_csv( r'F:\DaTong5Mouth.csv' )

# 由于最高气温与最低气温中有 / 分隔，故将其分开，即“气温”列由一列变为两列——“最高气温”和“最低气温”

data[ '最高气温' ] = data[ '气温' ].str.split( '/' ,expand= True )[ 0 ]

# 我们要对数值进行分析，所以将多余的单位 ℃ 从列表中去掉，只保留数值部分

data[ '最高气温' ] = data[ '最高气温' ].map( lambda x:x.replace( '℃,' , '' ))

# 日次操作同理，这里不再赘述

data[ '日期' ] = data[ '日期' ].map( lambda x:x.replace( '2020年05月0' , '' ))

data[ '日期' ] = data[ '日期' ].map( lambda x:x.replace( '日' , '' ))

# 不理解的小伙伴可运行下两行代码查看运行结果（这里先注释掉了）

# print(data['日期'])

# print(data['最高气温'])

# 传入对应日期及其最高气温参数

# # # 应以矩阵形式表达(对于单变量，矩阵就是列向量形式)

# xTrain = np.array(data['日期'])[:, np.newaxis]

# # 为方便理解，也转换成列向量

# yTrain = np.array(data['最高气温'])

xTrain = np.array([ 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 ])[:, np.newaxis] # 训练数据（日期）

yTrain = np.array([ 33 , 35 , 28 , 20 , 26 , 27 , 23 , 22 , 22 ]) # 训练数据（最高气温）

xTest = np.array([ 3 , 6 , 9 , 10 , 11 ])[:,np.newaxis] # 测试数据（日期）

yTest = np.array([ 28 , 27 , 22 , 20 , 19 ]) # 测试数据（最高气温）

# 创建模型对象

model = LinearRegression()

# 根据训练数据拟合出直线(以得到假设函数)

hypothesis = model.fit(xTrain, yTrain)

hpyTrain = model.predict(xTrain)

# 针对测试数据进行预测

hpyTest = model.predict(xTest)

# 手动计算训练数据集残差

ssResTrain = sum((hpyTrain - yTrain) ** 2 )

print(ssResTrain)

# Python计算的训练数据集残差

print(model._residues)

# 手动计算测试数据集残差

ssResTest = sum((hpyTest - yTest) ** 2 )

# 手动计算测试数据集y值偏差平方和

ssTotTest = sum((yTest - np.mean(yTest)) ** 2 )

# 手动计算R方

Rsquare = 1 - ssResTest / ssTotTest

print(Rsquare)

# Python计算的训练数据集的R方

print(model.score(xTest, yTest))

# corrcoef函数是在各行元素之间计算相关性，所以x和y都应是行向量

print(np.corrcoef(xTrain.T, yTrain.T)) # 计算训练数据的相关性

print(np.corrcoef(xTest.T, yTest.T)) # 计算测试数据的相关性

def initPlot () :

# 先准备好一块画布

plt.figure()

# 生成图表的名字

plt.title( '2020年5月上旬大同天气' )

# 横坐标名字

plt.xlabel( '日期' )

# 纵坐标名字

plt.ylabel( '当日最高气温' )

# 表内有栅格（不想要栅格把此行注释掉即可）

plt.grid( True )

return plt

plt = initPlot()

plt.plot(xTrain, yTrain, 'r.' ) # 训练点数据(红色)

plt.plot(xTest, yTest, 'b.' ) # 测试点数据(蓝色)

plt.plot(xTrain, hpyTrain, 'g-' ) # 假设函数直线(绿色)

plt.show()

查看上述拟合效果：

红色为训练数据点，蓝色为测试数据点，绿色为判别函数(拟合直线)；
计算出的R方为0.833，效果良；
计算出训练数据的相关性为-0.763，测试数据的相关性为-0.968。可以发现，根据数据集的不同，日期与最高气温之间的相关性波动较大。这也能解释为何针对测试数据的R方事实上不够理想。

2、多变量线性回归

在单变量线性回归中，最高气温仅与日期有关（尝试可知，这显然是极不合理的），按照这一假设，其预测的结果并不令人满意(R方=0.833)。因此在多变线性回归模型中再引入一个新的影响因素：最低气温(此处要注意和最高气温一样，计算前先利用 .map 方法将 ℃ 置空，仅将最低气温调整成数值，以便能够进行数值计算)。

模型二：基于LinearRegression实现的多变量线性回归模型

与单变量线性回归类似，但要注意训练数据此时是(是训练数据条数，是自变量个数)
针对测试数据的预测结果，其R方约为0.466，这时我们发现还没有单变量量线性回归R方值大，说明拟合效果差于单变量线性回归。这是什么问题呢？经过思考，我认为最高气温的影响因素不能拿日期和最低气温来衡量，也就是说，最高气温的走势依据情况特殊而复杂，不能单靠日期和最低气温等片面的为数不多的方面来进行拟合。

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

from sklearn.linear_model import LinearRegression

# 解决中文问题（若没有此步骤，表名字及横纵坐标中的汉语将无法显示[具体会显示矩形小方格]）

plt.rcParams[ 'font.sans-serif' ] = [ 'SimHei' ]

# 将数据从上一步存入的 .csv 格式文件中读取

data = pd.read_csv( r'F:\DaTong5Mouth.csv' )

# 由于最高气温与最低气温中有 / 分隔，故将其分开，即“气温”列由一列变为两列——“最高气温”和“最低气温”

data[ '最高气温' ] = data[ '气温' ].str.split( '/' ,expand= True )[ 0 ]

# 我们要对数值进行分析，所以将多余的单位 ℃ 从列表中去掉，只保留数值部分

data[ '最高气温' ] = data[ '最高气温' ].map( lambda x:x.replace( '℃,' , '' ))

data[ '最低气温' ] = data[ '气温' ].str.split( '/' ,expand= True )[ 1 ]

# 我们要对数值进行分析，所以将多余的单位 ℃ 从列表中去掉，只保留数值部分

data[ '最低气温' ] = data[ '最低气温' ].map( lambda x:x.replace( '℃,' , '' ))

# 日次操作同理，这里不再赘述

data[ '日期' ] = data[ '日期' ].map( lambda x:x.replace( '2020年05月0' , '' ))

data[ '日期' ] = data[ '日期' ].map( lambda x:x.replace( '日' , '' ))

# 不理解的小伙伴可运行下两行代码查看运行结果（这里先注释掉了）

# print(data['日期'])

# print(data['最高气温'])

# print(data['最低气温'])

# 传入对应日期及其最高气温参数

# # # 应以矩阵形式表达(对于单变量，矩阵就是列向量形式)

# xTrain = np.array(data['日期'])[:, np.newaxis]

# # 为方便理解，也转换成列向量

# yTrain = np.array(data['最高气温'])

# 训练集

xTrain = np.array([ 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 ]) # 无需手动添加Intercept Item项

yTrain = np.array([[ 33 , 8 ], [ 35 , 9 ], [ 28 , 4 ], [ 20 , 4 ], [ 26 , 6 ], [ 27 , 10 ], [ 23 , 10 ], [ 22, 7 ], [ 22 , 3 ]])

# 测试集

xTest = np.array([ 3 , 6 , 9 , 10 , 11 ])

yTest = np.array([[ 28 , 4 ], [ 27 , 10 ], [ 22 , 3 ], [ 20 , 5 ], [ 19 , 7 ]])

# 创建模型对象

model = LinearRegression()

# 根据训练数据拟合出直线(以得到假设函数)

model.fit(yTrain, xTrain)

# 针对测试数据进行预测

hpyTest = model.predict(yTest)

print( "假设函数参数：" , model.intercept_, model.coef_)

print( "测试数据预测结果与实际结果差异：" , hpyTest - xTest)

print( "测试数据R方：" , model.score(yTest, xTest))

模型三：基于成本函数和梯度下降实现的多变量线性回归模型

经过模型三的拟合，我们发现R方仅为0.164，还不如模型二的预测结果呢。而根据理论知识我们知道，这个模型预测结果应该是线性回归模型中预测拟合效果较好的一种，低的这个R方值经过思考，可进一步说明最高气温的影响因素不仅仅取决于日期和最低气温，甚至我们可推断出可能与日期及最低气温值等影响因素无关。
通过运行结果发现“50000次循环后，计算仍未收敛”。这说明①在未对自变量归一化处理的情况下，运算出现异常，无法收敛；②设置了过大的学习速率，会导致计算不收敛。

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

import bgd_resolver

from sklearn.linear_model import LinearRegression

# 解决中文问题（若没有此步骤，表名字及横纵坐标中的汉语将无法显示[具体会显示矩形小方格]）

plt.rcParams[ 'font.sans-serif' ] = [ 'SimHei' ]

def costFn (theta, X, y) : # 成本函数

temp = X.dot(theta) - y

return (temp.T.dot(temp)) / ( 2 * len(X))

def gradientFn (theta, X, y) : # 根据成本函数，分别对x0,x1...xn求导数(梯度)

return (X.T).dot(X.dot(theta) - y) / len(X)

# 将数据从上一步存入的 .csv 格式文件中读取

data = pd.read_csv( r'F:\DaTong5Mouth.csv' )

# 由于最高气温与最低气温中有 / 分隔，故将其分开，即“气温”列由一列变为两列——“最高气温”和“最低气温”

data[ '最高气温' ] = data[ '气温' ].str.split( '/' ,expand= True )[ 0 ]

# 我们要对数值进行分析，所以将多余的单位 ℃ 从列表中去掉，只保留数值部分

data[ '最高气温' ] = data[ '最高气温' ].map( lambda x:x.replace( '℃,' , '' ))

data[ '最低气温' ] = data[ '气温' ].str.split( '/' ,expand= True )[ 1 ]

# 我们要对数值进行分析，所以将多余的单位 ℃ 从列表中去掉，只保留数值部分

data[ '最低气温' ] = data[ '最低气温' ].map( lambda x:x.replace( '℃,' , '' ))

# 日次操作同理，这里不再赘述

data[ '日期' ] = data[ '日期' ].map( lambda x:x.replace( '2020年05月0' , '' ))

data[ '日期' ] = data[ '日期' ].map( lambda x:x.replace( '日' , '' ))

# 不理解的小伙伴可运行下两行代码查看运行结果（这里先注释掉了）

# print(data['日期'])

# print(data['最高气温'])

# print(data['最低气温'])

# 传入对应日期及其最高气温参数

# # # 应以矩阵形式表达(对于单变量，矩阵就是列向量形式)

# xTrain = np.array(data['日期'])[:, np.newaxis]

# # 为方便理解，也转换成列向量

# yTrain = np.array(data['最高气温'])

# 训练集

xTrain = np.array([ 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 ]) # 无需手动添加Intercept Item项

yTrainData = np.array([[ 33 , 8 ], [ 35 , 9 ], [ 28 , 4 ], [ 20 , 4 ], [ 26 , 6 ], [ 27 , 10 ], [ 23 , 10], [ 22 , 7 ], [ 22 , 3 ]])

yTrain = np.c_[yTrainData, np.ones(len(yTrainData))]

np.random.seed( 0 )

init_theta = np.random.randn(yTrain.shape[ 1 ])

theta = bgd_resolver.batch_gradient_descent(costFn, gradientFn, init_theta, yTrain, xTrain)

print( "theta值" , theta)

# 测试集

xTest = np.array([ 3 , 6 , 9 , 10 , 11 ])

yTestData = np.array([[ 28 , 4 ], [ 27 , 10 ], [ 22 , 3 ], [ 20 , 5 ], [ 19 , 7 ]])

yTest = np.c_[yTestData, np.ones(len(yTestData))]

print( "测试数据预测值与真实值的差异：" , xTest.dot(theta) - xTest)

rsquare = bgd_resolver.batch_gradient_descent_rsquare(theta, yTest, xTest)

print( "测试数据R方：" , rsquare)

3、以"线性回归"的方式来拟合高阶曲线

这一部分我们分别使用一阶曲线(直线)、二阶曲线和三阶曲线进行拟合，并检查拟合效果。

在拟合数据点时，一般来说，对于一个自变量的，拟合出来是一条直线；对于两个自变量的，拟合出来时一个直平面。这种拟合结果是严格意义上的“线性”回归。但是有时候，采用“曲线”或“曲面”的方式来拟合，能够对训练数据产生更逼近的效果。这就是“高阶拟合”。

首先，我们查看要拟合的数据：

import numpy as np

import matplotlib.pyplot as plt

# 解决中文问题（若没有此步骤，表名字及横纵坐标中的汉语将无法显示[具体会显示矩形小方格]）

plt.rcParams[ 'font.sans-serif' ] = [ 'SimHei' ]

xTrain = np. array ([ 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 ])[:, np.newaxis] # 训练数据（日期）

yTrain = np. array ([ 33 , 35 , 28 , 20 , 26 , 27 , 23 , 22 , 22 ]) # 训练数据（最高气温）

xTest = np. array ([ 3 , 6 , 9 , 10 , 11 ])[:,np.newaxis] # 测试数据（日期）

yTest = np. array ([ 28 , 27 , 22 , 20 , 19 ]) # 测试数据（最高气温）

plotData = np. array (np.linspace( 0 , 15 , 30 ))[:,np.newaxis] # 作图用的数据点

def initPlot():

plt.figure()

plt.title( '2020年5月上旬大同天气' )

plt.xlabel( '日期' )

plt.ylabel( '气温' )

plt.grid( True )

return plt

plt = initPlot()

plt.plot(xTrain, yTrain, 'r.' ) # 训练点数据(红色)

plt.plot(xTest, yTest, 'b.' ) # 测试点数据(蓝色)

plt.show()

模型四：一阶线性拟合

from sklearn.linear_model import LinearRegression

# 线性拟合

linearModel = LinearRegression()

linearModel.fit(xTrain, yTrain)

linearModelTrainResult = linearModel.predict(plotData)

# 计算R方

linearModelRSquare = linearModel.score(xTest, yTest)

print("线性拟合R方:", linearModelRSquare)

plt = initPlot()

plt.plot(xTrain, yTrain, 'r.') # 训练点数据(红色)

plt.plot(xTest, yTest, 'b.') # 测试点数据(蓝色)

plt.plot(plotData, linearModelTrainResult, 'y-') # 线性拟合线

plt.show()

模型五：二阶曲线拟合

PolynomialFeatures.fit_transform提供了将1阶数据扩展到高阶数据的方法；
训练样本和测试样本都需要进行扩充。

from sklearn.preprocessing import PolynomialFeatures

from sklearn.linear_model import LinearRegression

# 二阶曲线拟合 theta0 + theta1*x + theta2*x*x x*x => z theta0+theta1*x+theta2*z

quadratic_featurizer = PolynomialFeatures(degree=2)

xTrain_quadratic = quadratic_featurizer.fit_transform(xTrain)

print(xTrain_quadratic) # 查看扩展后的特征矩阵

quadraticModel = LinearRegression()

quadraticModel.fit(xTrain_quadratic, yTrain)

# 计算R方(针对测试数据)

xTest_quadratic = quadratic_featurizer.fit_transform(xTest)

quadraticModelRSquare = quadraticModel.score(xTest_quadratic, yTest)

print("二阶拟合R方:", quadraticModelRSquare)

# 绘图点也同样需要进行高阶扩充以便使用曲线进行拟合

plotData_quadratic = quadratic_featurizer.fit_transform(plotData)

quadraticModelTrainResult = quadraticModel.predict(plotData_quadratic)

plt = initPlot()

plt.plot(xTrain, yTrain, 'r.') # 训练点数据(红色)

plt.plot(xTest, yTest, 'b.') # 测试点数据(蓝色)

plt.plot(plotData, quadraticModelTrainResult, 'g-') # 二阶拟合线

plt.show()

模型六：三阶曲线拟合

from sklearn.preprocessing import PolynomialFeatures

from sklearn.linear_model import LinearRegression

# 三阶曲线拟合

cubic_featurizer = PolynomialFeatures(degree=3)

xTrain_cubic = cubic_featurizer.fit_transform(xTrain)

cubicModel = LinearRegression()

cubicModel.fit(xTrain_cubic, yTrain)

plotData_cubic = cubic_featurizer.fit_transform(plotData)

cubicModelTrainResult = cubicModel.predict(plotData_cubic)

# 计算R方(针对测试数据)

xTest_cubic = cubic_featurizer.fit_transform(xTest)

cubicModelRSquare = cubicModel.score(xTest_cubic, yTest)

print("三阶拟合R方:", cubicModelRSquare)

plt = initPlot()

plt.plot(xTrain, yTrain, 'r.') # 训练点数据(红色)

plt.plot(xTest, yTest, 'b.') # 测试点数据(蓝色)

plt.plot(plotData, cubicModelTrainResult, 'p-') # 三阶拟合线

plt.show()

综上对比我们发现，一阶拟合R方约为0.833，二阶拟合R方约为0.218，三阶拟合R方约为0.800。很显然，得到的拟合R方值并不是随着阶数的增高而增大，同前理，说明日期和最低气温并不是最高气温的影响因素。这正与我们常识所知的结论相吻合。因此，想要预测天气值就错综而复杂，不得片面考虑一个或为数不多的几个因素，且不应考虑到与气温影响因素无关的影响变量：比如说像上例中所提及的日期、最低气温等。

4、线性回归预测天气

模型七：线性回归预测模型

使用sklearn.linear_model.LinearRegression处理。

无需对自变量进行归一化处理，也能得到一致的结果。针对训练数据的R方约为0.583。

（1）装载并查看数据信息

import numpy as np

xTrain = np. array ([ 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 ])[:, np.newaxis] # 训练数据（日期）

yTrain = np. array ([ 33 , 35 , 28 , 20 , 26 , 27 , 23 , 22 , 22 ]) # 训练数据（最高气温）

# 查看天气统计数据

print ( "天气数据统计：" )

print ( "最低：%.2f, 最高：%.2f, 平均：%.2f, 中位数：%.2f, 标准差：%.2f" %

(np.min(yTrain), np.max(yTrain), np.mean(yTrain), np.median(yTrain) ,np.std(yTrain)))

（2）使用LinearRegression，没有进行归一化预处理

''' 使用LinearRegression，没有进行归一化预处理 '''

import numpy as np

from sklearn.linear_model import LinearRegression

train_data = np.array([ 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 ])[:, np.newaxis] # 训练数据（日期）

train_temp = np.array([ 33 , 35 , 28 , 20 , 26 , 27 , 23 , 22 , 22 ])[:, np.newaxis] # 训练数据（最高气温）

xTrain = np.array(train_data[:, 0 : 2 ])

yTrain = np.array(train_temp[:, -1 ])

xTrain = np.c_[xTrain, np.ones(len(xTrain))]

model = LinearRegression()

model.fit(xTrain, yTrain)

（3）使用LinearRegression，进行归一化预处理

''' 使用LinearRegression，进行归一化预处理 '''

import numpy as np

from sklearn.linear_model import LinearRegression

def normalizeData (X) :

# 每列(每个Feature)分别求出均值和标准差，然后与X的每个元素分别进行操作

return (X - X.mean(axis= 0 ))/X.std(axis= 0 )

train_data = np.array([ 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 ])[:, np.newaxis] # 训练数据（日期）

train_temp = np.array([ 33 , 35 , 28 , 20 , 26 , 27 , 23 , 22 , 22 ])[:, np.newaxis] # 训练数据（最高气温）

xTrain = np.array(train_data[:, 0 : 2 ])

yTrain = np.array(train_temp[:, -1 ])

xTrain = normalizeData(xTrain)

xTrain = np.c_[xTrain, np.ones(len(xTrain))] # 归一化完成后再添加intercept item列

model = LinearRegression()

model.fit(xTrain, yTrain)

print( "LinearRegression计算R方：" , model.score(xTrain, yTrain))

使用自定义的批量梯度下降法：

在未对自变量归一化处理的情况下，运算可能出现异常，无法收敛，但这里没有出现；
归一化处理后，能够得到与LinearRegression类似的结果，即R方值约为0.582；
因此，不考虑影响因素合不合理情况下这种预测结果实质上准确率不容乐观。

1：使用自定义BGD，未作归一化处理（可能无法收敛，但这里没有出现无法收敛情况）

''' 使用自定义BGD，未作归一化处理，可能无法收敛 '''

import numpy as np

import bgd_resolver

def costFn (theta, X, y) :

temp = X.dot(theta) - y

return (temp.T.dot(temp)) / ( 2 * len(X))

def gradientFn (theta, X, y) :

return (X.T).dot(X.dot(theta) - y) / len(X)

train_date = np.array([ 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 ])[:, np.newaxis] # 训练数据（日期）

train_temp = np.array([ 33 , 35 , 28 , 20 , 26 , 27 , 23 , 22 , 22 ])[:, np.newaxis] # 训练数据（最高气温）

xTrain = np.array(train_date[:, 0 : 2 ])

yTrain = np.array(train_temp[:, -1 ])

xTrain = np.c_[xTrain, np.ones(len(xTrain))]

init_theta = np.random.randn(xTrain.shape[ 1 ])

# 如果数据不进行Normalize，则下面的梯度算法有可能不收敛

theta = bgd_resolver.batch_gradient_descent(costFn, gradientFn, init_theta, xTrain, yTrain)

rsquare = bgd_resolver.batch_gradient_descent_rsquare(theta, xTrain, yTrain)

print( "梯度下降法计算R方：" , rsquare)

2：使用自定义BGD，作归一化处理

''' 使用自定义BGD，作归一化处理 '''

import numpy as np

import bgd_resolver

def normalizeData (X) :

# 每列(每个Feature)分别求出均值和标准差，然后与X的每个元素分别进行操作

return (X - X.mean(axis= 0 ))/X.std(axis= 0 )

def costFn (theta, X, y) :

temp = X.dot(theta) - y

return (temp.T.dot(temp)) / ( 2 * len(X))

def gradientFn (theta, X, y) :

return (X.T).dot(X.dot(theta) - y) / len(X)

train_date = np.array([ 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 ])[:, np.newaxis] # 训练数据（日期）

train_temp = np.array([ 33 , 35 , 28 , 20 , 26 , 27 , 23 , 22 , 22 ])[:, np.newaxis] # 训练数据（最高气温）

xTrain = np.array(train_date[:, 0 : 2 ])

yTrain = np.array(train_temp[:, -1 ])

xTrain = np.c_[xTrain, np.ones(len(xTrain))]

init_theta = np.random.randn(xTrain.shape[ 1 ])

# 如果数据不进行Normalize，则下面的梯度算法有可能不收敛

theta = bgd_resolver.batch_gradient_descent(costFn, gradientFn, init_theta, xTrain, yTrain)

rsquare = bgd_resolver.batch_gradient_descent_rsquare(theta, xTrain, yTrain)

print( "梯度下降法计算R方：" , rsquare)

5、线性回归的其它计算方法

模型八：基于协方差-方差公式实现的线性回归模型

事实上，使用该方法计算出来的判别函数参数，与LinearRegression对象的计算结果一致。

''' 使用协方差-方差公式计算线性回归权重参数，并与LinearRegression结果对比 '''

import numpy as np

from sklearn.linear_model import LinearRegression

xTrain = np.array([ 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 ])[:, np.newaxis] # 训练数据（日期）

yTrain = np.array([ 33 , 35 , 28 , 20 , 26 , 27 , 23 , 22 , 22 ]) # 训练数据（最高气温）

model = LinearRegression()

hypothesis = model.fit(xTrain, yTrain)

print( "LinearRegression theta1=" , hypothesis.coef_)

print( "LinearRegression theta0=" , hypothesis.intercept_)

# cov函数是在各行元素之间计算协方差，所以x和y都应是行向量

theta1 = np.cov(xTrain.T, yTrain, ddof= 1 )[ 1 , 0 ] / np.var(xTrain, ddof= 1 )

theta0 = np.mean(yTrain) - theta1 * np.mean(xTrain)

print( "Least Square theta1=" , theta1) # 通过最小二乘法公式计算的斜率

模型九：基于成本函数和批量梯度下降算法实现的线性回归模型

成本函数：

在使用训练数据来训练模型时，用于定义判别函数与实际值的误差。成本函数计算结果越小，说明该模型与训练数据的匹配程度越高；
设定了某个模型后，只要给定了成本函数，就可以使用数值方法求出成本函数的最优解（极小值），从而确定判别函数模型中各个系数。

梯度下降：

梯度下降是迭代法的一种,可以用于求解最小二乘问题(线性和非线性都可以)。在求解机器学习算法的模型参数，即无约束优化问题时。

''' 使用批量梯度下降算法优化线性回归权重参数 '''

import numpy as np

import matplotlib.pyplot as plt

import bgd_resolver # 来自bgd_resolver.py文件

def costFn (theta, X, y) : # 定义线性回归的成本函数

temp = X.dot(theta) - y

return temp.dot(temp) / ( 2 *len(X))

def gradientFn (theta, X, y) : # 根据成本函数，分别对x0和x1求导数(梯度)

return (X.T).dot(X.dot(theta) - y) / len(X)

xTrain = np.array([ 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 ])[:, np.newaxis] # 训练数据（日期）

yTrain = np.array([ 33 , 35 , 28 , 20 , 26 , 27 , 23 , 22 , 22 ]) # 训练数据（最高气温）

xTrain_ext = np.c_[np.ones(len(xTrain)), xTrain] # 第一列补充0。注意返回的第一个权重参数将对应theta0

np.random.seed( 0 )

theta_init = np.random.randn(xTrain_ext.shape[ 1 ])

theta = bgd_resolver.batch_gradient_descent(costFn, gradientFn, theta_init, xTrain_ext, yTrain, learning_rate= 0.005 , tolerance= 1e-12 )

print( "BGD theta1=" , theta[ 1 ])

print( "BGD theta0=" , theta[ 0 ])

def initPlot () :

plt.figure()

plt.title( '2020.05 WEATHER' )

plt.xlabel( 'date' )

plt.ylabel( 'maximum temperature' )

plt.grid( True )

return plt

plt = initPlot()

plt.plot(xTrain, yTrain, 'k.' )

plt.plot(xTrain, xTrain_ext.dot(theta), 'g-' )

plt.show()

模型十：基于SGDRegressor随机梯度下降算法的实现

sklearn.linear_model.SGDRegressor对象提供了使用随机梯度下降算法进行线性回归的实现。

SGDRegressor对于数据集较大的情形比较合适，如果样本较少(例如本例)，其效果一般不好；
可以观察到，每次运行时，其优化结果并不相同。

''' 使用SGDRegressor随机梯度下降算法优化线性回归权重参数 '''

%matplotlib inline

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import SGDRegressor

xTrain = np.array([ 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 ])[:, np.newaxis] # 训练数据（日期）

yTrain = np.array([ 33 , 35 , 28 , 20 , 26 , 27 , 23 , 22 , 22 ]) # 训练数据（最高气温）

regressor = SGDRegressor(loss= 'squared_loss' , max_iter= 2000 )

regressor.fit(xTrain, yTrain)

# 每次运行，得到的结果并不相同

theta0 = regressor.intercept_[ 0 ]

theta1 = regressor.coef_[ 0 ]

print( "SGD theta1=" , theta1)

print( "SGD theta0=" , theta0)

def initPlot () :

plt.figure()

plt.title( '2020.05 DaTong WEAThER' )

plt.xlabel( 'Date' )

plt.ylabel( 'maximum temperature' )

plt.grid( True )

return plt

plt = initPlot()

plt.plot(xTrain, yTrain, 'k.' )

plt.plot(xTrain, theta0 + theta1 * xTrain, 'g-' )

plt.show()

6、对数几率回归

查看数据图像

其中最高气温影响因素日期用 + 表示，最低气温用· 表示。

import numpy as np

import matplotlib.pyplot as plt

# 解决中文问题

plt.rcParams[ 'font.sans-serif' ] = [ 'SimHei' ]

def initPlot () :

plt.figure()

plt.title( '2020年5月上旬大同天气' )

plt.xlabel( '日期' )

plt.ylabel( '最低温度' )

return plt

plt = initPlot()

factor1 = np.array([ 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 ]) # 从trainData中获取下标索引第2列(passed)值为1的所有行的第0列元素

factor2 = np.array([ 8 , 9 , 4 , 4 , 6 , 10 , 10 , 7 , 3 ])

plt.plot(factor1, 'r+' )

plt.plot(factor2, 'ko' )

plt.show()

模型十一：使用LogisticRegression进行逻辑回归模型

设置逻辑回归算法的某些属性：model = LogisticRegression(solver='lbfgs')，使用lbfgs算法来执行回归计算。默认使用liblinear。注意，这两种算法的结果并不相同
执行计算：model.fit(X, y)
执行预测：model.predict(newX)，返回值是newX矩阵中每行数据所对应的结果。如果是1，则表示passed；如果是0，则表示unpassed
获得模型参数值：theta0 = model.intercept_[0] theta1 =model.coef_[0,0] theta2 = model.coef_[0,1]
决策边界线

决策边界线可视为两种类别数据点的分界线。在该分界线的一侧，所有数据点都被归为passed类(1)，另一侧的所有数据点都被归为unpassed类(0)；

对于本例来说，决策边界线是一条直线(在案例2中进行了说明)。

''' 使用LogisticRegression进行逻辑回归 '''

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import LogisticRegression

# 解决中文问题

plt.rcParams[ 'font.sans-serif' ] = [ 'SimHei' ]

xTrain = np.array([[ 1 , 8 ],[ 2 , 9 ],[ 3 , 4 ],[ 4 , 6 ],[ 5 , 10 ],[ 6 , 10 ],[ 7 , 10 ],[ 8 , 7 ],[ 9 , 3]])

yTrain = np.array([ 33 , 35 , 28 , 20 , 26 , 27 , 23 , 22 , 22 ])

# print(xTrain)

model = LogisticRegression(solver= 'lbfgs' ) # 使用lbfgs算法。默认是liblinear算法

model.fit(xTrain, yTrain)

newFactors = np.array([[ 2 , 9 ],[ 5 , 10 ],[ 9 , 3 ],[ 10 , 5 ]])

print( "预测结果：" )

print(model.predict(newFactors))

# 获取theta计算结果

theta = np.array([model.intercept_[ 0 ], model.coef_[ 0 , 0 ], model.coef_[ 0 , 1 ]])

def initPlot () :

plt.figure()

plt.title( '2020年5月上旬大同天气' )

plt.xlabel( '日期' )

plt.ylabel( '最低温度' )

return plt

plt = initPlot()

factor1 = np.array([ 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 ]) # 影响因素1：日期

factor2 = np.array([ 8 , 9 , 4 , 4 , 6 , 10 , 10 , 7 , 3 ]) # 影响因素2：最低气温

plt.plot(factor1, 'r+' )

plt.plot(factor2, 'ko' )

boundaryX = np.array([ 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 , 10 ]) # 绘制决策边界线(每天日期)

boundaryY = -(theta[ 1 ] * boundaryX + theta[ 0 ]) / theta[ 2 ] # 根据决策边界线的直线公式和x值，计算对应的y值

plt.plot(boundaryX, boundaryY, 'b-' )

plt.show()

模型十二：基于成本函数和梯度下降算法进行逻辑回归模型

''' 使用梯度下降算法进行逻辑回归 '''

import numpy as np

import matplotlib.pyplot as plt

import bgd_resolver

def normalizeData (X, column_mean, column_std) :

return (X - column_mean) / column_std

def sigmoid (z) :

return 1. / ( 1 + np.exp(-z))

def costFn (theta, X, y) :

temp = sigmoid(X.dot(theta))

cost = -y.dot(np.log(temp)) - ( 1 - y).dot(np.log( 1 - temp))

return cost / len(X)

def gradientFn (theta, X, y) :

return xTrain.T.dot(sigmoid(xTrain.dot(theta)) - yTrain) / len(X)

def initPlot () :

plt.figure()

plt.title( '2020.5 DaTong Weather' )

plt.xlabel( 'Date' )

plt.ylabel( 'Temp' )

return plt

xTrain = np.array([[ 1 , 8 ],[ 2 , 9 ],[ 3 , 4 ],[ 4 , 6 ],[ 5 , 10 ],[ 6 , 10 ],[ 7 , 10 ],[ 8 , 7 ],[ 9 , 3 ]])

# 计算训练数据每列平均值和每列的标准差

xTrain_column_mean = xTrain.mean(axis= 0 )

xTrain_column_std = xTrain.std(axis= 0 )

xTrain = normalizeData(xTrain, xTrain_column_mean, xTrain_column_std) # 如果不进行归一化处理，计算过程中可能产生溢出(但似乎仍可以收敛)

x0 = np.ones(len(xTrain))

xTrain = np.c_[x0, xTrain] # 需手动追加Intercept Item列

yTrain = np.array([ 33 , 35 , 28 , 20 , 26 , 27 , 23 , 22 , 22 ])

np.random.seed( 0 )

init_theta = np.random.random( 3 ) # 随机初始化theta

theta = bgd_resolver.batch_gradient_descent(costFn, gradientFn, init_theta, xTrain, yTrain, 0.005 , 0.00001 )

# 预测若干数据,也需要先归一化，使用之前训练数据的mean和std

newFactors = np.array([[ 2 , 9 ],[ 5 , 10 ],[ 9 , 3 ],[ 10 , 5 ]])

newFactors = normalizeData(newScores, xTrain_column_mean, xTrain_column_std)

x0 = np.ones(len(newFactors))

newFactors = np.c_[x0, newFactors]

print( "预测结果：" )

print(sigmoid(newFactors.dot(theta)))

plt = initPlot()

factor1 = np.array([ 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 ]) # 影响因素1：日期

factor2 = np.array([ 8 , 9 , 4 , 4 , 6 , 10 , 10 , 7 , 3 ]) # 影响因素2：最低气温

plt.plot(factor1, 'r+' )

plt.plot(factor2, 'ko' )

# 绘制决策边界线

boundaryX = np.array([ 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 , 10 ])

# 因为之前进行了归一化，因此边界线上点的x坐标也需要先归一化。x坐标对应的列索引是0

normalizedBoundaryX = (boundaryX - xTrain_column_mean[ 0 ]) / xTrain_column_std[ 0 ]

# 下面计算出来的边界线上的y坐标normalizedBoundaryY是经过归一化处理的坐标

normalizedBoundaryY = (theta[ 0 ] * normalizedBoundaryX + theta[ 1 ] ) / theta[ 1 ]

# boundaryY才是将归一化坐标还原成正常坐标。y坐标对应的列索引是1

boundaryY = xTrain_column_std[ 1 ] * normalizedBoundaryY + xTrain_column_mean[ 1 ]

plt.plot(boundaryX, boundaryY, 'b-' )

plt.show()

模型十三：基于scipy.optimize优化运算库实现对数几率回归模型

使用minimize库函数；
需要提供jac参数，并将其设置为梯度计算函数；
scipy.optimize库中提供的算法会比我们自己实现的算法更高效、灵活、全面；
本例中没有对数据进行归一处理，因此导致minimize方法执行过程中溢出(尽管可能也能收敛)。请自行添加归一化处理功能。

''' 使用minimize来优化逻辑回归求解 '''

import numpy as np

import matplotlib.pyplot as plt

import scipy.optimize as opt

# 定义全局变量

xTrain = np.array([[ 1 , 8 ],[ 2 , 9 ],[ 3 , 4 ],[ 4 , 6 ],[ 5 , 10 ],[ 6 , 10 ],[ 7 , 10 ],[ 8 , 7 ],[ 9 , 3 ]])

x0 = np.ones(len(xTrain))

xTrain = np.c_[x0, xTrain]

yTrain = np.array([ 33 , 35 , 28 , 20 , 26 , 27 , 23 , 22 , 22 ])

def sigmoid (z) :

return 1. / ( 1 + np.exp(-z))

# Cost Function以theta为参数

def costFn (theta, X, y) :

temp = sigmoid(xTrain.dot(theta))

cost = -yTrain.dot(np.log(temp)) - ( 1 - yTrain).dot(np.log( 1 - temp))

return cost / len(X)

# Gradient Function以theta为参数

def gradientFn (theta, X, y) :

return xTrain.T.dot(sigmoid(xTrain.dot(theta)) - yTrain) / len(X)

np.random.seed( 0 )

# 随机初始化theta，计算过程中可能产生溢出。

# 可以尝试将init_theta乘以0.01，这样可以防止计算溢出

init_theta = np.random.random(xTrain.shape[ 1 ])

result = opt.minimize(costFn, init_theta, args=(xTrain, yTrain), method= 'BFGS' , jac=gradientFn, options={ 'disp' : True })

theta = result.x # 最小化Cost时的theta

def initPlot () :

plt.figure()

plt.title( '2020.5 DaTong Weather' )

plt.xlabel( 'Date' )

plt.ylabel( 'Temp' )

return plt

plt = initPlot()

factor1 = np.array([ 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 ]) # 影响因素1：日期

factor2 = np.array([ 8 , 9 , 4 , 4 , 6 , 10 , 10 , 7 , 3 ]) # 影响因素2：最低气温

plt.plot(factor1, 'r+' )

plt.plot(factor2, 'ko' )

boundaryX = np.array([ 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 , 10 ]) # 绘制决策边界线

boundaryY = (theta[ 1 ] * boundaryX + theta[ 0 ]) / theta[ 2 ]

plt.plot(boundaryX,boundaryY, 'b-' )

plt.show()

综上可以观察到，所有数据点并不明显分成两个类别。

线性回归主要都是针对训练数据和计算结果均为数值的情形。而在本例中，结果不是数值而是某种分类：这里分成日期和最低气温两类。而且发现，两类并不显示有明显的分界线。这进一步说明最高气温的影响因素不是日期和最低气温。

总结

我们通过数据爬取并用十三种预测模型最终得出结论：最高气温的影响因素与日期和最低气温毫无关联（由上可知会出现很荒谬的、与理论不符的结论，进而判断）；而这一结论与我们常识正好相符合，也就说明在此方面，实验成功！

你可能感兴趣的:(如何用 13 种模型预测天气预报？程序员教你用代码来实现)

发现全球视界：开启土耳其、德国与荷兰的免费IPTV之旅马冶娆
发现全球视界：开启土耳其、德国与荷兰的免费IPTV之旅去发现同类优质开源项目:https://gitcode.com/项目介绍在这个数字时代，享受无国界的电视直播变得触手可及。全球视界IPTV是一个精心收集超过1000个免费频道的开源项目，囊括了来自土耳其、德国和荷兰的丰富资源。无需复杂的订阅步骤，只需一个链接，即可通过您喜爱的播放器，如VLC或Kodi，享受即时的国际视听盛宴。项目技术分析弹性播
基于 React hooks + Typescript + Cesium 实现通视分析 jiegiser# webgis cesium通视分析 webgis 三维可视化 typescript react hooks
文章目录效果截图功能介绍实现思路实现步骤核心代码插值计算绘制分析线效果截图先上截图：功能介绍通视分析是指以某一点为观察点，研究某一区域通视情况的地形分析。用户在模型上选取任意两点之间是否可以互相可见的技术方法，主要用于判断任意两点之间能否通视；图层管理（√）dom点扩散（√）轨迹回放（√）测量（√）坐标拾取（√）加载模型数据，拾取三维模型（√）geoserver结合实现属性查询（√）geoserv
Android kotlin自定义View实现高斯模糊背景安卓兼职framework应用工程师 Android高级进阶 android kotlin kotlin实现高斯模糊背景 kotlin实现毛玻璃背景效果
目录1.概述2.kotlin自定义View实现高斯模糊背景主要核心代码2.1自定义高斯模糊背景类2.2高斯模糊的相关资源2.3Activity中使用1.概述在app开发中，高斯模糊背景也是常有的功能，现在流行用kotlin开发相关功能，所以就需要用kotlin自定义View实现高斯模糊背景的功能，具体功能实现如下如图:2.kotlin自定义View实现高斯模糊背景主要核心代码2.1自定义高斯模糊背
React+Cesium基础教程（002）：创建基于React和Cesium的加载第三方地图服务及地图叠加叁拾舞 Ceisum react.js 前端框架 Cesium
文章目录加载第三方地图服务加载OpenStreetMap加载高德地图加载天地图加载矢量地图加载影像地图加载地形图地图叠加加载第三方地图服务在Cesium中，可以加载第三方地图服务（如高德地图、天地图、OpenStreetMap）作为底图。Cesium提供了多种方式来加载瓦片地图，包括ImageryLayer和TileMapServiceImageryProvider等。在Cesium中加载第三方地
Three.js实战项目01：vue3+three.js实现圣诞动画贺卡项目叁拾舞 ThreeJs Vue3 three.js
文章目录创建项目加载模型设置天空与水设置天空设置水纹添加点光源相机位置和文字切屏添加星星完整代码下载创建项目创建vue3项目【christmas-app】：npminitvite@latest安装两个库：[email protected]加载模型//导入three库import*
Cesium+Vue3教程（009）：基于Vue3+Cesium加载渲染GeoJson数据叁拾舞 Ceisum Cesium Vue3
文章目录加载渲染GeoJson数据使用GeoJsonDataSource加载GeoJSON数据自定义样式注意事项加载渲染GeoJson数据在Cesium中，可以使用Cesium.GeoJsonDataSource来加载和显示GeoJSON数据。GeoJSON是一种广泛使用的地理空间数据格式，可以包含点、线、面等地理要素以及相关属性。使用GeoJsonDataSource加载GeoJSON数据示例代
Cesium+Vue3教程（010）：基于Vue3+Cesium的KML数据和CZML数据介绍叁拾舞 Ceisum Cesium Vue3
文章目录09-KML数据生成全球科学研究所地理标记10-KMZ数据加载GDP数据11-CZML数据介绍初始CZML数据加载CZML09-KML数据生成全球科学研究所地理标记在Cesium中，可以使用Cesium.KmlDataSource来加载和显示KML数据。KML(KeyholeMarkupLanguage)是一种常用的地理数据格式，支持点、线、面以及图标和样式定义。实现代码：//加载kml数
RabbitMQ实战 ikt4435 Java 程序员编程 java java-rabbitmq rabbitmq
1.1、作用解耦：在项目启动之初来预测将来会碰到什么需求是极其困难的。消息中间件在处理过程中间插入了一个隐含的、基于数据的接口层，两边的处理过程都要实现这一接口，这允许你独立地扩展或修改两边的处理过程，只要确保它们遵守同样的接口约束即可冗余〈存储)有些情况下，处理数据的过程会失败。消息中间件可以把数据进行持久化直到它们已经被完全处理，通过这一方式规避了数据丢失风险。在把个消息从消息中间件中删除之前
Kotlin实现自定义圆形ImageView lly-rachel Android笔记 #Kotlin入门 #自定义View android kotlin canvas bitmap
Kotlin实现自定义圆形ImageView在项目中做用户头像经常需要实现圆形头像的功能，查找资料后，实现自定义圆形ImageView效果。packagecom.example.customlockscreen.Utilimportandroid.annotation.SuppressLintimportandroid.content.Contextimportandroid.graphics.*
每日OJ_牛客_小红的子串_滑动窗口+前缀和_C++_Java GR鲸鱼 c++开发语言 java 算法数据结构
目录牛客_小红的子串_滑动窗口+前缀和题目解析C++代码Java代码牛客_小红的子串_滑动窗口+前缀和小红的子串描述：小红拿到了一个长度为nnn的字符串，她准备选取一段子串，满足该子串中字母的种类数量在[l,r]之间。小红想知道，一共有多少种选取方案？输入描述：第一行输入三个正整数n,l,rn,第二行输入一个仅包含小写字母的字符串。1≤n≤2000001≤l≤r≤26输出描述：合法的方案数。题目解
2025美赛C题完整代码+建模过程摆烂大大王 2025美赛思路+代码参考机器学习 python 数学建模
问题一第一个问题是开发国家奖牌总数模型，包括以下几个具体要求：开发一个预测各国奖牌数（至少包括金牌和总奖牌数）的模型，并包括模型预测结果的不确定性/精度估计及模型性能的衡量指标。根据模型，预测2028年洛杉矶夏季奥运会的奖牌榜，包括所有结果的预测区间，并分析哪些国家可能在奖牌榜上有所提升，哪些国家表现可能不如2024年。模型应包括尚未获得奖牌的国家，预测下届奥运会中有多少国家可能赢得他们的首枚奖牌
AI Agent的工具调用体系：打造可扩展的能力框架技术出海录人工智能 AI ai agent
在上一篇文章中，我们讨论了AIAgent的记忆系统。今天，我想分享一下如何设计和实现一个灵活的工具调用体系。说实话，这个模块我重构了好几次，每次都有新的感悟。从简单到复杂最开始实现工具调用时，我用的是最简单的方式：defrun_tool(name:str,args:dict)->str:ifname=="search":returnsearch_function(**args)elifname==
使用 AI 助手提升前端代码质量：自动代码审查实战技术出海录远洋录·技术篇人工智能前端
最近在带团队的时候，发现代码审查（CodeReview）总是成为项目进度的一个瓶颈。一方面，高级工程师的时间很宝贵，不可能审查每一行代码；另一方面，初级工程师又急需及时的反馈来提升。于是我就在想：能不能用AI来解决这个问题？经过一番研究和实践，我搭建了一个AI代码审查助手，效果出乎意料的好！今天就来分享下这个小工具是怎么做的。为什么需要AI代码审查？说实话，最开始团队里有不少质疑的声音：“AI能审
C语言中的常见数据类型（char）卷卷的小趴菜学编程 c语言 c语言开发语言
一、char类型1.字符表示：char类型变量可以存储任何ASCII码或扩展ASCII码字符，取值范围是-128到127或0到255（分为signedchar和unsignedchar)，占一个字节，8个比特位。注意：char是否有符号取决于编译的实现，绝大部分的编译器上char为signedchar。2.默认值：未初始化的char变量默认值为'\0'，表示空字符。注意：在用printf打印时，\
【C++】list的模拟实现 _小羊_ C++c++list windows
个人主页：奋斗的小羊所属专栏：C++很荣幸您能阅读我的文章，诚请评论指点，欢迎欢迎~目录1、list的模拟实现1.1list简单介绍1.2list主要函数接口1.2.1构造1.2.2拷贝构造1.2.3赋值重载1.2.4迭代器1.2.5插入1.2.6删除1.2.7迭代器失效的问题1.2.8clear1.2.9析构1.3list迭代器1.3.1构造1.3.2++重载1.3.3--重载1.3.4解引用重
麦田物语学习笔记:背包物品选择高亮显示和动画扶离_flee 麦田物语学札学习笔记
如题,本篇文章没讲动画效果基本流程1.代码思路(1)先用点击事件的接口函数去实现,点击后反转选择状态(isSelected),以及设置激活状态(SetActive),并且还需要判断该格子是否为空,空格子是点不动的,完成后以上后,出现的问题是高亮应该是有且仅有一个格子是高亮的,而现在可以让多个都高亮(2)基于以上问题,需要遍历所有的格子,使被选中的格子变为那个唯一高亮的(3)值得注意的是,Inven
麦田物语学习笔记:创建DragItem实现物品的拖拽跟随显示扶离_flee 麦田物语学札学习笔记
基本流程1.代码思路(1)在SlotUI中使用拖拽接口IBeginDragHandler,IDragHandler,IEndDragHandler(2)开始拖拽的时候,在屏幕上生成物体,拖拽期间物体显示为当前被拖拽的物体的图标,停止拖拽时图标消失(3)基于以上,所以我们要获得这个图标的控制,则要去InventoryUI里获得(4)在停止拖拽的时候检测该位置所对应的GameObject,值得注意的是
c++常见设计模式之装饰器模式 _DCG_ c++c++设计模式装饰器模式
基础介绍装饰器模式是结构型设计模式，从字面意思看装饰器设计模式就是用来解决在原有的实现基础上添加一些额外的实现的问题。那么正统的概念是什么呢？装饰器模式允许我们动态的向对象添加新的行为，同时不改变其原有的结构。它是一种比继承更灵活的扩展对象功能的方式。举个简单的例子，比如手机作为一个产品，希望在基础手机的基础上实现新增两个功能1，且不希望改变类原有的结构，这种情况下就需要使用到装饰器模式。实现原理
STM32 GPIO 2401- stm32 单片机嵌入式硬件
GPIO简介GPIO（GeneralPurposeInputOutput）通用输入输出口可配置为8种输入输出模式引脚电平：0V~3.3V，部分引脚可容忍5V输出模式下可控制端口输出高低电平，用以驱动LED、控制蜂鸣器、模拟通信协议输出时许等。输入模式下可读取端口的高低电平或者电压，用于读取按键输入、外接模块电平信号输入、ADC电压采集、模拟通信协议接受数据等。系统结构寄存器：是一段特殊的存储器，内
AI Agent的记忆系统实现：从短期对话到长期知识技术出海录人工智能 AI ai agent
在上一篇文章中，我们搭建了AIAgent的基础框架。今天，我想深入讲讲AIAgent最核心的部分之一：记忆系统。说实话，我在实现记忆系统时走了不少弯路，希望通过这篇文章，能帮大家少走一些弯路。从一个bug说起还记得在开发知识助手的过程中，我遇到了一个很有意思的问题。一天我正在测试多轮对话功能：我：Python的装饰器是什么？助手：装饰器是Python中用于修改函数或类行为的一种设计模式...（省略
python如何在一个类里面调用另一个类里面的东西 xiamu_CDA python 开发语言
Python高手必备：轻松实现在一个类里调用另一个类的方法和属性Python是一门强大且灵活的编程语言，它的面向对象特性使得开发者可以轻松地组织和管理代码。然而，在实际开发过程中，我们经常会遇到这样一个问题：如何在一个类里面调用另一个类里面的东西？这看似简单的问题背后其实涉及到了许多面向对象编程的核心概念。本文将深入探讨这个问题，并提供几种实现方法，帮助你更好地理解和应用Python的类。为什么需
spss因子分析过程中，旋转载荷平方和累积有点低咋办怎么调整 xiamu_CDA python
SPSS因子分析过程中，旋转载荷平方和累积有点低咋办？怎么调整？在数据分析领域，因子分析是一项重要的统计技术，尤其在心理学、社会学、市场营销等领域中应用广泛。它通过将多个变量简化为少数几个潜在因子，帮助研究者理解变量之间的内在结构。然而，在实际操作过程中，我们常常会遇到一些棘手的问题，比如旋转载荷平方和累积值偏低。这不仅会影响模型的解释力，还可能导致研究结果的可靠性大打折扣。那么，当我们在使用SP
C语言的那点事第九篇：那些“幕后英雄”的故事，预处理暮雨哀尘 C语言的那点事算法 c语言开发语言青少年编程蓝桥杯 c++
C语言中的预处理：那些“幕后英雄”的故事在C语言的世界里，编译器就像一位严谨的厨师，把我们写的代码变成可执行的程序。但在这道菜上桌之前，还有一群“幕后英雄”在默默工作，它们就是预处理器。今天，就让我们一起走进预处理器的世界，看看它们是如何在代码的舞台上施展魔法的。一、预处理：编译前的“热身运动”在C语言的编译过程中，预处理是第一道工序。想象一下，你准备做一道复杂的菜，首先得把食材准备好，该洗的洗，
深度剖析 Java 的线程池：高效管理线程资源潜意识Java Java知识 java 开发语言
目录一、线程池是什么二、线程池的工作原理三、线程池的创建和使用四、线程池的拒绝策略五、线程池的优势家人们，今天咱们来聊聊Java并发编程里的关键组件——线程池。在开发多线程应用时，频繁地创建和销毁线程会消耗大量资源，影响程序性能，而线程池就能很好地解决这个问题。我也是在实际项目中不断摸索，才把线程池的用法和原理摸透，现在就把这些经验分享给大伙。一、线程池是什么简单来说，线程池就是一个管理线程的容器
MySQL实现Oracle merge into函数咸鱼的倔强 MySQL mysql oracle 数据库
MySQL实现Oraclemergeinto函数之前有撰文Oracle、MySQL兼容–mergeinto，其中介绍了MySQL用INSERT…ONDUPLICATEKEYUPDATE和存储过程实现mergeinto，本文介绍其它的两种方法实现mergeinto。1、replaceinto语法同insertinto，使用简单，但有限制，replaceinto是根据主键去匹配，故replaceint
用MySQL实现Oracle的merge into函数追寻自己的光 oracle mysql 数据库
目录第一部分使用Oracle的mergeinto函数第一步建表第二步插入数据第三步使用mergeinto函数从B表中向A表中更新数据第二部分使用MySQL实现Oracle的mergeinto函数第一步建表第二步插入数据第三步使用onduplicatekey实现Oracle的mergeinto函数最后：最近正好遇到将Oracle的mergeinto函数用MySQL的方式表示出来，但是在MySQL中是
Python批量为PDF添加水印：让你的文件瞬间高大上！码无止尽 Python办公自动化 python pdf
嗨，各位可爱的小伙伴们！小编在此奉上今天的超级干货：如何用Python给一大堆PDF文件添加水印。请放心，这不是在交朋友圈秀操作，而是有实际需求的哦！有时候我们需要在PDF文件上添加水印，比如“草稿”、“保密”、“审阅”等标识，来提醒自己或他人。今天就让我来教你如何用Python轻松搞定这件事！首先，让我给你看一下大致的实现思路，然后再附上实际代码。实现思路1、首先，我们需要一个PDF处理的Pyt
构建自动化网页内容监控系统：使用Python 爱你不会累
本文还有配套的精品资源，点击获取简介：网页监控更新工具是一个由Python开发的软件，用于检测和记录网页内容的变化。该工具利用Python在Web抓取和数据分析方面的优势，包括利用requests,BeautifulSoup,lxml,和diff-match-patch等库来获取网页内容、解析HTML文档及计算文本差异。工具支持在Windows7及Python2.7.3环境下运行，并允许用户设定监
单例模式 java面试题_8道常考Java单例模式面试题知然789 单例模式 java面试题
Java单例设计模式是GoF23种设计模式之一，也是是使用频率最高的设计模式之一，所以想参加java程序员岗位面试的朋友们，必须要提前学习好java单例模式面试题的内容，java单例模式在初级中高级的面试中几乎都会出现，所以还是十分重要的。答：单例模式是一种常用的软件设计模式，其定义是单例对象的类只能允许一个实例存在。许多时候整个系统只需要拥有一个的全局对象，这样有利于我们协调系统整体的行为。比如
一文了解AOSP是什么？秋月霜风其他知识标记 1024程序员节 android runtime 安卓
一文了解AOSP是什么？AOSP基本信息基本定义AOSP是AndroidOpenSourceProject的缩写，这是一个由Google维护的完全免费和开放的操作系统开发项目。它是Android系统的核心基础，提供了构建移动操作系统所需的基本组件。主要特点完全开源：源代码可以自由获取和修改基于Linux内核：使用修改版的Linux内核和其他开源软件主要面向触屏设备：设计优化适配触摸屏设备AOSP与
ztree设置禁用节点 3213213333332132 JavaScript ztree json setDisabledNode Ajax
ztree设置禁用节点的时候注意，当使用ajax后台请求数据,必须要设置为同步获取数据，否者会获取不到节点对象，导致设置禁用没有效果。 $(function(){ showTree(); setDisabledNode(); });
JVM patch by Taobao bookjovi java HotSpot
在网上无意中看到淘宝提交的hotspot patch，共四个，有意思，记录一下。 7050685：jsdbproc64.sh has a typo in the package name 7058036：FieldsAllocationStyle=2 does not work in 32-bit VM 7060619：C1 should respect inline and
将session存储到数据库中 dcj3sjt126com sql PHP session
CREATE TABLE sessions ( id CHAR(32) NOT NULL, data TEXT, last_accessed TIMESTAMP NOT NULL, PRIMARY KEY (id) ); <?php /** * Created by PhpStorm. * User: michaeldu * Date
Vector 171815164 vector
public Vector<CartProduct> delCart(Vector<CartProduct> cart, String id) { for (int i = 0; i < cart.size(); i++) { if (cart.get(i).getId().equals(id)) { cart.remove(i);
各连接池配置参数比较 g21121 连接池
排版真心费劲，大家凑合看下吧，见谅~ Druid DBCP C3P0 Proxool 数据库用户名称 Username Username User 数据库密码 Password Password Password 驱动名
[简单]mybatis insert语句添加动态字段 53873039oycg mybatis
mysql数据库,id自增,配置如下： <insert id="saveTestTb" useGeneratedKeys="true" keyProperty="id" parameterType=&
struts2拦截器配置云端月影 struts2拦截器
struts2拦截器interceptor的三种配置方法方法1. 普通配置法 <struts> <package name="struts2" extends="struts-default"> &
IE中页面不居中，火狐谷歌等正常 aijuans IE中页面不居中
问题是首页在火狐、谷歌、所有IE中正常显示，列表页的页面在火狐谷歌中正常，在IE6、7、8中都不中，觉得可能那个地方设置的让IE系列都不认识，仔细查看后发现，列表页中没写HTML模板部分没有添加DTD定义，就是<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3
String,int,Integer,char 几个类型常见转换 antonyup_2006 html sql .net
如何将字串 String 转换成整数 int? int i = Integer.valueOf(my_str).intValue(); int i=Integer.parseInt(str); 如何将字串 String 转换成Integer ? Integer integer=Integer.valueOf(str); 如何将整数 int 转换成字串 String ? 1.
PL/SQL的游标类型百合不是茶显示游标(静态游标)隐式游标游标的更新和删除 %rowtype ref游标(动态游标)
游标是oracle中的一个结果集,用于存放查询的结果; PL/SQL中游标的声明; 1,声明游标 2,打开游标(默认是关闭的); 3,提取数据 4,关闭游标注意的要点:游标必须声明在declare中,使用open打开游标,fetch取游标中的数据,close关闭游标隐式游标:主要是对DML数据的操作隐
JUnit4中@AfterClass @BeforeClass @after @before的区别对比 bijian1013 JUnit4 单元测试
一.基础知识 JUnit4使用Java5中的注解（annotation），以下是JUnit4常用的几个annotation： @Before：初始化方法对于每一个测试方法都要执行一次（注意与BeforeClass区别，后者是对于所有方法执行一次）@After：释放资源对于每一个测试方法都要执行一次（注意与AfterClass区别，后者是对于所有方法执行一次
精通Oracle10编程SQL(12)开发包 bijian1013 oracle 数据库 plsql
/* *开发包 *包用于逻辑组合相关的PL/SQL类型（例如TABLE类型和RECORD类型）、PL/SQL项（例如游标和游标变量）和PL/SQL子程序（例如过程和函数） */ --包用于逻辑组合相关的PL/SQL类型、项和子程序，它由包规范和包体两部分组成 --建立包规范：包规范实际是包与应用程序之间的接口，它用于定义包的公用组件，包括常量、变量、游标、过程和函数等 --在包规
【EhCache二】ehcache.xml配置详解 bit1129 ehcache.xml
在ehcache官网上找了多次，终于找到ehcache.xml配置元素和属性的含义说明文档了，这个文档包含在ehcache.xml的注释中！ ehcache.xml ： http://ehcache.org/ehcache.xml ehcache.xsd ： http://ehcache.org/ehcache.xsd ehcache配置文件的根元素是ehcahe ehcac
java.lang.ClassNotFoundException: org.springframework.web.context.ContextLoaderL 白糖_ java eclipse spring tomcat Web
今天学习spring+cxf的时候遇到一个问题：在web.xml中配置了spring的上下文监听器： <listener> <listener-class>org.springframework.web.context.ContextLoaderListener</listener-class> </listener> 随后启动
angular.element boyitech AngularJS AngularJS API angular.element
angular.element 描述: 包裹着一部分DOM element或者是HTML字符串，把它作为一个jQuery元素来处理。（类似于jQuery的选择器啦）如果jQuery被引入了，则angular.element就可以看作是jQuery选择器，选择的对象可以使用jQuery的函数；如果jQuery不可用，angular.e
java-给定两个已排序序列，找出共同的元素。 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class CommonItemInTwoSortedArray { /** * 题目：给定两个已排序序列，找出共同的元素。 * 1.定义两个指针分别指向序列的开始。 * 如果指向的两个元素
sftp 异常，有遇到的吗？求解 Chen.H java jcraft auth jsch jschexception
com.jcraft.jsch.JSchException: Auth cancel at com.jcraft.jsch.Session.connect(Session.java:460) at com.jcraft.jsch.Session.connect(Session.java:154) at cn.vivame.util.ftp.SftpServerAccess.connec
[生物智能与人工智能]神经元中的电化学结构代表什么? comsci 人工智能
我这里做一个大胆的猜想,生物神经网络中的神经元中包含着一些化学和类似电路的结构,这些结构通常用来扮演类似我们在拓扑分析系统中的节点嵌入方程一样,使得我们的神经网络产生智能判断的能力,而这些嵌入到节点中的方程同时也扮演着"经验"的角色.... 我们可以尝试一下...在某些神经
通过LAC和CID获取经纬度信息 dai_lm lac cid
方法1：用浏览器打开http://www.minigps.net/cellsearch.html，然后输入lac和cid信息(mcc和mnc可以填0)，如果数据正确就可以获得相应的经纬度方法2：发送HTTP请求到http://www.open-electronics.org/celltrack/cell.php?hex=0&lac=<lac>&cid=&
JAVA的困难分析 datamachine java
前段时间转了一篇SQL的文章（http://datamachine.iteye.com/blog/1971896），文章不复杂，但思想深刻，就顺便思考了一下java的不足，当砖头丢出来，希望引点和田玉。 -----------------------------------------------------------------------------------------
小学5年级英语单词背诵第二课 dcj3sjt126com english word
money 钱 paper 纸 speak 讲，说 tell 告诉 remember 记得，想起 knock 敲，击，打 question 问题 number 数字，号码 learn 学会，学习 street 街道 carry 搬运，携带 send 发送，邮寄，发射 must 必须 light 灯，光线，轻的 front
linux下面没有tree命令 dcj3sjt126com linux
centos p安装 yum -y install tree mac os安装 brew install tree 首先来看tree的用法 tree 中文解释：tree 功能说明：以树状图列出目录的内容。语　　法：tree [-aACdDfFgilnNpqstux][-I <范本样式>][-P <范本样式
Map迭代方式，Map迭代，Map循环蕃薯耀 Map循环 Map迭代 Map迭代方式
Map迭代方式，Map迭代，Map循环 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年
Spring Cache注解+Redis hanqunfeng spring
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redis</artifactId>
Guava中针对集合的 filter和过滤功能 jackyrong filter
在guava库中，自带了过滤器(filter)的功能，可以用来对collection 进行过滤，先看例子： @Test public void whenFilterWithIterables_thenFiltered() { List<String> names = Lists.newArrayList("John"
学习编程那点事 lampcy 编程 android PHP html5
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
架构师之流处理---------bytebuffer的mark,limit和flip nannan408 ByteBuffer
1.前言。如题，limit其实就是可以读取的字节长度的意思，flip是清空的意思，mark是标记的意思。 2.例子. 例子代码: String str = "helloWorld"; ByteBuffer buff = ByteBuffer.wrap(str.getBytes()); Sy
org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1, column 1 Everyday都不同 $转义 el表达式
最近在做Highcharts的过程中，在写js时，出现了以下异常：严重: Servlet.service() for servlet jsp threw exception org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1,
用Java实现发送邮件到163 tntxia java实现
/* 在java版经常看到有人问如何用javamail发送邮件？如何接收邮件？如何访问多个文件夹等。问题零散，而历史的回复早已经淹没在问题的海洋之中。本人之前所做过一个java项目，其中包含有WebMail功能，当初为用java实现而对javamail摸索了一段时间，总算有点收获。看到论坛中的经常有此方面的问题，因此把我的一些经验帖出来，希望对大家有些帮助。此篇仅介绍用
探索实体类存在的真正意义 java小叶檀 POJO
一. 实体类简述实体类其实就是俗称的POJO,这种类一般不实现特殊框架下的接口，在程序中仅作为数据容器用来持久化存储数据用的 POJO（Plain Old Java Objects）简单的Java对象它的一般格式就是 public class A{ private String id; public Str