weixin_39629989

tf 损失函数_【TF2.1学习笔记7】激活函数、损失函数和优化器

大纲指数衰减学习率

激活函数

损失函数

缓解过拟合

优化器

1. 指数衰减学习率

思想：先用较大的学习率快速得到近似解，然后逐步减小学习率，使算法在迭代后期稳定下来。计算公式为：

指数衰减学习率=初始学习率*学习率衰减率^(单前轮数/多少轮衰减一次)，其中，单前轮数可以指opoch数，也可以指global steps。

例子：

import tensorflow as tf

epoch=40

lr_base=0.2

lr_decay=0.99

lr_step=1

w = tf.Variable(tf.constant(5, dtype=tf.float32))

for epoch in range(epoch):

lr=lr_base*lr_decay**(epoch/lr_step)

with tf.GradientTape() as tape:

loss=tf.square(w+1)

grads=tape.gradient(loss,w)

w.assign_sub(lr*grads)

print("after%spoch, w is%f, loss if%f, lr is%f" %(epoch,w.numpy(),loss,lr))

outputs:

after 0 poch, w is 2.600000, loss if 36.000000, lr is 0.200000

after 1 poch, w is 1.174400, loss if 12.959999, lr is 0.198000

after 2 poch, w is 0.321948, loss if 4.728015, lr is 0.196020

after 3 poch, w is -0.191126, loss if 1.747547, lr is 0.194060

after 4 poch, w is -0.501926, loss if 0.654277, lr is 0.192119

after 5 poch, w is -0.691392, loss if 0.248077, lr is 0.190198

after 6 poch, w is -0.807611, loss if 0.095239, lr is 0.188296

after 7 poch, w is -0.879339, loss if 0.037014, lr is 0.186413

after 8 poch, w is -0.923874, loss if 0.014559, lr is 0.184549

after 9 poch, w is -0.951691, loss if 0.005795, lr is 0.182703

2. 激活函数tf.math.sigmoid(x)：数学形式为

，输出范围为[0,1]。特点：(1)大部分梯度接近于0，易造成梯度消失；(2)输出非0均值，收敛慢；(3)幂运算复杂，计算量大。

tf.math.tanh(x)：数学形式为

，输出范围为[-1,1]。特点：大部分梯度接近于0，易造成梯度消失；(2)输出0均值；(3)幂运算复杂，计算量大。

tf.nn.relu(x)：数学形式为

。优点是：解决了梯度消失问题，运算简单，收录速度远快于sigmoid和tanh。缺点是：输出非0均值，收敛慢；某些神经元的激活值为0，梯度也为0，导致这些神经元的参数永远不会被更新，即Dead relu问题。

tf.nn.leaky_relu(x)：数学形式为

。理论上来讲，leaky_relu有relu的所有优点，并且不存在Dead relu问题。

建议：首选relu激活函数

学习率设置为较小的值

输入特征标准化，让输入特征满足0均值，1标注差的正太分布

输出参数中心化，让随机生成的参数满足0均值，

标准差的正太分布，n指当前层输入特征个数。

3. 损失函数

损失函数指预测值y与已知答案y_之间的差距。均方误差

loss_mse=tf.math.reduce_mean(tf.math.square(y_-y))

例子：

import tensorflow as tf

import numpy as np

SEED=23455

rdm=np.random.RandomState(SEED)

x=rdm.rand(32,2)

y_=[[x1+x2+(rdm.rand()/10.-0.05)] for (x1,x2) in x]

x=tf.cast(x,dtype=tf.float32) #tf.cast能对numpy数据进行操作，返回Tensor

#print(x)

w1=tf.Variable(tf.random.normal([2,1],stddev=1,seed=1))

epoch=15000

lr=0.002

for epoch in range(epoch):

with tf.GradientTape() as tape:

y=tf.linalg.matmul(x,w1)

loss_mse=tf.math.reduce_mean(tf.math.square(y-y_)) #Tensor居然能直接减去列表

grads=tape.gradient(loss_mse,w1)

w1.assign_sub(lr*grads)

if epoch%500==0:

print("after%dtraining steps, w1 is" % (epoch))

print(w1.numpy(),"\n")

outputs:

after 14500 training steps, w1 is

[[1.0002553 ]

[0.99838644]]交叉熵

表示两个概率分布之间的距离。交叉熵越大，两个概率分布越远；交叉熵越小，两个概率分布越近。计算公式为：

式中，y_指标准答案，y指网络预测值。

实现方法：tf.losses.categorical_corssentropy(y_,y)

例子：

ce1=tf.losses.categorical_crossentropy([1,0],[0.6,0.4])

ce2=tf.losses.categorical_crossentropy([1,0],[0.8,0.2])

print(ce1)

print(ce2)

outputs:

tf.Tensor(0.5108256, shape=(), dtype=float32)

tf.Tensor(0.22314353, shape=(), dtype=float32)softmax和交叉熵结合

tf.nn.softmax_cross_entropy_with_logits(y_, y)

下面例子说明了softmax_cross_entropy_with_logits等价于softmax和categorical_crossentropy：

y_=np.array([[1,0,0],

[0,1,0],

[0,0,1],

[1,0,0]])

y=np.array([[12,3,2],

[3,10,1],

[1,2,5],

[4,6.5,1]])

y_pred=tf.nn.softmax(y)

loss1=tf.losses.categorical_crossentropy(y_,y_pred)

loss2=tf.nn.softmax_cross_entropy_with_logits(y_,y)

print(loss1)

print(loss2)

outputs:

tf.Tensor([1.68795487e-04 1.03475622e-03 6.58839038e-02 2.58265938e+00], shape=(4,), dtype=float64)

tf.Tensor([1.68795487e-04 1.03475622e-03 6.58839038e-02 2.58265938e+00], shape=(4,), dtype=float64)自定义

mse和交叉熵不一定是最优的loss，有时候可自定义loss。

4. 缓解过拟合正则化

正则化在损失函数中引入模型复杂度指标，利用给w加权值，弱化了训练数据的噪声(一般不正则化b)。数学形式为：

权值w的正则化一般有L1和L2正则化：

正则化的选择：

(1)L1正则化大概率会使很多参数变为0，因此它通过稀疏参数减少参数的数量，降低复杂度。

(2)L2正则化会使很多参数接近于0但不为0，因此它通过减小参数大小降低复杂度。

例子：

import tensorflow as tf

import numpy as np

from matplotlib import pyplot as plt

import pandas as pd

# 读入数据和标签

df=pd.read_csv('dot.csv')

x_data=np.array(df[['x1','x2']]) #shape (300,2)

y_data=np.array(df['y_c']) #shape (300,)

y_data=y_data.reshape(-1,1) #shape (300,1)

Y_c=[['red' if y else 'blue'] for y in y_data]

# 转换数据类型，否则后面矩阵相乘时会因数据类型问题报错

x_train=tf.cast(x_data,tf.float32) #tf函数能直接处理numpy数据，很有趣

y_train=tf.cast(y_data,tf.float32)

# 配对数据，切分数据

train_db=tf.data.Dataset.from_tensor_slices((x_train,y_train)).batch(32)

# 生成神经网络的参数，并保证参数可训练

w1=tf.Variable(tf.random.normal([2,11]),dtype=tf.float32)

b1=tf.Variable(tf.constant(0.01,shape=[11])) #突然间觉得对constant很陌生

w2=tf.Variable(tf.random.normal([11,1]),dtype=tf.float32)

b2=tf.Variable(tf.constant(0.01,shape=[1]))

lr=0.005

epoch=800

# 训练部分

for epoch in range(epoch):

for step,(x_train,y_train) in enumerate(train_db):

with tf.GradientTape() as tape:

h1=tf.linalg.matmul(x_train,w1)+b1

h1=tf.nn.relu(h1)

y=tf.linalg.matmul(h1,w2)+b2

#mse

loss_mse=tf.math.reduce_mean(tf.math.square(y_train-y))

#正则化

loss_regularization=[]

#tf.nn.l2_loss(w1)=sum(w**2)/2，输出一个scalar。使用tf.losses里面很多函数是不求和的，需要注意。

loss_regularization.append(tf.nn.l2_loss(w1))

loss_regularization.append(tf.nn.l2_loss(w2))

loss_regularization=tf.math.reduce_sum(loss_regularization)

loss=loss_mse+0.03*loss_regularization

#求梯度

variables=[w1,b1,w2,b2]

grads=tape.gradient(loss,variables)

# 更新梯度

w1.assign_sub(lr * grads[0])

b1.assign_sub(lr * grads[1])

w2.assign_sub(lr * grads[2])

b2.assign_sub(lr * grads[3])

if epoch%20==0:

print('epoch:',epoch, 'loss:',float(loss))

# 预测部分

print('******************predict*****************')

#xx在-3到3之间以步长为0.1，yy在-3到3之间以步长为0.1，生成间隔数值点

xx,yy=np.mgrid[-3:3:.1,-3:3:.1]

# 将xx和yy拉直，并合并配对为二维张量，生成二维坐标点

grid=np.c_[xx.ravel(),yy.ravel()]

grid=tf.cast(grid,tf.float32)

# 将网格点喂入神经网络进行预测

# probs=[]

# for x_test in grid:

# h1=tf.linalg.matmul([x_test],w1)+b1 #matmul的操作对象是矩阵，所以需要把x_test转换为矩阵

# h1=tf.nn.relu(h1)

# y=tf.linalg.matmul(h1,w2)+b2

# probs.append(y)

h1=tf.linalg.matmul(grid,w1)+b1

h1=tf.nn.relu(h1)

probs=tf.linalg.matmul(h1,w2)+b2

x1=x_data[:,0]

x2=x_data[:,1]

probs=np.array(probs).reshape(xx.shape) #Tensor可直接转换为numpy数据

plt.scatter(x1,x2,color=np.squeeze(Y_c))

plt.contour(xx,yy,probs,levels=[.5])

plt.show()图1 无正则化图2 L2正则化

5. 优化器

神经网络的优化器一般有一下步骤：

Step 1. 计算时刻t损失函数关于当前参数的梯度

Step 2. 计算时刻t的一阶动量

和二阶动量

Step 3. 计算时刻t的下降梯度

Step 4. 计算时刻t+1的参数

不同的优化方法的主要区别在于Step 2。我们来看看5种常见的优化器和它们的实现方法。SGD

SGD的一阶动力和二阶动量分别为

和

例子：

import tensorflow as tf

import numpy as np

from sklearn import datasets

from matplotlib import pyplot as plt

import time

# 读入数据

x_data=datasets.load_iris().data

y_data=datasets.load_iris().target

# 打乱数据

np.random.seed(116) #使用相同的seed，输出相同的随机数

np.random.shuffle(x_data)

np.random.seed(116)

np.random.shuffle(y_data)

tf.random.set_seed(116) #如果不设置seed，每一次运行结果都不一样

# 划分训练集和测试集

x_train=x_data[:-30]

y_train=y_data[:-30]

x_test=x_data[-30:]

y_test=y_data[-30:]

# 转换x的数据类型，否则后面矩阵相乘时会因数据类型不一致报错

x_train = tf.cast(x_train, tf.float32)

x_test = tf.cast(x_test, tf.float32)

# 数据集配对

train_db=tf.data.Dataset.from_tensor_slices((x_train,y_train)).batch(32)

test_db=tf.data.Dataset.from_tensor_slices((x_test,y_test)).batch(32)

# 生成神经网络的参数，4个输入特征故，输入层为4个输入节点；因为3分类，故输出层为3个神经元

# 用tf.Variable()标记参数可训练

# 使用seed使每次生成的随机数相同(方便教学，使大家结果都一致，在现实使用时不写seed)

w1=tf.Variable(tf.random.truncated_normal([4,3],stddev=0.1,seed=1))

b1=tf.Variable(tf.random.truncated_normal([3],stddev=0.1,seed=1))

# 训练神经网络

lr=0.1

train_loss_results = [] # 将每轮的loss记录在此列表中，为后续画loss曲线提供数据

test_acc = [] # 将每轮的acc记录在此列表中，为后续画acc曲线提供数据

epoch = 500 # 循环500轮

loss_all = 0 # 每轮分4个step，loss_all记录四个step生成的4个loss的和

now_time=time.time()

for epoch in range(epoch):

#训练部分

for step,(x_train,y_train) in enumerate(train_db):

with tf.GradientTape() as tape:

y=tf.linalg.matmul(x_train,w1)+b1

y=tf.nn.softmax(y) # 使输出y符合概率分布

y_=tf.one_hot(y_train,depth=3) # 将标签值转换为独热码格式，方便计算loss和accuracy

loss=tf.math.reduce_mean(tf.math.square(y-y_)) # 采用均方误差损失函数mse = mean(sum(y-out)^2)

loss_all+=loss.numpy() # 将每个step计算出的loss累加，为后续求loss平均值提供数据，这样计算的loss更准确

# 计算loss对各个参数的梯度

grads=tape.gradient(loss,[w1,b1])

# 实现梯度更新 w1 = w1 - lr * w1_grad b = b - lr * b_grad

w1.assign_sub(lr*grads[0])

b1.assign_sub(lr*grads[1])

print("Epoch {},loss:{}".format(epoch,loss_all/4)) # 训练集有120个数据，每个batch有32个数据

train_loss_results.append(loss_all / 4) # 将4个step的loss求平均记录在此变量中

loss_all = 0 # loss_all归零，为记录下一个epoch的loss做准备

# 测试部分

total_correct, total_number = 0, 0

for x_test,y_test in test_db:

# 使用更新后的参数进行预测

y=tf.linalg.matmul(x_test,w1)+b1

y=tf.nn.softmax(y)

pred=tf.math.argmax(y,1) #返回y中最大值的索引，即预测的分类

# 将pred转换为y_test的数据类型

pred=tf.cast(pred,dtype=y_test.dtype)

# 若分类正确，则correct=1，否则为0，将bool型的结果转换为int型

correct=tf.cast(tf.math.equal(pred,y_test),dtype=tf.int32)

# 将每个batch的correct数加起来

correct=tf.math.reduce_sum(correct)

# 将所有batch中的correct数加起来

total_correct+=int(correct)

# total_number为测试的总样本数，也就是x_test的行数，shape[0]返回变量的行数

total_number+=x_test.shape[0]

acc=total_correct/total_number

test_acc.append(acc)

print("Test_acc:", acc)

print("--------------------------")

total_time=time.time()-now_time

print('total time',total_time)

# 绘制 loss 曲线

plt.title('Loss Function Curve') # 图片标题

plt.xlabel('Epoch') # x轴变量名称

plt.ylabel('Loss') # y轴变量名称

plt.plot(train_loss_results, label="$Loss$") # 逐点画出trian_loss_results值并连线，连线图标是Loss

plt.legend() # 画出曲线图标

plt.show() # 画出图像

# 绘制 Accuracy 曲线

plt.title('Acc Curve') # 图片标题

plt.xlabel('Epoch') # x轴变量名称

plt.ylabel('Acc') # y轴变量名称

plt.plot(test_acc, label="$Accuracy$") # 逐点画出test_acc值并连线，连线图标是Accuracy

plt.legend()

plt.show()SGDM(动量梯度下降法)

SGDM的一阶动量和二阶动量分别为：

和

式中，

是一个接近于1的超参数，一般取0.9。

例子：

import tensorflow as tf

import numpy as np

from sklearn import datasets

from matplotlib import pyplot as plt

import time

# 读入数据

x_data=datasets.load_iris().data

y_data=datasets.load_iris().target

# 打乱数据

np.random.seed(116) #使用相同的seed，输出相同的随机数

np.random.shuffle(x_data)

np.random.seed(116)

np.random.shuffle(y_data)

tf.random.set_seed(116) #如果不设置seed，每一次运行结果都不一样

# 划分训练集和测试集

x_train=x_data[:-30]

y_train=y_data[:-30]

x_test=x_data[-30:]

y_test=y_data[-30:]

# 转换x的数据类型，否则后面矩阵相乘时会因数据类型不一致报错

x_train = tf.cast(x_train, tf.float32)

x_test = tf.cast(x_test, tf.float32)

# 数据集配对

train_db=tf.data.Dataset.from_tensor_slices((x_train,y_train)).batch(32)

test_db=tf.data.Dataset.from_tensor_slices((x_test,y_test)).batch(32)

# 生成神经网络的参数，4个输入特征故，输入层为4个输入节点；因为3分类，故输出层为3个神经元

# 用tf.Variable()标记参数可训练

# 使用seed使每次生成的随机数相同(方便教学，使大家结果都一致，在现实使用时不写seed)

w1=tf.Variable(tf.random.truncated_normal([4,3],stddev=0.1,seed=1))

b1=tf.Variable(tf.random.truncated_normal([3],stddev=0.1,seed=1))

# 训练神经网络

lr=0.1

train_loss_results = [] # 将每轮的loss记录在此列表中，为后续画loss曲线提供数据

test_acc = [] # 将每轮的acc记录在此列表中，为后续画acc曲线提供数据

epoch = 500 # 循环500轮

loss_all = 0 # 每轮分4个step，loss_all记录四个step生成的4个loss的和

# 动量初值

m_w=tf.constant(0,shape=[4,3],dtype=tf.float32)

m_b=tf.constant(0,shape=[3],dtype=tf.float32)

beta=0.9

now_time=time.time()

for epoch in range(epoch):

#训练部分

for step,(x_train,y_train) in enumerate(train_db):

with tf.GradientTape() as tape:

y=tf.linalg.matmul(x_train,w1)+b1

y=tf.nn.softmax(y) # 使输出y符合概率分布

y_=tf.one_hot(y_train,depth=3) # 将标签值转换为独热码格式，方便计算loss和accuracy

loss=tf.math.reduce_mean(tf.math.square(y-y_)) # 采用均方误差损失函数mse = mean(sum(y-out)^2)

loss_all+=loss.numpy() # 将每个step计算出的loss累加，为后续求loss平均值提供数据，这样计算的loss更准确

# 计算loss对各个参数的梯度

grads=tape.gradient(loss,[w1,b1])

# sgd-momentum

m_w=beta*m_w+(1-beta)*grads[0]

m_b=beta*m_b+(1-beta)*grads[1]

w1.assign_sub(lr*grads[0])

b1.assign_sub(lr*grads[1])

print("Epoch {},loss:{}".format(epoch,loss_all/4)) # 训练集有120个数据，每个batch有32个数据

train_loss_results.append(loss_all / 4) # 将4个step的loss求平均记录在此变量中

loss_all = 0 # loss_all归零，为记录下一个epoch的loss做准备

# 测试部分

total_correct, total_number = 0, 0

for x_test,y_test in test_db:

# 使用更新后的参数进行预测

y=tf.linalg.matmul(x_test,w1)+b1

y=tf.nn.softmax(y)

pred=tf.math.argmax(y,1) #返回y中最大值的索引，即预测的分类

# 将pred转换为y_test的数据类型

pred=tf.cast(pred,dtype=y_test.dtype)

# 若分类正确，则correct=1，否则为0，将bool型的结果转换为int型

correct=tf.cast(tf.math.equal(pred,y_test),dtype=tf.int32)

# 将每个batch的correct数加起来

correct=tf.math.reduce_sum(correct)

# 将所有batch中的correct数加起来

total_correct+=int(correct)

# total_number为测试的总样本数，也就是x_test的行数，shape[0]返回变量的行数

total_number+=x_test.shape[0]

acc=total_correct/total_number

test_acc.append(acc)

print("Test_acc:", acc)

print("--------------------------")

total_time=time.time()-now_time

print('total time',total_time)

# 绘制 loss 曲线

plt.title('Loss Function Curve') # 图片标题

plt.xlabel('Epoch') # x轴变量名称

plt.ylabel('Loss') # y轴变量名称

plt.plot(train_loss_results, label="$Loss$") # 逐点画出trian_loss_results值并连线，连线图标是Loss

plt.legend() # 画出曲线图标

plt.show() # 画出图像

# 绘制 Accuracy 曲线

plt.title('Acc Curve') # 图片标题

plt.xlabel('Epoch') # x轴变量名称

plt.ylabel('Acc') # y轴变量名称

plt.plot(test_acc, label="$Accuracy$") # 逐点画出test_acc值并连线，连线图标是Accuracy

plt.legend()

plt.show()Adagrad

Adagrad在SGD的基础上分配二阶动量，可以对模型中的每一个参数分配自适应学习率。Adagrad的一阶动量和二阶动量分别为：

和

例子：

import tensorflow as tf

import numpy as np

from sklearn import datasets

from matplotlib import pyplot as plt

import time

# 读入数据

x_data=datasets.load_iris().data

y_data=datasets.load_iris().target

# 打乱数据

np.random.seed(116) #使用相同的seed，输出相同的随机数

np.random.shuffle(x_data)

np.random.seed(116)

np.random.shuffle(y_data)

tf.random.set_seed(116) #如果不设置seed，每一次运行结果都不一样

# 划分训练集和测试集

x_train=x_data[:-30]

y_train=y_data[:-30]

x_test=x_data[-30:]

y_test=y_data[-30:]

# 转换x的数据类型，否则后面矩阵相乘时会因数据类型不一致报错

x_train = tf.cast(x_train, tf.float32)

x_test = tf.cast(x_test, tf.float32)

# 数据集配对

train_db=tf.data.Dataset.from_tensor_slices((x_train,y_train)).batch(32)

test_db=tf.data.Dataset.from_tensor_slices((x_test,y_test)).batch(32)

# 生成神经网络的参数，4个输入特征故，输入层为4个输入节点；因为3分类，故输出层为3个神经元

# 用tf.Variable()标记参数可训练

# 使用seed使每次生成的随机数相同(方便教学，使大家结果都一致，在现实使用时不写seed)

w1=tf.Variable(tf.random.truncated_normal([4,3],stddev=0.1,seed=1))

b1=tf.Variable(tf.random.truncated_normal([3],stddev=0.1,seed=1))

# 训练神经网络

lr=0.1

train_loss_results = [] # 将每轮的loss记录在此列表中，为后续画loss曲线提供数据

test_acc = [] # 将每轮的acc记录在此列表中，为后续画acc曲线提供数据

epoch = 500 # 循环500轮

loss_all = 0 # 每轮分4个step，loss_all记录四个step生成的4个loss的和

# adagrad

v_w=tf.constant(0,shape=[4,3],dtype=tf.float32)

v_b=tf.constant(0,shape=[3],dtype=tf.float32)

now_time=time.time()

for epoch in range(epoch):

#训练部分

for step,(x_train,y_train) in enumerate(train_db):

with tf.GradientTape() as tape:

y=tf.linalg.matmul(x_train,w1)+b1

y=tf.nn.softmax(y) # 使输出y符合概率分布

y_=tf.one_hot(y_train,depth=3) # 将标签值转换为独热码格式，方便计算loss和accuracy

loss=tf.math.reduce_mean(tf.math.square(y-y_)) # 采用均方误差损失函数mse = mean(sum(y-out)^2)

loss_all+=loss.numpy() # 将每个step计算出的loss累加，为后续求loss平均值提供数据，这样计算的loss更准确

# 计算loss对各个参数的梯度

grads=tape.gradient(loss,[w1,b1])

# adagrad

v_w+=tf.math.square(grads[0])

v_b+=tf.math.square(grads[1])

w1.assign_sub(lr*grads[0]/tf.math.sqrt(v_w))

b1.assign_sub(lr*grads[1]/tf.math.sqrt(v_b))

print("Epoch {},loss:{}".format(epoch,loss_all/4)) # 训练集有120个数据，每个batch有32个数据

train_loss_results.append(loss_all / 4) # 将4个step的loss求平均记录在此变量中

loss_all = 0 # loss_all归零，为记录下一个epoch的loss做准备

# 测试部分

total_correct, total_number = 0, 0

for x_test,y_test in test_db:

# 使用更新后的参数进行预测

y=tf.linalg.matmul(x_test,w1)+b1

y=tf.nn.softmax(y)

pred=tf.math.argmax(y,1) #返回y中最大值的索引，即预测的分类

# 将pred转换为y_test的数据类型

pred=tf.cast(pred,dtype=y_test.dtype)

# 若分类正确，则correct=1，否则为0，将bool型的结果转换为int型

correct=tf.cast(tf.math.equal(pred,y_test),dtype=tf.int32)

# 将每个batch的correct数加起来

correct=tf.math.reduce_sum(correct)

# 将所有batch中的correct数加起来

total_correct+=int(correct)

# total_number为测试的总样本数，也就是x_test的行数，shape[0]返回变量的行数

total_number+=x_test.shape[0]

acc=total_correct/total_number

test_acc.append(acc)

print("Test_acc:", acc)

print("--------------------------")

total_time=time.time()-now_time

print('total time',total_time)

# 绘制 loss 曲线

plt.title('Loss Function Curve') # 图片标题

plt.xlabel('Epoch') # x轴变量名称

plt.ylabel('Loss') # y轴变量名称

plt.plot(train_loss_results, label="$Loss$") # 逐点画出trian_loss_results值并连线，连线图标是Loss

plt.legend() # 画出曲线图标

plt.show() # 画出图像

# 绘制 Accuracy 曲线

plt.title('Acc Curve') # 图片标题

plt.xlabel('Epoch') # x轴变量名称

plt.ylabel('Acc') # y轴变量名称

plt.plot(test_acc, label="$Accuracy$") # 逐点画出test_acc值并连线，连线图标是Accuracy

plt.legend()

plt.show()RMSProp

它是在SGD基础上增加二阶动量。RMSProp的一阶动量和二阶动量分别为：

和

例子：

import tensorflow as tf

import numpy as np

from sklearn import datasets

from matplotlib import pyplot as plt

import time

# 读入数据

x_data=datasets.load_iris().data

y_data=datasets.load_iris().target

# 打乱数据

np.random.seed(116) #使用相同的seed，输出相同的随机数

np.random.shuffle(x_data)

np.random.seed(116)

np.random.shuffle(y_data)

tf.random.set_seed(116) #如果不设置seed，每一次运行结果都不一样

# 划分训练集和测试集

x_train=x_data[:-30]

y_train=y_data[:-30]

x_test=x_data[-30:]

y_test=y_data[-30:]

# 转换x的数据类型，否则后面矩阵相乘时会因数据类型不一致报错

x_train = tf.cast(x_train, tf.float32)

x_test = tf.cast(x_test, tf.float32)

# 数据集配对

train_db=tf.data.Dataset.from_tensor_slices((x_train,y_train)).batch(32)

test_db=tf.data.Dataset.from_tensor_slices((x_test,y_test)).batch(32)

# 生成神经网络的参数，4个输入特征故，输入层为4个输入节点；因为3分类，故输出层为3个神经元

# 用tf.Variable()标记参数可训练

# 使用seed使每次生成的随机数相同(方便教学，使大家结果都一致，在现实使用时不写seed)

w1=tf.Variable(tf.random.truncated_normal([4,3],stddev=0.1,seed=1))

b1=tf.Variable(tf.random.truncated_normal([3],stddev=0.1,seed=1))

# 训练神经网络

lr=0.001

train_loss_results = [] # 将每轮的loss记录在此列表中，为后续画loss曲线提供数据

test_acc = [] # 将每轮的acc记录在此列表中，为后续画acc曲线提供数据

epoch = 500 # 循环500轮

loss_all = 0 # 每轮分4个step，loss_all记录四个step生成的4个loss的和

# adagrad

v_w=tf.constant(0,shape=[4,3],dtype=tf.float32)

v_b=tf.constant(0,shape=[3],dtype=tf.float32)

beta=0.9

now_time=time.time()

for epoch in range(epoch):

#训练部分

for step,(x_train,y_train) in enumerate(train_db):

with tf.GradientTape() as tape:

y=tf.linalg.matmul(x_train,w1)+b1

y=tf.nn.softmax(y) # 使输出y符合概率分布

y_=tf.one_hot(y_train,depth=3) # 将标签值转换为独热码格式，方便计算loss和accuracy

loss=tf.math.reduce_mean(tf.math.square(y-y_)) # 采用均方误差损失函数mse = mean(sum(y-out)^2)

loss_all+=loss.numpy() # 将每个step计算出的loss累加，为后续求loss平均值提供数据，这样计算的loss更准确

# 计算loss对各个参数的梯度

grads=tape.gradient(loss,[w1,b1])

# rmsprop

v_w=beta*v_w+(1-beta)*tf.math.square(grads[0])

v_b=beta*v_b+(1-beta)*tf.math.square(grads[1])

w1.assign_sub(lr*grads[0]/tf.math.sqrt(v_w))

b1.assign_sub(lr*grads[1]/tf.math.sqrt(v_b))

print("Epoch {},loss:{}".format(epoch,loss_all/4)) # 训练集有120个数据，每个batch有32个数据

train_loss_results.append(loss_all / 4) # 将4个step的loss求平均记录在此变量中

loss_all = 0 # loss_all归零，为记录下一个epoch的loss做准备

# 测试部分

total_correct, total_number = 0, 0

for x_test,y_test in test_db:

# 使用更新后的参数进行预测

y=tf.linalg.matmul(x_test,w1)+b1

y=tf.nn.softmax(y)

pred=tf.math.argmax(y,1) #返回y中最大值的索引，即预测的分类

# 将pred转换为y_test的数据类型

pred=tf.cast(pred,dtype=y_test.dtype)

# 若分类正确，则correct=1，否则为0，将bool型的结果转换为int型

correct=tf.cast(tf.math.equal(pred,y_test),dtype=tf.int32)

# 将每个batch的correct数加起来

correct=tf.math.reduce_sum(correct)

# 将所有batch中的correct数加起来

total_correct+=int(correct)

# total_number为测试的总样本数，也就是x_test的行数，shape[0]返回变量的行数

total_number+=x_test.shape[0]

acc=total_correct/total_number

test_acc.append(acc)

print("Test_acc:", acc)

print("--------------------------")

total_time=time.time()-now_time

print('total time',total_time)

# 绘制 loss 曲线

plt.title('Loss Function Curve') # 图片标题

plt.xlabel('Epoch') # x轴变量名称

plt.ylabel('Loss') # y轴变量名称

plt.plot(train_loss_results, label="$Loss$") # 逐点画出trian_loss_results值并连线，连线图标是Loss

plt.legend() # 画出曲线图标

plt.show() # 画出图像

# 绘制 Accuracy 曲线

plt.title('Acc Curve') # 图片标题

plt.xlabel('Epoch') # x轴变量名称

plt.ylabel('Acc') # y轴变量名称

plt.plot(test_acc, label="$Accuracy$") # 逐点画出test_acc值并连线，连线图标是Accuracy

plt.legend()

plt.show()Adam

同时结合了SGDM的一阶动量和RMSProp的二阶动量，即

和

，并在此基础上增加了两个修正项：

例子：

import tensorflow as tf

import numpy as np

from sklearn import datasets

from matplotlib import pyplot as plt

import time

# 读入数据

x_data=datasets.load_iris().data

y_data=datasets.load_iris().target

# 打乱数据

np.random.seed(116) #使用相同的seed，输出相同的随机数

np.random.shuffle(x_data)

np.random.seed(116)

np.random.shuffle(y_data)

tf.random.set_seed(116) #如果不设置seed，每一次运行结果都不一样

# 划分训练集和测试集

x_train=x_data[:-30]

y_train=y_data[:-30]

x_test=x_data[-30:]

y_test=y_data[-30:]

# 转换x的数据类型，否则后面矩阵相乘时会因数据类型不一致报错

x_train = tf.cast(x_train, tf.float32)

x_test = tf.cast(x_test, tf.float32)

# 数据集配对

train_db=tf.data.Dataset.from_tensor_slices((x_train,y_train)).batch(32)

test_db=tf.data.Dataset.from_tensor_slices((x_test,y_test)).batch(32)

# 生成神经网络的参数，4个输入特征故，输入层为4个输入节点；因为3分类，故输出层为3个神经元

# 用tf.Variable()标记参数可训练

# 使用seed使每次生成的随机数相同(方便教学，使大家结果都一致，在现实使用时不写seed)

w1=tf.Variable(tf.random.truncated_normal([4,3],stddev=0.1,seed=1))

b1=tf.Variable(tf.random.truncated_normal([3],stddev=0.1,seed=1))

# 训练神经网络

lr=0.1

train_loss_results = [] # 将每轮的loss记录在此列表中，为后续画loss曲线提供数据

test_acc = [] # 将每轮的acc记录在此列表中，为后续画acc曲线提供数据

epoch = 500 # 循环500轮

loss_all = 0 # 每轮分4个step，loss_all记录四个step生成的4个loss的和

# adam

m_w=tf.constant(0,shape=[4,3],dtype=tf.float32)

m_b=tf.constant(0,shape=[3],dtype=tf.float32)

v_w=tf.constant(0,shape=[4,3],dtype=tf.float32)

v_b=tf.constant(0,shape=[3],dtype=tf.float32)

beta1=0.9

beta2=0.999

global_step=0

now_time=time.time()

for epoch in range(epoch):

#训练部分

for step,(x_train,y_train) in enumerate(train_db):

global_step+=1

with tf.GradientTape() as tape:

y=tf.linalg.matmul(x_train,w1)+b1

y=tf.nn.softmax(y) # 使输出y符合概率分布

y_=tf.one_hot(y_train,depth=3) # 将标签值转换为独热码格式，方便计算loss和accuracy

loss=tf.math.reduce_mean(tf.math.square(y-y_)) # 采用均方误差损失函数mse = mean(sum(y-out)^2)

loss_all+=loss.numpy() # 将每个step计算出的loss累加，为后续求loss平均值提供数据，这样计算的loss更准确

# 计算loss对各个参数的梯度

grads=tape.gradient(loss,[w1,b1])

# adam

m_w = beta1 * m_w + (1-beta1) * grads[0]

m_b = beta1 * m_b + (1 - beta1) * grads[1]

v_w=beta2*v_w+(1-beta2)*tf.math.square(grads[0])

v_b=beta2*v_b+(1-beta2)*tf.math.square(grads[1])

m_w_correction=m_w/(1-tf.pow(beta1,global_step))

m_b_correction=m_b/(1-tf.pow(beta1,global_step))

v_w_correction=v_w/(1-tf.pow(beta2,global_step))

v_b_correction=v_b/(1-tf.pow(beta2,global_step))

w1.assign_sub(lr*m_w_correction/tf.math.sqrt(v_w_correction))

b1.assign_sub(lr*m_b_correction/tf.math.sqrt(v_b_correction))

print("Epoch {},loss:{}".format(epoch,loss_all/4)) # 训练集有120个数据，每个batch有32个数据

train_loss_results.append(loss_all / 4) # 将4个step的loss求平均记录在此变量中

loss_all = 0 # loss_all归零，为记录下一个epoch的loss做准备

# 测试部分

total_correct, total_number = 0, 0

for x_test,y_test in test_db:

# 使用更新后的参数进行预测

y=tf.linalg.matmul(x_test,w1)+b1

y=tf.nn.softmax(y)

pred=tf.math.argmax(y,1) #返回y中最大值的索引，即预测的分类

# 将pred转换为y_test的数据类型

pred=tf.cast(pred,dtype=y_test.dtype)

# 若分类正确，则correct=1，否则为0，将bool型的结果转换为int型

correct=tf.cast(tf.math.equal(pred,y_test),dtype=tf.int32)

# 将每个batch的correct数加起来

correct=tf.math.reduce_sum(correct)

# 将所有batch中的correct数加起来

total_correct+=int(correct)

# total_number为测试的总样本数，也就是x_test的行数，shape[0]返回变量的行数

total_number+=x_test.shape[0]

acc=total_correct/total_number

test_acc.append(acc)

print("Test_acc:", acc)

print("--------------------------")

total_time=time.time()-now_time

print('total time',total_time)

# 绘制 loss 曲线

plt.title('Loss Function Curve') # 图片标题

plt.xlabel('Epoch') # x轴变量名称

plt.ylabel('Loss') # y轴变量名称

plt.plot(train_loss_results, label="$Loss$") # 逐点画出trian_loss_results值并连线，连线图标是Loss

plt.legend() # 画出曲线图标

plt.show() # 画出图像

# 绘制 Accuracy 曲线

plt.title('Acc Curve') # 图片标题

plt.xlabel('Epoch') # x轴变量名称

plt.ylabel('Acc') # y轴变量名称

plt.plot(test_acc, label="$Accuracy$") # 逐点画出test_acc值并连线，连线图标是Accuracy

plt.legend()

plt.show()

你可能感兴趣的:(tf,损失函数)

云原生--微服务、CICD、SaaS、PaaS、IaaS 青秋. 云原生 docker 云原生微服务 kubernetes serverless service_mesh ci/cd
往期推荐浅学React和JSX-CSDN博客一文搞懂大数据流式计算引擎Flink【万字详解，史上最全】-CSDN博客一文入门大数据准流式计算引擎Spark【万字详解，全网最新】_大数据spark-CSDN博客目录1.云原生概念和特点2.常见云模式3.云对外提供服务的架构模式3.1IaaS（Infrastructure-as-a-Service）3.2PaaS（Platform-as-a-Servi
okhttp3对Android5.0以下版本不兼容问题 m0_37735448 Android
okhttp3对Android5.0以下版本不兼容问题问题描述Android5.0以下版本在使用okhttp3发送请求的时候会报如下错误ExceptionLjava/lang/IllegalStateException;thrownwhileinitializingLokhttp3/internal/platform/Platform;原因调查这是因为okhttp3支持的最低Android版本为5
TCP backlog工作机制 riverz1227 tcp/ip 网络服务器
Linux中的TCPbacklog：两个队列与丢连接的真相在高并发网络服务场景中，listen()的backlog参数常常被误解，许多TCP连接被悄悄丢弃时，我们甚至毫无察觉。近期在排查一条内核日志TCP:dropopenrequestfrom...时，对此翻阅整理了一些资料,就TCPbacklog在Linux中的工作原理、背后的两个关键队列机制，以及如何高效排查相关连接丢失问题,做些记录01｜什
Ubuntu 20.04 搭建gitlab
更新apt源sudoaptupdate安装依赖项#PostfixConfiguration选择Noconfiguration就好sudoapt-getinstallcurlopenssh-serverca-certificatespostfix下载gitlab-ce软件包sudowgethttps://mirrors.tuna.tsinghua.edu.cn/gitlab-ce/ubuntu/po
ubuntu安装搜狗输入法后闪烁 wuzuyu365 ubuntu
在/etc/profile里面添加一行exportQT_QPA_PLATFORM=xcb就好了，重启正常使用。
二进制部署Kubernetes1.32.4最新版本高可用集群及附加组件 Nova_CaoFc 容器云技术专栏 kubernetes 容器云原生
一、前言在云原生技术席卷全球的今天，Kubernetes（K8s）已成为容器编排领域的事实标准。当大家都习惯了kubeadm、kubeasz等自动化工具一键部署的便利时，选择通过二进制方式手动搭建K8s集群更像是一场"知其然亦知其所以然"的深度修行。这种方式将带您穿透抽象层，直面etcd的分布式存储机制、kube-apiserver的RESTful接口设计、kubelet与CRI的交互细节，以及各
Java手动打印执行过的sql GoodStudyAndDayDayUp java sql 开发语言
1.拦截器packagecom.xxx.platform.common.interceptor;importcom.baomidou.dynamic.datasource.toolkit.DynamicDataSourceContextHolder;importcom.xxx.platform.common.aop.OLAPQuery;importcom.xxx.platform.constant
Python Set() 完全指南：从入门到精通 2501_91537435 python python 开发语言
PythonSet()完全指南：从入门到精通Set（集合）是Python中一种非常有用的内置数据类型，它提供了高效的成员检测和消除重复元素的功能。本文将带你全面了解Python中的set()，从基础概念到高级用法。一、什么是Set？Set是Python中的一种无序、可变、不重复元素的集合数据类型。它类似于数学中的集合概念，支持并集、交集、差集等操作。#创建一个setfruits={'apple',
直线插补动画引擎：从数学原理到C#实现——用代码绘制动态几何艺术墨夶 C#学习资料 c#算法开发语言
一、直线插补核心算法解析1.1DDA算法数学原理//////DDA算法实现直线插补///publicclassLineInterpolator{privatePointF_currentPoint;privatePointF_endPoint;privatefloat_stepSize;privatefloat_dx,_dy;privatefloat_xIncrement,_yIncrement;
MySQL8数据库高级特性 KellenKellenHao oracle 数据库 sql
创建测试表 createdatabasejxcharactersetutf8; usejx; my>descusers; +----------+-------------+------+-----+---------+----------------+ |Field |Type |Null|Key|Default|Extra | +----------+-------------+--
WinUI3入门16：Order自定义排序
初级代码游戏的专栏介绍与文章目录-CSDN博客我的github：codetoys，所有代码都将会位于ctfc库中。已经放入库中我会指出在库中的位置。这些代码大部分以Linux为目标但部分代码是纯C++的，可以在任何平台上使用。源码指引：github源码指引_初级代码游戏的博客-CSDN博客C#是我多年以来的业余爱好，新搞的东西能用C#的就用C#了。接上一篇继续研究排序问题。上一篇：WinUI3入门
DRF视图类选择与使用八九燕来 python django restful
在DjangoRESTFramework(DRF)中，视图（Views）扮演着协调请求、序列化器和模型之间交互的核心角色。它决定了如何处理请求（如数据校验、权限控制、业务逻辑），如何将数据传递给序列化器，以及如何将处理结果返回给客户端。以下是一个清晰的分类和选择指南：一、视图的核心作用处理HTTP请求解析请求数据（如GET,POST,PUT,DELETE），验证请求合法性。协调序列化器和模型调用序
巧用 #define与 #ifdef，实现灵活数值比较一粒沙白兔 C语言刷题记录算法 c语言
题目描述#if#ifdef和#ifndef的综合应用。源代码#include#defineMAX#defineMAXIMUM(x,y)(x>y)?x:y#defineMINIMUM(x,y)(x>y)?y:xintmain(){inta=10,b=20;#ifdefMAXprintf("更大的数字是%d\n",MAXIMUM(a,b));#elseprintf("更小的数字是%d\n",MINIM
DeepSeek API 完整调用指南：从基础到高级应用实战独立开发者阿乐原创 Deepseek api API调用 api接口核心能力模型 DeepSeek API
文章目录DeepSeekAPI调用全流程详解：从入门到生产级实践1.DeepSeekAPI概述1.1DeepSeekAPI核心能力1.2API版本与计费2.API调用准备工作2.1注册与认证2.2环境准备2.3API密钥管理3.基础API调用实现3.1RESTfulAPI调用3.2流式响应处理4.高级API使用技巧4.1多轮对话管理4.2文件上传与处理5.生产环境最佳实践5.1错误处理与重试机制5
低代码平台的优势与挑战：现代开发的革新之路 BPM_宏天低代码低代码
在数字化转型的浪潮中，低代码平台（Low-CodePlatforms）成为了开发者和企业的重要工具。低代码平台通过可视化界面和拖拽式功能，简化了应用程序的开发过程，使得即使是没有编程背景的用户也能够构建功能丰富的应用。然而，低代码平台的兴起不仅带来了巨大的便利，也伴随着一系列挑战。本文将探讨低代码平台的优势与挑战，帮助开发者和企业更好地理解并利用这一技术。1.低代码平台的优势1.1提高开发效率低代
低代码平台的性能测试实践与挑战测试者家园智能化测试性能测试人工智能低代码智能化测试人工智能性能测试软件开发和测试工程策略软件测试
一、引言近年来，低代码平台（Low-CodePlatform）正在快速改变企业软件开发方式。Gartner预测，到2025年，超过70%的应用开发将基于低代码或无代码技术。通过“拖拉拽建模+图形化逻辑+一键发布”，企业大幅缩短了从需求到交付的周期，实现了真正的“业务人员可编程”。但与此同时，一个被忽视的问题悄然浮现：低代码虽“低门槛”，但不等于“低复杂性”；表面简洁的背后，隐藏着深不可测的运行时系
【AI大模型】神经网络反向传播：核心原理与完整实现我爱一条柴ya 学习AI记录人工智能神经网络深度学习 ai AI编程
一、反向传播的本质与意义反向传播（Backpropagation）是神经网络训练的核心算法，通过链式法则高效计算损失函数对网络参数的梯度，实现神经网络的优化学习。它的出现解决了神经网络训练中的关键瓶颈，使深度学习成为可能。为什么需要反向传播？参数规模爆炸：现代神经网络有数百万至数十亿参数手动计算不可行：复杂网络梯度计算量指数级增长高效优化需求：梯度下降算法需要精确的梯度计算二、前向传播与反向传播对
Ubuntu 20.04安装FlClash 墨玦子 ubuntu linux 运维
1、下载好安装包使用sudodpkg-ixxx.deb安装好flclash2、终端输入FlClash，会遇到如下的问题，并附上解决方法（1）FlClash:errorwhileloadingsharedlibraries:libkeybinder-3.0.so.0:cannotopensharedobjectfile:Nosuchfileordirectory解决方法：sudoapt-getins
C++菱形虚无-缥缈笔记 C++
搞了半天终于弄好了，《万能菱形》(ಡωಡ)话不多说，直接上代码：#includeintmain(){printf("请随意输入一个奇数(如果是偶数将自动减一！)：\n");inti,t,k;//i代表循环中的行数，t代表空格数，k代表菱形总行数。scanf("%d",&k);getchar();for(i=1;i=0;t--)//先输出空格；找到空格数与行数的关系。printf("");for(t
Spring Data REST极速构建REST API 代码的余温 spring java 后端 spring boot
SpringDataREST是SpringData项目家族中的一个子项目，它构建在SpringDataRepositories（如SpringDataJPA、SpringDataMongoDB等）之上，旨在自动将你的数据模型（实体）和SpringDataRepository暴露为超媒体驱动的RESTfulWeb服务。它的核心目标是极大简化构建围绕数据的RESTAPI的过程。核心思想：约定优于配置：
c语言中的数组I xtmatao C语言编程 c语言
初试数组程序示例：计算用户输入的一串数字的平均数（以-1作为输入结束标志），并输出所有大于平均数的数字#includeintmain(){intx;doublesum=0;intcnt=0;intnumber[100];printf("请输入要计算平均数的数字：\n");scanf("%d",&x);while(x!=-1){number[cnt]=x;sum+=x;cnt++;scanf("%d
python读取pdf文档 reblue520
python读取txt#coding=utf-8importrequests#爬虫规则url="https://en.wikipedia.org/robots.txt"#读取网络资源res=requests.get(url).text#打印print(res)读取pdf#coding=utf-8frompdfminer.pdfparserimportPDFParser,PDFDocumentfro
云计算技术基础第2章云计算的架构及国内外标准化情况（2）学习记录wanxiaowan 数据库云计算概论计算机网络
分布式管理任务组（DMTF）是一个国际标准组织，DMTF工作组致力于分布式IT系统的有效管理，通过聚合众多IT厂商一起来进行管理系统的开发、效用及改进等标准化工作…OGF(开放网格论坛)全球网络存储工业协会（StorageNetworkingIndustryAssociation，SNIA）是成立时间比较早的存储厂家中立的行业协会组织，宗旨是领导全世界范围的存储行业开发…加拿大标准协会（Canad
Tika（文本提取）代码的代文件文本识别提取 java maven
ApacheTika是一个用于提取文本和元数据的开源Java库。它支持提取各种类型的文本，包括但不限于以下几种：文档文件：如PDF、MicrosoftWord、MicrosoftExcel、MicrosoftPowerPoint、OpenDocument、RTF、HTML、XML等。（亲测可以）归档文件：如ZIP、RAR、TAR、GZIP、7z等。（不成功）音频文件：如MP3、WAV、AAC、FL
BUUCTF在线评测-练习场-WebCTF习题[网鼎杯 2020 青龙组]AreUSerialz1-flag获取、解析码农12138号 BUUCTF 网络安全 web安全 CTF 反序列化漏洞
解题思路打开靶场，贴有源码process();}publicfunctionprocess(){if($this->op=="1"){$this->write();}elseif($this->op=="2"){$res=$this->read();$this->output($res);}else{$this->output("BadHacker!");}}privatefunctionwrit
【PyTorch】PyTorch中torch.nn模块的卷积层
PyTorch深度学习总结第七章PyTorch中torch.nn模块的卷积层文章目录PyTorch深度学习总结前言一、torch.nn模块1.模块的基本组成部分1.1层（Layers）1.2损失函数（LossFunctions）1.3激活函数（ActivationFunctions）2.自定义神经网络模型3.模块的优势二、torch.nn模块的卷积层1.卷积的定义2.常见的卷积层3.卷积层的重要参
技术日报开源项目
项目介绍：项目分为资讯和图片和关于三大类，资讯分为github、hacker、SegmentFault、jobBole、技术头条、Android、ios、和all，图片是美女福利图片、并提供下载。项目已在应用宝上线：地址http://android.myapp.com/myapp/detail.htm?apkName=com.infomation.haiffeng项目用到的技术框架1：采用okht
[QMT量化交易小白入门]-六十九、ETF动量评分策略，历史年化收益率107% python自动化工具量化交易小白入门数据库 java 缓存
本专栏主要是介绍QMT的基础用法，常见函数，写策略的方法，也会分享一些量化交易的思路，大概会写100篇左右。QMT的相关资料较少，在使用过程中不断的摸索，遇到了一些问题，记录下来和大家一起沟通，共同进步。文章目录相关阅读1.定时任务函数`mutorun`的解析1.1获取当前K线日期1.2跳过非回测或非最后一根K线的情况1.3开始任务日志记录1.4获取市场数据1.5检查市场数据有效性1.6计算ETF
今日Github热门仓库推荐2025-07-08
今日Github热门仓库推荐2025-07-08如果让AI分别扮演后端开发人员和前端开发人员，然后看看他们分别对github每天的trending仓库感兴趣的有哪些，并且给出他感兴趣的理由，那会发生什么呢？本内容通过Python+AI生成，项目地址跳转后端开发人员推荐仓库名称：rustfs/rustfs仓库推荐理由：作为一个有10年后端开发经验的工程师，我对高性能和分布式系统有浓厚的兴趣。Rust
Python破解东方财富反爬机制：热榜数据获取小白学大数据 python 开发语言
一、了解东方财富热榜数据东方财富热榜数据包括人气榜、飙升榜等多种类型，涵盖了A股市场、ETF基金、港股市场和美股市场等。这些数据通常每5分钟自动更新一次，能够动态展示最新的市场走势。热榜数据可以帮助投资者了解市场的热点和投资者的情绪倾向。二、反爬机制分析东方财富网的反爬机制主要包括以下几种：限制访问频率：频繁的请求可能会被识别为爬虫行为，导致IP被封禁。动态加载内容：部分数据通过JavaScrip
ASM系列六利用TreeApi 添加和移除类成员 lijingyao8206 jvm 动态代理 ASM 字节码技术 TreeAPI
同生成的做法一样，添加和移除类成员只要去修改fields和methods中的元素即可。这里我们拿一个简单的类做例子，下面这个Task类，我们来移除isNeedRemove方法，并且添加一个int 类型的addedField属性。 package asm.core; /** * Created by yunshen.ljy on 2015/6/
Springmvc-权限设计 bee1314 spring Web jsp
万丈高楼平地起。权限管理对于管理系统而言已经是标配中的标配了吧，对于我等俗人更是不能免俗。同时就目前的项目状况而言，我们还不需要那么高大上的开源的解决方案，如Spring Security，Shiro。小伙伴一致决定我们还是从基本的功能迭代起来吧。目标： 1.实现权限的管理（CRUD） 2.实现部门管理（CRUD) 3.实现人员的管理（CRUD） 4.实现部门和权限
算法竞赛入门经典（第二版）第2章习题 CrazyMizzz c 算法
2.4.1 输出技巧 #include <stdio.h> int main() { int i, n; scanf("%d", &n); for (i = 1; i <= n; i++) printf("%d\n", i); return 0; } 习题2-2 水仙花数(daffodil
struts2中jsp自动跳转到Action 麦田的设计者 jsp webxml struts2 自动跳转
1、在struts2的开发中，经常需要用户点击网页后就直接跳转到一个Action，执行Action里面的方法，利用mvc分层思想执行相应操作在界面上得到动态数据。毕竟用户不可能在地址栏里输入一个Action（不是专业人士） 2、＜jsp:forward page="xxx.action" /＞，这个标签可以实现跳转，page的路径是相对地址,不同与jsp和j
php 操作webservice实例 IT独行者 PHP webservice
首先大家要简单了解了何谓webservice，接下来就做两个非常简单的例子，webservice还是逃不开server端与client端。我测试的环境为：apache2.2.11 php5.2.10做这个测试之前，要确认你的php配置文件中已经将soap扩展打开，即extension=php_soap.dll; OK 现在我们来体验webservice //server端 serve
Windows下使用Vagrant安装linux系统 _wy_ windows vagrant
准备工作：下载安装 VirtualBox ：https://www.virtualbox.org/ 下载安装 Vagrant ：http://www.vagrantup.com/ 下载需要使用的 box ：官方提供的范例：http://files.vagrantup.com/precise32.box 还可以在 http://www.vagrantbox.es/
更改linux的文件拥有者及用户组(chown和chgrp) 无量 c linux chgrp chown
本文（转） http://blog.163.com/yanenshun@126/blog/static/128388169201203011157308/ http://ydlmlh.iteye.com/blog/1435157 一、基本使用：使用chown命令可以修改文件或目录所属的用户：命令
linux下抓包工具矮蛋蛋 linux
原文地址： http://blog.chinaunix.net/uid-23670869-id-2610683.html tcpdump -nn -vv -X udp port 8888 上面命令是抓取udp包、端口为8888 netstat -tln 命令是用来查看linux的端口使用情况 13 . 列出所有的网络连接 lsof -i 14. 列出所有tcp 网络连接信息 l
我觉得mybatis是垃圾！：“每一个用mybatis的男纸，你伤不起” alafqq mybatis
最近看了每一个用mybatis的男纸，你伤不起原文地址：http://www.iteye.com/topic/1073938 发表一下个人看法。欢迎大神拍砖；个人一直使用的是Ibatis框架，公司对其进行过小小的改良；最近换了公司，要使用新的框架。听说mybatis不错；就对其进行了部分的研究；发现多了一个mapper层；个人感觉就是个dao；
解决java数据交换之谜百合不是茶数据交换
交换两个数字的方法有以下三种，其中第一种最常用 /* 输出最小的一个数 */ public class jiaohuan1 { public static void main(String[] args) { int a =4; int b = 3; if(a<b){ // 第一种交换方式 int tmep =
渐变显示 bijian1013 JavaScript
<style type="text/css"> #wxf { FILTER: progid:DXImageTransform.Microsoft.Gradient(GradientType=0, StartColorStr=#ffffff, EndColorStr=#97FF98); height: 25px; } </style>
探索JUnit4扩展：断言语法assertThat bijian1013 java 单元测试 assertThat
一.概述 JUnit 设计的目的就是有效地抓住编程人员写代码的意图，然后快速检查他们的代码是否与他们的意图相匹配。 JUnit 发展至今，版本不停的翻新，但是所有版本都一致致力于解决一个问题，那就是如何发现编程人员的代码意图，并且如何使得编程人员更加容易地表达他们的代码意图。JUnit 4.4 也是为了如何能够
【Gson三】Gson解析{"data":{"IM":["MSN","QQ","Gtalk"]}} bit1129 gson
如何把如下简单的JSON字符串反序列化为Java的POJO对象? {"data":{"IM":["MSN","QQ","Gtalk"]}} 下面的POJO类Model无法完成正确的解析： import com.google.gson.Gson;
【Kafka九】Kafka High Level API vs. Low Level API bit1129 kafka
1. Kafka提供了两种Consumer API High Level Consumer API Low Level Consumer API(Kafka诡异的称之为Simple Consumer API，实际上非常复杂) 在选用哪种Consumer API时，首先要弄清楚这两种API的工作原理，能做什么不能做什么，能做的话怎么做的以及用的时候，有哪些可能的问题
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-归并排序 bylijinnan java
import java.util.Arrays; public class MergeSort { public static void main(String[] args) { int[] a={20,1,3,8,5,9,4,25}; mergeSort(a,0,a.length-1); System.out.println(Arrays.to
Netty源码学习-CompositeChannelBuffer bylijinnan java netty
CompositeChannelBuffer体现了Netty的“Transparent Zero Copy” 查看API（ http://docs.jboss.org/netty/3.2/api/org/jboss/netty/buffer/package-summary.html#package_description）可以看到，所谓“Transparent Zero Copy”是通
Android中给Activity添加返回键 hotsunshine Activity
// this need android:minSdkVersion="11" getActionBar().setDisplayHomeAsUpEnabled(true); @Override public boolean onOptionsItemSelected(MenuItem item) {
静态页面传参 ctrain 静态
$(document).ready(function () { var request = { QueryString : function (val) { var uri = window.location.search; var re = new RegExp("" + val + "=([^&?]*)", &
Windows中查找某个目录下的所有文件中包含某个字符串的命令 daizj windows 查找某个目录下的所有文件包含某个字符串
findstr可以完成这个工作。 [html] view plain copy >findstr /s /i "string" *.* 上面的命令表示，当前目录以及当前目录的所有子目录下的所有文件中查找"string&qu
改善程序代码质量的一些技巧 dcj3sjt126com 编程 PHP 重构
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短尽管很多人都遵
SharedPreferences对数据的存储 dcj3sjt126com
SharedPreferences简介： &nbs
linux复习笔记之bash shell (2) bash基础 eksliang bash bash shell
转载请出自出处： http://eksliang.iteye.com/blog/2104329 1.影响显示结果的语系变量（locale） 1.1locale这个命令就是查看当前系统支持多少种语系，命令使用如下： [root@localhost shell]# locale LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8"
Android零碎知识总结 gqdy365 android
1、CopyOnWriteArrayList add(E) 和remove(int index)都是对新的数组进行修改和新增。所以在多线程操作时不会出现java.util.ConcurrentModificationException错误。所以最后得出结论：CopyOnWriteArrayList适合使用在读操作远远大于写操作的场景里，比如缓存。发生修改时候做copy，新老版本分离，保证读的高
HoverTree.Model.ArticleSelect类的作用 hvt Web .net C#hovertree asp.net
ArticleSelect类在命名空间HoverTree.Model中可以认为是文章查询条件类，用于存放查询文章时的条件，例如HvtId就是文章的id。HvtIsShow就是文章的显示属性，当为-1是，该条件不产生作用，当为0时，查询不公开显示的文章，当为1时查询公开显示的文章。HvtIsHome则为是否在首页显示。HoverTree系统源码完全开放，开发环境为Visual Studio 2013
PHP 判断是否使用代理 PHP Proxy Detector 天梯梦 proxy
1. php 类 I found this class looking for something else actually but I remembered I needed some while ago something similar and I never found one. I'm sure it will help a lot of developers who try to
apache的math库中的回归——regression（翻译） lvdccyb Math apache
这个Math库，虽然不向weka那样专业的ML库，但是用户友好，易用。多元线性回归，协方差和相关性（皮尔逊和斯皮尔曼），分布测试（假设检验，t，卡方，G），统计。数学库中还包含，Cholesky，LU，SVD，QR，特征根分解，真不错。基本覆盖了：线代，统计，矩阵，最优化理论曲线拟合常微分方程遗传算法（GA），还有3维的运算。。。
基础数据结构和算法十三：Undirected Graphs (2) sunwinner Algorithm
Design pattern for graph processing. Since we consider a large number of graph-processing algorithms, our initial design goal is to decouple our implementations from the graph representation
云计算平台最重要的五项技术 sumapp 云计算云平台智城云
云计算平台最重要的五项技术 1、云服务器云服务器提供简单高效，处理能力可弹性伸缩的计算服务，支持国内领先的云计算技术和大规模分布存储技术，使您的系统更稳定、数据更安全、传输更快速、部署更灵活。特性机型丰富通过高性能服务器虚拟化为云服务器，提供丰富配置类型虚拟机，极大简化数据存储、数据库搭建、web服务器搭建等工作；仅需要几分钟，根据CP
《京东技术解密》有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的12月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 12月试读活动回顾： http://webmaster.iteye.com/blog/2164754 本次技术图书试读活动获奖名单及相应作品如下：一等奖（两名） Microhardest：http://microhardest.ite