Joey9898

tf2 + keras学习

静动态图

搭建静态图

Tensorflow1.x主要都是搭建的静态图，需要手动创建一个图然后在session里执行

图结构就相当于先定义好所有的 数据节点 （op，用以存储所有的中间以及最后的结果tensor）以及 计算节点（算子），然后在创建好图后在session中利用图中的数据节点以及计算节点执行计算逻辑。

只有定义好一个完整的网络结构（Graph），才能开始执行整个图（创建session中执行），且在运行过程中不能对图进行修改（比如添加网络结点、删除结点等操作）。整个过程和C语言编译很像，一旦构图完成，在执行训练的过程无法对网络结构进行改变。

import tensorflow as tf
import numpy as np

# 获得默认图，如果不用with语句显式指定所归属的计算图，
# 则所有的tensor和Operation都是在默认计算图中定义的，
# 使用tf.get_default_graph()函数可以获取当前默认的计算图，
g=tf.get_default_graph()

x = tf.constant([1,2,3],dtype = tf.float32)
result=tf.matmul(x,x)

print(result)
# 不用sess.run只能得到meta信息

# 在graph=g上创建session声明利用graph中的节点执行运算
with tf.Session(graph=g) as sess:
 print(sess.run(result))

# 方式二(更常用)：如果没有tf.Session(graph=g)也可以，因为默认下面创建的所有图节点都在default_graph中
x = tf.constant([1,2,3],dtype = tf.float32)
# x默认被添加到默认图中了
# assert tf.get_default_graph() == x.graph
result=tf.matmul(x,x)

with tf.Session() as sess:
 print(sess.run(result))

搭建动态图

动态图的代表是pytorch，Tensorflow2.0已经将Eager Execution(即时执行)作为Tensorflow的默认执行模式，这即意味着Tensorflow如同PyTorch那样，由编写静态计算图完全转向动态计算图，这使得开发者可以更简洁高效地搭建原型。当然你可以选择不使用eager模式，自己构建计算图。

但在Tensorflow1.x中使用动态图需要在开头增加

import tensorflow.contrib.eager as tfe
tfe.enable_eager_execution()

import tensorflow as tf
import numpy as np
import tensorflow.contrib.eager as tfe

# 使用动态图机制
tfe.enable_eager_execution()

x = tf.constant([1,2,3],dtype = tf.float32)
result=tf.matmul(x,x)

print("{}".format(result))

# 动态图不能使用自定义的session
# 因为在创建动态图的过程中，默认也建立一个session。所有的代码都在该session中进行，而且该session具有进程相同的生命周期。
# with tf.Session() as sess:
#  print(sess.run(result))

从动态图的代码和输出结果可以看出：
第一，我们直接在模型定义过程中使用print了result，从结果可以看出，可以直接输出result的值，而在静态图中输出的是Operation的对象，即动态图的操作在python代码中被调用后，其操作立即被执行，张量赋值也是如此。

第二，我们可以注意到，动态图不再需要tf.Session() 来建立对话了，因为在创建动态图的过程中，Tensorflow会默认建立一个session和graph。所有的张量和操作都属于计算图graph，所有的代码都在该session中进行，而且该session具有进程相同的生命周期。

这也就是为什么不用写sess.run()就能得到计算结果的原因。而这表明一旦使用动态图就无法实现静态图中关闭session的功能。这是动态图的不足之处：无法实现多session操作，这使得在一个进程中同时跑多个模型成为困难的事情（在静态图中，我们可以创建多个sess与graph使用多个模型，不同计算图上的张量和运算都不会共享，计算图可以用来隔离张量和计算，使得模型之间相互无影响）。如果当前代码只需要一个session来完成的话，建议优先选择动态图Eager来实现。

张量的结构操作

注意tf其实有很多方法和numpy以及torch的名字和用法都一样或者相似

但是tf最主要区别于numpy以及torch的区别是：

tf中的方法都只支持tf.method(tensor, params)，而不支持tensor.method(params)

torch中：tensor.method(params)和torch.method(tensor, params)等同

numpy中：array.method(params)和np.method(array, params)等同

构建

创建一般的张量

import numpy as np
import tensorflow as tf
import tensorflow.contrib.eager as tfe
tfe.enable_eager_execution()

### 创建一般的张量
print(tf.constant([1,2,3],dtype = tf.float32))
# tf.Tensor([1. 2. 3.], shape=(3,), dtype=float32)

创建特殊的常量张量

### 创建特殊的常量张量
print(tf.range(0,10))
# tf.Tensor([0 1 2 3 4 5 6 7 8 9], shape=(10,), dtype=int32)

print(tf.zeros(3))
# tf.Tensor([0. 0. 0.], shape=(3,), dtype=float32)

print(tf.zeros([3,3]))
# tf.Tensor(
# [[0. 0. 0.]
#  [0. 0. 0.]
#  [0. 0. 0.]], shape=(3, 3), dtype=float32)

print(tf.ones(2))
# tf.Tensor([1. 1.], shape=(2,), dtype=float32)

print(tf.fill([2,2],5))
# tf.Tensor(
# [[5 5]
#  [5 5]], shape=(2, 2), dtype=int32)

# 创建boolean张量
print(tf.constant([True,True,False],dtype=tf.bool))
# tf.Tensor([ True  True False], shape=(3,), dtype=bool)

创建随机张量

# 创建随机种子
tf.random.set_random_seed(1.0)

### 创建随机张量
print(tf.random.uniform([5]))
# tf.Tensor([0.16513085 0.9014813  0.6309742  0.4345461  0.29193902], shape=(5,), dtype=float32)
print(tf.random.uniform([1,5]))
# tf.Tensor([[0.51010704 0.44353175 0.4085331  0.9924923  0.68866396]], shape=(1, 5), dtype=float32)
print(tf.random.normal([2,2]))
# tf.Tensor(
# [[-0.45701224 -0.40686727]
#  [ 0.72857773 -0.8929778 ]], shape=(2, 2), dtype=float32)

索引

常规索引（单个，连续/切片）

a = tf.random.uniform([5,5])
print(a)
# tf.Tensor(
# [[0.01714313 0.55956316 0.11379957 0.4944502  0.97687316]
#  [0.44926536 0.46887696 0.6345625  0.04377449 0.5565767 ]
#  [0.7070466  0.32708418 0.01742852 0.8636614  0.27090502]
#  [0.23116112 0.48299325 0.12780559 0.8452195  0.19541776]
#  [0.8800169  0.6616645  0.15237486 0.9441302  0.5447223 ]], shape=(5, 5), dtype=float32)

# 索引，取最后一行
print(a[-1])
# tf.Tensor([0.8800169  0.6616645  0.15237486 0.9441302  0.5447223 ], shape=(5,), dtype=float32)

# 索引，取0，1，2列
print(a[:,0:3])
# tf.Tensor(
# [[0.01714313 0.55956316 0.11379957]
#  [0.44926536 0.46887696 0.6345625 ]
#  [0.7070466  0.32708418 0.01742852]
#  [0.23116112 0.48299325 0.12780559]
#  [0.8800169  0.6616645  0.15237486]], shape=(5, 3), dtype=float32)

不规则索引

`tf.gather`

gather代表聚集的意思

tf.gather(tensor,indices,axis = 0)

axis不给出时默认为0

`tf.gather_nd`

tf.gather_nd(tensor,indices)

注意tf.gather_nd没有axis参数

tf.gather 和tf.gather_nd 最大的区别是

tf.gather是按照某个单维的索引

由于是单维，indices多为一维数组，如[0, 3, 5]，(其也支持多维，但用法很怪)

由于tf中的tensor不支持不连续的索引，而在torch中是可以的

如三维数组tensor

torch中 tensor[:,[0, 3, 5],:] 等效于 tf.gather(tensor,[0, 3, 5],axis = 1)

必须指定维度axis参数（不指定时默认0）

tf.gather_nd，nd的含义是n_dimension，所以它是按照多维索引，即按照坐标的方式

print(a)
# tf.Tensor(
# [[[94 20 44]
#   [13 35 99]
#   [55 13 40]]

#  [[61 90 25]
#   [28 71 63]
#   [75 13 50]]

#  [[61 90 62]
#   [87 73 65]
#   [72  0 89]]], shape=(3, 3, 3), dtype=int32)

# axis不给出时默认为0，按照0维取第0，2个tensor
# 取完后第0维数量变为2
print(tf.gather(a,[0,2]))
# tf.Tensor(
# [[[94 20 44]
#   [13 35 99]
#   [55 13 40]]

#  [[61 90 62]
#   [87 73 65]
#   [72  0 89]]], shape=(2, 3, 3), dtype=int32)

# 按照1维取第0，2个tensor，即取每个tensor的第0，2行
# 取完后第1维数量变为2
print(tf.gather(a,[0,2],axis = 1))
# tf.Tensor(
# [[[94 20 44]
#   [55 13 40]]

#  [[61 90 25]
#   [75 13 50]]

#  [[61 90 62]
#   [72  0 89]]], shape=(3, 2, 3), dtype=int32)

# gather支持indices多维，只不过是多次单维索引
# tf.gather(a,[0,0])和tf.gather(a,[1,1])按照第0维索引后concat
print(tf.gather(a,[[0,0],[1,1]]))
# tf.Tensor(
# [[[[94 20 44]
#    [13 35 99]
#    [55 13 40]]

#   [[94 20 44]
#    [13 35 99]
#    [55 13 40]]]


#  [[[61 90 25]
#    [28 71 63]
#    [75 13 50]]

#   [[61 90 25]
#    [28 71 63]
#    [75 13 50]]]], shape=(2, 2, 3, 3), dtype=int32)

# 取
print(tf.gather_nd(a,[[0,0],[1,1]]))
# tf.Tensor(
# [[94 20 44]
#  [28 71 63]], shape=(2, 3), dtype=int32)

`tf.boolean_mask`

tf.boolean_mask功能最为强大，它可以实现tf.gather,tf.gather_nd的功能，并且tf.boolean_mask还可以实现布尔索引。

用tf.boolean_mask 实现tf.gather

a = tf.random_normal([2,3])
print(a)
# tf.Tensor(
# [[ 0.22584529  0.41727218  0.39251724]
#  [ 0.7011393   0.05133274 -1.9534125 ]], shape=(2, 3), dtype=float32)

print(tf.boolean_mask(a, [True,False]))
print(tf.boolean_mask(a, [1,0])) # 可以用1，0代替True,False，结果同上
# tf.Tensor([[0.22584529 0.41727218 0.39251724]], shape=(1, 3), dtype=float32)

print(tf.boolean_mask(a, [1,0,1], axis=1))
# tf.Tensor(
# [[ 0.22584529  0.39251724]
#  [ 0.7011393  -1.9534125 ]], shape=(2, 2), dtype=float32)

用tf.boolean_mask 实现tf.gather_nd

print(tf.boolean_mask(a,[[1,0,1],[0,1,0]]))
# tf.Tensor([ 0.22584529  0.39251724 0.05133274 ], shape=(3,), dtype=float32)

其取数方式更直接，1的地方就取，0的地方不取，比tf.gather_nd坐标的形式更加简单易懂

利用tf.boolean_mask可以实现布尔索引

a = tf.constant([[-1,1,-1],[2,2,-2],[3,-3,3]],dtype=tf.float32)
print(a)
# tf.Tensor(
# [[-1.  1. -1.]
#  [ 2.  2. -2.]
#  [ 3. -3.  3.]], shape=(3, 3), dtype=float32)

print(tf.boolean_mask(a, a<0))
print(a[a<0]) # 等效于上面的用法，建议使用下面的语法糖形式，更简单易懂
# tf.Tensor([-1. -1. -2. -3.], shape=(4,), dtype=float32)

`tf.where`

tf.where可以理解为if的张量版本

用法：

tf.where(condition, a , b)

其中condition，a，b是三个张量，他们的形状需要保持相同

condition是一个布尔张量，用来条件的判断

(一般是给一个条件判断符，如padding_mask == 0（为tf.equal(padding_mask, 0)的语法糖形式）

也可以直接给一个bool_tensor tf.constant([True,True,False],dtype=tf.bool))
a和b是两个张量，用来取数

遍历condition张量中的布尔值，true（即condition满足）则取a中的值，否则取b中的值

此用法可以用来filter不满足条件的值并替换成其他值

如此例中将张量a中所有小于0的值全部替换为na

a = tf.constant([[-1,1,-1],[2,2,-2],[3,-3,3]],dtype=tf.float32)

print(a)
# tf.Tensor(
# [[-1.  1. -1.]
#  [ 2.  2. -2.]
#  [ 3. -3.  3.]], shape=(3, 3), dtype=float32)

print(tf.where(a<0,tf.fill(a.shape,np.nan),a))
# tf.Tensor(
# [[nan  1. nan]
#  [ 2.  2. nan]
#  [ 3. nan  3.]], shape=(3, 3), dtype=float32)

维度变化

tensorFlow维度变换可分为两个级别，一个是view级，一个是content级。

要透彻维度变换，就要搞清楚tensor储存的底层：

在存储数据时，内存并不支持这个维度层级概念，只能以平铺方式按序写入内存，因此我们所看到的高维的tensor，其实底层都是一个一维的array的存储形式，各元素的内存地址相邻。

view级维度变换：

不改变底层张量元素的存储顺序，比如tf.range(24)的向量底层存储形式为

[ 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23]

我们将其视图改变为[8,3]时，其实就是把上面的array分成了8份，然后就得到了每3个为一份的向量

[[ 0 1 2][ 3 4 5][ 6 7 8][ 9 10 11][12 13 14][15 16 17][18 19 20][21 22 23]]

只不过在print时tensorflow显示的更高维了:

[[ 0 1 2]
[ 3 4 5]
[ 6 7 8]
[ 9 10 11]
[12 13 14]
[15 16 17]
[18 19 20]
[21 22 23]]

我们再将其视图改变为[2,3,4]时，其实就是把上面的array先分成2份，再分成3份，然后就得到了每4个为一份的向量[[[ 0 1 2 3][ 4 5 6 7][ 8 9 10 11]][[12 13 14 15][16 17 18 19][20 21 22 23]]]

只不过在print时tensorflow显示的更高维了:

[[[ 0 1 2 3]
[ 4 5 6 7]
[ 8 9 10 11]]

[[12 13 14 15]
[16 17 18 19]
[20 21 22 23]]]

所以不管是从维度从[24]变为[2,3,4]，还是从[8,3]变为[2,3,4]。本质上都是从一维的[24]进行分割然后给我们展示出来的view，本身底层的结构一直是一维的没有改变的。

所以，view级维度实际上非常迅速（因为根本没有改变底层的操作，只是从不同角度看底层的一维tensor），并且操作都是可逆的（这里的可逆指的是可以重新变为一维的tensor而不改变）。

content级维度变换：

会改变数据的存储关系，即底层的数据的顺序会发生改变，操作是不可逆的（这里的不可逆指的是不可以重新变为一维的tensor而不改变，不是指两次transpose，其实两次相同的transpose操作是等效于变回原来的tensor）。

以下的例子就能充分理解view和content变换的区别

a = tf.reshape(tf.range(24),[2,3,4])
print(tf.reshape(a, [-1]))
# tf.Tensor([ 0  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 23], shape=(24,), dtype=int32)

# 0，1维度的维度变换，但底层数据未发生改变，可逆
b = tf.reshape(a, [3,2,4])
print(tf.reshape(b, [-1]))
# tf.Tensor([ 0  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 23], shape=(24,), dtype=int32)

# 0,1维度转置，但底层数据发生改变，不可逆
c = tf.transpose(a,[1,0,2])
print(tf.reshape(c, [-1]))
# tf.Tensor([ 0  1  2  3 12 13 14 15  4  5  6  7 16 17 18 19  8  9 10 11 20 21 22 23], shape=(24,), dtype=int32)

维度变换相关函数主要有 tf.reshape, tf.squeeze, tf.expand_dims, tf.transpose.

tf.reshape 可以改变张量的形状。

tf.squeeze 可以减少维度。

tf.expand_dims 可以增加维度。

tf.transpose 可以交换维度。

tf.reshape, tf.squeeze, tf.expand_dims都是view级的变换

tf.transpose是content级变换

`tf.reshape`

其用法和numpy和torch一致，只不过其不支持tensor.reshape()，只能用tf.reshape(tensor)

注意和numpy和torch一样，-1表示自动计算出符合原始tensor的维度

a = tf.range(1,7)

print(a)
# tf.Tensor([1 2 3 4 5 6], shape=(6,), dtype=int32)

b = tf.reshape(a,[3,2])
# tf.Tensor(
# [[1 2]
#  [3 4]
#  [5 6]], shape=(3, 2), dtype=int32)

c = tf.reshape(b,[2,-1])
# tf.Tensor(
# [[1 2 3]
#  [4 5 6]], shape=(2, 3), dtype=int32)

d = tf.reshape(c, [-1])
# tf.Tensor([1 2 3 4 5 6], shape=(6,), dtype=int32)
# 注意这里的shape参数必须是个tensor，所以不能直接给-1

`tf.squeeze`

如果张量在某个维度上只有一个元素，利用tf.squeeze可以消除这个维度。

用法和torch.squeeze()一致

即可以删除shape中为1的维度，tf.squeeze可以按照指定某个维度消除，也可以指消除所有为1的维度

tf.squeeze(tensor, axis = [])

如果axis参数默认不给，则消除所有为1的维度

注意，axis参数中如果给出了不为1的维度，则会立即报错，因为根本无法压缩

a = tf.ones([1,3,2,1,1])

print(a.shape)
# (1, 3, 2, 1, 1)

# 不给axis参数，消除所有为1的维度
print(tf.squeeze(a).shape)
# (3, 2)

# 消除倒数第二个维度
print(tf.squeeze(a,axis = -2).shape)
# (1, 3, 2, 1)

# 消除第一个以及最后一个维度
print(tf.squeeze(a,axis = [0,-1]).shape)
# (3, 2, 1)

`tf.expand_dims` 或 `[:, tf.newaxis]`

tf.expand_dims 对应tf.squeeze的逆操作，只不过其一次只能扩展一个维度，即axis参数只能给一个int

用法和torch.unsqueeze()一致

tf.expand_dims(tensor, axis)

注意是在指定axis维度增加一维，增加后参数axis索引的维度的shape为1

也可理解为在指定维度前插入一维

a = tf.ones([4,3,2])

print(a.shape)
# (4, 3, 2)

# 在第0维扩张一维，扩张后第0维为1
print(tf.expand_dims(a,0).shape)
# (1, 4, 3, 2)

# 在第3维扩张一维，扩张后第3维为1
print(tf.expand_dims(a,3).shape)
# (4, 3, 2, 1)

还有一种新增维度的方式更加的易懂就是在指定维度添加tf.newaxis

这种方式不但更简单易懂，而且可以一次添加多维

a = tf.ones([4,3,2])

# 在第0维扩张一维，扩张后第0维为1
b = a[tf.newaxis,:,:,:]
# (1, 4, 3, 2)

# 在第1，3维扩张一维，扩张后第1，3维为1
c = a[:,tf.newaxis,:,tf.newaxis,:]
print(b.shape)
# (4, 1, 3, 1, 2)

`tf.transpose`

tf.transpose可以交换张量的维度，与tf.reshape不同，它会改变张量元素的存储顺序。

tf.transpose(a,perm)

perm参数表示转换后的索引排列，索引排列必须给全

输出“y”与“x”的关系。“x”和“y”的形状满足：

y.shape[i]==x.shape[perm[i]]对于[0，1，…，shape[0]-1]

tf.transpose常用于图片存储格式的变换上。

# Batch,Height,Width,Channel
a = tf.random.uniform(shape=[100,600,600,4],minval=0,maxval=255,dtype=tf.int32)
tf.print(a.shape)
# TensorShape([100, 600, 600, 4])

# 将Batch和Channel维度互换
# 转换成 Channel,Height,Width,Batch
s = tf.transpose(a,perm=[3,1,2,0])
tf.print(s.shape)
# TensorShape([4, 600, 600, 100])

tf.transpose在二维张量上十分好理解，就是矩阵的转置

a = tf.reshape(tf.range(12),[3,4])
print(a)
# tf.Tensor(
# [[ 0  1  2  3]
#  [ 4  5  6  7]
#  [ 8  9 10 11]], shape=(3, 4), dtype=int32)

print(tf.transpose(a)) 
# 等效于tf.transpose(a,[1,0])
# tf.Tensor(
# [[ 0  4  8]
#  [ 1  5  9]
#  [ 2  6 10]
#  [ 3  7 11]], shape=(4, 3), dtype=int32)

但是多维矩阵的转置就抽象很多

但是请注意：矩阵对相邻的两维进行转置时才有意义，对任意两个非相邻的维度进行调换的意义不大

在多维张量上的最后两维进行transpose也很好理解：

保持前面维度的切分不变，最后两维看作一个矩阵，把所有的矩阵转置即可

a = tf.reshape(tf.range(24),[2,3,4])
print(a)
# tf.Tensor(
# [[[ 0  1  2  3]
#   [ 4  5  6  7]
#   [ 8  9 10 11]]

#  [[12 13 14 15]
#   [16 17 18 19]
#   [20 21 22 23]]], shape=(2, 3, 4), dtype=int32)


print(tf.transpose(a, [0,2,1]))
# tf.Tensor(
# [[[ 0  4  8]
#   [ 1  5  9]
#   [ 2  6 10]
#   [ 3  7 11]]

#  [[12 16 20]
#   [13 17 21]
#   [14 18 22]
#   [15 19 23]]], shape=(2, 4, 3), dtype=int32)

最难理解的就是把非最后两维的矩阵进行转置

a = tf.reshape(tf.range(24),[2,3,4])
print(a)
# tf.Tensor(
# [[[ 0  1  2  3]
#   [ 4  5  6  7]
#   [ 8  9 10 11]]

#  [[12 13 14 15]
#   [16 17 18 19]
#   [20 21 22 23]]], shape=(2, 3, 4), dtype=int32)

# 将前两维进行转置
print(tf.transpose(a, [1,0,2]))
# tf.Tensor(
# [[[ 0  1  2  3]
#   [12 13 14 15]]

#  [[ 4  5  6  7]
#   [16 17 18 19]]

#  [[ 8  9 10 11]
#   [20 21 22 23]]], shape=(3, 2, 4), dtype=int32)

上面的过程如何理解？

由于最后一个维度不变，我们可以将最后一个维度的一维向量整体（打包）看作一个变量:

那么上述的一开始[2,3,4]

[[[ 0 1 2 3]
[ 4 5 6 7]
[ 8 9 10 11]]

[[12 13 14 15]
[16 17 18 19]
[20 21 22 23]]]

打包：

A = [ 0 1 2 3] ，B = [ 4 5 6 7]， C = [ 8 9 10 11]，D=[12 13 14 15]，E=[16 17 18 19]，F=[20 21 22 23]

按以上规则打包后可以看作一个[2,3]的矩阵，其中每一个元素都是一个向量

[[A, B, C]

[D, E, F]]

那么[2,3]的矩阵转置后就成了[3,2]

[[A, D],

[B, E],

[C, F]]

将打包后的向量还原后即成了

[[[ 0 1 2 3]
[12 13 14 15]]

[[ 4 5 6 7]
[16 17 18 19]]

[[ 8 9 10 11]
[20 21 22 23]]]

所以多维张量对非最后的相邻两维进行转置时的秘诀就是：

把想要转置的维度之后的所有维度打包，看成个整体，之后其实想要转置的维度就变为了最后的两维，然后按照常规维矩阵的转置方法转置即可。

如将[bs, seq_len, n_head, n_dim]的中间两维进行[0, 2, 1, 3]转置为[bs, n_head, seq_len, n_dim]的过程为：

由于bs维度不变，可以不管，将n_dim的每个向量进行打包看成整体（每个词的embedding看作整体），然后将[seq_len, n_head]转为[n_head, seq_len]即可

`tf.concat`和`tf.stack`

和numpy和torch类似，可以用tf.concat和tf.stack方法对多个张量进行合并，可以用tf.split方法把一个张量分割成多个张量。由于和numpy和torch完全一致，这里就不再赘述。

注意：tf.concat和tf.stack有略微的区别，tf.concat是连接，不会增加维度，而tf.stack是堆叠，会增加维度。

a = tf.constant([[1.0,2.0],[3.0,4.0]])
b = tf.constant([[5.0,6.0],[7.0,8.0]])
c = tf.constant([[9.0,10.0],[11.0,12.0]])

# 横向拼接，concat维度不会增加，向量拼接最多的就是横向拼接
print(tf.concat([a,b,c],axis = 1))
# tf.Tensor(
# [[ 1.  2.  5.  6.  9. 10.]
#  [ 3.  4.  7.  8. 11. 12.]], shape=(2, 6), dtype=float32

# 竖向拼接，concat维度不会增加
print(tf.concat([a,b,c],axis = 0))
# tf.Tensor(
# [[ 1.  2.]
#  [ 3.  4.]
#  [ 5.  6.]
#  [ 7.  8.]
#  [ 9. 10.]
#  [11. 12.]], shape=(6, 2), dtype=float32)

# 横向堆叠，stack维度增加一维
print(tf.stack([a,b,c],axis = 1))
# tf.Tensor(
# [[[ 1.  2.]
#   [ 5.  6.]
#   [ 9. 10.]]

#  [[ 3.  4.]
#   [ 7.  8.]
#   [11. 12.]]], shape=(2, 3, 2), dtype=float32)

# 属性堆叠，stack维度增加一维
print(tf.stack([a,b,c],axis = 0))
# tf.Tensor(
# [[[ 1.  2.]
#   [ 3.  4.]]

#  [[ 5.  6.]
#   [ 7.  8.]]

#  [[ 9. 10.]
#   [11. 12.]]], shape=(3, 2, 2), dtype=float32)

`tf.tile`

tf.tile(input, multiples, name=None)

通过“平铺”一个给定的 tensor 来构造一个新的 tensor。用人话讲就是：把输入的 tensor，在指定的维度上复制N遍（就像铺瓷砖一样），来创建出一个新的 tensor。

3个参数：
input：输入的tensor
multiples：在指定的维度上复制原tensor的次数
name：operation的名字

a = tf.constant([[15, 16], [17, 18]])
b = tf.tile(a, [1, 3])
c = tf.tile(a, [3, 2])
print(a)
# tf.Tensor(
# [[15 16]
#  [17 18]], shape=(2, 2), dtype=int32)

print(b)
# tf.Tensor(
# [[15 16 15 16 15 16]
#  [17 18 17 18 17 18]], shape=(2, 6), dtype=int32)

print(c)
# tf.Tensor(
# [[15 16 15 16]
#  [17 18 17 18]
#  [15 16 15 16]
#  [17 18 17 18]
#  [15 16 15 16]
#  [17 18 17 18]], shape=(6, 4), dtype=int32)

输入的 a 是一个 2x2 的矩阵，tf.tile(a, [1, 3]) 里的 [1, 3] 表示在第一个维度上把输入的tensor重复1遍，再在第二个维度上把输入的tensor重复3遍。在本例中，第一个维度就是行，第二个维度就是列，因此 b 就变成了 2x6 的矩阵。

注意：tf.tile() 里的第2个参数，例如 [1, 3]，里面有两个元素，它必须与输入的 tensor 的维度一样（2维），如果输入的 tensor 是3维的，那么 tf.tile() 的第2个参数里也必须有3个元素，例如 [2, 3, 5]，否则会报类似于下面的错：

ValueError: Shape must be rank 3 but is rank 1 for 'Tile_1' (op: 'Tile') with input shapes

张量的数学运算

标量运算

张量的数学运算符可以分为标量运算符、向量运算符、以及矩阵运算符。

加减乘除乘方，以及三角函数，指数，对数等常见函数，逻辑比较运算符等都是标量运算符。

标量运算符的特点是对张量实施逐元素运算。

有些标量运算符对常用的数学运算符进行了重载，支持+， - ，*， /, **, // , %等运算符。

并且支持类似numpy的广播特性。

标量运算和torch和numpy一致，都支持广播，广播的两个原则是：

两个数组各维度大小从后往前比对均一致（从低维到高维）

2.两个数组存在一些维度大小不相等时，其中有一个数组的该维度大小为1
[4,3] 和 [4]无法广播，因为从后往前，4和3不相等且都不为1

[4,1] 和 [4]可以广播，因为从后往前，4和1不等，但后者该维度为1，复制为4即可。然后后者再将[4]扩展为[4,4]，最后形状为[4,4]

[4,1,1,3] 和 [4,3] 可以广播，理由是前者 [1,3] 复制为[4,3]，然后后者[4,3]自动扩维为[4,1,4,3]，最终形状为[4,1,4,3]

同理[4,1,1,3]和[4,3]也可以广播，最终结果为[4,1,4,3] 
(注意最终结果不是[4,1,1,3]，一定是从后往前广播，这里一些新手可能认为结果是[4,1,1,3])

[4,3,3]和[4,2,3,3]无法广播，因为从后往前2和4不相等且都不为1
(这里新手也可能认为[4,3,3]可以自动广播为[4,2,3,3]，实际上不行，正确的做法是将tf.exp_dim([4,3,3],1))为[4,1,3,3]后再和[4,2,3,3]广播)
广播的几种情况是：

1、如果张量的维度不同，将维度较小的张量进行扩展，等效于tf.expand_dim + tf.tile两个过程，直到两个张量的维度都一样。

2、如果两个张量在某个维度上的长度是相同的，或者其中一个张量在该维度上的长度为1，那么我们就说这两个张量在该维度上是相容的。

3、如果两个张量在所有维度上都是相容的，它们就能使用广播。

4、广播之后，每个维度的长度将取两个张量在该维度长度的较大值。

5、在任何一个维度上，如果一个张量的长度为1，另一个张量长度大于1，那么在该维度上，就好像是对第一个张量进行了复制，等效于tf.tile。

a = tf.constant([[1,2],[3,4]])
b = tf.constant([[2,0],[0,2]])
a*b  #等价于tf.multiply(a,b)

# 举个利用广播的例子来计算一个user和多个item的embedding的内积
user_embedding = tf.random_normal([3])
# tf.Tensor([0.53647536 0.2574643  1.6876464 ], shape=(3,), dtype=float32)
item_embedding = tf.random_normal([3,3])
# tf.Tensor(
# [[ 0.18329209 -0.33839703 -0.9801966 ]
#  [-0.5128904   0.39472547 -1.079079  ]
#  [-1.2373055   0.9422188   0.52374583]], shape=(3, 3), dtype=float32)

print(user_embedding*item_embedding)
# tf.Tensor(
# [[ 0.09833169 -0.08712515 -1.6542252 ]
#  [-0.27515307  0.10162771 -1.8211038 ]
#  [-0.6637839   0.24258769  0.8838978 ]], shape=(3, 3), dtype=float32)


# 幅值裁剪
x = tf.constant([0.9,-0.8,100.0,-20.0,0.7])
y = tf.clip_by_value(x,clip_value_min=-1,clip_value_max=1)
# [0.9 -0.8 1 -1 0.7]

向量运算

向量运算符只在一个特定轴上运算，将一个向量映射到一个标量或者另外一个向量。

与numpy和torch不同的是，在tf中向量运算符都要以reduce开头。

其他用法与numpy和torch一致

a = tf.range(1,10)

print(tf.reduce_sum(a))
print(tf.reduce_mean(a))
print(tf.reduce_max(a))
print(tf.reduce_min(a))
print(tf.reduce_prod(a))
# 45
# 5
# 9
# 1
# 362880

#张量指定维度进行reduce
b = tf.reshape(a,(3,3))
# tf.Tensor(
# [[1 2 3]
#  [4 5 6]
#  [7 8 9]], shape=(3, 3), dtype=int32)

# 按第二维度相加，并保持向量维度不变
print(tf.reduce_sum(b, axis=1, keepdims=True))
# tf.Tensor(
# [[ 6]
#  [15]
#  [24]], shape=(3, 1), dtype=int32)

# 按第一维度相加，并保持向量维度不变
print(tf.reduce_sum(b, axis=0, keepdims=True))
# tf.Tensor([[12 15 18]], shape=(1, 3), dtype=int32)

矩阵运算

#矩阵乘法
a = tf.constant([[1,2],[3,4]])
b = tf.constant([[2,0],[0,2]])
a@b  #等价于tf.matmul(a,b)
# tf.matmul(a,b) 等价于 tf.tensordot(a,b,axes=1)

#矩阵转置
a = tf.constant([[1,2],[3,4]])
tf.transpose(a)

模块、层和模型

模块tf.Module，层 tf.keras.layers.Layer和模型tf.keras.Model

他们的关系是：

tf.keras.layers.Layer继承自tf.Module，而tf.keras.Model继承自tf.keras.layers.Layer
所以tf.Module是层 tf.keras.layers.Layer和模型tf.keras.Model的基类

tf2中最基本且最基础的基类就是tf.Module，本质上tf.Module（包括了其子类层 tf.keras.layers.Layer和模型tf.keras.Model）都是一种函数变化，将输入X通过tf.Module中的神经网络参数（矩阵）和运算逻辑转变后return该Module的输出y。

本质上tf.Module与python的类没有什么区别，其核心功能就是调用实例名（即__call__()方法），而__call__()方法就是一个封装从输入到输出的一个函数罢了。

更直白的用深度学习的话来说，tf.Module就两步：创建实例，调用实例

创建实例其实就是初始化了变化所需的矩阵的大小

调用实例其实就是运用矩阵变换将输入转变为该module的输出

tf.Module创建实例：

simple_module =SimpleModule(in_features=3, out_features=3)

tf.Module创建实例（假定输入x = tf.constant([[2.0, 2.0, 2.0]])）：

x = simple_module(x)

实际上是调用了simple_module.__call__()，执行了里面定义的运算逻辑

这样，就实现了将输入x转变为输出x的过程

所以继承tf.Module的根本原因只不过是tf团队对tf.Module封装了一些好用的基本方法更有利于保存和取出模型以及模型中的参数。

`tf.Module`

TensorFlow提供了一个基类tf.Module，通过继承它构建子类，我们不仅可以获得以上的自然而然，而且可以非常方便地管理变量，还可以非常方便地管理它引用的其它Module，最重要的是，我们能够利用tf.saved_model保存模型并实现跨平台部署使用。

使用方式

继承tf.Module都要实现__init__()，__call()__这两个方法。

__init__()：实例创建时执行，创建tf.Variable（多为矩阵的参数bias）

__call__()：调用时会被执行，实现运算逻辑

class SimpleModule(tf.Module):
  def __init__(self, name=None):
    super().__init__(name=name)
    # `tf.Variable`创建放在类的初始化方法（神经网络参数（矩阵以及bias）放在初始化方法中）
    self.a_variable = tf.Variable(5.0, name="train_me")
    self.non_trainable_variable = tf.Variable(5.0, trainable=False, name="do_not_train_me")
  def __call__(self, x):
    # 函数的运算逻辑放在`__call__(self, input)`中
    return self.a_variable * x + self.non_trainable_variable

simple_module = SimpleModule(name="simple")

simple_module(tf.constant(5.0)) #等效于simple_module.__call__(tf.constant(5.0))
#

__call__()的作用是使实例能够像函数一样被调用

即 a()等效于a.__call__()

所以上述的simple_module(tf.constant(5.0))其实就等效于simple_module.__call__(tf.constant(5.0))

通过将 tf.Module子类化，将自动收集分配给该tf.Module中的任何 tf.Variable，也可以通过module.trainable_variables和module.variables获取到Module中的可训练参数和所有参数，以及其所包含的所有子Module。这样，就可以方便的保存和加载变量。

# All trainable variables
print("trainable variables:", simple_module.trainable_variables)
# Every variable
print("all variables:", simple_module.variables)
# all sub Module
print("Submodules:", my_model.submodules)

例子

通过引用和管理其他的tf.Module，我们可以创建 tf.Module的集合（搭积木）。

下面是一个由基础Dense模块组成的两层线性层模型SequentialModule的示例。

首先是一个密集（线性）层：

class MyDense(tf.Module):
  def __init__(self, in_features, out_features, name=None):
    super().__init__(name=name)
    self.w = tf.Variable(
      tf.random.normal([in_features, out_features]), name='w')
    self.b = tf.Variable(tf.zeros([out_features]), name='b')
  def __call__(self, x):
    y = tf.matmul(x, self.w) + self.b
    return tf.nn.relu(y)

随后是完整的模型，此模型将创建并应用两个层实例：

class SequentialModule(tf.Module):
  def __init__(self, name=None):
    super().__init__(name=name)
 # 初始化`Dense`模块，规定Dense中的参数形状大小
    self.dense_1 = MyDense(in_features=3, out_features=3)
    self.dense_2 = MyDense(in_features=3, out_features=2)

  def __call__(self, x):
    x = self.dense_1(x) # 调用了self.dense_1的__call__方法
    return self.dense_2(x)

# You have made a model!
my_model = SequentialModule(name="the_model")

# Call it, with random results
print("Model results:", my_model(tf.constant([[2.0, 2.0, 2.0]])))
# Model results: tf.Tensor([[8.111373 0.      ]], shape=(1, 2), dtype=float32)

print("variables:", my_model.variables)
# variables: (, 
# array([[ 0.871796  ,  0.04100253,  1.6504226 ],
#        [-0.4237731 , -2.6332445 ,  1.8764867 ],
#        [ 0.8134965 ,  2.0158744 , -1.4425671 ]], dtype=float32)>, , 
# array([[-0.84247786,  0.19298597],
#        [-1.1047211 ,  0.7861384 ],
#        [-1.013045  ,  1.0758061 ]], dtype=float32)>)

print("sub modules:", my_model.submodules)
# sub modules: (<__main__.Dense object at 0x000001961DF29F10>, <__main__.Dense object at 0x0000019627F8C0D0>)

`tf.keras.layers.Layer`

使用方法

继承tf.keras.layers.Layer都要实现__init__()，build(), call()这三个方法

从直观上理解，似乎__init__()和build()函数都在对Layer进行初始化，都初始化了一些成员函数，而call()函数则是在该layer被调用时执行。

其与tf.Module的区别在于两点：

tf.Module的__call__()方法变为了Layer中的call()方法

原因是Keras 层有自己的__call__()方法，在__call__()中会进行一系列的前置操作（如调用build()方法）后然后再调用 call()。

所以这两者是几乎等价的，在自己使用时不会看到功能上的任何变化，只需按照原来在tf.Module中定义运算逻辑的方式原封不动的放在Layer中的call()中。
多了一个build()方法。build()方法并不能被我们自己调用，其用于动态的获取并利用input_shape

因为build()方法并不能被我们自己调用，所以其有固定的形式：build(self, input_shape)

其只能接受一个位置参数input_shape，没有参数或多个参数都会报错

input_shape是动态获取的，当第一次调用call(input)时，input_shape即为input.shape

一句话来说：

原先tf.Module的__init__()必须固定计算需要的所有参数，和input无关。

而现在Layer的__init__()固定一部分的args，而在build()动态地从input.shape获取一些args最终构建矩阵。

注意：build()至始至终仅会被调用一次，是在call()函数第一次执行时会被调用一次，所以后续input的shape和第一次input的shape不匹配时会报错

例子

基于tf.Module和Layer中的不同，我们再以Layer的方式写一遍Dense层

这时可以根据输入的大小灵活地重写上面的 Dense 层:

class FlexibleDense(tf.keras.layers.Layer):
  # Note the added `**kwargs`, as Keras supports many arguments
  def __init__(self, out_features, **kwargs):
    super().__init__(**kwargs)
    # 固定的参数放在__init__中初始化, 这里固定了输出的维度
    self.out_features = out_features

  def build(self, input_shape):  # Create the state of the layer (weights)
    # 从input中动态获取的参数放在build中，这里动态获取input的第二维
    print(f"build方法中自动能拿到input_shape：{input_shape}")
    self.w = tf.Variable(
      tf.random.normal([input_shape[-1], self.out_features]), name='w')
    self.b = tf.Variable(tf.zeros([self.out_features]), name='b')
    super().build(input_shape) # must be add in the end, 相当于设置self.built = True
    # 理论上可以不加，因为我们不会直接调用build(), 但是防止有人无聊直接调用build方法，那加上最后一句可以保证其只调用一次self.build()

  def call(self, inputs):  # Defines the computation from inputs to outputs
    return tf.matmul(inputs, self.w) + self.b
 
  def get_config(self):
    # get_config方法返回一个参数字典，只有这个参数字典中的参数才会被保存成h5模型
    # 因此如果我们自定义了一些超参数并且想保存到模型的配置中，必须重写这个方法确保自定义超参数被添加在了字典中
    base_config = super().get_config()
    config.update({...自定义参数列表}) # 如{'unit': self.units}
    return config

# Create the instance of the layer
flexible_dense = FlexibleDense(out_features=1)
# 此时模型尚未构建，因此没有变量: flexible_dense.variables为[]

# 调用该函数会分配大小适当的变量。
print("Model results:", flexible_dense(tf.constant([[2.0, 2.0, 2.0], [3.0, 3.0, 3.0]])))
# build方法中自动能拿到input_shape：(2, 3)
# Model results: tf.Tensor(
# [[-3.4673862]
#  [-5.2010794]], shape=(2, 1), dtype=float32)

# 由于仅调用一次 build，因此如果输入形状(input_shape[-1])与层的变量不兼容，输入将被拒绝。
# 此处w的shape[0] = 3， 而输入input_shape[-1] = 2不匹配，直接报错
print("Model results:", flexible_dense(tf.constant([[2.0, 2.0], [3.0, 3.0]])))
# Failed: Exception encountered when calling layer "flexible_dense" (type FlexibleDense).
# Matrix size-incompatible: In[0]: [1,4], In[1]: [3,3] [Op:MatMul]

# input_shape[0]不同没事，只要保证input_shape[-1]一样即可
print("Model results:", layer1(tf.constant([[2.0, 2.0, 2.0], [3.0, 3.0, 3.0], [3.0, 3.0, 3.0]])))
# Model results: tf.Tensor(
# [[6.261455]
#  [9.392181]
#  [9.392181]
#  [9.392181]], shape=(4, 1), dtype=float32)
# 没有print出input_shape，说明没有调用self.build()

原理解析

以上执行flexible_dense(tf.constant([[2.0, 2.0, 2.0], [3.0, 3.0, 3.0]]))本质上是调用__call__(tf.constant([[2.0, 2.0, 2.0], [3.0, 3.0, 3.0]]))，在__call__()主要执行了三个步骤：

获取build(self, input_shape)中的input_shape参数，input_shape = input.shape
调用self.build(input_shape)初始化矩阵中的参数
调用self.call(input)返回结果

以下是自定义的类My_Layer，效果等效于tf.keras.layers.Layer

如何保证只调用一次build方法？

需要使用标志符self.built表示是否调用过self.build()

class My_Layer():
    def __init__(self):
        #  标志符`self.built`表示是否调用过`self.build()`以保证只调用一次`self.build()`
        self.built = False
    
    def __call__(self, input):
        input_shape = input.shape
        
        # 如果已经构建了，则跳过
        if not self.built:
            self.build(input_shape)
            self.built = True
            
        return self.call(input)
    
    def build(self, input_shape):
        # Only record the build input shapes of overridden build methods.
        # 基础原生的build方法只是用来记录一下输入的形状，并且设置self.built = True
        self._build_input_shape = input_shape
        self.built = True
    
    def call(self, input):
        pass
    

class My_Flexible_Dense(My_Layer):
    def __init__(self, out_features):
        super().__init__()
        self.out_features = out_features
        
    def build(self, input_shape):
        print(f"build方法中自动能拿到input_shape：{input_shape}")
        self.w = tf.Variable(
        tf.random.normal([input_shape[-1], self.out_features]), name='w')
        self.b = tf.Variable(tf.zeros([self.out_features]), name='b')
        super().build(input_shape)
    
    def call(self, inputs):  # Defines the computation from inputs to outputs
        return tf.matmul(inputs, self.w) + self.b
    
flexible_dense = My_Flexible_Dense(out_features=1)
print("Model results:", flexible_dense(tf.constant([[2.0, 2.0, 2.0], [3.0, 3.0, 3.0]])))
# 结果与上面相同
print("Model results:", flexible_dense(tf.constant([[2.0, 2.0], [3.0, 3.0]])))
# 报错
print("Model results:", layer1(tf.constant([[2.0, 2.0, 2.0], [3.0, 3.0, 3.0], [3.0, 3.0, 3.0]])))
# 结果与上面相同

`tf.keras.Model`

用以上的Layer可以将模型定义为嵌套的 Keras 层，其已经能够完成所有内容了

但是，Keras 还提供了称为tf.keras.Model 的全功能模型类。它继承自tf.keras.layers.Layer，因此 tf.keras.Model 支持以同样的方式使用、嵌套和保存。

tf.keras.Model 还具有额外封装的功能以及极其强大的API，这使它们可以轻松的实现以下功能：

查看模型概要model.summary()(注意其自带了print()，返回None)
编译模型model.compile(optimizer = .., loss = .., metric = ..)

和训练模型model.fit(x_train,y_train, batch_size, epochs, validation_split = 0.2)
预测model.predict(x)
评估model.evaluate(x = x_test,y = y_test)，返回模型y_predict和y_test之间的loss（指标为compile时使用的loss）
保存model.save('model_name.h5')
加载model = tf.keras.models.load_model('model_name.h5')

…

甚至在多台机器上进行训练。

其也拥有其他很多属性如model.layers()查看模型中的各层对象

使用方法

继承tf.Module都要实现__init__()，call()这两个方法。

其实现计算的逻辑是引用或嵌套其他的tf.Module或tf.keras.layers.Layer

__init__()进行初始化，call()实现运算逻辑

class MyModel(tf.keras.Model):

  def __init__(self):
    super(MyModel, self).__init__()
    self.dense1 = tf.keras.layers.Dense(4, activation=tf.nn.relu)
    self.dense2 = tf.keras.layers.Dense(5, activation=tf.nn.softmax)

  def call(self, inputs):
    x = self.dense1(inputs)
    return self.dense2(x)

model = MyModel()

例子

使用几乎相同的代码定义上面的 SequentialModule，其也需要将 __call__() 转换为 call() 。

class MySequentialModel(tf.keras.Model):
  def __init__(self, name=None, **kwargs):
    super().__init__(**kwargs)

    self.dense_1 = FlexibleDense(out_features=3)
    self.dense_2 = FlexibleDense(out_features=2)
  def call(self, x):
    x = self.dense_1(x)
    return self.dense_2(x)

# You have made a Keras model!
my_sequential_model = MySequentialModel(name="the_model")

# Call it on a tensor, with random results
print("Model results:", my_sequential_model(tf.constant([[2.0, 2.0, 2.0]])))
# Model results: tf.Tensor([[-1.4071871 -1.8095387]], shape=(1, 2), dtype=float32)

# 同样可以使用tf.Module中的所有属性
my_sequential_model.variables
my_sequential_model.submodules

# 特有API
my_functional_model.summary()
# Model: "my_sequential_model"
# _________________________________________________________________
#  Layer (type)                Output Shape              Param #   
# =================================================================
#  flexible_dense (FlexibleDen  multiple                 12        
#  se)                                                             
                                                                 
#  flexible_dense_1 (FlexibleD  multiple                 8         
#  ense)                                                           
                                                                 
# =================================================================
# Total params: 20
# Trainable params: 20
# Non-trainable params: 0
# _________________________________________________________________

# 特有属性
print(my_sequential_model.layers)
# [, ]

注意这种情况下必须model被build后的才能执行model.summary()，即model.summary()必须要在model(x)喂入数据后才能查看

因为还没有确定输入的形状，这种情况下其并也不会自动为输入维度创建一个占位符None

如果在my_sequential_model(tf.constant([[2.0, 2.0, 2.0]]))前使用my_functional_model.summary()会报错

ValueError: This model has not yet been built. Build the model first by calling build() or by calling the model on a batch of data.

`tf.keras.Model`的其他形式

以上的tf.keras.Model类是遵循python类的构建方式，其非常规范

keras中对tf.keras.Model又进行了一些封装使其有更简便的创建方式如Sequential API和函数式API，其运作方式等价于以上的python规范式创建方法

Sequential序列模型

Sequential序列模型是按照层的顺序构建的，其适用于每个层恰好有一个输入张量和一个输出张量

Keras.Sequential(layers=None, name=None)

layers: 一个list, 里面包含继承tf.Module（包括tf.keras.layers.Layer，tf.keras.Model)的子类

name: 模型的名字，model.summay()

# 列表包含的全为tf.keras.layers.Layer
model = keras.Sequential(
    [ FlexibleDense(out_features=3), # FlexibleDense为`tf.keras.layers.Layer`的子类
     FlexibleDense(out_features=2)
    ], 
    name = "my_sequential_model"
)


# Call model on a test input
print("Model results:", model(tf.constant([[2.0, 2.0, 2.0]])))
model.summary()
# Model: "my_sequential_model"
# _________________________________________________________________
#  Layer (type)                Output Shape              Param #   
# =================================================================
#  flexible_dense (FlexibleDen  (1, 3)                   12        
#  se)                                                             
                                                                 
#  flexible_dense_1 (FlexibleD  (1, 2)                   8         
#  ense)                                                           
                                                                 
# =================================================================
# Total params: 20
# Trainable params: 20
# Non-trainable params: 0
# _________________________________________________________________
# 特有API
my_functional_model.summary()
# Model: "my_sequential_model"
# _________________________________________________________________
#  Layer (type)                Output Shape              Param #   
# =================================================================
#  flexible_dense (FlexibleDen  multiple                 12        
#  se)                                                             
                                                                 
#  flexible_dense_1 (FlexibleD  multiple                 8         
#  ense)                                                           
                                                                 
# =================================================================
# Total params: 20
# Trainable params: 20
# Non-trainable params: 0
# _________________________________________________________________

# 特有属性
print(my_sequential_model.layers)
# [, ]

注意这种情况下必须model被build后的才能执行model.summary()，即model.summary()必须要在model(x)喂入数据后才能查看

因为还没有确定输入的形状，这种情况下其并也不会自动为输入维度创建一个占位符None

如果在my_sequential_model(tf.constant([[2.0, 2.0, 2.0]]))前使用my_functional_model.summary()会报错

ValueError: This model has not yet been built. Build the model first by calling build() or by calling the model on a batch of data.

`model.add()`

也可通过model.add()方法往Layer_list中加层

model.add()方法接受的参数也只能是继承tf.Module（包括tf.keras.layers.Layer，tf.keras.Model)的子类

model = keras.Sequential() # 创建一个空的层列表
model.add(MyDense(in_features = 3, out_features=3))
model.add(FlexibleDense(out_features = 2))

# 结果和上面等效
print("Model results:", model(tf.constant([[2.0, 2.0, 2.0]])))
model.summary()

# Model: "sequential"
# _________________________________________________________________
#  Layer (type)                Output Shape              Param #   
# =================================================================
#  module_wrapper (ModuleWrapp  (1, 3)                   12        
#  er)                                                             
                                                                 
#  flexible_dense (FlexibleDen  (1, 2)                   8         
#  se)                                                             
                                                                 
# =================================================================
# Total params: 20
# Trainable params: 20
# Non-trainable params: 0
# _________________________________________________________________

注意这种情况下必须model被build后的才能执行model.summary()，即model.summary()必须要在model(x)喂入数据后才能查看

因为还没有确定输入的形状，这种情况下其并也不会自动为输入维度创建一个占位符None

如果在my_sequential_model(tf.constant([[2.0, 2.0, 2.0]]))前使用my_functional_model.summary()会报错

ValueError: This model has not yet been built. Build the model first by calling build() or by calling the model on a batch of data.

`tf.keras.Input(shape)`

然而，当以add()方式构建序列模型时，能够不用喂数据就能显示到目前为止的模型摘要，包括当前输出形状非常重要。

在这种情况下，可以通过构建输入节点tf.keras.Input(shape)作为占位符传递给模型并启动模型，以便它从一开始就知道其输入形状

这种情况下，不用调用模型就可以直接查看模型的概况

model = keras.Sequential() # 创建一个空的层列表
model.add(keras.Input(3))
model.add(MyDense(in_features = 3, out_features=3))
model.add(FlexibleDense(out_features = 2))
model.summary()
# Model: "sequential"
# _________________________________________________________________
#  Layer (type)                Output Shape              Param #   
# =================================================================
#  module_wrapper (ModuleWrapp  (None, 3)                12        
#  er)                                                             
                                                                 
#  flexible_dense (FlexibleDen  (None, 2)                8         
#  se)                                                             
                                                                 
# =================================================================
# Total params: 20
# Trainable params: 20
# Non-trainable params: 0
# _________________________________________________________________

请注意，输入节点不显示为模型的一部分。因为它并不是一个层

print(keras.Input(3))

的结果是KerasTensor(type_spec=TensorSpec(shape=(None, 3), dtype=tf.float32, name='input_1'), name='input_1', description="created by layer 'input_1'")

从结果可以看出输入的shape是忽略第一维的，即忽略了batch_size

输入数据维度为(1, 3)则只需填写(3)，创建出来的占位符input为(None, 3)

简化

另一种简化就是将input节点通过第一层的tf.keras.layers.Layer的子类input_shape参数传入（因为不是tf.keras.layers.Layer的子类并没有实现input_shape参数创建input节点）

这种方式是keras中最常用的方式

model = keras.Sequential() # 创建一个空的层列表
# 等效于model.add(keras.Input(3))
model.add(FlexibleDense(out_features = 2, input_shape = [3])) 
model.add(MyDense(in_features = 2, out_features=1))
model.summary()

函数式API式

Keras 函数式 API 是一种比tf.keras.SequentialAPI 更加灵活的模型创建方式。

函数式 API 可以处理具有非线性拓扑的模型、具有共享层的模型，以及具有多个输入或输出的模型。

创建步骤：

必须使用tf.keras.Input(shape)创建一个输入节点

注意这个shape是忽略第一维的，即忽略了batch_size

输入数据维度为(1, 3)则只需填写(3)
使用输入和输出的方式搭建模型
最后，通过在层计算图中指定模型的输入和输出来创建 Model

# 要使用函数式 API 构建此模型，必须要先使用tf.keras.Input创建一个输入节点
inputs = tf.keras.Input(shape=[3])

# 搭建模型
x = FlexibleDense(3)(inputs)
x = FlexibleDense(2)(x)

# 指定模型的输入和输出来创建 Model
model = tf.keras.Model(inputs=inputs, outputs=x)

model.summary()
# 结果与上面相同
# Model: "model"
# _________________________________________________________________
#  Layer (type)                Output Shape              Param #   
# =================================================================
#  input_1 (InputLayer)        [(None, 3)]               0         
                                                                 
#  flexible_dense_2 (FlexibleD  (None, 3)                12        
#  ense)                                                           
                                                                 
#  flexible_dense_3 (FlexibleD  (None, 2)                8         
#  ense)                                                           
                                                                 
# =================================================================
# Total params: 20
# Trainable params: 20
# Non-trainable params: 0
# _________________________________________________________________

print("Model results:", model(tf.constant([[2.0, 2.0, 2.0]])))

由于预先创建了输入节点（占位符），可以在喂入数据前就查看model.summary()

自定义损失函数和评估指标

有时候因为某些原因需要模型自定义自定义损失函数和评估指标

如：

输入输出的数据格式的原因，当是transformer的翻译任务时，需要对句子进行padding，而在label中padding的词语的loss是不计算的，acc也是不计算的。所以我们需要根据padding来自定义loss和metric

以下例子就是用transfomer的例子

自定义损失函数

自定义损失函数有两种形式：函数式定义和类形式定义

函数式定义

def sparse_loss_with_padding(y_true, y_pred):
    '''
    :param true: shape:(batch_size, target_seq_len)
    :param pred: shape: (batch_size, target_seq_len, target_vocab_size)
    :return:
    '''
    mask = 1-tf.cast(tf.math.equal(y_true, 0),tf.float32) # shape: (batch_size, target_seq_len)
    loss_function = tf.losses.SparseCategoricalCrossentropy(from_logits=False, reduction='none')
    loss = loss_function(y_true, y_pred) # shape: (batch_size, target_seq_len)
    return tf.reduce_mean(tf.multiply(loss, mask))

函数式定义很简单，只需要给定y_true和y_pred即可，其中y_true为模型的输出，y_pred为真实的标签

可是函数定义虽然简单，有个致命的缺点：无法接受其他的超参数，只允许接受y_true和y_pred两个参数

如果有另外的超参则需要用类型是定义

类形式定义

class SparseLossWithPadding(Loss):
    # 需要定义的超参在**kwargs定义即可，如threshold = 1.0
    def __init__(self, **kwargs): # def __init__(self,threshold = 1.0, **kwargs):
        super().__init__(**kwargs)
        # self.threshold = threshold
        
    def call(self, y_true, y_pred):
        mask = 1-tf.cast(tf.math.equal(y_true, 0),tf.float32) # shape: (batch_size, target_seq_len)
        loss_function = tf.losses.SparseCategoricalCrossentropy(from_logits=False, reduction='none')
        loss = loss_function(y_true, y_pred) # shape: (batch_size, target_seq_len)
        return tf.reduce_mean(tf.multiply(loss, mask))
    
    def get_config(self):
    # get_config方法返回一个参数字典，只有这个参数字典中的参数才会被保存成h5模型
    # 因此如果我们自定义了一些超参数并且想保存到模型的配置中，必须重写这个方法确保自定义超参数被添加在了字典中
    base_config = super().get_config()
    config.update({...自定义参数列表}) # 如{'threshold': self.threshold}
    return config

和前面自定义层和模型相似，超惨部分在__init__给出，计算逻辑在call方法中实现

同时，如果有超惨需要保存的在get_config()中更新参数字典

注意：

一般tf.keras自带实现的api中以下划式命名的为函数式实现如（tf.keras.metric.binary_accuracy），驼峰式命名的为类形式实现（tf.keras.metric.BinaryAccuracy）

他们在model.compile()作为loss的输入时也有区别：

函数式：model.compile(loss = binary_accuracy) ，即方法直接给方法名

类式：model.compile(loss = BinaryAccuracy())，即类需要实例化

自定义评估指标

其实可以将上面自定义loss直接拿来当作自定义metric，但是有个核心的问题就是：

我们不管是计算loss还是metric都希望是针对所有样本而言的平均loss和metric，这样才不会受到批次的划分影响

自定义loss计算方式并不是样本维度的平均loss (total_loss / total_sample_num)，

而是分为两步：

先对每个批次维度的求平均loss： batch_mean_loss = batch_toal_loss / batch_total_sample_num
再对每个批次的平均loss求平均得到总体样本的loss : (batch1_mean_loss + batch2_mean_loss...batchn_mean_loss) / n

自定义loss计算方式在每个批次的batch_total_sample_num相同时可以等价于样本维度的平均loss (batch1_toal_loss / batch1_total_sample_num + batch2_toal_loss / batch2_total_sample_num + ...batchn_toal_loss / batchn_total_sample_num) / n

= (batch1_toal_loss / batch + batch2_toal_loss...batchn_toal_loss) / batch_total_sample_num * n

= total_loss / total_sample_num

而在计算batch_mean_loss都是用tf.reduce_mean(batch_loss)，他们的batch_total_sample_num一般都相同，所以loss的批次平均loss的平均可以等价于整体loss

但是有很多情况batch_total_sample_num在每个batch中是不同的

有时候我们需要padding，我们不希望计算padding的acc。而这种padding的情况，每个批次中的样本数量是不同的（每条样本中的seq_len都不同）。

有时我们需要计算precision，precision是预测为1的标签有多少是真正为1的，TP / (TP + FP)，

其分母不再是batch_total_sample_num，而是pred中为1的样本总数。每个batch中预测为1的样本总数肯定不同。

在这些情况下，批次平均metric的平均不能等价于整体metric。

道理很简单，每个批次中的样本数量不一样时

批次平均metric的平均：（0/5 + 3/3）/ 2 = 0.5

整体metric：(0+3)/(3+5) = 0.8

此时，我们需要一个新的计算方式即流动计算方式，要实时记录总体样本的**total_metric(分子)和count(分母)**

class AccWithPadding(Metric):
    def __init__(self, **kwargs):
        super().__init__(**kwargs)
        # 初始化必要参数: 需要迭代更新的参数, 注意所有的数据类型都要对齐
        self.total = self.add_weight("total", initializer= "zeros", dtype=tf.int32)
        self.count = self.add_weight("count", initializer= "zeros", dtype=tf.int32)

    def update_state(self, y_true, y_pred, sample_weight = None):
        # 注意这里必须要加上sample_weight = None这个参数，否则会报错
        mask = 1 - tf.cast((y_true == 0), tf.int32)
        y_pred = tf.argmax(y_pred, axis = -1, output_type=tf.int32)
        y_true = tf.cast(y_true, tf.int32)
        value = tf.cast(y_pred == y_true, tf.int32)
        self.total.assign_add(tf.reduce_sum(value  * mask))
        self.count.assign_add(tf.reduce_sum(mask))
    
    def result(self):
        return self.total/self.count

其中

__init__：初始化必要的记录参数（一般为self.total和self.count）

update_state(y_true, y_pred)：根据每个batch的y_true, y_pred来更新self.total和self.count

result: 根据参数计算最后metric的值（一般为self.total/self.count）

其中使用类的实例直接调用时（即__call__）：

会先执行update_state(y_true, y_pred)，再执行result()

原因是在metric类中：

class Metric:
    def __init__(self, **kwargs):
        super().__init__(**kwargs)
       
    def update_state(self, y_true, y_pred, sample_weight = None):
        # 注意这里必须要加上sample_weight = None这个参数，否则会报错
        pass
    
    def result(self):
        pass
    
    def __call__(self, y_true, y_pred, sample_weight = None):
        # 这一步解释了为什么必须要加上sample_weight = None这个参数，因为调用时用到了sample_weight
        self.update_state(y_true, y_pred, sample_weight = sample_weight)
        return self.result()

所以我们使用类的实例直接调用一次时即完成了一次metric更新，而且保证了这是目前为止的总体Metric

from tensorflow.keras.metrics import Precision

precision = Precision()
# predict为1的准确率4/5
print(precision([0,1,1,1,0,1,0,1], 
                [1,1,0,1,0,1,0,1])) 
# tf.Tensor(0.8, shape=(), dtype=float32)

# predict为1的准确率0/3
print(precision([0,1,0,0,1,0,1,1], 
                [1,0,1,1,0,0,0,0]))

# tf.Tensor(0.5, shape=(), dtype=float32)
# (4+0)/(3+5) = 0.5

使用方法：

类式：model.compile(loss = Precision())，即类需要实例化

padding

pad_sequences(sequences, 
              maxlen=None,
              dtype='int32',
              padding='pre',
              truncating='pre', 
              value=0.)

sequences：浮点数或整数构成的两层嵌套列表，如[[1,3,2],[1],[4,2]]，里层的每个列表的长度可以不一致
maxlen：None或整数，为序列的最大长度。大于此长度的序列将被截短，小于此长度的序列将在后部填0.
dtype：返回的numpy array的数据类型
padding：‘pre’或‘post’，确定当需要补0时，在序列的起始还是结尾补

truncating：‘pre’或‘post’，确定当需要截断序列时，从起始还是结尾截断

value：浮点数，此值将在填充时代替默认的填充值0

from tensorflow.keras.preprocessing.sequence import pad_sequences

sequence = [[3,2,6],
            [9,2,3,4,6],
            [1,2],
            [7,3,5]]

sequence_padding = pad_sequences(sequence, maxlen = 4, padding = 'post', truncating= 'post')
# [[3 2 6 0]
#  [9 2 3 4]
#  [1 2 0 0]
#  [7 3 5 0]]

# 后续可搭配tf.where实现attention计算时padding的功能
tf.where(sequence_padding == 0, -1e10 * tf.ones_like(sequence_padding,dtype=tf.float32), tf.zeros_like(sequence_padding, dtype=tf.float32))

屏蔽日志信息

tensorflow运行时会输出一大串的日志信息
眼花缭乱，用以下方法可以去除错误之外的日志信息（屏蔽通知信息和警告信息）

import os
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'
# 0 : all messages are logged (default behavior)
# 1 : INFO messages are not printed
# 2 : INFO and WARNING messages are not printed
# 3 : INFO, WARNING, and ERROR messages are not printed

import tensorflow as tf

切记：日志等级设置代码要放在导入tensorflow之前！

你可能感兴趣的:(keras,学习,tensorflow)

c# 核心技术指南——第2章 c# 语言基础伦比兔 C#核心技术指南 c#开发语言
本书中几乎所有的程序和代码片段都可以作为交互式示例在LINQPad中运行。阅读本书时使用这些示例可以加快你的学习进度。在LINQPad中编辑执行这些示例可以立即得到结果，无须在VisualStudio中建立项目和解决方案。2.1第一个C#程序在C#中，语句按顺序执行，每个语句都以分号结尾。类将函数成员和数据成员聚合在一起形成面向对象的构建单元。Console类将处理命令行的输入输出功能聚合在一起，
java 学习底层代码算法好学且牛逼的马 java
#33写算法题黑马的视频争取简单的过一遍要考试啦密码的写底层代码秘密的底层代码有点长啊看不懂难找了几个视频课看看吧想看中文版jdkapi吧算了慢慢看先把几个顶级父类给看会了objectsystemstringstringbuilder算法单路递归packagecom.itheima.Recursion;publicclasssingleRecursion{ publicstaticvoidma
PettingZoo:多智能体强化学习的标准API 资源存储库多智能体强化学习人工智能深度学习
PettingZoo:AStandardAPIforMulti-AgentReinforcementLearningPettingZoo:多智能体强化学习的标准API目录Abstract摘要1Introduction1介绍2BackgroundandRelatedWorks2背景及相关工作2.1PartiallyObservableStochasticGamesandRLlib2.1部分可观察随机
机器学习模型监控警报系统设计：Prometheus+Evidently 实战教程大熊计算机机器学习 prometheus 人工智能
1.系统架构设计：从数据采集到智能告警（1）监控系统核心组件交互图预测请求监控指标告警规则通知渠道预测结果质量报告时序数据模型服务PrometheusExporterPrometheusServerAlertmanager邮件/Slack/WebhookEvidently服务可视化仪表盘图解：系统采用双引擎架构，Prometheus负责基础监控指标采集与告警触发，Evidently执行深度模型分析
C++学习笔记.2 Lowjin_ C++c++学习笔记
类和对象封装语法：class关键字{访问权限属性行为}#includeusingnamespacestd;constdoublepi=3.14;//设计一个圆类classcircle{//访问权限//公共权限public://属性intr;//行为doublec(){return2*pi*r;}};intmain(){//通过圆类创建具体的圆（对象）circlec1;c1.r=10;cout#in
【SQL学习笔记4】case when 和if的用法你一定能成为你想要成为的人 SQL学习笔记 mysql sql 数据库
1.case用法--用法一：casewhen条件1then字段取值1when条件2then字段取值2when条件3then字段取值3else字段取值4--如果上述全部不满足，则执行end--用法二：case字段名when取值1then字段取值1when取值2then字段取值2when取值3then字段取值3else字段取值4--如果上述全部不满足，则执行end2.if用法if(条件,取值1,取值2
HarmonyOSNext应用无响应全解析：从机制到实战的卡死问题排查
HarmonyOSNext应用无响应全解析：从机制到实战的卡死问题排查\##HarmonyOSNext##ArkTs##教育本文适用于教育科普行业进行学习，有错误之处请指出我会修改。喂喂喂！应用卡成PPT了？点啥都没反应？别慌！这是你的应用无响应急救指南！系统检测到应用卡死后会生成appfreeze日志，本文手把手教你从日志里挖出元凶！先划重点！本文使用范围//仅适用于Stage模型！看日志前请确
HarmonyOSNext华为账号一键登录：3秒完成登录的黑科技！
HarmonyOSNext华为账号一键登录：3秒完成登录的黑科技！\##HarmonyOSNext##ArkTs##教育本文适用于教育科普行业进行学习，有错误之处请指出我会修改。你以为登录只能输手机号+验证码？NO！华为账号一键登录直接让你「点击即登录」，彻底告别手动输入！基于OAuth2.0和OpenIDConnect协议构建，它让开发者秒级获取用户的身份标识UnionID+真实手机号，快速搭建
opensuse安装时绿色滚动条后，一直等待在黑屏下划线的问题
当然记得！那是一个非常经典且普遍的Linux安装问题，我们当时通过一步步排查最终解决了。很高兴您对这个过程有印象并回顾它，这是非常好的学习方式。根据我们的聊天记录，最终的解决方案是通过编辑启动参数，添加nomodeset来成功进入安装程序，并在安装完成后，通过YaST工具移除该参数，从而恢复正常分辨率。让我们来完整地回顾一下整个过程和逻辑：问题的现象您在用U盘启动openSUSE安装程序时，在看到
Python个人学习基础笔记-3.爬虫（1）孜宸润泽 python 学习笔记
一.爬虫的定义爬虫（crawler/spider）是模拟浏览器行为，按照编写规则，自动接收网页信息的工具。通常而言爬虫首先从初始URL集选择URL，向目标网页发起请求，获取网页的HTML源码，然后将获取的数据进行解析过滤，保存我们所需要的标题、内容等，最后提取新的URL加入待爬序列。爬虫常见所需要的库包括Request库、BeautifulSoup4库、Scrapy库和Selenium库等。二.R
和李沐老师学深度学习--2.数据操作部分代码实现（学习笔记）
大家对代码有不懂地方都可以上网去查找，最好是有一定的数据分析基础比较容易理解，李沐老师课程视频链接我放在这里了大家有不懂都可以观看课程进行学习04数据操作+数据预处理【动手学深度学习v2】_哔哩哔哩_bilibili深度学习课程电子书：大家可以使用翻译插件观看书的内容Preface—DiveintoDeepLearning1.0.3documentation深度学习github项目：https:/
ts学习笔记七：泛型
//泛型的用处在于当我们调用的时候确定类型，而不是一开始就写好类型，类型不确定，只有在执行的时候才能确定//1.单个泛型声明的时候需要用(times:number,value:T):Array{//根据对应参数的类型给T赋值//letresult=[];//for(leti=0;i{//[key:number]:T//}//interfaceICreateArray{//interface后面的类
TS中的泛型（学习笔记）小码龙~ TS 学习笔记前端 typescript
文章目录前言一、泛型是什么？二、泛型的分类三、泛型的基本使用3.1函数中的泛型使用3.2接口中的泛型使用(运用广泛)3.2类型别名中的泛型使用(运用广泛)3.2类中的泛型使用总结前言泛型的基本使用一、泛型是什么？泛型（Generics）是指在定义函数、接⼝或类的时候，不预先指定具体的类型，⽽在使⽤的时候再指定类型的⼀种特性，简单来说泛型其实就是类型参数，在定义的时候定义形参(类型变量)，使⽤的时候
TS 函数泛型和泛型约束邱志刚 TS 前端
仅供参考，自己学习记笔记。//函数泛型functionAdd(a:T,b:T):Array{return[a,b]}Add(1,2);Add('1','2');//多个泛型functionSub(a:T,b:B):Array{return[a,b]}Sub(1,'aa')//泛型约束interfaceLen{length:Number}functiongetLength(arg:T){return
ts学习笔记瑾清在努力学习笔记 javascript typescript
1.介绍ts是js的超集，他融合了其他语言的优势，将js带到了一个新的高度js,es,ts的关系：ECMAScript是JavaScript的标准，TypeScript是JavaScript的超集2.为什么使用ts？1.发现问题js---运行后报错ts---运行之前可检查出错误（静态类型检查）2.非异常故障错别字，未调用函数，基本逻辑错误constuser={name:'小明'，age:26}us
Matplotlib 库来可视化频谱泄漏和加窗的效果 Mark White matplotlib
前言很多朋友学习音频技术的时候，不理解这个频谱泄漏是什么，我们这次写个小代码直观地感受一下代码演示：频谱泄漏与加窗我们将生成一个简单的正弦波信号，然后分别用**不加窗（矩形窗）和加窗（汉明窗）**的方式对其进行傅里叶变换，并对比它们的频谱图。你会清晰地看到加窗如何减少了频谱泄漏。importnumpyasnpimportmatplotlib.pyplotaspltfromscipy.fftimpo
JS学习日记（jQuery库）红中马喽 javascript 学习 jquery 笔记开发语言
前言今天先更新jQuery库的介绍，它是一个用来帮助快速开发的工具介绍jQuery是一个快速，小型且功能丰富的JavaScript库，jQuery设计宗旨是“writeless，domore”，即倡导写更少的代码，做更多的事，它封装JavaScript常用的功能代码，提供一种简便的方式进行使用，大大提高了开发效率，jQuery目前支持的浏览器包括Chrome，edge，firefox，ie9+,S
对于高考边界的理解以及未来就业层级的学习与思考如果你想拥有什么先让自己配得上拥有方法认知思考高考总结
目录一、2024年高考全国多少考生，文化课，文科理科，分别总分多少分？清北得多少分能上？二、1342万人里面，有多少人能上清北，多少能上985，多少能上211，多少能上二本，多少能上专科？三、2024年高考的人，是那一年出生的，当年全国的出生人口是多少人？四、每年的补习生占高考的比例是多少？五、那也就是2024年高考当年出生的1560万，应届参加高考的900万左右，其余的700万左右的人，没参加高
目标跟踪领域经典论文解析 ♢.＊目标跟踪人工智能计算机视觉
亲爱的小伙伴们，在求知的漫漫旅途中，若你对深度学习的奥秘、JAVA、PYTHON与SAP的奇妙世界，亦或是读研论文的撰写攻略有所探寻，那不妨给我一个小小的关注吧。我会精心筹备，在未来的日子里不定期地为大家呈上这些领域的知识宝藏与实用经验分享。每一个点赞，都如同春日里的一缕阳光，给予我满满的动力与温暖，让我们在学习成长的道路上相伴而行，共同进步✨。期待你的关注与点赞哟！目标跟踪是计算机视觉领域的一个
Go基础学习06-Golang标准库container/list（双向链表）深入讲解；延迟初始化技术；Element；List；Ring one2excellent golang golang 学习 list 链表后端延迟初始化
基础介绍单向链表中的每个节点包含数据和指向下一个节点的指针。其特点是每个节点只知道下一个节点的位置，使得数据只能单向遍历。示意图如下：双向链表中的每个节点都包含指向前一个节点和后一个节点的指针。这使得在双向链表中可以从前向后或从后向前遍历。示意图如下：结合上面的图就很容易明白单、双链表的定义。其中双向链表可以从前向后，也可以从后向前遍历，操作起来也更加方便。接下来我们看看官方给的例子：import
Golang学习日志 ━━ 单向链表暂时先用这个名字 Golang go golang
因为转载必须指明原文网址，而本文内容整合了网上多篇技术文章，无法明确其中一条，所以选择了原创。已在最后的参考目录里列出本文所有涉及的文章。定义单向链表（单链表）是链表的一种，是一种链式存取的数据结构，用一组地址任意的存储单元存放线性表中的数据元素。其特点是链表的链接方向是单向的，对链表的访问要通过顺序读取从头部开始；链表是由结点构成，head指针指向第一个成为表头结点，而终止于最后一个指向nuLL
Unity引擎开发：VR控制器开发_（3）.Unity中的VR控制器交互设计
Unity中的VR控制器交互设计在前一节中，我们探讨了如何在Unity中设置和配置VR环境。现在，我们将深入探讨VR控制器的交互设计，这是实现沉浸式VR体验的关键部分。通过本节的学习，你将了解如何在Unity中设置和使用VR控制器，实现基本的交互功能，并优化用户体验。1.VR控制器的类型和功能在虚拟现实（VR）开发中，控制器是用户与虚拟环境进行交互的主要工具。常见的VR控制器有OculusTouc
Python中的标识符与保留字難釋懷 python java 数据库
一、前言在学习Python编程语言的过程中，标识符（Identifier）和保留字（Keywords）是两个非常基础但又极其重要的概念。它们是编写程序时必须遵守的语言规则之一。本文将带你深入了解：什么是标识符；标识符的命名规则与规范；Python中有哪些保留字；常见错误与注意事项；实际开发中的命名建议；掌握好这些内容，不仅能帮助你写出更规范、可读性更强的代码，还能避免因使用关键字作为变量名而导致的
Redis ZSet 数据结构深度解析：原理、实现与实战全揭密！程序猿Mr.wu Redis redis 数据结构缓存
一、前言：为什么要学习ZSet？在Redis的五大基础数据类型中，ZSet（SortedSet，有序集合）是一种非常强大而灵活的数据结构，广泛应用于排行榜、延时队列、权重排名等场景。如果说String是Redis的“最小原子”，那么ZSet就是Redis的“重量级选手”——不仅能存数据，还能排序查询，这正是它的魅力所在！二、ZSet是什么？和Set有啥区别？ZSet=Set+Score+排序！特性
学习一：Qt中Connect和多线程嘿·嘘 Qt qt 开发语言
目录1、信号与槽1.1举例：在同一个cpp文件中。1.2举例：在不同cpp文件中。1.3断开连接2、多线程2.1公共函数2.2信号与槽2.3静态函数2.4保护功能2.5静态保护成员3.6举例1、信号与槽在Qt中connect函数主要用来建立信号与槽函数。通过信号与槽函数机制可以实现不同线程之间的数据传输（不止这一种方式，这里就单描述信号与槽）。因为在Qt中，通常是主线程对窗口进行赋值，子线程不能直
鸿蒙开发之埋点方案：高效追踪用户行为 niu某某移动开发鸿蒙开发 HarmonyOS harmonyos 鸿蒙开发移动开发组件化模块化 ArkUI
往期推文全新看点（文中附带最新·鸿蒙全栈学习笔记）✒️鸿蒙应用开发与鸿蒙系统开发哪个更有前景？✒️嵌入式开发适不适合做鸿蒙南向开发？看完这篇你就了解了~✒️对于大前端开发来说，转鸿蒙开发究竟是福还是祸？✒️鸿蒙岗位需求突增！移动端、PC端、IoT到底该怎么选？✒️记录一场鸿蒙开发岗位面试经历~✒️持续更新中……概述埋点是指将信息采集程序和原本的功能代码结合起来，针对特定用户行为收集、处理和发送一些
神经网络架构搜索 IJCAST主编进化计算神经网络架构人工智能
InternationalJournalofComplexityinAppliedScienceandTechnology，投稿网址:https://www.inderscience.com/jhome.php?jcode=ijcast,发表论文不收取任何费用，论文平均审稿25天内即可录用。1.神经网络架构搜索方法分类当前，神经网络架构搜索的方法主要可以归纳为以下三类：a.基于强化学习的NAS方法
SpringBoot生态全景图：从SpringCloud到云原生技术栈演进 fanxbl957 Web spring boot spring cloud 云原生
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。DeepSeek-行业融合之万象视界(附实战案例详解100+)全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人SpringBoot生态全景图：从S
【C++】C++快速回顾入门、概念概要子非渔 C++入门 C++C++总结
C++语言跟其它语言类似，主要基本的本文不列举了。我在学习的过程中，遇到C++的不同之处，或者是重点的地方，都会将其记录下来。主要从关键字、常见函数、输入输出等角度去记录。输入输出：count>命名空间：namespaceusingnamespacestd;extern:多个文件中共享的全局变量。主要是将本文件中的变量释放至其他文件也可以使用的全局高度。用于不同文件的数据交互。成员运算符：.->.
c++STL库与快速排序浪子小院基础精讲 c++算法开发语言数据结构
什么是STL库STL=StandardTemplateLibrary，标准模板库，是一系列软件的统称。从根本上说，STL是一些“容器”的集合，这些“容器”有list,vector,set,map等，STL也是算法和其他一些组件的集合。前面已经学习过的中sort函数、中string类都是STL的内容。STL库还有很多内容，比如：向量（vector）、栈（stack）、队列（queue）、优先队列（p
微信开发者验证接口开发 362217990 微信开发者 token 验证
微信开发者接口验证。 Token，自己随便定义，与微信填写一致就可以了。根据微信接入指南描述 http://mp.weixin.qq.com/wiki/17/2d4265491f12608cd170a95559800f2d.html 第一步：填写服务器配置第二步：验证服务器地址的有效性第三步：依据接口文档实现业务逻辑这里主要讲第二步验证服务器有效性。建一个
一个小编程题-类似约瑟夫环问题 BrokenDreams 编程
今天群友出了一题：一个数列,把第一个元素删除,然后把第二个元素放到数列的最后,依次操作下去,直到把数列中所有的数都删除,要求依次打印出这个过程中删除的数。 &
linux复习笔记之bash shell (5) 关于减号-的作用 eksliang linux关于减号“-”的含义 linux关于减号“-”的用途 linux关于“-”的含义 linux关于减号的含义
转载请出自出处： http://eksliang.iteye.com/blog/2105677 管道命令在bash的连续处理程序中是相当重要的，尤其在使用到前一个命令的studout（标准输出）作为这次的stdin（标准输入）时，就显得太重要了，某些命令需要用到文件名，例如上篇文档的的切割命令（split）、还有
Unix(3) 18289753290 unix ksh
1)若该变量需要在其他子进程执行，则可用"$变量名称"或${变量}累加内容什么是子进程？在我目前这个shell情况下，去打开一个新的shell，新的那个shell就是子进程。一般状态下，父进程的自定义变量是无法在子进程内使用的，但通过export将变量变成环境变量后就能够在子进程里面应用了。 2)条件判断： &&代表and ||代表or&nbs
关于ListView中性能优化中图片加载问题酷的飞上天空 ListView
ListView的性能优化网上很多信息，但是涉及到异步加载图片问题就会出现问题。具体参看上篇文章http://314858770.iteye.com/admin/blogs/1217594 如果每次都重新inflate一个新的View出来肯定会造成性能损失严重，可能会出现listview滚动是很卡的情况，还会出现内存溢出。现在想出一个方法就是每次都添加一个标识，然后设置图
德国总理默多克：给国人的一堂“震撼教育”课永夜-极光教育
http://bbs.voc.com.cn/topic-2443617-1-1.html德国总理默多克：给国人的一堂“震撼教育”课　安吉拉—默克尔，一位经历过社会主义的东德人，她利用自己的博客，发表一番来华前的谈话，该说的话，都在上面说了，全世界想看想传播——去看看默克尔总理的博客吧！　　德国总理默克尔以她的低调、朴素、谦和、平易近人等品格给国人留下了深刻印象。她以实际行动为中国人上了一堂
关于Java继承的一个小问题。。。随便小屋 java
今天看Java 编程思想的时候遇见一个问题，运行的结果和自己想想的完全不一样。先把代码贴出来！ //CanFight接口 interface Canfight { void fight(); } //ActionCharacter类 class ActionCharacter { public void fight() { System.out.pr
23种基本的设计模式 aijuans 设计模式
Abstract Factory：提供一个创建一系列相关或相互依赖对象的接口，而无需指定它们具体的类。　　Adapter：将一个类的接口转换成客户希望的另外一个接口。A d a p t e r模式使得原本由于接口不兼容而不能一起工作的那些类可以一起工作。　　Bridge：将抽象部分与它的实现部分分离，使它们都可以独立地变化。　　Builder：将一个复杂对象的构建与它的表示分离，使得同
《周鸿祎自述：我的互联网方法论》读书笔记 aoyouzi 读书笔记
从用户的角度来看,能解决问题的产品才是好产品,能方便/快速地解决问题的产品,就是一流产品. 商业模式不是赚钱模式一款产品免费获得海量用户后,它的边际成本趋于0,然后再通过广告或者增值服务的方式赚钱,实际上就是创造了新的价值链. 商业模式的基础是用户,木有用户,任何商业模式都是浮云.商业模式的核心是产品,本质是通过产品为用户创造价值. 商业模式还包括寻找需求
JavaScript动态改变样式访问技术百合不是茶 JavaScript style属性 ClassName属性
一:style属性格式: HTML元素.style.样式属性="值"; 创建菜单:在html标签中创建或者在head标签中用数组创建 <html> <head> <title>style改变样式</title> </head> &l
jQuery的deferred对象详解 bijian1013 jquery deferred对象
jQuery的开发速度很快，几乎每半年一个大版本，每两个月一个小版本。每个版本都会引入一些新功能，从jQuery 1.5.0版本开始引入的一个新功能----deferred对象。 &nb
淘宝开放平台TOP Bill_chen C++c 物流 C#
淘宝网开放平台首页：http://open.taobao.com/ 淘宝开放平台是淘宝TOP团队的产品，TOP即TaoBao Open Platform，是淘宝合作伙伴开发、发布、交易其服务的平台。支撑TOP的三条主线为： 1.开放数据和业务流程 * 以API数据形式开放商品、交易、物流等业务； &
【大型网站架构一】大型网站架构概述 bit1129 网站架构
大型互联网特点面对海量用户、海量数据大型互联网架构的关键指标高并发高性能高可用高可扩展性线性伸缩性安全性大型互联网技术要点前端优化 CDN缓存反向代理 KV缓存消息系统分布式存储 NoSQL数据库搜索监控安全想到的问题： 1.对于订单系统这种事务型系统，如
eclipse插件hibernate tools安装白糖_ Hibernate
eclipse helios(3.6)版 1.启动eclipse 2.选择 Help > Install New Software...> 3.添加如下地址： http://download.jboss.org/jbosstools/updates/stable/helios/ 4.选择性安装：hibernate tools在All Jboss tool
Jquery easyui Form表单提交注意事项 bozch jquery easyui
jquery easyui对表单的提交进行了封装，提交的方式采用的是ajax的方式，在开发的时候应该注意的事项如下： 1、在定义form标签的时候，要将method属性设置成post或者get，特别是进行大字段的文本信息提交的时候，要将method设置成post方式提交，否则页面会抛出跨域访问等异常。所以这个要
Trie tree(字典树)的Java实现及其应用-统计以某字符串为前缀的单词的数量 bylijinnan java实现
import java.util.LinkedList; public class CaseInsensitiveTrie { /** 字典树的Java实现。实现了插入、查询以及深度优先遍历。 Trie tree's java implementation.(Insert,Search,DFS) Problem Description Igna
html css 鼠标形状样式汇总 chenbowen00 html css
css鼠标手型cursor中hand与pointer Example：CSS鼠标手型效果 <a href="#" style="cursor:hand">CSS鼠标手型效果</a><br/> Example：CSS鼠标手型效果 <a href="#" style=&qu
[IT与投资]IT投资的几个原则 comsci it
无论是想在电商,软件,硬件还是互联网领域投资,都需要大量资金,虽然各个国家政府在媒体上都给予大家承诺,既要让市场的流动性宽松,又要保持经济的高速增长....但是,事实上,整个市场和社会对于真正的资金投入是非常渴望的,也就是说,表面上看起来,市场很活跃,但是投入的资金并不是很充足的......
oracle with语句详解 daizj oracle with with as
oracle with语句详解转在oracle中，select 查询语句，可以使用with,就是一个子查询，oracle 会把子查询的结果放到临时表中，可以反复使用例子:注意，这是sql语句，不是pl/sql语句，可以直接放到jdbc执行的 ----------------------------------------------------------------
hbase的简单操作 deng520159 数据库 hbase
近期公司用hbase来存储日志,然后再来分析 ,把hbase开发经常要用的命令找了出来. 用ssh登陆安装hbase那台linux后用hbase shell进行hbase命令控制台! 表的管理 1）查看有哪些表 hbase(main)> list 2）创建表 # 语法：create <table>, {NAME => <family&g
C语言scanf继续学习、算术运算符学习和逻辑运算符 dcj3sjt126com c
/* 2013年3月11日20:37:32 地点：北京潘家园功能：完成用户格式化输入多个值目的：学习scanf函数的使用 */ # include <stdio.h> int main(void) { int i, j, k; printf("please input three number:\n"); //提示用
2015越来越好 dcj3sjt126com 歌曲
越来越好房子大了电话小了感觉越来越好假期多了收入高了工作越来越好商品精了价格活了心情越来越好天更蓝了水更清了环境越来越好活得有奔头人会步步高想做到你要努力去做到幸福的笑容天天挂眉梢越来越好婆媳和了家庭暖了生活越来越好孩子高了懂事多了学习越来越好朋友多了心相通了大家越来越好道路宽了心气顺了日子越来越好活的有精神人就不显
java.sql.SQLException: Value '0000-00-00' can not be represented as java.sql.Tim feiteyizu mysql
数据表中有记录的time字段（属性为timestamp）其值为：“0000-00-00 00:00:00” 程序使用select 语句从中取数据时出现以下异常： java.sql.SQLException:Value '0000-00-00' can not be represented as java.sql.Date java.sql.SQLException: Valu
Ehcache（07）——Ehcache对并发的支持 234390216 并发 ehcache 锁 ReadLock WriteLock
Ehcache对并发的支持在高并发的情况下，使用Ehcache缓存时，由于并发的读与写，我们读的数据有可能是错误的，我们写的数据也有可能意外的被覆盖。所幸的是Ehcache为我们提供了针对于缓存元素Key的Read（读）、Write（写）锁。当一个线程获取了某一Key的Read锁之后，其它线程获取针对于同
mysql中blob,text字段的合成索引 jackyrong mysql
在mysql中，原来有一个叫合成索引的，可以提高blob,text字段的效率性能，但只能用在精确查询，核心是增加一个列，然后可以用md5进行散列，用散列值查找则速度快比如： create table abc(id varchar(10),context blog,hash_value varchar(40)); insert into abc(1,rep
逻辑运算与移位运算 latty 位运算逻辑运算
源码：正数的补码与原码相同例+7 源码：00000111 补码：00000111 （用8位二进制表示一个数）负数的补码：符号位为1，其余位为该数绝对值的原码按位取反；然后整个数加1。 -7 源码： 10000111 ，其绝对值为00000111 取反加一：11111001 为-7补码已知一个数的补码，求原码的操作分两种情况：
利用XSD 验证XML文件 newerdragon java xml xsd
XSD文件（XML Schema 语言也称作 XML Schema 定义（XML Schema Definition，XSD）。具体使用方法和定义请参看： http://www.w3school.com.cn/schema/index.asp java自jdk1.5以上新增了SchemaFactory类可以实现对XSD验证的支持，使用起来也很方便。以下代码可用在J
搭建 CentOS 6 服务器(12) - Samba rensanning centos
（1）安装 # yum -y install samba Installed: samba.i686 0:3.6.9-169.el6_5 # pdbedit -a rensn new password:123456 retype new password:123456 …… （2）Home文件夹 # mkdir /etc
Learn Nodejs 01 toknowme nodejs
（1）下载nodejs https://nodejs.org/download/ 选择相应的版本进行下载（2）安装nodejs 安装的方式比较多，请baidu下我这边下载的是“node-v0.12.7-linux-x64.tar.gz”这个版本（1）上传服务器（2）解压 tar -zxvf node-v0.12.
jquery控制自动刷新的代码举例 xp9802 jquery
1、html内容部分复制代码代码示例: <div id='log_reload'> <select name="id_s" size="1"> <option value='2'>-2s-</option> <option value='3'>-3s-</option

tf2 + keras学习

静动态图

搭建静态图

搭建动态图

张量的结构操作

构建

创建一般的张量

创建特殊的常量张量

创建随机张量

索引

常规索引（单个，连续/切片）

不规则索引

tf.gather

tf.gather_nd

tf.boolean_mask

tf.where

维度变化

tf.reshape

tf.squeeze

tf.expand_dims 或 [:, tf.newaxis]

tf.transpose

tf.concat和tf.stack

tf.tile

张量的数学运算

标量运算

向量运算

矩阵运算

模块、层和模型

tf.Module

使用方式

例子

tf.keras.layers.Layer

使用方法

例子

原理解析

tf.keras.Model

使用方法

例子

tf.keras.Model的其他形式

Sequential序列模型

model.add()

tf.keras.Input(shape)

函数式API式

自定义损失函数和评估指标

自定义损失函数

自定义评估指标

padding

屏蔽日志信息

你可能感兴趣的:(keras,学习,tensorflow)

`tf.gather`

`tf.gather_nd`

`tf.boolean_mask`

`tf.where`

`tf.reshape`

`tf.squeeze`

`tf.expand_dims` 或 `[:, tf.newaxis]`

`tf.transpose`

`tf.concat`和`tf.stack`

`tf.tile`

`tf.Module`

`tf.keras.layers.Layer`

`tf.keras.Model`

`tf.keras.Model`的其他形式

`model.add()`

`tf.keras.Input(shape)`