图神经网络(三):数学基础

一.复数空间

在实数空间中,加法、减法可以看成是沿数轴的左右平移,乘法、除法可以看成是沿数轴的拉伸和压缩。但是在现实生活中除了平移和缩放以外,还存在旋转。在复数发明之前,处理旋转问题是非常麻烦的。

1.复数的定义

i 2 i^2 i2 = -1,这就是复数中虚数的基本定义。对该式的直观理解可以将其拆解成1 x i x i = -1,即数字“1”经过2次完全一样的操作,变成了“-1”,由此我们可以联想到下图旋转操作:先旋转90度,再旋转90度,即i代表旋转操作。
图神经网络(三):数学基础_第1张图片

2. e i x e^{ix} eix代表了什么

我们知道,e是能够表征物质的连续变化,本质是一种极限,定义为:
e x = lim ⁡ n → ∞ ( 1 + x n ) n e^x = \lim_{n \to \infty} (1+\frac{x}{n})^n ex=nlim(1+nx)n
如果将定义中的x换成ix,则可以得到:
e i x = lim ⁡ n → ∞ ( 1 + i x n ) n e^{ix} = \lim_{n \to \infty} (1+\frac{ix}{n})^n eix=nlim(1+nix)n
该式用MATLAB可视化如下:
当n=20时
图神经网络(三):数学基础_第2张图片

当n=50时
图神经网络(三):数学基础_第3张图片

当n=500时
图神经网络(三):数学基础_第4张图片

当n=5000时
图神经网络(三):数学基础_第5张图片

从上可见,当n足够大的时候, e i x e^{ix} eix其实就是一个单位圆。并且容易看出 e i x e^{ix} eix代表一簇矢量,矢量的角度为x,矢量的幅值为1,于是可以得到下面的图形:
图神经网络(三):数学基础_第6张图片

二.欧拉恒等式

e i x = c o s ( x ) + i s i n ( x ) e^{ix} = cos(x) + isin(x) eix=cos(x)+isin(x)这就是著名的欧拉恒等式。取式中的 x = π x=\pi x=π便可得到:
e i π + 1 = 0 e^{i\pi} + 1 = 0 e+1=0
欧拉恒等式被认为是数学上最优美的公式之一,在各大最美的公式排行榜中都留有一席之地,因为它将自然常数e,圆周率 π \pi π,虚数单位 i i i,自然数1以及0这五个最基本的数字用两个基本的运算符+和=连接在一起了,被认为是上帝写下的音符。该式可以理解为:自然数1,绕坐标中心旋转180度( e i π e^{i\pi} e),再平移1,就回到坐标原点。

三.傅里叶变换

傅里叶变换的核心是从时域到频域的变换,而这种变换是通过一组特殊的正交基来实现的。

1.时域

时域是描述一个数学函数或物理信号对时间的关系,这也是我们日常中最容易直观感受的一种域。从我们学物理开始,很多物理量的定义都是跟时间相关的。

  • 速度:位移与发生这个位移所用的时间之比
  • 电流:单位时间里通过导体任一横截面的电量
  • 功率:物体在单位时间内所做的功的多少

很多物理量的定义都是基于单位时间产生的效果或变化,以时间为参考让我们更容易理解。但是容易理解不代表方便使用或计算。
比如截取一段音频的波形图(来自李荣浩《麻雀》的副歌部分——“我飞翔在乌云之中,你看着我无动于衷…”),如下图:
图神经网络(三):数学基础_第7张图片

其中横轴是时间t,纵轴是振幅A[-1,1]。
假设播放器读入这段音频进行音频播放。现在想让音量大一些,播放器应该怎么做?
因为上面的波形图的振幅对应的其实就是声音的强度,如果想让音量大一些,只需要将整体的振幅同比例扩大即可。这个需求看起来很容易满足。
但如果有人比较喜欢低音效果,想加强上面这段音乐的低音部分,使其更厚重一些,那此时播放器应该怎么做呢?
虽然这是一段美妙的音乐,但是从时域的图像看起来,似乎杂乱无章,想找到低音部分根本无从下手,更不用说将低音部分加强了。因为高中低音在时域中是杂糅在一起的,因此无法将他们剥离开来,随便改动波形图中的一小部分,都会同时影响到高中低音,所以如果播放器仅仅对时域信号进行处理时无法完成这个需求的。

2.频域

频域就是描述频率所用到的空间或者说坐标系。频率虽然抽象,但是在我们的生活中时无处不在的。对于波来说,频率是每秒波形重复的数量。再比如家里用的交流电是50Hz,意思就是电压每秒完成50次振荡周期。更普遍的说,频率就是物质每秒钟完成周期性变化的次数。
而前面提到的低音效果是什么样的效果呢?就好比家庭影院中的低音炮,它是如何实现重低音的呢?简单来说,可以将它简化成一个低通滤波器,下图是低通滤波器的频率响应曲线。
图神经网络(三):数学基础_第8张图片

横轴是频率(Hz),纵轴是声音大小(dB)。
所谓的低音效果,其实就是对人声中的低音部分保留或增强,对应上图中左侧的横线部分;而对于人声中的高音部分进行衰减,对应上图中右侧的斜坡部分。通过这个低通滤波器,我们就能将低音过滤,将高音衰减。
可见,低音效果是在频率范围内考虑问题,而波形图是在时域内的图像,所以如果想在时域内解决低音效果的问题,就好比鸡同鸭讲。所以我们就需要找到一个沟通时域和频域的桥梁,也就是一个翻译,让时域和频域能够无障碍的沟通。但是,时域和频域表达的又只能是同一种信息,只是表现形式不同。就好比人们想了解古埃及文化,但完全不了解古埃及象形文的含义,所以也就无法根据记载的文字了解当时的文化。直到商博良破译了罗塞塔石碑上的古埃及象形文,才打开了古埃及文化的大门。

3.时域转频域

图神经网络(三):数学基础_第9张图片

傅立叶变换将原来难以处理的时域信号转换成了易于分析的频域信号(信号的频谱),可以利用一些工具对这些频域信号进行处理、加工。最后还可以利用傅立叶反变换将这些频域信号转换成时域信号。从现代数学的眼光来看,傅里叶变换是一种特殊的积分变换。它能将满足一定条件的某个函数表示成正弦基函数的线性组合或者积分。在不同的研究领域,傅里叶变换具有多种不同的变体形式:

  • 非周期性连续信号:傅立叶变换 (Fourier Transform)
  • 周期性连续信号:傅立叶级数 (Fourier Series)
  • 非周期性离散信号:离散时域傅立叶变换 (Discrete Time Fourier Transform)
  • 周期性离散信号:离散傅立叶变换 (Discrete Fourier Transform)

傅里叶变换的功能是把时域上的函数变成频域上的函数。
在这里插入图片描述

可以看到,傅里叶变换的定义就是信号函数和基函数的积分。这个基函数就是拉普拉斯算子 Δ \Delta Δ的特征函数,即满足以下特征方程: Δ g = λ g \Delta g = \lambda g Δg=λg
称为傅里叶变换的基函数。

3.1 拉普拉斯算子

在这里插入图片描述

就是说,拉普拉斯算子的作用是对各个分量的二阶偏导求和,把 e − ω t i e^{-\omega ti} eωti代入特征方程,得到$\Delta e^{-\omega ti}=- \omega2e{-\omega ti} ,即 ,即 ,即e^{-\omega ti}$ 是拉普拉斯算子的特征函数。

3.2 二阶差分

要在图上建立其对应关系,首先看离散化的二阶导数是什么。为方便讨论,设自变量为 x 0 , x 1 , … , x n x_0,x_1,…,x_n x0,x1,,xn,令 h = x i + 1 − x i h = x_{i+1} - x_i h=xi+1xi,考虑 x k x_k xk处的二阶导,分别将 y k − 1 y_{k-1} yk1 y k + 1 y_{k+1} yk+1泰勒展开:
图神经网络(三):数学基础_第10张图片

将两式相加,把余项丢掉,整理得到:
图神经网络(三):数学基础_第11张图片

这样便有了离散形式下的二阶导了。

3.3 图上的二阶导和拉普拉斯算子

注意到上面 x 0 , x 1 , … , x n x_0,x_1,…,x_n x0,x1,,xn 是一维在实轴上从左到右的, x k − 1 , x k + 1 x_{k-1},x_{k+1} xk1,xk+1 x k x_k xk 的“邻居”。图上的结点对应的是自变量,信号函数是“结点域”上的函数,而图上结点之间并没有这种全序关系因此考虑所以邻居结点。拉普拉斯算子是对各个方向的二阶导数求和,那图上 的拉普拉斯算子就是对各个邻居结点方向上的二阶导求和,不妨设h=1,则图上的拉普拉斯算子可以推广为:
在这里插入图片描述

3.4 图上的拉普拉斯矩阵

L = D - A
我们把这个L作用的信号函数上
图神经网络(三):数学基础_第12张图片

可以看到L相当于拉普拉斯算子,虽然他们之间相差了一个符号,但是没有关系,因为特征向量前面添个负号依然是特征向量。

3.5 图上的傅里叶变换

傅里叶变换就是时域上的信号函数乘以拉普拉斯特征函数对时间进行积分。
图上的傅里叶变换就是“结点域”上的信号函数乘以拉普拉斯矩阵的特征向量对结点进行求和:
在这里插入图片描述

其中 u k u_k uk是L的特征向量,写成矩阵的形式 F f = U T f Ff = U^T f Ff=UTf

你可能感兴趣的:(自然语言处理,基础理论,图神经网络,神经网络,matlab,算法)