ballball~~

PSNR、SSIM等图像质量评估指标详解

简介：个人学习分享，如有错误，欢迎批评指正。

一、PSNR（Peak Signal-to-Noise Ratio）峰值信噪比

1. 定义

PSNR 是一种用于衡量两幅图像之间差异的客观指标。它主要用于评估图像压缩、传输或重建算法的效果。PSNR 值越高，表示两幅图像越相似，质量损失越小。

PSNR 基于信号与噪声的概念，其理论基础来自信息论中的信噪比（SNR，Signal-to-Noise Ratio）。PSNR 将图像质量的评估转化为信号（原始图像）与噪声（失真部分）的比例。

1.1 信噪比（SNR）

信噪比定义为信号功率与噪声功率的比值，通常以分贝为单位表示：

$\text{SNR} = 10 \cdot \log_{10} \left( \frac{\text{信号功率}}{\text{噪声功率}} \right)$
在 PSNR 中，信号功率对应于图像的最大可能像素值平方，噪声功率对应于均方误差（MSE）。

1.2 对数转换

通过对信噪比进行对数转换，PSNR 能够将大的动态范围压缩到较小的尺度，更符合人类对变化的感知。

2. 数学原理

PSNR 基于均方误差（MSE，Mean Squared Error），通过对误差进行对数转换，得到一个以分贝（dB）为单位的指标。

2.1 均方误差（MSE）

均方误差是两幅图像像素值差异的平均值，其计算公式为：

$\text{MSE} = \frac{1}{MN} \sum_{i=1}^{M} \sum_{j=1}^{N} \left[ I_1(i, j) - I_2(i, j) \right]^2$

其中：

$I_1$ 和 $I_2$ 是两幅图像，
$M$ 和 $N$ 分别是图像的高度和宽度，
$i$ 和 $j$ 是像素的位置索引。

2.2 PSNR 公式

有了 MSE 后，PSNR 可以通过以下公式计算：

$\text{PSNR} = 10 \cdot \log_{10} \left( \frac{\text{MAX}^2}{\text{MSE}} \right)$

其中：

MAX 是图像中可能的最大像素值。例如，对于8位图像，MAX=255。

2.3 物理意义

PSNR 反映了信号（原图像）与噪声（失真部分）之间的比例。较高的 PSNR 值表示较少的噪声，图像质量较高。

3. 优缺点

优点

简单易计算：PSNR 的计算过程简单，计算效率高，适合大规模图像处理任务。
广泛应用：作为经典指标，许多研究和应用中都采用 PSNR 进行评估，便于结果比较。
明确的物理意义：PSNR 以分贝为单位，易于理解和解释。

缺点

感知不一致：PSNR 基于像素级误差，未能充分反映人类视觉系统对图像质量的感知。
忽略结构信息：PSNR 无法捕捉图像的结构、纹理等高级特征，可能导致对视觉效果的误判。
对噪声敏感：在某些情况下，PSNR 对特定类型的失真不敏感，无法有效区分不同失真类型。

4. 详细计算示例

假设我们有两幅 $\times 2$ 灰度图像：

$I_1 = \begin{bmatrix} 52 & 55 \\ 61 & 59 \end{bmatrix}, \quad I_2 = \begin{bmatrix} 50 & 54 \\ 60 & 58 \end{bmatrix}$

4.1 计算 MSE

$\text{MSE} = \frac{1}{2 \times 2} \left( (52 - 50)^2 + (55 - 54)^2 + (61 - 60)^2 + (59 - 58)^2 \right) = 1.75$

4.2 计算 PSNR

假设像素值范围为 $[0, 255]$ ，则 $\text{MAX} = 255$ 。

$\text{PSNR} = 10 \cdot \log_{10} \left( \frac{255^2}{1.75} \right) \approx 10 \cdot 4.568 \approx 45.68 \, \text{dB}$

5. 示例代码

以下是使用 Python 和 OpenCV 计算 PSNR 的示例代码：

import cv2
import numpy as np

def calculate_psnr(image1_path, image2_path):
    # 读取图像
    img1 = cv2.imread(image1_path)
    img2 = cv2.imread(image2_path)

    # 检查图像尺寸是否相同
    if img1.shape != img2.shape:
        raise ValueError("输入的两幅图像必须具有相同的尺寸和通道数")

    # 计算均方误差（MSE）
    mse = np.mean((img1 - img2) ** 2)
    if mse == 0:
        return float('inf')  # 图像完全相同

    # 计算PSNR
    PIXEL_MAX = 255.0
    psnr = 10 * np.log10((PIXEL_MAX ** 2) / mse)
    return psnr

# 示例
psnr_value = calculate_psnr('image1.jpg', 'image2.jpg')
print(f"两张图像的PSNR值为: {psnr_value:.2f} dB")

二、SSIM（Structural Similarity Index）结构相似性指数

1. 定义

SSIM 基于人类视觉系统（HVS）的感知模型，是一种用于衡量两幅图像在亮度、对比度和结构上相似度的指标。与 PSNR 不同，SSIM 更加贴近人类视觉系统的感知，能够更准确地反映图像质量。

2. 数学原理

SSIM 的核心思想是将图像看作是由亮度、对比度和结构组成的集合，通过比较这三个方面的相似性来评估整体相似度。

2.1 亮度比较

亮度是指图像的平均亮度水平，HVS 对亮度的变化具有高度敏感性。SSIM 通过比较两幅图像的平均亮度来评估相似性：

$\frac{2\mu_x \mu_y + C_1}{\mu_x^2 + \mu_y^2 + C_1}$

2.2 对比度比较

对比度反映了图像中亮度变化的程度，HVS 对对比度变化同样敏感。SSIM 通过比较两幅图像的对比度来评估相似性：

$\frac{2\sigma_x \sigma_y + C_2}{\sigma_x^2 + \sigma_y^2 + C_2}$

2.3 结构比较

结构反映了图像中物体的几何结构和纹理特征，HVS 对结构的感知具有高度敏感性。SSIM 通过比较两幅图像的结构相似性来评估相似性：

$\frac{\sigma_{xy} + C_3}{\sigma_x \sigma_y + C_3}$

通常， $C_3$ 被设置为 $C_3 = \frac{C_2}{2}$ ，因此 SSIM 可以简化为：

$\text{SSIM}(x, y) = \left[ l(x, y) \right]^\alpha \cdot \left[ c(x, y) \right]^\beta \cdot \left[ s(x, y) \right]^\gamma$

通常， $\alpha = \beta = \gamma = 1$ ，因此：

$\text{SSIM}(x, y) = l(x, y) \cdot c(x, y) \cdot s(x, y)$

2.4 综合公式

将上述三个部分结合，得到 SSIM 的完整公式：

$\text{SSIM}(x, y) = \frac{(2\mu_x \mu_y + C_1)(2\sigma_{xy} + C_2)}{(\mu_x^2 + \mu_y^2 + C_1)(\sigma_x^2 + \sigma_y^2 + C_2)}$

其中：

$\mu_x$ 和 $\mu_y$ 分别是图像 $x$ 和 $y$ 在局部窗口内的平均值，表示图像的亮度水平。
$\sigma_x^2$ 和 $\sigma_y^2$ 分别是图像 $x$ 和 $y$ 在局部窗口内的方差，表示图像的对比度。
$\sigma_{xy}$ 是图像 $x$ 和 $y$ 在局部窗口内的协方差，表示图像的结构相似性。
$C_1 = (K_1 L)^2$ ， $C_2 = (K_2 L)^2$ ，通常 $K_1 = 0.01$ ， $K_2 = 0.03$ ， $L$ 是像素值的动态范围（如 8 位图像 $L = 255$ ）。

3. 优缺点

优点

符合人类视觉感知：SSIM 考虑了亮度、对比度和结构，能够更准确地反映人类对图像质量的感知。
结构敏感：对图像中的结构信息变化敏感，能够有效捕捉到图像细节的变化。
局部对比：通过滑动窗口的方式，SSIM 能够在局部范围内评估图像相似度，更适合评估局部失真。

缺点

计算复杂度较高：相比于 PSNR，SSIM 的计算更为复杂，计算时间更长，尤其是在大规模图像处理任务中。
窗口大小选择：窗口大小的选择可能影响评估结果，不同应用场景下可能需要调整。
对旋转、缩放敏感：SSIM 对图像的旋转、缩放等几何变换不具备不变性，可能导致相似图像被评估为不同。

4. 详细计算示例

继续使用之前的 2x2 灰度图像示例：

$I_1 = \begin{bmatrix} 52 & 55 \\ 61 & 59 \end{bmatrix}, \quad I_2 = \begin{bmatrix} 50 & 54 \\ 60 & 58 \end{bmatrix}$

4.1 计算局部统计量

由于图像尺寸较小，假设使用整个图像作为一个窗口。

$\mu_x = \frac{52 + 55 + 61 + 59}{4} = \frac{227}{4} = 56.75$

$\mu_y = \frac{50 + 54 + 60 + 58}{4} = \frac{222}{4} = 55.5$

$\sigma_x^2 = \frac{(52 - 56.75)^2 + (55 - 56.75)^2 + (61 - 56.75)^2 + (59 - 56.75)^2}{4}= 12.1875$

$\sigma_y^2 = \frac{(50 - 55.5)^2 + (54 - 55.5)^2 + (60 - 55.5)^2 + (58 - 55.5)^2}{4} = 14.75$

$\sigma_{xy} = \frac{(52 - 56.75)(50 - 55.5) + (55 - 56.75)(54 - 55.5) + (61 - 56.75)(60 - 55.5) + (59 - 56.75)(58 - 55.5)}{4} = 13.375$

4.2 计算 SSIM

假设 $K_1 = 0.01$ ， $K_2 = 0.03$ ， $L = 255$ ，则：

$C_1 = (0.01 \times 255)^2 = 6.5025$

$C_2 = (0.03 \times 255)^2 = 58.5225$

代入 SSIM 公式：

$\text{SSIM} = \frac{(2 \times 56.75 \times 55.5 + 6.5025)(2 \times 13.375 + 58.5225)}{(56.75^2 + 55.5^2 + 6.5025)(12.1875 + 14.75 + 58.5225)}\approx 0.9962$

5. 示例代码

以下是使用 Python 计算 SSIM 的示例代码：

import cv2
import numpy as np
from scipy.ndimage import gaussian_filter

def load_image_grayscale(image_path):
    img = cv2.imread(image_path, cv2.IMREAD_GRAYSCALE)
    if img is None:
        raise ValueError(f"无法读取图像: {image_path}")
    img = img.astype(np.float64) / 255.0
    return img

def compute_statistics(img1, img2, window_size=11, sigma=1.5):
    mu1 = gaussian_filter(img1, sigma=sigma)
    mu2 = gaussian_filter(img2, sigma=sigma)
    
    sigma1_sq = gaussian_filter(img1 ** 2, sigma=sigma) - mu1 ** 2
    sigma2_sq = gaussian_filter(img2 ** 2, sigma=sigma) - mu2 ** 2
    
    sigma12 = gaussian_filter(img1 * img2, sigma=sigma) - mu1 * mu2
    
    return mu1, mu2, sigma1_sq, sigma2_sq, sigma12

def calculate_ssim(img1, img2, window_size=11, sigma=1.5, K1=0.01, K2=0.03, L=1.0):
    mu1, mu2, sigma1_sq, sigma2_sq, sigma12 = compute_statistics(img1, img2, window_size, sigma)
    
    C1 = (K1 * L) ** 2
    C2 = (K2 * L) ** 2
    
    luminance = (2 * mu1 * mu2 + C1) / (mu1 ** 2 + mu2 ** 2 + C1)
    contrast = (2 * np.sqrt(sigma1_sq) * np.sqrt(sigma2_sq) + C2) / (sigma1_sq + sigma2_sq + C2)
    structure = (sigma12 + C2 / 2) / (np.sqrt(sigma1_sq) * np.sqrt(sigma2_sq) + C2 / 2)
    
    ssim_map = luminance * contrast * structure
    return np.mean(ssim_map)

def ssim_index(image1_path, image2_path, window_size=11, sigma=1.5, K1=0.01, K2=0.03):
    img1 = load_image_grayscale(image1_path)
    img2 = load_image_grayscale(image2_path)
    
    if img1.shape != img2.shape:
        raise ValueError("输入的两幅图像必须具有相同的尺寸")
    
    ssim = calculate_ssim(img1, img2, window_size, sigma, K1, K2, L=1.0)
    return ssim

# 示例使用
if __name__ == "__main__":
    image1_path = 'original.jpg'
    image2_path = 'distorted.jpg'
    
    try:
        ssim_value = ssim_index(image1_path, image2_path)
        print(f"两张图像的SSIM值为: {ssim_value:.4f}")
    except Exception as e:
        print(f"计算SSIM时发生错误: {e}")

6. SSIM 的改进与变种

6.1 MS-SSIM（Multi-Scale SSIM）

多尺度 SSIM 通过在不同尺度下计算 SSIM，并综合各尺度的结果，提高了评估的准确性和鲁棒性。MS-SSIM 能更好地捕捉图像的全局和局部结构信息。

MS-SSIM 的计算步骤

多尺度分解：对图像进行多尺度分解，通常使用高斯金字塔或拉普拉斯金字塔。
逐尺度计算 SSIM：在每个尺度下计算 SSIM。
加权综合：将各尺度下的 SSIM 值加权综合，得到最终的 MS-SSIM 指标。

MS-SSIM 的优势

捕捉多尺度信息：能够同时考虑图像的局部和全局结构信息。
提高鲁棒性：对不同尺度下的图像失真具有更强的鲁棒性。

6.2 CW-SSIM（Complex Wavelet SSIM）

复数小波 SSIM 利用复数小波变换提取图像的相位信息，提高了对图像结构的捕捉能力。

CW-SSIM 的计算步骤

小波变换：对图像进行复数小波变换，提取幅度和相位信息。
相位相似性计算：通过比较相位信息，评估图像的结构相似性。
综合相似性：结合幅度和相位信息，得到 CW-SSIM 指标。

List item

CW-SSIM 的优势

增强结构感知：通过相位信息，提高对图像结构的敏感性。
抗噪性强：对噪声和失真的鲁棒性更强。

6.3 FSIM（Feature Similarity Index）

特征相似性指数通过提取图像的低级特征（如相位一致性和梯度幅度），评估图像的相似性。

FSIM 的计算步骤

特征提取：提取图像的相位一致性（PC）和梯度幅度（GM）特征。
特征相似性计算：比较两幅图像在特征空间中的相似性。
综合特征相似性：通过加权融合各特征相似性，得到最终的 FSIM 指标。

FSIM 的优势

高精度：能够更准确地反映图像的结构和细节信息。
对人类视觉系统更符合：通过特征提取，更贴近 HVS 的感知机制。

6.4 VIF（Visual Information Fidelity）

视觉信息保真度通过信息论的视角，衡量图像中的可视信息量。

VIF 的计算步骤

图像分解：对图像进行分解，提取多尺度特征。
信息量计算：计算两幅图像在不同尺度下的互信息量。
综合信息量：通过加权融合各尺度下的互信息量，得到 VIF 指标。

VIF 的优势

信息理论基础：基于信息论，具有坚实的理论基础。
高准确性：能够准确反映图像的可视信息保留情况。

三、MSE（Mean Squared Error，均方误差）

1. 定义

均方误差(Mean Squared Error，MSE)是一种常用的图像质量评估指标，用于衡量两幅图像在像素级别上的差异。MSE通过计算两幅图像对应像素差值的平方，并取其平均值，来量化图像之间的误差。

2. 数学原理

设有两幅图像 $I_1$ 和 $I_2$ ，每幅图像的尺寸为 $\times N$ ，即图像有 $M$ 行和 $N$ 列像素。MSE 定义为两幅图像对应像素差异的平方和的平均值，公式如下：

$\text{MSE} = \frac{1}{MN} \sum_{i=1}^M \sum_{j=1}^N \left[ I_1(i, j) - I_2(i, j) \right]^2$

其中：

$I_1(i, j)$ 和 $I_2(i, j)$ 分别表示图像 $I_1$ 和图像 $I_2$ 在位置 $(i, j)$ 处的像素值。
$M$ 和 $N$ 分别是图像的高度和宽度。

2. MSE的优缺点

优点

简单易计算：MSE的计算过程直观，公式简单，易于实现。计算效率高，适合大规模图像处理任务。
广泛应用：作为基础误差度量，MSE在许多图像处理和计算机视觉任务中得到广泛应用，如图像压缩、图像重建和去噪。
数学性质良好：MSE具有良好的数学性质，如可微性，适合作为优化目标函数。

缺点

不符合人类视觉感知：MSE基于像素级误差度量，无法反映人类视觉系统对图像质量的感知。对于某些视觉上显著的失真，MSE可能无法准确反映其严重程度。
忽略结构和纹理信息：MSE仅考虑像素值差异，未能捕捉图像的结构、纹理和语义信息。对于结构性失真（如边缘模糊），MSE无法有效区分。
对噪声敏感：MSE对高频噪声非常敏感，即使噪声对视觉影响较小，MSE也可能显著增加。
单位依赖性：MSE的值依赖于像素值的范围，不同动态范围的图像MSE值不可直接比较。

3. MSE的Python实现

import cv2
import numpy as np

def calculate_mse(image1_path, image2_path):
    """
    计算两幅图像的均方误差（MSE）。
    
    参数：
    - image1_path: 第一幅图像的文件路径。
    - image2_path: 第二幅图像的文件路径。
    
    返回：
    - mse: 两幅图像的MSE值。
    """
    # 读取图像
    img1 = cv2.imread(image1_path)
    img2 = cv2.imread(image2_path)
    
    if img1 is None:
        raise ValueError(f"无法读取图像: {image1_path}")
    if img2 is None:
        raise ValueError(f"无法读取图像: {image2_path}")
    
    # 检查图像尺寸是否相同
    if img1.shape != img2.shape:
        raise ValueError("输入的两幅图像必须具有相同的尺寸和通道数")
    
    # 将图像转换为浮点型
    img1 = img1.astype(np.float64)
    img2 = img2.astype(np.float64)
    
    # 计算MSE
    mse = np.mean((img1 - img2) ** 2)
    return mse

if __name__ == "__main__":
    # 示例图像路径
    image1_path = 'original.jpg'
    image2_path = 'distorted.jpg'
    
    try:
        mse_value = calculate_mse(image1_path, image2_path)
        print(f"两张图像的MSE值为: {mse_value:.2f}")
    except Exception as e:
        print(f"计算MSE时发生错误: {e}")

四、MAE（Mean Absolute Error，平均绝对误差）

1.定义

平均绝对误差（Mean Absolute Error，MAE）是一种常用的图像质量评估指标，用于衡量两幅图像在像素级别上的差异。MAE通过计算两幅图像对应像素差值的绝对值，并取其平均值，来量化图像之间的误差。

2.数学原理

设有两幅图像 $I_1$ 和 $I_2$ ，每幅图像的尺寸为 $\times N$ ，即图像有 $M$ 行和 $N$ 列像素。MAE 定义为两幅图像对应像素差异的绝对值和的平均值，公式如下：

$\text{MAE} = \frac{1}{MN} \sum_{i=1}^M \sum_{j=1}^N \left| I_1(i, j) - I_2(i, j) \right|$

其中：

$I_1(i, j)$ 和 $I_2(i, j)$ 分别表示图像 $I_1$ 和图像 $I_2$ 在位置 $(i, j)$ 处的像素值。
$M$ 和 $N$ 分别是图像的高度和宽度。

3. MAE的优缺点

优点

简单易计算：MAE的计算过程直观，公式简单，易于实现。计算效率高，适合大规模图像处理任务。
稳健性：相较于MSE，MAE对异常值（如噪声）的敏感性较低，具有更好的稳健性。
解释性强：MAE的值具有明确的物理意义，表示两幅图像在像素级别上的平均绝对差异。

缺点

不符合人类视觉感知：MAE基于像素级误差，无法反映人类视觉系统对图像质量的感知。对于某些视觉上显著的失真，MAE可能无法准确反映其严重程度。
忽略结构和纹理信息：MAE仅考虑像素值差异，未能捕捉图像的结构、纹理和语义信息。对于结构性失真（如边缘模糊），MAE无法有效区分。
单位依赖性：MAE的值依赖于像素值的范围，不同动态范围的图像MAE值不可直接比较。
线性特性：MAE对误差的线性度量，无法体现出误差的累积效应。

4. MAE的Python实现

import cv2
import numpy as np

def calculate_mae(image1_path, image2_path):
    """
    计算两幅图像的平均绝对误差（MAE）。
    
    参数：
    - image1_path: 第一幅图像的文件路径。
    - image2_path: 第二幅图像的文件路径。
    
    返回：
    - mae: 两幅图像的MAE值。
    """
    # 读取图像
    img1 = cv2.imread(image1_path)
    img2 = cv2.imread(image2_path)
    
    if img1 is None:
        raise ValueError(f"无法读取图像: {image1_path}")
    if img2 is None:
        raise ValueError(f"无法读取图像: {image2_path}")
    
    # 检查图像尺寸是否相同
    if img1.shape != img2.shape:
        raise ValueError("输入的两幅图像必须具有相同的尺寸和通道数")
    
    # 将图像转换为浮点型
    img1 = img1.astype(np.float64)
    img2 = img2.astype(np.float64)
    
    # 计算MAE
    mae = np.mean(np.abs(img1 - img2))
    return mae

if __name__ == "__main__":
    # 示例图像路径
    image1_path = 'original.jpg'
    image2_path = 'distorted.jpg'
    
    try:
        mae_value = calculate_mae(image1_path, image2_path)
        print(f"两张图像的MAE值为: {mae_value:.2f}")
    except Exception as e:
        print(f"计算MAE时发生错误: {e}")

五、UQI（Universal Quality Index，通用质量指数）

1. 定义

通用质量指数（Universal Quality Index，UQI）是由Zhou Wang等人在2002年提出的一种用于评估图像质量的指标。UQI旨在综合考虑图像的亮度、对比度和结构信息，从而更全面地反映两幅图像之间的相似度。与传统的像素级误差度量（如MSE和MAE）不同，UQI更加贴近人类视觉系统的感知。

2.数学原理

UQI通过综合衡量两幅图像在亮度、对比度和结构上的相似性，来评估图像质量。其核心思想是将这些不同的相似性度量结合起来，以提供一个统一的质量评分。

2.1 定义

设有两幅图像 $I_1$ 和 $I_2$ ，每幅图像的尺寸为 $\times N$ ，即图像有 $M$ 行和 $N$ 列像素。UQI 定义为：

$\text{UQI}(I_1, I_2) = \frac{4\sigma_{xy} \mu_x \mu_y}{(\sigma_x^2 + \sigma_y^2)(\mu_x^2 + \mu_y^2)}$

其中：

$\mu_x, \mu_y$ 是图像 $I_1$ 和 $I_2$ 的平均值。
$\sigma_x^2, \sigma_y^2$ 是图像 $I_1$ 和 $I_2$ 的方差。
$\sigma_{xy}$ 是图像 $I_1$ 和 $I_2$ 的协方差。

2.2 数学推导

UQI 基于以下三个关键组成部分：

亮度相似性 (Luminance Similarity)：

$l(I_1, I_2) = \frac{2\mu_x \mu_y}{\mu_x^2 + \mu_y^2}$

对比度相似性 (Contrast Similarity)：

$c(I_1, I_2) = \frac{2\sigma_x \sigma_y}{\sigma_x^2 + \sigma_y^2}$

结构相似性 (Structure Similarity)：

$s(I_1, I_2) = \frac{\sigma_{xy}}{\sigma_x \sigma_y}$

UQI 将上述三个相似度量结合起来：

$\text{UQI}(I_1, I_2) = l(I_1, I_2) \cdot c(I_1, I_2) \cdot s(I_1, I_2) = \frac{4\sigma_{xy} \mu_x \mu_y}{(\sigma_x^2 + \sigma_y^2)(\mu_x^2 + \mu_y^2)}$

通过这种方式，UQI 能够同时考虑图像的亮度、对比度和结构信息，从而提供一个全面的质量评估。

3.UQI的优缺点

优点

综合性强：UQI同时考虑了图像的亮度、对比度和结构信息，提供了一个全面的质量评估。
符合视觉感知：由于考虑了结构信息，UQI更贴近人类视觉系统的感知，能够更准确地反映图像质量。
数学性质良好：UQI具有良好的数学性质，如对称性，易于理解和计算。
易于实现：相对于一些复杂的指标，UQI的计算相对简单，可以在不依赖复杂库的情况下实现。

缺点

对噪声敏感：UQI在存在噪声的情况下可能会受到较大影响，尤其是高频噪声。
忽略高阶统计特性：虽然UQI综合了亮度、对比度和结构，但它并未考虑更高阶的统计特性，如纹理和语义信息。
单位依赖性：UQI的值依赖于图像的像素值范围，不同动态范围的图像UQI值不可直接比较。
对几何变换敏感：UQI对图像的旋转、缩放等几何变换敏感，即使图像内容相同，几何变换后的图像UQI值也会较低。

4.UQI的Python实现

import cv2
import numpy as np

def calculate_uqi(image1_path, image2_path):
    """
    计算两幅图像的通用质量指数（UQI）。
    
    参数：
    - image1_path: 第一幅图像的文件路径。
    - image2_path: 第二幅图像的文件路径。
    
    返回：
    - uqi: 两幅图像的UQI值。
    """
    # 读取图像
    img1 = cv2.imread(image1_path)
    img2 = cv2.imread(image2_path)
    
    if img1 is None:
        raise ValueError(f"无法读取图像: {image1_path}")
    if img2 is None:
        raise ValueError(f"无法读取图像: {image2_path}")
    
    # 检查图像尺寸是否相同
    if img1.shape != img2.shape:
        raise ValueError("输入的两幅图像必须具有相同的尺寸和通道数")
    
    # 将图像转换为浮点型，并归一化到[0,1]范围
    img1 = img1.astype(np.float64) / 255.0
    img2 = img2.astype(np.float64) / 255.0
    
    # 计算平均值
    mu_x = np.mean(img1, axis=(0,1))
    mu_y = np.mean(img2, axis=(0,1))
    
    # 计算方差
    sigma_x_sq = np.var(img1, axis=(0,1))
    sigma_y_sq = np.var(img2, axis=(0,1))
    
    # 计算协方差
    sigma_xy = np.mean((img1 - mu_x) * (img2 - mu_y), axis=(0,1))
    
    # 计算UQI每个通道
    numerator = 4 * sigma_xy * mu_x * mu_y
    denominator = (sigma_x_sq + sigma_y_sq) * (mu_x**2 + mu_y**2)
    
    # 防止除以零
    denominator = np.where(denominator == 0, 1e-10, denominator)
    
    uqi_channels = numerator / denominator
    
    # 取平均UQI
    uqi = np.mean(uqi_channels)
    
    return uqi

if __name__ == "__main__":
    # 示例图像路径
    image1_path = 'original.jpg'
    image2_path = 'distorted.jpg'
    
    try:
        uqi_value = calculate_uqi(image1_path, image2_path)
        print(f"两张图像的UQI值为: {uqi_value:.4f}")
    except Exception as e:
        print(f"计算UQI时发生错误: {e}")

六、FSIM（Feature Similarity Index，特征相似性指数）

1.定义

特征相似性指数（FSIM）由Zhang等人在2011年提出，是一种基于低级特征（如相位一致性和梯度幅度）的图像质量评估指标。FSIM旨在更好地模拟人类视觉系统（HVS）的感知，通过比较图像的关键特征来衡量相似度。

2.数学原理

FSIM基于以下两个关键特征：

相位一致性（Phase Consistency）：
- 描述图像局部区域的结构信息。
- 通过傅里叶变换提取图像的相位信息，以捕捉边缘和纹理。
梯度幅度（Gradient Magnitude）：
- 反映图像的对比度和边缘强度。
- 通过计算图像的梯度来衡量局部对比度。

FSIM通过结合这两种特征的相似性，提供一个全面的质量评估。

FSIM 的计算公式如下：

$\text{FSIM}(I_1, I_2) = \frac{\sum_x \phi(x) \cdot \text{SIM}_G(x)}{\sum_x \phi(x)}$

其中：

$\phi(x)$ 是相位一致性函数。
$\text{SIM}_G(x)$ 是梯度幅度的相似性函数。

计算步骤

相位一致性计算：
- 对两幅图像进行傅里叶变换，提取相位信息。
- 计算相位一致性函数 $\phi(x)$ 。
梯度幅度计算：
- 计算两幅图像的梯度幅度 $G_1$ 和 $G_2$ 。
- 计算梯度幅度相似性函数 $\text{SIM}_G(x)$ 。
结合相似性：
- 将相位一致性与梯度幅度相似性结合，得到 FSIM 值。

3. FSIM的优缺点

优点

高精度：考虑了相位和梯度特征，能够更准确地反映图像的结构和细节。
符合人类视觉感知：模拟了HVS对图像结构和对比度的敏感性。
鲁棒性强：对各种失真类型（如模糊、噪声、压缩失真）具有良好的评估能力。

缺点

计算复杂：涉及傅里叶变换和梯度计算，计算量较大。
参数选择敏感：需要合理设置参数以适应不同应用场景。
对几何变换敏感：如旋转、缩放等变换会影响FSIM值。

4.FSIM的Python实现

import cv2
import numpy as np

def calculate_fsim(image1_path, image2_path):
    """
    计算两幅图像的特征相似性指数（FSIM）。
    
    参数：
    - image1_path: 第一幅图像的文件路径。
    - image2_path: 第二幅图像的文件路径。
    
    返回：
    - fsim: 两幅图像的FSIM值。
    """
    # 读取图像并转换为灰度
    img1 = cv2.imread(image1_path, cv2.IMREAD_GRAYSCALE).astype(np.float64)
    img2 = cv2.imread(image2_path, cv2.IMREAD_GRAYSCALE).astype(np.float64)
    
    if img1.shape != img2.shape:
        raise ValueError("输入的两幅图像必须具有相同的尺寸")
    
    # 计算相位一致性
    def phase_consistency(img1, img2):
        F1 = np.fft.fft2(img1)
        F2 = np.fft.fft2(img2)
        phase1 = np.angle(F1)
        phase2 = np.angle(F2)
        phi = (2 * (phase1 * phase2 + 1)) / (phase1**2 + phase2**2 + 1)
        return phi
    
    phi = phase_consistency(img1, img2)
    
    # 计算梯度幅度
    def gradient_magnitude(img):
        grad_x = cv2.Sobel(img, cv2.CV_64F, 1, 0, ksize=3)
        grad_y = cv2.Sobel(img, cv2.CV_64F, 0, 1, ksize=3)
        magnitude = np.sqrt(grad_x**2 + grad_y**2)
        return magnitude
    
    G1 = gradient_magnitude(img1)
    G2 = gradient_magnitude(img2)
    
    # 计算梯度相似性
    eps = 1e-10
    sim_G = (2 * G1 * G2 + eps) / (G1**2 + G2**2 + eps)
    
    # 计算FSIM
    fsim_map = phi * sim_G
    fsim = np.mean(fsim_map)
    
    return fsim

if __name__ == "__main__":
    image1_path = 'original.jpg'
    image2_path = 'distorted.jpg'
    
    try:
        fsim_value = calculate_fsim(image1_path, image2_path)
        print(f"两张图像的FSIM值为: {fsim_value:.4f}")
    except Exception as e:
        print(f"计算FSIM时发生错误: {e}")

七、GMSD（Gradient Magnitude Similarity Deviation，梯度幅度相似性偏差）

1.定义

梯度幅度相似性偏差（GMSD）由Zhang等人在2015年提出，是一种基于梯度幅度的图像质量评估指标。GMSD旨在通过比较两幅图像的梯度幅度图，量化它们之间的视觉差异，提供快速且有效的质量评估。

2.数学原理

GMSD基于梯度幅度相似性，其核心思想是通过比较图像的梯度信息来评估图像质量。梯度幅度反映了图像中的边缘和细节信息，是衡量图像结构的重要特征。

核心步骤

梯度幅度计算：使用Sobel算子或其他梯度算子计算原始图像和失真图像的梯度幅度。
梯度幅度相似性：计算两幅图像对应梯度幅度的相似性，通常使用归一化的梯度幅度相似性函数。
偏差计算：计算所有像素点的梯度幅度相似性偏差的平均值，得到GMSD值。

2.1 基本公式

GMSD 的计算公式如下：

$\text{GMSD} = \sqrt{\frac{\frac{1}{MN} \sum_{i=1}^M \sum_{j=1}^N \left( S(x, y) - \hat{S}(x, y) \right)^2}{\mu_S}}$

其中：

$S (x, y)$ 和 $\hat{S}(x, y)$ 分别是原始图像和失真图像在像素 $(x, y)$ 处的梯度幅度。
$M$ 和 $N$ 是图像的高度和宽度。
$\mu_S$ 是原始图像梯度幅度的平均值。

3.2 示例计算

假设有两幅 $\times 3$ 的灰度图像，计算其 GMSD：

1. 计算梯度幅度（使用简化的 Sobel 算子）：

原始图像 $I$ ：

$\begin{bmatrix} 52 & 55 & 60 \\ 61 & 59 & 58 \\ 62 & 60 & 57 \end{bmatrix}$

失真图像 $\hat{I}$ ：

$\hat{I} = \begin{bmatrix} 50 & 54 & 59 \\ 60 & 58 & 57 \\ 61 & 59 & 56 \end{bmatrix}$

1. 计算梯度幅度 $S$ 和 $\hat{S}$ （简化示例，实际使用 Sobel 算子）：

$\begin{bmatrix} 5 & 5 & 5 \\ 5 & 5 & 5 \\ 5 & 5 & 5 \end{bmatrix}, \quad \hat{S} = \begin{bmatrix} 5 & 5 & 5 \\ 5 & 5 & 5 \\ 5 & 5 & 5 \end{bmatrix}$

2. 计算相似性偏差：

$\hat{S})^2 = \begin{bmatrix} 0 & 0 & 0 \\ 0 & 0 & 0 \\ 0 & 0 & 0 \end{bmatrix}$

3. 计算 GMSD：

$\text{GMSD} = \sqrt{\frac{\frac{0}{9}}{5}} = 0$

3. GMSD的优缺点

优点

高效性：计算简单，适合大规模图像处理任务。
符合视觉感知：基于梯度信息，能够有效捕捉图像的边缘和细节，符合人类对图像质量的感知。
鲁棒性：对多种失真类型（如模糊、噪声、压缩失真）具有良好的评估能力。

缺点

对噪声敏感：高频噪声会影响梯度幅度的计算，可能导致GMSD值不准确。
忽略颜色信息：主要基于灰度图像的梯度幅度，未充分利用彩色图像的颜色信息。
局部信息缺失：对图像局部区域的质量变化不够敏感，可能忽略细微的局部失真。

4.GMSD的Python实现

import cv2
import numpy as np
import os

def calculate_gmsd(image1_path, image2_path):
    """
    计算两幅图像的梯度幅度相似性偏差（GMSD）。
    
    参数：
    - image1_path: 第一幅图像的文件路径。
    - image2_path: 第二幅图像的文件路径。
    
    返回：
    - gmsd: 两幅图像的GMSD值。
    """
    # 读取图像并转换为灰度
    img1 = cv2.imread(image1_path, cv2.IMREAD_GRAYSCALE).astype(np.float64)
    img2 = cv2.imread(image2_path, cv2.IMREAD_GRAYSCALE).astype(np.float64)
    
    if img1.shape != img2.shape:
        raise ValueError("输入的两幅图像必须具有相同的尺寸")
    
    # 计算梯度幅度（使用Sobel算子）
    def gradient_magnitude(img):
        grad_x = cv2.Sobel(img, cv2.CV_64F, 1, 0, ksize=3)
        grad_y = cv2.Sobel(img, cv2.CV_64F, 0, 1, ksize=3)
        magnitude = np.sqrt(grad_x**2 + grad_y**2)
        return magnitude
    
    G1 = gradient_magnitude(img1)
    G2 = gradient_magnitude(img2)
    
    # 计算相似性
    eps = 1e-10
    sim_map = (2 * G1 * G2 + eps) / (G1**2 + G2**2 + eps)
    
    # 计算GMSD
    gmsd = np.sqrt(np.mean((sim_map - 1) ** 2)) / np.mean(G1)
    
    return gmsd

def calculate_gmsd_batch(original_dir, distorted_dir):
    """
    批量计算两组图像的梯度幅度相似性偏差（GMSD）。
    
    参数：
    - original_dir: 原始图像文件夹路径。
    - distorted_dir: 失真图像文件夹路径。
    
    返回：
    - gmsd_results: 字典，包含每对图像的GMSD值。
    """
    gmsd_results = {}
    original_images = sorted(os.listdir(original_dir))
    distorted_images = sorted(os.listdir(distorted_dir))
    
    if len(original_images) != len(distorted_images):
        raise ValueError("原始图像和失真图像的数量必须相同")
    
    for orig, dist in zip(original_images, distorted_images):
        orig_path = os.path.join(original_dir, orig)
        dist_path = os.path.join(distorted_dir, dist)
        
        try:
            gmsd = calculate_gmsd(orig_path, dist_path)
            gmsd_results[(orig, dist)] = gmsd
        except Exception as e:
            print(f"处理图像对 ({orig}, {dist}) 时发生错误: {e}")
    
    return gmsd_results

if __name__ == "__main__":
    original_dir = 'original_images'
    distorted_dir = 'distorted_images'
    
    try:
        gmsd_results = calculate_gmsd_batch(original_dir, distorted_dir)
        for (orig, dist), gmsd in gmsd_results.items():
            print(f"图像对 ({orig}, {dist}) 的GMSD值为: {gmsd:.4f}")
    except Exception as e:
        print(f"批量计算GMSD时发生错误: {e}")

八、LPIPS（Learned Perceptual Image Patch Similarity，学习感知图像块相似度）

1.定义

学习感知图像块相似度（LPIPS）由Zhang等人在2018年提出，是一种基于深度学习的图像质量评估指标。LPIPS旨在通过深度神经网络提取图像的高级特征，并比较这些特征的相似度，以更好地模拟人类视觉系统（HVS）的感知。

2.数学原理

LPIPS基于深度神经网络（通常是预训练的卷积神经网络，如AlexNet、VGG等）提取图像的多层特征。通过比较两幅图像在这些特征层的相似性，LPIPS能够捕捉到更高级的语义和结构信息，超越传统的像素级误差度量。

核心步骤

特征提取：使用预训练的深度网络提取两幅图像的多层特征表示。
特征比较：对应层的特征图进行逐元素比较，计算相似性度量（通常使用L2距离）。
加权融合：学习到的权重用于加权不同层的相似性度量，综合得到最终的LPIPS评分。

基本公式

LPIPS 的计算公式可以表示为：

$\text{LPIPS}(I_1, I_2) = \sum_l w_l \cdot \| \phi_l(I_1) - \phi_l(I_2) \|_2$

其中：

$\phi_l(I)$ 是第 $l$ 层的特征提取函数。
$w_l$ 是学习到的权重。
$\|\cdot\|_2$ 表示 L2 范数。

3. LPIPS的优缺点

优点

高感知相关性：能更好地模拟人类视觉系统，捕捉高级语义和结构信息。
鲁棒性强：对多种失真类型（如模糊、噪声、压缩失真）具有良好的评估能力。
灵活性高：可通过选择不同的预训练网络和层数，适应不同的应用需求。

缺点

计算复杂：需要深度神经网络的前向传播，计算资源需求高。
依赖预训练模型：需要使用预训练的深度网络，且结果依赖于所选模型的特性。
训练需求：学习权重需要大量的带标签数据，训练过程复杂。

4.LPIPS的Python实现

import lpips
import torch
import cv2
import numpy as np
import os

def calculate_lpips_batch(original_dir, distorted_dir, model='vgg'):
    """
    批量计算两组图像的学习感知图像块相似度（LPIPS）。
    
    参数：
    - original_dir: 原始图像文件夹路径。
    - distorted_dir: 失真图像文件夹路径。
    - model: 使用的预训练模型（'alex', 'vgg', 等）。
    
    返回：
    - lpips_results: 字典，包含每对图像的LPIPS值。
    """
    lpips_results = {}
    original_images = sorted(os.listdir(original_dir))
    distorted_images = sorted(os.listdir(distorted_dir))
    
    if len(original_images) != len(distorted_images):
        raise ValueError("原始图像和失真图像的数量必须相同")
    
    # 加载LPIPS模型
    loss_fn = lpips.LPIPS(net=model)
    
    for orig, dist in zip(original_images, distorted_images):
        orig_path = os.path.join(original_dir, orig)
        dist_path = os.path.join(distorted_dir, dist)
        
        try:
            # 预处理
            def preprocess(img_path):
                img = cv2.imread(img_path)
                if img is None:
                    raise ValueError(f"无法读取图像: {img_path}")
                img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
                img = cv2.resize(img, (256, 256))  # 调整大小
                img = img.astype(np.float32) / 255.0
                img = torch.from_numpy(img).permute(2, 0, 1).unsqueeze(0)
                return img

            img1 = preprocess(orig_path)
            img2 = preprocess(dist_path)
            
            # 计算LPIPS
            with torch.no_grad():
                lpips_val = loss_fn(img1, img2).item()
            
            lpips_results[(orig, dist)] = lpips_val
        except Exception as e:
            print(f"处理图像对 ({orig}, {dist}) 时发生错误: {e}")
    
    return lpips_results

if __name__ == "__main__":
    original_dir = 'original_images'
    distorted_dir = 'distorted_images'
    
    try:
        lpips_results = calculate_lpips_batch(original_dir, distorted_dir, model='vgg')
        for (orig, dist), lpips_val in lpips_results.items():
            print(f"图像对 ({orig}, {dist}) 的LPIPS值为: {lpips_val:.4f}")
    except Exception as e:
        print(f"批量计算LPIPS时发生错误: {e}")

九、DISTS（Deep Image Structure and Texture Similarity，深度图像结构与纹理相似性）

1.定义

深度图像结构与纹理相似性（DISTS）由Zhang等人在2020年提出，是一种基于深度学习的图像质量评估指标。DISTS结合了图像的结构和纹理信息，通过深度神经网络提取特征，旨在更准确地模拟人类视觉系统（HVS）的感知。

2.数学原理

DISTS基于深度神经网络（如VGG）提取图像的多层特征，通过比较这些特征的结构和纹理相似性，量化两幅图像的质量差异。

核心组成部分

结构相似性（Structure Similarity）：利用深层特征捕捉图像的整体结构信息。
纹理相似性（Texture Similarity）：通过浅层特征捕捉图像的纹理细节。
加权融合：结合结构和纹理相似性，综合评估图像质量。

2.1 基本公式

DISTS 的计算公式可以表示为：

$\text{DISTS}(I_1, I_2) = \alpha \cdot \text{Structure}(I_1, I_2) + (1 - \alpha) \cdot \text{Texture}(I_1, I_2)$

其中：

$\text{Structure}(I_1, I_2)$ ：结构相似度量。
$\text{Texture}(I_1, I_2)$ ：纹理相似度量。
$\alpha$ ：权重系数，用于平衡结构与纹理的重要性。

2.2 计算步骤

特征提取：使用预训练的深度网络（如VGG）提取原始图像和失真图像的多层特征。
相似性度量：计算对应层特征的结构和纹理相似性，通常使用L2距离或其他相似性指标。
加权融合：根据预设的权重系数α，结合结构与纹理相似性，得到最终的DISTS评分。

3. DISTS的优缺点

优点

高感知相关性：结合结构和纹理信息，更贴近人类视觉感知。
鲁棒性强：对多种失真类型（如模糊、噪声、压缩失真）具有良好的评估能力。
综合性强：同时考虑图像的全局结构和局部纹理，提供全面的质量评估。

缺点

计算复杂：依赖深度神经网络的前向传播，计算资源需求高。
依赖预训练模型：结果依赖于所选深度网络的特性和训练数据。
参数调整：需要合理设置权重系数 α，以适应不同应用场景。

4.DISTS的Python实现

import torch
import torchvision.transforms as transforms
from PIL import Image
from dists import DISTS
import os

def calculate_dists_batch(original_dir, distorted_dir, model='vgg'):
    """
    批量计算两组图像的深度图像结构与纹理相似性（DISTS）。
    
    参数：
    - original_dir: 原始图像文件夹路径。
    - distorted_dir: 失真图像文件夹路径。
    - model: 使用的预训练模型（'vgg', 'alex', 等）。
    
    返回：
    - dists_results: 字典，包含每对图像的DISTS值。
    """
    dists_results = {}
    original_images = sorted(os.listdir(original_dir))
    distorted_images = sorted(os.listdir(distorted_dir))
    
    if len(original_images) != len(distorted_images):
        raise ValueError("原始图像和失真图像的数量必须相同")
    
    # 图像预处理
    transform = transforms.Compose([
        transforms.Resize((256, 256)),
        transforms.ToTensor(),
    ])
    
    # 加载DISTS模型
    dists_model = DISTS(model=model).eval()
    
    for orig, dist in zip(original_images, distorted_images):
        orig_path = os.path.join(original_dir, orig)
        dist_path = os.path.join(distorted_dir, dist)
        
        try:
            img1 = Image.open(orig_path).convert('RGB')
            img2 = Image.open(dist_path).convert('RGB')
            
            img1 = transform(img1).unsqueeze(0)
            img2 = transform(img2).unsqueeze(0)
            
            with torch.no_grad():
                dists_val = dists_model(img1, img2).item()
            
            dists_results[(orig, dist)] = dists_val
        except Exception as e:
            print(f"处理图像对 ({orig}, {dist}) 时发生错误: {e}")
    
    return dists_results

if __name__ == "__main__":
    original_dir = 'original_images'
    distorted_dir = 'distorted_images'
    
    try:
        dists_results = calculate_dists_batch(original_dir, distorted_dir, model='vgg')
        for (orig, dist), dists_val in dists_results.items():
            print(f"图像对 ({orig}, {dist}) 的DISTS值为: {dists_val:.4f}")
    except Exception as e:
        print(f"批量计算DISTS时发生错误: {e}")

十、IFC（Information Fidelity Criterion，信息保真度准则）

1.定义

信息保真度准则（IFC）由Sheikh和Cohen在2005年提出，是一种基于信息理论的图像质量评估指标。IFC旨在衡量失真图像中保留的与原始图像相关的有用信息量，提供对图像质量的客观评估。

2.数学原理

IFC基于信息理论，具体采用信源编码理论和信息保真度的概念。核心思想是通过比较原始图像和失真图像之间的信息传递，评估失真图像中保留的原始信息量。

核心概念

信息保真度：衡量失真图像中保留的与原始图像相关的信息量。
信源模型：原始图像被视为信源，通过信道传输后产生失真图像。
熵和互信息：使用熵（信息量）和互信息（两变量间共享的信息量）来量化信息保真度。

2.1 基本公式

IFC 的计算基于互信息的概念，其基本公式为：

$\text{IFC}(I, K) = \frac{I(I; K)}{I(I; K) + I(N; K)}$

其中：

$I$ 是原始图像。
$K$ 是失真图像。
$N$ 是噪声图像（噪声与原始图像无关）。
$I (A; B)$ 表示 $A$ 和 $B$ 之间的互信息。

2.2 计算步骤

信源建模：将原始图像和失真图像建模为随机变量。
概率分布估计：估计原始图像和失真图像的联合概率分布。
互信息计算：计算原始图像与失真图像之间的互信息 $I (I; K)$ ，计算噪声图像与失真图像之间的互信息 $I (N; K)$ 。
IFC计算：将互信息代入IFC公式，得到最终的IFC值。

3.IFC的优缺点

优点

理论基础坚实：基于信息理论，具有良好的数学基础和理论支持。
信息量衡量：能够量化失真图像中保留的有用信息量，提供直观的质量评估。
鲁棒性强：对多种失真类型（如压缩、噪声、模糊）具有良好的评估能力。

缺点

计算复杂：需要估计高维的概率分布，计算量大，效率较低。
依赖模型假设：信源和信道的建模依赖于假设，实际应用中可能不完全符合。
缺乏普适性：在某些失真类型或图像内容下，IFC的评估可能不够准确。

4.IFC的Python实现

import cv2
import numpy as np
from sklearn.metrics import mutual_info_score

def calculate_ifc(original_path, distorted_path, bins=256):
    """
    计算两幅图像的信息保真度准则（IFC）。
    
    参数：
    - original_path: 原始图像的文件路径。
    - distorted_path: 失真图像的文件路径。
    - bins: 直方图的箱数。
    
    返回：
    - ifc: 两幅图像的IFC值。
    """
    # 读取图像并转换为灰度
    img1 = cv2.imread(original_path, cv2.IMREAD_GRAYSCALE)
    img2 = cv2.imread(distorted_path, cv2.IMREAD_GRAYSCALE)
    
    if img1 is None or img2 is None:
        raise ValueError("无法读取图像文件。")
    if img1.shape != img2.shape:
        raise ValueError("输入的两幅图像必须具有相同的尺寸。")
    
    # 计算互信息
    def mutual_information(img1, img2, bins):
        hist_2d, _, _ = np.histogram2d(img1.ravel(), img2.ravel(), bins=bins)
        mi = mutual_info_score(None, None, contingency=hist_2d)
        return mi
    
    mi_ik = mutual_information(img1, img2, bins)
    # 假设噪声图像与失真图像无关，互信息为0
    mi_nk = 0
    
    # 计算IFC
    ifc = mi_ik / (mi_ik + mi_nk + 1e-10)  # 加小值防止除零
    
    return ifc

if __name__ == "__main__":
    original_path = 'original.jpg'
    distorted_path = 'distorted.jpg'
    
    try:
        ifc_value = calculate_ifc(original_path, distorted_path)
        print(f"两张图像的IFC值为: {ifc_value:.4f}")
    except Exception as e:
        print(f"计算IFC时发生错误: {e}")

十一、总结和对比

1.选择建议：

任务需求：
- 像素级精度：如果任务需要评估像素级误差，如图像压缩和重建，可以使用PSNR和MSE。
- 结构和感知质量：如果任务需要更符合人类视觉感知的评估，如图像超分辨率和去噪，建议使用SSIM、LPIPS或FSIM。
- 高级特征：对于需要考虑高级特征和语义信息的任务，可以使用基于深度学习的指标，如LPIPS和DISTS。
计算资源：
- 高效评估：对于需要快速评估的场景，如实时图像处理，可以选择PSNR、MSE或GMSD。
- 高精度评估：对于离线评估或对质量要求较高的任务，可以选择SSIM、LPIPS或FSIM。
应用场景：
- 医学影像：需要高精度和结构信息的保留，可以选择SSIM、VIF或IFC。
- 监控与安全：需要快速评估，可以选择PSNR、MSE或GMSD。

2.对比总结

指标	优点	缺点	适用场景
MSE	计算简单，数学性质良好	不符合人类视觉感知，忽略结构和纹理信息，对异常值敏感	基础图像处理任务，如压缩、重建
MAE	简单易计算，稳健性较好	不符合人类视觉感知，忽略结构和纹理信息	基础图像处理任务，如压缩、重建、快速评估
PSNR	基于 MSE，易于理解，广泛应用	同 MSE，仍然不符合人类视觉感知，无法反映结构信息	图像压缩、重建的初步评估
SSIM	考虑亮度、对比度和结构，符合人类视觉感知	计算复杂，对几何变换敏感	高精度图像质量评估、图像增强、超分辨率等
UQI	综合考虑亮度、对比度和结构信息，符合人类视觉感知	计算复杂，对噪声敏感，忽略高阶特征	高级图像质量评估、图像压缩、重建、去噪
VIF	基于信息理论，准确反映图像信息保留情况	计算复杂，依赖标准库支持	信息保真要求较高的图像评估
FSIM	高精度，考虑结构和细节信息，符合人类视觉系统	计算复杂，需提取特定特征	需要高精度和细节保留的图像质量评估
GMSD	简单有效，计算效率高，对结构变化敏感	仅基于梯度信息，可能忽略其他视觉特征	快速图像质量评估、结构变化检测
LPIPS	更符合人类感知，能够捕捉高级语义信息	需要预训练深度模型，计算资源需求高	生成模型评估、超分辨率、图像增强
DISTS	综合考虑结构和纹理信息，更全面的质量评估	需要预训练深度模型，计算资源需求高	高级图像质量评估、结构和纹理保留
IFC	基于信息理论，准确反映有用信息保留情况	计算复杂，缺乏标准库支持	医学影像、高精度信息保留的图像评估

在实际应用中，结合使用多种指标能够提供更全面的评估。例如，使用PSNR和SSIM可以同时衡量像素级误差和结构相似性，再结合LPIPS评估感知质量，以获得更准确的图像质量评估。

结~~~

你可能感兴趣的:(CV,cv,图像处理,图像质量评估指标)

guava loadingCache代码示例 IM 胡鹏飞 Java 工具类介绍
publicclassTest2{publicstaticvoidmain(String[]args)throwsException{LoadingCachecache=CacheBuilder.newBuilder()//设置并发级别为8，并发级别是指可以同时写缓存的线程数.concurrencyLevel(8)//设置缓存容器的初始容量为10.initialCapacity(10)//设置缓存
有必要获得WHQL测试认证吗，有什么好处？
什么是WHQL认证？WHQL是MicrosoftWindowsHardwareQualityLab的缩写，中文意思是Windows硬件设备质量实验室，主要是对Windows操作系统的兼容性测试，检验硬件产品和驱动程序在windows系统下的兼容性和稳定性。当某一硬件或软件通过WHQL测试时，制造商可以在其产品包装和广告上使用“DesignedforWindows”标志。该标志可以证明硬件或软件已经
前端项目架构设计要领
1.架构设计的核心目标在设计前端项目架构时，核心目标是模块化、可维护、可扩展、可测试，以及开发效率的最大化。这些目标可以通过以下几个方面来实现：组件化：将UI功能封装为可复用的组件。模块化：将业务逻辑分解为独立的模块或服务。自动化构建与部署：实现自动化构建、测试和部署流程，减少人为操作的错误。代码规范化与检查：确保团队协作时，代码风格和质量一致。2.项目目录结构设计一个清晰合理的目录结构对大型项目
Android 开源组件和第三方库汇总 gyyzzr Android Android 开源框架
转载1、github排名https://github.com/trending,github搜索：https://github.com/search2、https://github.com/wasabeef/awesome-android-ui目录UIUI卫星菜单节选器下拉刷新模糊效果HUD与Toast进度条UI其它动画网络相关响应式编程地图数据库图像浏览及处理视频音频处理测试及调试动态更新热更新
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）阿牛的药铺算法移植部署 fpga开发 verilog
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）引言：为什么这个FPGA入门路线能帮你快速上岗？本文设计了一条**"Verilog语法→工具链操作→光学项目实战→岗位技能对标"的阶梯式学习路径。不同于泛泛而谈的FPGA教程，我们聚焦光学类产品开发**核心能力（时序接口设计、图像处理算法移植、高速接口应用），通过3个递进式项目（从LED闪烁到图像边缘检测），
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
基于架构的软件设计（Architecture-Based Software Design，ABSD）是一种以架构为核心的软件开发方法
ABSD方法与生命周期基于架构的软件设计（Architecture-BasedSoftwareDesign，ABSD）是一种以架构为核心的软件开发方法，强调在开发的各个阶段都要以架构为中心，确保系统的整体结构和质量属性得到有效管理。ABSD方法是一个自顶向下、递归细化的过程，软件系统的架构通过该方法得到细化，直到能产生软件构件和类。ABSD方法的三个基础功能的分解：使用基于模块的内聚和耦合技术，将
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
Shader面试题100道之（81-100）还是大剑师兰特 #Shader 综合教程100+大剑师 shader面试题 shader教程
Shader面试题（第81-100题）以下是第81到第100道Shader相关的面试题及答案：81.Unity中如何实现屏幕空间的热扭曲效果（HeatDistortion）？热扭曲效果可以通过GrabPass抓取当前屏幕图像，然后在片段着色器中使用噪声或动态UV偏移模拟空气扰动，再结合一个透明通道控制扭曲强度来实现。82.Shader中如何实现物体轮廓高亮（OutlineHighlight）？轮廓
cvc降噪和主动降噪_音频知识：CVC降噪和ANC主动降噪的区别和应用汪国 cvc降噪和主动降噪
原标题：音频知识：CVC降噪和ANC主动降噪的区别和应用降噪，对于需要长时间戴耳机的人群来讲，起到了很好的保护作用。然而在购买蓝牙耳机时总会听到商家在宣传耳机所具备的CVC、ANC降噪功能，尽管听过很多商家描述，有些小伙伴依然不是很明白这两者之间的区别以及应用。现在简单和大家介绍这两个看不懂的降噪名词。CVC降噪(ClearVoiceCapture)是通话软件降噪技术。工作原理是是通过耳机内置的消
零信任落地难题：安全性与用户体验如何两全？粤海科技君安全零信任终端安全网络安全 iOA
在零信任架构的实施过程中，平衡安全性与用户体验是企业数字化转型的核心命题。这一挑战的本质在于：既要通过「永不信任，持续验证」的安全机制抵御新型攻击，又要避免过度验证导致的效率损耗。一、矛盾根源：安全与体验的天然张力零信任的“永不信任”原则，本质上要求对每一次访问都进行动态评估，但这与用户对“便捷、流畅”的诉求存在天然冲突。例如：频繁的身份验证（如每次登录都需短信验证码）会打断工作节奏，某制造企业统
被动降噪的概念及编程实现 CodeByte 人工智能算法 javascript 编程
被动降噪是指通过编程技术和算法，对输入的数据进行处理，以减少或消除其中的噪声。噪声可以是各种形式的干扰，例如来自传感器、通信信号或其他外部源的干扰。在本文中，我们将探讨被动降噪的意义以及如何使用编程来实现这一目标。被动降噪的意义：噪声对数据的准确性和可靠性产生负面影响。在许多应用领域，例如图像处理、音频处理和信号处理中，噪声的存在可能导致数据质量下降，使得后续的分析和处理变得困难。因此，被动降噪技
等保测评中的物联网设备安全评估亿林数据物联网安全网络安全等保测评
随着物联网（IoT）技术的飞速发展，物联网设备已经广泛应用于智能家居、智慧城市、工业自动化等多个领域，极大地提升了社会生产力和生活便利性。然而，随着IoT设备数量的激增，其安全性问题也日益凸显，成为我们必须面对的重要课题。在这一背景下，等级保护（等保）测评中的物联网设备安全评估显得尤为重要，它为我们提供了一个有效的安全评估和管理机制。一、物联网设备安全评估的重要性物联网设备的核心理念是实现物物相连
盲超分的核心概念小冷爱读书数学建模盲超分超分重建
一、盲超分的本质与数学建模1.退化过程的数学表达低分辨率图像（LR）可看作高分辨率图像（HR）经过退化模型后的结果：：观测到的低分辨率图像：待恢复的高分辨率图像：模糊核（BlurKernel）⊗：卷积操作↓：下采样（步长为）：加性噪声（如高斯噪声、泊松噪声等）盲超分的核心问题：在未知、、的情况下，从估计。2.为什么传统超分方法会失效？传统方法（如SRCNN、EDSR）假设退化是固定的（如双三次下采
AI 图像编辑提示词参考之：背景替换
在AI图像编辑中（以FluxKontext为例），“替换背景”（BackgroundReplacement）是提升图像表现力的关键手段之一。但背景更换不仅仅是简单的视觉置换，更重要的是：确保人物主体外观不变，并与新背景在色温、色调、光影等方面自然融合。只有这样，最终图像才会呈现出“原本拍摄于该背景环境”的真实感。建议使用以下结构组织提示词：Replacethebackgroundwith[新背景]
JVM字节码加载与存储中的细节
问题引出：为什么Java定义int型变量为32767时使用的是bipush32767，而定义int型变量为32768时使用的是ldc#4？在Java中，如果这样定义int型变量：publicclassTest{publicstaticvoidmain(String[]args){inti=0;intj=5;intk=6;intm=32768;intn=32767;}}变量对应的字节码文件内容是这样
什么是RFM模型走过冬季学习笔记大数据数据分析
RFM模型是客户价值分析中一种经典且实用的量化模型，它通过三个关键维度评估用户价值，帮助企业识别最有价值的客户群体。名称RFM由三个核心指标的英文首字母组成：R（Recency）-最近一次消费时间定义：用户上一次发生交易行为距今的时间长度（如多少天前）。意义：衡量用户的活跃度和流失风险。R值越小（最近有消费），说明用户越活跃，流失风险越低；R值越大（很久没消费），用户流失风险越高。母婴场景示例：一
数据分析常用指标名词解释及计算公式走过冬季学习笔记数据分析大数据
数据分析中有大量常用指标，它们帮助我们量化业务表现、用户行为、产品健康度等。下面是一些核心指标的名词解释及计算方式，按常见类别分类：一、流量与用户规模指标页面浏览量名词解释：用户访问网站或应用时，每次加载或刷新一个页面就算一次PV。它衡量的是页面被打开的总次数。计算方式：PV=∑(所有页面被加载的次数)(通常由埋点或日志直接统计)独立访客数名词解释：在特定时间范围内（如一天、一周、一月），访问网站
目标检测（object detection）加油吧zkf 目标检测目标检测人工智能计算机视觉
目标检测作为计算机视觉的核心技术，在自动驾驶、安防监控、医疗影像等领域发挥着不可替代的作用。本文将系统讲解目标检测的概念、原理、主流模型、常见数据集及应用场景，帮助读者构建对这一技术的完整认知。一、目标检测的核心概念目标检测（ObjectDetection）是指在图像或视频中自动定位并识别出所有感兴趣的目标的技术。它需要解决两个核心问题：分类（Classification）：确定图像中每个目标的类
模型训练与部署注意事项篇---resize Atticus-Orion 图像处理篇深度学习篇模型训练与部署注意事项篇深度学习计算机视觉人工智能
图像大小的影响在YOLOv系列模型的训练和推理部署过程中，图像大小的选择是影响模型性能（精度、速度、泛化能力）的关键因素之一。两者的关系既相互关联，又存在一定的灵活性，具体可从以下几个方面详细分析：一、核心关系：训练与推理图像大小的“基准一致性”YOLOv模型（如YOLOv5、v7、v8等）的训练和推理图像大小通常以**“基准尺寸”**为核心关联，即训练时设定的图像尺寸会作为模型设计的基础，而推理
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）知识大胖 NVIDIA GPU和大语言模型开发教程 llama 人工智能 nvidia llm
介绍“单靠技术是不够的——技术与文科、人文学科的结合，才能产生让我们心花怒放的成果。”——史蒂夫·乔布斯近年来，人机交互领域发生了重大变化，尤其是随着ChatGPT、GPT-4等大型语言模型(LLM)的出现。虽然这些模型主要基于文本，但人们对语音交互的兴趣日益浓厚，以使人机对话更加无缝和自然。然而，实现语音交互而不受语音转文本处理中常见的延迟和错误的影响仍然是一个挑战。关键字：Llama-Omni
NVIDIA 系列之使用生成式 AI 增强 ROS2 机器人技术：使用 BLIP 和 Isaac Sim 进行实时图像字幕制作知识大胖 NVIDIA GPU和大语言模型开发教程人工智能机器人
简介在快速发展的机器人领域，集成先进的AI模型可以显著增强机器人系统的功能。在本博客中，我们将探讨如何在ROS2（机器人操作系统2）环境中利用BLIP（引导语言图像预训练）模型进行实时图像字幕制作，并使用NVIDIAIsaacSim进行模拟。我们将介绍如何实现一个ROS2节点，该节点订阅摄像头源、应用BLIP模型进行图像字幕制作，并实时显示结果。这种集成展示了生成式AI在增强人机交互方面的强大功能
卫星分析系列之使用卫星图像量化野火烧毁面积在 Google Colab 中使用 Python 使用 Sentinel-2 图像确定森林火灾烧毁面积知识大胖 NVIDIA GPU和大语言模型开发教程 python sentinel 开发语言
简介几年前，当大多数气候模型预测如果我们不采取必要措施，洪水、热浪和野火将会发生更多时，我没想到这些不寻常的灾难现象会成为常见事件。其中，野火每年摧毁大量森林面积。如果你搜索不同地方的重大野火表格，你会发现令人震惊的统计数据，显示由于野火，地球上有多少森林面积正在消失。在本教程中，我将结合我已经发表过的关于下载、处理卫星图像和可视化野火的故事，量化加州发生的其中一场重大野火的烧毁面积。与之前的帖子
使用NVIDIA NeRF将2D图像转换为逼真的3D模型（Python） ByteWhiz 3d python 计算机视觉 Python
使用NVIDIANeRF将2D图像转换为逼真的3D模型（Python）NeuralRadianceFields（NeRF）是一种强大的方法，可以将2D图像转换为逼真的3D模型。它使用神经网络来建模场景的辐射场，并通过渲染多个视角的图像来重建3D模型。在本文中，我们将使用Python和NVIDIANeRF库来实现这一过程。首先，我们需要安装所需的库。我们可以通过以下命令使用pip安装NVIDIANe
C语言手写简易 DNS 客户端（接收部分）（Charon） c语言开发语言
本文通过纯C语言手动构造DNS请求报文，使用UDP协议发送到公共DNS服务器，并接收响应，完整演示DNS请求流程。主流程：dns_client_commit()这是整个流程的核心函数，下面我们按顺序拆解每一步的逻辑，尤其突出发送sendto与接收recvfrom的设计思路和实现。第一步：创建UDP套接字intsockfd=socket(AF_INET,SOCK_DGRAM,0);if(sockfd
搜广推校招面经九十三 Y1nhl 搜广推面经机器学习人工智能 python 算法推荐算法 pytorch 搜索算法
字节懂车帝一面一、NDCG（NormalizedDiscountedCumulativeGain）的计算NDCG是信息检索和排序任务中常用的评价指标，用于衡量模型预测的排序质量与真实相关性排序的一致程度。1.1.DCG@k（DiscountedCumulativeGain）DCG@k=∑i=1krelilog⁡2(i+1)\text{DCG@k}=\sum_{i=1}^{k}\frac{rel_i
Android 图像处理 - Bitmap 图像处理观察记录（基本图像复制、带目录创建的图像复制、字节流处理的图像复制、并发图像复制、单线程池顺序图像复制）
Bitmap图像处理观察记录1、基本图像复制从应用内部存储目录读取test.png使用BitmapFactory解码为Bitmap对象将Bitmap重新压缩保存为newTest.png操作成功，compress返回trueFilefile=newFile(getFilesDir(),"test.png");StringabsolutePath=file.getAbsolutePath();Bitm
算法单链的创建与删除换个号韩国红果果 c 算法
先创建结构体 struct student { int data; //int tag;//标记这是第几个 struct student *next; }; // addone 用于将一个数插入已从小到大排好序的链中 struct student *addone(struct student *h,int x){ if(h==NULL) //??????
《大型网站系统与Java中间件实践》第2章读后感白糖_ java中间件
断断续续花了两天时间试读了《大型网站系统与Java中间件实践》的第2章，这章总述了从一个小型单机构建的网站发展到大型网站的演化过程---整个过程会遇到很多困难，但每一个屏障都会有解决方案，最终就是依靠这些个解决方案汇聚到一起组成了一个健壮稳定高效的大型系统。看完整章内容，
zeus持久层spring事务单元测试 deng520159 java DAO spring jdbc
今天把zeus事务单元测试放出来,让大家指出他的毛病, 1.ZeusTransactionTest.java 单元测试 package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Test; import
Rss 订阅开发周凡杨 html xml 订阅 rss 规范
RSS是 Really Simple Syndication的缩写（对rss2.0而言，是这三个词的缩写，对rss1.0而言则是RDF Site Summary的缩写，1.0与2.0走的是两个体系）。 RSS
分页查询实现 g21121 分页查询
在查询列表时我们常常会用到分页，分页的好处就是减少数据交换，每次查询一定数量减少数据库压力等等。按实现形式分前台分页和服务器分页：前台分页就是一次查询出所有记录，在页面中用js进行虚拟分页，这种形式在数据量较小时优势比较明显，一次加载就不必再访问服务器了，但当数据量较大时会对页面造成压力，传输速度也会大幅下降。服务器分页就是每次请求相同数量记录，按一定规则排序，每次取一定序号直接的数据
spring jms异步消息处理 510888780 jms
spring JMS对于异步消息处理基本上只需配置下就能进行高效的处理。其核心就是消息侦听器容器，常用的类就是DefaultMessageListenerContainer。该容器可配置侦听器的并发数量，以及配合MessageListenerAdapter使用消息驱动POJO进行消息处理。且消息驱动POJO是放入TaskExecutor中进行处理，进一步提高性能，减少侦听器的阻塞。具体配置如下：
highCharts柱状图布衣凌宇 hightCharts 柱图
第一步：导入 exporting.js,grid.js,highcharts.js;第二步：写controller @Controller@RequestMapping(value="${adminPath}/statistick")public class StatistickController { private UserServi
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans spring mvc Spring 教程 spring3 教程 Spring 入门
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
TLS java简单实现 antlove java ssl keystore tls secure
1. SSLServer.java package ssl; import java.io.FileInputStream; import java.io.InputStream; import java.net.ServerSocket; import java.net.Socket; import java.security.KeyStore; import
Zip解压压缩文件百合不是茶 Zip格式解压 Zip流的使用文件解压
ZIP文件的解压缩实质上就是从输入流中读取数据。Java.util.zip包提供了类ZipInputStream来读取ZIP文件,下面的代码段创建了一个输入流来读取ZIP格式的文件; ZipInputStream in = new ZipInputStream(new FileInputStream(zipFileName)); &n
underscore.js 学习（一） bijian1013 JavaScript underscore
工作中需要用到underscore.js，发现这是一个包括了很多基本功能函数的js库，里面有很多实用的函数。而且它没有扩展 javascript的原生对象。主要涉及对Collection、Object、Array、Function的操作。学
java jvm常用命令工具——jstatd命令(Java Statistics Monitoring Daemon) bijian1013 java jvm jstatd
1.介绍 jstatd是一个基于RMI（Remove Method Invocation）的服务程序，它用于监控基于HotSpot的JVM中资源的创建及销毁，并且提供了一个远程接口允许远程的监控工具连接到本地的JVM执行命令。 jstatd是基于RMI的，所以在运行jstatd的服务
【Spring框架三】Spring常用注解之Transactional bit1129 transactional
Spring可以通过注解@Transactional来为业务逻辑层的方法(调用DAO完成持久化动作)添加事务能力，如下是@Transactional注解的定义： /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version
我(程序员)的前进方向 bitray 程序员
作为一个普通的程序员,我一直游走在java语言中,java也确实让我有了很多的体会.不过随着学习的深入,java语言的新技术产生的越来越多,从最初期的javase,我逐渐开始转变到ssh,ssi,这种主流的码农,.过了几天为了解决新问题,webservice的大旗也被我祭出来了,又过了些日子jms架构的activemq也开始必须学习了.再后来开始了一系列技术学习,osgi,restful.....
nginx lua开发经验总结 ronin47
使用nginx lua已经两三个月了，项目接开发完毕了，这几天准备上线并且跟高德地图对接。回顾下来lua在项目中占得必中还是比较大的，跟PHP的占比差不多持平了，因此在开发中遇到一些问题备忘一下 1：content_by_lua中代码容量有限制，一般不要写太多代码，正常编写代码一般在100行左右（具体容量没有细心测哈哈，在4kb左右），如果超出了则重启nginx的时候会报 too long pa
java-66-用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。颠倒之后的栈为{5,4,3,2,1}，5处在栈顶 bylijinnan java
import java.util.Stack; public class ReverseStackRecursive { /** * Q 66.颠倒栈。 * 题目：用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。 * 颠倒之后的栈为{5,4,3,2,1}，5处在栈顶。 *1. Pop the top element *2. Revers
正确理解Linux内存占用过高的问题 cfyme linux
Linux开机后，使用top命令查看，4G物理内存发现已使用的多大3.2G，占用率高达80%以上： Mem: 3889836k total, 3341868k used, 547968k free, 286044k buffers Swap: 6127608k total,&nb
[JWFD开源工作流]当前流程引擎设计的一个急需解决的问题 comsci 工作流
当我们的流程引擎进入IRC阶段的时候，当循环反馈模型出现之后，每次循环都会导致一大堆节点内存数据残留在系统内存中，循环的次数越多，这些残留数据将导致系统内存溢出，并使得引擎崩溃。。。。。。而解决办法就是利用汇编语言或者其它系统编程语言，在引擎运行时，把这些残留数据清除掉。
自定义类的equals函数 dai_lm equals
仅作笔记使用 public class VectorQueue { private final Vector<VectorItem> queue; private class VectorItem { private final Object item; private final int quantity; public VectorI
Linux下安装R语言 datageek R语言 linux
命令如下：sudo gedit /etc/apt/sources.list1、deb http://mirrors.ustc.edu.cn/CRAN/bin/linux/ubuntu/ precise/ 2、deb http://dk.archive.ubuntu.com/ubuntu hardy universesudo apt-key adv --keyserver ke
如何修改mysql 并发数(连接数)最大值 dcj3sjt126com mysql
MySQL的连接数最大值跟MySQL没关系，主要看系统和业务逻辑了方法一：进入MYSQL安装目录打开MYSQL配置文件 my.ini 或 my.cnf查找 max_connections=100 修改为 max_connections=1000 服务里重起MYSQL即可　　方法二：MySQL的最大连接数默认是100客户端登录：mysql -uusername -ppass
单一功能原则 dcj3sjt126com 面向对象的程序设计软件设计编程原则
单一功能原则[ 编辑] SOLID 原则单一功能原则开闭原则 Liskov代换原则接口隔离原则依赖反转原则查论编在面向对象编程领域中，单一功能原则（Single responsibility principle）规定每个类都应该有
POJO、VO和JavaBean区别和联系 fanmingxing VO POJO javabean
POJO和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Plain Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比POJO复杂很多，JavaBean是一种组件技术，就好像你做了一个扳子，而这个扳子会在很多地方被
SpringSecurity3.X--LDAP：AD配置 hanqunfeng SpringSecurity
前面介绍过基于本地数据库验证的方式，参考http://hanqunfeng.iteye.com/blog/1155226，这里说一下如何修改为使用AD进行身份验证【只对用户名和密码进行验证，权限依旧存储在本地数据库中】。将配置文件中的如下部分删除：
mac mysql 修改密码 IXHONG mysql
$ sudo /usr/local/mysql/bin/mysqld_safe –user=root & //启动MySQL(也可以通过偏好设置面板来启动)$ sudo /usr/local/mysql/bin/mysqladmin -uroot password yourpassword //设置MySQL密码（注意，这是第一次MySQL密码为空的时候的设置命令，如果是修改密码，还需在-
设计模式--抽象工厂模式 kerryg 设计模式
抽象工厂模式：工厂模式有一个问题就是，类的创建依赖于工厂类，也就是说，如果想要拓展程序，必须对工厂类进行修改，这违背了闭包原则。我们采用抽象工厂模式，创建多个工厂类，这样一旦需要增加新的功能，直接增加新的工厂类就可以了，不需要修改之前的代码。总结：这个模式的好处就是，如果想增加一个功能，就需要做一个实现类，
评"高中女生军训期跳楼” nannan408
首先，先抛出我的观点，各位看官少点砖头。那就是，中国的差异化教育必须做起来。孔圣人有云：有教无类。不同类型的人，都应该有对应的教育方法。目前中国的一体化教育，不知道已经扼杀了多少创造性人才。我们出不了爱迪生，出不了爱因斯坦，很大原因，是我们的培养思路错了，我们是第一要“顺从”。如果不顺从，我们的学校，就会用各种方法，罚站，罚写作业，各种罚。军
scala如何读取和写入文件内容？ qindongliang1922 java jvm scala
直接看如下代码： package file import java.io.RandomAccessFile import java.nio.charset.Charset import scala.io.Source import scala.reflect.io.{File, Path} /** * Created by qindongliang on 2015/
C语言算法之百元买百鸡 qiufeihu c 算法
中国古代数学家张丘建在他的《算经》中提出了一个著名的“百钱买百鸡问题”，鸡翁一，值钱五，鸡母一，值钱三，鸡雏三，值钱一，百钱买百鸡，问翁，母，雏各几何？代码如下： #include <stdio.h> int main() { int cock,hen,chick; /*定义变量为基本整型*/ for(coc
Hadoop集群安全性：Hadoop中Namenode单点故障的解决方案及详细介绍AvatarNode wyz2009107220 NameNode
正如大家所知，NameNode在Hadoop系统中存在单点故障问题，这个对于标榜高可用性的Hadoop来说一直是个软肋。本文讨论一下为了解决这个问题而存在的几个solution。 1. Secondary NameNode 原理：Secondary NN会定期的从NN中读取editlog，与自己存储的Image进行合并形成新的metadata image 优点：Hadoop较早的版本都自带，