硬水果糖

神经网络基础之正则化

引言：正则化 （Regularization）是机器学习中一种用于防止模型过拟合技术。核心思想是通过在模型损失函数中添加一个惩罚项（Penalty Term），对模型的复杂度进行约束，从而提升模型在新数据上的泛化能力。

一、正则化目的

防止过拟合：当模型过于复杂（例如神经网络层数过多、参数过多）时，容易在训练数据上“记忆”噪声或细节，导致在测试数据上表现差。
简化模型：正则化通过限制模型参数的大小或数量，迫使模型学习更通用的特征，而非过度依赖训练数据的细节。

二、正则化原理

正则化的本质是在损失函数（Loss Function）中添加一个 惩罚项，其形式为：
$\text{总损失} = \text{原始损失} + \lambda \cdot \text{惩罚项}$

原始损失：模型在训练数据上的误差（如均方误差、交叉熵等）。
惩罚项：对模型参数的约束，例如参数的大小或稀疏性。
λ：正则化系数，控制惩罚项的强度。λ越大，惩罚越强，模型越简单。

三、常见正则化方法

1. L1 正则化（Lasso 正则化）：

定义：通过在损失函数中添加权重的 L1 范数惩罚项，使部分权重趋于零达到特征选择的效果。
算法原理：

在机器学习中，模型通过最小化损失函数进行训练。L1 正则化在原始损失函数中添加一个基于参数 L1 范数的惩罚项，优化目标变为：

$J(\theta) = L(\theta) + \lambda \cdot R(\theta)$

其中：

$J(\theta)$ ：总损失函数（带正则化的目标函数）。
$L(\theta)$ ：原始损失函数（例如均方误差、交叉熵等），衡量模型预测与真实值的差距。
$R(\theta) = \|\theta\|_1 = \sum_{i} |\theta_i|$ 惩罚项：L1 正则化项，即参数绝对值之和。
$\lambda$ ：正则化强度的超参数（惩罚系数），控制正则化的影响程度， $\lambda \geq 0$ 。
$\theta$ ：模型的参数（权重）。

通过最小化 $J(\theta)$ ，模型不仅要拟合数据，还要尽量减少参数的绝对值总和，这会导致部分参数被压缩到 0。

梯度更新原理：

由于 L1 范数的绝对值函数在 0 点不可导，梯度更新需要使用次梯度（subgradient）。以一个权重 $w$ 为例：

原始梯度更新（无正则化）： $\leftarrow w - \eta \frac{\partial L}{\partial w}$ 。
带 L1 正则化的次梯度更新：
$\leftarrow w - \eta \left( \frac{\partial L}{\partial w} + \lambda \cdot \text{sign}(w) \right)$
- $\eta$ ：学习率。
- $\frac{\partial L}{\partial w}$ ：原始损失对权重的梯度。
- $\text{sign}(w)$ ：符号函数， $w > 0$ 时为 1， $w < 0$ 时为 -1， $w = 0$ 时次梯度取值范围为 $[- 1, 1]$ 。

当 $w$ 的更新步长不足以抵消 $\lambda \cdot \text{sign}(w)$ 时， $w$ 会被压缩到 0，从而产生稀疏性。

作用：
- 稀疏解：L1 正则化倾向于将不重要的参数直接置为 0，形成稀疏的权重向量。这使得模型只保留对预测最重要的特征。
- 特征选择：由于部分权重变为 0，L1 正则化可以自动识别和剔除不相关或冗余的特征，特别适用于高维数据。
- 防止过拟合：通过减少有效参数数量，L1 正则化降低了模型复杂度，从而提升了泛化能力。
优缺点：
- 优点：
  - 特征选择能力： L1 正则化能够生成稀疏模型，自动筛选重要特征，适用于特征维度高或需要解释性的场景。
  - 降低模型复杂度：通过剔除不必要参数，简化模型结构，减少计算开销。
  - 对噪声鲁棒：忽略不相关特征后，模型对数据中的噪声更不敏感。
- 缺点：
  - 不稳定性：当特征之间高度相关时，L1 正则化可能随机选择其中一个特征置为非 0，而忽略其他相关特征，导致结果不稳定。
  - 优化难度：由于 L1 范数不可导，优化过程需要使用次梯度或近端梯度下降等方法，计算复杂度可能高于 L2 正则化。
  - 依赖超参数 $\lambda$ ：正则化强度 $\lambda$ 的选择至关重要，过大可能导致重要特征也被置为 0，过小则正则化效果不足。

import numpy as np
from sklearn.linear_model import LinearRegression, Lasso
from sklearn.datasets import make_regression
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error

# 1、生成模拟数据
X, y = make_regression(n_samples=100, n_features=10, noise=0.1, random_state=42)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 2、普通线性回归
lr = LinearRegression()
lr.fit(X_train, y_train)
y_predict_lr = lr.predict(X_test)
mse_lr = mean_squared_error(y_test, y_predict_lr)
print(f"普通线性回归 MSE: {mse_lr:.4f}")

# 3、L1 正则化（Lasso）
lasso = Lasso(alpha=0.1)  # alpha 是正则化强度，对应 λ
lasso.fit(X_train, y_train)
y_predict_lasso = lasso.predict(X_test)
mse_lasso = mean_squared_error(y_test, y_predict_lasso)
print(f"L1 正则化（Lasso） MSE: {mse_lasso:.4f}")

# 4、查看权重
print("普通线性回归权重：", lr.coef_[:10])
print("L1 正则化权重：", lasso.coef_[:10])

普通线性回归 MSE: 0.0103
L1 正则化（Lasso） MSE: 0.1824
普通线性回归权重： [16.7712358  54.13782324  5.18097686 63.64362199 93.61309994 70.63686589 87.0713662  10.43882574  3.15690876 70.90887261]
L1   正则化权重： [16.68551572 54.04466658  5.03023843 63.54923618 93.45872786 70.54211442 86.95689868 10.27114941  3.06974112 70.78354482]

2. L2 正则化（Ridge 正则化）：

定义：在损失函数中添加权重的 L2 范数平方惩罚项，防止权重过大，促进模型的平滑性。
算法原理：

在机器学习中，模型通常通过最小化一个损失函数（例如均方误差）来训练。L2 正则化通过在原始损失函数中添加一个额外的项，改变优化的目标。数学上，带 L2 正则化的损失函数可以表示为：

$J(\theta) = L(\theta) + \lambda \cdot R(\theta)$

其中：

$J(\theta)$ ：总损失函数（带正则化的目标函数）。
$L(\theta)$ ：原始损失函数（例如均方误差、交叉熵等），衡量模型预测与真实值之间的差距。
$R(\theta) = \frac{1}{2} \|\theta\|_2^2 = \frac{1}{2} \sum_{i} \theta_i^2$ ：L2 正则化项，即参数的 L2 范数平方，即参数权重平方和。
$\lambda$ ：正则化强度的超参数（也叫惩罚系数），控制正则化的影响程度， $\lambda \geq 0$ 。
$\theta$ ：模型的参数（权重）。

优化目标变为同时最小化原始损失 $L(\theta)$ 和正则化项 $\lambda \cdot R(\theta)$ ，从而平衡模型的拟合能力和复杂性。

梯度更新：

在梯度下降优化中，L2 正则化会影响参数的更新规则。以一个权重 ( w ) 为例：

原始梯度更新（无正则化）： $\leftarrow w - \eta \frac{\partial L}{\partial w}$ 。
带 L2 正则化的梯度更新：
$\leftarrow w - \eta \left( \frac{\partial L}{\partial w} + \lambda w \right)$
- $\eta$ ：学习率。
- $\frac{\partial L}{\partial w}$ ：原始损失对权重的梯度。
- $\lambda w$ ： $L 2$ 正则化的梯度贡献。

可以看到，L2 正则化在每次更新时额外引入了一个衰减项 $\lambda w$ ，使得权重倾向于变小。因此，L2 正则化也被称为 权重衰减（weight decay）。

作用：
- 避免过拟合：只需在损失函数中添加一项即可，计算和优化都很直接。使参数值整体变小（但不会变为 0），避免参数过大导致过拟合。
- 提升模型的稳定性：通过限制权重大小，L2 正则化使模型更能抵抗数据中的异常值或噪声。提升模型的稳定性（减少参数波动）。
- 广泛适用：可用于线性回归、逻辑回归、神经网络等多种模型。
局限性：
- 无法产生稀疏解：与 L1 正则化（Lasso）不同，L2 正则化不会将权重变为 0，因此不具备特征选择的能力。
- 依赖超参数 ：正则化强度需要通过交叉验证等方法调整，过大可能导致欠拟合，过小则效果不足。

import numpy as np
from sklearn.linear_model import LinearRegression, Ridge
from sklearn.datasets import make_regression
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error

# 1、生成模拟数据
X, y = make_regression(n_samples=100, n_features=10, noise=0.1, random_state=42)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 2、普通线性回归
lr = LinearRegression()
lr.fit(X_train, y_train)
y_predict_lr = lr.predict(X_test)
mse_lr = mean_squared_error(y_test, y_predict_lr)
print(f"普通线性回归 MSE: {mse_lr:.4f}")

# 3、L2 正则化（Ridge alpha=λ是正则化强度）
ridge = Ridge(alpha=3.0)  
ridge.fit(X_train, y_train)
y_predict_ridge = ridge.predict(X_test)
mse_ridge = mean_squared_error(y_test, y_predict_ridge)
print(f"L2 正则化（Ridge） MSE: {mse_ridge:.4f}")

# 4、查看权重
print("普通线性回归权重：", lr.coef_[:10])
print("L2 正则化权重：", ridge.coef_[:10])

普通线性回归 MSE: 0.0103
L2 正则化（Ridge） MSE: 99.6320
普通线性回归权重： [16.7712358  54.13782324  5.18097686 63.64362199 93.61309994 70.63686589 87.0713662  10.43882574  3.15690876 70.90887261]
L2   正则化权重： [17.26631225 51.58306238  5.07374538 60.93844646 89.34000194 67.95302325 83.99492712  8.91228771  3.41758485 67.23661507]

3. Dropout 正则化：

定义：在训练过程中随机丢弃部分神经元，减少神经元间的共适应性，防止过拟合。
算法原理：在训练时随机“关闭”（置零）部分神经元，强制网络学习更鲁棒的特征。

假设某一层的输入是 $x$ ，经过 Dropout 后的输出为 $y$ ：

训练时： $\sim \text{Bernoulli}(p) \quad \text{（生成 0/1 掩码，1 的概率为 } 1-p\text{）}$

$\frac{r \cdot x}{1-p} \quad \text{（其中 $ r $ 是随机掩码，$ p $ 是丢弃概率）}$

推理时： $y = x$ 不丢弃任何神经元，直接使用完整输出。

位置：输入 -> 全连接/卷积 -> 激活函数 -> Dropout -> 输出
作用：
- 防止过拟合：通过随机丢弃神经元，减少了神经元之间的“共适应”（co-adaptation），即避免模型过度依赖某些特定的神经元组合。
- 类似集成学习：Dropout 相当于在训练过程中生成了多个不同的子网络，最终的模型可以看作这些子网络的平均效果，具有类似集成学习的正则化作用。
- 简单高效：Dropout 实现简单，只需在网络中添加一层操作，且计算开销低。
- 提高泛化能力：模型在训练时无法依赖单一路径或特征，使得其在测试数据上的表现更鲁棒。
局限性：
- 训练时间增加：由于引入了随机性，Dropout 可能需要更多的迭代才能收敛。
- 不适用于所有场景：对于小型网络或数据量不足的情况，Dropout 可能会削弱模型的表达能力，反而降低性能。
- 推理阶段无随机性：Dropout 只在训练时起作用，推理时不丢弃神经元，因此其正则化效果仅通过训练过程间接体现。

import torch
import torch.nn as nn
import torch.optim as optim

# 定义一个带 Dropout 的简单网络
class DropNet(nn.Module):
    def __init__(self):
        super(DropNet, self).__init__()
        # 定义输入输出维度
        self.fc1 = nn.Linear(10, 20)
        # 丢弃概率 0.5
        self.dropout = nn.Dropout(p=0.5)
        self.fc2 = nn.Linear(20, 1)
        # 使用ReLU激活函数
        self.relu = nn.ReLU()

    def forward(self, x):
        x = self.fc1(x)
        x = self.relu(x)
        x = self.dropout(x)  # 应用 Dropout
        x = self.fc2(x)
        return x

# 1、生成随机数据（共64个样本，每个样本10个特征）
X = torch.randn(64, 10)
y = torch.randn(64, 1)
print(f"第一个条样本: {X[:1]}")
print(f"第一个目标值: {y[:1]}")

# 2、初始化模型、损失函数和优化器
model = DropNet()
criterion = nn.MSELoss()
optimizer = optim.SGD(model.parameters(), lr=0.01)

# 3、训练模型
model.train()
for epoch in range(100):
    # 清除上次梯度
    optimizer.zero_grad()
    # 前向传播，计算模型的输出
    output = model(X)
    # 计算损失函数
    loss = criterion(output, y)
    # 反向传播，计算梯度
    loss.backward()
    # 更新模型参数
    optimizer.step()
    if epoch % 20 == 0:
        print(f"Epoch {epoch}, 损失: {loss.item():.4f}")

# 4、推理模式
model.eval()  # 设置为评估模式（Dropout 关闭）
with torch.no_grad():
    predict = model(X)
    print("推理结果：", predict[:1])

第一个条样本: tensor([[-0.3384, -0.3127,  0.4141,  1.0404,  0.8872, -1.2251, -0.1888,  0.4323, 0.0642, -1.3889]])
第一个目标值: tensor([[-0.6342]])
Epoch 0, 损失: 1.0907
Epoch 20, 损失: 1.0641
Epoch 40, 损失: 0.9568
Epoch 60, 损失: 0.9666
Epoch 80, 损失: 0.9806
推理结果： tensor([[0.0403]])

4. 批归一化（Batch Normalization）：

定义：对每一层的输入进行归一化处理，稳定数据分布，加速训练并具有一定的正则化效果。
原理：在每一层的输入上，对每个小批量（mini-batch）的数据进行标准化，使得每层的输入分布更稳定，从而加速训练并提升模型性能。

对于一个小批量数据 $B = \{x_1, x_2, ..., x_m\}$ （ $m$ 是批量大小），计算：

均值： $\mu_B = \frac{1}{m} \sum_{i=1}^m x_i$
方差： $\sigma_B^2 = \frac{1}{m} \sum_{i=1}^m (x_i - \mu_B)^2$
$\hat{x}_i = \frac{x_i - \mu_B}{\sqrt{\sigma_B^2 + \epsilon}} \quad \text{（$\epsilon$ 是防止除零的小常数，如 $1 \times 10^{-5}$）}$

为了保留模型的表达能力，批量归一化引入两个可学习的参数 $\gamma$ 和偏移 $\beta$ （平移），对标准化后的值进行线性变换：
$y_i = \gamma \hat{x}_i + \beta \quad \text{（$\gamma$ 控制输出的标准差；$\beta$ 控制输出的均值）}$

位置：输入 -> 卷积/全连接 -> 批量归一化 -> 激活函数 -> 输出
作用：
- 加速训练：通过标准化输入，减少了梯度消失或爆炸的风险，使模型可以使用更高的学习率，从而加快收敛。
- 提高稳定性：减少了每一层输入分布的变化，使训练过程更稳定。
- 正则化效果：批量归一化引入了噪声（由于小批量均值和方差的随机性），一定程度上具有正则化作用，可能减少对 Dropout 等其他正则化方法的需求。
- 对初始化不敏感：减少了对参数初始化的依赖，即使初始值不太理想，模型也能较好地收敛。
局限性：
- 依赖批量大小：当批量大小（batch size）太小时，均值和方差的估计不够准确，会影响效果。通常需要较大的批量大小（如 32 或 64）。
- 推理阶段的处理：在训练时，BN 使用小批量的均值和方差；但在推理（测试）时，小批量不可用。因此，BN 会维护一个全局的移动均值和移动方差（通过训练时的指数移动平均计算），用于推理阶段。
- 不适用于某些任务：对于动态网络（如 RNN）或小批量难以定义的场景（如在线学习），BN 的效果可能不佳。

import torch
import torch.nn as nn
import torch.optim as optim

# 定义一个简单的网络
class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        # 定义输入输出维度
        self.fc1 = nn.Linear(10, 20)
        # 使用nn对20个特征进行批量归一化
        self.bn = nn.BatchNorm1d(20)  
        self.fc2 = nn.Linear(20, 1)
        # 使用ReLU激活函数
        self.relu = nn.ReLU()

    def forward(self, x):
        x = self.fc1(x)
        # 应用批量归一化
        x = self.bn(x)
        x = self.relu(x)
        x = self.fc2(x)
        return x

# 1、生成随机数据（共64个样本，每个样本10个特征）
X = torch.randn(64, 10)
y = torch.randn(64, 1)
print(f"第一个条样本: {X[:1]}")
print(f"第一个目标值: {y[:1]}")

# 2、初始化模型、损失函数和优化器
model = Net()
criterion = nn.MSELoss()
optimizer = optim.SGD(model.parameters(), lr=0.01)

# 3、训练模型
model.train()
for epoch in range(100):
    # 清除上次梯度
    optimizer.zero_grad()
    # 前向传播，计算模型的输出
    output = model(X)
    # 计算损失函数
    loss = criterion(output, y)
    # 反向传播，计算梯度
    loss.backward()
    # 更新模型参数
    optimizer.step()
    if epoch % 20 == 0:
        print(f"Epoch {epoch}, 损失: {loss.item():.4f}")

# 4、推理模式
model.eval()  # 设置为评估模式（使用移动均值和方差）
with torch.no_grad():
    predict = model(X)
    print("推理结果：", predict[:1])

第一个条样本: tensor([[-0.4048,  1.3088, -1.8305,  0.6533, -0.3900, -1.1319,  0.3992,  1.9025, -0.0115, -0.1645]])
第一个目标值: tensor([[0.0327]])
Epoch 0, 损失: 1.0700
Epoch 20, 损失: 0.7397
Epoch 40, 损失: 0.6255
Epoch 60, 损失: 0.5578
Epoch 80, 损失: 0.5163
推理结果： tensor([[-0.1543]])

四、总结

正则化方法	描述	公式表示	特点
L1 正则化（Lasso）	在损失函数中加入权重的 L1 范数惩罚项，鼓励模型产生稀疏权重，即部分权重被压缩为零，从而实现特征选择。	$J(\theta) = \text{Loss} + \lambda \sum_{i} \vert\theta_i\vert$	有助于特征选择，产生稀疏模型，但可能导致解的不稳定性。
L2 正则化（Ridge）	在损失函数中加入权重的 L2 范数惩罚项，防止权重过大，使模型更加平滑。	$J(\theta) = \text{Loss} + \lambda \sum_{i} \theta_i^2$	防止权重过大，适用于处理多重共线性问题，但不会导致权重为零。
Dropout	在训练过程中以一定概率随机丢弃神经元，减少神经元间的共适应性，防止过拟合。	-	简单有效，适用于神经网络，但增加了训练时间。
早停法（Early Stopping）	在验证集性能不再提升时停止训练，防止模型过度拟合训练数据。	-	简单易行，但需要验证集，可能错过最佳模型。
数据增强（Data Augmentation）	通过对训练数据进行随机变换，增加数据量，增强模型的泛化能力。	-	增强模型鲁棒性，但可能增加训练时间。
批归一化（Batch Normalization）	对每一层的输入进行归一化处理，稳定数据分布，加速训练并具有一定的正则化效果。	-	加速训练，稳定性强，但增加了模型复杂度。

【DL经典回顾】激活函数大汇总（四）（Softmax & Softplus附代码和详细公式）夺命猪头 python 机器学习人工智能神经网络 numpy
激活函数大汇总（四）（Softmax&Softplus附代码和详细公式）更多激活函数见激活函数大汇总列表一、引言欢迎来到我们深入探索神经网络核心组成部分——激活函数的系列博客。在人工智能的世界里，激活函数扮演着不可或缺的角色，它们决定着神经元的输出，并且影响着网络的学习能力与表现力。鉴于激活函数的重要性和多样性，我们将通过几篇文章的形式，本篇详细介绍两种激活函数，旨在帮助读者深入了解各种激活函数的
神经网络项目--基于FPGA的AI简易项目（1-9图片数字识别）霖12 深度学习 pytorch 神经网络 fpga开发人工智能机器学习
1.训练MNIST模型importtorch#导入pytorch核心库importtorch.nnasnn#神经网络模块，如卷积层importtorch.optimasoptim#优化器fromtorchvisionimportdatasets,transforms#数据集与图像预处理工具#定义CNN模型classSimpleCNN(nn.Module):#PyTorch库中所有神经网络的“基础模
基于NanoDet的健身姿势纠正系统开发 YOLO实战营人工智能 NanoDet 深度学习计算机视觉 ui
1.引言在现代健身行业中，正确的运动姿势至关重要，不仅能提升训练效果，还能预防运动损伤。尤其是在进行一些高强度的力量训练时，如深蹲、俯卧撑等，错误的姿势可能导致肌肉不平衡或关节损伤。传统的健身姿势纠正方式依赖教练的人工指导，但随着人工智能技术的发展，使用计算机视觉和深度学习技术来进行姿势纠正，逐渐成为一种高效且可扩展的解决方案。本文将详细介绍如何基于NanoDet（一个轻量化目标检测模型）开发一个
大模型算法工程师技术路线全解析：从基础到资深的能力跃迁 Mr.小海大模型算法数据挖掘人工智能机器学习深度学习机器翻译 web3
文章目录大模型算法工程师技术路线全解析：从基础到资深的能力跃迁一、基础阶段（0-2年经验）：构建核心知识体系与工程入门数学与机器学习基础编程与深度学习框架NLP与Transformer入门二、进阶阶段（2-4年经验）：深化模型技术与工程落地能力大模型预训练与微调技术预训练原理：数据与任务的协同设计微调工具：参数高效适配与工程优化对齐实践：价值观优化与实证效果分布式训练与框架工具并行策略：多维度协同
Go与Python在数据管道与分析项目中的抉择：性能与灵活性的较量真智AI 人工智能 python go
你正在设计一个全新数据管道或启动一个分析项目，此时你或许正在思考该选择Python还是Go。五年前，这甚至不是个值得讨论的问题——你会毫不犹豫地选择Python，故事到此为止。然而，近年来Go在数据领域，尤其是在数据基础设施和实时处理方面，正逐渐被更多人采用。实际上，这两种语言都已在现代数据技术栈中找到了各自的定位。Python依然非常适合机器学习和数据分析，而Go则逐步成为高性能数据基础设施的首
Python爬虫实战：从新浪财经爬取股票新闻的完整实现 Python爬虫项目 python 爬虫开发语言数据分析 php
第一部分：爬虫概述1.1什么是爬虫？爬虫是指通过程序模拟浏览器的行为，自动化地抓取网络上的数据。通过爬虫技术，能够从各种网站上提取信息，广泛应用于数据采集、数据分析、机器学习等领域。1.2新浪财经简介新浪财经是中国最大的财经信息平台之一，提供股票、基金、债券、外汇等多方面的财经新闻和数据。在股票领域，新浪财经提供了大量的股票行情、实时数据、新闻报道等信息，因此爬取新浪财经的股票新闻对于投资分析和决
神经网络常见激活函数 13-Softplus函数亲持红叶神经网络常见激活函数神经网络人工智能深度学习
文章目录Softplus函数+导函数函数和导函数图像优缺点PyTorch中的Softplus函数TensorFlow中的Softplus函数Softplus函数+导函数Softplus函数Softplus⁡(x)=ln⁡(1+e x)\begin{aligned}\operatorname{Softplus}(x)&=\ln\bigl(1+e^{\,x}\bigr)\end{aligned}Sof
AI 智能运维，重塑大型企业软件运维：从自动化到智能化的进阶实践 AI、少年郎人工智能运维自动化
一、引言：企业软件运维的智能化转型浪潮在数字化转型加速的背景下，大型企业软件架构日益复杂，微服务、多云环境、分布式系统的普及导致传统运维模式面临效率瓶颈。AI技术的渗透催生了智能运维（AIOps）的落地，通过机器学习、大模型、智能Agent等技术，实现从"人工救火"到"智能预防"的范式转变。本文结合头部企业实践，解析AI在运维领域的核心应用场景、技术架构及未来趋势，特别针对基础运维中流程重构、技术
Spring AI 概述与功能简介 drebander AI 编程 spring 人工智能 java
SpringAI是一个由Spring团队开发的开源框架，旨在为人工智能（AI）和机器学习（ML）提供一个成熟且高效的开发平台。它将Spring生态系统的设计理念应用于AI开发，尤其强调模块化、可移植性以及简洁的集成。SpringAI提供了丰富的功能，涵盖从AI模型的调用到与数据库的集成等多个方面，帮助开发者构建和管理AI驱动的应用程序。1.SpringAI背景SpringAI的背景源于Spring
Spring AI从入门到精通：构建智能Spring应用的全面指南 java干货仓库 Spring 八股文汇总大模型 spring 人工智能 java
随着人工智能技术的快速发展，将大语言模型（LLM）与企业应用集成已成为趋势。SpringAI作为Spring官方推出的AI集成框架，为开发者提供了便捷、标准化的方式来构建智能应用。本文将从基础概念到高级应用，全面介绍SpringAI的核心功能与实践技巧。一、SpringAI概述1.1什么是SpringAI？SpringAI是VMware于2023年推出的开源框架，旨在简化大语言模型（LLM）与Sp
在二分类任务中如何处理包含中文的类别特征 Dush32 分类数据挖掘人工智能机器学习数据分析
在机器学习中，处理类别特征（CategoricalFeatures）是常见的任务，特别是在中文数据中，很多类别特征如省份、城市等都是字符串类型。如何将这些类别变量转换为模型可以理解的数值格式，是每个数据科学家都必须面对的挑战。在这篇文章中，我们将探讨两种常见的类别特征编码方法：astype('category')和LabelEncoder，并比较它们在二分类任务中的效果。我们以“省份”这一类别特征
基于用户画像的商品推荐系统 Dush32 机器学习人工智能 python 推荐算法
随着人工智能和大数据技术的进步，产品推荐系统成为了现代广告与电商平台中不可或缺的部分。通过深度挖掘用户的行为数据，能够为广告主提供精准的用户画像，从而更高效地推荐相关产品，提升购买转化率。本项目基于科大讯飞AI营销云大赛的赛题，目的是利用用户画像进行产品推荐，预测用户是否会购买相应商品。我们使用了机器学习的二分类模型，通过分析用户的性别、年龄、常驻地、机型等信息，来判断用户的付费行为。项目目标：本
AI原生应用领域多租户的技术架构剖析 AI天才研究院 AI-native 架构人工智能 ai
AI原生应用领域多租户技术架构深度剖析元数据框架标题：AI原生应用多租户技术架构：从隔离性到智能化的分层设计与实践关键词：AI原生应用、多租户架构、数据隔离、模型共享、云原生租户管理摘要：本文系统解析AI原生应用场景下多租户技术架构的核心设计逻辑，覆盖从数据层到模型层的全栈隔离与共享机制。通过第一性原理推导，结合云原生、机器学习生命周期管理（MLOps）等技术范式，提出包含租户上下文管理、动态资源
对话新希望CDO李旭昶：立足核心诉求，积极拥抱人工智能
“转型焕新，希望无限。”整理|王娴编辑|云舒出品｜极新4月12日，在「2024飞书先进生产力峰会|成都站」活动中，新希望首席数字官李旭昶先生做了主题为“转型焕新，希望无限”的分享。上次见他是4个月前，当时我们聊了1个多小时，内容涉及数字化转型、人工智能、管理、技术商业等话题。今天顺着他分享的内容，将这篇对话分享出来。随着信息科技的发展，我国传统企业在过去几年中逐步进行数字化转型，利用先进的科学技术
飞算科技：以创新科技引领数字化变革，旗下飞算 JavaAI 成开发利器飞算JavaAI开发助手科技
作为国家级高新技术企业，飞算科技专注于自主创新，在数字科技领域持续深耕，用前沿技术为各行业客户赋能，助力其实现数字化转型升级的飞跃。飞算科技凭借深厚的技术积累，将互联网科技、大数据、人工智能等技术与实际应用紧密融合。公司组建了一支由行业资深专家和技术精英构成的团队，他们在相关领域积累了多年实践经验，深刻理解不同行业客户在数字化进程中面临的痛点与挑战。基于这些洞察，飞算科技推出了一系列具有创新性和实
Python爬虫实战：批量下载小红书笔记图片的全流程技术解析 Python爬虫项目 2025年爬虫实战项目 python 爬虫笔记开发语言音视频 github
1.引言：为什么要爬取小红书笔记图片小红书作为新兴的生活方式分享平台，聚集了大量高质量原创笔记内容，涵盖时尚、美妆、旅游、美食等多领域。笔记中的图片往往是内容的核心，批量下载小红书笔记图片，有助于：内容归档与备份数据分析与用户行为研究图像识别与机器学习训练电商推广及内容再加工但小红书对内容保护做得较好，爬取难度较高，需要结合多技术手段突破。2.小红书平台特点与爬取难点动态加载与API接口多变：页面
Rust+ChatBoxAI：实战
ChatboxAIChatboxAI是一款基于人工智能技术的智能助手工具，旨在通过自然语言交互帮助用户完成多种任务。以下是其核心功能与特点：功能概述多模型支持：可连接OpenAI、Claude、Gemini等主流大语言模型，用户能自由切换不同AI服务。本地运行：支持离线使用，数据隐私性较强，适合敏感信息处理场景。跨平台兼容：提供Windows、macOS和Linux客户端，同步支持移动端应用。核心
【Java架构师的未来与趋势】架构学院 Java成神之路-架构师进阶 java 开发语言
Java架构师的未来与趋势引言Java作为企业级应用开发的主力军，已经走过了25年的历程。在这四分之一个世纪中，Java生态系统经历了从Applet到企业级应用，从单体架构到微服务，从本地部署到云原生的巨大转变。今天，Java架构师正站在新一轮技术变革的十字路口——人工智能、云计算、低代码、边缘计算等新兴技术正深刻重塑软件架构的形态和架构师的角色。据JetBrains《2023Java开发者调查》
【机器学习】必会降维算法之：独立成分分析（ICA） Carl_奕然机器学习算法人工智能
独立成分分析（ICA）1、引言2、独立成分分析（ICA）2.0引言2.1定义2.2应用场景2.3核心原理2.4实现方式2.5算法公式2.6代码示例3、总结1、引言小屌丝：鱼哥，最近胡塞武装很哇塞啊。小鱼：你什么时候开始关注军事了？小屌丝：这…还用关注吗？都上新闻了。小鱼：嗯，那你知道胡塞武装为什么这么厉害吗？小屌丝：额…当然是光脚不怕穿鞋的。小鱼：…你可真是…小屌丝：真是啥？小鱼：一个字，自己体会
神经网络：从模式组合到多层神经网络的进化 MoonlitHan 人工智能
这两张图展示了神经网络如何从“简单判断”进化到“复杂识别”：1.模式组合：让神经网络“拆分任务”第一张图的核心是“模式组合”：比如识别数字3时，网络会把任务拆成“识别左半部分”和“识别右半部分”；中间的神经元专门负责提取局部特征（比如左半部分的曲线、右半部分的直线）；最终输出层的y₃和y₈会综合这些局部特征，判断图片是不是数字3或8。2.多层神经网络：让AI学会“分层思考”第二张图展示了多层神经网
【AAAI2025】计算机视觉|P-sLSTM:P-sLSTM：让LSTM在时间序列预测领域“重获新生”
论文地址：https://arxiv.org/pdf/2408.10006代码地址：https://github.com/Eleanorkong/P-sLSTM关注UPCV缝合怪，分享最计算机视觉新即插即用模块，并提供配套的论文资料与代码。https://space.bilibili.com/473764881摘要传统的循环神经网络结构，如长短期记忆神经网络(LSTM)，在时间序列预测(TSF)任
Java 大视界 -- Java 大数据机器学习模型在金融市场情绪分析与投资策略制定中的应用青云交大数据新视界 Java 大视界 java 大数据机器学习情绪分析智能投资多源数据
Java大视界--Java大数据机器学习模型在金融市场情绪分析与投资策略制定中的应用）引言：正文：一、金融情绪数据的立体化采集与治理1.1多模态数据采集架构1.2数据治理与特征工程二、Java机器学习模型的工程化实践2.1情感分析模型的深度优化2.2强化学习驱动的动态投资策略三、顶级机构实战：Java系统的金融炼金术四、技术前沿：Java与金融科技的未来融合4.1量子机器学习集成4.2联邦学习在合
生成式人工智能实战 | 像素卷积神经网络（PixelCNN）盼小辉丶生成式人工智能实战150讲深度学习生成模型 aigc
生成式人工智能实战|像素卷积神经网络0.前言1.PixelCNN工作原理1.1掩码卷积层1.2残差块2.PixelCNN分析3.使用混合分布改进PixelCNN3.1模型构建3.2模型训练0.前言像素卷积神经网络(PixelConvolutionalNeuralNetwork,PixelCNN)是于2016年提出的一种图像生成模型，其根据前面的像素预测下一个像素的概率来逐像素地生成图像，模型可以通
【机器学习【9】】评估算法：数据集划分与算法泛化能力评估 roman_日积跬步-终至千里 #机器学习机器学习
文章目录一、数据集划分：训练集与评估集二、K折交叉验证：提升评估可靠性1.基本原理1.1.K折交叉验证基本原理1.2.逻辑回归算法与L22.基于K折交叉验证L2算法三、弃一交叉验证（Leave-One-Out）1、基本原理2、代码实现四、ShuffleSplit交叉验证1、基本原理2、为什么能降低方差3、代码测试五、选择建议在机器学习中，评估算法的核心目标是衡量模型在“未知数据”上的表现，而不是仅
最全2025年AI开发工具深度对比分析：程序员的智能编程助手全指南最新功能、定价策略、使用体验和适用场景 Cursor、GitHub Copilot、Claude 4、Claude Code wei佳人工智能 ai AI编程 webstorm idea vscode
2025年AI开发工具深度对比分析：程序员的智能编程助手全指南引言(不想看文字可直接看后面图表对比）随着人工智能技术的飞速发展，AI编程助手已经从概念走向现实，成为现代软件开发不可或缺的工具。2025年上半年，AI编程工具市场迎来了前所未有的变革，各大厂商纷纷推出革命性功能，从简单的代码补全演进为能够理解完整项目上下文的智能编程代理。据最新市场研究显示，全球AI代码工具市场在2024年达到67亿美
Python day15
@浙大疏锦行Pythonday15.内容：复习日本周主要的内容是一些常见的机器学习流程以及其中的部分内容标签编码以及连续特征的处理：归一化和正态化等。图像的绘制：热力图、Shap图等的绘制超参数优化算法：网格搜索、贝叶斯以及启发式算法模拟退火、遗传算法等不平衡数据集的处理：过采样以及欠采样。
基于cnn和resnet和mobilenet对比实现驾驶员分心检测深度学习乐园 cnn 人工智能神经网络
演示效果及获取项目源码点击文末名片本项目旨在通过深度学习技术，结合卷积神经网络（CNN）模型、ResNet模型和MobileNet模型，实现对驾驶员分心行为的自动检测。我们通过训练这些模型来识别不同的驾驶员分心行为，包括如发短信、通话、喝水等行为。使用的数据集包含驾驶员行为的图片，并且针对每个行为标注了相应的标签（例如"正常驾驶"、"右手发短信"等）。MobileNetV2是Google于2018
Postman + Newman + Jenkins 接口自动化测试 Thomas Kant 自动化测试 postman newman jenkins allure
亲爱的技术爱好者们，热烈欢迎来到Kant2048的博客！我是ThomasKant，很开心能在CSDN上与你们相遇～本博客的精华专栏：【自动化测试】【测试经验】【人工智能】【Python】Postman
无人值守人工智能智慧系统数据分析：深度洞察与未来展望呆码科技人工智能数据分析数据挖掘
无人值守人工智能智慧系统数据分析：深度洞察与未来展望随着科技的飞速发展，人工智能（AI）技术已逐渐渗透到社会经济的各个领域，其中无人值守人工智能智慧系统作为AI技术应用的前沿阵地，正引领着一场深刻的行业变革。这类系统通过集成高级算法、大数据分析、物联网（IoT）及云计算等先进技术，实现了对复杂环境的自主监控、智能决策与高效管理，极大地提升了运营效率，降低了人力成本，并开启了数据驱动决策的新纪元。本
Lecture 5：Training versus Testing 薛家掌柜的
回顾一下前四个Lecture，Lecture1讲的是找一个使得（也就是），Lecture2讲的是使得，Lecture3讲的是机器学习的分类，Lecture4讲的是让。那么，我们就有两个核心问题需要解决了。我们如何保证尽可能地靠近？我们如何使得足够小？而在这两个问题里面，假设集大小又扮演着什么样的角色？应该多大呢？如果是一个很小的，能够满足，但是可选的假设又太少了。如果是一个很大的，可选的假设很多，
多线程编程之理财周凡杨 java 多线程生产者消费者理财
现实生活中，我们一边工作，一边消费，正常情况下会把多余的钱存起来，比如存到余额宝，还可以多挣点钱，现在就有这个情况：我每月可以发工资20000万元（暂定每月的1号），每月消费5000（租房+生活费）元（暂定每月的1号），其中租金是大头占90%，交房租的方式可以选择（一月一交，两月一交、三月一交），理财：1万元存余额宝一天可以赚1元钱，
[Zookeeper学习笔记之三]Zookeeper会话超时机制 bit1129 zookeeper
首先，会话超时是由Zookeeper服务端通知客户端会话已经超时，客户端不能自行决定会话已经超时，不过客户端可以通过调用Zookeeper.close()主动的发起会话结束请求，如下的代码输出内容 Created /zoo-739160015 CONNECTEDCONNECTED .............CONNECTEDCONNECTED CONNECTEDCLOSEDCLOSED
SecureCRT快捷键 daizj secureCRT 快捷键
ctrl + a : 移动光标到行首ctrl + e ：移动光标到行尾crtl + b: 光标前移1个字符crtl + f: 光标后移1个字符crtl + h : 删除光标之前的一个字符ctrl + d ：删除光标之后的一个字符crtl + k ：删除光标到行尾所有字符crtl + u : 删除光标至行首所有字符crtl + w: 删除光标至行首
Java 子类与父类这间的转换周凡杨 java 父类与子类的转换
最近同事调的一个服务报错，查看后是日期之间转换出的问题。代码里是把 java.sql.Date 类型的对象强制转换为 java.sql.Timestamp 类型的对象。报java.lang.ClassCastException。代码：
可视化swing界面编辑朱辉辉33 eclipse swing
今天发现了一个WindowBuilder插件，功能好强大，啊哈哈，从此告别手动编辑swing界面代码，直接像VB那样编辑界面，代码会自动生成。首先在Eclipse中点击help，选择Install New Software,然后在Work with中输入WindowBui
web报表工具FineReport常用函数的用法总结（文本函数）老A不折腾 finereport web报表工具报表软件 java报表
文本函数 CHAR CHAR(number):根据指定数字返回对应的字符。CHAR函数可将计算机其他类型的数字代码转换为字符。 Number:用于指定字符的数字，介于1Number:用于指定字符的数字，介于165535之间（包括1和65535）。示例: CHAR(88)等于“X”。 CHAR(45)等于“-”。 CODE CODE(text):计算文本串中第一个字
mysql安装出错林鹤霄 mysql安装
[root@localhost ~]# rpm -ivh MySQL-server-5.5.24-1.linux2.6.x86_64.rpm Preparing... #####################
linux下编译libuv aigo libuv
下载最新版本的libuv源码，解压后执行： ./autogen.sh 这时会提醒找不到automake命令，通过一下命令执行安装（redhat系用yum，Debian系用apt-get）： # yum -y install automake # yum -y install libtool 如果提示错误：make: *** No targe
中国行政区数据及三级联动菜单 alxw4616
近期做项目需要三级联动菜单,上网查了半天竟然没有发现一个能直接用的! 呵呵,都要自己填数据....我了个去这东西麻烦就麻烦的数据上. 哎,自己没办法动手写吧. 现将这些数据共享出了,以方便大家.嗯,代码也可以直接使用文件说明 lib\area.sql -- 县及县以上行政区划分代码（截止2013年8月31日)来源：国家统计局发布时间：2014-01-17 15:0
哈夫曼加密文件百合不是茶哈夫曼压缩哈夫曼加密二叉树
在上一篇介绍过哈夫曼编码的基础知识,下面就直接介绍使用哈夫曼编码怎么来做文件加密或者压缩与解压的软件,对于新手来是有点难度的,主要还是要理清楚步骤; 加密步骤: 1,统计文件中字节出现的次数,作为权值 2,创建节点和哈夫曼树 3,得到每个子节点01串 4,使用哈夫曼编码表示每个字节
JDK1.5 Cyclicbarrier实例 bijian1013 java thread java多线程 Cyclicbarrier
CyclicBarrier类一个同步辅助类，它允许一组线程互相等待，直到到达某个公共屏障点 (common barrier point)。在涉及一组固定大小的线程的程序中，这些线程必须不时地互相等待，此时 CyclicBarrier 很有用。因为该 barrier 在释放等待线程后可以重用，所以称它为循环的 barrier。 CyclicBarrier支持一个可选的 Runnable 命令，
九项重要的职业规划 bijian1013 工作学习
一. 学习的步伐不停止古人说，活到老，学到老。终身学习应该是您的座右铭。世界在不断变化，每个人都在寻找各自的事业途径。您只有保证了足够的技能储
【Java范型四】范型方法 bit1129 java
范型参数不仅仅可以用于类型的声明上，例如 package com.tom.lang.generics; import java.util.List; public class Generics<T> { private T value; public Generics(T value) { this.value =
【Hadoop十三】HDFS Java API基本操作 bit1129 hadoop
package com.examples.hadoop; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataInputStream; import org.apache.hadoop.fs.FileStatus; import org.apache.hadoo
ua实现split字符串分隔 ronin47 lua split
LUA并不象其它许多"大而全"的语言那样，包括很多功能，比如网络通讯、图形界面等。但是LUA可以很容易地被扩展：由宿主语言(通常是C或 C++)提供这些功能，LUA可以使用它们，就像是本来就内置的功能一样。LUA只包括一个精简的核心和最基本的库。这使得LUA体积小、启动速度快，从而适合嵌入在别的程序里。因此在lua中并没有其他语言那样多的系统函数。习惯了其他语言的字符串分割函
java-从先序遍历和中序遍历重建二叉树 bylijinnan java
public class BuildTreePreOrderInOrder { /** * Build Binary Tree from PreOrder and InOrder * _______7______ / \ __10__ ___2 / \ / 4
openfire开发指南《连接和登陆》开窍的石头 openfire 开发指南 smack
第一步官网下载smack.jar包下载地址：http://www.igniterealtime.org/downloads/index.jsp#smack 第二步把smack里边的jar导入你新建的java项目中开始编写smack连接openfire代码 p
[移动通讯]手机后盖应该按需要能够随时开启 comsci 移动
看到新的手机，很多由金属材质做的外壳，内存和闪存容量越来越大，CPU速度越来越快，对于这些改进，我们非常高兴，也非常欢迎但是，对于手机的新设计，有几点我们也要注意第一：手机的后盖应该能够被用户自行取下来，手机的电池的可更换性应该是必须保留的设计,
20款国外知名的php开源cms系统 cuiyadll cms
内容管理系统，简称CMS，是一种简易的发布和管理新闻的程序。用户可以在后端管理系统中发布，编辑和删除文章，即使您不需要懂得HTML和其他脚本语言，这就是CMS的优点。在这里我决定介绍20款目前国外市面上最流行的开源的PHP内容管理系统，以便没有PHP知识的读者也可以通过国外内容管理系统建立自己的网站。 1. Wordpress WordPress的是一个功能强大且易于使用的内容管
Java生成全局唯一标识符 darrenzhu java uuid unique identifier id
How to generate a globally unique identifier in Java http://stackoverflow.com/questions/21536572/generate-unique-id-in-java-to-label-groups-of-related-entries-in-a-log http://stackoverflow
php安装模块检测是否已安装过, 使用的SQL语句 dcj3sjt126com sql
SHOW [FULL] TABLES [FROM db_name] [LIKE 'pattern'] SHOW TABLES列举了给定数据库中的非TEMPORARY表。您也可以使用mysqlshow db_name命令得到此清单。本命令也列举数据库中的其它视图。支持FULL修改符，这样SHOW FULL TABLES就可以显示第二个输出列。对于一个表，第二列的值为BASE T
5天学会一种 web 开发框架 dcj3sjt126com Web 框架 framework
web framework层出不穷，特别是ruby/python,各有10+个,php/java也是一大堆根据我自己的经验写了一个to do list,按照这个清单，一条一条的学习，事半功倍，很快就能掌握一共25条，即便很磨蹭，2小时也能搞定一条，25*2=50。只需要50小时就能掌握任意一种web框架各类web框架大同小异:现代web开发框架的6大元素，把握主线，就不会迷路建议把本文
Gson使用三(Map集合的处理,一对多处理) eksliang json gson Gson map Gson 集合处理
转载请出自出处：http://eksliang.iteye.com/blog/2175532 一、概述 Map保存的是键值对的形式，Json的格式也是键值对的，所以正常情况下，map跟json之间的转换应当是理所当然的事情。二、Map参考实例 package com.ickes.json; import java.lang.refl
cordova实现“再点击一次退出”效果 gundumw100 android
基本的写法如下： document.addEventListener("deviceready", onDeviceReady, false); function onDeviceReady() { //navigator.splashscreen.hide(); document.addEventListener("b
openldap configuration leaning note iwindyforest configuration
hostname // to display the computer name hostname <changed name> // to change go to: /etc/sysconfig/network, add/modify HOSTNAME=NEWNAME to change permenately dont forget to change /etc/hosts
Nullability and Objective-C 啸笑天 Objective-C
https://developer.apple.com/swift/blog/?id=25 http://www.cocoachina.com/ios/20150601/11989.html http://blog.csdn.net/zhangao0086/article/details/44409913 http://blog.sunnyxx
jsp中实现参数隐藏的两种方法 macroli JavaScript jsp
在一个JSP页面有一个链接，//确定是一个链接?点击弹出一个页面，需要传给这个页面一些参数。//正常的方法是设置弹出页面的src="***.do?p1=aaa&p2=bbb&p3=ccc"//确定目标URL是Action来处理?但是这样会在页面上看到传过来的参数，可能会不安全。要求实现src="***.do"，参数通过其他方法传！//////
Bootstrap A标签关闭modal并打开新的链接解决方案 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
Bootstrap里面的js modal控件使用起来很方便，关闭也很简单。只需添加标签 data-dismiss="modal" 即可。可是偏偏有时候需要a标签既要关闭modal，有要打开新的链接，尝试多种方法未果。只好使用原始js来控制。 <a href="#/group-buy" class="btn bt
二维数组在Java和C中的区别流淚的芥末 java c 二维数组数组
Java代码： public class test03 { public static void main(String[] args) { int[][] a = {{1},{2,3},{4,5,6}}; System.out.println(a[0][1]); } } 运行结果： Exception in thread "mai
systemctl命令用法 wmlJava linux systemctl
对比表，以 apache / httpd 为例任务旧指令新指令使某服务自动启动 chkconfig --level 3 httpd on systemctl enable httpd.service 使某服务不自动启动 chkconfig --level 3 httpd off systemctl disable httpd.service 检查服务状态 service h