weiweiweimengting

混合密集网络（Mixture Density Networks）

前言

考古了1994年的一篇文章，写的很朴实，不像现在很多的AI文章有一种过度包装的感觉，论文题目《Mixture Density Networks》。

理论

混合密集网络是一种将高斯混合模型和神经网络结合的网络，与一般的神经网络不同，它在网络的输出部分不再使用线性层或softmax作为预测值，为了引入模型的不确定性，认为每个输出是一种高斯混合分布，而不是一个确定值或者单纯的高斯分布，至于为什么不是通过高斯分布引入不确定性，这也是混合密集网络的一大亮点：高斯混合分布可以解决高斯分布不好解决的多值映射问题。
设输入为 $\bm{x}$ ，输出为 $\bm{t}$ ，这里以回归问题为例，输出和输出均是可能有多个维度的矢量。目标值的概率密度可以表示成多个核函数的线性组合：
$p(\bm{t}|\bm{x})=\sum_{i=1}^m\alpha_i(\bm{x})\phi_i(\bm{t}|\bm{x})$
其中 $\alpha_i(\bm{x})$ 称为混合系数，可以认为是 $\bm{x}$ 的一种先验概率， $\phi_i$ 表示目标向量 $\bm{t}$ 的第 $i$ 个核。这里的核函数可以有多种选择，文章选了最经常使用的形式：高斯分布，因为足够数量的混合高斯分布在原理上可以近似任何一个分布。 $m$ 是高斯混合分布选取了多少个核，核函数 $\phi$ 表示成：
$\phi_i(\bm{t}|\bm{x})=\frac{1}{(2\pi)^{c/2}\sigma_i(\bm{x})^c}\exp\{-\frac{||\bm{t}-\bm{\mu}_i(\bm{x})||^2}{2\sigma_i(\bm{x})^2}\}$
其中 $c$ 为 $\bm{t}$ 的维度。注意这里的每一个核函数都是一个多元的高斯分布， $\sigma_i(\bm{x})$ 是一个标量，但是 $\bm{\mu}_i(\bm{x})$ 是一个与目标值 $\bm{t}$ 同维度的矢量，反应回归的预测值。除此之外，与认为 $\bm{t}$ 的不同元之间是相互独立的高斯分布不同，高斯混合分布不需要这个假设。

如何搭建网络

网络的搭建也非常简单，前面是神经网络，在输出的时候建立混合高斯模型，重点在怎么连接上，我们先来看高斯混合模型需要多少个参数值：
根据 $p(\bm{t}|\bm{x})$ 的公式， $\alpha_i(\bm{x}),\sigma_i(\bm{x}),\bm{\mu}_i(\bm{x})$ 都属于要优化的参数，所以从神经网络传出来的参数量应该等于高斯混合模型要优化的参数量，一个 $p(\bm{t}|\bm{x})$ 有 $m$ 个 $\alpha_i(\bm{x})$ ， $m$ 个 $\sigma_i(\bm{x})$ ， $\bm{\mu}_i(\bm{x})$ 中有 $c m$ 个标量，所以对应的神经网络的输出应该是 $(c + 2) m$ 个输出变量。
在高斯混合分布中，所有的混合系数之和为1：
$\sum_{i=1}^m\alpha_i(\bm{x})=1$
在神经网络里面可以通过softmax函数实现：
$\alpha_i=\frac{\exp(z_i^{\alpha})}{\sum_{j=1}^M\exp(z_j^{\alpha})}$
其中 $z^{\alpha}$ 对应神经网络的一个输出变量，相应地，每个高斯单元的方差和均值也可以表示为：
$\sigma_i=\exp(z_i^{\sigma}) \\ \mu_{ik}=z_{ik}^{\mu}$
网络的损失函数是寻找以给定的 $\bm{x}$ 为条件下什么样的参数可以使 $p(\bm{t}|\bm{x})$ 的概率最大，即 $\argmax \quad p(\bm{t}|\bm{x})$ ，通常我们写成误差函数的形式：
$\mathcal{L}=\sum_q\mathcal{L}^q \\ \mathcal{L}^q=-\ln\{\sum_{i=1}^m\alpha_i(\bm{x}^q)\phi_i(\bm{t}^q|\bm{x}^q\}$
其中 $\mathcal{L}^q$ 表示每个样本的损失。根据高斯混合分布中哪一个成分占的多，该成分对应的中心值 $\bm{\mu}_i$ 即为该样本的预测值，更详细一点，在所有的成分中：
$\mathop{\max}\limits_i\{\frac{\alpha_i(\bm{x})}{\sigma_i(\bm{x})^c}\}$
其中这个 $i$ 对应的 $\bm{\mu}_i$ 就是预测值。但是这个预测值是一个近似的值，在严格意义上，预测值应该是计算得到的分布 $p(\bm{t}|\bm{x})$ 关于 $\bm{t}$ 的条件平均（也就是分布函数关于 $\bm{t}$ 的期望）：
$E(t)=\sum_i \alpha_i(\bm{x})\int \bm{t}\phi_i(\bm{t}|\bm{x})d\bm{t} \\ =\sum_i \alpha_i(\bm{x})\bm{\mu}_i(\bm{x})$
模型的不确定性仍然通过方差来计算：
$s^2(\bm{x})=E[\bm{t}-E(\bm{t})]^2 \\ =\sum_i \alpha_i(\bm{x})\{\sigma_i(\bm{x})^2+||\bm{\mu}_i(\bm{x})-\sum_j \alpha_j(\bm{x})\bm{\mu}_j(\bm{x})||^2\}$

假设预测值服从高斯混合分布有什么好处

传统的神经网络模型对于单值映射具有良好的拟合能力，但是对于一个输入可能存在多个输出的情况，拟合效果就会很差，比如一个从 $t$ 到 $x$ 的映射函数；
$\sin(2\pi t)+\epsilon$
对于一个输入 $t$ ，只有一个 $x$ 与之对应，此时拟合效果如下：

忽略图中的坐标含义，横坐标表示输入，纵坐标表示输出。
但是，如果现在对调 $t$ 和 $x$ 的位置，当有一个输入的时候，可能存在多个输出，这样一来，网络的拟合能力就会大幅降低：

其中曲线为神经网络的拟合曲线，散点为样本实际分布。
这个问题出现的原因是我们采用真实值-预测值的均平方作为损失函数，网络自己在学习的时候只保证这一个目标，但是很明显全局的均方误差最小并不能保证每个样本都有合适的拟合值，其实这个问题在图像生成选取损失函数的时候也会出现，当我们选取整幅图像所有像素点的均方误差作为损失函数优化网络的时候，虽然损失在减小，但是生成的图像可能是模糊的，这是全局最优不能代表局部最优的一个典型案例。
而假设输出为高斯混合分布就可以很好地解决这个问题，当我们假设输出服从单一的高斯分布时，其实是在默认输出只有一个可能值，这个值就是高斯分布的峰值对应的横坐标，但是高斯混合分布含有多个成分 $\alpha_i$ ，不同成分的动态大小就是就输出可能值的一种反应，作者用一幅图很好的说明了不同成分对预测值的影响：

可以看到，在样本 $\bm{x}$ 的预测值只有一个的情况下（如 $\bm{x}=0.2,\bm{x}=0.8$ ）， $p(\bm{t}|\bm{x})$ 中只有一个成分占有很高的比重，并且相应的该成分对应的 $\alpha_i$ 的值接近于1，而对应有多个可能值的情况下（如 $\bm{x}=0.5$ ）， $p(\bm{t}|\bm{x})$ 中的三个成分占有的比重不相上下，每个成分对应的峰值也都差不多。这也引出了一个问题，如何选择总的成分的个数呢？也就是说： $p(\bm{t}|\bm{x})$ 对应的 $m$ 应该是多少？
文章给出的建议是 $m$ 的个数应该大于等于最大的样本可能的预测值的个数，上面的图也是对这种选择的一种解释：潜在预测值的个数可以通过 $p(\bm{t}|\bm{x})$ 里面不同 $\alpha_i$ 所占的比重体现。

程序实现

模型部分

"""A module for a mixture density network layer

For more info on MDNs, see _Mixture Desity Networks_ by Bishop, 1994.
"""
import torch
import torch.nn as nn
import torch.optim as optim
from torch.autograd import Variable
from torch.distributions import Categorical
import math


ONEOVERSQRT2PI = 1.0 / math.sqrt(2 * math.pi)

# 标注一下输出维度out_features = 1，对应论文从神经网络出来的维度是（c + 2） * m = (1 + 2) * 5,但是mdn里面用了三个linear层来分别表示pi，sigma和mu
class MDN(nn.Module):
    """A mixture density network layer

    The input maps to the parameters of a MoG probability distribution, where
    each Gaussian has O dimensions and diagonal covariance.

    Arguments:
        in_features (int): the number of dimensions in the input
        out_features (int): the number of dimensions in the output
        num_gaussians (int): the number of Gaussians per output dimensions

    Input:
        minibatch (BxD): B is the batch size and D is the number of input
            dimensions.

    Output:
        (pi, sigma, mu) (BxG, BxGxO, BxGxO): B is the batch size, G is the
            number of Gaussians, and O is the number of dimensions for each
            Gaussian. Pi is a multinomial distribution of the Gaussians. Sigma
            is the standard deviation of each Gaussian. Mu is the mean of each
            Gaussian.
    """

    def __init__(self, in_features, out_features, num_gaussians):
        super(MDN, self).__init__()
        self.in_features = in_features
        self.out_features = out_features
        self.num_gaussians = num_gaussians
        self.pi = nn.Sequential(
            nn.Linear(in_features, num_gaussians),
            nn.Softmax(dim=1)
        )
        self.sigma = nn.Linear(in_features, out_features * num_gaussians)
        self.mu = nn.Linear(in_features, out_features * num_gaussians)

    def forward(self, minibatch):
        pi = self.pi(minibatch)  # [btz, num_gaussians]
        sigma = torch.exp(self.sigma(minibatch))  # [btz, num_gaussians]
        # 因为sigma和mu都与输出的维度有关，所以在这里还要展开，给输出一个维度
        sigma = sigma.view(-1, self.num_gaussians, self.out_features)
        mu = self.mu(minibatch)
        mu = mu.view(-1, self.num_gaussians, self.out_features)
        return pi, sigma, mu


def gaussian_probability(sigma, mu, target):
    """Returns the probability of `target` given MoG parameters `sigma` and `mu`.
    example: sigma: torch.Size([150, 5, 1]) mu: torch.Size([150, 5, 1]) target: [150, 1]
    Arguments:
        sigma (BxGxO): The standard deviation of the Gaussians. B is the batch
            size, G is the number of Gaussians, and O is the number of
            dimensions per Gaussian.
        mu (BxGxO): The means of the Gaussians. B is the batch size, G is the
            number of Gaussians, and O is the number of dimensions per Gaussian.
        target (BxI): A batch of target. B is the batch size and I is the number of
            input dimensions.

    Returns:
        probabilities (BxG): The probability of each point in the probability
            of the distribution in the corresponding sigma/mu index.
        返回高斯混合分布的component：phi,如果输出是多维的有 exp(a) * exp(b) = exp(a+b)
    """
    target = target.unsqueeze(1).expand_as(sigma)
    ret = ONEOVERSQRT2PI * torch.exp(-0.5 * ((target - mu) / sigma)**2) / sigma
    return torch.prod(ret, 2)


def mdn_loss(pi, sigma, mu, target):
    """Calculates the error, given the MoG parameters and the target
        pi: torch.Size([150, 5]) sigma: torch.Size([150, 5, 1]) mu: torch.Size([150, 5, 1])
    The loss is the negative log likelihood of the data given the MoG
    parameters.
    """
    prob = pi * gaussian_probability(sigma, mu, target)
    nll = -torch.log(torch.sum(prob, dim=1))
    return torch.mean(nll)


def sample(pi, sigma, mu):
    """Draw samples from a MoG.
    """
    # Choose which gaussian we'll sample from,返回采样点的索引
    # 返回的是 均值 + 方差*随机噪声 的形式
    pis = Categorical(pi).sample().view(pi.size(0), 1, 1)
    # Choose a random sample, one randn for batch X output dims
    # Do a (output dims)X(batch size) tensor here, so the broadcast works in
    # the next step, but we have to transpose back.
    gaussian_noise = torch.randn(                                        # [2, 150]
        (sigma.size(2), sigma.size(0)), requires_grad=False)
    # torch.gather(dim=1) 表示按照列号进行索引，寻找采样的pi对应的sigma
    variance_samples = sigma.gather(1, pis).detach().squeeze()   # [150]
    mean_samples = mu.detach().gather(1, pis).squeeze()
    return (gaussian_noise * variance_samples + mean_samples).transpose(0, 1)

测试部分

"""A script that shows how to use the MDN. It's a simple MDN with a single
nonlinearity that's trained to output 1D samples given a 2D input.
"""
import matplotlib.pyplot as plt
import sys
sys.path.append('../mdn')
from MDN.mdn import mdn
import torch
import torch.nn as nn
import torch.optim as optim

# 输入为2维的向量，输出为一个标量，高斯分布的成分有5个
input_dims = 2
output_dims = 1
num_gaussians = 5


def translate_cluster(cluster, dim, amount):
    """Translates a cluster in a particular dimension by some amount
    torch.add_:
                一般来说函数加了下划线的属于内建函数，将要改变原来的值，没有加下划线的并不会改变原来的数据，引用时需要另外赋值给其他变量
    """
    translation = torch.ones(cluster.size(0)) * amount
    cluster.transpose(0, 1)[dim].add_(translation)
    return cluster


print("Generating training data... ", end='')
cluster1 = torch.randn((50, input_dims + output_dims)) / 4
cluster1 = translate_cluster(cluster1, 1, 1.2)
cluster2 = torch.randn((50, input_dims + output_dims)) / 4
cluster2 = translate_cluster(cluster2, 0, -1.2)
cluster3 = torch.randn((50, input_dims + output_dims)) / 4
cluster3 = translate_cluster(cluster3, 2, -1.2)
training_set = torch.cat([cluster1, cluster2, cluster3]) # torch.Size([150, 3])
print('Done')


print("Initializing model... ", end='')
model = nn.Sequential(
    nn.Linear(input_dims, 5),
    nn.Tanh(),
    mdn.MDN(5, output_dims, num_gaussians)
)
optimizer = optim.Adam(model.parameters())
print('Done')

print('Training model... ', end='')
sys.stdout.flush()
# training_set的前两列作为训练数据，后一列作为预测值，对应in_features和out_features
for epoch in range(1000):
    model.zero_grad()
    pi, sigma, mu = model(training_set[:, 0:input_dims])
    loss = mdn.mdn_loss(pi, sigma, mu, training_set[:, input_dims:])
    loss.backward()
    optimizer.step()
    if epoch % 100 == 99:
        print(f' {round(epoch/10)}%', end='')
        sys.stdout.flush()
print('Done')

# 这一步骤用来计算预测值，实际上均值已经可以表示预测值，作者在这里加上了方差*随机噪声用来表示模型的不确定性
print('Generating samples... ', end='')
pi, sigma, mu = model(training_set[:, 0:input_dims])
samples = mdn.sample(pi, sigma, mu)
print('Done')

print('Saving samples.png... ', end='')
fig = plt.figure()
ax = fig.add_subplot(projection='3d')

xs = training_set[:, 0]
ys = training_set[:, 1]
zs = training_set[:, 2]

ax.scatter(xs, ys, zs, label='target')
ax.scatter(xs, ys, samples, label='samples')
ax.legend()
fig.savefig('samples.png')
print('Done')

PyTorch安装与环境配置终极指南：从零搭建高效深度学习开发环境（一） WHCIS python pytorch 人工智能深度学习机器学习
一、环境搭建的核心意义与准备工作1.1深度学习环境的核心挑战深度学习开发环境涉及复杂的软件栈依赖关系：硬件兼容性：GPU型号（NVIDIA系列）与CUDA版本的匹配软件依赖链：Python版本→PyTorch版本→CUDA驱动→cuDNN加速库环境隔离需求：不同项目可能依赖冲突的库版本1.2硬件准备清单硬件类型最低要求推荐配置CPU4核8核以上内存8GB32GB+GPU支持CUDANVIDIART
AI概率学预测足球大小球让球数据分析 sanx18 人工智能数据分析数据挖掘
在足球数据分析中，AI概率学预测主要涉及大小球和让球盘口的分析。以下是关键点：1.大小球分析大小球指机构设定的进球数预期，投注者预测实际进球数是否超过或低于该值。AI应用：历史数据：AI通过分析球队的历史进球、失球等数据，预测未来比赛进球数。机器学习：使用回归模型、神经网络等预测进球数，考虑球队实力、比赛风格、天气等因素。实时数据：结合实时比赛数据动态调整预测。2.让球分析让球是机构为平衡双方实力
【梯度下降算法】蝉叫醒了夏天机器学习算法
梯度下降算法：第一章梯度下降的历史沿革1.1优化方法的演进脉络从17世纪牛顿时代的数值解法，到20世纪最优控制理论的发展，直至现代机器学习对优化算法的特殊需求，梯度下降算法在数学优化史上占据重要地位。1947年FrankRosenblatt在感知机研究中首次系统应用梯度下降思想1.2机器学习时代的复兴21世纪深度学习革命使梯度下降算法获得新生：2006年Hinton团队在深度信念网络中的突破应用2
sparkML入门，通俗解释机器学习的框架和算法 Tometor spark-ml 机器学习算法回归数据挖掘人工智能 scala
一、机器学习的整体框架（类比烹饪）假设你要做一道菜，机器学习的过程可以类比为：步骤-->烹饪类比-->机器学习对应1.确定目标|想做什么菜（红烧肉/沙拉）|明确任务(分类/回归/聚类)2.准备食材|买菜、洗菜、切菜|数据收集与预处理3.设计食谱|决定烹饪步骤和调料|选择算法和模型设计4.试做并尝味道|调整火候和调味|模型训练与调参5.最终成品|端上桌的菜|模型部署与应用二、机器学习的核心流程1.数
深度学习基础-onnxruntime推理模型 yuweififi 深度学习人工智能
以下是一个完整的示例，展示如何加载ONNX模型、获取模型信息并运行推理：importonnxruntimeimportnumpyasnp#模型路径bev_head_onnx_path="path/to/your/bev_head.onnx"#加载模型session=onnxruntime.InferenceSession(bev_head_onnx_path)#获取模型元信息model_meta=
神经网络机器学习中说的过拟合是什么意思 yuanpan 机器学习神经网络人工智能
在神经网络和机器学习中，过拟合（Overfitting）是指模型在训练数据上表现非常好，但在未见过的测试数据上表现较差的现象。换句话说，模型过度学习了训练数据中的细节和噪声，导致其泛化能力（Generalization）下降，无法很好地适应新数据。过拟合的表现训练误差很低，但测试误差很高：模型在训练集上的准确率非常高，但在测试集上的准确率却显著下降。模型过于复杂：模型学习了训练数据中的噪声或不相关
造价算量审图多元化融合软件开发实战：技术架构与核心代码解析夏末之花架构
——从BIM模型解析到AI智能审图的完整实现路径1.技术架构设计该软件需融合以下模块：BIM/CAD模型解析引擎（支持Revit/DWG文件一键导入）智能算量核心算法（基于规则引擎与机器学习）协同审图平台（多人实时标注与版本控制）AI辅助决策系统（材料价格预测、工程量误差检测）技术栈推荐：前端：Three.js（3D模型渲染）+React（协同界面）后端：Python（算量算法）+Java（业务逻
基于大模型的Text2SQL微调的实战教程(二) herosunly AIGC Text2SQL 微调实战教程
大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。本文主要介绍了基于大模型的Text2SQL微调的实战教程(二)，希望对学习大语言模型的
计算机视觉算法实战——茶园害虫识别（主页有源码）喵了个AI 计算机视觉实战项目计算机视觉算法人工智能
✨个人主页欢迎您的访问✨期待您的三连✨✨个人主页欢迎您的访问✨期待您的三连✨✨个人主页欢迎您的访问✨期待您的三连✨1.引言茶园害虫识别是农业领域中的一个重要研究方向，旨在通过计算机视觉技术自动识别茶园中的害虫种类，从而帮助农民及时采取防治措施，减少经济损失。随着深度学习技术的快速发展，茶园害虫识别的准确性和效率得到了显著提升，为智慧农业提供了强有力的技术支持。2.当前相关算法在茶园害虫识别领域，常
训练大模型LLM选择哪种开发语言最好大0马浓人工智能训练 python
训练大型语言模型（LLM）时，选择合适的编程语言主要取决于效率、生态支持、开发便利性以及特定需求（如性能优化或硬件适配）。以下是常见语言的分析和推荐：---1.Python（首选语言）优势：-生态系统丰富：主流深度学习框架（PyTorch、TensorFlow、JAX）均以Python为主要接口，提供完整的工具链（数据处理、模型训练、评估部署）。-开发效率高：语法简洁，适合快速实验和原型开发，社区
论文学习：基于机器学习的光声图像分析1 superace7911 基于机器学习的光声图像处理机器学习人工智能图像处理
3/25——3/31期间论文学习笔记，关于基于机器学习的光声图像分析的6篇1区论文血管结构模拟&分割：Quantificationofvascularnetworksinphotoacousticmesoscopy链接数据集链接摘要这篇论文提出了一种新的方法，利用中观光声成像（MesoscopicPhotoacousticImaging,PAI）技术和高级图像分析技术，来非侵入性地定量化和分析活体
详细解释交叉熵损失函数（面试题200合集）快撑死的鱼人工智能机器学习
非常抱歉，我在之前的回答中确实没有严格遵循您指定的公式格式要求。感谢您的提醒！以下是修正后的版本，我将确保：内联公式使用$...$表示，例如a+b=ca+b=ca+b=c，嵌入在文本中。块级公式使用$$...$$表示，例如：E=mc2E=mc^2E=mc2我将重新整理并严格按照要求格式化之前的回答，同时保持内容清晰简洁。交叉熵损失函数的详细解释交叉熵（Cross-Entropy）损失函数是机器学习
动手深度学习笔记（二十九）5.5. 读写文件落花逐流水 pytorch实践 pytorch pytorch
动手深度学习笔记（二十九）5.5.读写文件5.深度学习计算5.5.读写文件5.5.1.加载和保存张量5.5.2.加载和保存模型参数5.5.3.小结5.5.4.练习5.深度学习计算5.5.读写文件到目前为止，我们讨论了如何处理数据，以及如何构建、训练和测试深度学习模型。然而，有时我们希望保存训练的模型，以备将来在各种环境中使用（比如在部署中进行预测）。此外，当运行一个耗时较长的训练过程时，最佳的做法
【深度学习】从全连接层到卷积熙曦Sakura 深度学习深度学习人工智能
从全连接层到卷积我们之前讨论的多层感知机十分适合处理表格数据，其中行对应样本，列对应特征。对于表格数据，我们寻找的模式可能涉及特征之间的交互，但是我们不能预先假设任何与特征交互相关的先验结构。此时，多层感知机可能是最好的选择，然而对于高维感知数据，这种缺少结构的网络可能会变得不实用。例如，在之前猫狗分类的例子中：假设我们有一个足够充分的照片数据集，数据集中是拥有标注的照片，每张照片具有百万级像素，
【深度学习】微积分熙曦Sakura 深度学习深度学习人工智能
微积分在2500年前，古希腊人把一个多边形分成三角形，并把它们的面积相加，才找到计算多边形面积的方法。为了求出曲线形状（比如圆）的面积，古希腊人在这样的形状上刻内接多边形。如图2.4.1所示，内接多边形的等长边越多，就越接近圆。这个过程也被称为逼近法（methodofexhaustion）。事实上，逼近法就是积分（integralcalculus）的起源。2000多年后，微积分的另一支，微分（di
NLP常见任务专题介绍（3）-垂直领域的聊天机器人搭建详细教程 AI专题精讲大模型专题系列自然语言处理机器人人工智能
一、整体流程构建垂直领域的聊天机器人需要结合特定行业的需求，采用自然语言处理和机器学习等技术。以下是一个典型的构建流程及相关技术实现：需求分析：明确机器人需要解决的问题范围和功能，例如客户服务、信息查询等。数据收集与预处理：数据收集：从行业相关的网站、论坛、数据库等渠道获取大量专业领域的文本数据。数据清洗：去除广告、无意义回复等噪声数据，确保数据质量。数据标注：对文本进行意图识别和实体识别的标注，
iOS 18 系统功能解析目录蓝鲸忘了海 IOS 1-18系统功能解析 ios cocoa macos
iOS18系统功能解析目录iOS18系统功能解析引言第一部分：iOS18系统架构全解析1.1全新系统设计理念1.2核心架构与硬件协同1.3安全架构与隐私保护1.4跨平台生态协同第二部分：用户界面与交互体验的革新2.1全新视觉设计2.2自定义UI与多任务切换2.3通知中心与交互体验2.4动态交互动画与手势识别第三部分：人工智能与机器学习的深度整合3.1新一代智能助手3.2CoreML与机器学习框架进
Chebykan wx 文章阅读やっはろ深度学习
文献筛选[1]神经网络：全面基础[2]通过sigmoid函数的超层叠近似[3]多层前馈网络是通用近似器[5]注意力是你所需要的[6]深度残差学习用于图像识别[7]视觉化神经网络的损失景观[8]牙齿模具点云补全通过数据增强和混合RL-GAN[9]强化学习：一项调查[10]使用PySR和SymbolicRegression.jl的科学可解释机器学习[11]Z.Liu,Y.Wang,S.Vaidya,F
LeNet-5卷积神经网络详解 LChuck 深度学习人工智能神经网络深度学习数据结构计算机视觉 AIGC
LeNet-5卷积神经网络详解1.历史背景LeNet-5是由YannLeCun等人在1998年提出的一种卷积神经网络架构，是深度学习领域的一个重要里程碑。这个网络最初是为了解决手写数字识别问题而设计的，在当时取得了突破性的成果。它的成功不仅证明了卷积神经网络在计算机视觉任务中的有效性，更为后来深度学习的发展奠定了重要基础。图1：LeNet-5网络结构示意图2.网络结构LeNet-5的结构非常优雅且
基于yolov11的瓶盖缺陷检测系统python源码+pytorch模型+评估指标曲线+精美GUI界面 FL1623863129 深度学习 YOLO pytorch 人工智能
【算法介绍】基于YOLOv11的瓶盖缺陷检测系统在现代制造业中，瓶盖的质量直接影响到产品的封装效果和消费者的使用体验。因此，对瓶盖进行快速、准确的缺陷检测至关重要。基于YOLOv11（YouOnlyLookOnceversion11）的瓶盖缺陷检测系统应运而生，为瓶盖质量监控提供了一种高效、智能的解决方案。该系统采用YOLOv11作为核心检测算法，这一算法融合了先进的深度学习技术和创新的网络架构，
机器学习专栏博文汇总 python游乐园机器学习机器学习人工智能合集
本篇汇集了Python游乐园中机器学习专栏博文，会持续更新，需要的小伙伴可以收藏一下Python机器学习实战：基于不同机器学习算法的鸢尾花数据集分析机器学习常见问题：过拟合及其处理方式结构化数据和非结构化数据的区别是什么如何选择合适的机器学习算法来处理非结构化数据可用于文本分析的机器学习算法都有哪些Python机器学习实战：遗传算法机器学习基础：什么是启发式算法机器学习中常用的调节参数的方法（附P
论文阅读笔记：Graph Matching Networks for Learning the Similarity of Graph Structured Objects 游离态GLZ不可能是金融技术宅知识图谱机器学习深度学习人工智能
论文做的是用于图匹配的神经网络研究，作者做出了两点贡献:证明GNN可以经过训练，产生嵌入graph-leve的向量可以用于相似性计算。作者提出了一种新的基于注意力的跨图匹配机制GMN(cross-graphattention-basedmatchingmechanism)，来计算出一对图之间的相似度评分。（核心创新点）论文证明了该模型在不同领域的有效性，包括具有挑战性的基于控制流图(control
2024-05-21 问AI: 介绍一下大语言模型的推理过程。 BigSharkTech 必杀技用AI来理解AI 人工智能语言模型自然语言处理
文心一言大语言模型的推理过程是一个复杂而精细的序列，它结合了深度学习和自然语言处理的技术，旨在理解和生成人类可以理解的自然语言文本。以下是该过程的主要步骤：输入文本的解析：当用户输入一段文本时，大语言模型首先会通过一个称为分词器的工具（tokenizer）对输入文本进行解析。分词器会将文本分解为一系列的单词或子词（tokens），并将它们转换为数字形式的序列。这些数字通常是单词在模型词典（voca
基于pytorch的神经病网络搭建学习停走的风 pytorch学习学习 pytorch 人工智能
1.pycharm中code方法的使用1.1父类重写技巧操作：在需要重写的方法上右键，选择code-->Generate>OverrideMethods。作用：自动生成重写父类或接口的方法2.简单神经网络importtorchfromtorchimportnnclassyu(nn.Module):def__init__(self,*args,**kwargs)->None:super().__in
KMeans实战——聚类和轮廓系数评估啤酒数据集巷955 机器学习人工智能
原理：在数据分析和机器学习中，聚类是一种常用的无监督学习方法，用于将数据集中的样本划分为若干个簇，使得同一簇内的样本相似度较高，而不同簇之间的样本相似度较低。KMeans算法是其中最常用的聚类算法之一。本文将介绍如何使用KMeans算法对啤酒数据集进行聚类，并使用轮廓系数（SilhouetteScore）来评估聚类结果的质量。1.数据准备首先，我们需要导入必要的库并加载数据集。本文使用的数据集是一
如何增强机器学习基础，提升大模型面试通过概率 weixin_40941102 机器学习面试人工智能
我的好朋友没有通过面试所以我给我的好朋友准备了这一篇学习路线随着大模型（如Transformer、GPT-4、LLaMA等）在自然语言处理（NLP）、计算机视觉（CV）和多模态任务中的广泛应用，AI行业的招聘竞争愈发激烈。面试官不仅要求候选人熟练使用深度学习框架（如PyTorch、TensorFlow），还希望他们具备扎实的机器学习理论基础、算法实现能力和实际问题解决经验。本文将从机器学习基础入手
Bottleneck、CSP、DP结构详细介绍 CV工程师小朱深度学习笔记人工智能深度学习 CSP 深度可分离残差网络
文章目录前言一、BottleneckDarknetBottleneck二、CSPCSP思想pp-picodet中的CSPLayerDP卷积前言本篇文章详细介绍了三种神经网络中常见的结构，bottleneck、CSP、DP，并附上了代码加深理解。一、BottleneckBottleneck出现在ResNet50/101/152这种深层网络中，基本思想就是先用1x1减少通道数再进行卷积最后再通过1x1
【人工智能数学基础】——深入详解贝叶斯理论：掌握贝叶斯定理及其在分类和预测中的应用猿享天开人工智能数学基础专讲分类数据挖掘人工智能贝叶斯数学
深入详解贝叶斯理论：掌握贝叶斯定理及其在分类和预测中的应用贝叶斯理论（BayesianTheory）是概率论和统计学中的一个重要分支，它以托马斯·贝叶斯（ThomasBayes）命名，主要关注如何根据新的证据更新对某一事件的信念。贝叶斯定理作为贝叶斯理论的核心，在机器学习、数据分析、决策科学等多个领域中具有广泛的应用。本文将深入探讨贝叶斯定理的理论基础、数学表达及其在分类和预测中的应用，辅以实例和
文档处理的数字化和革新 - ComIDP
在当今快节奏的环境中，企业不断寻求创新解决方案以精简操作并自动化手动任务。ComIDP是由ComPDFKit提供的先进的智能文档处理（IDP）解决方案，它作为一个强大工具，旨在改变组织管理文档的方式。什么是智能文档处理？智能文档处理是一种结合了人工智能（AI）、机器学习（ML）和光学字符识别（OCR）的技术，用于自动提取各种文档格式中的有价值信息。与传统的数据捕获方法需要大量手动干预不同，IDP利
Python数据可视化自动化工具：让数据跃然纸上 Echo_Wish Python 算法 Python 笔记从零开始学Python人工智能信息可视化 python 自动化
友友们好！我是Echo_Wish，我的的新专栏《Python进阶》以及《Python！实战！》正式启动啦！这是专为那些渴望提升Python技能的朋友们量身打造的专栏，无论你是已经有一定基础的开发者，还是希望深入挖掘Python潜力的爱好者，这里都将是你不可错过的宝藏。在这个专栏中，你将会找到：●深入解析：每一篇文章都将深入剖析Python的高级概念和应用，包括但不限于数据分析、机器学习、Web开发
对股票分析时要注意哪些主要因素？会飞的奇葩猪股票分析云掌股吧
　　众所周知，对散户投资者来说，股票技术分析是应战股市的核心武器，想学好股票的技术分析一定要知道哪些是重点学习的，其实非常简单，我们只要记住三个要素：成交量、价格趋势、振荡指标。一、成交量　　大盘的成交量状态。成交量大说明市场的获利机会较多，成交量小说明市场的获利机会较少。当沪市的成交量超过150亿时是强市市场状态，运用技术找综合买点较准；
【Scala十八】视图界定与上下文界定 bit1129 scala
Context Bound，上下文界定，是Scala为隐式参数引入的一种语法糖，使得隐式转换的编码更加简洁。隐式参数首先引入一个泛型函数max，用于取a和b的最大值 def max[T](a: T, b: T) = { if (a > b) a else b } 因为T是未知类型，只有运行时才会代入真正的类型，因此调用a >
C语言的分支——Object-C程序设计阅读有感 darkblue086 apple c 框架 cocoa
自从1972年贝尔实验室Dennis Ritchie开发了C语言，C语言已经有了很多版本和实现，从Borland到microsoft还是GNU、Apple都提供了不同时代的多种选择，我们知道C语言是基于Thompson开发的B语言的，Object-C是以SmallTalk-80为基础的。和C++不同的是，Object C并不是C的超集，因为有很多特性与C是不同的。 Object-C程序设计这本书
去除浏览器对表单值的记忆周凡杨 html 记忆 autocomplete form 浏览
&n
java的树形通讯录 g21121 java
最近用到企业通讯录，虽然以前也开发过，但是用的是jsf，拼成的树形，及其笨重和难维护。后来就想到直接生成json格式字符串，页面上也好展现。 // 首先取出每个部门的联系人 for (int i = 0; i < depList.size(); i++) { List<Contacts> list = getContactList(depList.get(i
Nginx安装部署 510888780 nginx linux
Nginx ("engine x") 是一个高性能的 HTTP 和反向代理服务器，也是一个 IMAP/POP3/SMTP 代理服务器。 Nginx 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的，第一个公开版本0.1.0发布于2004年10月4日。其将源代码以类BSD许可证的形式发布，因它的稳定性、丰富的功能集、示例配置文件和低系统资源
java servelet异步处理请求墙头上一根草ｊａｖａ异步返回ｓｅｒｖｌｅｔ
servlet3.0以后支持异步处理请求，具体是使用AsyncContext ，包装httpservletRequest以及httpservletResponse具有异步的功能， final AsyncContext ac = request.startAsync(request, response); ac.s
我的spring学习笔记8-Spring中Bean的实例化 aijuans Spring 3
在Spring中要实例化一个Bean有几种方法： 1、最常用的（普通方法） <bean id="myBean" class="www.6e6.org.MyBean" /> 使用这样方法，按Spring就会使用Bean的默认构造方法，也就是把没有参数的构造方法来建立Bean实例。（有构造方法的下个文细说） 2、还
为Mysql创建最优的索引 annan211 mysql 索引
索引对于良好的性能非常关键，尤其是当数据规模越来越大的时候，索引的对性能的影响越发重要。索引经常会被误解甚至忽略，而且经常被糟糕的设计。索引优化应该是对查询性能优化最有效的手段了，索引能够轻易将查询性能提高几个数量级，最优的索引会比较好的索引性能要好2个数量级。 1 索引的类型 (1) B-Tree 不出意外，这里提到的索引都是指 B-
日期函数百合不是茶 oracle sql 日期函数查询
ORACLE日期时间函数大全 TO_DATE格式(以时间:2007-11-02 13:45:25为例) Year: yy two digits 两位年显示值:07 yyy three digits 三位年显示值:007
线程优先级 bijian1013 java thread 多线程 java多线程
多线程运行时需要定义线程运行的先后顺序。线程优先级是用数字表示，数字越大线程优先级越高，取值在1到10，默认优先级为5。实例： package com.bijian.study; /** * 因为在代码段当中把线程B的优先级设置高于线程A,所以运行结果先执行线程B的run()方法后再执行线程A的run()方法 * 但在实际中，JAVA的优先级不准，强烈不建议用此方法来控制执
适配器模式和代理模式的区别 bijian1013 java 设计模式
一.简介适配器模式：适配器模式（英语：adapter pattern）有时候也称包装样式或者包装。将一个类的接口转接成用户所期待的。一个适配使得因接口不兼容而不能在一起工作的类工作在一起，做法是将类别自己的接口包裹在一个已存在的类中。 &nbs
【持久化框架MyBatis3三】MyBatis3 SQL映射配置文件 bit1129 Mybatis3
SQL映射配置文件一方面类似于Hibernate的映射配置文件，通过定义实体与关系表的列之间的对应关系。另一方面使用<select>,<insert>,<delete>，<update>元素定义增删改查的SQL语句，这些元素包含三方面内容 1. 要执行的SQL语句 2. SQL语句的入参，比如查询条件 3. SQL语句的返回结果
oracle大数据表复制备份个人经验 bitcarter oracle 大表备份大表数据复制
前提：数据库仓库A（就拿oracle11g为例）中有两个用户user1和user2,现在有user1中有表ldm_table1,且表ldm_table1有数据5千万以上，ldm_table1中的数据是从其他库B（数据源）中抽取过来的，前期业务理解不够或者需求有变，数据有变动需要重新从B中抽取数据到A库表ldm_table1中。
HTTP加速器varnish安装小记 ronin47 http varnish 加速
上午共享的那个varnish安装手册，个人看了下，有点不知所云，好吧~看来还是先安装玩玩！苦逼公司服务器没法连外网，不能用什么wget或yum命令直接下载安装，每每看到别人博客贴出的在线安装代码时，总有一股羡慕嫉妒“恨”冒了出来。。。好吧，既然没法上外网，那只能麻烦点通过下载源码来编译安装了！ Varnish 3.0.4下载地址： http://repo.varnish-cache.org/
java-73-输入一个字符串，输出该字符串中对称的子字符串的最大长度 bylijinnan java
public class LongestSymmtricalLength { /* * Q75题目：输入一个字符串，输出该字符串中对称的子字符串的最大长度。 * 比如输入字符串“google”，由于该字符串里最长的对称子字符串是“goog”，因此输出4。 */ public static void main(String[] args) { Str
学习编程的一点感想 Cb123456 编程感想 Gis
写点感想，总结一些，也顺便激励一些自己.现在就是复习阶段，也做做项目. 本专业是GIS专业，当初觉得本专业太水，靠这个会活不下去的，所以就报了培训班。学习的时候，进入状态很慢，而且当初进去的时候，已经上到Java高级阶段了，所以.....，呵呵，之后有点感觉了，不过，还是不好好写代码，还眼高手低的，有
[能源与安全]美国与中国 comsci 能源
现在有一个局面：地球上的石油只剩下N桶，这些油只够让中国和美国这两个国家中的一个顺利过渡到宇宙时代，但是如果这两个国家为争夺这些石油而发生战争，其结果是两个国家都无法平稳过渡到宇宙时代。。。。而且在战争中，剩下的石油也会被快速消耗在战争中，结果是两败俱伤。。。在这个大
SEMI-JOIN执行计划突然变成HASH JOIN了的原因分析 cwqcwqmax9 oracle
甲说： A B两个表总数据量都很大，在百万以上。 idx1 idx2字段表示是索引字段 A B 两表上都有 col1字段表示普通字段 select xxx from A where A.idx1 between mmm and nnn and exists (select 1 from B where B.idx2 =
SpringMVC-ajax返回值乱码解决方案 dashuaifu Ajax springMVC response 中文乱码
SpringMVC-ajax返回值乱码解决方案一：（自己总结，测试过可行） ajax返回如果含有中文汉字，则使用：（如下例：） @RequestMapping(value="/xxx.do") public @ResponseBody void getPunishReasonB
Linux系统中查看日志的常用命令 dcj3sjt126com OS
因为在日常的工作中，出问题的时候查看日志是每个管理员的习惯，作为初学者，为了以后的需要，我今天将下面这些查看命令共享给各位 cat tail -f 日志文件说明 /var/log/message 系统启动后的信息和错误日志，是Red Hat Linux中最常用的日志之一 /var/log/secure 与安全相关的日志信息 /var/log/maillog 与邮件相关的日志信
[应用结构]应用 dcj3sjt126com PHP yii2
应用主体应用主体是管理 Yii 应用系统整体结构和生命周期的对象。每个Yii应用系统只能包含一个应用主体，应用主体在入口脚本中创建并能通过表达式 \Yii::$app 全局范围内访问。补充: 当我们说"一个应用"，它可能是一个应用主体对象，也可能是一个应用系统，是根据上下文来决定[译：中文为避免歧义，Application翻译为应
assertThat用法 eksliang JUnit assertThat
junit4.0 assertThat用法一般匹配符1、assertThat( testedNumber, allOf( greaterThan(8), lessThan(16) ) ); 注释： allOf匹配符表明如果接下来的所有条件必须都成立测试才通过，相当于“与”（&&） 2、assertThat( testedNumber, anyOf( g
android点滴2 gundumw100 应用服务器 android 网络应用 OS HTC
如何让Drawable绕着中心旋转？ Animation a = new RotateAnimation(0.0f, 360.0f, Animation.RELATIVE_TO_SELF, 0.5f, Animation.RELATIVE_TO_SELF,0.5f); a.setRepeatCount(-1); a.setDuration(1000); 如何控制Andro
超简洁的CSS下拉菜单 ini html Web 工作 html5 css
效果体验：http://hovertree.com/texiao/css/3.htmHTML文件： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>简洁的HTML+CSS下拉菜单-HoverTree</title>
kafka consumer防止数据丢失 kane_xie kafka offset commit
kafka最初是被LinkedIn设计用来处理log的分布式消息系统，因此它的着眼点不在数据的安全性（log偶尔丢几条无所谓），换句话说kafka并不能完全保证数据不丢失。尽管kafka官网声称能够保证at-least-once，但如果consumer进程数小于partition_num，这个结论不一定成立。考虑这样一个case，partiton_num=2
@Repository、@Service、@Controller 和 @Component mhtbbx DAO spring bean prototype
@Repository、@Service、@Controller 和 @Component 将类标识为Bean Spring 自 2.0 版本开始，陆续引入了一些注解用于简化 Spring 的开发。@Repository注解便属于最先引入的一批，它用于将数据访问层 (DAO 层 ) 的类标识为 Spring Bean。具体只需将该注解标注在 DAO类上即可。同时，为了让 Spring 能够扫描类
java 多线程高并发读写控制误区 qifeifei java thread
先看一下下面的错误代码，对写加了synchronized控制，保证了写的安全，但是问题在哪里呢？ public class testTh7 { private String data; public String read(){ System.out.println(Thread.currentThread().getName() + "read data "
mongodb replica set(副本集)设置步骤 tcrct java mongodb
网上已经有一大堆的设置步骤的了，根据我遇到的问题，整理一下，如下：首先先去下载一个mongodb最新版，目前最新版应该是2.6 cd /usr/local/bin wget http://fastdl.mongodb.org/linux/mongodb-linux-x86_64-2.6.0.tgz tar -zxvf mongodb-linux-x86_64-2.6.0.t
rust学习笔记 wudixiaotie 学习笔记
1.rust里绑定变量是let，默认绑定了的变量是不可更改的，所以如果想让变量可变就要加上mut。 let x = 1; let mut y = 2; 2.match 相当于erlang中的case，但是case的每一项后都是分号，但是rust的match却是逗号。 3.match 的每一项最后都要加逗号，但是最后一项不加也不会报错，所有结尾加逗号的用法都是类似。 4.每个语句结尾都要加分