努力学习的廖同学

动手学深度学习笔记day5

多层感知机

1、模型输出并不是和每一个特征都是线性相关的，在特征之间的右复杂的相关交互作用。

2、每一层都输出到上面的层，直到生成最后的输出。我们可以把前L−1层看作表示，把最后一层看作线性预测器。这种架构通常称为多层感知机（multilayer perceptron），通常缩写为MLP。

多层感知机中的层数为隐藏层和输出层。（不包含输入层）。

没有加激活函数的话，仿射函数的仿射函数本身就是仿射函数，我们没有好处！

3、在仿射变换之后对每个隐藏单元应用非线性的激活函数（activation function）σ。激活函数的输出（例如，σ(⋅)）被称为活性值（activations）。一般来说，有了激活函数，就不可能再将我们的多层感知机退化成线性模型。

激活函数

ReLU函数

给定元素x，ReLU函数被定义为该元素与0的最大值。ReLU函数通过将相应的活性值设为0，仅保留正元素并丢弃所有负元素。

当输入为负时，ReLU函数的导数为0，而当输入为正时，ReLU函数的导数为1。注意，当输入值精确等于0时，ReLU函数不可导。

使用ReLU的原因是，它求导表现得特别好：要么让参数消失，要么让参数通过。这使得优化表现得更好，并且ReLU减轻了困扰以往神经网络的梯度消失问题。

ReLU函数变体：参数化pReLU

ReLU函数有许多变体，包括参数化ReLU（Parameterized ReLU，）函数。该变体为ReLU添加了一个线性项，因此即使参数是负的，某些信息仍然可以通过：

sigmoid函数

对于一个定义域在R中的输入， sigmoid函数将输入变换为区间(0, 1)上的输出。因此，sigmoid通常称为挤压函数（squashing function）：它将范围（-inf, inf）中的任意输入压缩到区间（0, 1）中的某个值：

sigmoid函数的导数为下面的公式。当输入为0时，sigmoid函数的导数达到最大值0.25；而输入在任一方向上越远离0点时，导数越接近0。

tanh函数

tanh(双曲正切)函数也能将其输入压缩转换到区间(-1, 1)上。 tanh函数的公式如下。

tanh函数的导数为下面的公式。当输入接近0时，tanh函数的导数接近最大值1。与我们在sigmoid函数图像中看到的类似，输入在任一方向上越远离0点，导数越接近0。

多层感知机的从零开始实现

import torch
from torch import nn
from d2l import torch as d2l

#1、继续使用Fashion-MNIST图像分类数据集 
batch_size = 256
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)  #上一节已经定义的函数

#2、 初始化模型参数
#将每个图像视为具有784个输入特征 和10个类的简单分类数据集。 多层感知机包含256个隐藏单元。

num_inputs, num_outputs, num_hiddens = 784, 10, 256

W1 = nn.Parameter(torch.randn(
    num_inputs, num_hiddens, requires_grad=True) * 0.01)
b1 = nn.Parameter(torch.zeros(num_hiddens, requires_grad=True))
W2 = nn.Parameter(torch.randn(
    num_hiddens, num_outputs, requires_grad=True) * 0.01)
b2 = nn.Parameter(torch.zeros(num_outputs, requires_grad=True))

params = [W1, b1, W2, b2]

#3、ReLU激活函数
def relu(X):
    a = torch.zeros_like(X)  #定义一个和x形状一样的全零矩阵
    return torch.max(X, a)

#4、模型
#使用reshape将每个二维图像转换为一个长度为num_inputs的向量
def net(X):
    X = X.reshape((-1, num_inputs))
    H = relu(X@W1 + b1)  # 这里“@”代表矩阵乘法
    return (H@W2 + b2)

#5、损失函数
#直接使用高级API中的内置函数来计算softmax和交叉熵损失。
loss = nn.CrossEntropyLoss(reduction='none')

#6、训练
num_epochs, lr = 10, 0.1
updater = torch.optim.SGD(params, lr=lr)
d2l.train_ch3(net, train_iter, test_iter, loss, num_epochs, updater) #上一节已经定义的函数

#7、测试
d2l.predict_ch3(net, test_iter)

多层感知机的简洁实现

import torch
from torch import nn
from d2l import torch as d2l

#1、模型
net = nn.Sequential(nn.Flatten(),  #输入为一批数据，第一维为batch，通常要把一个数据拉成一维，而#不是将一批数据拉为一维。所以torch.nn.Flatten()默认从第二维开始平坦化。
                    nn.Linear(784, 256),
                    nn.ReLU(),
                    nn.Linear(256, 10))

def init_weights(m):
    if type(m) == nn.Linear:
        nn.init.normal_(m.weight, std=0.01)

net.apply(init_weights);  #在网络模型中运用初始化w，假如该层模型是nn.Linear，jiu进行初始化


batch_size, lr, num_epochs = 256, 0.1, 10
loss = nn.CrossEntropyLoss(reduction='none')
trainer = torch.optim.SGD(net.parameters(), lr=lr)

train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)
d2l.train_ch3(net, train_iter, test_iter, loss, num_epochs, trainer)

模型选择（过拟合与欠拟合）

评估几个候选模型后选择最终的模型。这个过程叫做模型选择

将模型在训练数据上拟合的比在潜在分布中更接近的现象称为过拟合（overfitting），用于对抗过拟合的技术称为正则化（regularization）。

训练误差和泛化误差

训练误差（training error）是指，模型在训练数据集上计算得到的误差。

泛化误差（generalization error）是指，模型应用在同样从原始样本的分布中抽取的无限多数据样本时，模型误差的期望。

我们永远不能准确地计算出泛化误差。这是因为无限多的数据样本是一个虚构的对象。在实际中，我们只能通过将模型应用于一个独立的测试集来估计泛化误差，该测试集由随机选取的、未曾在训练集中出现的数据样本构成。

影响模型泛化的因素：

1、可调整参数的数量。当可调整参数的数量（也称为自由度）很大时，模型往往更容易过拟合。2、参数采用的值。当权重的取值范围较大时，模型可能更容易过拟合。

3、训练样本的数量。即使你的模型很简单，也很容易过拟合只包含一两个样本的数据集。而过拟合一个有数百万个样本的数据集则需要一个极其灵活的模型。

验证集

除了训练和测试数据集之外，还增加一个验证数据集（validation dataset），也叫验证集（validation set）。

K折交叉验证

原始训练数据被分成K个不重叠的子集。然后执行K次模型训练和验证，每次在K−1个子集上进行训练，并在剩余的一个子集（在该轮中没有用于训练的子集）上进行验证。最后，通过对K次实验的结果取平均来估计训练和验证误差。

欠拟合和过拟合

如果模型不能降低训练误差，这可能意味着模型过于简单。这种现象被称为欠拟合（underfitting）。

当我们的训练误差明显低于验证误差时要小心，这表明严重的过拟合（overfitting）。

多项式回归模拟欠拟合与过拟合

import math
import numpy as np
import torch
from torch import nn
from d2l import torch as d2l


#1、生成数据集
max_degree = 20  # 多项式的最大阶数
n_train, n_test = 100, 100  # 训练和测试数据集大小
true_w = np.zeros(max_degree)  # 分配大量的空间
true_w[0:4] = np.array([5, 1.2, -3.4, 5.6])

features = np.random.normal(size=(n_train + n_test, 1))
np.random.shuffle(features)
poly_features = np.power(features, np.arange(max_degree).reshape(1, -1)) 
#[200,],[1,20]->[200,20]
for i in range(max_degree):
    poly_features[:, i] /= math.gamma(i + 1)  # gamma(n)=(n-1)!
# labels的维度:(n_train+n_test,)
labels = np.dot(poly_features, true_w)
labels += np.random.normal(scale=0.1, size=labels.shape)

# NumPy ndarray转换为tensor
true_w, features, poly_features, labels = [torch.tensor(x, dtype=
    torch.float32) for x in [true_w, features, poly_features, labels]]


#2、对模型进行训练和测试
def evaluate_loss(net, data_iter, loss):  #@save
    """评估给定数据集上模型的损失"""
    metric = d2l.Accumulator(2)  # 损失的总和,样本数量
    for X, y in data_iter:
        out = net(X)
        y = y.reshape(out.shape)
        l = loss(out, y)
        metric.add(l.sum(), l.numel())
    return metric[0] / metric[1]


def train(train_features, test_features, train_labels, test_labels,
          num_epochs=400):
    loss = nn.MSELoss(reduction='none')
    input_shape = train_features.shape[-1]
    # 不设置偏置，因为我们已经在多项式中实现了它
    net = nn.Sequential(nn.Linear(input_shape, 1, bias=False))
    batch_size = min(10, train_labels.shape[0])
    train_iter = d2l.load_array((train_features, train_labels.reshape(-1,1)),
                                batch_size)
    test_iter = d2l.load_array((test_features, test_labels.reshape(-1,1)),
                               batch_size, is_train=False)
    trainer = torch.optim.SGD(net.parameters(), lr=0.01)
    animator = d2l.Animator(xlabel='epoch', ylabel='loss', yscale='log',
                            xlim=[1, num_epochs], ylim=[1e-3, 1e2],
                            legend=['train', 'test'])
    for epoch in range(num_epochs):
        d2l.train_epoch_ch3(net, train_iter, loss, trainer)
        if epoch == 0 or (epoch + 1) % 20 == 0:
            animator.add(epoch + 1, (evaluate_loss(net, train_iter, loss),
                                     evaluate_loss(net, test_iter, loss)))
    print('weight:', net[0].weight.data.numpy())


#3、三阶多项式函数拟合(正常)
# 从多项式特征中选择前4个维度，即1,x,x^2/2!,x^3/3!
train(poly_features[:n_train, :4], poly_features[n_train:, :4],
      labels[:n_train], labels[n_train:])
#weight: [[ 5.019018   1.1946101 -3.4238737  5.6215625]]

#4、线性函数拟合(欠拟合)
# 从多项式特征中选择前2个维度，即1和x
train(poly_features[:n_train, :2], poly_features[n_train:, :2],
      labels[:n_train], labels[n_train:])
#weight: [[3.643353  3.9591959]]


#5、高阶多项式函数拟合(过拟合)
# 从多项式特征中选取所有维度
train(poly_features[:n_train, :], poly_features[n_train:, :],
      labels[:n_train], labels[n_train:], num_epochs=1500)

#weight: [[ 4.98981619e+00  1.28851151e+00 -3.28302407e+00  5.15355873e+00
  -3.46124321e-01  1.13549972e+00  5.10900607e-03  1.18201613e-01
  -1.63049936e-01 -1.38878882e-01  2.88553052e-02 -1.50383292e-02
  -1.69221520e-01 -1.03751056e-01  8.86610001e-02  5.50406016e-02
  -1.06619544e-01  3.09333988e-02  1.18263520e-01 -1.75979659e-01]]

缓解过拟合

权重衰减

权重衰减（weight decay）是最广泛使用的正则化的技术之一，它通常也被称为L2正则化。

要保证权重向量比较小，最常用方法是将其范数作为惩罚项加到最小化损失的问题中。将原来的训练目标最小化训练标签上的预测损失，调整为最小化预测损失和惩罚项之和。现在，如果我们的权重向量增长的太大，我们的学习算法可能会更集中于最小化权重范数‖w‖2。这正是我们想要的。loss如下

L2正则化回归的小批量随机梯度下降更新如下式：

我们根据估计值与观测值之间的差异来更新w。然而，我们同时也在试图将w的大小缩小到零。

def l2_penalty(w):
    return torch.sum(w.pow(2)) / 2

 l = loss(net(X), y) + lambd * l2_penalty(w)

暂退法（Dropout）

泛化性和灵活性之间的这种基本权衡被描述为偏差-方差权衡（bias-variance tradeoff）。线性模型有很高的偏差：它们只能表示一小类函数。然而，这些模型的方差很低：它们在不同的随机数据样本上可以得出相似的结果。

暂退法在前向传播过程中，计算每一内部层的同时注入噪声，因为我们从表面上看是在训练过程中丢弃（drop out）一些神经元。在整个训练过程的每一次迭代中，标准暂退法包括在计算下一层之前将当前层中的一些节点置零。

在每次训练迭代中，他将从均值为零的分布ϵ∼N(0,σ2) 采样噪声添加到输入x，从而产生扰动点x′=x+ϵ，预期是E[x′]=x。每个中间活性值h以暂退概率p由随机变量h′替换，如下所示：

根据此模型的设计，其期望值保持不变，即E[h′]=h。

从零开始实现

要实现单层的暂退法函数，我们从均匀分布U[0,1]中抽取样本，样本数与这层神经网络的维度一致。然后我们保留那些对应样本大于p的节点，把剩下的丢弃。

在下面的代码中，我们实现 dropout_layer 函数，该函数以dropout的概率丢弃张量输入X中的元素，如上所述重新缩放剩余部分：将剩余部分除以1.0-dropout。

import torch
from torch import nn
from d2l import torch as d2l


def dropout_layer(X, dropout):
    assert 0 <= dropout <= 1
    # 在本情况中，所有元素都被丢弃
    if dropout == 1:
        return torch.zeros_like(X)
    # 在本情况中，所有元素都被保留
    if dropout == 0:
        return X
    mask = (torch.rand(X.shape) > dropout).float()
    return mask * X / (1.0 - dropout)

#1.定义模型参数
num_inputs, num_outputs, num_hiddens1, num_hiddens2 = 784, 10, 256, 256

#2.定义模型
#可以为每一层分别设置暂退概率： 常见的技巧是在靠近输入层的地方设置较低的暂退概率。
dropout1, dropout2 = 0.2, 0.5

class Net(nn.Module):
    def __init__(self, num_inputs, num_outputs, num_hiddens1, num_hiddens2,
                 is_training = True):
        super(Net, self).__init__()
        self.num_inputs = num_inputs
        self.training = is_training
        self.lin1 = nn.Linear(num_inputs, num_hiddens1)
        self.lin2 = nn.Linear(num_hiddens1, num_hiddens2)
        self.lin3 = nn.Linear(num_hiddens2, num_outputs)
        self.relu = nn.ReLU()

    def forward(self, X):
        H1 = self.relu(self.lin1(X.reshape((-1, self.num_inputs))))
        # 只有在训练模型时才使用dropout
        if self.training == True:
            # 在第一个全连接层之后添加一个dropout层
            H1 = dropout_layer(H1, dropout1)
        H2 = self.relu(self.lin2(H1))
        if self.training == True:
            # 在第二个全连接层之后添加一个dropout层
            H2 = dropout_layer(H2, dropout2)
        out = self.lin3(H2)
        return out


net = Net(num_inputs, num_outputs, num_hiddens1, num_hiddens2)

#3、训练和测试
num_epochs, lr, batch_size = 10, 0.5, 256
loss = nn.CrossEntropyLoss(reduction='none')
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)
trainer = torch.optim.SGD(net.parameters(), lr=lr)
d2l.train_ch3(net, train_iter, test_iter, loss, num_epochs, trainer)

简洁实现

net = nn.Sequential(nn.Flatten(),
        nn.Linear(784, 256),
        nn.ReLU(),
        # 在第一个全连接层之后添加一个dropout层
        nn.Dropout(dropout1),
        nn.Linear(256, 256),
        nn.ReLU(),
        # 在第二个全连接层之后添加一个dropout层
        nn.Dropout(dropout2),
        nn.Linear(256, 10))

def init_weights(m):
    if type(m) == nn.Linear:
        nn.init.normal_(m.weight, std=0.01)

net.apply(init_weights);

trainer = torch.optim.SGD(net.parameters(), lr=lr)
d2l.train_ch3(net, train_iter, test_iter, loss, num_epochs, trainer)

动手学深度学习在线课程

关于自然语言处理（三）深度学习中的文字序列数据的分词操作 MatrixSparse 大模型人工智能自然语言处理深度学习人工智能
深度学习中的文字序列数据二维文字序列在文字数据中，样本与样本之间的联系是语义的联系，语义的联系即是词与词之间、字与字之间的联系，因此在文字序列中每个样本是一个单词或一个字（对英文来说大部分时候是一个单词，偶尔也可以是更小的语言单位，如字母或半词），故而在中文文字数据中，一张二维表往往是一个句子或一段话，而单个样本则表示单词或字。此时，不能够打乱顺序的维度是vocab_size，它代表了一个句子/一
【开源项目】2024最新PHP在线客服系统源码/带预知消息/带搭建教程于飞SEO 免费资源分享开源 php 开发语言
简介随着人工智能技术的飞速发展，AI驱动的在线客服系统已经成为企业提升客户服务质量和效率的重要工具。本文将探讨AI在线客服系统的理论基础，并展示如何使用PHP语言实现一个简单的AI客服系统。源码仓库地址：ym.fzapp.top在线客服系统的理论基础AI在线客服系统通过自然语言处理（NLP）、机器学习（ML）和深度学习（DL）技术，能够理解和响应客户的查询。这些系统通常包括以下几个关键组件：自然语
基于CNN-BIGRU-Attention模型的功率预测（模型详解及代码复现）清风AI 深度学习算法详解及代码复现深度学习人工智能算法机器学习计算机视觉 cnn 神经网络
整体架构基于CNN-BiGRU-Attention模型的功率预测模型是一种融合了卷积神经网络(CNN)、双向门控循环单元(BiGRU)和注意力机制(Attention)的深度学习架构。这种混合模型旨在充分利用CNN的局部特征提取能力、BiGRU的长序列处理能力以及Attention机制的关键特征突出能力，从而提高功率预测的准确性和可靠性。模型的整体架构主要包括以下几个关键组件：输入层：设计的输入特
文生图图生视频文生视频人工智能AI工具节选行思理 AI 人工智能文生图文生视频图生视频数字人
1、MidjourneyAI图像和插画生成工具，官网地址：Midjourney中文站,MJ中文站-专业AI绘图网站2、StableDiffusion一种基于扩散技术的深度学习文本转图像模型，演示地址：StabilityAI3、通义万相阿里云通义大模型旗下的AI创意作画与视频生成平台，官网地址：通义万相_AI创意作画_AI绘画_人工智能-阿里云4、PhotoStudioAI模特AI商品图及视频一键生
ChatGPT-4o引领医学革命：临床科研创新与效率的新纪元小艳加油教程语言类人工智能数据分析 ChatGPT-4o 临床医学
2024年5月12日，更强版本的ChatGPT-4o上线，文本、语音、图像等多模态交互方式使其在各行各业的应用呈现了更多的可能性。因此，帮助广大临床医学相关的医院管理人员、医生、学生、科研人员更加熟练地掌握ChatGPT-4o在临床医学日常生活、工作与学习、课题申报、论文选题、实验方案设计、实验数据统计分析与可视化等方面的强大功能，同时更加系统地学习人工智能（包括传统机器学习、深度学习等）的基础理
人工智能引领技术革命：ChatGPT与深度学习的突破性进展撒旦骑路西法，大战吕布国内外安全资讯人工智能
在全球科技快速发展的今天，人工智能（AI）正以前所未有的速度渗透到各个行业，成为推动社会变革的重要力量。特别是在自然语言处理（NLP）领域，OpenAI的ChatGPT凭借深度学习技术的持续突破，展现了AI在理解、推理、对话生成等方面的惊人进步。本文将深入探讨ChatGPT及深度学习的最新突破，以及它对不同行业的深远影响。1.ChatGPT：AI语言模型的革新者1.1什么是ChatGPT？Chat
深入探索Deeplearning4j（DL4J）：Java深度学习的全面指南软件职业规划 java 深度学习开发语言
一、DL4J框架概述Deeplearning4j（DL4J）是一个开源的深度学习框架，专为Java和Scala设计，运行在Java虚拟机（JVM）上。它由Skymind公司开发并维护，旨在将深度学习技术应用于大规模商业应用。DL4J支持多种深度学习模型，包括卷积神经网络（CNN）、循环神经网络（RNN）、长短期记忆网络（LSTM）等。自2014年首次发布以来，DL4J已经成为Java深度学习领域的
电机的声音数据进行AI分析鹿屿二向箔人工智能
对电机的声音数据进行分析，尤其是当数据来源于加速度传感器时，涉及到的不仅仅是声音分析，还包含了振动分析。这类问题通常可以归类于机械故障诊断或预测性维护领域。以下是一些适合处理这种类型数据的人工智能模型和方法：1.特征工程+传统机器学习模型在直接应用深度学习之前，通常首先会进行特征提取。对于振动信号（即使通过加速度传感器采集），常用的方法包括计算频域特征（如傅里叶变换后的频谱）、时域特征（如均方根值
李沐深度学习预备知识——数据操作 flex_university 李沐课程学习笔记深度学习人工智能
预备知识——数据操作1、数据操作1.1基本操作importtorchx=torch.arange(12)print(x)print(x.shape)print(x.numel())x=x.reshape(3,4)#变形x=x.reshape(2,-1)#-1代表自动计算torch.zeros((2,3,4))#生成全0张量torch.ones((2,3,4))#生成全1张量torch.randn(
基于Pytorch的语音情感识别系统鱼弦人工智能时代 pytorch 人工智能 python
基于Pytorch的语音情感识别系统介绍语音情感识别（SpeechEmotionRecognition,SER）是指通过分析和处理人的语音信号来识别其情感状态。常见的情感状态包括愤怒、喜悦、悲伤、惊讶等。基于Pytorch的语音情感识别系统使用深度学习技术，通过训练神经网络模型来实现情感识别任务。应用使用场景客户服务中心：自动识别客户情绪，提供有针对性的服务。智能语音助手：提升人机交互体验，更加智
新一代 AI 软件Manus 将重新将AI市场大洗牌 CircuitWizard 人工智能
Manus是一家专注于手部追踪、虚拟现实（VR）和增强现实（AR）技术的公司，其新一代AI软件结合了先进的机器学习和计算机视觉技术，致力于提升人机交互的自然性和效率。以下是关于Manus新一代AI软件的详细介绍及其核心功能：1.核心技术与创新Manus的AI软件基于以下技术突破：高精度手部追踪：通过深度学习算法和摄像头/传感器数据，实时捕捉手部骨骼、关节和肌肉的细微动作，精度可达亚毫米级，支持复杂
【自然语言处理-NLP】情感分析与主题建模云博士的AI课堂深度学习哈佛博后带你玩转机器学习自然语言处理人工智能情感分析主题建模深度学习机器学习 NLP
以下内容详细剖析了NLP中情感分析（SentimentAnalysis）和主题建模（TopicModeling）的技术与方法，分别展示如何从文本中提取情感倾向和潜在主题，并提供示例代码和讲解，可在Python环境下直接运行。目录情感分析（SentimentAnalysis）1.1概念与方法概览1.2传统机器学习方法1.3深度学习与预训练模型1.4代码示例：基于机器学习的情感分类主题建模（Topic
搜广推校招面经三十八 Y1nhl 搜广推面经算法 pytorch 推荐算法搜索算法机器学习
字节推荐算法一、场景题：在抖音场景下为用户推荐广告词，吸引用户点击搜索，呈现广告这一流程的关键点以及可能遇到的困难。二、Transformer中对梯度消失或者梯度爆炸的处理在Transformer模型中，梯度消失和梯度爆炸是深度学习中常见的问题，尤其是在处理长序列数据时。为了克服这些问题，Transformer采用了一系列技术：2.1.残差连接（ResidualConnections）每个子层（包
【深度学习】PyTorch v2.6 Overview OpenSeek 人工智能 #机器学习 #深度学习 python pytorch 人工智能
PyTorchv2.6OverviewPythonAPILibrariesPyTorch是一个优化的张量库，用于使用GPU和CPU进行深度学习。PythonAPI序号API名称解释1torchPyTorch核心库(中文:火炬)PyTorch的核心库，提供了张量操作、自动求导等基础功能。2torch.nn神经网络模块包含构建神经网络所需的各种模块，如层、损失函数等。3torch.nn.functio
PyTorch 显存分配不均匀 LutingWang debug pytorch 人工智能 python
在使用PyTorch进行深度学习训练时，可能会遇到GPU0的显存占用明显高于其他GPU的情况。这可能导致显存不足，影响训练效率。排查思路：开启两个Shell，ShellA用于运行训练脚本，ShellB用于实时监控显存。在ShellA运行训练脚本。在另一个shell中运行nvidia-smi-l1。这个命令会每秒刷新一次nvidia-smi的结果，方便实时观察各GPU显存的变化情况。观察GPU0何时
PyTorch 训练循环全攻略：从零到精通的深度学习秘籍吴师兄大模型 PyTorch 深度学习 pytorch 人工智能训练循环 LLM 大模型 python
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
python搭建NPL模型的详细步骤和代码百锦再@新空间代码工作室包罗万象 python 开发语言 django flask pygame pip
目录**一、环境准备****二、数据准备****三、文本预处理****1.清理文本****四、特征工程****1.TF-IDF****2.Word2Vec****五、搭建NLP模型****1.逻辑回归****2.LSTM深度学习模型****六、使用预训练的BERT模型****七、模型评估****八、部署模型****总结**1.**人机交互的核心技术**2.**推动AI技术发展的动力**3.**广泛
golang深度学习-性能分析老狼伙计 golang 编程语言云原生学习笔记 golang 深度学习开发语言
性能分析Go语言原生支持在运行时保留重要的特征指标和状态，有许多工具可以分析甚至可视化程序运行的状态和过程。pprof工具：常用于分析资源的使用情况，可以采集程序运行时的多种不同类型的数据（例如CPU占用、内存消耗和协程数量等），并对数据进行分析聚合生成的报告。trace工具：则关注程序运行时的事件（例如协程状态切换，GC的开始和结束、系统调用等等），常用于分析延迟、阻塞和调度等问题。pprof工
专业英语程序员爱德华英语专业英语
文章目录一、计算机1.计算机基础(1)计算机组成原理(2)计算机网络(3)数据库(4)编译原理(5)离散数学2.软件开发(1)编程词汇(2)开发术语(3)Linux(4)软件3.就业领域(1)职场(2)芯片(3)自动驾驶(4)嵌入式硬件4.深度学习(1)论文(2)深度学习DL(3)计算机视觉CV(4)自然语言处理NLP(5)推荐系统(6)计算机图形学二、数学三、机械、材料四、医药五、英美计量单位一
AI与机器学习、深度学习在气候变化预测中的应用 weixin_贾农业模型气象人必备模型人工智能机器学习深度学习气候数据预测气候变化趋势农业生产气溶胶
全球气候变化是现代社会面临的最重要的环境挑战之一，影响了气温、降水、海平面、农业、生态系统等多个方面。气候变化的驱动因素主要包括温室气体排放、气溶胶浓度、火灾频发、海冰融化、叶绿素变化、农业变化和生态环境变化等。这些因素在全球范围内交互作用，导致复杂的气候变化模式。将学习如何应用ChatGPT、Deepseek辅助Python编程、学习如何下载处理NASA卫星、CMIP6数据。通过机器学习（K-m
python 虚拟环境介绍 The One Neo python 开发语言
一、pippip介绍很简单，但是在学习深度学习的时候，虽然用过，但也仅仅是用过，对其了解不多，更多的是下载包，相对于pip，用的更多的反而是anaconda和miniconda这两个python包管理器。pip是Python的包管理工具，主要用于安装、更新、卸载Python软件包。它是Python官方推荐的工具，能够从PythonPackageIndex(PyPI)下载并安装符合指定依赖关系的包。
2025最新Transformer模型及深度学习前沿技术应用 weixin_贾 Python MATLAB python 深度学习 MATLAB编程深度学习模型图神经网络自编码物理信息神经网络目标检测大语言模型
第一章、注意力（Attention）机制1、注意力机制的背景和动机（为什么需要注意力机制？注意力机制的起源和发展里程碑）。2、注意力机制的基本原理（什么是注意力机制？注意力机制的数学表达与基本公式、用机器翻译任务带你了解Attention机制、如何计算注意力权重？）3、注意力机制的主要类型：键值对注意力机制（Key-ValueAttention）、自注意力（Self-Attention）与多头注意
tensorflow keras 报错：No gradients provided for any variable 原因与解决办法研志必有功 tensorflow报错 tensorflow 深度学习机器学习神经网络自然语言处理
错误分析Nogradientsprovidedforanyvariable这个意思是没有梯度给已知的所有函数，为什么会出现这个错误呢，因为在深度学习中，梯度的更新是由于反向传播算法的实现的，如果损失函数没有与已知的任何（除输入）层关联，那么，损失函数就无法求出关于各个函数的梯度，导致错误解决办法例如损失函数defcontrastive_loss_layer(left_inputs,right_in
cv君独家视角 | AI内幕系列十四：【手机、相机防抖大揭秘】数字防抖、鸡头防抖、光学防抖、AI防抖等(附源码+长期更新) cv君原创项目级实战项目 cv君独家视角 AI内幕系列深度学习与计算机视觉精品人工智能 ai isp 科技 python
目录摘要主要防抖技术手机防抖对比某拇指相机技术分析：1.基础介绍2.功能需求2.1功能背景2.2技术背景与技术选型2.3技术方案2.4可行性落地链路2.5竞品调研与市场分析2.6防抖主客观评价源码实现运动防抖步骤：代码实现性能优化与改进代码改进进一步改进与应用深度学习方法示例实时处理与应用示例运动摄影无人机航拍摄像头防抖设备计算资源需求复杂场景处理参数调整和优化实时处理需求误差累积并行和分布式处理
Deepseek r1回答：人工智能的本质是什么？给人类社会带来的意义是什么？相比于之前的互联网革命，这一轮的人工智能革命的特点和异同点有哪些？强化学习曾小健 Deepseek原理与使用人工智能
嗯，用户问的是人工智能的本质、对社会的意义，以及和互联网革命的比较。首先得拆解这三个问题，逐个分析。用户可能对AI有一定了解，但想深入理解其核心和影响。可能需要从技术、社会、历史角度切入。先想AI的本质。本质是什么？是模拟人类智能，还是数据处理？可能需要提到机器学习、深度学习，尤其是神经网络。但本质可能更深层，比如自主决策、模式识别。还要区分弱AI和强AI，现在都是弱AI，专注于特定任务。然后是意
（Pytorch）动手学深度学习：基础内容（持续更新）孔表表uuu 神经网络深度学习 pytorch 人工智能
深度学习前言环境安装(Windows)安装anaconda使用conda或miniconda创建环境下载所需的包下载代码并执行(课件代码)关于线性代数内积(数量积、点乘)外积关于数据操作X.sum(0,keepdim=True)和X.sum(1,keepdim=True)广播机制(broadcast)Softmax函数和交叉熵损失函数Softmax函数交叉熵损失函数感知机多层感知机前言之前看吴恩达
PyTorch深度学习框架60天进阶学习计划第14天：循环神经网络进阶凡人的AI工具箱深度学习 pytorch 学习人工智能 python AI编程
PyTorch深度学习框架60天进阶学习计划第14天：循环神经网络进阶在深度学习处理序列数据时，循环神经网络(RNN)家族的模型扮演着至关重要的角色。今天，我们将深入探讨循环神经网络的进阶内容，包括BiLSTM的工作机制、注意力机制的数学原理，以及Transformer编码层的实现。目录BiLSTM的双向信息流机制LSTM回顾BiLSTM架构解析时序特征融合策略BiLSTM实现与案例注意力机制原理
使用 DeepSeek 训练属于自己写小说的模型 xinxiyinhe DeepSeek 人工智能 python
如果你想使用DeepSeek训练一个专门用于写小说的模型，以下是详细的指导指南。DeepSeek是一个强大的深度学习框架，支持自然语言处理任务。我们将基于DeepSeek的API和工具，结合HuggingFace的Transformers库，完成模型的训练和部署。详细指南：使用DeepSeek训练写小说模型1.环境准备1.1安装必要的库确保你已经安装了以下Python库：pipinstalltor
Qwen1.5-7B-实现RAG应用详细步骤大数据追光猿大模型数据库 AI编程语言模型人工智能深度学习
1.准备工作1.1安装依赖确保你的环境中安装了以下工具和库：Python：建议使用Python3.8或更高版本。PyTorch：用于运行深度学习模型。Transformers：HuggingFace提供的库，支持加载和运行预训练模型。FAISS：用于向量检索的高效库。GPTQ支持库：如auto-gptq或gptqmodel。安装命令运行以下命令安装所需的Python包：pipinstalltorc
GitHub每日最火火火项目（3.7） FutureUniant github日推 github 人工智能计算机视觉音视频 ai
ai-hedge-fund项目介绍：ai-hedge-fund是由virattt开发的项目，本质上是一个将人工智能技术应用于对冲基金领域的团队或平台。在金融市场中，对冲基金旨在通过各种策略获取超额收益，而人工智能具备强大的数据分析和预测能力，二者结合能为投资决策带来新的思路和方法。该项目可能运用机器学习、深度学习等人工智能算法，对大量的金融数据进行深入分析，包括股票、债券、期货等市场的历史价格、交
mongodb3.03开启认证 21jhf mongodb
下载了最新mongodb3.03版本，当使用--auth 参数命令行开启mongodb用户认证时遇到很多问题，现总结如下：（百度上搜到的基本都是老版本的，看到db.addUser的就是，请忽略） Windows下我做了一个bat文件，用来启动mongodb，命令行如下： mongod --dbpath db\data --port 27017 --directoryperdb --logp
【Spark103】Task not serializable bit1129 Serializable
Task not serializable是Spark开发过程最令人头疼的问题之一，这里记录下出现这个问题的两个实例，一个是自己遇到的，另一个是stackoverflow上看到。等有时间了再仔细探究出现Task not serialiazable的各种原因以及出现问题后如何快速定位问题的所在，至少目前阶段碰到此类问题，没有什么章法 1. package spark.exampl
你所熟知的 LRU(最近最少使用) dalan_123 java
关于LRU这个名词在很多地方或听说，或使用，接下来看下lru缓存回收的实现 1、大体的想法 a、查询出最近最晚使用的项 b、给最近的使用的项做标记通过使用链表就可以完成这两个操作，关于最近最少使用的项只需要返回链表的尾部；标记最近使用的项，只需要将该项移除并放置到头部，那么难点就出现你如何能够快速在链表定位对应的该项？这时候多
Javascript 跨域周凡杨 JavaScript jsonp 跨域 cross-domain
linux下安装apache服务器 g21121 apache
安装apache 下载windows版本apache，下载地址：http://httpd.apache.org/download.cgi 1.windows下安装apache Windows下安装apache比较简单，注意选择路径和端口即可，这里就不再赘述了。 2.linux下安装apache：下载之后上传到linux的相关目录，这里指定为/home/apach
FineReport的JS编辑框和URL地址栏语法简介老A不折腾 finereport web报表报表软件语法总结
JS编辑框： 1.FineReport的js。作为一款BS产品，browser端的JavaScript是必不可少的。 FineReport中的js是已经调用了finereport.js的。大家知道，预览报表时，报表servlet会将cpt模板转为html，在这个html的head头部中会引入FineReport的js，这个finereport.js中包含了许多内置的fun
根据STATUS信息对MySQL进行优化墙头上一根草 status
mysql 查看当前正在执行的操作，即正在执行的sql语句的方法为: show processlist 命令 mysql> show global status;可以列出MySQL服务器运行各种状态值，我个人较喜欢的用法是show status like '查询值%';一、慢查询mysql> show variab
我的spring学习笔记7-Spring的Bean配置文件给Bean定义别名 aijuans Spring 3
本文介绍如何给Spring的Bean配置文件的Bean定义别名？原始的 <bean id="business" class="onlyfun.caterpillar.device.Business"> <property name="writer"> <ref b
高性能mysql 之性能剖析 annan211 性能 mysql mysql 性能剖析剖析
1 定义性能优化 mysql服务器性能，此处定义为响应时间。在解释性能优化之前，先来消除一个误解，很多人认为，性能优化就是降低cpu的利用率或者减少对资源的使用。这是一个陷阱。资源时用来消耗并用来工作的，所以有时候消耗更多的资源能够加快查询速度，保持cpu忙绿，这是必要的。很多时候发现编译进了新版本的InnoDB之后，cpu利用率上升的很厉害，这并不
主外键和索引唯一性约束百合不是茶索引唯一性约束主外键约束联机删除
目标;第一步;创建两张表用户表和文章表第二步;发表文章 1,建表; ---用户表 BlogUsers --userID唯一的 --userName --pwd --sex create
线程的调度 bijian1013 java 多线程 thread 线程的调度 java多线程
1. Java提供一个线程调度程序来监控程序中启动后进入可运行状态的所有线程。线程调度程序按照线程的优先级决定应调度哪些线程来执行。 2. 多数线程的调度是抢占式的（即我想中断程序运行就中断，不需要和将被中断的程序协商） a)
查看日志常用命令 bijian1013 linux 命令 unix
一.日志查找方法，可以用通配符查某台主机上的所有服务器grep "关键字" /wls/applogs/custom-*/error.log 二.查看日志常用命令1.grep '关键字' error.log：在error.log中搜索'关键字'2.grep -C10 '关键字' error.log：显示关键字前后10行记录3.grep '关键字' error.l
【持久化框架MyBatis3一】MyBatis版HelloWorld bit1129 helloworld
MyBatis这个系列的文章，主要参考《Java Persistence with MyBatis 3》。样例数据本文以MySQL数据库为例，建立一个STUDENTS表，插入两条数据，然后进行单表的增删改查 CREATE TABLE STUDENTS ( stud_id int(11) NOT NULL AUTO_INCREMENT,
【Hadoop十五】Hadoop Counter bit1129 hadoop
1. 只有Map任务的Map Reduce Job File System Counters FILE: Number of bytes read=3629530 FILE: Number of bytes written=98312 FILE: Number of read operations=0 FILE: Number of lar
解决Tomcat数据连接池无法释放 ronin47 tomcat 连接池　优化
近段时间，公司的检测中心报表系统(SMC)的开发人员时不时找到我，说用户老是出现无法登录的情况。前些日子因为手头上有Jboss集群的测试工作，发现用户不能登录时，都是在Tomcat中将这个项目Reload一下就好了，不过只是治标而已，因为大概几个小时之后又会再次出现无法登录的情况。今天上午，开发人员小毛又找到我，要我协助将这个问题根治一下，拖太久用户难保不投诉。简单分析了一
java-75-二叉树两结点的最低共同父结点 bylijinnan java
import java.util.LinkedList; import java.util.List; import ljn.help.*; public class BTreeLowestParentOfTwoNodes { public static void main(String[] args) { /* * node data is stored in
行业垂直搜索引擎网页抓取项目 carlwu Lucene Nutch Heritrix Solr
公司有一个搜索引擎项目，希望各路高人有空来帮忙指导，谢谢！这是详细需求：（1）通过提供的网站地址(大概100-200个网站)，网页抓取程序能不断抓取网页和其它类型的文件（如Excel、PDF、Word、ppt及zip类型），并且程序能够根据事先提供的规则，过滤掉不相干的下载内容。（2）程序能够搜索这些抓取的内容，并能对这些抓取文件按照油田名进行分类，然后放到服务器不同的目录中。
[通讯与服务]在总带宽资源没有大幅增加之前,不适宜大幅度降低资费 comsci 资源
降低通讯服务资费，就意味着有更多的用户进入，就意味着通讯服务提供商要接待和服务更多的用户，在总体运维成本没有由于技术升级而大幅下降的情况下，这种降低资费的行为将导致每个用户的平均带宽不断下降，而享受到的服务质量也在下降，这对用户和服务商都是不利的。。。。。。。。 &nbs
Java时区转换及时间格式 Cwind java
本文介绍Java API 中 Date, Calendar, TimeZone和DateFormat的使用，以及不同时区时间相互转化的方法和原理。问题描述：向处于不同时区的服务器发请求时需要考虑时区转换的问题。譬如，服务器位于东八区（北京时间，GMT+8:00），而身处东四区的用户想要查询当天的销售记录。则需把东四区的“今天”这个时间范围转换为服务器所在时区的时间范围。
readonly,只读，不可用 dashuaifu js jsp disable readOnly readOnly
readOnly 和 readonly 不同，在做js开发时一定要注意函数大小写和jsp黄线的警告！！！我就经历过这么一件事：使用readOnly在某些浏览器或同一浏览器不同版本有的可以实现“只读”功能，有的就不行，而且函数readOnly有黄线警告！！！就这样被折磨了不短时间！！！（期间使用过disable函数，但是发现disable函数之后后台接收不到前台的的数据！！！）
LABjs、RequireJS、SeaJS 介绍 dcj3sjt126com js Web
LABjs 的核心是 LAB（Loading and Blocking）：Loading 指异步并行加载，Blocking 是指同步等待执行。LABjs 通过优雅的语法（script 和 wait）实现了这两大特性，核心价值是性能优化。LABjs 是一个文件加载器。RequireJS 和 SeaJS 则是模块加载器，倡导的是一种模块化开发理念，核心价值是让 JavaScript 的模块化开发变得更
[应用结构]入口脚本 dcj3sjt126com PHP yii2
入口脚本入口脚本是应用启动流程中的第一环，一个应用（不管是网页应用还是控制台应用）只有一个入口脚本。终端用户的请求通过入口脚本实例化应用并将将请求转发到应用。 Web 应用的入口脚本必须放在终端用户能够访问的目录下，通常命名为 index.php，也可以使用 Web 服务器能定位到的其他名称。控制台应用的入口脚本一般在应用根目录下命名为 yii（后缀为.php），该文
haoop shell命令 eksliang hadoop hadoop shell
cat chgrp chmod chown copyFromLocal copyToLocal cp du dus expunge get getmerge ls lsr mkdir movefromLocal mv put rm rmr setrep stat tail test text
MultiStateView不同的状态下显示不同的界面 gundumw100 android
只要将指定的view放在该控件里面，可以该view在不同的状态下显示不同的界面，这对ListView很有用，比如加载界面，空白界面，错误界面。而且这些见面由你指定布局，非常灵活。 PS：ListView虽然可以设置一个EmptyView，但使用起来不方便，不灵活，有点累赘。 <com.kennyc.view.MultiStateView xmlns:android=&qu
jQuery实现页面内锚点平滑跳转 ini JavaScript html jquery html5 css
平时我们做导航滚动到内容都是通过锚点来做，刷的一下就直接跳到内容了，没有一丝的滚动效果，而且 url 链接最后会有“小尾巴”，就像#keleyi，今天我就介绍一款 jquery 做的滚动的特效，既可以设置滚动速度，又可以在 url 链接上没有“小尾巴”。效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/37.htmHTML文件代码： &
kafka offset迁移 kane_xie kafka
在早前的kafka版本中（0.8.0），offset是被存储在zookeeper中的。到当前版本（0.8.2）为止，kafka同时支持offset存储在zookeeper和offset manager（broker）中。从官方的说明来看，未来offset的zookeeper存储将会被弃用。因此现有的基于kafka的项目如果今后计划保持更新的话，可以考虑在合适
android > 搭建 cordova 环境 mft8899 android
1 , 安装 node.js http://nodejs.org node -v 查看版本 2, 安装 npm 可以先从 https://github.com/isaacs/npm/tags 下载源码解压到
java封装的比较器，比较是否全相同，获取不同字段名字 qifeifei
非常实用的java比较器，贴上代码： import java.util.HashSet; import java.util.List; import java.util.Set; import net.sf.json.JSONArray; import net.sf.json.JSONObject; import net.sf.json.JsonConfig; i
记录一些函数用法 .Aky. 位运算 PHP 数据库函数 IP
高手们照旧忽略。想弄个全天朝IP段数据库，找了个今天最新更新的国内所有运营商IP段，copy到文件，用文件函数，字符串函数把玩下。分割出startIp和endIp这样格式写入.txt文件，直接用phpmyadmin导入.csv文件的形式导入。（生命在于折腾，也许你们觉得我傻X，直接下载人家弄好的导入不就可以，做自己的菜鸟，让别人去说吧）当然用到了ip2long()函数把字符串转为整型数
sublime text 3 rust wudixiaotie Sublime Text
1.sublime text 3 => install package => Rust 2.cd ~/.config/sublime-text-3/Packages 3.mkdir rust 4.git clone https://github.com/sp0/rust-style 5.cd rust-style 6.cargo build --release 7.ctrl