贝叶贝叶贝叶斯

第二周卷积神经网络

1.卷积神经网络的用处

卷积神经网络在计算机视觉中可以应用在图像的分类、检索、目标的检测和图像分割中，具体可以应用到人脸识别、人脸表情识别、图像生成、自动驾驶等方面。

2.卷积是什么？

卷积在《Deep Learning》书中定义为：卷积是对两个实变函数的一种数学运算。卷积的运算过程如下图所示。

在输入的矩阵中，卷积核像滑动窗口一样对输入矩阵进行卷积操作。卷积操作就是卷积核中方格的值与对应输入矩阵方格中的数相乘，最后将每对方格的积求和。其中，卷积核又被成为滤波器。

在卷积过程中经常涉及到的基本概念如下：

其中padding是填充像素，当卷积核在输入矩阵上滑动时，当滑动到边界有时出现当前进行卷积操作的部分输入矩阵的大小和卷积核的大小不相同，如当前操作的矩阵大小为3*2，卷积核的大小为3*3，这样的话，就不能进行正常的卷积运算，此时可以使用填充0的方法，给原来的矩阵填充一列0，使得大小和卷积核相同，这种操作就是padding。

深度的大小和卷积核的个数一致。

计算feature map的大小

其中，是输入矩阵的大小，是卷积核的大小，stride是遍历的步长。

当图像使用了padding时，特征图大小的计算公式为：

3.池化

保留了主要特征的同时减少参数和计算量，防止过度拟合，提高模型的泛化能力。一般位于卷积层与卷积层之间。主要有Max pooling(最大值池化)和Average pooling(平均值池化)。

4. 全连接(FC layer)

两层之间所有的神经元都有权重的连接，通常全连接层在网络的尾部，参数量通常较大。

5. 典型卷积网络结构

5.1 AlexNet

AlexNet包含5个卷积层和3个全连接层，结构如下图：

在AlexNet中使用非线性激活函数ReLu，为了防止产生过拟合现象，采用了Dropout和Data augmentation，并且使用双GPU实现。由上图可以看出来，网络被分为上下两层。

5.2 ZFNet

ZFNet在结构上和AlexNet相同，但在第一层卷积层中将感受野的大小由11*11调整为7*7，步长由4调整为2。

第三、四、五成卷积层中，卷积核个数由384，384，256调整为512，512，1024。

5.3 VGG

VGG是一个更深网络，它从AlexNet的8层加深到了16-19层。由于当时的条件限制，不足以一次性进行如此深层的网络训练，于是它首先训练了网络的前11层，在参数固定后再训练后面的层，采用分块的方法进行全层的网络训练。

5.4 GoogleNet

GoogleNet不仅在深度上增大了模型的深度，而且在模型的结构上也进行了改进。

网络包含22个待参数的层，独立的层约有100层，并且参数是AlexNet的1/12。没有额外的全连接层，除了最后的类别输出层。

GoolgeNet添加inception模块的初衷是希望多卷积核增加特征多样性。在原始的inception中会出现堆叠导致计算复杂度过高的现象，Inception v2中插入1*1卷积核进行降维。

在Inception v3版本中，京一部对参数数量进行降低，用小的卷积核来替代大的卷积核。

使用两个3*3的卷积核来替换5*5的卷积核，通过这种方法可以降低参数的数量(5*5的卷积核的参数计算为：；替换为2个3*3的卷积核需要参数为：)。而且可以增加非线性激活函数，使得表征能力更强，心训练的速度更快。

5.5 ResNet

使用残差学习网络，深度有152层，是2015年ILSVRC竞赛冠军。

残差的思想就是去掉相同的主体部分，从而突出微小的变化。可以被用来训练非常深的网络。残差网络优势在于解决了梯度消失的现象。

$(f(g(h(x)+x)+x)+x)'\rightarrow (f'+1)(g'+1)(h'+1)$

这样，即使某个函数的导数为0，相对于BP算法来说，也不会出现整体为0的情况，从而解决了梯度消失的现象。

6. MNIST 数据集分类

6.1 加载MNIST数据集

PyTorch里包含了 MNIST， CIFAR10 等常用数据集，调用 torchvision.datasets 即可把这些数据由远程下载到本地。

DataLoader提供的常用操作有：batch_size(每个batch的大小), shuffle(是否进行随机打乱顺序的操作), num_workers(加载数据的时候使用几个子进程)

input_size  = 28*28   # MNIST上的图像尺寸是 28x28
output_size = 10      # 类别为 0 到 9 的数字，因此为十类

train_loader = torch.utils.data.DataLoader(
    datasets.MNIST('./data', train=True, download=True,
        transform=transforms.Compose(
            [transforms.ToTensor(),
             transforms.Normalize((0.1307,), (0.3081,))])),
    batch_size=64, shuffle=True)

test_loader = torch.utils.data.DataLoader(
    datasets.MNIST('./data', train=False, transform=transforms.Compose([
             transforms.ToTensor(),
             transforms.Normalize((0.1307,), (0.3081,))])),
    batch_size=1000, shuffle=True)

6.2 创建网络

class FC2Layer(nn.Module):
    def __init__(self, input_size, n_hidden, output_size):
        # nn.Module子类的函数必须在构造函数中执行父类的构造函数
        # 下式等价于nn.Module.__init__(self)        
        super(FC2Layer, self).__init__()
        self.input_size = input_size
        # 这里直接用 Sequential 就定义了网络，注意要和下面 CNN 的代码区分开
        self.network = nn.Sequential(
            nn.Linear(input_size, n_hidden), 
            nn.ReLU(), 
            nn.Linear(n_hidden, n_hidden), 
            nn.ReLU(), 
            nn.Linear(n_hidden, output_size), 
            nn.LogSoftmax(dim=1)
        )
        
    def forward(self, x):
        # view一般出现在model类的forward函数中，用于改变输入或输出的形状
        # x.view(-1, self.input_size) 的意思是多维的数据展成二维
        # 代码指定二维数据的列数为 input_size=784，行数 -1 表示我们不想算，电脑会自己计算对应的数字
        # 在 DataLoader 部分，我们可以看到 batch_size 是64，所以得到 x 的行数是64
        # 大家可以加一行代码：print(x.cpu().numpy().shape)
        # 训练过程中，就会看到 (64, 784) 的输出，和我们的预期是一致的

        # forward 函数的作用是，指定网络的运行过程，这个全连接网络可能看不啥意义，
        # 下面的CNN网络可以看出 forward 的作用。
        x = x.view(-1, self.input_size)
        return self.network(x)
    


class CNN(nn.Module):
    def __init__(self, input_size, n_feature, output_size):
        # 执行父类的构造函数，所有的网络都要这么写
        super(CNN, self).__init__()
        # 下面是网络里典型结构的一些定义，一般就是卷积和全连接
        # 池化、ReLU一类的不用在这里定义
        self.n_feature = n_feature
        self.conv1 = nn.Conv2d(in_channels=1, out_channels=n_feature, kernel_size=5)
        self.conv2 = nn.Conv2d(n_feature, n_feature, kernel_size=5)
        self.fc1 = nn.Linear(n_feature*4*4, 50)
        self.fc2 = nn.Linear(50, 10)    
    
    # 下面的 forward 函数，定义了网络的结构，按照一定顺序，把上面构建的一些结构组织起来
    # 意思就是，conv1, conv2 等等的，可以多次重用
    def forward(self, x, verbose=False):
        x = self.conv1(x)
        x = F.relu(x)
        x = F.max_pool2d(x, kernel_size=2)
        x = self.conv2(x)
        x = F.relu(x)
        x = F.max_pool2d(x, kernel_size=2)
        x = x.view(-1, self.n_feature*4*4)
        x = self.fc1(x)
        x = F.relu(x)
        x = self.fc2(x)
        x = F.log_softmax(x, dim=1)
        return x

6.3 在全连接网络和CNN网络上进行训练测试查看结果

全连接网络

n_hidden = 8 # number of hidden units

model_fnn = FC2Layer(input_size, n_hidden, output_size)
model_fnn.to(device)
optimizer = optim.SGD(model_fnn.parameters(), lr=0.01, momentum=0.5)
print('Number of parameters: {}'.format(get_n_params(model_fnn)))

normal_fcn_train_loss,train_x = train(model_fnn)
test(model_fnn)
model_fnn

CNN网络

# Training settings 
n_features = 6 # number of feature maps

model_cnn = CNN(input_size, n_features, output_size)
model_cnn.to(device)
optimizer = optim.SGD(model_cnn.parameters(), lr=0.01, momentum=0.5)
print('Number of parameters: {}'.format(get_n_params(model_cnn)))

normal_cnn_train_loss,_ = train(model_cnn)
test(model_cnn)
model_cnn

6.4 打乱像素顺序再次在两个网络上训练与测试

CNN在卷积与池化上具有优良特性，如果我们把图像中的像素打乱顺序，这样卷积和池化就难以发挥作用了，为了验证这个想法，我们把图像中的像素打乱顺序再试试。

全连接网络

CNN网络

6.5 综合对比

非打乱情况下全连接网络与卷积网络训练误差对比

可以看到卷积神经网络在训练集上误差较小，收敛较快，表现出的性能优于全连接网络。

打乱情况下全连接网络与卷积网络训练误差对比

可以看到将像素顺序打乱之后，卷积神经网络的卷积操作和池化操作的优良特性将失去作用，此时全连接网络的效果表现得较好。

打乱与非打乱情况下全连接网络训练误差对比

从结果可以看出，像素顺序是否打乱对该网络的影响较小。

打乱与非打乱情况下卷积网络训练误差对比

而对于CNN网络，打乱像素的顺序对改网络的影响较大。

7. CNN 对 CIFAR10 数据集进行分类

7.1 下载数据集并查看

trainset = torchvision.datasets.CIFAR10(root='./data', train=True,
                                        download=True, transform=transform)
trainloader = torch.utils.data.DataLoader(trainset, batch_size=64,
                                          shuffle=True, num_workers=2)

testset = torchvision.datasets.CIFAR10(root='./data', train=False,
                                       download=True, transform=transform)
testloader = torch.utils.data.DataLoader(testset, batch_size=8,
                                         shuffle=False, num_workers=2)

classes = ('plane', 'car', 'bird', 'cat',
           'deer', 'dog', 'frog', 'horse', 'ship', 'truck')


def imshow(img):
    plt.figure(figsize=(8,8))
    img = img / 2 + 0.5     # 转换到 [0,1] 之间
    npimg = img.numpy()
    plt.imshow(np.transpose(npimg, (1, 2, 0)))
    plt.show()

# 得到一组图像
images, labels = iter(trainloader).next()
# 展示图像
imshow(torchvision.utils.make_grid(images))
# 展示第一行图像的标签
for j in range(8):
    print(classes[labels[j]])

7.2 定义网络、损失函数和优化器

class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.conv1 = nn.Conv2d(3, 6, 5)
        self.pool = nn.MaxPool2d(2, 2)
        self.conv2 = nn.Conv2d(6, 16, 5)
        self.fc1 = nn.Linear(16 * 5 * 5, 120)
        self.fc2 = nn.Linear(120, 84)
        self.fc3 = nn.Linear(84, 10)

    def forward(self, x):
        x = self.pool(F.relu(self.conv1(x)))
        x = self.pool(F.relu(self.conv2(x)))
        x = x.view(-1, 16 * 5 * 5)
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x

# 网络放到GPU上
net = Net().to(device)
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(net.parameters(), lr=0.001)

7.3 网络训练

plt.figure(figsize=(24,8))#设置画板的大小
for epoch in range(10):  # 重复多轮训练
    loss_i = np.array([])
    train_x = np.array([])
    for i, (inputs, labels) in enumerate(trainloader):
        inputs = inputs.to(device)
        labels = labels.to(device)
        # 优化器梯度归零
        optimizer.zero_grad()
        # 正向传播 +　反向传播 + 优化 
        outputs = net(inputs)
        loss = criterion(outputs, labels)
        loss_i = np.append(loss_i,loss.item())
        loss.backward()
        optimizer.step()
        train_x = np.append(train_x,i)
        # 输出统计信息
        if i % 100 == 0:   
            print('Epoch: %d Minibatch: %5d loss: %.3f' %(epoch + 1, i + 1, loss.item()))
    plt.plot(train_x,loss_i,label = '{i} train loss'.format(i=epoch+1))
    plt.legend()#添加标注
plt.show()
print('Finished Training')

7.4 查看模型在数据集上的准确度

correct = 0
total = 0

for data in testloader:
    images, labels = data
    images, labels = images.to(device), labels.to(device)
    outputs = net(images)
    _, predicted = torch.max(outputs.data, 1)
    total += labels.size(0)
    correct += (predicted == labels).sum().item()

print('Accuracy of the network on the 10000 test images: %d %%' % (
    100 * correct / total))

8. 使用VGG对CIFAR10 数据集进行分类

8.1 数据集获取

transform_train = transforms.Compose([
    transforms.RandomCrop(32, padding=4),
    transforms.RandomHorizontalFlip(),
    transforms.ToTensor(),
    transforms.Normalize((0.4914, 0.4822, 0.4465), (0.2023, 0.1994, 0.2010))])

transform_test = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize((0.4914, 0.4822, 0.4465), (0.2023, 0.1994, 0.2010))])

trainset = torchvision.datasets.CIFAR10(root='./data', train=True,  download=True, transform=transform_train)
testset  = torchvision.datasets.CIFAR10(root='./data', train=False, download=True, transform=transform_test)

trainloader = torch.utils.data.DataLoader(trainset, batch_size=128, shuffle=True, num_workers=2)
testloader = torch.utils.data.DataLoader(testset, batch_size=128, shuffle=False, num_workers=2)

classes = ('plane', 'car', 'bird', 'cat',
           'deer', 'dog', 'frog', 'horse', 'ship', 'truck')

8.2 定义VGG网络

class VGG(nn.Module):
    def __init__(self):
        super(VGG, self).__init__()
        self.cfg = [64, 'M', 128, 'M', 256, 256, 'M', 512, 512, 'M', 512, 512, 'M']
        self.features = self._make_layers(self.cfg)
        self.classifier = nn.Linear(512, 10)

    def forward(self, x):
        out = self.features(x)
        out = out.view(out.size(0), -1)
        out = self.classifier(out)
        return out

    def _make_layers(self, cfg):
        layers = []
        in_channels = 3
        for x in cfg:
            if x == 'M':
                layers += [nn.MaxPool2d(kernel_size=2, stride=2)]
            else:
                layers += [nn.Conv2d(in_channels, x, kernel_size=3, padding=1),
                           nn.BatchNorm2d(x),
                           nn.ReLU(inplace=True)]
                in_channels = x
        layers += [nn.AvgPool2d(kernel_size=1, stride=1)]
        return nn.Sequential(*layers)

8.3 对网络进行训练

plt.figure(figsize=(24,8))#设置画板的大小
for epoch in range(10):  # 重复多轮训练
    loss_i = np.array([])
    train_x = np.array([])
    for i, (inputs, labels) in enumerate(trainloader):
        inputs = inputs.to(device)
        labels = labels.to(device)
        # 优化器梯度归零
        optimizer.zero_grad()
        # 正向传播 +　反向传播 + 优化 
        outputs = net(inputs)
        loss = criterion(outputs, labels)
        loss_i = np.append(loss_i,loss.item())
        loss.backward()
        optimizer.step()
        train_x = np.append(train_x,i)
        # 输出统计信息
        if i % 100 == 0:   
            print('Epoch: %d Minibatch: %5d loss: %.3f' %(epoch + 1, i + 1, loss.item()))
    plt.plot(train_x,loss_i,label = '{i} train loss'.format(i=epoch+1))
    plt.legend()#添加标注
plt.show()
print('Finished Training')

训练结果

对比7.3的训练结果，使用VGG网络每轮的训练误差都在降低。

8.4 测试模型准确度

correct = 0
total = 0

for data in testloader:
    images, labels = data
    images, labels = images.to(device), labels.to(device)
    outputs = net(images)
    _, predicted = torch.max(outputs.data, 1)
    total += labels.size(0)
    correct += (predicted == labels).sum().item()

print('Accuracy of the network on the 10000 test images: %.2f %%' % (
    100 * correct / total))

实验结果

相比于CNN网络，本次VGG网络的分类准确度上升了20%，但同时模型的训练时间也有较为明显的差异，VGG网络的训练时间要明显长于CNN网络。

网络名称	训练时间
CNN	1分42.8秒
VGG	7分19秒

9. 思考与解答

1. dataloader 里面 shuffle 取不同值有什么区别？

shuffle是控制加载数据集时是否打乱数据集的顺序，当shuffle为true时，数据被随即打乱，使得模型的泛化能力能强。下图是shuffle的对比，当shuffle为false时，训练误差成周期性震荡，而为true的训练误差逐渐收敛。

2. transform 里，取了不同值，这个有什么区别？

Normalize()函数的作用是将数据转换为标准高斯分布，即对图像的每个channel进行标准化（均值变为0，标准差为1），可以加快模型的收敛。

torchvision.transforms 用来对数据进行预处理，从而提高模型的泛化能力。

3. epoch 和 batch 的区别？

epoch是训练整个训练集的次数。当数据集很大时，不能一次性将所有数据送进去训练，于是使用batch，每个batch包含较小数目的数据，将这些数据送入模型中进行训练。

4. 1x1的卷积和 FC 有什么区别？主要起什么作用？

卷积跟全连接都是一个点乘的操作，区别在于卷积是作用在一个局部的区域，而全连接是对于整个输入而言，那么只要把卷积作用的区域扩大为整个输入，那就变成全连接了。

1x1的卷积核的作用有：跨通道的特征整合、特征通道升维或者降维、减少卷积核的参数。

5. residual leanring 为什么能够提升准确率？

使用残差网络可以有效解决梯度消失的问题，从而可以更好的传播误差，用来更新参数，因此能够提升准确度。

6. 代码练习二里，网络和1989年 Lecun 提出的 LeNet 有什么区别？

LeNet网络结构：

CNN网络结构：

首先，CNN的网络结构中少了一个池化层；CNN中的池化层是最大池化，LeNet的池化层中有可训练参数；CNN使用的是ReLU激活函数，LeNet使用的是sigmoid激活函数；最后LeNet使用Softmax分类，本次CNN中没有。

7. 代码练习二里，卷积以后feature map 尺寸会变小，如何应用 Residual Learning?

可以选择使用1*1卷积、填充padding等方法来调整feature map尺寸

8. 有什么方法可以进一步提升准确率？

可以优化网络结构
加深网络的深度
使用合适的激活函数
使用dropout来优化模型训练
进行数据增强，来提升模型训练的效果

郑州人工智能计算中心成果发布会成功举办埃文科技共建AI生态人工智能
2024年3月1日，由郑州市科学技术局主办，郑州联通、华为技术有限公司联合承办的郑州人工智能计算中心成果发布会在郑州隆重举行，郑州埃文科技有限公司（以下简称“埃文科技”）作为河南省人工智能领军企业受邀参会。大会以“全面拥抱智能化，共筑算力新底座”为主题，郑州市委副书记、代市长庄建球，河南联通党委书记、总经理华豫民等领导，以及300余位行业专家、企业代表齐聚一堂，共同见证中部地区首个政府主导的智能算
DeepSeek×博云AIOS：突破算力桎梏，开启AI普惠新纪元 deepseek
背景在全球人工智能技术高速迭代的背景下，算力成本高企、异构资源适配复杂、模型部署效率低下等问题，始终是制约企业AI规模化应用的关键。DeepSeek以创新技术直击产业痛点，而博云先进算力管理平台AIOS的全面适配，则为这一技术落地提供了坚实底座。两者的深度融合，正在重塑AI产业化的技术范式。DeepSeek：算法创新定义AI新范式DeepSeek凭借技术突破，为AI领域树立了新标杆：DeepSee
赋能农业数字化转型用DeepSeek大模型开启智慧农业新纪元 jingwang-cs 人工智能人工智能后端
赋能农业数字化转型用DeepSeek大模型开启智慧农业新纪元当农业遇见DeepSeek大模型：从经验驱动到数据智能的跨越传统农业依赖“看天吃饭”，而「智慧农业」平台依托公司自主研发的农业大模型，深度融合DeepSeek前沿AI技术，构建“数据-模型-决策”全链路智能服务体系。通过深度学习历史种植数据、气象信息、土壤墒情等多维农业要素，平台可精准预测病虫害风险、产量波动及市场趋势，为农户提供科学种植
Transformer架构简略：DeepSeek 的底层基石 windwant 人工智能人工智能 transformer 架构
2017年，一篇名为《AttentionisAllYouNeed》的论文横空出世，提出了Transformer架构，彻底改变了自然语言处理（NLP）领域的格局。它不仅在各种NLP任务上取得了突破性进展，更成为了当今人工智能领域最具影响力的架构之一。一、从RNN到Transformer：突破瓶颈，开创先河在Transformer出现之前，循环神经网络（RNN）及其变体（如LSTM、GRU）是处理序列
Python 基本语法全解析：从安装到应用木觞清 7天熟练Python python 开发语言
Python是一种广泛使用的高级编程语言，因其简洁易懂的语法和强大的功能而受到开发者的喜爱。从数据分析到人工智能，Python都在各个领域占据着重要地位。如果你是编程新手，Python是一个非常适合入门的语言。本篇博客将带你从安装Python到理解其基础语法，再到实际应用中常见的内置函数、文件操作及第三方库的使用。1.Python安装与环境配置在开始编写Python程序之前，你首先需要在你的电脑上
大智能：大数据+大模型+大算力_大算力大数据大模型 AI学习不迷路大数据大模型人工智能语言模型 ai 产品经理算力
在近日举行的“2022中国人工智能产业年会”主论坛上，中国人工智能学会监事长、中国工程院院士蒋昌俊在报告中表示，人工智能的发展已经历了数十年的过程，大模型ChatGPT在今年春节前后突然出现，大家还没有来得及深度思考就已经“扑面而来”。蒋昌俊大智能的研究进展科学技术的研究约分为两大范式，一是牛顿力学奠定了理论计算的范式，二是开普勒开启数据的范式。之后经历了实验归纳、理论的逻辑推演，以及计算模拟、最
神经网络:人工智能的核心技术 m0_75126181 人工智能神经网络深度学习
神经网络简介神经网络是一种模仿生物神经系统的计算模型,由大量相互连接的神经元组成。它通过学习大量的数据来完成复杂的模式识别和决策任务,是当前人工智能和机器学习领域最重要的技术之一。神经网络的基本结构包括输入层、隐藏层和输出层。输入层接收外部数据,隐藏层对数据进行处理和特征提取,输出层产生最终结果。神经元之间通过带权重的连接相互作用,通过调整这些权重来实现学习过程。神经网络的工作原理神经网络的工作原
DeepSeek与ChatGPT：AI语言模型的全面对决与开发者洞察硅基打工人 AI 人工智能 chatgpt 语言模型媒体经验分享自然语言处理
大家好，我是硅基打工人呀！在2025年的人工智能领域，DeepSeek与ChatGPT两大语言模型的竞争成为全球开发者关注的焦点。本文将从技术架构、性能表现、应用场景及生态策略等维度，结合最新行业动态与用户实测数据，为开发者呈现这场技术对决的核心要点。一、技术架构对比：效率与规模的博弈DeepSeek的差异化设计混合专家（MoE）架构：通过动态激活部分参数（如R1模型每次仅调用370亿参数），显著
嵌入式仿真实验教学平台比Proteus更具有教学优势嵌入式仿真实验教学平台学习 proteus 嵌入式实时数据库 stm32 嵌入式硬件
近年来，随着物联网、人工智能等技术的快速发展，嵌入式系统教学的实践性和创新性需求日益增强。传统仿真工具如Proteus虽曾占据重要地位，但其局限性逐渐暴露。相比之下，嵌入式仿真实验教学平台凭借其高仿真度、资源整合能力及虚实结合的教学模式，正在成为高校和教育机构的新选择。本文将从技术演进、教学痛点、平台优势及实际应用等角度，解析嵌入式仿真实验教学平台为何能全面超越Proteus，成为教学创新的核心工
2024 年 AI 垂直应用迅速落地，人人都可以获得AI红利 yimifx AI AIGC 人工智能人工智能 ai AI写作 AIGC agi AI编程 AI作画
演示站点：https://ai.uaai.cn技能模块官方论坛：www.jingyuai.com京娱AI随着人工智能技术的持续发展与突破，2024年AI辅助研发正成为科技界和工业界瞩目的焦点。从医药研发到汽车设计，从软件开发到材料科学，AI正逐渐渗透到研发的各个环节，变革着传统的研发模式。在这一背景下，AI辅助研发不仅提升了研发效率，降低了成本，更在某种程度上解决了复杂问题，推动了科技进步。202
ai垂直领域和水平领域如何理解? 王摇摆 ChatGPT 人工智能
在AI领域中，"垂直领域"和"水平领域"是两个相关但不同的概念。垂直领域（VerticalDomain）：指的是在特定行业或领域中应用人工智能技术和解决方案的情况。在垂直领域中，AI技术被专门应用于解决该领域内的具体问题。例如，医疗保健、金融、零售、交通运输等都是垂直领域。在这些领域中，AI技术被用于医学诊断、风险评估、销售预测、智能交通管理等特定领域的应用。水平领域（HorizontalDoma
智能模型轻量化：知识蒸馏技术如何重塑AI部署格局人工智能
智能模型轻量化：知识蒸馏技术如何重塑AI部署格局前言在人工智能技术高速迭代的今天，模型优化领域正经历着静默的革命。当我们惊叹于DeepSeek在自然语言处理上的惊艳表现时，一个关键问题逐渐浮出水面：如何让这些"庞然大物"真正走入现实场景？知识蒸馏技术作为模型压缩领域的突破性方案，正在为AI技术的普惠化开辟新路径。一、技术本质的解构与重构知识蒸馏颠覆了传统模型训练的范式，构建了"师生传承"的新型学习
AI大模型之争：通用性与垂直性，哪个更具优势？想你依然心痛个人总结与成长规划人工智能
文章目录每日一句正能量前言背景介绍能力分析通用大模型的能力：垂直大模型的能力：差异与互补性分析：难点探究1.算力挑战2.数据挑战3.算法挑战4.泛化能力5.可解释性和透明度6.伦理和偏见问题7.成本效益后记每日一句正能量昨天已逝，明日是谜，面对今朝，尽力而为！前言在人工智能的快速发展浪潮中，AI大模型作为这一领域的明珠，正以其强大的数据处理能力和智能决策能力，引领着技术革新的潮流。随着技术的不断成
超市数字化落地：RWA + 智能体赋能实体零售数字化 leijiwen 零售
引言随着数字化技术的飞速发展，传统零售行业正在面临前所未有的挑战与机遇。在这个转型过程中，**现实世界资产（RWA）与智能体（AIAgents）**的结合为实体零售业带来了强大的赋能，特别是在超市领域。通过将现实资产数字化、引入人工智能技术以及去中心化治理，RWA和智能体为实体零售提供了全新的数字化解决方案，推动零售业向智能化、透明化和个性化方向发展。本文将详细探讨基于RWA与智能体结合的超市数字
通用大模型VS垂直大模型，你更青睐哪一方? 109702008 人工智能杂谈人工智能
AI大模型之辩：通用与垂直，谁将引领未来？在人工智能（AI）领域，大模型技术的崛起无疑为整个行业带来了革命性的变革。然而，随着技术的深入发展，AI大模型的战场似乎正在悄然分化，形成了通用大模型与垂直大模型两大阵营。两者各有千秋，各有其适用的场景和优势，那么在这场没有硝烟的战争中，究竟谁将引领未来呢？通用大模型，以其广泛的适用性和强大的学习能力，成为AI领域的明星产品。它能够在多个领域和场景下展现出
AI创业机遇：垂直领域无限可能 AGI大模型与大数据研究院 DeepSeek R1 &大数据AI人工智能 java python javascript kotlin golang 架构人工智能
AI创业垂直领域机器学习深度学习自然语言处理计算机视觉无人驾驶1.背景介绍人工智能（AI）正在各行各业掀起一场革命，为创业者带来了前所未有的机遇。垂直领域，即特定行业或细分市场，正在成为AI创业的热门选择。本文将深入探讨AI在垂直领域的应用，并提供实用的指南，帮助读者把握AI创业机遇。2.核心概念与联系2.1AI与垂直领域AI在垂直领域的应用，需要理解AI与垂直领域的关系。AI可以为垂直领域提供智
AI赋能校园安全：科技助力预防与应对校园霸凌 weixin_45819535 人工智能安全科技
校园本应是学生快乐学习、健康成长的地方，然而，校园霸凌却成为威胁学生身心健康的隐形“毒瘤”。近年来，随着人工智能（AI）技术的快速发展，AI在校园安全领域的应用逐渐成为解决校园霸凌问题的新突破口。通过智能监控、行为分析、情感识别等技术，AI为预防和应对校园霸凌提供了全新的解决方案。辉视AI智能安防系统作为行业领先的智能安防解决方案，正以其卓越的技术能力，为校园安全保驾护航。校园霸凌的现状与挑战校园
DeepSeek模型家族大揭秘：不同版本到底有啥区别？再见孙悟空_ 【2025 AI学习从零单排系列】【2025AI工具合集】DeepSeek DeepSeek V1 DeepSeek V2 DeepSeer R1
DeepSeek模型家族大揭秘：不同版本到底有啥区别？大家好！今天咱们来聊聊DeepSeek这个超火的AI模型家族。如果你对人工智能有点兴趣，肯定听说过DeepSeek，但你知道它其实有好几个版本吗？每个版本都有自己的特点和适用场景。今天我就带大家好好扒一扒这些版本的区别，帮你搞清楚哪个版本最适合你的需求。1.DeepSeek是什么？首先，简单介绍一下DeepSeek。DeepSeek是一个基于深
清华大学DeepSeek PPT第二版深度解读：人工智能前沿技术解析 qudongmofashi 人工智能
立即下载完整课件资料点击此处获取最新版PPT一、DeepSeek课件为何值得关注？清华大学出品的DeepSeek系列教学资源，长期聚焦人工智能领域核心技术。第二版PPT从以下方面实现全面升级：AI前沿技术覆盖：涵盖大模型、深度强化学习等领域最新研究进展工业级实践案例：新增多个企业级项目解决方案案例三维知识框架：从算法原理→代码实现→工程部署的全链路解析下载建议：建议保存至本地，结合源码案例同步学习
DeepSeek人工智能领域的创新先锋与变革力量 CodeJourney. 数据库算法人工智能
在科技飞速发展的时代，人工智能（AI）无疑是最具变革性的力量之一。DeepSeek作为人工智能领域的关键参与者，正以其独特的技术路径和创新理念，深刻影响着行业的发展格局。深入解读相关信息，能让我们更全面地认识DeepSeek在人工智能领域的重要贡献、技术优势、发展战略以及其带来的广泛影响。一、DeepSeek的技术突破与创新（一）核心技术成就DeepSeek在自然语言处理（NLP）和计算机视觉等人
Prompt工程指南：从入门到精通，手把手教你玩转AI大模型！ AI大模型-大飞 prompt 人工智能大模型教程 AI大模型开源 chatgpt 大模型
一、什么是Prompt？Prompt是一种基于人工智能（AI）指令的技术，通过明确而具体的指导语言模型的输出。在提示词工程中，Prompt的定义涵盖了任务、指令和角色三个主要元素，以确保模型生成符合用户需求的文本。任务：Prompt明确而简洁地陈述了用户要求模型生成的内容。这包括在特定应用场景中，用户希望模型完成的任务或生成的文本类型。指令：模型在生成文本时应遵循的指令是Prompt中的关键要素之
国内如何快速拿下微软AI-900!? 全球认证考试中心 microsoft 人工智能 ai
微软AI-900认证，全称AzureAIFundamentals是由微软官方最新研发的一项有关人工智能的认证证书。想要获得该证书，需通过AI-900测试或者AI-102。适用于全行业、全学龄人员，考试不设置专业和年龄限制，对人工智能感兴趣即可参加。获得证书能够证明证书持有者在机器学习（ML）、人工智能（AI）基础概念、云技术基础及MicrosoftAzure服务等多方面的掌握程度。此考试的考生应熟
深度学习代码分析——自用肆—— 深度学习人工智能笔记
代码来自：https://github.com/ChuHan89/WSSS-Tissue?tab=readme-ov-file借助了一些人工智能1_train_stage1.py代码功能总览该代码是弱监督语义分割（WSSS）流程的Stage1训练与测试脚本，核心任务是通过多标签分类模型生成图像级标签，为后续生成伪掩码（Pseudo-Masks）提供基础。代码分为train_phase和test_p
Python | Pytorch | Tensor知识点总结漂亮_大男孩 Python拾遗 python pytorch 深度学习人工智能
如是我闻：Tensor是我们接触Pytorch了解到的第一个概念，这里是一个关于PyTorchTensor主题的知识点总结，涵盖了Tensor的基本概念、创建方式、运算操作、梯度计算和GPU加速等内容。1.Tensor基本概念Tensor是PyTorch的核心数据结构，类似于NumPy的ndarray，但支持GPU加速和自动求导。PyTorch的Tensor具有动态计算图，可用于深度学习模型的前向
QKV 注意力机制在Transformer架构中的作用，和卷积在卷积神经网络中的地位，有哪些相似之处？安意诚Matrix 机器学习笔记 transformer cnn 深度学习
QKV注意力机制在Transformer架构中的作用，和卷积在卷积神经网络中的地位，有哪些相似之处？QKV（Query-Key-Value）注意力机制在Transformer架构和卷积在卷积神经网络（CNN）中都起着核心作用，它们有以下一些相似之处：特征提取QKV注意力机制：在Transformer中，QKV注意力机制通过Query与Key的计算来确定对不同位置Value的关注程度，从而自适应地提
Python 学习与开发：高效编程技巧与实用案例壹屋安源知识分享 python 学习开发语言
Python学习与开发：高效编程技巧与实用案例Python是现代编程语言中最受欢迎的一种，它以简洁、易读的语法和强大的功能广泛应用于数据分析、人工智能、Web开发等多个领域。无论你是Python新手还是有经验的开发者，掌握一些高效编程技巧和实用案例，能让你的Python开发之旅更加顺畅。1.高效的函数式编程使用列表推导式列表推导式是Python中非常常用的功能，它不仅可以让代码更加简洁，还能提高执
一文讲清楚自我学习和深度学习平凡而伟大(心之所向) 人工智能人工智能深度学习机器学习
自我学习（Self-Learning）和深度学习（DeepLearning）是两个不同的概念，但它们在某些应用场景中可以有交集。下面我们将分别介绍这两个概念，并探讨如何将它们结合起来用于自我学习系统。自我学习（Self-Learning）自我学习是指个体或系统通过自主探索、实践和反思来获取知识和技能的过程。它强调的是无需外部直接指导的学习方式，通常包括以下几个方面：自主性：学习者根据自己的兴趣、需
AI时代，程序员如何提升竞争力：技术与软技能双修炼源码姑娘人工智能
人工智能技术的迅猛发展正在重塑软件开发行业的格局。从代码生成工具（如GitHubCopilot）到智能调试系统，AI已从辅助工具逐步演变为开发流程中不可或缺的伙伴。然而，这种变革既是机遇也是挑战：程序员若想在这场技术浪潮中保持竞争力，必须实现技术与软技能的双重修炼。本文将从技术深耕、AI工具驾驭、跨学科融合及软技能提升四个维度，探讨程序员的核心竞争力构建路径。一、技术修炼：从工具使用者到领域专家1
AI大语言模型(LLM)：电商行业的搜索革命与未来趋势搞技术的妹子人工智能语言模型智能电视
大语言模型：电商行业的搜索革命与未来趋势一、大语言模型在电商搜索中的应用1.提升搜索精准度2.改善搜索召回率3.虚拟购物助手二、大语言模型与生成性AI的结合1.生成性AI：从搜索到对话式购物体验2.提升个性化推荐三、大语言模型的未来展望1.电商与LLM的深度融合2.面临的挑战与机遇随着人工智能的快速发展，电商行业正在经历一场深刻的变革。尤其是在搜索技术方面，大语言模型（LLM）正逐渐成为提升用户体
mac系统下安装pycharm 连小黑 python pycharm macos python
mac系统下安装pycharm前言Windows系统安装教程传送门链接:https://blog.csdn.net/lianxiaohei/article/details/121694126随着人工智能的不断发展，机器学习这门技术也越来越重要，也有很多人都因为做自动化，爬虫会学python，今天写的是pycharm编译器，在mac上如何安装,废话不多说，上步骤一、第一步下载示例：下载安装软件的第一
强大的销售团队背后竟然是大数据分析的身影蓝儿唯美数据分析
Mark Roberge是HubSpot的首席财务官，在招聘销售职位时使用了大量数据分析。但是科技并没有挤走直觉。大家都知道数理学家实际上已经渗透到了各行各业。这些热衷数据的人们通过处理数据理解商业流程的各个方面，以重组弱点，增强优势。 Mark Roberge是美国HubSpot公司的首席财务官，HubSpot公司在构架集客营销现象方面出过一份力——因此他也是一位数理学家。他使用数据分析
Haproxy+Keepalived高可用双机单活 bylijinnan 负载均衡 keepalived haproxy 高可用
我们的应用MyApp不支持集群，但要求双机单活（两台机器：master和slave）： 1.正常情况下，只有master启动MyApp并提供服务 2.当master发生故障时，slave自动启动本机的MyApp，同时虚拟IP漂移至slave，保持对外提供服务的IP和端口不变 F5据说也能满足上面的需求，但F5的通常用法都是双机双活，单活的话还没研究过服务器资源 10.7
eclipse编辑器中文乱码问题解决 0624chenhong eclipse乱码
使用Eclipse编辑文件经常出现中文乱码或者文件中有中文不能保存的问题，Eclipse提供了灵活的设置文件编码格式的选项，我们可以通过设置编码格式解决乱码问题。在Eclipse可以从几个层面设置编码格式：Workspace、Project、Content Type、File 本文以Eclipse 3.3（英文）为例加以说明： 1. 设置Workspace的编码格式： Windows-&g
基础篇--resources资源不懂事的小屁孩 android
最近一直在做java开发，偶尔敲点android代码，突然发现有些基础给忘记了，今天用半天时间温顾一下resources的资源。 String.xml 字符串资源涉及国际化问题 http://www.2cto.com/kf/201302/190394.html string-array
接上篇补上window平台自动上传证书文件的批处理问卷酷的飞上天空 window
@echo off : host=服务器证书域名或ip，需要和部署时服务器的域名或ip一致 ou=公司名称, o=公司名称 set host=localhost set ou=localhost set o=localhost set password=123456 set validity=3650 set salias=s
企业物联网大潮涌动：如何做好准备？蓝儿唯美企业
物联网的可能性也许是无限的。要找出架构师可以做好准备的领域然后利用日益连接的世界。尽管物联网（IoT）还很新，企业架构师现在也应该为一个连接更加紧密的未来做好计划，而不是跟上闸门被打开后的集成挑战。“问题不在于物联网正在进入哪些领域，而是哪些地方物联网没有在企业推进，” Gartner研究总监Mike Walker说。 Gartner预测到2020年物联网设备安装量将达260亿，这些设备在全
spring学习——数据库（mybatis持久化框架配置） a-john mybatis
Spring提供了一组数据访问框架，集成了多种数据访问技术。无论是JDBC，iBATIS(mybatis)还是Hibernate，Spring都能够帮助消除持久化代码中单调枯燥的数据访问逻辑。可以依赖Spring来处理底层的数据访问。 mybatis是一种Spring持久化框架，要使用mybatis，就要做好相应的配置： 1，配置数据源。有很多数据源可以选择，如：DBCP，JDBC，aliba
Java静态代理、动态代理实例 aijuans Java静态代理
采用Java代理模式，代理类通过调用委托类对象的方法，来提供特定的服务。委托类需要实现一个业务接口，代理类返回委托类的实例接口对象。按照代理类的创建时期，可以分为：静态代理和动态代理。所谓静态代理：　指程序员创建好代理类，编译时直接生成代理类的字节码文件。所谓动态代理：　在程序运行时，通过反射机制动态生成代理类。一、静态代理类实例： 1、Serivce.ja
Struts1与Struts2的12点区别 asia007 Struts1与Struts2
1) 在Action实现类方面的对比：Struts 1要求Action类继承一个抽象基类；Struts 1的一个具体问题是使用抽象类编程而不是接口。Struts 2 Action类可以实现一个Action接口，也可以实现其他接口，使可选和定制的服务成为可能。Struts 2提供一个ActionSupport基类去实现常用的接口。即使Action接口不是必须实现的，只有一个包含execute方法的P
初学者要多看看帮助文档不要用js来写Jquery的代码百合不是茶 jquery js
解析json数据的时候需要将解析的数据写到文本框中, 出现了用js来写Jquery代码的问题; 1, JQuery的赋值有问题代码如下: data.username 表示的是: 网易 $("#use
经理怎么和员工搞好关系和信任 bijian1013 团队项目管理管理
产品经理应该有坚实的专业基础，这里的基础包括产品方向和产品策略的把握，包括设计，也包括对技术的理解和见识，对运营和市场的敏感，以及良好的沟通和协作能力。换言之，既然是产品经理，整个产品的方方面面都应该能摸得出门道。这也不懂那也不懂，如何让人信服？如何让自己懂？就是不断学习，不仅仅从书本中，更从平时和各种角色的沟通
如何为rich:tree不同类型节点设置右键菜单 sunjing contextMenu tree Richfaces
组合使用target和targetSelector就可以啦，如下： <rich:tree id="ruleTree" value="#{treeAction.ruleTree}" var="node" nodeType="#{node.type}" selectionChangeListener=&qu
【Redis二】Redis2.8.17搭建主从复制环境 bit1129 redis
开始使用Redis2.8.17 Redis第一篇在Redis2.4.5上搭建主从复制环境，对它的主从复制的工作机制，真正的惊呆了。不知道Redis2.8.17的主从复制机制是怎样的，Redis到了2.4.5这个版本，主从复制还做成那样，Impossible is nothing! 本篇把主从复制环境再搭一遍看看效果，这次在Unbuntu上用官方支持的版本。 Ubuntu上安装Red
JSONObject转换JSON--将Date转换为指定格式白糖_ JSONObject
项目中，经常会用JSONObject插件将JavaBean或List<JavaBean>转换为JSON格式的字符串，而JavaBean的属性有时候会有java.util.Date这个类型的时间对象，这时JSONObject默认会将Date属性转换成这样的格式： {"nanos":0,"time":-27076233600000,
JavaScript语言精粹读书笔记 braveCS JavaScript
【经典用法】： //①定义新方法 Function .prototype.method=function(name, func){ this.prototype[name]=func; return this; } //②给Object增加一个create方法，这个方法创建一个使用原对
编程之美-找符合条件的整数用字符串来表示大整数避免溢出 bylijinnan 编程之美
import java.util.LinkedList; public class FindInteger { /** * 编程之美找符合条件的整数用字符串来表示大整数避免溢出 * 题目：任意给定一个正整数N，求一个最小的正整数M(M>1)，使得N*M的十进制表示形式里只含有1和0 * * 假设当前正在搜索由0，1组成的K位十进制数
读书笔记 chengxuyuancsdn 读书笔记
1、Struts访问资源 2、把静态参数传递给一个动作 3、<result>type属性 4、s:iterator、s:if c:forEach 5、StringBuilder和StringBuffer 6、spring配置拦截器 1、访问资源 (1)通过ServletActionContext对象和实现ServletContextAware,ServletReque
[通讯与电力]光网城市建设的一些问题 comsci 问题
信号防护的问题,前面已经说过了,这里要说光网交换机与市电保障的关系我们过去用的ADSL线路,因为是电话线,在小区和街道电力中断的情况下,只要在家里用笔记本电脑+蓄电池,连接ADSL,同样可以上网........
oracle 空间RESUMABLE daizj oracle 空间不足 RESUMABLE 错误挂起
空间RESUMABLE操作转 Oracle从9i开始引入这个功能，当出现空间不足等相关的错误时，Oracle可以不是马上返回错误信息，并回滚当前的操作，而是将操作挂起，直到挂起时间超过RESUMABLE TIMEOUT，或者空间不足的错误被解决。这一篇简单介绍空间RESUMABLE的例子。第一次碰到这个特性是在一次安装9i数据库的过程中，在利用D
重构第一次写的线程池 dieslrae 线程池 python
最近没有什么学习欲望,修改之前的线程池的计划一直搁置,这几天比较闲,还是做了一次重构,由之前的2个类拆分为现在的4个类. 1、首先是工作线程类:TaskThread,此类为一个工作线程,用于完成一个工作任务,提供等待(wait),继续(proceed),绑定任务(bindTask)等方法 #!/usr/bin/env python # -*- coding:utf8 -*-
C语言学习六指针 dcj3sjt126com c
初识指针，简单示例程序： /* 指针就是地址，地址就是指针地址就是内存单元的编号指针变量是存放地址的变量指针和指针变量是两个不同的概念但是要注意：通常我们叙述时会把指针变量简称为指针，实际它们含义并不一样 */ # include <stdio.h> int main(void) { int * p; // p是变量的名字， int *
yii2 beforeSave afterSave beforeDelete dcj3sjt126com delete
public function afterSave($insert, $changedAttributes) { parent::afterSave($insert, $changedAttributes); if($insert) { //这里是新增数据 } else { //这里是更新数据 } }
timertask shuizhaosi888 timertask
java.util.Timer timer = new java.util.Timer(true); // true 说明这个timer以daemon方式运行（优先级低， // 程序结束timer也自动结束），注意，javax.swing // 包中也有一个Timer类，如果import中用到swing包， // 要注意名字的冲突。 TimerTask task = new
Spring Security（13）——session管理 234390216 session Spring Security 攻击保护超时
session管理目录 1.1 检测session超时 1.2 concurrency-control 1.3 session 固定攻击保护
公司项目NODEJS实践0.3[ mongo / session ...] 逐行分析JS源代码 mongodb session nodejs
http://www.upopen.cn 一、前言书接上回，我们搭建了WEB服务端路由、模板等功能，完成了register 通过ajax与后端的通信，今天主要完成数据与mongodb的存取，实现注册 / 登录 /
pojo.vo.po.domain区别 LiaoJuncai java VO POJO javabean domain
　　POJO = "Plain Old Java Object"，是MartinFowler等发明的一个术语，用来表示普通的Java对象，不是JavaBean, EntityBean 或者 SessionBean。POJO不但当任何特殊的角色，也不实现任何特殊的Java框架的接口如，EJB， JDBC等等。　　　　即POJO是一个简单的普通的Java对象，它包含业务逻辑
Windows Error Code OhMyCC windows
0 操作成功完成. 1 功能错误. 2 系统找不到指定的文件. 3 系统找不到指定的路径. 4 系统无法打开文件. 5 拒绝访问. 6 句柄无效. 7 存储控制块被损坏. 8 存储空间不足, 无法处理此命令. 9 存储控制块地址无效. 10 环境错误. 11 试图加载格式错误的程序. 12 访问码无效. 13 数据无效. 14 存储器不足, 无法完成此操作. 15 系
在storm集群环境下发布Topology roadrunners 集群 storm topology spout bolt
storm的topology设计和开发就略过了。本章主要来说说如何在storm的集群环境中，通过storm的管理命令来发布和管理集群中的topology。 1、打包打包插件是使用maven提供的maven-shade-plugin，详细见maven-shade-plugin。 <plugin> <groupId>org.apache.maven.
为什么不允许代码里出现“魔数” tomcat_oracle java
　　在一个新项目中，我最先做的事情之一，就是建立使用诸如Checkstyle和Findbugs之类工具的准则。目的是制定一些代码规范，以及避免通过静态代码分析就能够检测到的bug。　　迟早会有人给出案例说这样太离谱了。其中的一个案例是Checkstyle的魔数检查。它会对任何没有定义常量就使用的数字字面量给出警告，除了-1、0、1和2。　　很多开发者在这个检查方面都有问题，这可以从结果
zoj 3511 Cake Robbery(线段树) 阿尔萨斯线段树
题目链接：zoj 3511 Cake Robbery 题目大意：就是有一个N边形的蛋糕，切M刀，从中挑选一块边数最多的，保证没有两条边重叠。解题思路：有多少个顶点即为有多少条边，所以直接按照切刀切掉点的个数排序，然后用线段树维护剩下的还有哪些点。 #include <cstdio> #include <cstring> #include <vector&

第二周 卷积神经网络