Flying Bulldog

攻克 Transformer && 评分函数（加性注意力、缩放点积注意力）

上篇博客链接直达：攻克 Transformer & 注意力机制的查询、键和值 & 有无参数的Nadaraya-Watson核回归

选择不同的注意⼒评分函数 a 会导致不同的注意⼒汇聚操作。在本文章中，我们将介绍两个流⾏的评分函数，稍后将⽤他们来实现更复杂的注意⼒机制。

目录

（1）评分函数概念

（2）加性注意力

a) 公式

b) 草稿理解

c) 完整代码

（3）缩放点积注意力

a) 公式

b) 草稿理解

c）完整代码

（4）掩蔽softmax操作

（5）总结

（1）评分函数概念

上一篇博客，我们使⽤⾼斯核来对查询和键之间的关系建模。

我们可以将高斯核指数部分视为注意⼒评分函数（attention scoring function），简称评分函数（scoring function），然后把这个函数的输出结果输⼊到 softmax 函数中进⾏运算。通过上述步骤，我们将得到与键对应的值的概率分布（即注意力权重）。最后，注意⼒汇聚的输出就是基于这些注意⼒权重的值的加权和。

从宏观来看，我们可以使⽤上述算法来实现图1 中的注意⼒机制框架。图1 说明了如何将注意⼒汇聚的输出计算成为值的加权和，其中 a 表示注意力评分函数。由于注意⼒权重是概率分布，因此加权和其本质上是加权平均值。

图1 计算注意力汇聚的输出为值的加权和

评分函数公式：

（2）加性注意力

a) 公式

b) 草稿理解

注意：h是隐藏单元数

c) 完整代码

建议：自己调试，观看各个阶段的 Q, K, V 张量的尺寸大小的变化。

import matplotlib.pyplot as plt
import torch
from torch import nn
from d2l import torch as d2l


def masked_softmax(X, valid_lens):
    """通过在最后一个轴上掩蔽元素来执行softmax操作"""
    # X:3D张量，valid_lens:1D或2D张量
    if valid_lens is None:
        return nn.functional.softmax(X, dim=-1)
    else:
        shape = X.shape
        if valid_lens.dim() == 1:
            valid_lens = torch.repeat_interleave(valid_lens, shape[1])
        else:
            valid_lens = valid_lens.reshape(-1)
        # 最后一轴上被掩蔽的元素使用一个非常大的负值替换，从而其softmax输出为0
        X = d2l.sequence_mask(X.reshape(-1, shape[-1]), valid_lens, value=-1e6)
        return nn.functional.softmax(X.reshape(shape), dim=-1)


# 指定每个矩阵的有效长度
out_mask_1 = masked_softmax(torch.rand(2, 2, 4), torch.tensor([2, 3]))
# 使用二维张量，为矩阵样本中的每一行指定有效长度。
out_mask_2 = masked_softmax(torch.rand(2, 2, 4), torch.tensor([[1, 3], [2, 4]]))
print("*************************mask_softmax*********************")
print(out_mask_1)
print(out_mask_2)


# 2、20、8、0.1
class AdditiveAttention(nn.Module):
    """加性注意力"""
    def __init__(self, key_size, query_size, num_hiddens, dropout, **kwargs):
        super(AdditiveAttention, self).__init__(**kwargs)
        self.W_k = nn.Linear(key_size, num_hiddens, bias=False)  # [2, 8]
        self.W_q = nn.Linear(query_size, num_hiddens, bias=False)  # [20, 8]
        self.w_v = nn.Linear(num_hiddens, 1, bias=False)  # [8, 1]
        self.dropout = nn.Dropout(dropout)  # 0.1 # 随机将10%的元素置为0

    # torch.normal(0, 1, (2, 1, 20)), torch.ones((2, 10, 2)), torch.Size([2, 10, 4]), torch.tensor([2, 6])
    def forward(self, queries, keys, values, valid_lens):
        queries, keys = self.W_q(queries), self.W_k(keys)  # [2, 1, 8], [2, 10, 8]

        # 在维度扩展后，
        # queries的形状：(batch_size，查询的个数，1，num_hidden)
        # key的形状：(batch_size，1，“键－值”对的个数，num_hiddens)
        # 使用广播方式进行求和
        features = queries.unsqueeze(2) + keys.unsqueeze(1)

        # print(queries.unsqueeze(2), keys.unsqueeze(1))  # [2, 1, 1, 8], [2, 1, 10, 8]
        # print(features)  # [2, 1, 10, 8]
        features = torch.tanh(features)

        # self.w_v仅有一个输出，因此从形状中移除最后那个维度。
        # scores的形状：(batch_size，查询的个数，“键-值”对的个数)
        scores = self.w_v(features).squeeze(-1)  # [2, 1, 10, 8]*[8, 1]=[2, 1, 10, 1]>>>[2, 1, 10]

        # 第一个矩阵的每一行保留有效长度为2
        # 第二个矩阵的每一行保留有效长度为6
        self.attention_weights = masked_softmax(scores, valid_lens)  # [2, 1, 10]
        print("*************************self.attention_weights*********************")
        print(self.attention_weights)

        # values的形状：(batch_size，“键－值”对的个数，值的维度)
        output = torch.bmm(self.dropout(self.attention_weights), values)  # [2, 1, 4]

        return output


queries, keys = torch.normal(0, 1, (2, 1, 20)), torch.ones((2, 10, 2))
# values的小批量，两个值矩阵是相同的
values = torch.arange(40, dtype=torch.float32).reshape(1, 10, 4).repeat(2, 1, 1)  # [2, 10, 4]

# 定义序列的有效长度
valid_lens = torch.tensor([2, 6])

attention = AdditiveAttention(key_size=2, query_size=20, num_hiddens=8, dropout=0.1)
attention.eval()
print("*************************Q,K,V*********************")
print(queries.size(), keys.size(), values.size())
output = attention(queries, keys, values, valid_lens)
print("*************************output*********************")
print(output.size())
print(output)

# 显示注意力权重特征图
d2l.show_heatmaps(attention.attention_weights.reshape((1, 1, 2, 10)),
                  xlabel='Keys', ylabel='Queries')
plt.show()

（3）缩放点积注意力

a) 公式

b) 草稿理解

c）完整代码

建议：自己调试，观看各个阶段的 Q, K, V 张量的尺寸大小的变化。

import math

import matplotlib.pyplot as plt
import torch
from torch import nn
from d2l import torch as d2l


def masked_softmax(X, valid_lens):
    """通过在最后一个轴上掩蔽元素来执行 softmax 操作"""
    # X:3D张量，valid_lens:1D或2D张量
    if valid_lens is None:
        return nn.functional.softmax(X, dim=-1)
    else:
        shape = X.shape
        if valid_lens.dim() == 1:
            valid_lens = torch.repeat_interleave(valid_lens, shape[1])
        else:
            valid_lens = valid_lens.reshape(-1)
        # 最后一轴上被掩蔽的元素使用一个非常大的负值替换，从而其softmax输出为0
        X = d2l.sequence_mask(X.reshape(-1, shape[-1]), valid_lens, value=-1e6)
        return nn.functional.softmax(X.reshape(shape), dim=-1)


class DotProductAttention(nn.Module):
    """缩放点积注意力"""
    def __init__(self, dropout, **kwargs):
        super(DotProductAttention, self).__init__(**kwargs)
        self.dropout = nn.Dropout(dropout)

    # queries的形状：(batch_size，查询的个数，d)
    # keys的形状：(batch_size，“键－值”对的个数，d)
    # values的形状：(batch_size，“键－值”对的个数，值的维度)
    # valid_lens的形状:(batch_size，)或者(batch_size，查询的个数)
    def forward(self, queries, keys, values, valid_lens=None):
        d = queries.shape[-1]
        # 设置transpose_b=True为了交换keys的最后两个维度
        scores = torch.bmm(queries, keys.transpose(1, 2)) / math.sqrt(d)  # [2, 1, 10]
        self.attention_weights = masked_softmax(scores, valid_lens)
        return torch.bmm(self.dropout(self.attention_weights), values)  # [2, 1, 4]


queries, keys = torch.normal(0, 1, (2, 1, 2)), torch.ones((2, 10, 2))
# print(keys.transpose(1, 2))  # 转置 [2, 2, 10]

# values的小批量，两个值矩阵是相同的
values = torch.arange(40, dtype=torch.float32).reshape(1, 10, 4).repeat(2, 1, 1)  # [2, 10, 4]
valid_lens = torch.tensor([2, 6])

attention = DotProductAttention(dropout=0.5)
attention.eval()
output = attention(queries, keys, values, valid_lens)
print("*************************output*********************")
print(output.size())
print(output)

# 显示注意力权重特征图
d2l.show_heatmaps(attention.attention_weights.reshape((1, 1, 2, 10)),
                  xlabel='Keys', ylabel='Queries')
plt.show()

（4）掩蔽softmax操作

softmax操作⽤于输出⼀个概率分布作为注意⼒权重。在某些情况下，并⾮所有的值都应该被纳⼊到注意⼒汇聚中。某些⽂本序列被填充了没有意义的特殊词元，为了仅将有意义的词元作为值来获取注意⼒汇聚，我们可以指定⼀个有效序列⻓度（即词元的个数），以便在计算softmax时过滤掉超出指定范围的位置。通过这种⽅式，我们可以在下⾯的 masked_softmax 函数中实现这样的掩蔽softmax操作（masked softmax operation），其中任何超出有效⻓度的位置都被掩蔽置为0。

import matplotlib.pyplot as plt
import torch
from torch import nn
from d2l import torch as d2l


def masked_softmax(X, valid_lens):
    """通过在最后一个轴上掩蔽元素来执行softmax操作"""
    # X:3D张量，valid_lens:1D或2D张量
    if valid_lens is None:
        return nn.functional.softmax(X, dim=-1)
    else:
        shape = X.shape
        if valid_lens.dim() == 1:
            valid_lens = torch.repeat_interleave(valid_lens, shape[1])
        else:
            valid_lens = valid_lens.reshape(-1)
        # 最后一轴上被掩蔽的元素使用一个非常大的负值替换，从而其softmax输出为0
        X = d2l.sequence_mask(X.reshape(-1, shape[-1]), valid_lens, value=-1e6)
        return nn.functional.softmax(X.reshape(shape), dim=-1)


# 指定每个矩阵的有效长度
out_mask_1 = masked_softmax(torch.rand(2, 2, 4), torch.tensor([2, 3]))
# 使用二维张量，为矩阵样本中的每一行指定有效长度。
out_mask_2 = masked_softmax(torch.rand(2, 2, 4), torch.tensor([[1, 3], [2, 4]]))
print("*************************mask_softmax*********************")
print(out_mask_1)
print(out_mask_2)

>>>output

*************************mask_softmax*********************

tensor([[[0.5607, 0.4393, 0.0000, 0.0000], # L=2
[0.6431, 0.3569, 0.0000, 0.0000]], # L=2

[[0.4818, 0.2435, 0.2747, 0.0000], # L=3
[0.2330, 0.2912, 0.4758, 0.0000]]]) #L=3

tensor([[[1.0000, 0.0000, 0.0000, 0.0000], # L=1
[0.3486, 0.4044, 0.2470, 0.0000]], # L=3

[[0.6019, 0.3981, 0.0000, 0.0000], # L=2
[0.2037, 0.1969, 0.2232, 0.3763]]]) # L=4

可以指定矩阵的有效长度，也可以指定每一行的有效长度

（5）总结

将注意⼒汇聚的输出计算可以作为值的加权平均，选择不同的注意⼒评分函数会带来不同的注意⼒汇聚操作。
当查询和键是不同长度的⽮量时，可以使⽤可加性注意⼒评分函数。当它们的长度相同时，使⽤缩放的 “点－积”注意⼒评分函数的计算效率更⾼。

未完待续。。。

>>>如有疑问，欢迎评论区一起探讨

你可能感兴趣的:(变形金刚,Transformer,transformer,深度学习,人工智能,python,神经网络)

Python学习总结学学睡觉 python 学习开发语言
客户端与服务端聊天窗口服务端导入wxPython用于创建图形界面。socket用于网络通信，AF_INET是IPv4地址族，SOCK_STREAM表示流式套接字（TCP）。利用wxPython创建图形界面，并通过socket与服务器通信。主要功能：连接服务器。发送和接收消息。断开连接。界面上有文本框和按钮来操作。wxPython处理UI部分，socket处理网络通信。importthreading
【模块】Non-local Neural dearr__ 扒网络模块深度学习 pytorch python
论文《Non-localNeuralNetworks》作用非局部神经网络通过非局部操作捕获长距离依赖，这对于深度神经网络来说至关重要。这些操作允许模型在空间、时间或时空中的任何位置间直接计算相互作用，从而捕获长距离的交互和依赖关系。这种方法对于视频分类、对象检测/分割以及姿态估计等任务表现出了显著的改进。机制非局部操作通过在输入特征图的所有位置上计算响应的加权和来实现，其中权重由位置之间的关系（如
Python解决安装包报错4.0.0-unsupported zhou_x_b python 开发语言
1、安装open3d一直报错，提示pip没有最新2、更新pip报错4.0.0-unsupported解决思路：pip含多个（wherepip命令可以在cmd中查看pip的位置），卸载pippipuninstallpip根据提示如果有多个都卸载了在安装pip命令：easy_installpip关掉软件在打开（否则没用）如果通过pycharm设置安装包，得选择python安装路径对应的pip
使用arxiv提供的API爬取文章信息 ye6 爬虫 python
大致阅读了一下arxiv提供的文档，里面4.1.SimpleExamples部分提供了4种语言的API请求样例。我的需求是使用Python，所以直接复制粘贴了。网址：https://arxiv.org/help/api/user-manualimporturlliburl='http://export.arxiv.org/api/query?search_query=all:electron&st
【华为OD机试真题E卷】 27、计算最大乘积 | 机试真题+思路参考+代码解析（C++、Java、Py） KFickle Java Py）华为od c++java 华为OD机试真题计算最大乘积
文章目录一、题目题目描述输入输出样例1二、代码与思路参考C++代码Java代码Python代码订阅本专栏后即可解锁在线OJ刷题权限个人博客首页：KFickle专栏介绍：最新的华为OD机试真题D、E卷，每题都使用C++，Java，Python语言进行解答，每个题目的思路分析都非常详细，持续更新，支持在线OJ刷题，订阅后评论获取权限，有代码问题随时解答，代码仅供学习参考一、题目题目描述给定一个元素类型
python爬取arXiv论文元数据小孔不爱coding python 开发语言网络爬虫
需要相关学科、主题的论文元数据做一些分析，arXiv开源，容易获取。显示选择了考虑用arXiv的api去实现，相关手册见arXiv-api但貌似每次我都被卡在3000条数据就停止了，所以我选择用传统的lxml，bs4直接爬取，但仍然被限制爬取10000条。直接上完整代码，后面解释fromlxmlimporthtmlimportrequestsimportreimportmathimportcsvf
基于yolov10的水果成熟度之石榴成熟度检测 qq1309399183 计算机视觉实战项目集合 YOLO 目标检测目标跟踪计算机视觉人工智能水果成熟度检测视觉检测
石榴成熟度检测**Pomegranate*是一个基于深度学习的系统，旨在自动化检测和分类石榴果实的生长阶段（未成熟、成熟、成熟期）。该系统采用最新的YOLOv10目标检测模型，能够高效地分析图像或视频中的石榴果实，并根据其外观特征识别其生长阶段。通过这种技术，农民可以更好地监控石榴果实的发育过程，优化作物管理，合理安排收获时间，从而提高生产效率和经济收益。系统概述石榴作为一种重要的水果作物，广泛种
如何用Python 3调用ArXiv API查询ArXiv论文元数据诸神缄默不语编程学习笔记 python 开发语言 ArXiv API XML urllib
诸神缄默不语-个人CSDN博文目录ArXivAPI文档：arXivAPIAccess-arXivinfoarXivAPIBasics-arXivinfoarXivAPIUser’sManual-arXivinfo文章目录1.调包2.获取数据1.简单入门2.XML返回值示例3.添加分类信息，获取最新论文4.ArXiv查询入参详解3.解析XML数据1.调包importurllibfromurllib.
【折线图 Line】——5 花花 Show Python pyecharts—从0到精通信息可视化数据分析 python
解锁数据可视化的魔法钥匙——pyecharts实战指南在这个数据为王的时代，每一次点击、每一次交易、每一份报告背后都隐藏着无尽的故事与洞察。但你是否曾苦恼于如何将这些冰冷的数据转化为直观、吸引人的视觉盛宴？欢迎来到《pyecharts图形绘制大师班》在这里，你将不再受限于单调的表格和图表，而是学会如何运用pyecharts这一强大的Python数据可视化库，将复杂的数据转化为令人惊叹的交互式图形。
Python语法糖教程第2天—Python装饰器深度解析与高阶应用指南 Bruce_xiaowei 编程笔记总结经验 python 开发语言
Python语法糖教程第2天—Python装饰器深度解析与高阶应用指南一、装饰器本质揭秘1.1装饰器的运行时序defdecorator(func):print("装饰器初始化阶段")defwrapper(*args,**kwargs):print("函数执行前操作")result=func(*args,**kwargs)print("函数执行后操作")returnresultreturnwrapp
疯狂python_疯狂 python weixin_39646970 疯狂python
书籍：python游戏编码CodingGamesinPython-2018简介初学者和有经验的程序员可以使用Python来构建和玩电脑游戏，从令人惊叹的脑筋急转弯到具有爆炸性声音效果和3D图形的疯狂动作游戏。Python中CodingGames的每一章都展示了如何用简单的编号步骤构建一个完整的工作游戏。本书讲授如何使用免费的资源，如PyGameZero和Ble...文章python人工智能命理20
力扣1631最小体力消耗路径——python Leosaf 力扣 python leetcode
我们先理解一下题目，他要求我们返回的是最小的体力消耗，这里的体力消耗于高度差的绝对值有关，越小越省体力，我们我们最后需要把所有的内容全部都连接一起。我们可以尝试用暴力方法求解。我们依次遍历上下左右，每条路都求完，然后返回出最大的绝对值之差。heights=[]r,c=len(heights),len(heights[0])ifr==1andc==1:return0#如果只有一个格子直接返回0dp=
yolov5-训练好的模型部署的几种方式-ONNX 黄晓魚 halcon3d PCL点云处理深度神经网络 YOLO C#python
ONNX，即OpenNeuralNetworkExchange，是微软和Facebook发布的一个深度学习开发工具生态系统，旨在让AI开发人员能够随着项目发展而选择正确的工具。ONNX所针对的是深度学习开发生态中最关键的问题之一，在任意一个框架上训练的神经网络模型，无法直接在另一个框架上用。开发者需要耗费大量时间精力把模型从一个开发平台移植到另一个。因此，如何实现不同框架之间的互操作性，简化从研究
【人工智能】数据挖掘与应用题库（101-200）奋力向前123 人工智能人工智能数据挖掘
1、有矩阵A3×2，B2×3，C3×3，下列运算有意义的是（）答案：BC2、13524的逆序数为（）答案：33、矩阵A中元素a14的余子式记作M14，代数余子式记作A14，二者关系为（）答案：相反4、关于机器学习与深度学习的范畴关系，下列说法正确的是？答案：深度学习是机器学习的子集（分支）5、关于机器学习的本质，下列表述最恰当的是？答案：从数据或环境反馈中自主学习到规则6、深度学习的“深度”是指？
【人工智能】数据挖掘与应用题库（301-400）奋力向前123 人工智能人工智能数据挖掘 pandas
1、关于pandas中的Series描述错误的是答案：Series默认没有index2、关于DataFrame描述正确的是答案：DataFrame指数据框，相当于程序中的虚拟Excel表格创建DataFrame后，可以重新指定indexDataFrame允许有缺失值3、在DataFrame中，可以获取某一列的值，也可以获取某一行的值。答案:对4、对于数据框book_info，以下用法有误的是答案：
【人工智能】数据挖掘与应用题库（1-100）奋力向前123 人工智能人工智能算法
1、涉及变化快慢的问题可以考虑使用导数来分析。答案:对2、导数的几何意义是曲线在某点处切线的斜率。答案:对3、函数在某点的左导数存在，则导数就存在。答案:错4、关于梯度下降算法，下列说法错误的是（）错误:梯度下降算法能找到函数精确的最小值。5、正弦函数的导数是余弦函数。答案：对6、[u(x)×v(x)]'=u(x)'×v(x)'答案：错7、链式法则的步骤可以概况为：分解、各自求导、相乘、回代。答案
全方位解析：大语言模型评测方法的综合指南大模型玩家语言模型人工智能自然语言处理深度学习 agi 大模型搜索引擎
自2017年Transformer模型提出以来，自然语言处理研究逐步转向基于该框架的预训练模型，如BERT、GPT、BART和T5等。这些预训练模型与下游任务适配后，持续刷新最优结果。然而，现有评测方法存在广度和深度不足、数据偏差、忽视模型其他能力或属性评估等问题。因此，需要全面评测和深入研究模型的各项能力、属性、应用局限性、潜在风险及其可控性等。本文回顾了自然语言处理中的评测基准与指标，将大语言
python中的“＠”与“＊”运算符汤姆_布利柏 python numpy
1、@运算符@运算符是对矩阵进行矩阵乘法（即数学上的矩阵相乘）来用的。1.1、二维方阵生成二维矩阵a和b：importnumpyasnpa=np.arange(1,10).reshape(3,3)print(a)print(a.shape)print(type(a))print(a.dtype)[[123][456][789]](3,3)int32b=np.array(np.arange(0,9)
Ubuntu+GPU+python编程环境 liwenkaitop 工程实践总结 linux python anaconda tensorflow
本文安装之前，参考了如下链接的大体思路：https://blog.csdn.net/rogerchen1983/article/details/90272877不过中间还是遇到一些小问题，花了点时间都解决掉了。(1)Ubuntu系统这次安装Ubuntu的时候，最新版本是20.04，当然要安装最新的了，不过由于要对双系统作出分区安排，还是花了一些时间整理windows下的资料，腾出干净的空间出来。然
python中@运算符和*运算符在矩阵乘法中的区别与作用 zeeq_ python 矩阵 python 线性代数
我们在看python程序时，经常可以看到@运算符和*运算符，其中@运算符在传统python中通常是作为装饰器使用的。但是在Python3.5之后，它又具备了矩阵乘法运算的功能。下面使用示例来对比这两个运算符对矩阵运算的影响：导入用到numpy包：importnumpyasnp 创建一个维度为2×3×3的数组a，结果如下图所示：a=np.arange(1,10).reshape(
大语言模型原理与工程实践：手把手教你训练 7B 大语言模型自动化训练框架 AI天才研究院 AI大模型企业级应用开发实战 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大语言模型原理与工程实践：手把手教你训练7B大语言模型自动化训练框架关键词：大语言模型、7B模型、自动化训练、深度学习、神经网络、自然语言处理、分布式计算文章目录大语言模型原理与工程实践：手把手教你训练7B大语言模型自动化训练框架1.背景介绍2.核心概念与联系3.核心算法原理&具体操作步骤3.1算法原理概述3.2算法步骤详解3.3算法优缺点3.4算法应用领域4.数学模型和公式&详细讲解&举例说明4
python-个人笔记尘叶风凌个人笔记 python
入门python运行Python简单教程Python综述python是什么Python是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。Python的设计具有很强的可读性，相比其他语言经常使用英文关键字，其他语言的一些标点符号，它具有比其他语言更有特色语法结构。Python是一种解释型语言：这意味着开发过程中没有了编译这个环节。类似于PHP和Perl语言。Python是交互式语
Java基于SpringBoot的校园心声墙小程序（附源码，文档） stormjun 小程序毕业设计 java spring boot 小程序校园心声墙小程序
基于SpringBoot的校园心声墙小程序博主介绍：✌stormjun、8年大厂程序员经历。全网粉丝15w+、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌文末获取源码联系精彩专栏推荐订阅不然下次找不到哟Java项目精品实战案例《100套》Java微信小程序项目实战《100套》Python项目实战《100套》感兴趣的可以先收藏起来，还有大家
小白学Python：Numpy（二）洲洲的笔记小白学Python python numpy 数据分析
目录引言数组的基本数学运算数组变换总结引言NumPy库是Python中用于科学计算的核心库。它提供了一个高性能多维数组对象，以及使用和处理这些数组的工具。Numpy是每一位学习python的小伙伴的必修课，因为它真的真的太实用了。举几个例子：我们在线性代数中学习的向量就是一维数组，矩阵就是二维数组，而Numpy就是专业来处理数组的，因此我们可以使用Numpy进行向量和矩阵的运算。图片本质上都可以用
python+flask计算机毕业设计基于Web的空巢老人服务系统的设计与实现（程序+开题+论文） node.js毕设小健 python flask 课程设计
本系统（程序+源码+数据库+调试部署+开发环境）带论文文档1万字以上，文末可获取，系统界面在最后面。系统程序文件列表开题报告内容研究背景随着社会的快速发展和人口老龄化的加剧，空巢老人群体日益庞大，成为社会关注的重点。空巢老人指的是子女离家后独自生活的老年人，他们面临着生活孤独、信息闭塞、健康管理不便等多重挑战。在传统家庭养老功能逐渐弱化的背景下，如何利用现代信息技术，特别是互联网技术，为空巢老人提
Transformer 代码剖析1 - 数据处理（pytorch实现） lczdyx Transformer代码剖析人工智能 transformer 深度学习 pytorch python
引言Transformer架构自《AttentionIsAllYouNeed》论文发表以来，在自然语言处理领域引起了巨大的变革。它摒弃了传统的循环结构，完全基于注意力机制，显著提高了处理序列数据的效率和性能。本文将通过对一个具体的项目代码结构进行详细分析，带领大家深入了解Transformer模型的数据处理部分。项目结构概述首先，让我们来看看项目的整体结构：（参考项目代码）transformer-
BERT模型深入理解——自然语言处理的里程碑 cufewxy2018 自然语言处理 bert 人工智能
1BERT的诞生背景2018年谷歌团队发布了BERT（BidirectionalEncoderRepresentationsfromTransformers）模型，在自然语言处理领域引领了技术性的革命。BERT创新性地使用预训练+微调模式，先用预训练在大量无标注的语料中进行自监督学习，学习到语言的通用规律，然后在少量有标注的数据中进行有监督学习，适配更精细化的任务。这种模式一直影响到最新的大模型结
RuntimeError: Couldn‘t load custom C++ ops.This can happen if your PyTorch and torchvision versions 万年枝常见运行错误服务器使用 pytorch 开发语言 torch版本错误
文章目录出现问题问题分析问题解决出现问题File"/home/anaconda3/envs/tris/lib/python3.8/site-packages/torchvision/ops/boxes.py",line40,innms_assert_has_ops()File"/home/anaconda3/envs/tris/lib/python3.8/site-packages/torchvi
from PIL import Image ModuleNotFoundError: No module named ‘PIL‘ 万年枝服务器使用 linux 常见运行错误 python linux 前端
问题报错：Traceback(mostrecentcalllast):File"examples/inference_demo.py",line10,infromPILimportImageModuleNotFoundError:Nomodulenamed'PIL'已知环境为python=3.7.16，Pillow=9.0.1；问题解决：使用命令pipinstallpillow--upgradeI
怎样通过人机融合智能去除“机器幻觉”？人机与认知实验室
人机融合智能的目标是通过深度结合人类智能和机器智能，解决现有人工智能系统（特别是深度学习模型，如各种大模型）可能出现的问题，比如“机器幻觉”现象。机器幻觉指的是人工智能模型在处理信息时，做出错误的、非理性的判断或预测，这种现象往往源于模型在训练数据中的偏差、不完全信息或过度依赖某些特定模式。通过人机融合的方式，可以有效减少这种“幻觉”，进而提升人机环境系统智能的可靠性和解释能力。1.结合人类的直觉
java责任链模式 3213213333332132 java 责任链模式村民告县长
责任链模式，通常就是一个请求从最低级开始往上层层的请求，当在某一层满足条件时，请求将被处理，当请求到最高层仍未满足时，则请求不会被处理。就是一个请求在这个链条的责任范围内，会被相应的处理，如果超出链条的责任范围外，请求不会被相应的处理。下面代码模拟这样的效果：创建一个政府抽象类,方便所有的具体政府部门继承它。 package 责任链模式; /** *
linux、mysql、nginx、tomcat 性能参数优化 ronin47
一、linux 系统内核参数 /etc/sysctl.conf文件常用参数 net.core.netdev_max_backlog = 32768 #允许送到队列的数据包的最大数目 net.core.rmem_max = 8388608 #SOCKET读缓存区大小 net.core.wmem_max = 8388608 #SOCKET写缓存区大
php命令行界面 dcj3sjt126com PHP cli
常用选项 php -v php -i PHP安装的有关信息 php -h 访问帮助文件 php -m 列出编译到当前PHP安装的所有模块执行一段代码 php -r 'echo "hello, world!";' php -r 'echo "Hello, World!\n";' php -r '$ts = filemtime("
Filter&Session 171815164 session
Filter HttpServletRequest requ = (HttpServletRequest) req; HttpSession session = requ.getSession(); if (session.getAttribute("admin") == null) { PrintWriter out = res.ge
连接池与Spring,Hibernate结合 g21121 Hibernate
前几篇关于Java连接池的介绍都是基于Java应用的，而我们常用的场景是与Spring和ORM框架结合，下面就利用实例学习一下这方面的配置。 1.下载相关内容： &nb
[简单]mybatis判断数字类型 53873039oycg mybatis
昨天同事反馈mybatis保存不了int类型的属性,一直报错，错误信息如下: Caused by: java.lang.NumberFormatException: For input string: "null" at sun.mis
项目启动时或者启动后ava.lang.OutOfMemoryError: PermGen space 程序员是怎么炼成的 eclipse jvm tomcat catalina.sh eclipse.ini
在启动比较大的项目时，因为存在大量的jsp页面，所以在编译的时候会生成很多的.class文件，.class文件是都会被加载到jvm的方法区中，如果要加载的class文件很多，就会出现方法区溢出异常 java.lang.OutOfMemoryError: PermGen space. 解决办法是点击eclipse里的tomcat，在
我的crm小结 aijuans crm
各种原因吧，crm今天才完了。主要是接触了几个新技术： Struts2、poi、ibatis这几个都是以前的项目中用过的。 Jsf、tapestry是这次新接触的，都是界面层的框架，用起来也不难。思路和struts不太一样，传说比较简单方便。不过个人感觉还是struts用着顺手啊，当然springmvc也很顺手，不知道是因为习惯还是什么。jsf和tapestry应用的时候需要知道他们的标签、主
spring里配置使用hibernate的二级缓存几步 antonyup_2006 java spring Hibernate xml cache
．在spring的配置文件中 applicationContent.xml，hibernate部分加入 xml 代码 <prop key="hibernate.cache.provider_class">org.hibernate.cache.EhCacheProvider</prop> <prop key="hi
JAVA基础面试题百合不是茶抽象实现接口 String类接口继承抽象类继承实体类自定义异常
/* * 栈（stack）：主要保存基本类型（或者叫内置类型）（char、byte、short、 *int、long、 float、double、boolean）和对象的引用，数据可以共享，速度仅次于 * 寄存器（register），快于堆。堆（heap）：用于存储对象。 */ &
让sqlmap文件 "继承" 起来 bijian1013 java ibatis sqlmap
多个项目中使用ibatis , 和数据库表对应的 sqlmap文件（增删改查等基本语句)，dao, pojo 都是由工具自动生成的, 现在将这些自动生成的文件放在一个单独的工程中，其它项目工程中通过jar包来引用，并通过"继承"为基础的sqlmap文件，dao,pojo 添加新的方法来满足项
精通Oracle10编程SQL(13)开发触发器 bijian1013 oracle 数据库 plsql
/* *开发触发器 */ --得到日期是周几 select to_char(sysdate+4,'DY','nls_date_language=AMERICAN') from dual; select to_char(sysdate,'DY','nls_date_language=AMERICAN') from dual; --建立BEFORE语句触发器 CREATE O
【EhCache三】EhCache查询 bit1129 ehcache
本文介绍EhCache查询缓存中数据，EhCache提供了类似Hibernate的查询API，可以按照给定的条件进行查询。要对EhCache进行查询，需要在ehcache.xml中设定要查询的属性数据准备 @Before public void setUp() { //加载EhCache配置文件 Inpu
CXF框架入门实例白糖_ spring Web 框架 webservice servlet
CXF是apache旗下的开源框架，由Celtix + XFire这两门经典的框架合成，是一套非常流行的web service框架。它提供了JAX-WS的全面支持，并且可以根据实际项目的需要，采用代码优先（Code First）或者 WSDL 优先（WSDL First）来轻松地实现 Web Services 的发布和使用，同时它能与spring进行完美结合。在apache cxf官网提供
angular.equals boyitech AngularJS AngularJS API AnguarJS 中文API angular.equals
angular.equals 描述: 比较两个值或者两个对象是不是相等。还支持值的类型，正则表达式和数组的比较。两个值或对象被认为是相等的前提条件是以下的情况至少能满足一项：两个值或者对象能通过=== （恒等）的比较两个值或者对象是同样类型，并且他们的属性都能通过angular
java-腾讯暑期实习生-输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A[0]*A[1]*...*A[i-1]*A[i+1] bylijinnan java
这道题的具体思路请参看何海涛的微博：http://weibo.com/zhedahht import java.math.BigInteger; import java.util.Arrays; public class CreateBFromATencent { /** * 题目：输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A
FastDFS 的安装和配置修订版 Chen.H linux fastDFS 分布式文件系统
FastDFS Home:http://code.google.com/p/fastdfs/ 1. 安装 http://code.google.com/p/fastdfs/wiki/Setup http://hi.baidu.com/leolance/blog/item/3c273327978ae55f93580703.html 安装libevent (对libevent的版本要求为1.4.
[强人工智能]拓扑扫描与自适应构造器 comsci 人工智能
当我们面对一个有限拓扑网络的时候,在对已知的拓扑结构进行分析之后,发现在连通点之后,还存在若干个子网络,且这些网络的结构是未知的,数据库中并未存在这些网络的拓扑结构数据....这个时候,我们该怎么办呢? 那么,现在我们必须设计新的模块和代码包来处理上面的问题
oracle merge into的用法 daizj oracle sql merget into
Oracle中merge into的使用 http://blog.csdn.net/yuzhic/article/details/1896878 http://blog.csdn.net/macle2010/article/details/5980965 该命令使用一条语句从一个或者多个数据源中完成对表的更新和插入数据. ORACLE 9i 中，使用此命令必须同时指定UPDATE 和INSE
不适合使用Hadoop的场景 datamachine hadoop
转自：http://dev.yesky.com/296/35381296.shtml。　　Hadoop通常被认定是能够帮助你解决所有问题的唯一方案。当人们提到“大数据”或是“数据分析”等相关问题的时候，会听到脱口而出的回答：Hadoop! 实际上Hadoop被设计和建造出来，是用来解决一系列特定问题的。对某些问题来说，Hadoop至多算是一个不好的选择，对另一些问题来说，选择Ha
YII findAll的用法 dcj3sjt126com yii
看文档比较糊涂，其实挺简单的： $predictions=Prediction::model()->findAll("uid=:uid",array(":uid"=>10)); 第一个参数是选择条件：”uid=10″。其中:uid是一个占位符，在后面的array(“:uid”=>10)对齐进行了赋值；更完善的查询需要
vim 常用 NERDTree 快捷键 dcj3sjt126com vim
下面给大家整理了一些vim NERDTree的常用快捷键了，这里几乎包括了所有的快捷键了，希望文章对各位会带来帮助。切换工作台和目录 ctrl + w + h 光标 focus 左侧树形目录ctrl + w + l 光标 focus 右侧文件显示窗口ctrl + w + w 光标自动在左右侧窗口切换ctrl + w + r 移动当前窗口的布局位置 o 在已有窗口中打开文件、目录或书签，并跳
Java把目录下的文件打印出来蕃薯耀列出目录下的文件文件夹下面的文件目录下的文件
Java把目录下的文件打印出来 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 11:02:
linux远程桌面----VNCServer与rdesktop hanqunfeng Desktop
windows远程桌面到linux，需要在linux上安装vncserver，并开启vnc服务，同时需要在windows下使用vnc-viewer访问Linux。vncserver同时支持linux远程桌面到linux。 linux远程桌面到windows，需要在linux上安装rdesktop，同时开启windows的远程桌面访问。下面分别介绍，以windo
guava中的join和split功能 jackyrong java
guava库中，包含了很好的join和split的功能，例子如下： 1）将LIST转换为使用字符串连接的字符串 List<String> names = Lists.newArrayList("John", "Jane", "Adam", "Tom");
Web开发技术十年发展历程 lampcy android Web 浏览器 html5
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
架构师之mima-----------------mina的非NIO控制IOBuffer(说得比较好) nannan408 buffer
1.前言。如题。 2.代码。 IoService IoService是一个接口，有两种实现：IoAcceptor和IoConnector；其中IoAcceptor是针对Server端的实现，IoConnector是针对Client端的实现；IoService的职责包括： 1、监听器管理 2、IoHandler 3、IoSession
ORA-00054:resource busy and acquire with NOWAIT specified Everyday都不同 oracle session Lock
[Oracle] 今天对一个数据量很大的表进行操作时，出现如题所示的异常。此时表明数据库的事务处于“忙”的状态，而且被lock了，所以必须先关闭占用的session。 step1，查看被lock的session： select t2.username, t2.sid, t2.serial#, t2.logon_time from v$locked_obj
javascript学习笔记 tntxia JavaScript
javascript里面有6种基本类型的值:number、string、boolean、object、function和undefined。number：就是数字值，包括整数、小数、NaN、正负无穷。string:字符串类型、单双引号引起来的内容。boolean:true、false object:表示所有的javascript对象，不用多说function:我们熟悉的方法，也就是
Java enum的用法详解 xieke90 enum 枚举
Java中枚举实现的分析：示例： public static enum SEVERITY{ INFO,WARN,ERROR } enum很像特殊的class，实际上enum声明定义的类型就是一个类。而这些类都是类库中Enum类的子类 (java.l

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他