Yi_cAt

Lecture 4 Sequence as input

Lecture 4: Sequence as input

文章目录

Self-attention
- Sophisticated Input
- - Vector set as input
  - - 文字处理
    - 音频处理
    - Graph as input
- What is the output?
- - Each vector has a label
  - - Example
  - The whole sequence has a label
  - - Example
  - Model decides the number of labels itself （**Seq2Seq**）
- Sequence Labeling
- Self-attention
- - Input and output
  - Self-attention in the view of matrix multiplication
  - - Step 1: 计算 ${\bf q}^i,\ {\bf k}^i, {\bf v}^i$
    - Step 2: 计算 $\alpha$
    - Step 3: 计算 ${\bf b}^i$
    - Brief Summary
- Multi-head Self-attention
- Positional Encoding
- Applications of self-attention
- - NLP
  - Speech
  - Image
- Self-attention v.s. CNN

Self-attention

Sophisticated Input

Input is a vector:

Lecture 4 Sequence as input_第1张图片

Input is a set of vectors:

Lecture 4 Sequence as input_第2张图片

Vector set as input

文字处理

Lecture 4 Sequence as input_第3张图片

假设网络的输入是一个句子，我们需要将句子中的每一个词都用一个向量来表示。那么，我们的模型输入将会是一个 Vector Set，并且每一次输入的 Vector Set 的大小会不同。将用向量来表示词汇的方法如下所示：

Lecture 4 Sequence as input_第4张图片

One-hot Encoding 建立一个很长的向量，每一个维度对应一个词汇。缺点也很明显，这种方法忽略掉了词语之间的关系（词语间语义的关系）；比如说，很难从 One-hot Encoding 中看出 cat 和 dog 都是动物这层关系。

Word Embedding 也使用向量来表示词语，但这些向量包含了语义的关系。如上图所示，可以看到“动词”、“动物”、“植物”类的词汇往往都分别聚集成一块。

音频处理

Lecture 4 Sequence as input_第5张图片

一个窗口（Window）内的音频信号可以描述成一个向量，这个向量也叫做帧（Frame），长度通常是 $25 m s$ ；为了描述整段的音频信号，窗口会进行滑动，向后滑动 $10 m s$ ；那么 $1 s$ 内就有 $100$ 个向量。

Graph as input

Lecture 4 Sequence as input_第6张图片

Lecture 4 Sequence as input_第7张图片

What is the output?

Each vector has a label

Lecture 4 Sequence as input_第8张图片

输入和输出的长度保持一致，输入 $n$ 个 vector 就输出 $n$ 个 scalar 或 class。

Example

Lecture 4 Sequence as input_第9张图片

常见的应用：词性标注；语音辨识；社交网络中每个结点的特性。

The whole sequence has a label

Lecture 4 Sequence as input_第10张图片

无论输入有多长，都只会有一个输出。

Example

Lecture 4 Sequence as input_第11张图片

常见应用：情感分析；识别演讲人；有机物的亲水性如何。

Model decides the number of labels itself （Seq2Seq）

Lecture 4 Sequence as input_第12张图片

我们并不知道将会有多少输出，需要模型自己决定。

Sequence Labeling

本节主要关注 Each vector has a label 这一情况，又叫做 Sequence Labeling。

Lecture 4 Sequence as input_第13张图片

如果我们考虑用全连接网络来解决词性标注的问题，那将会有一个明显的问题 —— 我们期待 $\color{blue} saw$ 通过 FC 后输出的是动词， $\color{orange}saw$ 通过 FC 后输出的是名词，而对于 FC 来说，输入的 $\color{black}saw$ 没有任何区别，因此它们会得到同样的输出。

为了解决上述问题，我们尝试让 FC 考虑上下文的信息，我们将前后几个相邻向量（一个 window）都输入 FC 中。那如果问题需要考虑一整个 Sequence 该怎么办呢？—— 引入 Self - attention

Self-attention

Lecture 4 Sequence as input_第14张图片

Self-attention 的处理流程如上图所示，将 Sequence 中的所有 Vector 输入 Self-attention，输入 $n$ 个 Vector 就输出 $n$ 个 Vector，且这 $n$ 个 Vector 都考虑了整个 Sequence 的信息。将这些 Vector 再输入到 FC 中，最终再输出 scalar 或者 class。

Input and output

Lecture 4 Sequence as input_第15张图片

Self-attention 的输入可以来自原始的 input vector 或者是 hidden layer 的输出。每一个输出向量 $\bf b$ 都考虑了输入向量 $\bf a$ 。接下来将详细解释输出向量 ${\bf b}^1$ 的产生过程。

计算 $\alpha$ :

Lecture 4 Sequence as input_第16张图片

首先，根据 $a^1$ 找出这个 sequence 中所有与 $a^1$ 相关的向量，sequence 中其余向量与 $a^1$ 的关联程度用 $\alpha$ 表示。那么， $\alpha$ 如何计算呢？引入计算 attention 的模组。

Dot-product

Lecture 4 Sequence as input_第17张图片

两个输入向量分别乘上矩阵 $W^q$ 和 $W^k$ 得到向量 $\bf q$ 和 $\bf k$ ， $\alpha=\bf q \cdot \bf k$ 。Transformer 中使用的是这种方法。

Additive

Lecture 4 Sequence as input_第18张图片

两个输入向量分别乘上矩阵 $W^q$ 和 $W^k$ 得到向量 $\bf q$ 和 $\bf k$ ，将这两个向量连接起来输入到激活函数中，再经过一个 Transform 得到 $\alpha$ 。

Lecture 4 Sequence as input_第19张图片

如上图所示， ${\bf a}^1$ 乘上 ${\rm W}^q$ 作为 query ${\bf q}^1$ ， ${\bf a}^1,\ {\bf a}^2,\ {\bf a}^3$ 都乘上 ${\rm W}^k$ 作为 key ${\bf k}^2,\ {\bf k}^3,\ {\bf k}^4$ 。 ${\bf q}^1$ 分别和 ${\bf k}^2,\ {\bf k}^3,\ {\bf k}^4$ 做点积得到 $\alpha_{1,2},\ \alpha_{1,3},\ \alpha_{1,4}$ ，这些 $\alpha$ 也叫做 attention score。

计算 ${\bf b}^1$ ：

Lecture 4 Sequence as input_第20张图片

在实际操作中，我们也需要计算 $\alpha_{1,1}$ ，也就是 ${\bf q}^1$ 和 ${\bf k}^1$ 都由 ${\bf a}^1$ 分别乘上矩阵 ${\rm W}^q,\ {\rm W}^k$ 得到（需要计算自己和自己的相关性），其余的 $\alpha$ 计算方式同上。最后通过 $so f t ma x$ 得到 $\alpha_{1,i}'$ ，即 $\alpha_{1,i}'=\exp(\alpha_{1,i})/\sum_j\exp(\alpha_{1,j})$ 。

得到 $\alpha_{1,i}'$ 后，我们需要根据 $\alpha_{1,i}'$ 来抽取出 sequence 中重要的信息。如下图所示，对于每个 ${\bf a}$ 都乘上矩阵 ${\rm W}^v$ 得到向量 ${\bf v}$ ；接下来，用 attention score 乘上每个 ${\bf v}$ 再求和就得到了 ${\bf b}^1$ ，即 ${\bf b}^1=\sum_{i}\alpha_{1,i}'{\bf v}^i$ 。哪一个 $\alpha_{1,i}'$ 大，那么 $\bf b$ 就会越接近该 $\bf v$ 向量。

Lecture 4 Sequence as input_第21张图片

计算 ${\bf b}^2$ 的过程也类似， ${\bf b}^2=\sum_{i}\alpha_{2,i}'{\bf v}^i$ 。总之，要计算 ${\bf b}^i$ ，首先，由 ${\bf a}^i$ 和矩阵 ${\rm W}^q,\ {\rm W}^k,\ {\rm W}^v$ 计算 ${\bf q}^i,\ {\bf k}^i, {\bf v}^i$ ；再由 ${\bf q}^i,\ {\bf k}^j$ 计算出 $\alpha_{i,j}$ ，再通过 $so f t ma x$ 得到 $\alpha'_{i,j}$ （attention score）；最后得到 ${\bf b}^i=\sum_j\alpha'_{i,j} {\bf v}_j$ 。

Lecture 4 Sequence as input_第22张图片

Self-attention in the view of matrix multiplication

Step 1: 计算 ${\bf q}^i,\ {\bf k}^i, {\bf v}^i$

Lecture 4 Sequence as input_第23张图片

我们已经知道了需要 ${\bf a}^i$ 和矩阵 ${\rm W}^q,\ {\rm W}^k,\ {\rm W}^v$ 计算 ${\bf q}^i,\ {\bf k}^i, {\bf v}^i$ 。接下来通过矩阵乘法的角度来看self-attention。

Lecture 4 Sequence as input_第24张图片

如上图所示，我们可以将 ${\bf a}^i$ 拼接起来记作 ${\bf I}$ （input），因此与矩阵 ${\rm W}^q,\ {\rm W}^k,\ {\rm W}^v$ 作矩阵乘法得到 ${\bf Q},\ {\bf K},\ {\bf V}$ （分别是 ${\bf q}^i,\ {\bf k}^i, {\bf v}^i$ 拼接的结果）。

Step 2: 计算 $\alpha$

Lecture 4 Sequence as input_第25张图片

Lecture 4 Sequence as input_第26张图片

我们已经知道了 attention score 的计算方式，如上图所示， $\alpha_{1,i}$ 由 ${\bf q}^1$ 和 ${\bf k}^i$ 做内积得到。还是通过矩阵乘法的角度，上述的过程可以看作：

Lecture 4 Sequence as input_第27张图片

继续扩展：

Lecture 4 Sequence as input_第28张图片

attention score 的矩阵 ${\bf A}$ 是由 ${\bf K}^{\rm T},\ {\bf Q}$ 做矩阵乘法得到，即 ${\bf A}={\bf K}^{\rm T}{\bf Q}$ ；attention score 再标准化一下（这里选择 $so f t ma x$ ）得到矩阵 ${\bf A}'$ （attention matrix）。

Step 3: 计算 ${\bf b}^i$

Lecture 4 Sequence as input_第29张图片

如上图所示，我们已经知道了 ${\bf b}^i=\sum_j\alpha'_{i,j} {\bf v}_j$ ，接下来用矩阵乘法的角度来看这一过程。

Lecture 4 Sequence as input_第30张图片

如上图所示，利用矩阵乘法得到 ${\bf b}^i$ 组成的矩阵 ${\bf O}$ （output），也就是 self-attention 最终的输出。

Brief Summary

计算 ${\bf q}^i,\ {\bf k}^i, {\bf v}^i$ ：

Lecture 4 Sequence as input_第31张图片

计算 $\alpha$ :

Lecture 4 Sequence as input_第32张图片

计算 ${\bf b}^i$ :

Lecture 4 Sequence as input_第33张图片

虽然 self-attention 这一系列操作做下来会有些复杂，但仅有矩阵 ${\rm W}^q,\ {\rm W}^k,\ {\rm W}^v$ 是需要训练学习到的参数。

Multi-head Self-attention

在翻译、语音识别，利用 multi-head 可能会有较好的结果。为什么需要 multi-head？在做 self-attention 的时候，我们在用 ${\bf q}$ 去找相关的 ${\bf k}$ ，而向相关的种类有很多种，因此我们需要不同的 ${\bf q}$ 负责不同种类的相关性。

Lecture 4 Sequence as input_第34张图片

以 $2$ 头为例， ${\bf q}^i,\ {\bf k}^i, {\bf v}^i$ 分别乘上两个矩阵得到 ${\bf q}^{i,1},\ {\bf q}^{i,2};\ {\bf k}^{i,1},\ {\bf k}^{i,2},\ {\bf v}^{i,1},\ {\bf v}^{i,2}$ 。计算 self-attention 的步骤类似，但多头之间的计算仅涉及一类。如上图所示，计算 ${\bf b}^{i,1}$ ，首先分别计算出 ${\bf q}^{i,1}$ 与 ${\bf k}^{i,1}$ 和 ${\bf k}^{j,1}$ 的 attention score，接下来将这两个 attention score 分别乘上 ${\bf v}^{i,1},\ {\bf v}^{j,1}$ 再进行 $\text{weighted sum}$ 到一起就是 ${\bf b}^{i,1}$ 。

类似地， ${\bf q}^{i,2}$ 只会和 ${\bf k}^{i,2},\ {\bf k}^{j,2},\ {\bf v}^{i,2},\ {\bf v}^{j,2}$ 进行计算得到 ${\bf b}^{i,2}$ 。如果有更多的头，顺推即可。

当得到 ${\bf b}^{i,1},\ {\bf b}^{i,2}$ 后，可以将它们拼在一起，再乘上一个矩阵（进行 transform）就可以传到网络的下一层：

Lecture 4 Sequence as input_第35张图片

Positional Encoding

在 self-attention 的操作中，忽略掉了位置信息；（每一个 input 出现在最前面还是最后面是不知道的）—— 引入 Positional Encoding 技术。

为每一个位置都设置一个唯一的位置向量（positional vector） $e^i,\ \text{i means position}$ ，一种做法是将 $e^i$ 加到输入 $a^i$ 上：

Lecture 4 Sequence as input_第36张图片

$e^i$ 的可能取值（Attention is all you need）：

Lecture 4 Sequence as input_第37张图片

Applications of self-attention

NLP

Lecture 4 Sequence as input_第38张图片

Speech

Lecture 4 Sequence as input_第39张图片

Image

Lecture 4 Sequence as input_第40张图片

Lecture 4 Sequence as input_第41张图片

Self-attention v.s. CNN

Lecture 4 Sequence as input_第42张图片

Lecture 4 Sequence as input_第43张图片

On the Relationship between Self-Attention and Convolutional Layers

Lecture 4 Sequence as input_第44张图片

An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale

你可能感兴趣的:(2022,Spring,李宏毅ML,自然语言处理,人工智能,深度学习)

Python前端开发 PITSU 正则表达式 html css3 mysql
Python前端开发1.前端三剑客（HTML，CSS和JavaScript）1.1HTML1.1.1HTML简介HyperTextMark-upLanguage,指的是超文本标记语言；html是开发网页的语言；html中的标签大多数都是成对出现的,格式:1.1.2HTML结构第一行是文档声明部分HTML：分为页头，页身和页脚。标签大部分是成对出现1.1.3第一行文档声明部分HTML在vscode中
初识HTML中的div块元素—零基础自学网页制作猿说前端 html web开发
块元素基础属性讲解元素是个有故事的元素，这个元素很早就出现在html超文本标记语言中，它设计之初就是为了解决网页页面布局的需求。但是遗憾的是它出生后一直怀才不遇。在我还上初中的时候，智能手机还没有出现，更没有平板电脑等移动设备。上网是通过摆在桌子上的计算机来完成的。那时，大街小巷上有好多网吧。那时，马云刚刚辞去工作准备创业。那时，发送邮件的操作都会出现在计算机课程中。那时，对页面还没有现在的跨平台
java毕业设计，在线水果商城系统爱编程的小哥 java毕设 java 课程设计 spring boot vue
天天生鲜在线商城系统技术解密|SpringBoot+Vue3企业级实战（附高并发场景解决方案）一、系统全景解读该系统是生鲜电商全流程解决方案，采用SpringBoot3+Vue3+ElementPlus技术栈，覆盖商品管理、智能分类、订单处理、用户画像等核心场景，通过RBAC权限控制+OSS图片存储+高并发库存管理三大技术亮点，日均支撑5000+商品、10万+订单的电商需求。系统以蓝白清新界面+实
当现代教育技术遇上仓颉---探秘华为仓颉编程语言与未来教育技术的接轨想成为高手499 华为服务器 php
引言随着人工智能、物联网、区块链等新兴技术的发展，编程语言的需求也在不断演化。据市场研究机构发布的数据显示，全球编程语言市场规模预计在未来五年内将以每年10%的速度增长。此外，越来越多的企业和高校正在积极推动基于分布式系统和硬件优化的新型语言开发，这进一步表明对高性能编程语言的需求日益旺盛。近年来，华为推出了自研编程语言“仓颉”，以其高效的语法设计、灵活的语义表达能力和强大的跨平台适配性能引发了编
springboot整合mybatis分页插件不生效问题潘令 spring boot mybatis java 后端
原因分析做项目时发现导入分页插件的场景启动器后，分页插件不生效，一直查询出所有数据上网搜索发现分页插件不生效主要有以下原因：1、没有导入分页插件的场景启动器，而是导入了普通的分页插件依赖com.github.pagehelperpagehelper5.1.10导入该依赖后还需要进行额外的配置1).在MyBatis配置xml中配置拦截器插件<propertyname="param1&
Python在人工智能与机器人开发中的应用与实践一键难忘 python 人工智能机器人
Python在人工智能与机器人开发中的应用与实践Python已经成为人工智能和机器人开发的主要编程语言之一，凭借其简洁的语法、强大的库支持和广泛的社区资源，Python为开发者提供了一个高效且易于学习的平台。在这篇文章中，我们将深入探讨如何使用Python进行人工智能（AI）和机器人开发，并通过实际代码示例展示核心技术和应用。1.Python在人工智能中的应用人工智能（AI）领域的核心任务包括机器
复旦：过程奖励优化多模态推理大模型任我行大模型-模型训练人工智能自然语言处理语言模型论文笔记
标题：VisualPRM:AnEffectiveProcessRewardModelforMultimodalReasoning来源：arXiv,2503.10291摘要我们引入了VisualPRM，这是一种具有8B参数的高级多模态过程奖励模型（PRM），它通过Best-of-N（BoN）评估策略提高了现有多模态大型语言模型（MLLM）在不同模型尺度和族之间的推理能力。具体来说，我们的模型提高了三
MySQL 面试题你曾经是少年 mysql 数据库
1.数据库基础问题：请解释数据库（DB）、数据库管理系统（DBMS）、SQL三者的区别。参考答案：DB：存储数据的结构化仓库DBMS：管理数据库的软件（如MySQL、Oracle）SQL：操作关系型数据库的标准化语言2.SQL分类问题：SQL分为哪几类？分别写出对应的关键字（至少3个）。参考答案：DDL：CREATE/DROP/ALTERDML：INSERT/UPDATE/DELETEDQL：SE
计算机专业毕业设计题目推荐（新颖选题）本科计算机科学专业相关毕业设计选题大全✅ 会写代码的羊毕设选题课程设计计算机网络毕设选题毕设系统毕设题目计算机科学专业
文章目录前言最新毕设选题（建议收藏起来）本科计算机科学专业相关的毕业设计选题毕设作品推荐前言2025全新毕业设计项目博主介绍：✌全网粉丝10W+,CSDN全栈领域优质创作者，博客之星、掘金/华为云/阿里云等平台优质作者。技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、大数据、机器学习等设计与开发。主要内容：免费功能设计
RabbitMQ中如何确保你的消息只被消费一次昔我往昔 MQ rabbitmq ruby 分布式
在SpringBoot项目中，确保RabbitMQ消息只被消费一次是一个常见且重要的问题。为了确保消息在RabbitMQ中只被消费一次，我们通常依赖于消息确认机制（acknowledgment），以及幂等性设计。以下是一些常见的做法来实现这一目标。1.使用消息确认机制（Ack）RabbitMQ提供了消息确认机制，允许消费者在成功处理消息后通知RabbitMQ服务器。这可以确保在消息消费完成前，不会
物联网 - JetLinks与ThingsBoard技术选型对比天机️灵韵物联网开源项目物联网
JetLinks与ThingsBoard作为两款主流的开源物联网平台，在技术架构、功能特性及适用场景上存在显著差异。以下从技术选型的关键维度进行深度对比分析：JetLinks与ThingsBoard物联网平台的深度技术对比及选型建议，综合多个维度分析两者的核心差异与适用场景：一、技术架构与性能技术栈JetLinks：基于Java8、SpringBoot2.x、WebFlux、Netty等，采用响应
localStorage在上面位置？数据存放文件名是什么？ 2301_79698214 html java
在上述代码中，数据并不是以传统文件的形式存放在某个具体的文件里，而是存储在浏览器的localStorage中。localStorage是HTML5新增的一个会话存储对象，它用于临时保存同一窗口（或标签页）的数据，在关闭窗口或标签页后数据仍然存在。数据存储位置和文件名存储位置：localStorage是浏览器提供的一个存储机制，数据存储在浏览器的本地存储区域，不同的浏览器存储位置不同，例如：Chro
智慧交通是什么，可以帮助我们解决什么问题? Guheyunyi 运维大数据人工智能信息可视化前端
智慧交通是什么？智慧交通（SmartTransportation）是指利用物联网（IoT）、大数据、人工智能（AI）、云计算、5G通信等先进技术，对交通系统进行智能化管理和优化，以提高交通效率、减少拥堵、降低事故率、提升出行体验，并实现交通资源的合理配置和可持续发展。智慧交通的核心是通过数据采集、分析和应用，实现交通系统的智能化、自动化和协同化，从而构建一个高效、安全、绿色、便捷的交通生态系统。智
Promise 原理与实战：从基础到高级的完整教程 D.eL 前端工程化从无 -通前端 javascript
一、前言：为什么会出现Promise?Promise的重要性我认为没有必要多说，概括起来就是五个字：必！须！得！掌！握！。而且还要掌握透彻，在实际的使用中，有非常多的应用场景我们不能立即知道应该如何继续往下执行。最常见的一个场景就是ajax请求，通俗来说，由于网速的不同，可能你得到返回值的时间也是不同的，这个时候我们就需要等待，结果出来了之后才知道怎么样继续下去。letxhr=newXMLHttp
NSSCTF_crypto_[HGAME 2022 week3]RSA attack 3 岁岁的O泡奶 python 开发语言密码学 crypto NSSCTF 维纳攻击
[HGAME2022week3]RSAattack3题目:太多了自己去看，提示:维纳攻击首先在做这题之前你得先懂得维纳攻击的原理https://www.cnblogs.com/wandervogel/p/16805992.htmlok啊看懂了维纳攻击的原理就来开始写脚本吧fromCrypto.Util.numberimportlong_to_bytesimportgmpy2#已知参数n=50741
springBoot中myBatisPlus的使用无足鸟丶 spring boot 后端 java
MyBatis-Plus是一个MyBatis的增强工具，在SpringBoot项目里使用它能极大提升开发效率。下面为你详细介绍在SpringBoot中使用MyBatis-Plus的步骤以及示例代码。1.创建SpringBoot项目你可以借助SpringInitializr（https://start.spring.io/）来创建一个新的SpringBoot项目，添加以下依赖：SpringWebSp
springBoot中不添加依赖 , 手动生成一个token ,并校验token (使用简单 , 但是安全会低一点) 无足鸟丶 spring boot 安全后端
在SpringBoot里，即便不添加额外依赖，也能手动生成和校验Token。下面以简单的基于时间戳和密钥的方式来生成和校验Token为例，介绍具体实现步骤。实现思路生成Token：把用户信息、时间戳等数据组合起来，再用密钥进行哈希处理，生成一个唯一的Token。校验Token：从Token里提取出用户信息和时间戳，重新进行哈希处理，然后与原Token进行对比，同时检查时间戳是否过期。代码实现1.创
网页大屏适配使用css的scale方法缺点是两边会有留白；无足鸟丶 css css3 html javascript 前端
网页大屏适配使用css的scale方法缺点是两边会有留白；Document*{margin:0;padding:0;}html,body{width:100vw;height:100vh;background-color:blue;}#container{width:100%;height:100%;}.box{width:1920px;height:1080px;background-color
Browser-Use WebUI项目启动指南思考在马桶上人工智能 chatgpt 经验分享 python
摘要此前发布《Browser-UseWebUI使用体验》博文后，鉴于部分朋友运行时出现问题，重新运行并整理相关内容。本文详细记录WebUI项目启动全过程，涵盖Python3.11+、Chrome浏览器及APIKeys等环境要求，Python环境检查、依赖安装等环境配置步骤，.env文件中环境变量的设置方法。同时，针对启动中如lxml.html.clean依赖缺失、连接被拒等问题给出解决方案，介绍启
java-生成二维码，并写入word尾页【基础篇】橙-极纪元JJYCheng java word 开发语言
java-生成二维码，并写入word尾页【基础篇】介绍项目框架：SpringBoot项目管理：Maven推荐文章1：java-生成二维码，二维码增加logo，读取二维码推荐文章2：java-生成二维码，并写入word尾页【基础篇】推荐文章3：java-生成二维码，并写入word尾页【高级篇】推荐文章4：java
【开题报告+论文+源码】基于SpringBoot+Vue的社区团购配送系统编程毕设 spring boot 后端 java
项目背景与意义随着社会的进步和收入的提高，消费者对购物体验有了更高的要求。他们希望获得更多样化的商品选择，更加便捷的购物方式，以及更加优质的售后服务。同时，越来越多的老年人开始关注健康饮食和食品质量。他们不再满足于传统的购物方式，而是希望通过更加方便的方式来获取更加安全和健康的食品。社区团购配送系统在满足用户日常生活需求的同时，也带来了许多便利和机遇。项目介绍本课程演示的是一款基于SpringBo
实战LLM强化学习——使用GRPO（DeepSeek R1出圈算法）大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 经验分享
引言近年来，深度强化学习（DRL）已经成为解决复杂决策问题的一个强有力工具，尤其是在自然语言处理（NLP）领域的广泛应用。通过不断优化决策策略，DRL能在大量数据中学习最佳行为，尤其是大型语言模型（LLM）在任务中展现出的巨大潜力。然而，随着模型规模的扩大和任务复杂性的增加，传统的强化学习算法开始暴露出训练效率低、收敛速度慢等问题。为了解决这些挑战，DeepSeek公司提出了一个新的强化学习算法—
网络安全入门教程（非常详细）从零基础入门到精通，看完这一篇就够了白帽黑客坤哥 web安全网络安全 python windows
href="https://csdnimg.cn/release/blogv2/dist/mdeditor/css/editerView/kdoc_html_views-1a98987dfd.css"rel="stylesheet"/>href="https://csdnimg.cn/release/blogv2/dist/mdeditor/css/editerView/ck_htmledit_v
10 分钟学会SpringValidation数据校验和全局异常处理 ohn.yu spring spring boot java
以下是一个使用Spring开发的简单RESTAPI小程序，通过对一张user表进行操作，代码演示如何RestAPI开发中实现数据校验、全局异常处理和返回Json格式数据。使用的核心框架包括SpringBootSpringWebSpringDataJPABeanValidation（JSR-303）Lombok1.项目依赖（pom.xml）创建一个Maven项目，添加以下依赖："xmlns:xsi=
若依框架入门指南：快速上手SpringBoot+前后端分离版小小鸭程序员 spring java spring boot 后端 intellij-idea
若依（RuoYi）是一款基于SpringBoot的快速开发平台，集成了权限管理、代码生成、监控管理等功能。本文将以SpringBoot+Vue前后端分离版本为例，带你快速上手若依框架。一、环境准备基础环境：JDK1.8+MySQL5.7+Redis5.0+Maven3.6+Node.js14+（前端）下载项目：#后端项目gitclonehttps://gitee.com/y_project/Ruo
在线视频创作平台（Vidnami） deepdata_cn 视频生成视频剪辑视频创作
Vidnami是一款功能强大的在线视频创作平台，前身为ContentSamurai，于2015年推出，2020年更名为Vidnami。它运用人工智能技术，能够分析输入的文本，自动从大量素材中选取合适的图像和视频片段，将文字快速转化为具有专业外观的视频，无需用户具备视频编辑经验。该平台提供多种视频模板、全主题定制功能以及内置的免版权媒体库，包括3000万张图片和3万首音乐，还支持自动配音，用户可以录
移动端IOS的H5页面被键盘顶起后，底部有一大片空白区域的解决方法不怕麻烦的鹿丸浏览器 HTML5 JavaScript 前端 html5 javascript
在移动端开发中，当使用HTML5(特别是在Vue.js框架下)构建应用时，经常会遇到键盘弹出导致页面内容被顶起的问题。当键盘收起后，页面未能自动恢复到原来的位置。当键盘弹出时，你可以通过JavaScript监听键盘的显示和隐藏事件，并相应地调整页面的滚动位置。exportdefault{mounted(){window.addEventListener('focusin',this.handleF
【初学者】用Python语言来解释指针的用例与应用场景 lisw05 python python 开发语言
李升伟整理Python本身并不直接支持指针的概念，因为Python是一种高级语言，内存管理由解释器自动处理。不过，Python提供了一些机制（如引用、可变对象等）来实现类似指针的功能。以下是Python中“指针”的用例和应用场景。1.引用机制（类似指针）在Python中，变量是对对象的引用，而不是直接存储对象的值。这种引用机制类似于指针的概念。示例：a=10#a是对整数对象10的引用b=a#b也引
【初学者】请介绍一下指针分析（Pointer Analysis）？ lisw05 计算机科学技术 c语言指针
李升伟整理指针分析（PointerAnalysis）指针分析（PointerAnalysis）是一种静态程序分析技术，用于确定程序中指针可能指向的内存位置或对象。它是编译器优化、程序验证、漏洞检测和并行化等领域的重要基础。1.指针分析的目标指针分析的主要目标是回答以下问题：指针变量可能指向哪些内存位置或对象？两个指针是否可能指向同一个内存位置（别名分析）？指针的指向关系如何影响程序的行为？通过回答
【初学者】指针：概念、示例与应用场景详解 lisw05 计算科学初学者数据结构 c语言
李升伟整理指针的概念指针是编程中的一种变量，用于存储另一个变量的内存地址。通过指针，程序可以直接访问和操作内存中的数据，提供了灵活的内存管理和高效的数据处理能力。指针的示例以下是一个简单的C语言示例，展示了指针的基本用法：#includeintmain(){intvar=10;//定义一个整型变量int*ptr;//定义一个整型指针ptr=&var;//将变量var的地址赋给指针ptrprintf
面向对象面向过程 3213213333332132 java
面向对象：把要完成的一件事，通过对象间的协作实现。面向过程：把要完成的一件事，通过循序依次调用各个模块实现。我把大象装进冰箱这件事为例，用面向对象和面向过程实现，都是用java代码完成。 1、面向对象 package bigDemo.ObjectOriented; /** * 大象类 * * @Description * @author FuJian
Java Hotspot: Remove the Permanent Generation bookjovi HotSpot
openjdk上关于hotspot将移除永久带的描述非常详细，http://openjdk.java.net/jeps/122 JEP 122: Remove the Permanent Generation Author Jon Masamitsu Organization Oracle Created 2010/8/15 Updated 2011/
正则表达式向前查找向后查找,环绕或零宽断言 dcj3sjt126com 正则表达式
向前查找和向后查找 1. 向前查找：根据要匹配的字符序列后面存在一个特定的字符序列(肯定式向前查找)或不存在一个特定的序列(否定式向前查找)来决定是否匹配。.NET将向前查找称之为零宽度向前查找断言。对于向前查找，出现在指定项之后的字符序列不会被正则表达式引擎返回。 2. 向后查找：一个要匹配的字符序列前面有或者没有指定的
BaseDao 171815164 seda
import java.sql.Connection; import java.sql.DriverManager; import java.sql.SQLException; import java.sql.PreparedStatement; import java.sql.ResultSet; public class BaseDao { public Conn
Ant标签详解--Java命令 g21121 Java命令
这一篇主要介绍与java相关标签的使用终于开始重头戏了，Java部分是我们关注的重点也是项目中用处最多的部分。 1
[简单]代码片段_电梯数字排列 53873039oycg 代码
今天看电梯数字排列是9 18 26这样呈倒N排列的,写了个类似的打印例子，如下: import java.util.Arrays; public class 电梯数字排列_S3_Test { public static void main(S
Hessian原理云端月影 hessian原理
Hessian 原理分析一．远程通讯协议的基本原理网络通信需要做的就是将流从一台计算机传输到另外一台计算机，基于传输协议和网络 IO 来实现，其中传输协议比较出名的有 http 、 tcp 、 udp 等等， http 、 tcp 、 udp 都是在基于 Socket 概念上为某类应用场景而扩展出的传输协
区分Activity的四种加载模式----以及Intent的setFlags aijuans android
在多Activity开发中，有可能是自己应用之间的Activity跳转，或者夹带其他应用的可复用Activity。可能会希望跳转到原来某个Activity实例，而不是产生大量重复的Activity。这需要为Activity配置特定的加载模式，而不是使用默认的加载模式。加载模式分类及在哪里配置 Activity有四种加载模式： standard singleTop
hibernate几个核心API及其查询分析 antonyup_2006 html .net Hibernate xml 配置管理
(一) org.hibernate.cfg.Configuration类读取配置文件并创建唯一的SessionFactory对象.(一般,程序初始化hibernate时创建.) Configuration co
PL/SQL的流程控制百合不是茶 oracle PL/SQL编程循环控制
PL/SQL也是一门高级语言,所以流程控制是必须要有的,oracle数据库的pl/sql比sqlserver数据库要难,很多pl/sql中有的sqlserver里面没有流程控制; 分支语句 if 条件 then 结果 else 结果 end if ; 条件语句 case when 条件 then 结果; 循环语句 loop
强大的Mockito测试框架 bijian1013 mockito 单元测试
一.自动生成Mock类在需要Mock的属性上标记@Mock注解，然后@RunWith中配置Mockito的TestRunner或者在setUp()方法中显示调用MockitoAnnotations.initMocks(this);生成Mock类即可。二.自动注入Mock类到被测试类 &nbs
精通Oracle10编程SQL(11)开发子程序 bijian1013 oracle 数据库 plsql
/* *开发子程序 */ --子程序目是指被命名的PL/SQL块，这种块可以带有参数，可以在不同应用程序中多次调用 --PL/SQL有两种类型的子程序：过程和函数 --开发过程 --建立过程：不带任何参数 CREATE OR REPLACE PROCEDURE out_time IS BEGIN DBMS_OUTPUT.put_line(systimestamp); E
【EhCache一】EhCache版Hello World bit1129 Hello world
本篇是EhCache系列的第一篇，总体介绍使用EhCache缓存进行CRUD的API的基本使用，更细节的内容包括EhCache源代码和设计、实现原理在接下来的文章中进行介绍环境准备 1.新建Maven项目 2.添加EhCache的Maven依赖 <dependency> <groupId>ne
学习EJB3基础知识笔记白糖_ bean Hibernate jboss webservice ejb
最近项目进入系统测试阶段，全赖袁大虾领导有力，保持一周零bug记录，这也让自己腾出不少时间补充知识。花了两天时间把“传智播客EJB3.0”看完了，EJB基本的知识也有些了解，在这记录下EJB的部分知识，以供自己以后复习使用。 EJB是sun的服务器端组件模型，最大的用处是部署分布式应用程序。EJB (Enterprise JavaBean)是J2EE的一部分，定义了一个用于开发基
angular.bootstrap boyitech AngularJS AngularJS API angular中文api
angular.bootstrap 描述：手动初始化angular。这个函数会自动检测创建的module有没有被加载多次，如果有则会在浏览器的控制台打出警告日志，并且不会再次加载。这样可以避免在程序运行过程中许多奇怪的问题发生。使用方法： angular .
java-谷歌面试题-给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数 bylijinnan java
public class SearchInShiftedArray { /** * 题目：给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数。 * 请在这个特殊数组中找出给定的整数。 * 解答： * 其实就是“旋转数组”。旋转数组的最小元素见http://bylijinnan.iteye.com/bl
天使还是魔鬼？都是我们制造 ducklsl 生活教育情感
----------------------------剧透请原谅，有兴趣的朋友可以自己看看电影，互相讨论哦！！！从厦门回来的动车上，无意中瞟到了书中推荐的几部关于儿童的电影。当然，这几部电影可能会另大家失望，并不是类似小鬼当家的电影，而是关于“坏小孩”的电影！自己挑了两部先看了看，但是发现看完之后，心里久久不能平
[机器智能与生物]研究生物智能的问题 comsci 生物
我想,人的神经网络和苍蝇的神经网络,并没有本质的区别...就是大规模拓扑系统和中小规模拓扑分析的区别.... 但是,如果去研究活体人类的神经网络和脑系统,可能会受到一些法律和道德方面的限制,而且研究结果也不一定可靠,那么希望从事生物神经网络研究的朋友,不如把
获取Android Device的信息 dai_lm android
String phoneInfo = "PRODUCT: " + android.os.Build.PRODUCT; phoneInfo += ", CPU_ABI: " + android.os.Build.CPU_ABI; phoneInfo += ", TAGS: " + android.os.Build.TAGS; ph
最佳字符串匹配算法（Damerau-Levenshtein距离算法）的Java实现 datamachine java 算法字符串匹配
原文：http://www.javacodegeeks.com/2013/11/java-implementation-of-optimal-string-alignment.html------------------------------------------------------------------------------------------------------------
小学5年级英语单词背诵第一课 dcj3sjt126com english word
long 长的 show 给...看，出示 mouth 口，嘴 write 写 use 用，使用 take 拿，带来 hand 手 clever 聪明的 often 经常 wash 洗 slow 慢的 house 房子 water 水 clean 清洁的 supper 晚餐 out 在外 face 脸，
macvim的使用实战 dcj3sjt126com mac vim
macvim用的是mac里面的vim, 只不过是一个GUI的APP, 相当于一个壳 1. 下载macvim https://code.google.com/p/macvim/ 2. 了解macvim :h vim的使用帮助信息 :h macvim
java二分法查找蕃薯耀 java二分法查找二分法 java二分法
java二分法查找 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 11:40:03 星期二 http:/
Spring Cache注解+Memcached hanqunfeng spring memcached
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>com.google.code.simple-spring-memcached</groupId> <artifactId>simple-s
apache commons io包快速入门 jackyrong apache commons
原文参考 http://www.javacodegeeks.com/2014/10/apache-commons-io-tutorial.html Apache Commons IO 包绝对是好东西，地址在http://commons.apache.org/proper/commons-io/，下面用例子分别介绍： 1）工具类 2
如何学习编程 lampcy java 编程 C++c
首先,我想说一下学习思想.学编程其实跟网络游戏有着类似的效果.开始的时候,你会对那些代码,函数等产生很大的兴趣,尤其是刚接触编程的人,刚学习第一种语言的人.可是,当你一步步深入的时候,你会发现你没有了以前那种斗志.就好象你在玩韩国泡菜网游似的,玩到一定程度,每天就是练级练级,完全是一个想冲到高级别的意志力在支持着你.而学编程就更难了,学了两个月后,总是觉得你好象全都学会了,却又什么都做不了,又没有
架构师之spring-----spring3.0新特性的bean加载控制@DependsOn和@Lazy nannan408 Spring3
1.前言。如题。 2.描述。 @DependsOn用于强制初始化其他Bean。可以修饰Bean类或方法，使用该Annotation时可以指定一个字符串数组作为参数，每个数组元素对应于一个强制初始化的Bean。 @DependsOn({"steelAxe","abc"}) @Comp
Spring4+quartz2的配置和代码方式调度 Everyday都不同代码配置 spring4 quartz2.x 定时任务
前言：这些天简直被quartz虐哭。。因为quartz 2.x版本相比quartz1.x版本的API改动太多，所以，只好自己去查阅底层API…… quartz定时任务必须搞清楚几个概念： JobDetail——处理类 Trigger——触发器，指定触发时间，必须要有JobDetail属性，即触发对象 Scheduler——调度器，组织处理类和触发器，配置方式一般只需指定触发
Hibernate入门 tntxia Hibernate
前言使用面向对象的语言和关系型的数据库，开发起来很繁琐，费时。由于现在流行的数据库都不面向对象。Hibernate 是一个Java的ORM（Object/Relational Mapping）解决方案。 Hibernte不仅关心把Java对象对应到数据库的表中，而且提供了请求和检索的方法。简化了手工进行JDBC操作的流程。如
Math类 xiaoxing598 Math
一、Java中的数字（Math）类是final类，不可继承。 1、常数 PI：double圆周率 E：double自然对数 2、截取（注意方法的返回类型） double ceil(double d) 返回不小于d的最小整数 double floor(double d) 返回不大于d的整最大数 int round(float f) 返回四舍五入后的整数 long round

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他