新缸中之脑

LLM大模型4位量化实战【GPTQ】

权重量化方面的最新进展使我们能够在消费类硬件上运行大量大型语言模型，例如 RTX 3090 GPU 上的 LLaMA-30B 模型。这要归功于性能下降最小的新型 4 位量化技术，例如 GPTQ、GGML 和 NF4。

在上一篇文章中，我们介绍了简单的 8 位量化技术和出色的 LLM.int8()。在本文中，我们将探索流行的 GPTQ 算法，以了解其工作原理并使用 AutoGPTQ 库实现它。

你可以在 Google Colab 和 GitHub 上找到代码。

在线工具推荐： Three.js AI纹理开发包 - YOLO合成数据生成器 - GLTF/GLB在线编辑 - 3D模型格式在线转换 - 可编程3D场景编辑器

1、最优大脑量化

让我们首先介绍我们要解决的问题。对于网络中的每一层 ℓ，我们希望找到原始权重 Wₗ 的量化版本 Ŵₗ。这称为分层压缩问题。更具体地说，为了最大限度地减少性能下降，我们希望这些新权重的输出 (ŴᵨXᵨ) 尽可能接近原始权重 (WᵨXᵨ)。换句话说，我们想要找到：

人们提出了不同的方法来解决这个问题，但我们对这里的最优大脑量化器（OBQ：Optimal Brain Quantizer）框架感兴趣。

该方法的灵感来自于一种修剪（pruning）技术，该技术可以仔细地从经过充分训练的密集神经网络（最佳脑外科医生）中去除权重。它使用近似技术，并为要删除的最佳单个权重 w和最佳更新 δ提供显式公式，以调整剩余非量化权重 F 的集合以弥补删除：

其中 quant(w) 是量化给出的权重舍入，H 是 Hessian 矩阵。

使用 OBQ，我们可以首先量化最简单的权重，然后调整所有剩余的非量化权重以补偿这种精度损失。然后我们选择下一个要量化的权重，依此类推。

这种方法的一个潜在问题是当存在异常权重时，这可能会导致高量化误差。通常，当剩下很少的非量化权重可以调整以补偿大误差时，这些离群值将最后被量化。当一些权重因中间更新而被进一步推到网格之外时，这种效果可能会恶化。应用一个简单的启发式方法来防止这种情况：异常值一出现就被量化。

这个过程的计算量可能很大，尤其是对于KKM而言。为了解决这个问题，OBQ 方法使用了一种技巧，可以避免每次简化权重时都重新进行整个计算。量化权重后，它通过删除与该权重关联的行和列（使用高斯消除）来调整计算中使用的矩阵（Hessian）：

该方法还采用矢量化来一次处理多行权重矩阵。尽管其效率很高，但 OBQ 的计算时间随着权重矩阵大小的增加而显着增加。这种立方增长使得在具有数十亿参数的大型模型上使用 OBQ 变得困难。

2、GPTQ 算法

由 Frantar 等人提出，GPTQ 算法从 OBQ 方法中汲取灵感，但进行了重大改进，以将其扩展到（非常）大型语言模型。

第 1 步：任意排序洞察

OBQ 方法按一定的顺序选择权重（模型中的参数）进行量化，所确定的权重将增加最少的附加误差。然而，GPTQ 观察到，对于大型模型，以任何固定顺序量化权重都可以获得同样的效果。这是因为，即使某些权重可能会单独引入更多误差，但它们会在过程中稍后进行量化，因为此时几乎没有其他权重可能会增加误差。所以顺序并不像我们想象的那么重要。

基于这一见解，GPTQ 旨在以相同的顺序量化矩阵所有行的所有权重。这使得过程更快，因为某些计算只需为每列执行一次，而不是为每个权重执行一次。

第 2 步：惰性批量更新

该方案不会很快，因为它需要更新一个巨大的矩阵，并且每个条目的计算量很少。此类操作无法充分利用 GPU 的计算能力，并且会因内存限制（内存吞吐量瓶颈）而减慢速度。

为了解决这个问题，GPTQ 引入了“惰性批量”更新。事实证明，给定列的最终舍入决策仅受对该列执行的更新的影响，而不受后续列上执行的更新的影响。因此，GPTQ 可以一次将该算法应用于一批列（例如 128 列），仅更新这些列和矩阵的相应块。完全处理一个块后，算法对整个矩阵执行全局更新。

步骤 3：Cholesky 重构

然而，还有一个问题需要解决。当算法扩展到非常大的模型时，数值不准确可能会成为一个问题。具体来说，重复应用某个运算可能会累积数值误差。

为了解决这个问题，GPTQ 使用 Cholesky 分解，这是一种用于解决某些数学问题的数值稳定方法。它涉及使用 Cholesky 方法从矩阵中预先计算一些所需的信息。这种方法与轻微的“阻尼”（向矩阵的对角元素添加一个小常数）相结合，有助于算法避免数值问题。

完整的算法可以概括为以下几个步骤：

GPTQ 算法从 Hessian 逆矩阵（帮助决定如何调整权重的矩阵）的 Cholesky 分解开始
然后它循环运行，一次处理一批列。
对于批次中的每一列，它都会量化权重，计算误差，并相应地更新块中的权重。
处理完该批次后，它会根据块的错误更新所有剩余的权重。

GPTQ 算法在各种语言生成任务上进行了测试。它与其他量化方法进行了比较，例如将所有权重四舍五入到最接近的量化值（RTN）。 GPTQ 与 BLOOM（176B 参数）和 OPT（175B 参数）模型系列一起使用，并使用单个 NVIDIA A100 GPU 对模型进行量化。

3、使用 AutoGPTQ 量化 LLM

GPTQ 在创建可在 GPU 上高效运行的 4 位精度模型方面非常流行。你可以在 Hugging Face Hub 上找到许多示例，尤其是来自 TheBloke 的示例。如果你正在寻找一种对 CPU 更友好的方法，GGML 目前是你的最佳选择。最后，带有 bitsandbytes 的 Transformer 库允许你在使用 load_in_4bit=true 参数加载模型时对其进行量化，这需要下载完整模型并将其存储在 RAM 中。

让我们使用 AutoGPTQ 库实现 GPTQ 算法并量化 GPT-2 模型。这需要 GPU，但 Google Colab 上的免费 T4 就可以了。我们首先加载库并定义我们想要量化的模型（在本例中为 GPT-2）。

!BUILD_CUDA_EXT=0 pip install -q auto-gptq transformers

import random

from auto_gptq import AutoGPTQForCausalLM, BaseQuantizeConfig
from datasets import load_dataset
import torch
from transformers import AutoTokenizer


# Define base model and output directory
model_id = "gpt2"
out_dir = model_id + "-GPTQ"

我们现在要加载模型和分词器。分词器是使用 Transformers 库中的经典 AutoTokenizer 类加载的。另一方面，我们需要传递特定的配置（BaseQuantizeConfig）来加载模型。

在此配置中，我们可以指定要量化的位数（此处，bits=4）和组大小（惰性批次的大小）。请注意，该组大小是可选的：我们还可以对整个权重矩阵使用一组参数。在实践中，这些组通常以非常低的成本提高量化质量（特别是在 group_size=1024 的情况下）。此处的 hum_percent 值用于帮助 Cholesky 重新公式化，不应更改。

最后，desc_act（也称为行为顺序）是一个棘手的参数。它允许你根据减少的激活来处理行，这意味着首先处理最重要或最有影响力的行（由采样的输入和输出确定）。该方法旨在将大部分量化误差（在量化过程中不可避免地引入）置于不太重要的权重上。这种方法通过确保以更高的精度处理最重要的权重，提高了量化过程的整体准确性。然而，当与组大小一起使用时，由于需要频繁重新加载量化参数，desc_act 可能会导致性能下降。因此，我们不会在这里使用它（但是将来可能会修复它）。

# Load quantize config, model and tokenizer
quantize_config = BaseQuantizeConfig(
    bits=4,
    group_size=128,
    damp_percent=0.01,
    desc_act=False,
)
model = AutoGPTQForCausalLM.from_pretrained(model_id, quantize_config)
tokenizer = AutoTokenizer.from_pretrained(model_id)

量化过程很大程度上依赖于样本来评估和提高量化质量。它们提供了一种比较原始模型和新量化模型产生的输出的方法。提供的样本数量越多，进行更准确和有效比较的潜力就越大，从而提高量化质量。

在本文中，我们利用 C4（Colossal Clean Crawled Corpus）数据集来生成样本。 C4 数据集是从 Common Crawl 项目收集的大规模、多语言的网络文本集合。这个庞大的数据集经过专门清理和准备，用于训练大规模语言模型，使其成为此类任务的重要资源。维基文本数据集是另一个流行的选择。

在下面的代码块中，我们从 C4 数据集中加载 1024 个样本，对它们进行标记并格式化。

# Load data and tokenize examples
n_samples = 1024
data = load_dataset("allenai/c4", data_files="en/c4-train.00001-of-01024.json.gz", split=f"train[:{n_samples*5}]")
tokenized_data = tokenizer("\n\n".join(data['text']), return_tensors='pt')

# Format tokenized examples
examples_ids = []
for _ in range(n_samples):
    i = random.randint(0, tokenized_data.input_ids.shape[1] - tokenizer.model_max_length - 1)
    j = i + tokenizer.model_max_length
    input_ids = tokenized_data.input_ids[:, i:j]
    attention_mask = torch.ones_like(input_ids)
    examples_ids.append({'input_ids': input_ids, 'attention_mask': attention_mask})

现在数据集已准备就绪，我们可以开始批大小为 1 的量化过程。我们还可以选择使用 OpenAI Triton（CUDA 的替代方案）与 GPU 进行通信。完成此操作后，我们将分词器和模型保存为安全张量格式。

# Quantize with GPTQ
model.quantize(
    examples_ids,
    batch_size=1,
    use_triton=True,
)

# Save model and tokenizer
model.save_quantized(out_dir, use_safetensors=True)
tokenizer.save_pretrained(out_dir)

像往常一样，然后可以使用 AutoGPTQForCausalLM 和 AutoTokenizer 类从输出目录加载模型和标记生成器。

device = "cuda:0" if torch.cuda.is_available() else "cpu"

# Reload model and tokenizer
model = AutoGPTQForCausalLM.from_quantized(
    out_dir,
    device=device,
    use_triton=True,
    use_safetensors=True,
)
tokenizer = AutoTokenizer.from_pretrained(out_dir)

让我们检查一下模型是否正常工作。 AutoGPTQ 模型（大部分）作为普通transformer模型工作，这使得它与推理管道兼容，如以下示例所示：

from transformers import pipeline

generator = pipeline('text-generation', model=model, tokenizer=tokenizer)
result = generator("I have a dream", do_sample=True, max_length=50)[0]['generated_text']
print(result)

I have a dream," she told CNN last week. "I have this dream of helping my mother find her own. But, to tell that for the first time, now that I'm seeing my mother now, just knowing how wonderful it is that

我们成功地从量化的 GPT-2 模型中获得了令人信服的完成结果。更深入的评估需要测量量化模型与原始模型的复杂度。但是，我们将其排除在本文的讨论范围之外。

4、结束语

在本文中，我们介绍了 GPTQ 算法，这是一种在消费级硬件上运行 LLM 的最先进的量化技术。我们展示了它如何基于具有任意顺序洞察、惰性批量更新和 Cholesky 重构的改进 OBS 技术来解决分层压缩问题。这种新颖的方法显着降低了内存和计算需求，使LLM可供更广泛的受众使用。

此外，我们在免费的 T4 GPU 上量化了我们自己的 LLM 模型，并运行它来生成文本。你可以在 Hugging Face Hub 上推送自己的 GPTQ 4 位量化模型版本。正如简介中提到的，GPTQ 并不是唯一的 4 位量化算法：GGML 和 NF4 都是优秀的替代方案，但范围略有不同。我鼓励你更多地了解它们并尝试一下！

原文链接：GPTQ 4位量化实战 - BimAnt

html.partial mvc5,[ASP.NET Core Razor Pages系列教程]ASP.NET Core Razor Pages中的Partial Views(部分视图)(04)... 安静的小屁孩儿 html.partial mvc5
PartialViews(部分视图)什么是PartialViews?PartialViews(之后统称:部分视图)是包含了HTML代码片段和服务端代码的Razor文件，它同样以.cshtml为扩展名。部分视图可以被包含在任意数量的页面或者布局中。部分视图可以用来将复杂的页面分解成更小的单元，从而减少复杂性，同时也可以在团队开发中被复用。什么时候使用部分视图(PartialViews)部分视图可以处
ASP.NET Web的 Razor Pages应用，配置热重载，解决.NET Core MVC 页面在更改后不刷新坐望云起开发语言 asp.net 前端后端 Razor Pages mvc .net core
RazorPages应用，修改页面查看修改效果，如果没有热重载，改一句话跑一次，这个活就没法干了。1、VS2022中的NuGet中安装RuntimeCompilationMicrosoft.AspNetCore.Mvc.Razor.RuntimeCompilation需要配套你的.netsdk版本，我这里用的是6.0，所以这个也用了6.0.0。2、找到你的Properties\launchSett
事务回滚核心技术 KBkongbaiKB java
一、事务回滚的数学本质与核心挑战1.1事务状态机模型操作执行持久化完成系统故障事务回滚ActivePartiallyCommittedCommittedFailedAborted1.2核心技术挑战矩阵问题维度单机事务分布式事务原子性保证存储引擎WAL日志二阶段提交协议隔离性实现MVCC多版本控制全局锁调度机制可见性管理事务ID版本链向量时钟同步回滚触发条件SQL执行异常/死锁网络分区/节点故障二、
Spring的JavaWeb三层架构可问可问春风 JAVA SSM框架 spring 架构 java
Spring三层架构的核心注解及协作在Spring的JavaWeb三层架构中，通过分层注解实现职责分离和组件管理，各层（表现层、业务层、数据访问层）的协作基于组件扫描和依赖注入（DI）机制。以下是各层的核心注解及其协作关系：1.分层架构与对应注解层级职责注解关联技术表现层处理用户请求，返回响应@Controller/@RestControllerSpringMVC,RESTfulAPI业务层实现业
MySQL 的多版本并发控制潇湘馆记 mysql 数据库
MySQL的多版本并发控制（MVCC）详解1.什么是MVCC？MVCC（Multi-VersionConcurrencyControl，多版本并发控制）是MySQLInnoDB引擎的一种并发控制机制，通过保存数据的多个版本，允许不同事务读取不同的数据版本，从而减少锁冲突，提高并发性能。2.MVCC主要用于哪种隔离级别？支持REPEATABLEREAD（可重复读）和READCOMMITTED（读已提
spring MVC 介绍 LCY133 spring后端 spring mvc java
SpringMVC是Spring框架中用于构建Web应用的核心模块，基于MVC设计模式（Model-View-Controller）实现。以下是其核心概念的整理：1.MVC设计模式•Model（模型）：封装业务数据和业务逻辑（如POJO对象、Service层）。•View（视图）：负责数据展示（如JSP、Thymeleaf、HTML）。•Controller（控制器）：接收请求，调用业务逻辑，返回
Spring Boot详解这河里吗l SpringBoot spring boot 后端 java spring
目录1.SpringBoot介绍1.1什么是SpringBoot1.2SpringBoot特点1.3Javaweb、spring、springmvc和springboot有什么区别？1.4SpringBoot的Starter2.SpringBoot入门HelloWorld3.SpringBoot的全局配置文件3.1properties配置文件3.2yml配置文件3.3yml与properties的
【元婴境】mysql的MVCC（详解） jstart千语 mysql 数据库
目录MVCC介绍隐藏字段undologReadView示例：流程总结MVCC介绍大家好，我是jstart千语。上篇我们讲到mysql的事务隔离级别，其中MVCC就是控制事务隔离级别的重要组成部分，也是实现事务四大特性之一隔离性的重要手段。那么接下来我将通透地讲解MVCC，让大家对mysql的隔离性有一个更深刻的理解。MVCC全称Multi-VersionConcurrencyControl，也就是
TinyMCE插件是否支持Word图片的直接复制与web上传？ 2501_90694782 umeditor粘贴word ueditor粘贴word ueditor复制word ueditor上传word图片 ueditor导入word ueditor导入pdf ueditor导入ppt
要求：开源，免费，技术支持编辑器：TinyMCE前端：vue,vue2-cli,vue3-cli后端：java,jsp,springboot,asp.net,php,asp,.netcore,.netmvc,.netform功能：导入Word,导入Excel,导入PPT(PowerPoint),导入PDF,复制粘贴word,导入微信公众号内容,web截屏平台：Windows,macOS,Linux
Java复习路线 Code good g 面试准备 java mysql 数据库
Java复习1、Java基础2、Java多线程3、Javaweb的复习4、MySql复习数据库常用的代码：思维导图：5、计算机组成原理6、网络编程7、Java注解和反射8、计算机网络9、html/css/js10、ssm11、spring12、springmvc13、springboot14、vue15、springcloud16、jvm17、Juc18、mybatis-plus学习19、git2
从MVC实战学习网站编写（一）初识MVC 璞瑜无文 MVC 架构 mvc 设计结构
前情概要：曾是学生时代的我，初识架构是一个传说中的三层架构。这可是鼻祖啊！因为我个人认为这是第一个让我明白高内聚低耦合的一种写代码的方式。刚接触写程序统统都是把所有的东西放一起，自己找一段代码得花很长时间（哪个时候还不知道VS有F12的存在）。简单的说就是UI层（界面），BLL层（业务处理），DAL层（数据处理）。就是分工明确在不同的包里分别编译，便于管理。今天我们从MVC基础开始穿插Knocko
asp.net mvc mysql 开源项目_【开源项目SugarSite】ASP.NET MVC+ Layui+ SqlSugar+RestSharp项目讲解... weixin_39805732 asp.net mvc mysql 开源项目
SugarSite一个前端支持移动端的企业网站，目前只支持了简单功能，后续还会加上论坛等。源码GIT地址：技术介绍Layui个人而言不喜欢引用一堆东西，越简洁越好，layui正好能够满足我的这种需求，它是一款轻量级UI，JS部分都是采用模块化设计(AMD)，对移动端支持比较不错。唯一不足是目前支持的组件有些少，需要有一定前端扩展能力的人才可以顺心使用。用法：例如我想用form.js和uploda.
C#电子相册：面向对象设计与架构实践金融先生-Frank
本文还有配套的精品资源，点击获取简介：C#电子相册是一个使用高级编程语言C#开发的Windows平台应用程序。该项目采用面向对象编程方法，将对象如照片和相册封装、继承和多态地组织起来。它可能采用了MVC、MVVM或MVP架构模式，并使用.NETFramework或.NETCore以及VisualStudio作为开发环境。数据库管理部分涉及SQL数据库，支持相册数据的存储与检索。文件列表中的"eri
基于ssm的林木生长管理系统 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战计算计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍在我们的日常生活中，森林资源的管理和保护是一个重要的环保议题。为了有效地管理森林资源，许多科研机构和政府部门正在寻找更高效的技术手段。这就是我们今天要讨论的主题：基于SSM的林木生长管理系统。SSM是SpringMVC、Spring和MyBatis三个开源框架的缩写。这三个框架在Java开发中被广泛使用，因为它们可以提供一种简单、高效的方式来开发和维护复杂的Web应用程序。在这篇文章中
金融、教育等行业如何高效利用wangEditor实现word文档网页化编辑？ 2501_90699850 金融 word umeditor粘贴word ueditor粘贴word ueditor复制word ueditor上传word图片 ueditor导入word
要求：开源，免费，技术支持编辑器：wangEditor前端：vue2,vue3,vue-cli,html5后端：java,jsp,springboot,asp.net,php,asp,.netcore,.netmvc,.netform群体：学生,个人用户,外包,自由职业者,中小型网站,博客,场景：数字门户,数字中台,站群,内网，外网，信创国产化环境，web截屏行业：医疗，教育，建筑，政府，党政，国
SpringBoot集成Swagger3.0 邪神大叔 Java Mac SpringBoot swagger3.0 java springboot
pom.xmlio.springfoxspringfox-boot-starter3.0.0SwaggerConfig/***@author:zek*@desc:swagger*/@EnableOpenApi@ConfigurationpublicclassSwaggerConfigimplementsWebMvcConfigurer{@BeanpublicDocketcreateRestApi(
领域驱动设计（DDD）与MVC架构：理念对比与架构选择以恒1 mvc 架构
领域驱动设计（DDD）与MVC架构：理念对比与架构选择一、架构之争的本质：业务复杂度驱动技术演进在软件开发领域，没有银弹式的完美架构，只有适合当前业务场景的合理选择。MVC与DDD的区别本质上是业务复杂度与架构响应能力的匹配问题。让我们通过一个真实案例展开思考：案例背景某金融科技公司初期采用MVC架构开发支付系统，随着业务扩展，新增跨境支付、分账系统、风控规则等功能后，代码库逐渐演变成"大泥球"架
SpringBoot、Spring、SpringMVC原理梳理猛猛开发笔记 java spring
SpringBoot、Spring、SpringMVC原理梳理文章目录SpringBoot、Spring、SpringMVC原理梳理Spring、SpringMVC、SpringBoot三者的关系：Spring和SpringMVC：SpringBoot、Spring：SpringMVC的DispatchServlet解析DispatchServlet初始化：initServletBeaninitW
springmvc中如何自定义入参注解并自动注入值红豆和绿豆 Spring mvc
在Spring中，`HandlerMethodArgumentResolver`是一个非常强大的接口，用于自定义控制器方法参数的解析逻辑。以下是一个完整的示例，展示如何使用`HandlerMethodArgumentResolver`并结合自定义注解来实现特定的参数解析逻辑。###**1.定义自定义注解**首先，定义一个自定义注解，用于标记需要特殊处理的参数。例如，定义一个`@CurrentUse
SpringMVC系列之整合Thymeleaf【Thymeleaf整合springmvc介绍及Thymeleaf基础概念、使用语法详解】吕鑫洋 SpringMVC系列 java html js spring mvc
Thymeleaf是java的模板引擎，可以将动态页面静态化；目前使用较多的模板引擎：Velocity、Freemarker、Thymeleaf一、Maven依赖Thymeleaf整合springmvc共需要两个jar：1.thymeleaf2.thymeleaf-spring5org.thymeleafthymeleaf3.0.9.RELEASEorg.thymeleafthymeleaf-sp
【＜二＞丹方改良：Spring 时代的 JavaWeb】之 Spring MVC 的核心组件：DispatcherServlet 的工作原理 Foyo Designer spring mvc java servlet HandlerMapping ViewResolver
点击此处查看合集https://blog.csdn.net/foyodesigner/category_12907601.html?fromshare=blogcolumn&sharetype=blogcolumn&sharerId=12907601&sharerefer=PC&sharesource=FoyoDesigner&sharefrom=from_link一、DispatcherServ
php 高性能，高并发，有哪些框架，扩展，推荐一下，或者技术的实现有哪些行思理运维 LNMP Linux php 开发语言
以下是针对PHP高性能、高并发场景的框架、扩展及技术实现推荐，结合最新技术趋势和行业实践进行总结：一、高性能框架推荐1.C扩展类框架YAF(YetAnotherFramework)特点：由C语言编写，直接嵌入PHP内核，仅提供核心MVC功能，执行效率极高（RPS可达3000+），适合API网关、秒杀系统等场景213。适用场景：对性能要求极高但功能需求简单的项目，如百度、微博部分业务曾采用其修改版。
SpringBoot测试：@SpringBootTest与MockMvc的实战应用程序媛学姐 Spring 全家桶 Java spring boot 后端 java
文章目录引言一、SpringBoot测试基础1.1测试环境配置1.2测试目录结构二、@SpringBootTest注解详解2.1基本用法与配置选项2.2不同WebEnvironment模式的应用场景三、MockMvc实战应用3.1MockMvc基本使用方法3.2高级请求构建和响应验证四、模拟服务层与依赖4.1使用@MockBean模拟服务4.2测试异常处理和边界情况五、测试最佳实践5.1测试数据准
C#基于MVC模式实现TCP三次握手，附带简易日志管理模块风，停下 C#设计模式网络协议 c#mvc tcp/ip
C#基于MVC模式实现TCP三次握手1Model1.1ServerModel1.2ClientModel1.3配置参数模块1.4日志管理模块1.4.1数据结构1.4.1日志管理工具类1.4.1日志视图展示1.4.1.1UcLogManage.cs1.4.1.2UcLogManage.Designer.cs2视图（View）2.1ViewServer2.1.1ViewServer.cs2.1.1Vi
事务隔离性如何保证？努力向前ing MySQL八股详究数据库 MySQL 事务
事务隔离性如何保证？1.通过锁2.通过MVCC（事务隔离级别无锁的实现方式，用于提高事务的性能）不加锁性能肯定比加锁要高。如何通过MVCC实现事务隔离性？什么是MVCC？MVCC多版本并发控制。通过维护多版本的数据，以不加锁的方式实现事务的隔离性，本质上是CAS操作，是一种乐观锁的思想。MVCC实现事务隔离级别的流程：关键概念：1.隐藏字段：DB_TRX_ID：事务id，roll_pointer:
Springboot启动失败：解决「org.yaml.snakeyaml.error.YAMLException」报错全记录 -天凉好秋- spring boot java idea visual studio code
##关键字Java、Springboot、vscode、idea、nacos启动失败、YAMLException、字符集配置---##背景环境###项目架构-**框架**：SSM（Spring+SpringMVC+MyBatis）-**中间件**：Nacos（配置管理+服务发现）-**配置存储**：Nacos中存储了Springboot的配置，包括：数据库连接信息、Redis连接信息、服务配置等。
超越传统！wangEditor编辑器如何实现excel、ppt、pdf及word一键导入？ 2501_90699780 编辑器 excel powerpoint umeditor粘贴word ueditor粘贴word ueditor复制word ueditor上传word图片
要求：开源，免费，技术支持编辑器：wangEditor前端：vue2,vue3,vue-cli,html5后端：java,jsp,springboot,asp.net,php,asp,.netcore,.netmvc,.netform群体：学生,个人用户,外包,自由职业者,中小型网站,博客,场景：数字门户,数字中台,站群,内网，外网，信创国产化环境，web截屏行业：医疗，教育，建筑，政府，党政，国
laravel基础 m0_65977885 lavarel
#laravel基础###一、MVC设计模式在php的的主流框架中，大多都采用MVC的设计模式，它可以将代码解耦，让视图代码和逻辑代码分开编写，为后期的维护带来了极大的便利。**MVC是模型（model）、视图（view）、控制器（controller）是组合**，它表示将软件系统分成3个核心部分。-模型model，用于数据处理-视图view，用于显示数据-控制器controller，接收用户请求
【SpringMVC】_简单示例计算器 _周游 Spring JavaEE java-ee mvc spring
目录1.需求分析2.接口定义3.请求参数4.响应数据5.服务器代码6.前端页面代码7.运行测试为阶段性总结与应用，现将以SpringMVC项目创建一个可以实现加法的计算器为例1.需求分析加法计算器功能，对两个整数进行相加，需要客户端提供参与计算的两个数，服务器返回这两个整数计算的结果。2.接口定义（1）请求路径：cala/sum（2）请求方式：GET/POST（3）接口描述：计算两个整数相加3.请
用SpringMvc做一个简易计算器 little 源 springmvc
用SpringMvc做一个简易计算器一.domain类packagessm1.domain;publicclassJiSuan{privateintnumOne;privateintnumTwo;privateStringyunSuan;privateintresult;publicintgetNumOne(){returnnumOne;}publicvoidsetNumOne(intnumOne
用MiddleGenIDE工具生成hibernate的POJO（根据数据表生成POJO类） AdyZhang POJO eclipse Hibernate MiddleGenIDE
推荐:MiddlegenIDE插件, 是一个Eclipse 插件. 用它可以直接连接到数据库, 根据表按照一定的HIBERNATE规则作出BEAN和对应的XML ，用完后你可以手动删除它加载的JAR包和XML文件! 今天开始试着使用
.9.png Cb123456 android
“点九”是andriod平台的应用软件开发里的一种特殊的图片形式，文件扩展名为：.9.png 　　智能手机中有自动横屏的功能,同一幅界面会在随着手机(或平板电脑)中的方向传感器的参数不同而改变显示的方向,在界面改变方向后,界面上的图形会因为长宽的变化而产生拉伸,造成图形的失真变形。　　我们都知道android平台有多种不同的分辨率，很多控件的切图文件在被放大拉伸后，边
算法的效率天子之骄算法效率复杂度最坏情况运行时间大O阶平均情况运行时间
算法的效率效率是速度和空间消耗的度量。集中考虑程序的速度，也称运行时间或执行时间，用复杂度的阶(O)这一标准来衡量。空间的消耗或需求也可以用大O表示，而且它总是小于或等于时间需求。以下是我的学习笔记： 1.求值与霍纳法则，即为秦九韶公式。 2.测定运行时间的最可靠方法是计数对运行时间有贡献的基本操作的执行次数。运行时间与这个计数成正比。
java数据结构何必如此 java 数据结构
Java 数据结构 Java工具包提供了强大的数据结构。在Java中的数据结构主要包括以下几种接口和类：枚举（Enumeration）位集合（BitSet）向量（Vector）栈（Stack）字典（Dictionary）哈希表（Hashtable）属性（Properties）以上这些类是传统遗留的，在Java2中引入了一种新的框架-集合框架(Collect
MybatisHelloWorld 3213213333332132
//测试入口TestMyBatis package com.base.helloworld.test; import java.io.IOException; import org.apache.ibatis.io.Resources; import org.apache.ibatis.session.SqlSession; import org.apache.ibat
Java|urlrewrite|URL重写|多个参数 7454103 java xml Web 工作
个人工作经验！如有不当之处，敬请指点 1.0 web -info 目录下建立 urlrewrite.xml 文件类似如下： <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE u
达梦数据库+ibatis darkranger sql mysql ibatis SQL Server
--插入数据方面如果您需要数据库自增... 那么在插入的时候不需要指定自增列. 如果想自己指定ID列的值, 那么要设置 set identity_insert 数据库名.模式名.表名; ----然后插入数据; example: create table zhabei.test( id bigint identity(1,1) primary key, nam
XML 解析四种方式 aijuans android
XML现在已经成为一种通用的数据交换格式,平台的无关性使得很多场合都需要用到XML。本文将详细介绍用Java解析XML的四种方法。 XML现在已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。对于XML本身的语法知识与技术细节,需要阅读相关的技术文献,这里面包括的内容有DOM(Document Object
spring中配置文件占位符的使用 avords
1.类 <?xml version="1.0" encoding="UTF-8"?><!DOCTYPE beans PUBLIC "-//SPRING//DTD BEAN//EN" "http://www.springframework.o
前端工程化-公共模块的依赖和常用的工作流 bee1314 webpack
题记：一个人的项目，还有工程化的问题嘛？我们在推进模块化和组件化的过程中，肯定会不断的沉淀出我们项目的模块和组件。对于这些沉淀出的模块和组件怎么管理？另外怎么依赖也是个问题？你真的想这样嘛？ var BreadCrumb = require(‘../../../../uikit/breadcrumb’); //真心ugly。
上司说「看你每天准时下班就知道你工作量不饱和」，该如何回应？ bijian1013 项目管理沟通 IT职业规划
问题：上司说「看你每天准时下班就知道你工作量不饱和」，如何回应正常下班时间6点，只要是6点半前下班的，上司都认为没有加班。 Eno-Bea回答，注重感受，不一定是别人的虽然我不知道你具体从事什么工作与职业，但是我大概猜测，你是从事一项不太容易出现阶段性成果的工作
TortoiseSVN，过滤文件征客丶 SVN
环境： TortoiseSVN 1.8 配置：在文件夹空白处右键选择 TortoiseSVN -> Settings 在 Global ignote pattern 中添加要过滤的文件：多类型用英文空格分开 *name ：过滤所有名称为 name 的文件或文件夹 *.name ：过滤所有后缀为 name 的文件或文件夹 --------
【Flume二】HDFS sink细说 bit1129 Flume
1. Flume配置 a1.sources=r1 a1.channels=c1 a1.sinks=k1 ###Flume负责启动44444端口 a1.sources.r1.type=avro a1.sources.r1.bind=0.0.0.0 a1.sources.r1.port=44444 a1.sources.r1.chan
The Eight Myths of Erlang Performance bookjovi erlang
erlang有一篇guide很有意思： http://www.erlang.org/doc/efficiency_guide 里面有个The Eight Myths of Erlang Performance： http://www.erlang.org/doc/efficiency_guide/myths.html Myth: Funs are sl
java多线程网络传输文件(非同步)-2008-08-17 ljy325 java 多线程 socket
利用 Socket 套接字进行面向连接通信的编程。客户端读取本地文件并发送；服务器接收文件并保存到本地文件系统中。使用说明:请将TransferClient, TransferServer, TempFile三个类编译，他们的类包是FileServer. 客户端: 修改TransferClient: serPort, serIP, filePath, blockNum,的值来符合您机器的系
读《研磨设计模式》-代码笔记-模板方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.ResultSet;
配置心得 chenyu19891124 配置
时间就这样不知不觉的走过了一个春夏秋冬，转眼间来公司已经一年了，感觉时间过的很快，时间老人总是这样不停走，从来没停歇过。作为一名新手的配置管理员，刚开始真的是对配置管理是一点不懂，就只听说咱们公司配置主要是负责升级，而具体该怎么做却一点都不了解。经过老员工的一点点讲解，慢慢的对配置有了初步了解，对自己所在的岗位也慢慢的了解。做了一年的配置管理给自总结下： 1.改变从一个以前对配置毫无
对“带条件选择的并行汇聚路由问题”的再思考 comsci 算法工作软件测试嵌入式领域模型
2008年上半年，我在设计并开发基于”JWFD流程系统“的商业化改进型引擎的时候，由于采用了新的嵌入式公式模块而导致出现“带条件选择的并行汇聚路由问题”(请参考2009-02-27博文)，当时对这个问题的解决办法是采用基于拓扑结构的处理思想，对汇聚点的实际前驱分支节点通过算法预测出来，然后进行处理，简单的说就是找到造成这个汇聚模型的分支起点，对这个起始分支节点实际走的路径数进行计算，然后把这个实际
Oracle 10g 的clusterware 32位下载地址 daizj oracle
Oracle 10g 的clusterware 32位下载地址 http://pan.baidu.com/share/link?shareid=531580&uk=421021908 http://pan.baidu.com/share/link?shareid=137223&uk=321552738 http://pan.baidu.com/share/l
非常好的介绍：Linux定时执行工具cron dongwei_6688 linux
Linux经过十多年的发展，很多用户都很了解Linux了，这里介绍一下Linux下cron的理解，和大家讨论讨论。cron是一个Linux 定时执行工具，可以在无需人工干预的情况下运行作业，本文档不讲cron实现原理，主要讲一下Linux定时执行工具cron的具体使用及简单介绍。新增调度任务推荐使用crontab -e命令添加自定义的任务（编辑的是/var/spool/cron下对应用户的cr
Yii assets目录生成及修改 dcj3sjt126com yii
assets的作用是方便模块化，插件化的，一般来说出于安全原因不允许通过url访问protected下面的文件，但是我们又希望将module单独出来，所以需要使用发布，即将一个目录下的文件复制一份到assets下面方便通过url访问。 assets设置对应的方法位置 \framework\web\CAssetManager.php assets配置方法在m
mac工作软件推荐 dcj3sjt126com mac
mac上的Terminal + bash ＋ screen组合现在已经非常好用了，但是还是经不起iterm＋zsh＋tmux的冲击。在同事的强烈推荐下，趁着升级mac系统的机会，顺便也切换到iterm＋zsh＋tmux的环境下了。我为什么要要iterm2 切换过来也是脑袋一热的冲动，我也调查过一些资料，看了下iterm的一些优点： * 兼容性好，远程服务器 vi 什么的低版本能很好兼
Memcached(三)、封装Memcached和Ehcache frank1234 memcached ehcache spring ioc
本文对Ehcache和Memcached进行了简单的封装，这样对于客户端程序无需了解ehcache和memcached的差异，仅需要配置缓存的Provider类就可以在二者之间进行切换，Provider实现类通过Spring IoC注入。 cache.xml <?xml version="1.0" encoding="UTF-8"?>
Remove Duplicates from Sorted List II hcx2013 remove
Given a sorted linked list, delete all nodes that have duplicate numbers, leaving only distinct numbers from the original list. For example,Given 1->2->3->3->4->4->5,
Spring4新特性——注解、脚本、任务、MVC等其他特性改进 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
MySQL安装文档 liyong0802 mysql
工作中用到的MySQL可能安装在两种操作系统中，即Windows系统和Linux系统。以Linux系统中情况居多。安装在Windows系统时与其它Windows应用程序相同按照安装向导一直下一步就即，这里就不具体介绍，本文档只介绍Linux系统下MySQL的安装步骤。 Linux系统下安装MySQL分为三种：RPM包安装、二进制包安装和源码包安装。二
使用VS2010构建HotSpot工程 p2p2500 HotSpot OpenJDK VS2010
1. 下载OpenJDK7的源码： http://download.java.net/openjdk/jdk7 http://download.java.net/openjdk/ 2. 环境配置 ▶
Oracle实用功能之分组后列合并 seandeng888 oracle 分组实用功能合并
1 实例解析由于业务需求需要对表中的数据进行分组后进行合并的处理，鉴于Oracle10g没有现成的函数实现该功能，且该功能如若用JAVA代码实现会比较复杂，因此，特将SQL语言的实现方式分享出来，希望对大家有所帮助。如下：表test 数据如下： ID,SUBJECTCODE,DIMCODE,VALUE 1&nbs
Java定时任务注解方式实现 tuoni java spring jvm xml jni
Spring 注解的定时任务，有如下两种方式：第一种： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http
11大Java开源中文分词器的使用方法和分词效果对比 yangshangchuan word分词器 ansj分词器 Stanford分词器 FudanNLP分词器 HanLP分词器
本文的目标有两个： 1、学会使用11大Java开源中文分词器 2、对比分析11大Java开源中文分词器的分词效果本文给出了11大Java开源中文分词的使用方法以及分词结果对比代码，至于效果哪个好，那要用的人结合自己的应用场景自己来判断。 11大Java开源中文分词器，不同的分词器有不同的用法，定义的接口也不一样，我们先定义一个统一的接口： /** * 获取文本的所有分词结果, 对比

LLM大模型4位量化实战【GPTQ】

1、最优大脑量化

2、GPTQ 算法

3、使用 AutoGPTQ 量化 LLM

4、结束语

你可能感兴趣的:(mvc)