数据拾光者

广告行业中那些趣事系列6：BERT线上化ALBERT优化原理及项目实践(附github)

摘要：BERT因为效果好和适用范围广两大优点，所以在NLP领域具有里程碑意义。实际项目中主要使用BERT来做文本分类任务，其实就是给文本打标签。因为原生态BERT预训练模型动辄几百兆甚至上千兆的大小，模型训练速度非常慢，对于BERT模型线上化非常不友好。本篇研究目前比较火的BERT最新派生产品ALBERT来完成BERT线上化服务。ALBERT使用参数减少技术来降低内存消耗从而最终达到提高BERT的训练速度，并且在主要基准测试中均名列前茅，可谓跑的快，还跑的好。希望对需要将BERT线上化感兴趣的小伙伴有些许帮助。

目录
01 项目背景介绍
02 从BERT到ALBERT
03 万里第一步：先跑通模型
04 多分类任务实践
总结

01 项目背景介绍

原生态BERT预训练模型动辄几百兆甚至上千兆的大小，训练速度非常慢，对于模型线上化非常不友好。为了实现BERT模型线上化问题，其实就是如何又快有好的训练模型，经调研目前超火的BERT最新派生产品ALBERT项目能很好的解决上述问题。

ALBERT是由论文《ALBERT: A Lite BERT For Self-Supervised Learningof Language Representations》提出来的。通常情况下增加预训练模型大小可以提升模型在下游任务中的性能，但是因为“GPU/TPU内存的限制、更长的训练时间以及意想不到的模型退化”等问题，作者提出了ALBERT模型。

论文下载地址：
https://arxiv.org/pdf/1909.11942.pdf

通俗的理解ALBERT就是参数数量更少的轻量级BERT模型。ALBERT是BERT最新派生产品，虽然轻量，但是效果并没打折，在主要基准测试中均名列前茅。

02 从BERT到ALBERT

1. ALBERT出现背景

自从深度学习引爆计算机视觉领域之后，提升模型性能最简单也最有效的一个方法就是增加网络深度。下图中拿图片分类任务举例，可以看出随着网络层数不断增加，模型的效果也会有很大提升：

图1 网络层数增加模型效果提升

同样的情况也出现在BERT上，随着网络变深变宽使得模型的效果得到提升：

图2 BERT随着网络变深变宽模型效果得到提升

但是网络变深变宽带来一个显著的问题：参数爆炸。这里看下不同规模参数的BERT模型参数量的变“胖”之路：

图3 BERT参数爆炸问题

如何做到，让BERT不那么“胖”，但是效果依旧好是目前学术界的研究重点，也是如何将BERT线上化的重点工作之一。这也是ALBERT要做的事情。

2. BERT“胖”在哪里

想让BERT变瘦，先要知道“肉”长在哪里。BERT使用Transformer作为特征抽取器，这是BERT参数的来源。之前广告行业中那些趣事系列4：详解从配角到C位出道的Transformer很深入的剖析了Transformer，有兴趣的小伙伴可以回头看看。

Transformer的参数来源主要有大块：第一块是token embedding映射模块，参数量占比为20%，第二块是attention层和前向反馈层FFN，参数量占比为80%。

图4 Transformer结构图和BERT参数来源

3. ALBERT优化策略

策略一、对embedding参数因式分解(Factorized embedding parameterization)

BERT将词的one-hot向量映射到高维空间，参数量是O(VXH)，ALBERT则采用因式分解的方式先将词的one-hot向量映射到低维空间(大小为E)，然后再映射回一个高维的空间(大小为H)，这样使用的参数仅仅是O(VXE+EXH)，如果E<
可以通过因式分解减少参数量的原因是token embedding是上下文独立的，通过one-hot向量转化成dense向量。而第二部分的attention和FFN作为隐藏层是上下文依赖的，包含更多信息。所以通过一个小于H的E做中介将词的one-hot向量先经过一个低维的embedding矩阵，然后再映射回高维的embedding矩阵是可行的。下图中红色方框显示了因式分解部分：

图5 因式分解降低参数量

查看token embedding因式分解效果情况：总体来看降低了17%的模型参数，但是模型效果仅仅降低了不到1%。

图6 因式分解降低参数量效果

策略二、共享层与层之间的参数(Cross-layer parameter sharing)

通过对Transformer各层参数可视化分析发现各层参数类似，都是在[CLS]token和对角线上分配更多的注意力，所以可以使用跨层的参数共享方案。

通常来说，跨层的参数共享对应Transformer编码器中的结构有两种方案：一种是attention模块的参数共享，另一种是前馈神经网络层FFN的参数共享。具体的效果如下图所示：

图7 使用共享参数对模型参数量和效果的影响

当映射到低维空间E=768时，对比不共享参数和共享FFN层的参数可以看出，参数减少了近50%，这也是导致模型效果下降的主要原因。而共享attention层的参数则对模型效果影响较小。

策略三、构建自学习任务-句子连贯性预测

通过改造NSP(Next Sentence Prediction)任务，增强网络学习句子的连续型来提高预训练任务。

广告行业中那些趣事系列3：NLP中的巨星BERT重点讲解了BERT模型，其中提到BERT是近几年NLP领域杰出成果的集大成者，本身的创新主要是随机屏蔽的语言模型Masked LM和下一句预测Next Sentence Prediction。有兴趣的小伙伴可以倒回去再好好看下。

NSP任务本身是一个二分类任务，目的是预测两句话是否是连续的语句。NSP实际包含两个子任务，分别是主题预测和关系一致性预测。NSP任务选择同一文档中连续的两个句子作为正样本，选择不同文档的句子作为负样本。因为来自不同的文档，差异性可能非常大。为了提升模型预测连续型句子的能力，ALBERT提出了新的任务SOP(SenteceOrder Prediction)，正样本获取方式和NSP相同，负样本则将正样本的语句顺序颠倒。

SOP和NSP效果展示如下图所示：

图8 SOP和NSP效果展示

从图中可以看出NSP任务无法预测SOP类任务，但是SOP可以预测NSP任务。整体来看，SOP任务的模型效果也优于NSP任务。

策略四、去掉dropout

dropout主要是为了防止过拟合，但实际MLM一般不容易过拟合。去掉dropout还可以较少中间变量从而有效提升模型训练过程中内存的利用率。

图9 dropout效果影响

其他策略：网络宽度和深度对模型效果的影响

1. 网络深度是否越深越好
对比ALBERT在不同深度下的效果可以发现：随着层数加深，不同NLP任务的模型效果是有一定提升。但是这种情况并不是绝对的，有些任务效果反而会下降。

图10 网络深度的影响

2. 网络宽度是否越宽越好
对比深度为3的ALBERT-large模型下不同网络宽度的模型效果情况可以发现：模型宽度的影响和深度类似，随着网络宽度增加，不同NLP任务的模型效果是有一定提升。某些任务也会存在效果下降的情况。

图11 网络宽度的影响

总体来看，ALBERT的实质是使用参数减少技术来降低内存消耗从而最终达到提高BERT的训练速度，主要优化了以下几个方面：

通过因式分解和共享层与层之间的参数减少了模型参数量，提升了参数效率；
通过SOP替代NSP，增强了网络学习句子连续性的能力，提升了自监督学习任务的能力；
通过去掉dropout可以节省很多临时变量，有效提升模型训练过程中内存的利用率，提升了模型的效率，减少了训练数据的规模。

03 万里第一步：先跑通模型

因为实际项目中主要是识别中文，所以主要是使用ALBERT中文版本ALBERT_zh，项目的github地址：https://github.com/brightmart/albert_zh。

记得之前看过一个图片很有意思，能很好的描述此刻我的心情：

广告行业中那些趣事系列6：BERT线上化ALBERT优化原理及项目实践(附github)_第12张图片

图12 第一步先跑通模型

对于我这种“拿来主义者”来说，再牛逼的模型第一步永远都是先跑通它，至于优化的先放一放。跑通它不仅能提升自信心，最实际的作用就是能快速实现项目上线。因为我需要完成文本分类任务，所以通过上面的github地址下载项目后，在集群上跳转到albert_zh目录下，执行sh run_classifier_lcqmc.sh命令即可跑起来。因为项目没有句子分类任务，只有个类似的句子关系判断任务，所以先跑通这个任务，后期再根据这个任务的代码来改就行了。

run_classifier_lcqmc.sh脚本中总体分成两大块，第一块是模型运行的准备工作，第二块就是模型运行。下面是模型的第一块，其中涉及获取数据、预训练模型、设备以及模型相关的参数等等。

图13 模型运行准备工作

第二块就是负责模型运行，主要就是python运行程序的指令以及需要的相关参数配置。

图14 模型运行

总结下，这里重点讲了如何运行成功ALBERT_zh本身提供的一个句子关系判断任务。这个demo是和我们实际项目中文本分类任务很相似的任务，下面就是通过改造这个脚本以及执行的代码来完成我们的实际项目文本分类。

04 多分类任务实践

项目改造的github地址如下：https://github.com/wilsonlsm006/albert_zh。

将原项目fork下来，这里我增加了两个文件run_classifier_multiclass.sh和run_classifier_multiclass.py。这是用来执行文本分类的任务脚本以及代码。改造的原理其实也比较简单，这里大致讲解下。

项目原来提供的句子关系判断任务的数据格式是:id,text_a,text_b,label，任务其实就是来判断两句话到底有没有关系。正样本举例如下：

text_a:成龙大哥代言的一刀传奇好玩么？
text_b:成龙大哥还代言过其他传奇么？
label:1

负样本则可能是这样的：
text_a:成龙大哥代言的一刀传奇好玩么？
text_b:成都市内哪个景点最好玩？
label:0

通过上面两个正负样本的例子大家应该能了解什么是句子关系判断任务，其实就是有监督学习的分类任务。我们实际项目主要通过BERT来做文本分类，识别一句话属于哪个标签，对应到上面的任务其实就是只有text_a,label。因为任务类型一致，所以修改代码的策略就是重点分析有text_b的代码的部分。具体脚本和代码修改就是上面说的两个文件，有需要的小伙伴自取。这里需要注意的是原来的数据文件是tsv格式，我这边是csv格式，数据输入有点点不同，模型其他的都没动。

总结

实际项目中需要将BERT线上化需要使模型又快又好的训练，所以经过调研使用目前BERT最新的派生产品ALBERT。ALBERT通过因式分解和共享层与层之间的参数减少了模型参数量，提升了参数效率；通过SOP替代NOP，增强了网络学习句子的连续性的能力，提升了自监督学习任务的能力；通过去掉dropout可以节省很多临时变量，有效提升模型训练过程中内存的利用率，提升了模型的效率，减少了训练数据的规模。最后将项目中的句子关系判断任务改造成我们实际项目中的文本分类任务用于实际业务需求。可以说是有理论，帮助小伙伴们理解ALBERT为啥训练快了，效果还不错。也有实践，如果需要使用ALBERT做文本分类任务，直接用我改造好的脚本和代码跑起来就行。

喜欢本类型文章的小伙伴可以关注我的微信公众号：数据拾光者。有任何干货我会首先发布在微信公众号，还会同步在知乎、头条、简书、csdn等平台。也欢迎小伙伴多交流。如果有问题，可以在微信公众号随时Q我哈。

使用Docker部署RabbitMQ 九思x docker rabbitmq 容器
第一步：安装RabbitMQ#1.拉取镜像dockerpullrabbitmq:3.12.0-management#2.启动容器（开放端口+数据持久化）dockerrun-d\--name=share_rabbitmq\-p5672:5672\#AMQP协议端口-p15672:15672\#管理界面端口-v/opt/rabbitmq/data:/var/lib/rabbitmq\#数据持久化目录r
React性能优化的8种方式 Mr.BoBo. 前端 #React react.js 性能优化前端
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言1、Reac.memo缓存组件2、使用useMemo缓存大量的计算3、避免使用内联对象4、避免使用匿名函数5、延迟加载不是立即需要的组件6、调整CSS而不是强制组件加载和卸载7、使用React.Fragment避免添加额外的DOM8、使用React.PureComponent,shouldComponentUpdate9、
大疆C++开发面试题及参考答案大模型大数据攻城狮信号量 C++面试 C++面经堆和栈 TCP和UDP 智能指针 C++11
虚函数的作用是什么？虚函数机制是如何实现的？虚表指针在内存中的存放位置在哪里？虚函数主要用于实现多态性。多态是面向对象编程中的一个重要概念，它允许通过基类指针或引用调用派生类中重写的函数。这样可以在运行时根据对象的实际类型来确定调用哪个函数，增强了程序的灵活性和可扩展性。在实现虚函数机制方面，C++使用了虚函数表（v-table）。当一个类包含虚函数时，编译器会为这个类创建一个虚函数表。虚函数表是
OpenStack 云平台的深度定制与性能优化算法探索者 openstack
引言OpenStack作为一款领先的开源云平台，以其高度的灵活性和可扩展性，为企业构建云计算基础设施提供了强大的支持。然而，不同企业的业务场景和技术需求千差万别，原生的OpenStack部署往往无法完全满足企业特定的要求。因此，对OpenStack云平台进行深度定制，并在此基础上进行性能优化，成为了企业充分发挥OpenStack优势、提升云服务质量的关键。本文将深入探讨如何针对企业特定需求对Ope
HTML5！进击2025web蓝桥杯复习之路 Deepsleep. html5 前端 html
#HTML5全面解析##目录1.[HTML5简介](#1-html5-简介)2.[基本标签](#2-基本标签)3.[新特性](#3-新特性)4.[本地存储](#4-本地存储)5.[总结](#5-总结)---##1.HTML5简介HTML5是HTML的第五个主要版本，2014年由W3C正式发布。主要特性包括：-语义化标签-多媒体支持-图形绘制（Canvas/SVG）-本地存储能力-WebWorker
uniapp Deepsleep. uni-app
uni-app是一个使用Vue.js开发所有前端应用的框架，可以编译到iOS、Android、H5、以及各种小程序等多个平台。以下是uni-app页面生命周期的详细介绍，包括一些简单的示例：初始化阶段onLoad(options)触发时机：页面加载时触发，且只触发一次。参数：options是一个包含页面路径参数的对象。示例：从上一个页面传递参数到当前页面。onLoad(options){conso
Seata分布式事务框架及四种模式原理解析 Cloud_. 分布式 seata java Seata-AX Seata-AT
一、Seata核心概念Seata（SimpleExtensibleAutonomousTransactionArchitecture）是阿里开源的分布式事务解决方案，核心思想是通过事务协调器（TC）统一管理全局事务分支的状态，协调资源管理器（RM）和事务管理器（TM）完成事务的提交与回滚。核心组件：TC(TransactionCoordinator)：全局事务协调者，维护全局事务状态，驱动分支事务
PV操作(Java代码)进程同步实战指南 Cloud_. java 开发语言操作系统并发
引言在Java并发编程中，资源同步如同精密仪器的齿轮咬合，任何偏差都可能导致系统崩溃。本文将以Java视角解析经典PV操作原理，通过真实可运行的代码示例，带你掌握线程同步的底层实现逻辑。一、Java信号量实现机制1.1Semaphore类解析importjava.util.concurrent.Semaphore;//创建包含5个许可的信号量（相当于计数信号量）Semaphoresemaphore
Spring Boot 整合 RabbitMQ：注解声明队列与交换机详解 Cloud_. java-rabbitmq spring boot rabbitmq MQ 消息队列
RabbitMQ作为一款高性能的消息中间件，在分布式系统中广泛应用。SpringBoot通过spring-boot-starter-amqp提供了对RabbitMQ的无缝集成，开发者可以借助注解快速声明队列、交换机及绑定规则，极大简化了配置流程。本文将通过代码示例和原理分析，详细介绍如何用注解实现RabbitMQ的集成，并深入解析交换机的作用与类型。一、环境准备1.添加依赖在pom.xml中引入S
【STM32实物】基于STM32的扫地机器人/小车控制系统设计阿齐Archie 单片机项目合集 stm32 机器人单片机 mcu
基于STM32的扫地机器人/小车控制系统设计演示视频：基于STM32的扫地机器人小车控制系统设计简介：扫地机器人系统采用分层结构设计，主要包括底层硬件控制层、中间数据处理层和上层用户交互层。底层硬件控制层负责对各个硬件模块进行控制和数据采集，中间数据处理层负责对采集到的数据进行处理和解算，上层用户交互层负责与用户进行交互并显示系统状态信息。主控模块采用STM32F103C8T6开发板，具有高性能、
AtCoder Beginner Contest 156题解（未完） wdxcqupt 算法 c++
AtCoderBeginnerContest156D-Bouquet题意：一共有n种不同的花，问将x种花组成一束花的方案数，1<=x<=n，x!=a，x!=b。思路：补集思想，总共有∑i=1n\sum_{i=1}^n∑i=1nCniC_n^iCni=2n−12^n-12n−1,种方案，不合情况的有CnaC_n^aCna与CnbC_n^bCnb减去即是答案。E-Roaming题意：有n个房间，每个房
roaming是什么文件夹？石大师 Windows系统 windows
不少用户向小编发出疑问：roaming是什么文件夹？roaming文件夹是一种可以很容易地与服务器同步的文件夹，它的数据可以随用户的个人资料从一台PC移动到另一台PC中。那roaming文件夹在哪呢？下面就给大家介绍一下roaming的位置。Roaming文件夹是什么？Roaming文件夹是一种可以很容易地与服务器同步的文件夹。它的数据可以随用户的个人资料从一台PC移动到另一台PC——就像当您在w
Appdata\Local Roaming LocalLow文件夹 ynchyong 系统运维 local Roaming LocalLow
自Vista及Win7开始，微软更改了原有的应用程序存储目录结构，（XP是ApplicationData）C\用户\用户名\Appdata,并分为Roaming,Local,及LocalLow三个文件夹.更改原因如下:优化登录速度根据使用安全级别分别访问不同文件夹Windows使用Local及LocalLow文件夹存放非漫游的应用程序数据（类似注册表Local_machine）及一些空间占用大无法
最常用的Linux指令手册忍界英雄 linux 运维服务器
最常用的Linux指令手册一、远程连接1.连接远程服务器[email protected]二、文件与目录操作2.查看目录内容ls：查看目录内容、ls-l：显示详细信息、ls-al/home：包含隐藏文件3.显示当前路径pwd4.切换目录cd/var/www/html5.创建文件touchfile1.txtfile2.txt、touchlinode{1..10}.txt:创建文件6.写入文件
Kubernets命名空间忍界英雄 docker k8s
Kubernets命名空间什么是命名空间命名空间（Namespace）是一种用于组织和隔离Kubernetes资源的机制。在Kubernetes集群中，命名空间将物理集群划分为多个逻辑部分，每个部分都拥有自己的一组资源（如Pod、Service、ConfigMap等），彼此之间互不干扰，实现资源的隔离管理。不仅Kubernetes具备命名空间的概念，在Docker等容器技术中，也通过命名空间（Na
191113面试题总结快乐男孩小东
1.Maven中A依赖BB依赖C那么A可以使用C中的类吗？*按照依赖关系，可推C继承A，则C可以使用A中修饰符为public,protected的类2.SpringBoot中有一个类标记了@Controller注解,通过自动扫描把这个类的对象加入IOC，那么这个类应该放那？*在@SpringBootApplication所在包或者下面的子包，才能被自动扫描到#3.通过Maven下载jar包，下载失
通信之OTDR 玖Yee 信息与通信
OTDR，即光时域反射仪，是光纤测量中最主要的仪器，被广泛应用于光纤光缆工程的测量、施工、维护及验收工作中，形象地被称为光通信中的“万用表”。工作原理OTDR利用光纤传输通道存在的瑞利散射和菲涅尔反射特性，通过监测瑞利散射的反向散射光的轨迹制成。它向被测光纤发送一光脉冲，光脉冲在光纤本身及各特征点上会有光信号反射回OTDR，反射回的光信号又通过定向耦合到OTDR的接收器，并在这里转换成电信号，最终
量子化学仿真软件：Quantum Espresso_（8）.dos.x模块使用 kkchenjj 分子动力学2 分子动力学仿真模拟模拟仿真人工智能
dos.x模块使用在量子化学仿真软件中，dos.x模块用于计算和分析能态密度（DensityofStates,DOS）。能态密度是描述材料电子结构的重要物理量，可以提供关于材料能带结构、电子态分布和电子性质的详细信息。本节将详细介绍如何使用dos.x模块进行能态密度的计算和分析。1.基本概念1.1能态密度（DOS）定义能态密度（DOS）是指单位能量区间内的量子态数。在固体物理中，DOS可以描述材料
Python 用户账户(创建用户账户) 钢铁男儿 Python 从入门到精通 python sqlite 数据库
Web应用程序的核心是让任何用户都能够注册账户并能够使用它，不管用户身处何方。在本章中，你将创建一些表单，让用户能够添加主题和条目，以及编辑既有的条目。你还将学习Django如何防范对基于表单的网页发起的常见攻击，这让你无需花太多时间考虑确保应用程序安全的问题。然后，我们将实现一个用户身份验证系统。你将创建一个注册页面，供用户创建账户，并让有些页面只能供已登录的用户访问。接下来，我们将修改一些视图
202.HarmonyOS NEXT系列教程之图案锁错误处理机制详解 harmonyos-next
温馨提示：本篇博客的详细代码已发布到git:https://gitcode.com/nutpi/HarmonyosNext可以下载运行哦！HarmonyOSNEXT系列教程之图案锁错误处理机制详解效果预览1.错误处理架构1.1错误类型定义//振动功能错误处理try{vibrator.startVibration({type:'preset',effectId:'haptic.clock.timer
201.HarmonyOS NEXT系列教程之图案锁生命周期管理详解
温馨提示：本篇博客的详细代码已发布到git:https://gitcode.com/nutpi/HarmonyosNext可以下载运行哦！HarmonyOSNEXT系列教程之图案锁生命周期管理详解效果预览1.生命周期概述@ComponentexportstructPatternLockMainPage{//组件初始化privatepatternLockController:PatternLockC
192.HarmonyOS NEXT系列教程之图案锁事件处理机制详解 harmonyos-next
温馨提示：本篇博客的详细代码已发布到git:https://gitcode.com/nutpi/HarmonyosNext可以下载运行哦！HarmonyOSNEXT系列教程之图案锁事件处理机制详解效果预览1.事件系统概述1.1事件类型定义//点连接事件.onDotConnect(()=>{this.startVibrator();})//图案完成事件.onPatternComplete((inpu
194.HarmonyOS NEXT系列教程之图案锁交互反馈系统详解 harmonyos-next
温馨提示：本篇博客的详细代码已发布到git:https://gitcode.com/nutpi/HarmonyosNext可以下载运行哦！HarmonyOSNEXT系列教程之图案锁交互反馈系统详解效果预览1.交互反馈系统概述1.1反馈类型//反馈类型定义interfaceFeedbackTypes{visual:boolean;//视觉反馈haptic:boolean;//触觉反馈message:
What's new in dubbo-go v3.3.0
我们dubbogo社区很高兴地宣布发布最新版本v3.3.0！这一版本带来了多个Bug修复、新特性以及代码优化，显著提升了dubbogo的稳定性与功能性。版本亮点在本次更新中，我们对多个核心组件进行了改进，以解决服务发现、注册中心相关的问题，并优化内存管理，减少内存泄漏。此外，我们增强了底层通信库的错误处理能力，并提升了系统的整体稳定性，为Go开发者提供更强大、更可靠的微服务开发体验。本次更新的主要
20190626_二次开发BarTender打印机_C#代码_一边读取TID_一边打印_打印机POSTEK weixin_30784141 c/c++数据库
demo代码如下:privatevoidbtnPrint_Click(objectsender,EventArgse){if(this.btnPrint.Text=="停止打印"){SetBtnPrintUIEnable();return;}//禁用界面上的相关按钮SetBtnPrintUIDisable();vardt=newDataTable();newTask(()=>{///开始的打印//
YOLOV8多模态(可见光+红外光，基于Ultralytics官方代码实现） @M_J_Y@ 目标检测 YOLO 计算机视觉目标检测 python
YOLOV8多模态(可见光+红外光，基于Ultralytics官方代码实现）各位读者麻烦给个star或者fork，求求了。YOLOV8双分支模型架构图YOLOV8多模态目标检测前言：环境配置要求1.数据集DroneVehicle数据集(可见光+热红外)2.数据集文件格式(labeles:YOLO格式)3.权重文件下载4.配置模型yaml文件和数据集yaml文件5.训练6.测试7.打印模型信息8.o
Lua语法详解之自带库 MagicianThirteen Lua相关 lua 游戏开发 unity3d
--自带库--string--table--时间print(os.time())--1601168290print(os.time({year=2020,month=9,day=25}))--1601006400--os.date("*t")传回来的是张表localnow=os.date("*t")print(now)--table:0x7fa99f604360for<
最大矩阵面积问题 syzyc 杂项最大矩阵面积问题
问题概述最大矩阵面积问题有两种：在一个网格图中，一些格子里有障碍，求在网格图中规划一个矩形，使得它不会覆盖任何一个障碍格且面积最大。在一个平面直角坐标系中，先给你规定一个大矩形（一般左下角是(0,0)(0,0)(0,0)，右上角是(MaxX,MaxY)(MaxX,MaxY)(MaxX,MaxY)），有一些障碍点，求在这个大矩形中规划一个小矩形，使得它不会覆盖每一个障碍点（障碍点可在矩形边缘）。具体
java:实现设置窗体背景颜色为淡蓝色（附带源码） Katie。 Java 实战项目 java 信息可视化开发语言
一、项目简介在桌面应用开发中，窗体背景颜色作为界面设计的重要组成部分，不仅影响整体美观，还能传递特定的情感和品牌信息。本项目旨在使用JavaSwing简单实现将窗体背景颜色设置为淡蓝色效果。该示例展示了如何创建一个基本的JFrame，并通过调用其内容面板的setBackground()方法，设置背景颜色为淡蓝色（RGB值173,216,230）。通过本项目，初学者可以了解Swing基本组件的使用方
使用欧拉法数值求解微分方程的 Python 实现神经网络15044 python 深度学习算法 python 开发语言
编写函数y=Eular(x,h)，使用欧拉法数值求解微分方程初值为函数Eular(x,h)中Cx为计算结束时微分方程x的值，h为计算步长再编写脚本，通过调用函数分别以不同步长(例如h=1.0，h=0.5，h=0.25)计算y(3)，并分析步长和误差之间的关系。以下是使用欧拉法数值求解微分方程的Python实现。假设我们要求解的微分方程是dydx=f(x,y)\frac{dy}{dx}=f(x,y)
ios内付费 374016526 ios 内付费
近年来写了很多IOS的程序，内付费也用到不少，使用IOS的内付费实现起来比较麻烦，这里我写了一个简单的内付费包，希望对大家有帮助。具体使用如下: 这里的sender其实就是调用者，这里主要是为了回调使用。 [KuroStoreApi kuroStoreProductId:@"产品ID" storeSender:self storeFinishCallBa
20 款优秀的 Linux 终端仿真器 brotherlamp linux linux视频 linux资料 linux自学 linux教程
终端仿真器是一款用其它显示架构重现可视终端的计算机程序。换句话说就是终端仿真器能使哑终端看似像一台连接上了服务器的客户机。终端仿真器允许最终用户用文本用户界面和命令行来访问控制台和应用程序。（LCTT 译注：终端仿真器原意指对大型机-哑终端方式的模拟，不过在当今的 Linux 环境中，常指通过远程或本地方式连接的伪终端，俗称“终端”。）你能从开源世界中找到大量的终端仿真器，它们
Solr Deep Paging(solr 深分页) eksliang solr深分页 solr分页性能问题
转载请出自出处：http://eksliang.iteye.com/blog/2148370 作者：eksliang(ickes) blg:http://eksliang.iteye.com/ 概述长期以来，我们一直有一个深分页问题。如果直接跳到很靠后的页数，查询速度会比较慢。这是因为Solr的需要为查询从开始遍历所有数据。直到Solr的4.7这个问题一直没有一个很好的解决方案。直到solr
数据库面试题 18289753290 面试题数据库
1.union ,union all 网络搜索出的最佳答案： union和union all的区别是,union会自动压缩多个结果集合中的重复结果，而union all则将所有的结果全部显示出来，不管是不是重复。 Union：对两个结果集进行并集操作，不包括重复行，同时进行默认规则的排序； Union All：对两个结果集进行并集操作，包括重复行，不进行排序； 2.索引有哪些分类？作用是
Android TV屏幕适配酷的飞上天空 android
先说下现在市面上TV分辨率的大概情况两种分辨率为主 1.720标清，分辨率为1280x720. 屏幕尺寸以32寸为主，部分电视为42寸 2.1080p全高清，分辨率为1920x1080 屏幕尺寸以42寸为主，此分辨率电视屏幕从32寸到50寸都有适配遇到问题，已1080p尺寸为例：分辨率固定不变，屏幕尺寸变化较大。如：效果图尺寸为1920x1080，如果使用d
Timer定时器与ActionListener联合应用永夜-极光 java
功能:在控制台每秒输出一次代码: package Main; import javax.swing.Timer; import java.awt.event.*; public class T { private static int count = 0; public static void main(String[] args){
Ubuntu14.04系统Tab键不能自动补全问题解决随便小屋 Ubuntu 14.04
Unbuntu 14.4安装之后就在终端中使用Tab键不能自动补全，解决办法如下： 1、利用vi编辑器打开/etc/bash.bashrc文件（需要root权限） sudo vi /etc/bash.bashrc 接下来会提示输入密码 2、找到文件中的下列代码 #enable bash completion in interactive shells #if
学会人际关系三招轻松走职场 aijuans 职场
要想成功，仅有专业能力是不够的，处理好与老板、同事及下属的人际关系也是门大学问。如何才能在职场如鱼得水、游刃有余呢？在此，教您简单实用的三个窍门。　　第一，多汇报最近，管理学又提出了一个新名词“追随力”。它告诉我们，做下属最关键的就是要多请示汇报，让上司随时了解你的工作进度，有了新想法也要及时建议。不知不觉，你就有了“追随力”，上司会越来越了解和信任你。　　第二，勤沟通团队的力
《O2O：移动互联网时代的商业革命》读书笔记 aoyouzi 读书笔记
移动互联网的未来：碎片化内容+碎片化渠道=各式精准、互动的新型社会化营销。 O2O：Online to OffLine 线上线下活动 O2O就是在移动互联网时代，生活消费领域通过线上和线下互动的一种新型商业模式。手机二维码本质：O2O商务行为从线下现实世界到线上虚拟世界的入口。线上虚拟世界创造的本意是打破信息鸿沟，让不同地域、不同需求的人
js实现图片随鼠标滚动的效果百合不是茶 JavaScript 滚动属性的获取图片滚动属性获取页面加载
1,获取样式属性值 top 与顶部的距离 left 与左边的距离 right 与右边的距离 bottom 与下边的距离 zIndex 层叠层次例子:获取左边的宽度,当css写在body标签中时 <div id="adver" style="position:absolute;top:50px;left:1000p
ajax同步异步参数async bijian1013 jquery Ajax async
开发项目开发过程中，需要将ajax的返回值赋到全局变量中，然后在该页面其他地方引用，因为ajax异步的原因一直无法成功，需将async:false，使其变成同步的。格式： $.ajax({ type: 'POST', ur
Webx3框架（1） Bill_chen eclipse spring maven 框架 ibatis
Webx是淘宝开发的一套Web开发框架，Webx3是其第三个升级版本；采用Eclipse的开发环境，现在支持java开发；采用turbine原型的MVC框架，扩展了Spring容器，利用Maven进行项目的构建管理，灵活的ibatis持久层支持，总的来说，还是一套很不错的Web框架。 Webx3遵循turbine风格，velocity的模板被分为layout/screen/control三部
【MongoDB学习笔记五】MongoDB概述 bit1129 mongodb
MongoDB是面向文档的NoSQL数据库，尽量业界还对MongoDB存在一些质疑的声音，比如性能尤其是查询性能、数据一致性的支持没有想象的那么好，但是MongoDB用户群确实已经够多。MongoDB的亮点不在于它的性能，而是它处理非结构化数据的能力以及内置对分布式的支持(复制、分片达到的高可用、高可伸缩)，同时它提供的近似于SQL的查询能力，也是在做NoSQL技术选型时，考虑的一个重要因素。Mo
spring/hibernate/struts2常见异常总结白糖_ Hibernate
Spring ①ClassNotFoundException: org.aspectj.weaver.reflect.ReflectionWorld$ReflectionWorldException 缺少aspectjweaver.jar，该jar包常用于spring aop中 ②java.lang.ClassNotFoundException: org.sprin
jquery easyui表单重置(reset)扩展思路 bozch form jquery easyui reset
在jquery easyui表单中尚未提供表单重置的功能，这就需要自己对其进行扩展。扩展的时候要考虑的控件有： combo,combobox,combogrid,combotree,datebox,datetimebox 需要对其添加reset方法，reset方法就是把初始化的值赋值给当前的组件，这就需要在组件的初始化时将值保存下来。在所有的reset方法添加完毕之后，就需要对fo
编程之美-烙饼排序 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; /* *《编程之美》的思路是：搜索+剪枝。有点像是写下棋程序：当前情况下，把所有可能的下一步都做一遍；在这每一遍操作里面，计算出如果按这一步走的话，能不能赢（得出最优结果）。 *《编程之美》上代码有很多错误，且每个变量的含义令人费解。因此我按我的理解写了以下代码： */
Struts1.X 源码分析之ActionForm赋值原理 chenbowen00 struts
struts1在处理请求参数之前，首先会根据配置文件action节点的name属性创建对应的ActionForm。如果配置了name属性，却找不到对应的ActionForm类也不会报错，只是不会处理本次请求的请求参数。如果找到了对应的ActionForm类，则先判断是否已经存在ActionForm的实例，如果不存在则创建实例，并将其存放在对应的作用域中。作用域由配置文件action节点的s
[空天防御与经济]在获得充足的外部资源之前,太空投资需有限度 comsci 资源
这里有一个常识性的问题: 地球的资源,人类的资金是有限的,而太空是无限的..... 就算全人类联合起来,要在太空中修建大型空间站,也不一定能够成功,因为资源和资金,技术有客观的限制.... &
ORACLE临时表—ON COMMIT PRESERVE ROWS daizj oracle 临时表
ORACLE临时表转临时表：像普通表一样，有结构，但是对数据的管理上不一样，临时表存储事务或会话的中间结果集，临时表中保存的数据只对当前会话可见，所有会话都看不到其他会话的数据，即使其他会话提交了，也看不到。临时表不存在并发行为，因为他们对于当前会话都是独立的。创建临时表时，ORACLE只创建了表的结构（在数据字典中定义），并没有初始化内存空间，当某一会话使用临时表时，ORALCE会
基于Nginx XSendfile+SpringMVC进行文件下载 denger 应用服务器 Web nginx 网络应用 lighttpd
在平常我们实现文件下载通常是通过普通 read-write方式，如下代码所示。 @RequestMapping("/courseware/{id}") public void download(@PathVariable("id") String courseID, HttpServletResp
scanf接受char类型的字符 dcj3sjt126com c
/* 2013年3月11日22:35:54 目的：学习char只接受一个字符 */ # include <stdio.h> int main(void) { int i; char ch; scanf("%d", &i); printf("i = %d\n", i); scanf("%
学编程的价值 dcj3sjt126com 编程
发一个人会编程, 想想以后可以教儿女, 是多么美好的事啊, 不管儿女将来从事什么样的职业, 教一教, 对他思维的开拓大有帮助像这位朋友学习: http://blog.sina.com.cn/s/articlelist_2584320772_0_1.html VirtualGS教程 (By @林泰前): 几十年的老程序员，资深的
二维数组（矩阵）对角线输出飞天奔月二维数组
今天在BBS里面看到这样的面试题目, 1，二维数组（N*N），沿对角线方向，从右上角打印到左下角如N=4： 4*4二维数组 { 1 2 3 4 } { 5 6 7 8 } { 9 10 11 12 } {13 14 15 16 } 打印顺序 4 3 8 2 7 12 1 6 11 16 5 10 15 9 14 13 要
Ehcache（08）——可阻塞的Cache——BlockingCache 234390216 并发 ehcache BlockingCache 阻塞
可阻塞的Cache—BlockingCache 在上一节我们提到了显示使用Ehcache锁的问题，其实我们还可以隐式的来使用Ehcache的锁，那就是通过BlockingCache。BlockingCache是Ehcache的一个封装类，可以让我们对Ehcache进行并发操作。其内部的锁机制是使用的net.
mysqldiff对数据库间进行差异比较 jackyrong mysqld
mysqldiff该工具是官方mysql-utilities工具集的一个脚本，可以用来对比不同数据库之间的表结构，或者同个数据库间的表结构如果在windows下，直接下载mysql-utilities安装就可以了，然后运行后，会跑到命令行下： 1）基本用法 mysqldiff --server1=admin:12345
spring data jpa 方法中可用的关键字 lawrence.li java spring
spring data jpa 支持以方法名进行查询/删除/统计。查询的关键字为find 删除的关键字为delete/remove (>=1.7.x) 统计的关键字为count (>=1.7.x) 修改需要使用@Modifying注解 @Modifying @Query("update User u set u.firstna
Spring的ModelAndView类 nicegege spring
项目中controller的方法跳转的到ModelAndView类，一直很好奇spring怎么实现的？ /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version 2.0 (the "License"); * yo
搭建 CentOS 6 服务器(13) - rsync、Amanda rensanning centos
（一）rsync Server端 # yum install rsync # vi /etc/xinetd.d/rsync service rsync { disable = no flags = IPv6 socket_type = stream wait
Learn Nodejs 02 toknowme nodejs
（1）npm是什么 npm is the package manager for node 官方网站：https://www.npmjs.com/ npm上有很多优秀的nodejs包，来解决常见的一些问题，比如用node-mysql，就可以方便通过nodejs链接到mysql，进行数据库的操作在开发过程往往会需要用到其他的包，使用npm就可以下载这些包来供程序调用 &nb
Spring MVC 拦截器 xp9802 spring mvc
Controller层的拦截器继承于HandlerInterceptorAdapter HandlerInterceptorAdapter.java 1 public abstract class HandlerInterceptorAdapter implements HandlerIntercep

广告行业中那些趣事系列6：BERT线上化ALBERT优化原理及项目实践(附github)

你可能感兴趣的:(广告行业中那些趣事系列6：BERT线上化ALBERT优化原理及项目实践(附github))