zenRRan

赛尔笔记 | 自然语言处理中的迁移学习(下)

点击上方，选择星标或置顶，每天给你送干货！

阅读大概需要28分钟

跟随小博主，每天进步一丢丢

来自：哈工大SCIR

作者：徐啸

福利推荐：

精心挑选从入门到实践的高质量书籍免费送

本文小结：本文为教程的第二篇，包含教程的 3-6 部分。

相关链接：赛尔笔记 | 自然语言处理中的迁移学习(上)

提纲

介绍：本节将介绍本教程的主题：迁移学习当前在自然语言处理中的应用。在不同的迁移学习领域中，我们主要定位于顺序迁移学习 sequential transfer learning 。
预训练：我们将讨论无监督、监督和远程监督的预训练方法。
表示捕获了什么：在讨论如何在下游任务中使用预训练的表示之前，我们将讨论分析表示的方法，以及观察到它们捕获了哪些内容。
调整：在这个部分，我们将介绍几种调整这些表示的方法，包括特征提取和微调。我们将讨论诸如学习率安排、架构修改等的实际考虑。
下游应用程序：本节，我们将重点介绍预训练的表示是如何被用在不同的下游任务中的，例如文本分类、自然语言生成、结构化预测等等。
开放问题和方向：在最后一节中，我们将提出对未来的展望。我们将突出待解决的问题以及未来的研究方向。

3. 表示捕获了什么

为什么要关心表示捕获了什么？

Swayamdipta, 2019

在下游任务进行的外部评估

复杂多样，随特定任务而不同

Language-aware representations 语言感知表示

泛化到其他任务的新的输入
作为可能改进预训练工作的中间步骤

可解释！

我们得到结果的原因是否正确?
发现偏见……

分析什么？

嵌入

单词
上下文的

网络激活
变化

结构 (RNN / Transformer)
层
预训练目标

分析方法 1：可视化

保持嵌入/网络激活静态或冻结

可视化嵌入

在低维(2D/3D)空间内绘制嵌入

t-SNE (van der Maaten & Hinton, 2008)
PCA projections

可视化单词类比 (Mikolov et al. 2013)

空间关联

词汇语义的高级视图

只有有限的例子
与其他任务的连接尚不清楚 (Goldberg, 2017)

Radford et al., 2017

神经元激活值与特征/标签相关

Karpathy et al., 2016

标识学习可识别的功能

如何选择某个神经元？难以扩展！
可解释 != 重要(Morcos et al., 2018)

流行于机器翻译，或其他seq2seq架构:

源字与目标字之间的对齐。
长距离词与词之间的依赖(句内注意)

结构上的亮点

拥有复杂的注意力机制可能是一件好事!
分层的

解释可能很棘手

只有几个例子？
Robust corpus-wide trends? Next !

Attention is not explanation | Attention is not not explanation

分析方法 2: 行为探测器

RNN-based 语言模型

主谓关系中的数字一致性 number agreement in subject-verb dependencies
自然的、不自然的或不合语法的句子
对输出困惑度进行评估

RNNs优于其他非神经方法的 Baseline

当显式地使用语法训练时，性能会提高(Kuncoro et al. 2018)

Linzen et al., 2016; Gulordava et al. 2018; Marvin et al., 2018

这种 probe 可能易受共现偏差的影响

“dogs in the neighborhood bark(s)”
以前的句子可能和原来的太不一样了…

分析方法 3: Classifier Probes

保持嵌入/网络激活并在顶部训练一个简单的监督模型

探测表层特征

给定一个句子，预测属性如

长度
这个句子里有一个单词吗？

给出句子中的单词的预测属性，例如：

以前见过的词，与语言模型形成对比
词在句子中的位置

检查记忆的能力

训练有素的、更丰富的体系结构往往运行得更好
在语言数据上训练能记忆的更好

Zhang et al. 2018; Liu et al., 2018; Conneau et al., 2018

探测词法，句法，语义

词法学
词级别的语法

POS tags, CCG supertags
Constituent parent, grandparent

部分语法

依赖关系

部分语义

实体关系
共指
角色

Adi et al., 2017; Conneau et al., 2018; Belinkov et al., 2017; Zhang et al., 2018; Blevins et al., 2018; Tenney et al. 2019; Liu et al., 2019

探测分类结果

Contextualized > non-contextualized

尤其是在句法任务上
更紧密的语义任务表现
双向上下文很重要

BERT (large) 几乎总是获得最佳效果

Grain of salt: 不同的上下文表示在不同的数据上训练，使用不同的架构……

探测网络各层

Fig. from Liu et al. (NAACL 2019)

李如对该篇文章做了简洁的总结

CWRs（上下文词表征）编码了语言的哪些特征？

在各类任务中，BERT>ELMo>GPT，发现“bidirectional”是这类上下文编码器的必备要素
相比于其他任务，编码器们在NER和纠错任务表现较差 => 没有捕获到这方面信息
在获得CWRs编码后，再针对任务增加MLP(relu)或者LSTM会提升效果
引出了问题：什么时候直接fine-tune编码器？什么时候freeze编码器，增加task-specific layer？

编码器中不同层的迁移性是怎样变化的？

对于ELMo(LSTM)来说，靠前的层更 transferable，靠后的层更 task-specific
对于 Transformer 来说，靠中间的层更 transferable ，但是把各个层加权起来的效果会更好
模型需要进行 trade off ，在任务上表现越好，迁移性越差

预训练任务会对任务和迁移性有怎样的影响？

双向语言模型预训练出来平均效果越好
预训练任务越接近特定任务，在特定任务的表现越好
预训练数据越多，表现越好

以上引用其总结的三点并稍作修改

RNN 的各层：通用语言属性

最低层：形态学
中间层：语法
最高层次：特定于任务的语义

Transformer 的各层

不同任务的不同趋势；middle-heavy
参见Tenney et. al., 2019

探测预训练目标

Zhang et al., 2018; Blevins et al., 2018; Liu et al., 2019;

语言建模优于其他非监督和监督目标。

机器翻译
依存分析
Skip-thought 预测上下文的句子

低资源时(训练数据的大小)可能导致相反的趋势。

迄今为止我们学到了什么？

表征是对某些语言现象的预测:

翻译中的对齐，句法层次结构

有语法和没有语法的预训练:

有语法的预训练具有更好的性能
但是如果没有语法，至少还是会学到些语法概念 (Williams et al. 2018)

网络架构决定了表示中的内容

句法与Bert Transformer (Tenney et al., 2019; Goldberg, 2019)
跨架构的不同的逐层趋势

关于探测器的开放问题

一个好的探测器应该寻找什么信息?

Probing a probe！

探测性能告诉我们什么？

很难综合各种基线的结果…

它本身会带来一些复杂性吗

线性或非线性分类
行为：输入句子的设计

我们应该使用 probe 作为评估指标吗?

可能会破坏目的…

分析方法 4：改变模型

Li et al., 2016

逐步删除或屏蔽网络组件

词嵌入维度
隐藏单位
输入——单词/短语

表示捕捉到了什么？

这要看你怎么看了!

可视化：

鸟瞰
很少的样本——可能会让人想起 cherry-picking (最佳选择)

调查：

发现语料层面的特定属性
可能会引入自己的偏见…

网络修改：

对改进建模很有帮助
可以是特定于任务的

分析方法作为辅助模型开发的工具！

可解释性和可迁移性对下游任务而言是重要的。

4. 调整

如何调整预训练模型

我们可以在几个方向上做决定:

结构的修改？

为了适应，需要对预训练的模型体系结构进行多大的更改

优化方案？

在适应过程中需要训练哪些权重以及遵循什么时间表

更多信号：弱监督、多任务和集成

如何为目标任务获取更多的监督信号

4.1 结构

两个通用选项：

保持预训练模型内部不变

在顶部添加分类器，在底部添加嵌入，将输出作为特征

修改预训练模型的内部架构

初始化编码器-解码器、特定于任务的修改、适配器

4.1.1 – 结构：保持模型不变

常规工作流：

如果对目标任务无效，则删除预训练的任务头

示例：从预训练语言模型中删除softmax分类器
不总是需要：一些调整方案重用了预训练的目标/任务，例如用于多任务学习

在预训练模型的顶部/底部添加特定于任务的目标层

简单：在预训练的模型上添加线性层

更复杂的：将模型输出作为单独模型的输入
当目标任务需要预训练嵌入中所没有的交互时，通常是有益的

4.1.2 – 结构：修改模型内部

各种各样的原因:

适应结构上不同的目标任务

例如：使用单个输入序列(例如:语言建模)进行预训练，但是适应多个输入序列的任务(例如:翻译、条件生成……)
使用预训练的模型权重尽可能初始化结构不同的目标任务模型
例如：使用单语语言模型初始化机器翻译的编码器和解码器参数 (Ramachandran et al., EMNLP 2017; Lample & Conneau, 2019)

特定于任务的修改

提供对目标任务有用的预训练模型
例如：添加跳过/残差连接，注意力(Ramachandran et al., EMNLP 2017)

使用较少的参数进行调整:

更少的参数进行微调
在模型参数不断增大的情况下，非常有用
例如:在预训练模型的层之间添加瓶颈模块(“适配器”) (Rebuffi et al., NIPS 2017;CVPR 2018)

Adapters

通常使用剩余连接与现有层并行的层相连
每层之间都放置时效果最佳(底层效果较小)
不同的操作(卷积，自我注意)是可能的
特别适合 Transformer 等模块化架构 (Houlsby et al., ICML 2019; Stickland and Murray, ICML 2019

Adapters (Stickland & Murray, ICML 2019)

多头的关注(MH；跨层共享)与BERT的 self-attention (SA)层并行使用
两者都被加在一起，并输入到 Layer-norm (LN)中

4.2 优化

涉及到优化本身的几个方向:

选择我们应该更新的权重

Feature extraction, fine-tuning, adapters

选择如何以及何时更新权重

From top to bottom, gradual unfreezing, discriminative fine-tuning

考虑实事求是的权衡

Space and time complexity, performance

4.2.1 – 优化: 什么权重？

主要问题:调整还是不调整(预先训练好的重量)?

不改变预先训练的重量

Feature extraction

(预训练的)权重被冻结

线性分类器是在预训练的表示上进行训练的

不要只使用顶层的特性!
学习层的线性组合 (Peters et al., NAACL 2018, Ruder et al., AAAI 2019)

或者，在下游模型中使用预先训练的表示作为特性

Adapters

在现有层之间添加的特定于任务的模块
只有 adapters 被训练

改变预训练权重

fine-tuning

采用预训练的权重作为下游模型参数的初始化
整个预训练的体系结构在适应阶段进行训练

4.2.2 – 优化：什么方式？

我们已经决定要更新哪些权重，但是以什么顺序以及如何更新它们？

动机：我们希望避免覆盖有用的预训练信息，并最大化积极的知识迁移

相关概念：灾难遗忘 (McCloskey＆Cohen, 1989; French, 1999) :一个模型忘记了它最初受过训练的任务

指导原则：从上到下更新

时间上逐步更新：冻结
强度上逐步更新：改变学习速度
Progressively vs. the pretrained model 逐步更新 vs 预训练模型：正则化

优化：冻结

主要直觉：在不同分布和任务的数据上同时训练所有层可能导致不稳定的不良解决方案
解决方案：单独训练每一层，使他们有时间适应新的任务和数据。
回到早期深度神经网络的分层训练（Hinton et al., 2006; Bengio et al., 2007）

4.2.2 – 优化：学习率

主要想法：使用更低的学习率来避免覆盖掉有用的信息

在哪里以及在什么时候？

低层(捕获一般信息)
训练初期(模型仍需适应目标分布)
训练后期(模型接近收敛)

4.2.2 – 优化：正则化

主要思想：通过使用正则化项，鼓励目标模型参数接近预先训练的模型参数，将灾难性遗忘最小化。

简单的方法:将新参数正则化，不要与预训练的参数偏离太多 (Wiese et al., CoNLL 2017)

更高级(elastic weight consolidation; EWC)(Kirkpatrick et al., PNAS 2017)

基于 Fisher 信息矩阵 F ，关注对预训练任务重要的参数

EWC在持续学习方面有缺点:

可能过度约束参数
计算成本与任务数量成线性关系(Schwarz et al., ICML 2018)

如果任务相似，我们也可以鼓励基于交叉熵的源和目标预测接近，类似于蒸馏:

4.2.3 – 优化：权衡

在选择更新哪些权重时，需要权衡以下几个方面：

A. 空间复杂度

特定于任务的修改、附加参数、参数重用

B. 时间复杂度

训练时间

C. 性能

经验法则：如果任务源和目标任务不相似*，使用特征提取 (Peters et al., 2019)
否则，特征提取和微调常常效果类似（此时用微调更好）
在文本相似性任务上对 BERT 进行微调，效果明显更好
适配器实现了与微调相比具有竞争力的性能
有趣的是，Transformer 比 LSTMs 更容易微调(对超参数不那么敏感)

*不相似：某些能力(例如句子间关系建模)对目标任务是有益的，但预训练的模型缺乏这些能力能(参见后面的更多内容)

4.3 – 获得更多信号

目标任务通常是低资源任务。我们经常可以通过组合不同的信号，提高迁移学习的效果：

在单个适应任务上微调单个模型

基本原理：用一个简单的分类目标对模型进行微调

其他数据集和相关任务中收集信号

微调与弱监督，多任务和顺序调整

集成模型

结合几个微调模型的预测

4.3.1 – 获得更多信号：基本的 fine-tuning

微调文本分类任务的简单例子：

从模型中提取单个定长向量

第一个/最后一个令牌的隐藏状态，或者是隐藏状态的平均值/最大值

使用附加的分类器投影到分类空间
用分类目标函数训练

4.3.2 – 获得更多信号：相关数据集/任务

顺序调整 Sequential adaptation

对相关数据集和任务进行中间微调

与相关任务进行多任务微调

如 GLUE 中的 NLI 任务

数据集分割

当模型在特定的数据片上始终表现不佳时

半监督学习

使用未标记的数据来提高模型的一致性

4.3.2 – 获得更多信号：顺序调整

在相关高资源数据集进行微调

在拥有更多的数据的相关任务对模型进行微调
在目标任务上微调数据集

对于数据有限并且有类似任务的任务尤其有用(Phang et al., 2018)
提高目标任务的样本复杂度(Yogatama et al., 2019)

4.3.2 – 获得更多信号：多任务 fine-tuning

在相关任务上共同微调模型

对于每个优化步骤，取样一个任务和一批数据进行训练
通过多任务学习训练多轮
只在最后几个阶段对目标任务进行微调

使用无监督的辅助任务微调模型

语言建模是一个相关的任务！
微调语言模型有助于将预训练的参数调整到目标数据集
即使没有预训练，也会起到帮助 (Rei et al., ACL 2017)
可选退火比(Chronopoulou et al., NAACL 2019)
作为 ULMFiT 中的一个单独步骤使用

4.3.2 – 获得更多信号：数据集切分

使用仅在数据的特定子集上训练的辅助头

分析模型误差
使用启发式方法自动识别训练数据的挑战性子集
与主头一起联合训练辅助头

See also Massive Multi-task Learning with Snorkel MeTaL

4.3.2 – 获得更多信号：半监督学习

使用未标记的数据可以使模型预测更加一致

主要思想:使对原始输入 x 和扰动输入 x' 的预测之间的距离最小化
扰动可以是噪声、掩蔽(Clark et al., EMNLP 2018)、数据增强，例如 back-translation (Xie et al., 2019)

4.3.3 – 获得更多信号：集成

通过集成独立的微调模型达到最先进水平

集成模型：使用各种超参数微调模型预测的组合

在不同的任务
在不同的数据集分块
使用不同的参数(dropout, initializations…)
来自预训练模型的变体(例如 cased/uncased )

知识蒸馏：在一个更小的模型中提取一组调优模型

知识蒸馏：在教师（集成模型）制作的软目标上训练学生模型
教师标签的相对概率包含教师如何概括的信息

5. 下游应用程序

在本节中，我们将沿两个方向探索下游的应用和实际考虑:

迁移学习在自然语言处理中的各种应用是什么

文档/句子分类、令牌级分类、结构化预测和语言生成

如何利用多个框架和库来实现实际应用

Tensorflow、PyTorch、Keras和第三方库，例如 fast.ai, HuggingFace……

句子和文档级分类

动手实践：文档级分类(fast.ai)

令牌分类

实践：问答(谷歌BERT & Tensorflow/TF Hub)

语言生成

实践：对话生成(OpenAI GPT & HuggingFace/PyTorch Hub)

本部分内容偏向编程实践，将在本教程的第三篇中进行补充

5.1 – 句子和文档级别分类

使用 fast.ai 库完成文档分类的迁移学习

目标任务

IMDB：一个二元情绪分类数据集，包含用于训练的25k个高度极性的电影评论，用于测试的25k个，以及其他未标记的数据。https://ai.stanford.edu/~amaas/data/sentiment/
Fast.ai 特别提供了:

一个预先训练的英文模型可供下载
一个标准化的数据块API
易于访问标准数据集，如IMDB

fast.ai 基于 PyTorch

fast.ai 为视觉、文本、表格数据和协同过滤提供了许多开箱即用的高级API

库的设计是为了加快实验的速度，例如在互动计算环境中一次导入所有必需的模块，例如:

Fast.ai 包含快速设置迁移学习实验所需的所有高级模块。

加载数据集
使用语言模型和分类器的 DataBunch
使用语言模型损失函数，在 WikiText-103 上预训练的 AWD-LSTM 并在 IMDB 数据集上微调

一旦我们有了微调的语言模型(AWD-LSTM)，我们可以创建一个文本分类器，添加一个分类头:

将RNN的最终输出的最大值与所有中间输出(沿着序列长度)的平均值连接起来的层
Two blocks of nn.BatchNorm1d ⇨ nn.Dropout ⇨ nn.Linear ⇨ nn.ReLU 的隐藏维度为50
分两步微调

只训练分类头，同时保持语言模型不变
微调整个结构

Colab: tiny.cc/NAACLTransferFastAiColab

5.2 – Token 级别分类: BERT & Tensorflow

用于令牌级分类的迁移学习：谷歌的 BERT in TensorFlow

目标任务:

SQuAD: 回答问题的数据集 https://rajpurkar.github.io/SQuAD-explorer/

在本例中，我们将直接使用 Tensorflow checkpoint

例如：https://github.com/google-research/bert/
我们使用通常的Tensorflow工作流：创建包含核心模型和添加/修改元素的模型图
加载检查点时要注意变量分配

语言生成迁移学习：OpenAI GPT 和 HuggingFace 库

目标任务

ConvAI2 -第二届会话智能挑战，用于训练和评估非目标导向对话系统的模型，例如闲聊

http://convai.io

预训练模型的 HuggingFace 仓库

大型预先训练模型 BERT, GPT, GPT-2, Transformer-XL 的仓库
提供一个简单的方法来下载、实例化和训练PyTorch中预先训练好的模型

HuggingFace的模型现在也可以通过PyTorch Hub访问

语言生成任务接近语言建模训练前的目标，但是:

语言建模前的训练只需要一个输入：一系列单词
在对话框设置中：提供了几种类型的上下文来生成输出序列

知识库：角色句
对话的历史：至少是用户的最后一句话
已生成的输出序列的标记

我们应该如何适应这种模式？

6. 开放问题和方向

预训练的语言模型的缺点

概述：语言模型可视为一般的预训练任务；有了足够的数据、计算和容量，LM可以学到很多东西
在实践中，许多在文本中表示较少的东西更难学习
预先训练好的语言模型并不擅长

细粒度语言任务 (Liu et al., NAACL 2019)
常识(当你真的让它变得困难 Zellers et al., ACL 2019)；自然语言生成(维护长期依赖、关系、一致性等)
当微调时，倾向于过度适应表面形成的信息；‘rapid surface learners’

大型的、预训练的语言模型很难优化。

微调通常是不稳定的，并且有很高的方差，特别是在目标数据集非常小的情况下
Devlin et al. (NAACL 2019) 指出，BERT的大版本(24层)特别容易导致性能退化；多次随机重启有时是必要的，这在(Phang et al., 2018)中也有详细的研究

当前的预训练语言模型非常大

我们真的需要所有这些参数吗？
最近的研究表明，BERT中只需要几个注意力头(Voita et al., ACL 2019)
需要做更多的工作来理解模型参数
修剪和蒸馏是两种处理方法
参见：彩票假说(Frankle et al., ICLR 2019)

预训练任务

语言建模目标的不足

并不适用于所有模型

如果我们需要更多的输入，就需要对这些部件进行预培训
例如序列到序列学习中的解码器(Song et al., ICML 2019)

从左到右的偏见并不总是最好的

考虑更多上下文(如屏蔽)的目标似乎有用(采样效率较低)
可能组合不同LM变种(Dong et al., 2019)

语义和长期上下文的弱信号与语法和短期单词共存的强信号

需要激励机制来促进我们所关心的编码，例如语义

更加多样化的自我监督目标

从计算机视觉中获得灵感
语言中的自我监督主要基于词的共现(Ando and Zhang, 2005)
不同层次意义上的监督

论述、文件、句子等
使用其他信号，例如元数据

强调语言的不同性质

抽样一个补丁和一个邻居，并预测它们的空间配置(Doersch et al., ICCV 2015)

图片着色 (Zhang et al., ECCV 2016)

专门的预训练任务来教我们的模型缺少的东西

制定专门的预训练任务，明确学习这些关系

获取背景知识的单词对关系 (Joshi et al., NAACL 2019)
范围级表示(Swayamdipta et al., EMNLP 2018)
不同的预训练词嵌入是有用的(Kiela et al., EMNLP 2018)

其他预训练的任务可以明确地学习推理或理解

算术、时间、因果等；话语、叙述、谈话等。

预训练的表示可以以稀疏和模块化的方式连接

基于语言子结构(Andreas et al., NAACL 2016) 或专家 (Shazeer et al., ICLR 2017)

需要更加合理的表示

分布式假设的局限性——很难从原始文本中学习特定类型的信息

人类报告偏见：不陈述显而易见的(Gordon and Van Durme, AKBC 2013)
常识不是写下来的
关于命名实体的事实
没有其他模式的基础

可能的解决方式:

吸收其他结构化知识(e.g. knowledge bases like ERNIE, Zhang et al 2019)
多模态学习(e.g. with visual representations like VideoBERT, Sun et al. 2019)
交互式/human-in-the-loop 的方法(e.g. dialog, Hancock et al. 2018)

任务和任务的相似性

许多任务可以表示为语言建模的变体

语言本身可以直接用于指定任务、输入和输出，例如，通过构建QA (McCann et al., 2018)
基于对话的学习，不受正向预测的监督 (Weston, NIPS 2016)
将NLP任务制定为完形填空预测目标 (Children Book Test, LAMBADA, Winograd, ...)
通过提示触发任务行为，例如翻译提示 (Radford, Wu et al. 2019); 使zero-shot适应
质疑NLP中的“任务”概念
预训练和目标任务(NLI，分类)的直觉相似性与较好的下游性能相关
不清楚两个任务在什么时候以及如何相似和相关
获得更多理解的方法之一：大规模的迁移实证研究，如 Taskonomy (Zamir et al., CVPR 2018)
是否有助于设计更好和更专业的预训练任务

持续和元学习

当前迁移学习只进行一次适应。
最终，我们希望拥有能够在许多任务中持续保留和积累知识的模型(Yogatama et al., 2019)
预训练和适应之间没有区别；只有一个任务流
主要的挑战是:灾难性的遗忘
不同的研究方法：

记忆、正则化、任务特定权重等

迁移学习的目的：学习一种对许多任务都通用且有用的表示方法
客观因素不会刺激适应的易用性(通常不稳定)；没有学会如何适应它
元学习与迁移学习相结合可以使这一方法更加可行
然而，大多数现有的方法都局限于few-shot场景，并且只学习了几个适应步骤

偏见

偏见已经被证明普遍存在于单词嵌入和一般的神经模型中
大型预训练的模型必然有自己的一套偏见
常识和偏见之间的界限很模糊
我们需要在适应过程中消除这种偏见
一个小的微调模型应该更不易被误用

结论

主题：语境中的词汇，语言模型预培训，深度模型
预训练具有较好的 sample-efficiency ，可按比例放大
对某些特性的预测——取决于您如何看待它
性能权衡，自顶向下
迁移学习易于实现，实用性强
仍然存在许多不足和尚未解决的问题

本期责任编辑：崔一鸣

本期编辑：顾宇轩

方便交流学习，备注：昵称-学校（公司）-方向，进入DL&NLP交流群。

方向有很多：机器学习、深度学习，python，情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。

记得备注呦

推荐阅读：

【ACL 2019】腾讯AI Lab解读三大前沿方向及20篇入选论文

【一分钟论文】IJCAI2019 | Self-attentive Biafﬁne Dependency Parsing

【一分钟论文】 NAACL2019-使用感知句法词表示的句法增强神经机器翻译

【一分钟论文】Semi-supervised Sequence Learning半监督序列学习

【一分钟论文】Deep Biaffine Attention for Neural Dependency Parsing

详解Transition-based Dependency parser基于转移的依存句法解析器

经验 | 初入NLP领域的一些小建议

学术 | 如何写一篇合格的NLP论文

干货 | 那些高产的学者都是怎样工作的？

一个简单有效的联合模型

近年来NLP在法律领域的相关研究工作

让更多的人知道你“在看”

你可能感兴趣的:(赛尔笔记 | 自然语言处理中的迁移学习(下))

django - admin后台管理-2-自定义模型类米兔-miny django -达内 django 分布式 python
注册自定义模型类若要自己定义的模型类也能在/admin后台管理界中显示和管理，需要将自己的类注册到后台管理界面注册步骤：在应用app中的admin.py中导入注册要管理的模型models类，如：from.modelsimportBook调用admin.site.register方法进行注册，如：admin.site.register(自定义模型类)#file:bookstore/admin.pyf
Django - 视图和模板 Missing Sunshine Python-Django django 视图和模板
视图视图-是具体的业务代码在app下的views.py文件中编写代码fromdjango.httpimportHttpResponsedefindex(request):returnHttpResponse("这里是我的站点") 为了调用该视图，我们还需要编写urlconf，也就是路由配置。在polls目录中新建一个文件，名字为urls.py（不要换成别的名字），在其中输入代码如下:fromdj
STM32 ADC详解月入鱼饵 stm32 嵌入式硬件单片机
本文介绍stm32ADC的使用，本文较长，可以配合目录跳转到需要的地方阅读。ADC转换原理本文重点在于STM32的ADC的使用，介绍ADC转换原理是为了更好理解STM32中关于ADC的配置，所以这里只是简单介绍一下ADC的转换原理，想详细了解ADC的转换原理可以看看看完这篇文章，终于搞懂了ADC原理及分类！和ADC基本工作原理-CSDN。简单来说，模拟信号输入进来，经过低通滤波操作预处理信号之后，
Spring 声明式事务：从原理到实现的完整解析 Code季风 Spring详解 spring 数据库后端开发语言 java spring boot
在后端开发中，事务管理是保证数据一致性的核心机制。尤其是在复杂业务场景下，一个操作可能涉及多步数据库操作，任何一步失败都需要回滚到初始状态。Spring的声明式事务通过AOP思想，将事务管理从业务逻辑中剥离，让开发者更专注于核心业务。本文将结合实际实现，详解声明式事务的核心机制和设计思路。一、为什么需要声明式事务？在讨论实现之前，我们先明确一个问题：为什么要用声明式事务，而不是手动编写事务代码？假
设计可靠 LoRaWAN 设备时需要考虑的关键能力门思科技技术分享网络服务器物联网运维嵌入式硬件
引言LoRaWAN已经成为低功耗广域网（LPWAN）中的重要标准，在智慧农业、能源管理、城市基础设施监测等领域得到大规模应用。然而，设计一款真正能够在各种复杂环境中稳定运行、可远程管理、可持续升级的设备，需要从底层架构就进行深度思考，而不仅仅是简单集成一个无线模块。如果缺乏系统性的设计，设备在面对实际部署时会遇到连接不稳、电池过快耗尽、远程控制受限等问题，导致后期维护成本大幅上升。下面，我们将从工
vllm本地部署bge-reranker-v2-m3模型API服务实战教程雷电法王大模型部署 linux python vscode language model
文章目录一、说明二、配置环境2.1安装虚拟环境2.2安装vllm2.3对应版本的pytorch安装2.4安装flash_attn2.5下载模型三、运行代码3.1启动服务3.2调用代码验证一、说明本文主要介绍vllm本地部署BAAI/bge-reranker-v2-m3模型API服务实战教程本文是在Ubuntu24.04+CUDA12.8+Python3.12环境下复现成功的二、配置环境2.1安装虚
上位机知识篇---Linux中的文件挂载 Atticus-Orion 上位机操作篇 linux 运维网络文件挂载
文章目录前言1.挂载的基本概念文件系统挂载点设备文件2.挂载的命令挂载文件系统示例卸载文件系统示例3.挂载的常用选项示例4.自动挂载（/etc/fstab文件）示例使用UUID挂载5.挂载网络文件系统（NFS）挂载NFS示例6.挂载ISO文件挂载ISO文件示例7.查看已挂载的文件系统8.挂载的注意事项9.挂载的常见问题挂载失败卸载失败10.总结前言在Linux系统中，文件挂载是指将一个文件系统（如
《Effective Python》第十三章测试与调试——使用 pdb 进行交互式调试不学无术の码农 Effective Python 精读笔记 python 开发语言
引言本文基于《EffectivePython:125SpecificWaystoWriteBetterPython,3rdEdition》第十三章：测试与调试中的Item114:ConsiderInteractiveDebuggingwithpdb，旨在系统总结书中关于Python内置调试器pdb的使用方法，结合笔者在实际开发中的调试经验，探讨其应用场景、技巧以及延伸思考。Python开发过程中，
java 对象中必须有属性和方法_Java反射机制（三）：调用对象的私有属性和方法... WebKing java 对象中必须有属性和方法
一、通过反射调用类中的方法在正常情况下，得到类的对象后，我们就可以直接调用类中的方法了，如果要想调用的话，则肯定必须清楚地知道要调用的方法是什么，之后通过Class类中的getMethod方法，可得到Method对象。publicMethodgetMethod(Stringname,Class>...parameterTypes)throwsNoSuchMethodException,Securi
浏览器的事件循环中的任务队列（消息队列）小吴在摸渝前端
在浏览器的事件循环中，任务队列是有优先级的。这些优先级决定了在一次事件循环中，哪些任务会被优先执行。以下是一些主要的任务队列及其优先级：微任务队列（优先级最高）：这个队列用于存放需要最快执行的任务。添加任务到微任务队列的主要方式是使用Promise和MutationObserver1。交互队列（优先级高）：这个队列用于存放用户操作后产生的事件处理任务，例如鼠标点击、页面滚动等。延时队列（优先级中）
《C++性能优化指南》 linux版代码及原理解读第一章 v俊逸 C++性能优化指南性能优化 C++性能优化性能优化
概述：目录概述：性能优化的必要性：C++代码优化策略总结用好的编译器并用好编译器使用更好的算法使用更好的库减少内存分配和复制移除计算使用更好的数据结构提高并发性优化内存管理性能优化的必要性：按照当今的CPU运行速度来说，执行一条指令所需要的时间是10的-9次方的时间单位，如此快速的执行速度是否就没有性能优化的必要了呢？其实不然，性能优化与CPU的执行速度并无非常大的关系，试想一下，一段代码，如果用
《C++性能优化指南》 linux版代码及原理解读第四章 v俊逸 C++性能优化指南性能优化 C++性能优化指南性能优化
目录概述为什么字符串很麻烦字符串是动态分配的字符串赋值背后的操作如何面对字符串会进行大量复制写时复制COW（copyonwrite）尝试优化字符串避免临时字符串通过预留存储空间减少内存分配通过传递引用减少实参复制使用迭代器操作减少循环中的比较操作减少返回值的复制还没有结束，使用字符数组代替字符串再次优化字符串尝试其他的算法叠加以前的优化方式使用其他的编译器使用其他字符串的库功能丰富的字符串库使用s
Python装饰器（decorator）
Python装饰器（decorator）是一种高阶函数，用于在不修改原函数代码的情况下，动态地为函数添加额外的功能。它本质上是一个接受函数作为输入并返回新函数的函数，常用于日志记录、性能测试、权限验证等场景。以下是关于Python装饰器的详细讲解：1.基本概念装饰器是一个函数，它接受一个函数作为参数，并返回一个新的函数。新函数通常会在调用原函数前后执行一些额外的逻辑。装饰器的语法糖是@decora
c++中如何排查死锁三月微风 c++java 开发语言
排查死锁（deadlock）是多线程C++开发中的一项核心调试技能，死锁通常是因为多个线程交叉持有资源而相互等待导致程序卡死。下面详细讲讲如何排查和预防死锁：一、死锁的常见成因锁获取顺序不一致（最常见）多个互斥量之间相互等待一个线程尝试多次加锁同一个非递归互斥锁忘记释放锁条件变量使用错误（如wait时未持锁）二、排查死锁的方法✅1.日志调试法在加锁和解锁前后打日志，确认：哪些线程获取了锁哪个线程卡
c++中迭代器的本质三月微风 c++开发语言
C++迭代器的本质与实现原理迭代器是C++标准模板库(STL)的核心组件之一，它作为容器与算法之间的桥梁，提供了统一访问容器元素的方式。下面从多个维度深入解析迭代器的本质特性。一、迭代器的基本定义与分类迭代器的本质迭代器是一种行为类似指针的对象，用于遍历和操作容器中的元素。它提供了一种统一的方式来访问不同容器中的元素，而无需关心容器的具体实现细节。标准分类体系C++标准定义了5种迭代器类型，按功能
24GB GPU 中的 DeepSeek R1：Unsloth AI 针对 671B 参数模型进行动态量化知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek ollama
简介最初的DeepSeekR1是一个拥有6710亿个参数的语言模型，UnslothAI团队对其进行了动态量化，将模型大小减少了80%（从720GB减少到131GB），同时保持了强大的性能。当添加模型卸载功能时，该模型可以在24GBVRAM下以低令牌/秒的推理速度运行。推荐文章《本地构建AI智能分析助手之01快速安装，使用PandasAI和Ollama进行数据分析，用自然语言向你公司的数据提问为决策
在 Obsidian 中本地使用 DeepSeek — 无需互联网！知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek
简介您是否想在Obsidian内免费使用类似于ChatGPT的本地LLM？如果是，那么本指南适合您！我将引导您完成在Obsidian中安装和使用DeepSeek-R1模型的确切步骤，这样您就可以在笔记中拥有一个由AI驱动的第二大脑。推荐文章《24GBGPU中的DeepSeekR1：UnslothAI针对671B参数模型进行动态量化》权重1，DeepSeek类《在RaspberryPi上运行语音识别
dpdk-testpmd 统计显示
背景最近在做测试的发现testpmdshowport统计的Tx-packets是个极大值，很不符合预期。硬件同学说，这个是软件统计，一定是软件问题。我大概知道它是个硬件统计，但是并不能确定，于是，做了一下代码的分析。testpmd>showportstats0########################NICstatisticsforport0########################R
技术演进中的开发沉思-32 MFC系列：生命周期 chilavert318 熬之滴水穿石 windows c++
今天，我们继续MFC以一种更亲近的方式，梳理这个框架的脉络，看看一个MFC程序从诞生到运行的完整故事。一、MFC类层次结构昨天已经梳理过MFC的类层次了，今天梳理其生命周期，还是要提一下。因为它确实很重要，如果把MFC比作一个庞大的家族，那类层次结构就是它的族谱。最顶层的CObject就像家族的老祖宗，所有成员都流淌着它的血液——封装了最基础的功能，比如对象的创建与销毁、序列化等。往下分，就像家族
C++中的智能指针
智能指针是C++中用于自动化管理动态内存的类模板，通过封装原生指针，并利用RAII（资源获取即初始化）技术，确保内存的自动释放，从而避免内存泄漏和悬空指针问题。它是现代C++内存管理的核心工具之一。原生指针的缺陷：1.内存泄漏：忘记调用delete2.悬空指针：释放后仍访问指针3.重复释放：同一内存被多次delete智能指针的优势：1.自动释放内存，不需手动delete，超出作用域自动释放2.防止
C++中NULL等于啥奇妙之二进制嵌入式/Linux #C++编程法则 c++开发语言
文章目录**一、`NULL`的标准定义****二、常见实现方式**1.**定义为整数`0`**2.**定义为`0L`或`(void*)0`**（较少见）**三、与C语言的关键区别****四、`NULL`在C++中的问题**1.**重载函数匹配歧义**2.**模板参数推导错误****五、C++11+的替代方案：`nullptr`****六、最佳实践****七、总结**在C++中，NULL的定义与行为
如何简单获取通配符SSL证书？网安秘谈服务器运维
通配符SSL证书（WildcardSSLCertificate）是一种特殊类型的SSL/TLS证书，其核心功能在于使用一个证书即可为指定主域名下的所有一级子域名提供HTTPS加密保护。它与单域名证书的关键区别在于引入了通配符“*”，代表该层级下无限数量的子域名。↓点击进入证书申请通道填写230935获取一对一技术支持↑核心特点与优势广泛覆盖，简化管理：一张通配符证书（例如*.example.com
【收藏系列】Python 常用装饰器全解析 Gaffey大杂烩 python python 装饰器
Python常用装饰器全解析装饰器是Python中一个强大的特性，它允许我们在不修改原函数或类的情况下，扩展或修改其功能。本文将详细介绍几个最常用的内置装饰器。Python装饰器速查表（一句话用途）装饰器一句话作用概述@classmethod定义一个类方法，第一个参数是类本身（cls），常用于工厂函数或操作类属性。@staticmethod定义一个不依赖实例或类的工具方法，无需self或cls参数
C++中的智能指针（1）：unique_ptr
一、背景普通指针是指向某块内存区域地址的变量。如果一个指针指向的是一块动态分配的内存区域，那么即使这个指针变量离开了所在的作用域，这块内存区域也不会被自动销毁。动态分配的内存不进行释放则会导致内存泄漏。如果一个指针指向的是一块已经被释放的内存区域，那么这个指针就是悬空指针。使用悬空指针会造成不可预料的后果。如果我们定义了一个指针但未初始化使其指向有效的内存区域时，这个指针就成了野指针。使用野指针访
C#常见面试题 rapLiu java 开发语言
1.i++中为什么用到锁在C#中，i++通常不需要用锁，因为i++操作本身是一个原子操作。原子操作是指一个操作要么完全执行，要么完全不执行，不会被中断。因此，在单线程环境下，i++操作是安全的。然而，在多线程环境下，如果多个线程同时对i进行++操作，就可能会出现竞争条件（racecondition），导致数据不一致或错误的结果。为了避免这种情况，需要使用锁来保护i的操作，确保在同一时刻只有一个线程
什么是站群8C？应该能获得多少个IP？
简述站群服务器有1C、2C、4C、8C或更多的种类,IP数量都不同,究竟不同C段数目的分别是什么？不同C段应获得多少IP数量才算合理吗？是如何换算出来？内文会为大家解答什么是C段C段是指IP段的第三个节点,例如142.250.66.110,当中的第三个节点的66便是C段内容。C段的数目越多,不同C段的产品IP便越多,但相对可用IP越少IP组合:aaa.bbb.ccc.dddIP范围:0-255.0
使用内联汇编实现CAS操作（含详细讲解）（Charon）汇编
在多线程环境下，如何安全地更新共享变量，一直是一个重要的话题。今天，我们通过一段使用内联汇编实现的CAS（CompareAndSwap）代码，深入学习它的原理和用法。完整示例代码如下：#include//标准输入输出头文件#include//pthread多线程编程相关头文件#include//usleep函数需要的头文件#defineTHREAD_COUNT10//定义线程数量为10volati
服务器或网络卡的原因和状况 qq2453939845 服务器网络网络服务器
卡的情况下，请先检查您服务器的使用情况。1、CPU使用率是否大于50%。2、内存使用率是否过高。3、网络使用率是否过高。如您购买的是10mbps，那么您服务器的网卡如果为100mbps的连接速率，当网络使用率为10%左右的情况下，则表示您的服务器带宽跑满了，以此类推，如果是千兆网卡（连接速率1000mbps）的，则显示1%即为10mbps。如果出现上述情况，则表明您的服务器或网络无法承载您目前的服
大模型MoE模型技术详解大雷神 AI 人工智能机器学习 AI 大模型
场景：大型超市的收银区域想象一下周末的超市，人山人海（就像大模型要处理海量的Token）。众多收银台（专家）：超市有20个收银台，每个收银台都是一个“专家”。有的收银台是人工柜台（擅长处理现金、复杂商品、老人购物）；有的是自助扫码机（适合年轻人、商品少、动作快）；有的是快速通道（只允许买5件商品以下的顾客）；有的是大宗商品通道（专门处理整箱饮料、大件物品）。智能引导系统（门控网络）：顾客（每个To
K8s 1.24在node节点上手动部署etcd 喝醉酒的小白 K8s kubernetes etcd 容器
目录标题第一次操作一、生成证书并拷贝到新增节点~~~~方案1~~缺少了SAN（SubjectAlternativeNames）~~方案2关键改进：使用说明：二、在已有节点（181）上添加etcd集群成员三、在180上部署静态Pod四、更新旧节点（181）的静态Pod配置-可选五、验证集群状态第一次操作下面给出在节点 172.30.30.180（下简称“180”）上新增etcd成员的完整操作步骤。假
集合框架天子之骄 java 数据结构集合框架
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
Table Driven（表驱动）方法实例 bijian1013 java enum Table Driven 表驱动
实例一： /** * 驾驶人年龄段 * 保险行业，会对驾驶人的年龄做年龄段的区分判断 * 驾驶人年龄段：01-[18,25);02-[25,30);03-[30-35);04-[35,40);05-[40,45);06-[45,50);07-[50-55);08-[55,+∞) */ public class AgePeriodTest { //if...el
Jquery 总结 cuishikuan java jquery Ajax Web jquery方法
1.$.trim方法用于移除字符串头部和尾部多余的空格。如：$.trim(' Hello ') // Hello2.$.contains方法返回一个布尔值，表示某个DOM元素（第二个参数）是否为另一个DOM元素（第一个参数）的下级元素。如：$.contains(document.documentElement, document.body); 3.$
面向对象概念的提出麦田的设计者 java 面向对象面向过程
面向对象中，一切都是由对象展开的，组织代码，封装数据。在台湾面向对象被翻译为了面向物件编程，这充分说明了，这种编程强调实体。下面就结合编程语言的发展史，聊一聊面向过程和面向对象。 c语言由贝尔实
linux网口绑定被触发 linux
刚在一台IBM Xserver服务器上装了RedHat Linux Enterprise AS 4，为了提高网络的可靠性配置双网卡绑定。一、环境描述我的RedHat Linux Enterprise AS 4安装双口的Intel千兆网卡，通过ifconfig -a命令看到eth0和eth1两张网卡。二、双网卡绑定步骤： 2.1 修改/etc/sysconfig/network
XML基础语法肆无忌惮_ xml
一、什么是XML？ XML全称是Extensible Markup Language，可扩展标记语言。很类似HTML。XML的目的是传输数据而非显示数据。XML的标签没有被预定义，你需要自行定义标签。XML被设计为具有自我描述性。是W3C的推荐标准。二、为什么学习XML？用来解决程序间数据传输的格式问题做配置文件充当小型数据库三、XML与HTM
为网页添加自己喜欢的字体知了ing 字体秒表 css
@font-face { font-family: miaobiao;//定义字体名字 font-style: normal; font-weight: 400; src: url('font/DS-DIGI-e.eot');//字体文件 } 使用： <label style="font-size:18px;font-famil
redis范围查询应用-查找IP所在城市矮蛋蛋 redis
原文地址： http://www.tuicool.com/articles/BrURbqV 需求根据IP找到对应的城市原来的解决方案 oracle表（ip_country）：查询IP对应的城市： 1.把a.b.c.d这样格式的IP转为一个数字，例如为把210.21.224.34转为3524648994 2. select city from ip_
输入两个整数，计算百分比 alleni123 java
public static String getPercent(int x, int total){ double result=(x*1.0)/(total*1.0); System.out.println(result); DecimalFormat df1=new DecimalFormat("0.0000%");
百合——————>怎么学习计算机语言百合不是茶 java 移动开发
对于一个从没有接触过计算机语言的人来说，一上来就学面向对象，就算是心里上面接受的了，灵魂我觉得也应该是跟不上的，学不好是很正常的现象，计算机语言老师讲的再多，你在课堂上面跟着老师听的再多，我觉得你应该还是学不会的，最主要的原因是你根本没有想过该怎么来学习计算机编程语言，记得大一的时候金山网络公司在湖大招聘我们学校一个才来大学几天的被金山网络录取，一个刚到大学的就能够去和
linux下tomcat开机自启动 bijian1013 tomcat
方法一：修改Tomcat/bin/startup.sh 为: export JAVA_HOME=/home/java1.6.0_27 export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar:. export PATH=$JAVA_HOME/bin:$PATH export CATALINA_H
spring aop实例 bijian1013 java spring AOP
1.AdviceMethods.java package com.bijian.study.spring.aop.schema; public class AdviceMethods { public void preGreeting() { System.out.println("--how are you!--"); } } 2.beans.x
[Gson八]GsonBuilder序列化和反序列化选项enableComplexMapKeySerialization bit1129 serialization
enableComplexMapKeySerialization配置项的含义 Gson在序列化Map时，默认情况下，是调用Key的toString方法得到它的JSON字符串的Key，对于简单类型和字符串类型，这没有问题，但是对于复杂数据对象，如果对象没有覆写toString方法，那么默认的toString方法将得到这个对象的Hash地址。 GsonBuilder用于
【Spark九十一】Spark Streaming整合Kafka一些值得关注的问题 bit1129 Stream
包括Spark Streaming在内的实时计算数据可靠性指的是三种级别： 1. At most once，数据最多只能接受一次，有可能接收不到 2. At least once, 数据至少接受一次，有可能重复接收 3. Exactly once 数据保证被处理并且只被处理一次，具体的多读几遍http://spark.apache.org/docs/lates
shell脚本批量检测端口是否被占用脚本 ronin47
#!/bin/bash cat ports |while read line do#nc -z -w 10 $line nc -z -w 2 $line 58422>/dev/null2>&1if[ $?-eq 0]then echo $line:ok else echo $line:fail fi done 这里的ports 既可以是文件
java-2.设计包含min函数的栈 bylijinnan java
具体思路参见：http://zhedahht.blog.163.com/blog/static/25411174200712895228171/ import java.util.ArrayList; import java.util.List; public class MinStack { //maybe we can use origin array rathe
Netty源码学习-ChannelHandler bylijinnan java netty
一般来说，“有状态”的ChannelHandler不应该是“共享”的，“无状态”的ChannelHandler则可“共享” 例如ObjectEncoder是“共享”的, 但 ObjectDecoder 不是因为每一次调用decode方法时，可能数据未接收完全（incomplete），它与上一次decode时接收到的数据“累计”起来才有可能是完整的数据，是“有状态”的 p
java生成随机数 cngolon java
方法一： /** * 生成随机数 * @author [email protected] * @return */ public synchronized static String getChargeSequenceNum(String pre){ StringBuffer sequenceNum = new StringBuffer(); Date dateTime = new D
POI读写海量数据 ctrain 海量数据
import java.io.FileOutputStream; import java.io.OutputStream; import org.apache.poi.xssf.streaming.SXSSFRow; import org.apache.poi.xssf.streaming.SXSSFSheet; import org.apache.poi.xssf.streaming
mysql 日期格式化date_format详细使用 daizj mysql date_format 日期格式转换日期格式化
日期转换函数的详细使用说明 DATE_FORMAT(date,format) Formats the date value according to the format string. The following specifiers may be used in the format string. The&n
一个程序员分享8年的开发经验 dcj3sjt126com 程序员
在中国有很多人都认为IT行为是吃青春饭的，如果过了30岁就很难有机会再发展下去!其实现实并不是这样子的，在下从事.NET及JAVA方面的开发的也有8年的时间了，在这里在下想凭借自己的亲身经历，与大家一起探讨一下。明确入行的目的很多人干IT这一行都冲着“收入高”这一点的，因为只要学会一点HTML, DIV+CSS，要做一个页面开发人员并不是一件难事，而且做一个页面开发人员更容
android欢迎界面淡入淡出效果 dcj3sjt126com android
很多Android应用一开始都会有一个欢迎界面，淡入淡出效果也是用得非常多的，下面来实现一下。主要代码如下： package com.myaibang.activity; import android.app.Activity;import android.content.Intent;import android.os.Bundle;import android.os.CountDown
linux 复习笔记之常见压缩命令 eksliang tar解压 linux系统常见压缩命令 linux压缩命令 tar压缩
转载请出自出处:http://eksliang.iteye.com/blog/2109693 linux中常见压缩文件的拓展名 *.gz gzip程序压缩的文件 *.bz2 bzip程序压缩的文件 *.tar tar程序打包的数据，没有经过压缩 *.tar.gz tar程序打包后，并经过gzip程序压缩 *.tar.bz2 tar程序打包后，并经过bzip程序压缩 *.zi
Android 应用程序发送shell命令 gqdy365 android
项目中需要直接在APP中通过发送shell指令来控制lcd灯，其实按理说应该是方案公司在调好lcd灯驱动之后直接通过service送接口上来给APP，APP调用就可以控制了，这是正规流程，但我们项目的方案商用的mtk方案，方案公司又没人会改，只调好了驱动，让应用程序自己实现灯的控制，这不蛋疼嘛！！！！发就发吧！一、关于shell指令：我们知道，shell指令是Linux里面带的
java 无损读取文本文件 hw1287789687 读取文件无损读取读取文本文件 charset
java 如何无损读取文本文件呢？以下是有损的 @Deprecated public static String getFullContent(File file, String charset) { BufferedReader reader = null; if (!file.exists()) { System.out.println("getFull
Firebase 相关文章索引 justjavac firebase
Awesome Firebase 最近谷歌收购Firebase的新闻又将Firebase拉入了人们的视野，于是我做了这个 github 项目。 Firebase 是一个数据同步的云服务，不同于 Dropbox 的「文件」，Firebase 同步的是「数据」，服务对象是网站开发者，帮助他们开发具有「实时」（Real-Time）特性的应用。开发者只需引用一个 API 库文件就可以使用标准 RE
C++学习重点 lx.asymmetric C++笔记
1.c++面向对象的三个特性：封装性，继承性以及多态性。 2.标识符的命名规则：由字母和下划线开头，同时由字母、数字或下划线组成；不能与系统关键字重名。 3.c++语言常量包括整型常量、浮点型常量、布尔常量、字符型常量和字符串性常量。 4.运算符按其功能开以分为六类：算术运算符、位运算符、关系运算符、逻辑运算符、赋值运算符和条件运算符。 &n
java bean和xml相互转换 q821424508 java bean xml xml和bean转换 java bean和xml转换
这几天在做微信公众号做的过程中想找个java bean转xml的工具，找了几个用着不知道是配置不好还是怎么回事，都会有一些问题，然后脑子一热谢了一个javabean和xml的转换的工具里，自己用着还行，虽然有一些约束吧，还是贴出来记录一下顺便你提一下下，这个转换工具支持属性为集合、数组和非基本属性的对象。 packag
C 语言初级位运算 1140566087 位运算 c
第十章位运算 1、位运算对象只能是整形或字符型数据，在VC6.0中int型数据占4个字节 2、位运算符：运算符作用 ~ 按位求反 << 左移 >> 右移 & 按位与 ^ 按位异或 | 按位或他们的优先级从高到低； 3、位运算符的运算功能： a、按位取反： ~01001101 = 101
14点睛Spring4.1-脚本编程 wiselyman spring4
14.1 Scripting脚本编程脚本语言和java这类静态的语言的主要区别是:脚本语言无需编译,源码直接可运行; 如果我们经常需要修改的某些代码,每一次我们至少要进行编译,打包,重新部署的操作,步骤相当麻烦; 如果我们的应用不允许重启,这在现实的情况中也是很常见的; 在spring中使用脚本编程给上述的应用场景提供了解决方案,即动态加载bean; spring支持脚本