luv_dusk

ERNIE: 2.0带来了什么

目录

前言
一、ERNIE: Enhanced Representation through Knowledge Integration
- - - Knowledge Masking Strategies
    - 对话语言模型
    - 成绩
二、ERNIE 2.0: A Continual Pre-training Framework for Language Understanding
- - - 多任务预训练
    - Word-aware Pretraining Tasks
    - Structure-aware Pretraining Tasks
    - Semantic-aware Pretraining Tasks
    - 成绩

前言

最近一段日子，我们很惊喜地看到越来越多的华夏面孔出现在自然语言处理领域的前沿。从最近叱诧风云的 XLNet 到上个星期自然语言处理顶会 ACL 2019 年的最佳长论文 (还有更多入会论文)，主要负责人都是华人/国人。夹杂着这些好消息，带着 16 项中英文 SOTA 成绩，ERNIE 2.0 的发布更是把自然语言处理的舆论氛围推向了巅峰。就百度而言，无论在产品上如何遭人诟病，其依旧是 IT 从业者们的技术天堂，ERNIE 2.0 向我们展现了它的实力。本篇文章中，我们同样以论文作为标题开始我们的解读：

ERNIE: Enhanced Representation through Knowledge Integration (19 April 2019)
ERNIE 2.0: A Continual Pre-training Framework for Language Understanding (29 July 2019)

一、ERNIE: Enhanced Representation through Knowledge Integration

论文链接：https://arxiv.org/abs/1904.09223
代码链接：https://github.com/PaddlePaddle/ERNIE/tree/develop/ERNIE

在讲 2.0 版本之前，我们先回顾一下在 ERNIE 1.0 (以下统称 ERNIE) 中，百度做了什么，熟悉 1.0 的朋友可以先跳过这一节。ERNIE 的雏形来自于 2018 年 10 月发布的 BERT。关于 BERT 的简介可参考笔者另一篇博文中的相关内容：链接。ERNIE 沿袭了 BERT 中绝大多数的设计思路，包括 预训练 (Pretraining) 加微调 (Fine-tuning) 的流程，去噪自编码 (DAE, abbr. denoising autoencoding) 的模型本质，以及 Masked Language Model 和 Next Sentence Prediction 的训练环节。主要的不同，在于 ERNIE 采用了更为复杂的 Masking 策略：Knowledge Masking Strategies，并针对对话型数据引入一套新的训练机制：对话语言模型 (Dialogue Language Model)。

从图中我们可以看到，ERNIE 不再仅仅只是如同 BERT 中那样，简单地对 token 进行随机选取，而后附上 Mask，而是同时对 token 所在的短语中其他词进行 Masking。这样的设计初衷，在于将更高级的语义信息融入到最终的 embedding 中。事后证明这样的设计，尽管在英文的下游任务中没能刷新 SOTA 成绩，但在对付中文 NLP 任务上相当凑效。

Knowledge Masking Strategies

为了将这样的设计思想融入到模型里，ERNIE 选择逐步推进，将预训练分为三个阶段，分别采用三种 Masking 机制：

Basic-level Masking：如同 BERT，随机选取 15% 的语料单元。
Phrase-level Masking：改为随机挑选短语进行 Masking；短语的识别在于预先使用语言工具进行标注，英文语料使用词法分析以及语义组块，中文语料应用中文分词技术。
Entity-level Masking：改为随机挑选命名实体进行 Masking；预先使用命名实体识别技术对命名实体进行标注，例如人名、地名、组织名。

对话语言模型

上文中的 Knowledge Masking Strategies 应用于一般的句子型语料，而 ERNIE 在训练数据中增加了问答形式下的对话型文本。针对这一类特殊的文本输入，ERNIE 特别地采用另一种 Masking 模型，将 Masked Language Model 取而代之：对话语言模型 (DLM, abbr. Dialogue Language Model)。

DLM 中，不再构建如同 “[CLS] + Sentence_A + [SEP] + Sentence_B + [SEP]” 的句子对，而是如同 “[CLS] + Query + [SEP] + Response_A + [SEP] + Response_B + [SEP]” 的对话三元组，是否上下文连续的二分类训练目标转为预测该对话是否真实 (real/fake)。三元组随机地采用 QRQ、QRR、QQR 其中一种构建形式，上面的例子便是其中的 QRR。为了给处理后的数据添加噪声，部分的 Query 和 Response 使用不相关的语句进行随机替换，以强制模型学习对话中的语境关联。

在训练一般语料时，ERNIE 采用 Knowledge Masking Strategies 改造后的 Masked LM；而在训练对话型语料时，ERNIE 采用 DLM；两者交替使用。

成绩

为了方便进行对比，试验中的 ERNIE 采用同 BERT-base 同样的超参数，包含 12 个 Transformer 层、768 个隐藏单元以及 12 个自注意力头。训练语料来自于中文维基百科、百度百科、百度新闻和百度贴吧 (对话型数据)，总共包含约 1.7 亿个中文语句。在对繁体字进行简体转换后，词汇集的大小最终确定在 17,964。最终，ERNIE 在以下五个中文数据集上战胜 BERT，得到了 SOTA 结果：

自然语言推理：XNLI
语义相似度：LCQMC
命名实体识别：MSRA-NER
情绪分析：ChnSentiCorp
问答：NLPCC-DBQA

作为 BERT 的简单改良版，我们很遗憾没能看到模型表现有大范围的提升，论文中甚至出现不止一处英文书写不规范的问题，显得论文的发表有些急于求成。但这无疑是一个很好的开端，为 ERNIE 2.0 刷新各类中英文成绩做了铺垫。

二、ERNIE 2.0: A Continual Pre-training Framework for Language Understanding

论文链接：https://arxiv.org/abs/1907.12412
代码链接：https://github.com/PaddlePaddle/ERNIE

ERNIE 2.0 将 1.0 版本中的功能特性全部予以保留，并在此基础上做更为丰富的扩展和延伸。论文指出，近几年来基于未标注语料进行无监督编码的预训练模型，包括 Word2Vec、ELMo、GPT、BERT、XLNet、ERNIE 1.0，存在一个共同缺陷：仅仅只是利用了 token 与 token 之间的共现 (Co-occurance) 信息。当两个 token 拥有相似的上下文语境时，最终的编码必然具有极高的相似度。这使得模型无法在词向量中嵌入语料的词汇 (lexical)、语法 (syntatic) 以及语义 (semantic) 信息。为此，ERNIE 2.0 首次引入 连续预训练 (Continual Pre-training) 机制 —— 以串行的方式进行多任务学习，学习以上三类特征。设计的初衷在于模拟人类的学习行为：利用已经积累的知识，持续地进行新的学习。

多任务预训练

多任务学习并不是什么特别新鲜的事物，BERT 中 Masked LM + Next Sentence Prediction 便是一种范例。多任务学习更直接地表现在损失函数的变化上，如下图。

这些任务并非强制性地加入到训练流程中，而是可以针对下游任务，有选择性地挑选一些加入模型。需要注意的是，每次添加任务都需要重新进行一次完整的训练。在开始训练前，每一个任务都会得到一套独立的编码，称为 Task Embedding，附加在原始的语料输入上。在应用于下游任务的微调时，这一套编码会用于模型的初始化。完整的 ERNIE 2.0 架构如下图所示：

需要指出的是，在多数情况下 ERNIE 2.0 输入的是由两个句子组成的句子对 (如同 BERT 中那样)，但在应用于对话型数据时使用 ERNIE 1.0 中的 对话语言模型 (DLM, abbr. Dialogue Language Model)，构建对话三元组，具体的形式请见上一节。

多任务预训练的模式使得模型能够在下游任务中具备更优秀的表现；但相对地，模型的可迁移性将会下降。由于部分任务专门针对特定下游任务设计，当模型的应用场景发生变化时，可能将不得不重新进行预训练以保证模型效果。

Word-aware Pretraining Tasks

多任务中的第一类，用于捕捉词汇 (lexical) 级别的信息。

Knowledge Masking Task：沿袭 ERNIE 1.0 中的 Knowledge Masking Strategies，预测被 Mask 的对象。
Capitalization Prediction Task：预测对象是否大小写 (cased/uncased)；ERNIE 2.0 认为大写开头的词汇具备特定的含义，例如人名、地名、机构名等，这将对命名实体识别一类的下游任务有所帮助。
Token-Document Relation Prediction Task：预测对象是否在文档中其他文段有出现；正案例通常包含文档的关键词以及语言通用词，因此添加这一任务有助于模型将更多的注意力放在这一类词汇上。

Structure-aware Pretraining Tasks

这一类用于捕捉语料中语法 (syntactic) 级别的信息，有助于模型应用在自然语言推理、问答等领域。

Sentence Recording Task：针对文档中的每一个段落，以句子为单位划分为 $1$ ~ $m$ 段，而后对整个文档所有文段进行打乱排列，对每一个文段预测原始位置，成为 $k$ 分类问题 ( $k=\sum_{n=1}^mn!$ )。
Sentence Distance Task：取代 Next Sentence Prediction，预测输入句子对的相对距离；三分类问题， $0$ 代表两个句子在同一篇文档且距离相近， $1$ 代表两个句子在同一片文档但距离较远， $2$ 代表两个句子在不同文档。

Semantic-aware Pretraining Tasks

最后一类用于提取语义 (semantic) 类的信息。

Discourse Relation Task：预测两个句子之间的语法及修辞关联。
IR Relevance Task：专门为百度搜索引擎日志设计的任务，预测 Query-Title 对的相关性；三分类问题， $0$ 、 $1$ 、 $2$ 分别代表强相关、弱相关以及不相关；这将有助于标题自动生成以及文本摘要类任务。

成绩

模型的流程架构上，ERNIE 2.0 相对于 BERT 及 ERNIE 1.0 无疑都更为复杂，但参数结构基本保持一致 (仅添加了可训练的 Task Embedding)。试验中，ERNIE2.0-base 的参数大小向 BERT-base 靠齐，包含 12 个注意力层、768 个隐藏单元以及 12 个自注意力头；而 ERNIE2.0-large 则相应地对齐 BERT-large，包含 24 个注意力层、1024 个隐藏单元以及 16 个自注意力头。最终，ERNIE 2.0 以小于 BERT、XLNet 数倍的训练语料，在 16 项任务上全面超越两者，获得了 SOTA 成绩：

自然语言推理 (英文)：GLUE (CoLA, SST-2, MNLI, RTE, WNLI, QQP, MRPC, STS-B, QNLI, AX)
机器阅读理解 (中文)：CMRC 2018, DRCD, DuReader
自然语言推理 (中文)：XNLI
语义相似度 (中文)：LCQMC, BQ Corpus
命名实体识别 (中文)：MSRA-NER (SIGHAN 2006)
情绪分析 (中文)：ChnSentiCorp
问题 (中文)：NLPCC-DBQA

ERNIE 2.0 创新地将过去单一的预训练流程拆解为串行的多个预训练任务，无疑是其最大的贡献。如何通过多任务的形式将更多的语法信息有效地融入到模型的自编码中，相信会成为未来新的研究方向。

你可能感兴趣的:(ERNIE,ERNIE,2.0)

2.0践行没有你的参与就不完美 x秀丽x
亲爱的伙伴们早上好，今天早上我们开了一次班委竞选的会议，全程只有20多个人参与，宫班本着对大家负责任的态度告诉我们，此次竞选作废，原因是这没有达到2.0的100%参会要求，如果没有大家的参与那么这个班委选出来还有什么意义，这说明选出来的人也是不一定是我们大家心目中认可的那个人，所以为了让大家的这个90天能够更好的激发出自己的的“做”的能力，那么要从第一次竞选班委的会议开始做到100%出席会议，竞选
读书||陶新华《教育中的积极心理学》1—28 流水淙淙2022
读一本好书，尤如和一位高尚者对话，亦能对人的精神进行洗礼。但是若不能和实践结合起来，也只能落到空读书的状态。读书摘要与感想1、塞利格曼在《持续的幸福》一书中提出了幸福2.0理论，提出幸福由5个元素决定——积极情绪、投入的工作和生活、目标和意义、和谐的人际关系、成就感。2、人的大脑皮层在进行智力活动时，都伴有皮下中枢活动，对这些活动进行体验请假，并由此产生了情感解读。人的情绪情感体验总是优先于大脑的
MongoDB知识概括 GeorgeLin98 持久层 mongodb
MongoDB知识概括MongoDB相关概念单机部署基本常用命令索引-IndexSpirngDataMongoDB集成副本集分片集群安全认证MongoDB相关概念业务应用场景：传统的关系型数据库（如MySQL），在数据操作的“三高”需求以及应对Web2.0的网站需求面前，显得力不从心。解释：“三高”需求：①Highperformance-对数据库高并发读写的需求。②HugeStorage-对海量数
使用由 Python 编写的 lxml 实现高性能 XML 解析 hunyxv python 笔记 python xml
转载自：文章lxml简介Python从来不出现XML库短缺的情况。从2.0版本开始，它就附带了xml.dom.minidom和相关的pulldom以及SimpleAPIforXML(SAX)模块。从2.4开始，它附带了流行的ElementTreeAPI。此外，很多第三方库可以提供更高级别的或更具有python风格的接口。尽管任何XML库都足够处理简单的DocumentObjectModel(DOM
《教育信息化2.0素养提升》思考与总结———2019兴成长4⃣️班宁都5940李娟
迎来了美好的假期生活。你可以放松。但是不可以向自己的惰性妥协。你决定不了太阳几点升起，但你可以决定你何时起床。暑假前一个星期很喜欢这样的生活。上午逛逛超市，中午陪爸妈吃饭。下午午觉或者看看书。洗洗衣服干干活。晚上七点钟开始去上课。晚上回来看看电视。熬夜、这样的生活。没有压力。没有目的。没有成果。看似乎一切都可以。这样的生活最多只能过一个星期。暑假的第一个星期学校就开始安排个为教师的素养提升以及自身
[转载] NoSQL简介 weixin_30325793 大数据数据库运维
摘自“百度百科”。NoSQL，泛指非关系型的数据库。随着互联网web2.0网站的兴起，传统的关系数据库在应付web2.0网站，特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心，暴露了很多难以克服的问题，而非关系型的数据库则由于其本身的特点得到了非常迅速的发展。NoSQL数据库的产生就是为了解决大规模数据集合多重数据种类带来的挑战，尤其是大数据应用难题。虽然NoSQL流行语
详细的等保测评攻略就在这里快快小毛毛网络网络安全系统安全
信息安全等级保护，是对信息和信息载体按照重要性等级分级别进行保护的一种工作。目前我国实行的是等保2.0于2019年12月1日开始实施，等保2.0从传统的信息系统，转变成具有基础信息网络平台的多种新兴技术对象，即具有网络服务，有数据的网络服务平台都可以成为新兴的测评对象。等保2.0备案从原来的自主定级改变成系统定级，才能得到公安机关的备案，关于等保测评详细攻略如下：等保2.0定级步骤:确定定级对象—
Cloud Native Weekly | 华为云抢先发布Redis5.0，红帽宣布收购混合云提供商 weixin_34302561 数据库 devops 大数据
1——华为云抢先发布Redis5.02——DigitalOceanK8s服务正式上线3——红帽宣布收购混合云提供商NooBaa4——微软发布多项AzureKubernetes服务更新1华为云抢先发布Redis5.012月17日，华为云在DCS2.0的基础上，快人一步，抢先推出了新的Redis5.0产品，这是一个崭新的突破。目前国内在缓存领域的发展普遍停留在Redis4.0阶段，华为云率先发布了Re
车联网智能终端GB/T 32960国标协议规范、国标新能源车联网终端GB/T32960标准T-BOX应用 zsmydz888 车联网解决方案汽车T-Box车机硬件
新能源车联网终端T-BOX符合GB/T32960,标准国标车载智能网联终端4GTBOX，利用车身总线Can2.0控制协议实现终端与汽车的信息交互，结合北斗GPS卫星定位技术、4G蜂窝网络、Internet网传技术，提供多种信息达成对车辆安全防护，通过强大的服务平台可以实现对车辆进行实时远程监管作用，可以为企业和私家车主提供定位、跟踪、防盗、轨迹回放、车况监测和驾驶行为分析等功能，也可以广泛应用于个
Android界面特效全汇总小飞鹤 Android开发详解 android
（一）Activity页面切换的效果Android2.0之后有了overridePendingTransition（），其中里面两个参数，一个是前一个activity的退出两一个activity的进入，Java代码1.@OverridepublicvoidonCreate(BundlesavedInstanceState){2.super.onCreate(savedInstanceState);
Web3入门指南：从基础概念到实际应用 dingzd95 去中心化 web3 区块链人工智能智能合约
Web3，即“去中心化的第三代互联网”，正在逐步改变我们对互联网的传统认知。从最初的静态网页（Web1.0）到互动平台和社交媒体为主的互联网（Web2.0），Web3的目标是让用户重新掌握对数据和数字资产的控制权。什么是Web3？Web3被视为互联网的下一代发展阶段，其核心是去中心化。与以往依赖中心化服务器和大公司控制的数据模式不同，Web3通过区块链技术实现了数据的分布式存储和处理。这一去中心化
「读书笔记」《如何阅读一本书》13 如何阅读历史书兆雪儿的简书
一本书的分类2.0注：深色字体的分类都是在这部分深入讨论过的，浅色字体的分类仅讨论了其上一级的大分类。“一个历史的‘事实’——虽然我们感觉很相信这两个字代表的意义，但却是世上最难以捉摸的。”“历史比较接近小说，而非科学。”因为，跟小说一样，“他们在创造一个世界。这个新世界与我们所居住的世界并非截然不同——事实上，最好不是——而一个诗人也是人，透过人的感官进行自己的学习。”一、2个要点要点一：对你感
vue IE因Promise无法显示解决办法 Yao请输入昵称
一、ie11打开vue2.0项目空白,控制台报错vuexrequiresaPromisepolyfillinthisbrowserPromise为ES6语法，有的浏览器不支持ES6,所以需要安装babel-polyfill来将ES6转换为浏览器可识别的ES5语法①npminstall--save-devbabel-polyfill②在main.js中引入import"babel-polyfill"
AFN用什么方式实现多线程 natewang
AF3.03.0基于NSURLsession。网络请求的线程可由NSURLSessionConfiguration的HTTPMaximumConnectionsPerHost控制。delegate回调在一个线程上。AF2.0基于NSOperation、NSOperationQueue。使用常驻线程来发起请求、接受delegate回调数据。可以自己设置NSOperationQueue的最大线程数来控
国家等保 2.0 时代，你的移动安全要如何防护？ Reneeeeee412
移动互联时代，什么对企业最重要？是人才？是技术？在勒索病毒“WannaCry”肆虐全球之后企业更加意识到安全才是关键所在跃至2.0时代国家等级保护范围扩展到新领域在信息安全领域，国家提出了最为深远的保障制度——信息安全等级保护制度。在2017年5月等保制度顺应时代要求一跃升级到2.0，不仅安全等级的评定条件更加严格，保护要求也扩展到移动互联、云计算、大数据、物联网和工业控制等新技术和新应用领域。在
go向量数据库 leijmdas golang
在Go语言中，有几个开源的向量数据库项目可供选择。以下是一些受欢迎的选项：1.Milvus：Milvus是一个开源的向量数据库，专为AI应用设计，支持大规模的向量相似性搜索。Milvus2.0版本采用云原生架构，具有存储和计算分离的特点，支持水平扩展以处理数十亿的向量数据。Milvus提供了Go语言的SDK，可以轻松集成到Go应用程序中。Milvus支持多种索引类型，如倒排索引、HNSW、IVF等
前端技术简介 2401_83916204 程序员前端
“前端开发”是从“网页制作”演变而来的。从2005年开始，互联网进入web2.0时代，由单一的文字和图片组成的静态网页已经不能满足用户的需求，用户需要更好的体验。在web2.0时代，网页有静态网页和动态网页。所谓动态网页，就是用户不仅仅可以浏览网页，还可以与服务器进行交互。举个例子，你登陆新浪微博，要输入账号密码，这个时候就需要服务器对你的账号和密码进行验证通过才行。web2.0时代的网页不仅包含
Spring Boot整合Spring Security+JWT+OAuth 2.0 实现认证鉴权登录（框架介绍）星空下夜猫子 spring spring boot 数据库
简介SpringSecurity框架描述SpringSecurity是一个基于Spring框架的安全性框架，可以为Web应用程序提供身份验证（Authentication）、授权（Authorization）、攻击防御等安全功能。SpringSecurity框架提供了一整套的身份验证、授权、ACL（访问控制列表）等模块和类库，还提供了一系列的安全过滤器、安全标签等，可以方便地实现常见的安全性控制。
Meta Force原力元宇宙区块链驱动的财富新引擎口碑信息传播者
在数字化浪潮席卷全球的今天，区块链技术以其去中心化、透明性和不可篡改的特性，正逐渐改变着传统行业的运营模式。其中，MetaForce2.0原力元宇宙作为区块链技术应用的佼佼者，以其独特的矩阵玩法和智能合约机制，成为了市场竞争的新宠。本文将详细解析MetaForce2.0原力元宇宙的运作机制，以及它如何为参与者带来丰厚的收益。13分钟视频内容讲明白原力元宇宙创富项目，中国区运营服务对接微信：Forc
2.0第一周检视（8/16-8/20） aeb1fe80c479
目标一：早起6:30目标二：运动每周3次以上（跑步，跳绳，瑜珈，冥想，快/慢走10000步……）目标三：早睡23点1.健康：本周精力感觉不足，总是犯困，每天也23点睡觉早上6点多会醒，但是醒来后还是感觉困，睡眠软件记录深眠只有1小时左右，午休做10分钟冥想补充精力；运动：两次美姿雅仪锻炼，一次晚上快走1W+2.学习：上了叶老师的财富公开课和PPT公开课发现有上海班，立即决定预约10月PPT3.线下
Spring Boot 2.0 解决跨域问题：WebMvcConfiguration implements WebMvcConfigurer 令狐少侠2011 spring 前端 spring boot java 后端
WhenallowCredentialsistrue,allowedOriginscannotcontainthespecialvalue“*“sincethatcannotWhenallowCredentialsistrue,allowedOriginscannotcontainthespecialvalue"*"sincethatcannotbesetonthe“Access-Control-
Flutter 自绘组件（CustomPaint与Canvas）绘制虚线、区域、直线（一） goodhighting 程序员 flutter 前端 javascript
有人也许会疑惑，方案1和方案二不都是采用的绘制吗，那可不一定。有的时候解决问题，我们不遵循常规也可以解决问题，满足一时之需了。1、解决问题奇葩方式一：为什么奇葩呢？我们采用多个Container进行竖直或者水平排列完成了效果，至于性能上我们后面慢慢验证了。_lineContainer(){returnContainer(margin:EdgeInsets.only(top:2.0),color:C
易效能2.0精进J班YY82392898第二周大班会情若能控_
周检视模版【三个标签】1.旅游爱好者。2.财务自由追求者。3.时间管理践行者。【90天目标】目标1：优化检视，每天晨间日记，周检视，月检视不中断目标2：养成每周3次跑步，争取90天跑一次半马。目标3：培养专注，每天阅读半小时。坐标：宁夏银川睡眠：21:30睡觉为健康，5:00起床为梦想。健康：90天减肥（身材恢复到两年前80公斤）家庭：说服自己用爱教育孩子，而不是打骂阅读：听樊登读书会30分钟；9
天使2.0践行班级总结→唐斌斌临城下
各位天使班的天使班，大家早上好。我是2.0天使践行班的班长，唐斌。很荣幸在这100天的日子里作为班长服务大家，带领大家一起践行。在这100天的践行日子里，对我成长进步很大，让我懂得了践行不是一朝一夕的事，是持续终身的事。首先我说说作为班长在这100天践行日子里都做了哪些具体工作：1.开班前期分组，落实学员入组；2.班会，班委会跟各小组班委沟通，确定好主持人和各参会大臣，参与班会排练；3.解决班委会
Spring Cloud云架构 - SSO单点登录之OAuth2.0 根据token获取用户信息(4) 初夏_91fb
上一篇我根据框架中OAuth2.0的使用总结，画了SSO单点登录之OAuth2.0登出流程，今天我们看一下根据用户token获取yoghurt信息的流程：image/***根据token获取用户信息*@paramaccessToken*@return*@throwsException*/@RequestMapping(value="/user/token/{accesstoken}",method
移动WEB开发（第四天）__响应式布局加蓓努力我先飞 5.移动web开发资料前端
移动WEB开发（第四天）__响应式布局移动端WEB开发之响应式布局1.0响应式开发原理1.1响应式开发原理1.2响应式布局容器2.0bootstrap的介绍2.1Bootstrap简介2.2bootstrap优点2.3版本简介2.4bootstrap基本使用2.5bootstrap布局容器2.6bootstrap栅格系统3.0阿里百秀案例制作3.1技术选型移动端WEB开发之响应式布局1.0响应式开
开源协议有哪些坑？来，比较一下~ FIN技术铺聊聊源码开源协议
在开源软件的世界里，协议扮演着至关重要的角色，它们定义了软件的使用、修改、分发以及商业化等关键条款。不同的开源协议，如GPL、MIT、BSD、Apache2.0等，各有其独特之处，适用于不同的项目和场景。笔者尝试从功能、性能、易用性、安全性以及对商业友好的程度五个维度，对近十种主流的开源软件协议进行深入对比，旨在帮助开发者更好地理解这些协议，并为项目选择合适的开源许可。一、开源协议概述开源协议，又
python3.7安装keras教程_python 3.7 安装 sklearn keras(tf.keras) weixin_39641103
#1sklearn一般方法网上有很多教程，不再赘述。注意顺序是numpy+mkl，然后scipy的环境，scipy，然后sklearn#2anocondaanaconda原始的环境已经自带了sklearn，这里说一下新建环境（比如创建了一个tensorflow的环境），activatetensorflow2.0，然后condainstallsklearn即可，会帮你把各种需要的库都安装。#kera
ModuleNotFoundError: No module named ‘flask._compat‘ 我不是大佬zvj flask python 后端
大家最好别用Flask-Script这个模块了，因为flask2.0及其以上版本取消了flask._compat模块，这个bug根本解决不了，就算降低了flask的版本也会出来其他各种类似的问题，都是由于包版本冲突导致的。搞得我写的项目直接烂尾了，本地之前开发的时候使用的是大环境，没有重构一个新的虚拟环境，所以建议大家开发新项目一定要使用一个新的环境，严格控制包的版本。
Python自动化办公2.0 即将发布百里图书自动化人工智能 python
第一节课：数据整理与清洗第二节课：数据筛选、过滤与排序第三节课：高级数据处理技巧第四节课：数据可视化与实践案例第五节课：统计分析与报表第六节：常见的Excel报表与下方的课程形成知识体系：Python自动化办公(面向2020,Python3.7,不断更新ing)_在线视频教程-CSDN程序员研修院https://edu.csdn.net/course/detail/28031Python机器学习教
iOS http封装 374016526 ios 服务器交互 http 网络请求
程序开发避免不了与服务器的交互，这里打包了一个自己写的http交互库。希望可以帮到大家。内置一个basehttp，当我们创建自己的service可以继承实现。 KuroAppBaseHttp *baseHttp = [[KuroAppBaseHttp alloc] init]; [baseHttp setDelegate:self]; [baseHttp
lolcat ：一个在 Linux 终端中输出彩虹特效的命令行工具 brotherlamp linux linux教程 linux视频 linux自学 linux资料
那些相信 Linux 命令行是单调无聊且没有任何乐趣的人们，你们错了，这里有一些有关 Linux 的文章，它们展示着 Linux 是如何的有趣和“淘气” 。在本文中，我将讨论一个名为“lolcat”的小工具 – 它可以在终端中生成彩虹般的颜色。何为 lolcat ? Lolcat 是一个针对 Linux，BSD 和 OSX 平台的工具，它类似于 cat 命令，并为 cat
MongoDB索引管理（1）——[九] eksliang mongodb MongoDB管理索引
转载请出自出处：http://eksliang.iteye.com/blog/2178427 一、概述数据库的索引与书籍的索引类似，有了索引就不需要翻转整本书。数据库的索引跟这个原理一样，首先在索引中找，在索引中找到条目以后，就可以直接跳转到目标文档的位置，从而使查询速度提高几个数据量级。不使用索引的查询称
Informatica参数及变量 18289753290 Informatica 参数变量
下面是本人通俗的理解，如有不对之处，希望指正 info参数的设置：在info中用到的参数都在server的专门的配置文件中（最好以parma）结尾下面的GLOBAl就是全局的，$开头的是系统级变量，$$开头的变量是自定义变量。如果是在session中或者mapping中用到的变量就是局部变量，那就把global换成对应的session或者mapping名字。 [GLOBAL] $Par
python 解析unicode字符串为utf8编码字符串酷的飞上天空 unicode
php返回的json字符串如果包含中文，则会被转换成\uxx格式的unicode编码字符串返回。在浏览器中能正常识别这种编码，但是后台程序却不能识别，直接输出显示的是\uxx的字符，并未进行转码。转换方式如下 >>> import json >>> q = '{"text":"\u4
Hibernate的总结永夜-极光 Hibernate
1.hibernate的作用,简化对数据库的编码,使开发人员不必再与复杂的sql语句打交道做项目大部分都需要用JAVA来链接数据库，比如你要做一个会员注册的页面，那么获取到用户填写的基本信后，你要把这些基本信息存入数据库对应的表中，不用hibernate还有mybatis之类的框架，都不用的话就得用JDBC，也就是JAVA自己的，用这个东西你要写很多的代码，比如保存注册信
SyntaxError: Non-UTF-8 code starting with '\xc4' 随便小屋 python
刚开始看一下Python语言，传说听强大的，但我感觉还是没Java强吧！写Hello World的时候就遇到一个问题，在Eclipse中写的，代码如下 ''' Created on 2014年10月27日 @author: Logic ''' print("Hello World!"); 运行结果 SyntaxError: Non-UTF-8
学会敬酒礼仪不做酒席菜鸟 aijuans 菜鸟
俗话说，酒是越喝越厚，但在酒桌上也有很多学问讲究，以下总结了一些酒桌上的你不得不注意的小细节。细节一：领导相互喝完才轮到自己敬酒。敬酒一定要站起来，双手举杯。细节二：可以多人敬一人，决不可一人敬多人，除非你是领导。细节三：自己敬别人，如果不碰杯，自己喝多少可视乎情况而定，比如对方酒量，对方喝酒态度，切不可比对方喝得少，要知道是自己敬人。细节四：自己敬别人，如果碰杯，一
《创新者的基因》读书笔记 aoyouzi 读书笔记《创新者的基因》
创新者的基因创新者的“基因”，即最具创意的企业家具备的五种“发现技能”：联想，观察，实验，发问，建立人脉。第一部分破坏性创新，从你开始第一章破坏性创新者的基因如何获得启示：发现以下的因素起到了催化剂的作用：(1) -个挑战现状的问题；(2)对某项技术、某个公司或顾客的观察；(3) -次尝试新鲜事物的经验或实验；(4)与某人进行了一次交谈，为他点醒
表单验证技术百合不是茶 JavaScript DOM对象 String对象事件
js最主要的功能就是验证表单,下面是我对表单验证的一些理解,贴出来与大家交流交流 ,数显我们要知道表单验证需要的技术点, String对象,事件,函数一:String对象;通常是对字符串的操作; 1,String的属性; 字符串.length;表示该字符串的长度; var str= "java"
web.xml配置详解之context-param bijian1013 java servlet web.xml context-param
一.格式定义： <context-param> <param-name>contextConfigLocation</param-name> <param-value>contextConfigLocationValue></param-value> </context-param> 作用：该元
Web系统常见编码漏洞（开发工程师知晓） Bill_chen sql PHP Web fckeditor 脚本
1.头号大敌：SQL Injection 原因：程序中对用户输入检查不严格，用户可以提交一段数据库查询代码，根据程序返回的结果，获得某些他想得知的数据，这就是所谓的SQL Injection，即SQL注入。本质: 对于输入检查不充分，导致SQL语句将用户提交的非法数据当作语句的一部分来执行。示例： String query = "SELECT id FROM users
【MongoDB学习笔记六】MongoDB修改器 bit1129 mongodb
本文首先介绍下MongoDB的基本的增删改查操作，然后，详细介绍MongoDB提供的修改器，以完成各种各样的文档更新操作 MongoDB的主要操作 show dbs 显示当前用户能看到哪些数据库 use foobar 将数据库切换到foobar show collections 显示当前数据库有哪些集合 db.people.update，update不带参数，可
提高职业素养，做好人生规划白糖_ 人生
培训讲师是成都著名的企业培训讲师，他在讲课中提出的一些观点很新颖，在此我收录了一些分享一下。注：讲师的观点不代表本人的观点，这些东西大家自己揣摩。 1、什么是职业规划：职业规划并不完全代表你到什么阶段要当什么官要拿多少钱，这些都只是梦想。职业规划是清楚的认识自己现在缺什么，这个阶段该学习什么，下个阶段缺什么，又应该怎么去规划学习，这样才算是规划。
国外的网站你都到哪边看？ bozch 技术网站国外
学习软件开发技术，如果没有什么英文基础，最好还是看国内的一些技术网站，例如：开源OSchina，csdn，iteye,51cto等等。个人感觉如果英语基础能力不错的话，可以浏览国外的网站来进行软件技术基础的学习，例如java开发中常用的到的网站有apache.org 里面有apache的很多Projects,springframework.org是spring相关的项目网站,还有几个感觉不错的
编程之美-光影切割问题 bylijinnan 编程之美
package a; public class DisorderCount { /**《编程之美》“光影切割问题” * 主要是两个问题： * 1.数学公式（设定没有三条以上的直线交于同一点）： * 两条直线最多一个交点，将平面分成了4个区域； * 三条直线最多三个交点，将平面分成了7个区域； * 可以推出：N条直线 M个交点，区域数为N+M+1。
关于Web跨站执行脚本概念 chenbowen00 Web 安全跨站执行脚本
跨站脚本攻击(XSS)是web应用程序中最危险和最常见的安全漏洞之一。安全研究人员发现这个漏洞在最受欢迎的网站,包括谷歌、Facebook、亚马逊、PayPal,和许多其他网站。如果你看看bug赏金计划,大多数报告的问题属于 XSS。为了防止跨站脚本攻击,浏览器也有自己的过滤器,但安全研究人员总是想方设法绕过这些过滤器。这个漏洞是通常用于执行cookie窃取、恶意软件传播,会话劫持,恶意重定向。在
[开源项目与投资]投资开源项目之前需要统计该项目已有的用户数 comsci 开源项目
现在国内和国外,特别是美国那边,突然出现很多开源项目,但是这些项目的用户有多少,有多少忠诚的粉丝,对于投资者来讲,完全是一个未知数,那么要投资开源项目,我们投资者必须准确无误的知道该项目的全部情况,包括项目发起人的情况,项目的维持时间..项目的技术水平,项目的参与者的势力,项目投入产出的效益.....
oracle alert log file（告警日志文件） daizj oracle 告警日志文件 alert log file
The alert log is a chronological log of messages and errors, and includes the following items: All internal errors (ORA-00600), block corruption errors (ORA-01578), and deadlock errors (ORA-00060)
关于 CAS SSO 文章声明 denger SSO
由于几年前写了几篇 CAS 系列的文章，之后陆续有人参照文章去实现，可都遇到了各种问题，同时经常或多或少的收到不少人的求助。现在这时特此说明几点： 1. 那些文章发表于好几年前了，CAS 已经更新几个很多版本了，由于近年已经没有做该领域方面的事情，所有文章也没有持续更新。 2. 文章只是提供思路，尽管 CAS 版本已经发生变化，但原理和流程仍然一致。最重要的是明白原理，然后
初二上学期难记单词 dcj3sjt126com english word
lesson 课 traffic 交通 matter 要紧；事物 happy 快乐的，幸福的 second 第二的 idea 主意；想法；意见 mean 意味着 important 重要的，重大的 never 从来，决不 afraid 害怕的 fifth 第五的 hometown 故乡，家乡 discuss 讨论；议论 east 东方的 agree 同意；赞成 bo
uicollectionview 纯代码布局, 添加头部视图 dcj3sjt126com Collection
#import <UIKit/UIKit.h> @interface myHeadView : UICollectionReusableView { UILabel *TitleLable; } -(void)setTextTitle; @end #import "myHeadView.h" @implementation m
N 位随机数字串的 JAVA 生成实现 FX夜归人 java Math 随机数 Random
/** * 功能描述随机数工具类<br /> * @author FengXueYeGuiRen * 创建时间 2014-7-25<br /> */ public class RandomUtil { // 随机数生成器 private static java.util.Random random = new java.util.R
Ehcache（09）——缓存Web页面 234390216 ehcache 页面缓存
页面缓存目录 1 SimplePageCachingFilter 1.1 calculateKey 1.2 可配置的初始化参数 1.2.1 cach
spring中少用的注解@primary解析 jackyrong primary
这次看下spring中少见的注解@primary注解，例子 @Component public class MetalSinger implements Singer{ @Override public String sing(String lyrics) { return "I am singing with DIO voice
Java几款性能分析工具的对比 lbwahoo java
Java几款性能分析工具的对比摘自：http://my.oschina.net/liux/blog/51800 在给客户的应用程序维护的过程中，我注意到在高负载下的一些性能问题。理论上，增加对应用程序的负载会使性能等比率的下降。然而，我认为性能下降的比率远远高于负载的增加。我也发现，性能可以通过改变应用程序的逻辑来提升，甚至达到极限。为了更详细的了解这一点，我们需要做一些性能
JVM参数配置大全 nickys jvm 应用服务器
JVM参数配置大全 /usr/local/jdk/bin/java -Dresin.home=/usr/local/resin -server -Xms1800M -Xmx1800M -Xmn300M -Xss512K -XX:PermSize=300M -XX:MaxPermSize=300M -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=5 -
搭建 CentOS 6 服务器(14) - squid、Varnish rensanning varnish
（一）squid 安装 # yum install httpd-tools -y # htpasswd -c -b /etc/squid/passwords squiduser 123456 # yum install squid -y 设置 # cp /etc/squid/squid.conf /etc/squid/squid.conf.bak # vi /etc/
Spring缓存注解@Cache使用 tom_seed spring
参考资料 http://www.ibm.com/developerworks/cn/opensource/os-cn-spring-cache/ http://swiftlet.net/archives/774 缓存注解有以下三个： @Cacheable @CacheEvict @CachePut
dom4j解析XML时出现"java.lang.noclassdeffounderror: org/jaxen/jaxenexception"错误 xp9802
java.lang.NoClassDefFoundError: org/jaxen/JaxenExc 关键字: java.lang.noclassdeffounderror: org/jaxen/jaxenexception 使用dom4j解析XML时，要快速获取某个节点的数据，使用XPath是个不错的方法，dom4j的快速手册里也建议使用这种方式执行时却抛出以下异常： Exceptio

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他