Miracle_520

（五）Bert

文章目录

一、Bert的基本原理是什么？
二、BERT 是怎么用 Transformer 的？
三、BERT 的训练过程是怎么样的？

3.1 Masked LM
3.2 Next Sentence Prediction

四、为什么 BERT 比 ELMo 效果好？ELMo 和 BERT 的区别是什么？

4.1 为什么 BERT 比 ELMo 效果好？
4.2 ELMo 和 BERT 的区别是什么？

五、BERT 有什么局限性？
六、BERT 的输入和输出分别是什么？
七、BERT 的 embedding 向量如何得来的？
八、BERT 模型为什么要用 mask？它是如何做 mask 的？其 mask 相对于 CBOW 有什么异同点？

8.1 BERT 模型为什么要用 mask?
8.2 它是如何做 mask 的？
8.3 其 mask 相对于 CBOW 有什么异同点？

九、BERT 的两个预训练任务对应的损失函数是什么(用公式形式展示)？
十、词袋模型到 word2vec 改进了什么？word2vec 到 BERT 又改进了什么？

10.1 词袋模型到 word2vec 改进了什么？
12.2 word2vec 到 BERT 又改进了什么？

Bert
GELU

一、Bert的基本原理是什么？

BERT 是“Bidirectional Encoder Representations from Transformers”的首字母缩写，整体是一个自编码语言模型（Autoencoder LM），并且其设计了两个任务来预训练该模型。

第一个任务是采用 MaskLM 的方式来训练语言模型，通俗地说就是在输入一句话的时候，随机地选一些要预测的词，然后用一个特殊的符号[MASK]来代替它们，之后让模型根据所给的标签去学习这些地方该填的词。
第二个任务在双向语言模型的基础上额外增加了一个句子级别的连续性预测任务（NSP），即预测输入 BERT 的两段文本是否为连续的文本，引入这个任务可以更好地让模型学到连续的文本片段之间的关系。

BERT 相较于原来的 RNN、LSTM 可以做到并发执行，同时提取词在句子中的关系特征，并且能在多个不同层次提取关系特征，进而更全面反映句子语义。相较于 word2vec，其又能根据句子上下文获取词义，从而避免歧义出现。同时缺点也是显而易见的，模型参数太多，而且模型太大，少量数据训练时，容易过拟合。

二、BERT 是怎么用 Transformer 的？

BERT 只使用了** Transformer 的 Encoder 模块**，原论文中，作者分别用 12 层和 24 层 Transformer Encoder 组装了两套 BERT 模型。

「需要注意的是，与 Transformer 本身的 Encoder 端相比，BERT 的 Transformer Encoder 端输入的向量表示，多了 Segment Embeddings。」

三、BERT 的训练过程是怎么样的？

在论文原文中，作者提出了两个预训练任务：Masked LM 和 Next Sentence Prediction。

3.1 Masked LM

Masked LM 的任务描述为：给定一句话，随机抹去这句话中的一个或几个词，要求根据剩余词汇预测被抹去的几个词分别是什么，如下图所示。

具体来说，文章作者在一句话中随机选择 15% 的词汇用于预测。对于在原句中被抹去的词汇， 80% 情况下采用一个特殊符号 [MASK] 替换， 10% 情况下采用一个任意词替换，剩余 10% 情况下保持原词汇不变。

这么做的主要原因是：在后续微调任务中语句中并不会出现 [MASK] 标记，而且这么做的另一个好处是：预测一个词汇时，模型并不知道输入对应位置的词汇是否为正确的词汇（ 10% 概率），这就迫使模型更多地依赖于上下文信息去预测词汇，并且赋予了模型一定的纠错能力。上述提到了这样做的一个缺点，其实这样做还有另外一个缺点，就是每批次数据中只有 15% 的标记被预测，这意味着模型可能需要更多的预训练步骤来收敛。

3.2 Next Sentence Prediction

Next Sentence Prediction 的任务描述为：给定一篇文章中的两句话，判断第二句话在文本中是否紧跟在第一句话之后，如下图所示。

Next Sentence Prediction 任务实际上就是段落重排序的简化版：只考虑两句话，判断是否是一篇文章中的前后句。在实际预训练过程中，文章作者从文本语料库中随机选择 50% 正确语句对和 50% 错误语句对进行训练，与 Masked LM 任务相结合，让模型能够更准确地刻画语句乃至篇章层面的语义信息。

BERT 模型通过对 Masked LM 任务和 Next Sentence Prediction 任务进行联合训练，使模型输出的每个字 / 词的向量表示都能尽可能全面、准确地刻画输入文本（单句或语句对）的整体信息，为后续的微调任务提供更好的模型参数初始值。

四、为什么 BERT 比 ELMo 效果好？ELMo 和 BERT 的区别是什么？

4.1 为什么 BERT 比 ELMo 效果好？

LSTM 抽取特征的能力远弱于 Transformer
拼接方式双向融合的特征融合能力偏弱(没有具体实验验证，只是推测)
其实还有一点，BERT 的训练数据以及模型参数均多余 ELMo，这也是比较重要的一点

4.2 ELMo 和 BERT 的区别是什么？

ELMo 模型是通过语言模型任务得到句子中单词的 embedding 表示，以此作为补充的新特征给下游任务使用。因为 ELMO 给下游提供的是每个单词的特征形式，所以这一类预训练的方法被称为“Feature-based Pre-Training”。

而 BERT 模型是“基于 Fine-tuning 的模式”，这种做法和图像领域基于 Fine-tuning 的方式基本一致，下游任务需要将模型改造成 BERT 模型，才可利用 BERT 模型预训练好的参数。

五、BERT 有什么局限性？

从 XLNet 论文中，提到了 BERT 的两个缺点，分别如下：

BERT 在第一个预训练阶段，假设句子中多个单词被 Mask 掉，这些被 Mask 掉的单词之间没有任何关系，是条件独立的，然而有时候这些单词之间是有关系的
BERT 的在预训练时会出现特殊的[MASK]，但是它在下游的 fine-tune 中不会出现，这就出现了预训练阶段和 fine-tune 阶段不一致的问题。

另外还有一个缺点，是 BERT 在分词后做[MASK]会产生的一个问题，为了解决 OOV 的问题，我们通常会把一个词切分成更细粒度的 WordPiece。BERT 在 Pretraining 的时候是随机 Mask 这些 WordPiece 的，这就可能出现只 Mask 一个词的一部分的情况。

为了解决这个问题，很自然的想法就是词作为一个整体要么都 Mask 要么都不 Mask，这就是所谓的 Whole Word Masking。

六、BERT 的输入和输出分别是什么？

BERT 模型的主要输入是文本中各个字/词(或者称为 token)的原始词向量，该向量既可以随机初始化，也可以利用 Word2Vector 等算法进行预训练以作为初始值；输出是文本中各个字/词融合了全文语义信息后的向量表示，如下图所示（为方便描述且与 BERT 模型的当前中文版本保持一致，统一以「字向量」作为输入）：

从上图中可以看出，**BERT 模型通过查询字向量表将文本中的每个字转换为一维向量，作为模型输入；模型输出则是输入各字对应的融合全文语义信息后的向量表示。**此外，模型输入除了字向量(英文中对应的是 Token Embeddings)，还包含另外两个部分：

Segment Embeddings：区分段落
Position Embeddings：由于出现在文本不同位置的字/词所携带的语义信息存在差异（比如：“我爱你”和“你爱我”），因此，BERT 模型对不同位置的字/词分别附加一个不同的向量以作区分

最后，BERT 模型将字向量、文本向量和位置向量的加和作为模型输入。特别地，在目前的 BERT 模型中，文章作者还将英文词汇作进一步切割，划分为更细粒度的语义单位（WordPiece），例如：将 playing 分割为 play 和##ing；此外，对于中文，目前作者未对输入文本进行分词，而是直接将单字作为构成文本的基本单位。

在做 Next Sentence Prediction 任务时，在第一个句子的首部会加上一个[CLS] token，在两个句子中间以及最后一个句子的尾部会加上一个[SEP] token。

七、BERT 的 embedding 向量如何得来的？

以中文为例，「BERT 模型通过查询字向量表将文本中的每个字转换为一维向量，作为模型输入(还有 position embedding 和 segment embedding)；模型输出则是输入各字对应的融合全文语义信息后的向量表示。」

而对于输入的 token embedding、position embedding 都是随机生成的，需要注意的是在 Transformer 论文中的 position embedding 由 sin/cos 函数生成的固定的值，而在这里代码实现中是跟普通 word embedding 一样随机生成的，可以训练的。作者这里这样选择的原因可能是 BERT 训练的数据比 Transformer 那篇大很多，完全可以让模型自己去学习。

八、BERT 模型为什么要用 mask？它是如何做 mask 的？其 mask 相对于 CBOW 有什么异同点？

8.1 BERT 模型为什么要用 mask?

类似 BERT 这种预训练模式，被称为 DAE LM。因此总结来说 BERT 模型 [Mask] 标记就是引入噪音的手段。

关于 DAE LM 预训练模式，优点是它能比较自然地融入双向语言模型，同时看到被预测单词的上文和下文，然而缺点也很明显，主要在输入侧引入[Mask]标记，导致预训练阶段和 Fine-tuning 阶段不一致的问题。

8.2 它是如何做 mask 的？

给定一个句子，会随机 Mask 15%的词，然后让 BERT 来预测这些 Mask 的词，在输入侧引入[Mask]标记，会导致预训练阶段和 Fine-tuning 阶段不一致的问题，因此在论文中为了缓解这一问题，采取了如下措施：

如果某个 Token 在被选中的 15%个 Token 里，则按照下面的方式随机的执行：

80%的概率替换成[MASK]
10%的概率替换成随机的一个词
10%的概率替换成它本身

8.3 其 mask 相对于 CBOW 有什么异同点？

相同点：CBOW 的核心思想是：给定上下文，根据它的上文 Context-Before 和下文 Context-after 去预测 input word。而 BERT 本质上也是这么做的，但是 BERT 的做法是给定一个句子，会随机 Mask 15%的词，然后让 BERT 来预测这些 Mask 的词。

不同点：

首先，在 CBOW 中，每个单词都会成为 input word，而 BERT 不是这么做的，原因是这样做的话，训练数据就太大了，而且训练时间也会非常长。
其次，对于输入数据部分，CBOW 中的输入数据只有待预测单词的上下文，而 BERT 的输入是带有[MASK] token 的“完整”句子，也就是说 BERT 在输入端将待预测的 input word 用[MASK] token 代替了。
另外，通过 CBOW 模型训练后，每个单词的 word embedding 是唯一的，因此并不能很好的处理一词多义的问题，而 BERT 模型得到的 word embedding(token embedding)融合了上下文的信息，就算是同一个单词，在不同的上下文环境下，得到的 word embedding 是不一样的。

九、BERT 的两个预训练任务对应的损失函数是什么(用公式形式展示)？

BERT 的损失函数由两部分组成，第一部分是来自 Mask-LM 的**「单词级别分类任务」，另一部分是「句子级别的分类任务」**。通过这两个任务的联合学习，可以使得 BERT 学习到的表征既有 token 级别信息，同时也包含了句子级别的语义信息。

具体的预训练工程实现细节方面，BERT 还利用了一系列策略，使得模型更易于训练，比如对于学习率的 warm-up 策略，使用的激活函数不再是普通的 ReLu，而是 GeLu，也使用了 dropout 等常见的训练技巧。

十、词袋模型到 word2vec 改进了什么？word2vec 到 BERT 又改进了什么？

10.1 词袋模型到 word2vec 改进了什么？

词袋模型(Bag-of-words model)这种表示方式不考虑文法以及词的顺序。「而在用词袋模型时，文档的向量表示直接将各词的词频向量表示加和」。通过上述描述，可以得出词袋模型的两个缺点：

词向量化后，词与词之间是有权重大小关系的，不一定词出现的越多，权重越大。
词与词之间是没有顺序关系的。

而 word2vec 是考虑词语位置关系的一种模型。通过大量语料的训练，将每一个词语映射成一个低维稠密向量，通过求余弦的方式，可以判断两个词语之间的关系，word2vec 其底层主要采用基于 CBOW 和 Skip-Gram 算法的神经网络模型。

因此，综上所述，词袋模型到 word2vec 的改进主要集中于以下两点：

考虑了词与词之间的顺序，引入了上下文的信息
得到了词更加准确的表示，其表达的信息更为丰富

12.2 word2vec 到 BERT 又改进了什么？

BERT 的思想其实很大程度上来源于 CBOW 模型

每日传习1：个人的《传习录》学习计划良知即吾心每日传习传习录心学学习
一直想系统的学习《传习录》，学习阳明心学，但却总觉得不到时候。经过了这几年的成长，我的心智更加成熟，心性也更加沉稳一些，感觉现在的自己有信心能把《传习录》系统的学完，于是就开始了传习录的每日学习。具体的学习方法暂定如下：第一轮：先把《传习录》的一篇内容手打到这里。这一步相当于手抄书，虽没有直接手抄的效果好，但是我的字实在太难看，手抄的话，说不定会抹杀我学习的热情。搞清楚文章中每个字的读音。通读若干
零基础入门Python：30天从小白到实战高手（附完整代码+项目案例）全息架构师 Python 实战项目大揭秘 python 开发语言
零基础入门Python：30天从小白到实战高手（附完整代码+项目案例）摘要：本文为技术小白量身打造Python学习路线，包含环境搭建、基础语法、核心库使用、实战项目开发全流程。每日学习计划+代码案例+避坑指南，助你快速掌握编程核心技能！关键词：Python入门、零基础编程、实战项目、学习路线、避坑指南一、为什么选择Python作为第一门编程语言？1.1Python的四大核心优势语法简洁：print
SAS实验04 ——回归分析 jingmingx1 SAS操作分享 sas 数据分析
实验04回归分析一、实验目的通过实验进行对回归分析的学习，并有效掌握回归分析数据样本的解读和整理并从SAS输出结果中得到相关结论二、实验内容①我近些日子复习英语单词的个数和每天的单词学习时间之间的关系做一元线性回归分析②我近些日子每日学习单词时间与复习/学习单词两个变量之间的关系做二元线性回归分析③对四种不同化学物质对水泥放热的影响做逐步回归④在光电比色计上测定每升溶液中叶绿素的毫克数（x，mg/
每日学习Java之一万个为什么？ ~Yogi 学习 java 开发语言
文章目录基于RouYi改造的电商项目业务简单描述Minio文件上传服务权限控制管理端功能H5页面Ajax响应数据接口开发缓存穿透缓存击穿购物车功能订单结算下单立即购买支付页我的订单订单详情用户取消订单库存支付AOP实现自定义缓存热拔插注解中遇到的问题**1.是否需要将增删改查分为四个类型的插件？****原因分析****解决方案****2.缓存数据一致性问题****常见问题****解决方案****3
React百日学习计划——Deepseek版 LuckyLay react.js 学习前端
阶段一：基础巩固（1-20天）目标：掌握HTML/CSS/JavaScript核心语法和开发环境搭建。每日学习内容：HTML/CSS（1-10天）标签语义化、盒模型、Flex布局、Grid布局、响应式设计（媒体查询）。资源：MDNWebDocs、书籍《HTML&CSS设计与构建网站》。JavaScript基础（11-20天）变量、函数、作用域、ES6+（箭头函数、解构、Promise、模块化）。资
[每日学习]算法学习1——数组二分夕虞算法学习算法学习 leetcode 每日 java
回来啦！开启新的一段时间的算法学习~也可以说是复习+深入理解，程序员还是要好好打基本功的。从数组开始。数组二分法入门二分法快速敲一遍代码，复习两种最常见的标准二分法。704.二分查找给定一个n个元素有序的（升序）整型数组nums和一个目标值target，写一个函数搜索nums中的target，如果目标值存在返回下标，否则返回-1。示例1:输入:nums=[-1,0,3,5,9,12],target
flink重温笔记（一）：Flink 基础入门卡林神不是猫 Flink重温笔记 flink 笔记大数据学习方法数据仓库经验分享
Flink重温笔记（一）前言：最近发现Flink技术在实时数仓开发上占比越来越明显，希望通过抓紧复习，加强对Flink的理解和应用，提升自己实时数仓的开发能力，以下是今日整理的学习笔记，各种图像均按照自己理解重画，有疏漏的地方还请各位大佬指出，希望能和大家一起共同学习，互相进步。Tips：这是我的第一篇CSDN博客，后续会持续分享每日学习总结和心得，2024年大家一起加油！一、Flink基础入门1
每日学习Java之一万个为什么 ~Yogi 修炼学习 java mybatis
Mybatis分步查询如果有下一步查询计划，resultType需要改为resultMap，（只要这张表的查询大于1就用Map）并在Map中配置下一步计划在本计划中的实体类，查询列名，下一步计划方法路径。当然，在分步查询sql设计前后我们需要设计分步查询实体类。select*fromt_scorewhereuid=#{id};分步查询和JOIN哪个更好？参考分步查询的延迟加载lazyLoading
每日学习Java之一万个为什么 ~Yogi 修炼 java 学习 spring boot
场景启动器：starter参考常见启动器默认配置官网默认值依赖见官网/pom父依赖注解@SpringBootApplication：启动自动装配，配合main+SpringApplication.run（.class,args）@SpringBootTest：SpringBoot单元测试注解@ConfigurationProperties:指定前缀读取配置文件对应属性，实现批量读取属性值@Impo
每日学习Java之一万个为什么 ~Yogi 修炼学习 java 开发语言
文章目录Spring声明式事务配置事务接口PlatformTransactionManagerSpring基于AOP的事务具体实现流程@Transactional细节事务传播行为SpringMVC所需依赖SpringMVC五个组成部分功能及其原理SpringMVCHandler方法注解RequestMappingHandlerAdapter工作原理Handler需要处理的数据格式，以及用于简化参数
【Leetcode日常签到-1328】人保牛马算法 leetcode
时间2025年2月8日每日学习学习目标：回文字符串题目练习：leetcode1328.破坏回文串题目：由小写英文字母组成的回文字符串palindrome，请你将其中一个字符用任意小写英文字母替换，使得结果字符串的字典序最小，且不是回文串，无法做到，则返回空串分析：由题意可知，要破坏回文字符串。有两种特殊情况：1.一个字符时，是无法破坏回文字符串的。2.当一个回文字符串都是a的时候publicStr
每日学习Java之一万个为什么？[MySQL面试篇] ~Yogi 修炼学习 java mysql
分析SQL语句执行流程中遇到的问题前言1MySQL是怎么在一台服务器上启动的2MySQL主库和从库是同时启动保持Alive的吗？3如果不是主从怎么在启动的时候保证数据一致性4ACID原则在MySQL上的体现5数据在MySQL是通过什么DTO实现的6客户端怎么与MySQLServer建立连接，有哪些建立连接的方式，默认是什么，可以选什么，有哪些应用场景7.SQL组件接受的SQL是什么形式？为什么单一
深度学习笔记线性代数方面，记录一些每日学习到的知识肆—— 人工智能深度学习 python
记录一些每日学习到的新知识：torch：Torch是一个有大量机器学习算法支持的科学计算框架，是一个与Numpy类似的张量(Tensor)操作库jupyter：JupyterNotebook的本质是一个Web应用程序，便于创建和共享程序文档，支持实时代码，数学方程，可视化和markdown。用途包括：数据清理和转换，数值模拟，统计建模，机器学习等等。只有一个轴的张量，形状只有一个元素torch.a
电控三周速成计划参考 kyle~ 嵌入式单片机嵌入式硬件
第1周：基础搭建与GPIO控制学习目标：建立开发环境，掌握最基础的硬件控制能力每日学习（2-3小时）：环境搭建（2天）安装KeilMDK-ARM+STM32CubeMX使用CubeMX创建第一个工程（选择STM32F103C8T6）生成代码并烧录到开发板（LED点亮验证）GPIO编程（3天）推挽输出/开漏输出模式区别使用HAL_GPIO_WritePin()控制LED按键输入检测（轮询方式）时钟系
ES6--《每日学习》 Oswaldhs es6 学习 javascript
一、ES6相关介绍1.1、什么是ES61995年的美国，有一家名为netscape(网景)的公司打造了一款主要用于check验证的脚本语言，而恰在此时，Sun公司的java语言火的一塌糊涂，netscape公司为蹭其热度，便将该脚本语言命名为JavaScript。不料JavaScript居然被越来越多的人使用，后效仿大秦的货币统一政策将其提交给国际标准组织ECMA。该组织发布的标准被称做ECMAS
2022-04-16 安然与你相伴
一、每日精进1、读书:给孩子讲了绘本《格林童话》我自己没有读书2、健身:宝爸回来了，饭后全家一起散步。3、陪家人:陪大宝写精选优秀学生的演讲稿。和两个宝贝一起制定学习计划。陪小女儿讲故事。陪家人散步。陪老公喝茶。今天完成了第一次家庭会议：自由发言，制定了大休日和最新的每日学习清单。希望接下来在执行的时候第一次，我要巧妙的提醒，确保她第一次成功，给她树立起极大的信心。这很重要。4、帮朋友:帮楼下的爷
假装自己是个诗人一个闲人王峻
图片发自App《论道》作者:一个闲人闲人闲心闲眼观，闲情闲语笑世间。莫道红尘多虚幻，唯把快乐撒心田。又到了日更的时间，没什么写作的心情，平淡无奇的生活，周而复始的日子，每日早睡，早起，每日学习，工作，赚钱，日子在时钟的滴答滴答中，机械的进行着。平淡中，唯有读书和写作才能给人带来欢乐，还人一片净土……每天坚持写作是一件很快乐的事情，假装自己是一个很清高诗人，假装自己看透了周遭的一切，假装自己已经读懂
2019.5.1工作总结景气祥和_80d0
工作内容：1.上钟2.回复大众点评（好评7条、差评0）。3.朋友圈素材编辑4.新店预售数量统计5.预约客户6.给顾客发节日祝福需要提高：如何铺垫售卡需要改正：感性的烦恼每日分享：不必急着要生活给予你所有的答案，有时候，你要拿出耐心等等。即便你向空谷喊话，也要等一会儿，才会听见那绵长的回音。每日学习：预判营业数据，对经营的理解
【每天学习一点点 day03】React Native 跨端原理 - 我相信我现在做的能给我的人生带来希望 _终会遇见_ 07 每天一个知识点学习 react native react.js
哈喽大家好，2024年1月24日我将开启打卡【每天学习一点点】，主要内容为记录和分享每日学习内容，学习的类型不限（全凭个人兴趣，哈哈哈，不一定今天能学点啥）2024Q1计划是移动端：①uniapp②ReactNative③Flutter④小程序⑤原生开发，暂时打算每个部分都先从了解其背后的逻辑入手，再到上手的项目，目的之一是为了找出不同框架的相同之处。鸿蒙开发最近也了解了一下，但是目前还没有加入上
金句指导行动（系列之一）王伟强博士
如果把金句比作一个个钉子，读一遍，是把钉子浅浅的钉在大脑这面墙上。把金句感悟出来，就是用锤子把钉子深深钉进大脑之墙。我把这些深深钉入我大脑之墙的金句，配上我鲜活的个人体验，分享给你。相信，你读了也会有带入感，对这些金句产生不一样的认识。我将每日学习的金句做成一个系列。每个系列10句。计划先做100句。这是金句系列之一，10个真诚的金句感悟。请笑纳。【金句1】：初生之物，其形必丑。不怕打脸，万折必东
2021-9-9晨间日记夏之爱
今天是什么日子：每开始新的一天就意味着每一次多了创造美好自我的机会～起床：6:30就寝：22:30天气：️晴朗️心情：开心，满足纪念日：纪念重新开始，形成健康的生活习惯和自律生活的第一天任务清单今日需要完成的任务，最重要的三件事：1.问卷星2.联系人清单整理3.简历修改（打印）4.看书（做个强硬的女孩）5.英语复习（100个单词）习惯养成：坚持每日学习，写作学习·信息·阅读听书健康·饮食·锻炼打球
格局决定结局翻译 2021-10-12 时与猫璞
Yourgreatnessismeasuredbyyourhorizons.你的成就和眼界成正比。-米开朗琪罗时与的每日学习打卡如下：翻译：思路决定出路，格局决定结局Yourwayoutisdeterminedbythewayofthinking,andyouroutcomeismeasuredbyyourambition.又是努力奋斗的一天。2021.10.12
高效率慢生活No.7 智享_GENE
图片发自App每日金句：你不可能完成所有的事每日小确幸：早起的清晨，遇见一轮美丽的明月。✨每日微习惯：[x]每日平板1分钟或俯卧撑每日学习·信息·阅读*熊猫阅读《断舍离竟然没有完成本周的测试，由于已经做过几个，也不能做后面的了，不过看了《我的家里空无一物》这个《断舍离》强烈推荐的教科书式的电视剧，还真心不错。*英语流利说懂你英语懂你英语特训*微信心得《早起的奇迹》的作者经过多年的打拼领悟到一句话：
日历圆盘:11月总结，12月计划。雅俗儿的手帐
☞11月日历圆盘总结:①本月阅读书籍3本，差距1本；②手帐分享完成，整理了PPT并发布；③观看《无名之辈》并做了观影手帐。☞12月日历圆盘计划①每日学习手帐打卡②每日阅读，本月目标4本③本月尝试一篇书评图片发自App图片发自App
2020.3.7今日复盘幸福的丫头丹
丫头本月精进目标①每天赋能群读书打卡一分钟②坚持每天听一本书，本月看书两本③每日抄经练字一篇④每天坚持隐牛健身一小时⑤每日动手画一画⑥陪姑娘每日学习，给儿子在家早教⑦坚持每日复盘，复盘才能翻盘⑧备考复习，每日学习一章⑨走进玛雅，学习玛雅⑩多接触学习新的知识领域，多get新技能今日行动（做了什么）✓天赋乐园学习21天爱上写作day3✓早教分享，今日游戏“浴球吊环”锻炼上臂力量✓抄经练字一篇✓画手账2
2022-12-08 雅思单词与短语 Hedgehoginwind
记录每日学习生活，雅思词汇学习。第一组familiarizeyourselfwithsth使熟悉ahorribletoxin可怕的毒素/releaseatoxincomplexinterplay复杂的相互作用第二组anidentifiablemark可辨别的标记/identifiableby可通过辨认的inductivereasoning归纳推理internist内科医生第三组accreditat
成功习惯30天训练营【day2】 24e3dfd07fce
记录者：余丽霞成长比成功重要完成比完美重要要有梦想和相信的力量信是所望之事的实底，是未见之事的确据每日学习：精油日历之柠檬草，今日礼拜听刘志雄长老讲道每日使用：保卫+顺畅呼吸香薰，茉莉呵护护肤，给老公按摩【芳香调理技术】每日分享：前天送野橘和柑橘清新给姐姐，今天和姐姐见面下单首购套，跟进3人芒果x刘静，新华每日看书：箴言22章，越书写越明白列名单：Y
30/30 记录| 调整英楠在践行
1.每周每月内容写到A4纸上，差缺补漏更加直观，避免忘记，更方便系统总结2.好习惯养成，我坚持做再要求孩子3.营造学习环境大宝二宝都一起输入给孩子什么，就是什么，玩好学好，父母帮助营造好的环境，增加知识性输入，例如物理化学类，日常常识普及给孩子。4.提前备课，如何规划每日学习内容安排(大宝二宝)例如，二宝手指操，全脑，找资源提前准备。大宝，什么时间练魔方，什么时间早读，读什么，篮球怎么练习，讲讲为
2021-12-22晨间日记辽远的边疆
今天是什么日子：自律操作系统建设的第188天！12条军规铁律！：1.不发不写任何朋友圈，朋友圈只用来打卡！不刷朋友圈！任何人的！不点赞评论任何人！2.要事第一！3.珍惜时间不屁话！不查不搜不好奇不猎奇不浏览只按计划刻意练习4.不无聊一无聊就刷网课5.累了困了休息15分钟后继续坚持6.不说下次不说等以后7.晨起后的第一件事是写列好每日学习计划然后开网课灌耳音再下床去洗漱而不是刷屏耽误早上的宝贵时间！
高效率慢生活No.22 智享_GENE
✨每日金句：成功的最短途径是创造力和进取精神。--叶武斌每日小确幸：能当次专家帮助他人完成项目每日A4、番茄工作法完成了本周a4纸的任务整理。吃掉四个番茄。下午外出。✨每日微习惯：√每日平板1分钟或俯卧撑每日学习·信息·阅读*阅读80/20法则也告诉我们，“把工作的内容按实际价值列出，我们会发现80%的价值是由20%的工作产生的，而余下80%的工作仅产生20%的价值”。所以我们需要时刻提醒自己将主
分享100个最新免费的高匿HTTP代理IP mcj8089 代理IP 代理服务器匿名代理免费代理IP 最新代理IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ 120.198.243.130:80,中国/广东省 58.251.78.71:8088,中国/广东省 183.207.228.22:83,中国/
mysql高级特性之数据分区 annan211 java 数据结构 mongodb 分区 mysql
mysql高级特性 1 以存储引擎的角度分析，分区表和物理表没有区别。是按照一定的规则将数据分别存储的逻辑设计。器底层是由多个物理字表组成。 2 分区的原理分区表由多个相关的底层表实现，这些底层表也是由句柄对象表示，所以我们可以直接访问各个分区。存储引擎管理分区的各个底层表和管理普通表一样(所有底层表都必须使用相同的存储引擎)，分区表的索引只是
JS采用正则表达式简单获取URL地址栏参数 chiangfai js 地址栏参数获取
GetUrlParam:function GetUrlParam(param){ var reg = new RegExp("(^|&)"+ param +"=([^&]*)(&|$)"); var r = window.location.search.substr(1).match(reg); if(r!=null
怎样将数据表拷贝到powerdesigner (本地数据库表) Array_06 powerDesigner
================================================== 1、打开PowerDesigner12，在菜单中按照如下方式进行操作 file->Reverse Engineer->DataBase 点击后，弹出 New Physical Data Model 的对话框 2、在General选项卡中 Model name:模板名字，自
logbackのhelloworld 飞翔的马甲日志 logback
一、概述 1.日志是啥？当我是个逗比的时候我是这么理解的：log.debug()代替了system.out.print(); 当我项目工作时，以为是一堆得.log文件。这两天项目发布新版本，比较轻松，决定好好地研究下日志以及logback。传送门1：日志的作用与方法： http://www.infoq.com/cn/articles/why-and-how-log 上面的作
新浪微博爬虫模拟登陆随意而生新浪微博
转载自：http://hi.baidu.com/erliang20088/item/251db4b040b8ce58ba0e1235 近来由于毕设需要，重新修改了新浪微博爬虫废了不少劲，希望下边的总结能够帮助后来的同学们。现行版的模拟登陆与以前相比，最大的改动在于cookie获取时候的模拟url的请求
synchronized 香水浓 java thread
Java语言的关键字，可用来给对象和方法或者代码块加锁，当它锁定一个方法或者一个代码块的时候，同一时刻最多只有一个线程执行这段代码。当两个并发线程访问同一个对象object中的这个加锁同步代码块时，一个时间内只能有一个线程得到执行。另一个线程必须等待当前线程执行完这个代码块以后才能执行该代码块。然而，当一个线程访问object的一个加锁代码块时，另一个线程仍然
maven 简单实用教程 AdyZhang maven
1. Maven介绍 1.1. 简介 java编写的用于构建系统的自动化工具。目前版本是2.0.9，注意maven2和maven1有很大区别，阅读第三方文档时需要区分版本。 1.2. Maven资源见官方网站；The 5 minute test，官方简易入门文档；Getting Started Tutorial，官方入门文档；Build Coo
Android 通过 intent传值获得null aijuans android
我在通过intent 获得传递兑现过的时候报错，空指针,我是getMap方法进行传值，代码如下 1 2 3 4 5 6 7 8 9 public void getMap(View view){ Intent i =
apache 做代理报如下错误：The proxy server received an invalid response from an upstream baalwolf response
网站配置是apache＋tomcat,tomcat没有报错，apache报错是： The proxy server received an invalid response from an upstream server. The proxy server could not handle the request GET /. Reason: Error reading fr
Tomcat6 内存和线程配置 BigBird2012 tomcat6
1、修改启动时内存参数、并指定JVM时区（在windows server 2008 下时间少了8个小时）在Tomcat上运行j2ee项目代码时，经常会出现内存溢出的情况，解决办法是在系统参数中增加系统参数： window下，在catalina.bat最前面 set JAVA_OPTS=-XX:PermSize=64M -XX:MaxPermSize=128m -Xms5
Karam与TDD bijian1013 Karam TDD
一.TDD 测试驱动开发（Test-Driven Development,TDD）是一种敏捷（AGILE）开发方法论，它把开发流程倒转了过来，在进行代码实现之前，首先保证编写测试用例，从而用测试来驱动开发（而不是把测试作为一项验证工具来使用）。 TDD的原则很简单： a.只有当某个
[Zookeeper学习笔记之七]Zookeeper源代码分析之Zookeeper.States bit1129 zookeeper
public enum States { CONNECTING, //Zookeeper服务器不可用，客户端处于尝试链接状态 ASSOCIATING, //？？？ CONNECTED, //链接建立，可以与Zookeeper服务器正常通信 CONNECTEDREADONLY, //处于只读状态的链接状态，只读模式可以在
【Scala十四】Scala核心八：闭包 bit1129 scala
Free variable A free variable of an expression is a variable that’s used inside the expression but not defined inside the expression. For instance, in the function literal expression (x: Int) => (x
android发送json并解析返回json ronin47 android
package com.http.test; import org.apache.http.HttpResponse; import org.apache.http.HttpStatus; import org.apache.http.client.HttpClient; import org.apache.http.client.methods.HttpGet; import
一份IT实习生的总结 brotherlamp PHP php资料 php教程 php培训 php视频
今天突然发现在不知不觉中自己已经实习了 3 个月了，现在可能不算是真正意义上的实习吧，因为现在自己才大三，在这边撸代码的同时还要考虑到学校的功课跟期末考试。让我震惊的是，我完全想不到在这 3 个月里我到底学到了什么，这是一件多么悲催的事情啊。同时我对我应该 get 到什么新技能也很迷茫。所以今晚还是总结下把，让自己在接下来的实习生活有更加明确的方向。最后感谢工作室给我们几个人这个机会让我们提前出来
据说是2012年10月人人网校招的一道笔试题-给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。将重物放到天平左侧，问在两边如何添加砝码 bylijinnan java
public class ScalesBalance { /** * 题目： * 给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。（假设N无限大，但一种重量的砝码只有一个） * 将重物放到天平左侧，问在两边如何添加砝码使两边平衡 * * 分析： * 三进制 * 我们约定括号表示里面的数是三进制，例如 47=(1202
dom4j最常用最简单的方法 chiangfai dom4j
要使用dom4j读写XML文档,需要先下载dom4j包,dom4j官方网站在 http://www.dom4j.org/目前最新dom4j包下载地址:http://nchc.dl.sourceforge.net/sourceforge/dom4j/dom4j-1.6.1.zip 解开后有两个包,仅操作XML文档的话把dom4j-1.6.1.jar加入工程就可以了,如果需要使用XPath的话还需要
简单HBase笔记 chenchao051 hbase
一、Client-side write buffer 客户端缓存请求描述：可以缓存客户端的请求，以此来减少RPC的次数，但是缓存只是被存在一个ArrayList中，所以多线程访问时不安全的。可以使用getWriteBuffer()方法来取得客户端缓存中的数据。默认关闭。二、Scan的Caching 描述： next( )方法请求一行就要使用一次RPC,即使
mysqldump导出时出现when doing LOCK TABLES daizj mysql mysqdump 导数据
　　执行　mysqldump -uxxx -pxxx -hxxx -Pxxxx database tablename > tablename.sql　导出表时，会报 mysqldump: Got error: 1044: Access denied for user 'xxx'@'xxx' to database 'xxx' when doing LOCK TABLES 解决
CSS渲染原理 dcj3sjt126com Web
从事Web前端开发的人都与CSS打交道很多，有的人也许不知道css是怎么去工作的，写出来的css浏览器是怎么样去解析的呢？当这个成为我们提高css水平的一个瓶颈时，是否应该多了解一下呢？一、浏览器的发展与CSS
《阿甘正传》台词 dcj3sjt126com
Part Ⅰ: 《阿甘正传》Forrest Gump经典中英文对白 Forrest: Hello! My names Forrest. Forrest Gump. You wanna Chocolate? I could eat about a million and a half othese. My momma always said life was like a box ochocol
Java处理JSON dyy_gusi json
Json在数据传输中很好用，原因是JSON 比 XML 更小、更快，更易解析。在Java程序中，如何使用处理JSON，现在有很多工具可以处理，比较流行常用的是google的gson和alibaba的fastjson，具体使用如下： 1、读取json然后处理 class ReadJSON { public static void main(String[] args)
win7下nginx和php的配置 geeksun nginx
1. 安装包准备 nginx : 从nginx.org下载nginx-1.8.0.zip php：从php.net下载php-5.6.10-Win32-VC11-x64.zip， php是免安装文件。 RunHiddenConsole: 用于隐藏命令行窗口 2. 配置 # java用8080端口做应用服务器，nginx反向代理到这个端口即可 p
基于2.8版本redis配置文件中文解释 hongtoushizi redis
转载自： http://wangwei007.blog.51cto.com/68019/1548167 在Redis中直接启动redis-server服务时, 采用的是默认的配置文件。采用redis-server xxx.conf 这样的方式可以按照指定的配置文件来运行Redis服务。下面是Redis2.8.9的配置文
第五章常用Lua开发库3-模板渲染 jinnianshilongnian nginx lua
动态web网页开发是Web开发中一个常见的场景，比如像京东商品详情页，其页面逻辑是非常复杂的，需要使用模板技术来实现。而Lua中也有许多模板引擎，如目前我在使用的lua-resty-template，可以渲染很复杂的页面，借助LuaJIT其性能也是可以接受的。如果学习过JavaEE中的servlet和JSP的话，应该知道JSP模板最终会被翻译成Servlet来执行；而lua-r
JZSearch大数据搜索引擎颠覆者 JavaScript
系统简介：大数据的特点有四个层面：第一，数据体量巨大。从TB级别，跃升到PB级别；第二，数据类型繁多。网络日志、视频、图片、地理位置信息等等。第三，价值密度低。以视频为例，连续不间断监控过程中，可能有用的数据仅仅有一两秒。第四，处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”——Volume，Variety，Value，Velocity。大数据搜索引
10招让你成为杰出的Java程序员 pda158 java 编程框架
如果你是一个热衷于技术的 Java 程序员，那么下面的 10 个要点可以让你在众多 Java 开发人员中脱颖而出。　　 1. 拥有扎实的基础和深刻理解 OO 原则　　对于 Java 程序员，深刻理解 Object Oriented Programming（面向对象编程）这一概念是必须的。没有 OOPS 的坚实基础，就领会不了像 Java 这些面向对象编程语言
tomcat之oracle连接池配置小网客 oracle
tomcat版本7.0 配置oracle连接池方式：修改tomcat的server.xml配置文件： <GlobalNamingResources> <Resource name="utermdatasource" auth="Container" type="javax.sql.DataSou
Oracle 分页算法汇总 vipbooks oracle sql 算法 .net
这是我找到的一些关于Oracle分页的算法，大家那里还有没有其他好的算法没？我们大家一起分享一下！ -- Oracle 分页算法一 select * from ( select page.*,rownum rn from (select * from help) page -- 20 = (currentPag