易筱昭

bert做文本摘要_语篇感知神经抽取式文本摘要

bert做文本摘要_语篇感知神经抽取式文本摘要_第1张图片

论文标题：Discourse-Aware Neural Extractive Text Summarization 论文来源：ACL2020 论文链接：arxiv.org/abs/19... 论文源码：github.com/jia...

Abstract

BERT模型在许多摘要任务中都发挥着出色的表现。但是，基于句子的提取模型通常会在提取的摘要中导致多余或无意义的短语；同样，整个文档中的远程依存关系也不能很好地被BERT捕获，因为BERT是对句子对（而不是文档）进行了预训练。

为了解决这些问题，作者提出了一种语篇感知神经摘要模型-DISCOBERT。DISCOBERT将次句子语篇单位（而不是句子）作为候选者，以进行更精细的抽取选择；为了捕获语篇单元之间的长期依赖关系，作者基于RST树和共指关系构建了结构化的语篇图，并使用图卷积网络进行了编码。

实验表明，与其他基于BERT的模型相比，该模型在流行的摘要基准上的性能要优于最新方法。

Introduction

作者提出的DISCOBERT模型是一种基于BERT的语篇感知神经提取摘要模型。为了同时执行压缩和提取并减少句子的冗余度，作者将基本语篇单元（EDU）而不是句子作为最小选择单元，其中EDU是源自RST（修辞结构理论）的子句短语单元。通过在话语单元级别上进行操作，模型可以丢弃子句中的多余细节，因此保留了包含更多概念或事件的额外功能，从而提供了更加简洁和信息丰富的摘要。

作者的贡献主要体现在以下三个方面：

提出了一种语篇感知提取摘要模型DISCOBERT，该模型在实体语篇单元级别上运行，以生成简洁且内容丰富的摘要，而冗余度较低；
使用两种类型的语篇图在结构上模拟句子间上下文；
DISCOBERT在两个流行的Newswire文本摘要数据集上达到了新的技术水平，优于其他基于BERT的模型。

Discourse Analysis

语篇分析的重点是文档或对话中的句子间关系，而修辞结构理论（RST）是一种基于文本局部之间关系的关于文本组织的描述理论。在RST框架中，文本的话语结构可以以树格式表示。整个文档可以分为连续的，相邻的和不重叠的文本范围，称为基本语篇单元（EDU）。每个EDU都被标记为“核”或“卫星”，这是其核能或显著性的特征。核节点通常位于中心位置，而卫星节点则位于外围位置，并且在内容和语法依赖性方面不太重要。 EDU之间存在依存关系，代表着它们的修辞关系。作者将EDU视为文本摘要中内容选择的最小单位，

在文本摘要的内容选择中，作者希望模型选择文档中最简洁，最关键的概念，并且冗余度较低。作者提出的方法可以选择一个或几个细粒度的EDU，以使生成的摘要较少冗余。这是DISCOBERT模型的基础。

bert做文本摘要_语篇感知神经抽取式文本摘要_第2张图片

RST Graph

当选择句子作为提取性摘要的候选者时，常假设每个句子在语法上都是独立的。但是对于EDU，需要考虑一些限制以确保语法。话语单元和结构的实现是EDU预处理的关键部分，需要两个步骤：话语分割和RST解析。在分割阶段，作者使用基于BiLSTM CRF框架的神经语篇分割器，分段器在RST-DT测试集中获得94.3 F1分数，其中人类表现为98.3。在解析阶段，使用平移-减少语篇解析器提取关系并识别神经质。

EDU之间的依赖性对于所选EDU的语法至关重要。所选EDU的数量取决于参考摘要的平均长度，跨EDU的依赖性以及现有内容的长度。根据开发集调整所选EDU的最佳平均数量。

RST Graph的构建不仅旨在在EDU之间提供本地段落级别的连接，而且还提供远程文档级别的连接。从第i个EDU到第j个EDU的相关性作为有向边，即

[i] [j] = 1。

Coreference Graph

文本摘要（尤其是新闻摘要）通常会遇到众所周知的“位置偏见”问题。大部分关键信息在文档的开头就进行了描述，但是，在文档的中间或末尾仍然散布了大量的信息，摘要模型通常会忽略这些信息；此外，在长篇新闻文章中，整个文档中经常有多个核心人物和事件。但是，现有的神经模型在建模这样的远程上下文时效果不佳，尤其是当存在多个模棱两可的共指关系要解析时。

为了鼓励和指导模型捕捉文档中的远程上下文，作者提出了基于话语单元的共指图，其算法如下图所示：

bert做文本摘要_语篇感知神经抽取式文本摘要_第3张图片

作者首先使用Stanford CoreNLP来检测文章中的所有共指簇。对于每个共同参照集群，将包含提及同一集群的所有语篇单元连接起来。在所有共指提及群集上重复此过程，以创建最终的共指图。

bert做文本摘要_语篇感知神经抽取式文本摘要_第4张图片

DISCOBERT Model

bert做文本摘要_语篇感知神经抽取式文本摘要_第5张图片

该模型由文档编码器和图形编码器组成。对于文档编码器，首先使用预训练的BERT模型在令牌级别对整个文档进行编码。然后，使用自注意跨度提取器从对应的文本跨度中获取EDU表示形式。Graph Encoder以Document Encoder的输出作为输入，并根据所构建的话语图用Graph Convolutional Network更新EDU表示形式，然后用于预测oracle标签。

假设文档D总共分为n个EDU，即D={

}。作者将提取摘要公式化为顺序标记任务，其中每个EDU

由神经网络评分，并根据所有EDU的评分做出决策。 oracle标签是二进制标签的序列，其中1代表被选择，0代表未被选择。作者将标签表示为Y={

}。在训练过程中，旨在预测给定文档D的标签Y的顺序。在推理过程中，需要进一步考虑语篇依赖性，以确保输出摘要的连贯性和语法性。

Document Encoder

BERT最初受过训练，可以对单个句子或句子对进行编码。但是，新闻文章通常包含500多个单词，因此需要进行一些调整才能将BERT应用于文档编码。具体来说，在每个句子的开头和结尾分别插入和令牌，为了对新闻等较长的文档进行编码，作者还将BERT的最大序列长度从512扩展到768进行实验。

标记化后的输入文档表示为D={

}，且

={

},其中

是第i个EDU中BPE令牌的数量。然后使用BERT模型对文档进行编码:

在BERT编码器之后，作者采用了Lee等人提出的自注意跨度提取器学习EDU表示形式。EDU表示计算如下所示：

bert做文本摘要_语篇感知神经抽取式文本摘要_第6张图片

其中

是第i个EDU中第j个单词的分数;

是第j个单词的归一化注意力;

是BERT输出的隐藏状态的加权和;W和b矩阵是要学习的参数。

在跨度提取步骤之后，整个文档被表示为一系列EDU表示形式：

而他们将被送往图形编码器。

Graph Encoder

给定构造的图形G =（V; E），节点V对应于文档中的EDU，而边E对应于RST话语关系或共指提及。然后，作者使用图卷积网络更新所有EDU的表示形式，以捕获BERT遗漏的远程依赖项，以便进行更好的摘要。为了使体系结构设计模块化，作者提出了一个语篇图编码器（DGE）层。实验中堆叠了多个DGE层，第k个DGE层的设计如下：

bert做文本摘要_语篇感知神经抽取式文本摘要_第7张图片

LN(.)表示归一化层；

表示第i个EDU节点的邻节点；

是第K个DGE层的第i个EDU节点的输出；而

是文档编码器的输出。在经过K层的图传播后，我们得到了最终的EDU表示：

对于不同的图，不共享DGE的参数。如果同时使用两个图（RST图和共指图），则它们的输出是串联在一起的：

Training & Inference

训练中，

被用于预测oracle标签:

该模型的训练损失是二进制交叉熵损失：

在inference过程中，给定一个输入文档，在获得所有EDU的预测概率后,进行降序排列，并相应地选择EDU。EDU之间的依赖性在预测中也得到强制执行，以确保生成的摘要的语法正确性。

Experiments

bert做文本摘要_语篇感知神经抽取式文本摘要_第8张图片

CNN/DM

bert做文本摘要_语篇感知神经抽取式文本摘要_第9张图片

NYT

bert做文本摘要_语篇感知神经抽取式文本摘要_第10张图片

语法性

bert做文本摘要_语篇感知神经抽取式文本摘要_第11张图片

人类评估结果

bert做文本摘要_语篇感知神经抽取式文本摘要_第12张图片

输出样例

Conclusion

在本文中，作者提出了DISCOBERT，它使用话语单元作为最小选择基础来减少摘要冗余，并利用两种类型的话语图作为归纳偏差来捕获话语单元之间的长期依赖性。作者在两个流行的摘要数据集上验证了所提出的方法，并观察到相对于基线模型的一致改进。

你可能感兴趣的:(bert做文本摘要)

芦花鞋一四许叶晗
又是在一个寒冷的夏日里，青铜和葵花决定今天一起去卖芦花鞋，奶奶亲手给他们做了一碗热乎乎的粥对他们说:“就靠你们两挣生活费了这碗粥赶紧趁热喝了吧！”于是青铜和葵花喝完了奶奶给她们做的粥，就准备去镇上卖卢花鞋，这回青铜和葵花穿着新的芦花鞋来到了镇上。青铜这回看到了很多人都在卖，用手势表达对葵花说:“这回有好多人在抢我们生意呢！我们必须得吆喝起来。”葵花点了点头。可是谁知他们也大声的叫，卖芦花喽！卖芦花
2020-01-25 晴岚85
郑海燕坚持分享590天2020.1.24在生活中只存在两个问题。一个问题是：你知道想要达成的目标是什么，但却不知道如何才能达成；另一个问题是：你不知道你的目标是什么。前一个是行动的问题，后一个是结果的问题。通过制定具体的下一步行动，可以解决不知道如何开始行动的问题。而通过去想象结果，对结果做预估，可以解决找不着目标的问题。对于所有吸引我们注意力，想要完成的任务，你可以先想象一下，预期的结果究竟是什
一百九十四章. 自相矛盾巨木擎天
唉！就这么一夜，林子感觉就像过了很多天似的，先是回了阳间家里，遇到了那么多不可思议的事情儿。特别是小伙伴们，第二次与自己见面时，僵硬的表情和恐怖的气氛，让自己如坐针毡，打从心眼里难受！还有东子，他现在还好吗？有没有被人欺负？护城河里的小鱼小虾们，还都在吗？水不会真的干枯了吧？那对相亲相爱漂亮的太平鸟儿，还好吧！春天了，到了做窝、下蛋、喂养小鸟宝宝的时候了，希望它们都能够平安啊！虽然没有看见家人，也
开心蒋泳频
从无比抗拒来上课到接受，感动，收获～看着波哥成长，晶晶幸福笑容满面。感觉自己做的事情很有意义，很开心！还有3个感召目标就是还有三个有缘人，哈哈。明天感召去明日计划：8：30-11：00小公益11：00-21点上班，感召图片发自App图片发自App图片发自App
放下是一段成长的修行小莳玥
人来到这个世界上，只有两件事：生和死。一件事已经做完了，另一件你还急什么呢?是人，都有七情六欲。是心，都有喜怒哀乐，这些再正常不过了。别总抱怨自己活得累，过得辛苦。永远记住：舒坦是留给死人的。苦，才是生活；累，才是工作；变，才是命运；忍，才是历练；容，才是智慧；静，才是修养；舍，才会得到；做，才会拥有。人生，活得太清楚，才是最大的不明白。有些事，看得很清，却说不清；有些人，了解很深，却猜不透；有些
活给自己看，笑容才灿烂听着了么
白岩松说“有时候，我们活得很累，并非生活过于刻薄，而是我们太容易被外界的氛围所感染，被他人的情绪所左右。”心情是自己的。若只是活在别人的眼里、嘴里，便掌握不了让自己开心的主动权。人活着，不是为了活给别人看的，唯有做最真实的自己，活给自己看，笑容才灿烂。诚然，世事纷繁复杂，人人都有一张嘴，管也管不了。永远有人欣赏你，也永远有人批评你，不可能做到让所有人都满意，开心做自己才是最重要的。人生苦短，有太多
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
2.0践行没有你的参与就不完美 x秀丽x
亲爱的伙伴们早上好，今天早上我们开了一次班委竞选的会议，全程只有20多个人参与，宫班本着对大家负责任的态度告诉我们，此次竞选作废，原因是这没有达到2.0的100%参会要求，如果没有大家的参与那么这个班委选出来还有什么意义，这说明选出来的人也是不一定是我们大家心目中认可的那个人，所以为了让大家的这个90天能够更好的激发出自己的的“做”的能力，那么要从第一次竞选班委的会议开始做到100%出席会议，竞选
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
阶段总结反思轻争
马上就要进入10月份了，今天做一下前段时间的总结和反思。前段时间，日更、英语、健身、护肤坚持的比较好。阅读、书法坚持的不好。1.中间被迫停更半个多月，其余时间一直在坚持日更挑战。偶尔也有不想写的时候，就做一下摘抄。因为阅读（输入）没跟上来，所以写作（输出）质量有待进一步加强。2.英语做到了一周至少学习5天，每次不少于30分钟，但是小班课没有跟上更新速度，下一步要争取利用零碎时间补听小班课。3.减肥
冬天短期的暴利小生意有哪些？那些小生意适合新手做？一起高省
短期生意不失为创业的一个商机，不过短期生意的商机是转瞬即逝的，而且这类生意也很难作为长期的生意去做，那冬天短期暴利小生意查看更多关于短期暴利小生意的文章有哪些呢?给大家先推荐一个2023年风口项目吧，真很不错的项目，全程零投资，当做副业来做真的很稳定，不管你什么阶层的人，或多或少都网购吧？你们知道网购是可以拿提成，拿返利，拿分佣的吗？你们知道很多优惠券群里面，天天群主和管理发一些商品吗？他们其实在
怎么做淘客赚钱(2022最新免费淘客盈利的方法) 高省_飞智666600
很多人都不知道什么是淘宝客，今天小编为大家解答一下吧。淘宝客，现在简称淘客，是时下比较流行的一个词语，特质为淘宝店推广商品获取提成的人，这些人没有自己的产品，只是在淘宝里面选择适合自己的产品，在自己比较熟悉的领域推广，把产品卖出去之后，会从淘宝店家那里获得百分之五到百分之五十左右的佣金。淘宝客付出的是什么呢？时间。你需要花时间去选适合自己推广的产品，需要花时间去选自己的推广方法，如果你打算自己做个
EIO国际确定性的交易（3/10）资管，资金委托安全吗？古城鹏哥
大家可能都知道资金托管，账户是自己开，钱在自己的账户上，密码是由自己掌控，别人提不走你账户的资金，每天可以看下到自己的账户，也可以看到交易流水。现金只能提到自己的银行卡中。账户由技术人员或操作人员，或者是机构团队帮你操作账户，产生盈利和收入，以获得的利润来分配盈利，技术强硬和做的时间久了过硬技术团队，会保证你的资金本金，不会让你的本金亏损的按照一定比例分配收入。所以在这个过程当中一定要看清楚技术的
2018-07-20 韻梅
念亲爱的好感谢亲爱的每天照顾我们！因为有你我们心里踏实！念儿子的好儿子感谢你昨晚为我们煎手抓饼，让我们感到你满满的爱与幸福:你煎的与外边买的没有区别，也是脆脆的金黄黄的！我也不担心你的温饱问题，因为你能自己做简单的点心啊！儿子已经长大了，妈妈可要享福了咯！儿子加油！只要你敢想敢行动定能会成功的！
我希望，你快乐浅香笑
你总说，你过于沉闷我知道，那只是你的外衣你低垂的眉眼里常盛开你从未言语的笑意你总说，请忽视你的悲伤我知道，你对他人暖意的安慰是如此的渴望！其实那滑落的泪珠不是没人心疼你总说，你喜欢一个人的角落在那里你安然的做自己我知道，人生来就是群居动物没谁喜欢一直孤独的旅程你总说，总说……我知道，都知道试着放开自己吧，给予他人你的美丽，拥抱他人的善意你知道的，我希望，你快乐啊
4招写出高价值文章 zhiliner
文章写得泛泛是因为思考得不够深，思考得越深文章会越有价值。拿到一个主题一定要去深入挖掘事件背后的东西，比如人物困境以及趋势性的东西。写作过程中有几个深度思考的方法一、解剖，让旧素材焕发新意作为一个写作者，我们能够做的最大贡献，就是给出自己看世界的角度。解剖其实就是把这个话题相关的信息都列出来，详细的列出来，看清楚它的内部。我们看到一个老话题或者一段旧素材的时候，不要只看这个素材或者话题本身，一定要
2022-08-28 蔚蓝一片晴
初三暑假培训收获点滴从8月25至8月27日三天两晚的培训结束了，回到家中，该静下心来整理一下触动心灵的收获，成为成长的积淀。1.在优秀团队中快速成长与提升，做一名反思成长型教师一名专业型教师的教学指导包括了教学原理知识、案例知识、策略知识。面对教学中的遇到的有趣的情形、问题会去研究其理，寻找更好的教法学法对策。从新手到成熟型教师，再走向专业型教师，需要的是觉醒与反思，多进行案例研究，从案例中观察、
中原焦点团队网络初中级30期阴丽丽坚持分享第三百八十八次2022.10.18分享约练次数（74）咨询师（6）来访者（53）观察者（15）阴丽丽
今天是忙碌的一天，一早起来，总想着找点把事情弄完，可总也弄不完。就这样弄着吧！孩子的事，自己的事都在那里搁置着，不想做，有点欧！今天总体还不错，只是在下午起床时走神了俩小时，也算是给自己的放松吧！今日难得1.儿子乖巧、听话，努力配合，一天下来也是忙忙碌碌，这真的很难得！2.儿子今天录的视频被班主任认可，这真的很难得3.我今天早上做核酸时，自己把教案整了一下，这真的很难得
做好总书记心中的新青年漂洋过海来看岐岐
习近平总书记在党的二十大报告中强调：“广大青年要坚定不移听党话、跟党走，怀抱梦想又脚踏实地，敢想敢为又善作善成，立志做有理想、敢担当、能吃苦、肯奋斗的新时代好青年。”青年的本领要从基层一线的服务中来，主动跟群众交友，促膝长谈交心，深入基层，为民排忧解难。俗话说，事业都是拼搏出来的，但事业取得成功的前提是要有过硬的本领、足够精湛的技艺，只要肯学习，坚持学以致用，努力求得真知、锤炼本领，就一定会有所收
晨语问安2022年7月6日求索大伟
『晨语问安7.6』不追悔昨日，不将就今天，不妄想未来。只要踏踏实实老老实实把今天做到、做实、做好，即使没有显著成绩，也要无怨无悔走实当下。昨日工作生活对也好错也好，都已经成为了过去，作用就是汲取营养，让自我更好地行走当下；未来即使再美好，也是空中楼阁，起到的是启明引领的作用，能否成为现实取决于当下的行动；今天不仅是空间上的承前启后，更重大的作用让梦想成真同时，也让自己行动更有针对性、思维更加犀利，
一颗小桃树李蓉乐平市湾头中小学
当“凹”同“洼”的时侯，才读(wa，平声)，他不叫贾平洼(贾，原名贾平娃)，非要写作贾平凹。为了表示对他的尊重，对文学的尊重，对文化人的尊重。如果不是帮闺蜜的儿子修改作文，我也不会发现贾平凹叫贾平娃。以下是摘选他的文章《一棵小桃树》：可我的小桃树儿，一颗“仙桃”的种子，却开得太白了，太淡了，那瓣片儿单薄得似纸做的，没有肉的感觉，没有粉的感觉，像患了重病的少女，苍白白的脸，又偏苦涩涩地笑着。雨还在下
越努力，越幸运！ Trulyjane
只有坚持，才可以做到～～记得以前在一本书上看过这句话:再深厚的夫妻感情，如果一方前进，而另一方保持色初心，止步不前，怎么也经不起岁月的考验，将会渐行渐远！当前是个务实的社会，很多的浪漫，没有面包的爱情经不起考验，所有的风花雪月都需要看似很俗却又不得不需要的东西～金钱。所以，无论你是什么身份，多去想想怎么赚钱，让自己无论说话还是做事可以随心，做自己想做的事，并且拥有话语权。越努力，越幸运！！
《度五行》生活报报甲午62：不通痛苦，太通也痛苦，要健康快乐，需要通体舒畅。 YangduSam2021
220809壬寅戊申甲午，《度.生活五行》:天干土克水，水生木，木克土。地支寅申冲，寅午合。20220809，周二，兴大上海六班2512天，西交大2013上海班3212天，后TA15332天，度生活619天，今天拜访了一家有趣且当红产业的新创公司AK。AK一开始从事深海新能源储存与供电设备的研发生产制造，2年前开始做移动与家庭储能设备的研发生产制造。觉得有趣是因为这是笔者认知里用科技做降维打击的公
彩绘曼陀罗作品-第29幅《雪花》燕子心语
2018年12月18日彩绘曼陀罗-第29幅《雪花》图片发自App前夜梦见掉进电梯井，问自己：怎么办？梦醒，感觉有些害怕。想想生活中，事太多，压力大，一件事连着一件事，有点应付不过来了。不再追求完美，一件一件的做，终于完成了好几件事，其中有朋友帮忙完成，感恩画时，即想到此段过程，先画尖角部分，用了三种绿色，想对称，结果无法对称，好吧，接纳!想过渡，结果颜色画错，好吧，接纳!……我在想，错了又能怎样？
小燕子的故事同楼秀才
有则寓言故事：秋天来了，一只小燕子问正在忙碌的蚂蚁：“你们这是在做什么？”“我们在贮藏食物过冬。”它们迅速地回答。“这很聪明，”燕子说，“我也要这样做。”她立即动手把一些死蜘蛛、死苍蝇衔往自己的巢里去。“弄这做什么？”她的母亲终于忍不住问道。“预备过严寒的冬天呀，亲爱的妈妈；是蚂蚁把这种方法教给我的。”老燕说，“适合于它们做的并不适合于优秀的燕子。仁慈的大自然给我们安排了一个更吉利的命运。如果丰腴
九月班级管理工作反思追梦蜂
这个月应该算是最难的一个月，我已N年没当班主任，然后我又开始当了。职称是一方面，想到我如果退休了，不能再接触学生了，那该是多么遗憾的事！我的学生梁*铭是我的榜样，她那么努力，那么拼，那么上进，为什么我不行？虽然我面临的工作很难，但是高考数学也不容易。她拿下来了！满分150分她考了146分！我目睹她的艰辛，她的拼搏！还有，我要为我的孩子做榜样，如何竭尽全力，实现梦想。还有，服务，为社会做事，也是会有
928、在新冠的日子里（2）隔离天使小鱼儿
昨天YD全部人员核酸检测阴性。但是也都不能回家，要隔离14天，按规定执行。小红也是其中之一，今天是第三天，第二夜，门把手的源头还没有通报，在排查中。隔离措施是对的。是人？是物？是相似病毒？希望是虚惊一场。昨天，单位排长队，做核酸检测。我们都统一做了检测。现在出去做事，核酸检测是必须的。我今天也要外出做事，所以核酸检测也要提供。给小红准备了简单的替换衣服。我们也按规定执行。问闺蜜你们也都不回家吗？回
python中的深拷贝与浅拷贝 anshejd70787 python
深拷贝和浅拷贝浅拷贝的时候，修改原来的对象，浅拷贝的对象不会发生改变。1、对象的赋值对象的赋值实际上是对象之间的引用：当创建一个对象，然后将这个对象赋值给另外一个变量的时候，python并没有拷贝这个对象，而只是拷贝了这个对象的引用。当对对象做赋值或者是参数传递或者作为返回值的时候，总是传递原始对象的引用，而不是一个副本。如下所示：>>>aList=["kel","abc",123]>>>bLis
如何培养兴趣绽蕊向阳
今天读李笑来的书《与时间做朋友》，读到有关兴趣部分，深有感触。书中提到，好多人说对某事没有兴趣，实际上是没有能力把这件事做好，做这件事时的感受很不好，有挫败感，每个人对自己不擅长做不好的事情，都本能的容易逃避，所以就以为自己对这件事不感兴趣，他们真正感兴趣的是其他事情。可事实上，出现这种感觉应该仅仅是因为还没有开始做那件事情，也还没有在那件事情上遭受挫折而已。其实，很多人真的放弃原来做的事情，转去
SQL的各种连接查询 xieke90 UNION ALL UNION 外连接内连接 JOIN
一、内连接概念：内连接就是使用比较运算符根据每个表共有的列的值匹配两个表中的行。内连接（join 或者inner join ） SQL语法： select * fron
java编程思想--复用类百合不是茶 java 继承代理组合 final类
复用类看着标题都不知道是什么,再加上java编程思想翻译的比价难懂,所以知道现在才看这本软件界的奇书一:组合语法:就是将对象的引用放到新类中即可代码: package com.wj.reuse; /** * * @author Administrator 组
[开源与生态系统]国产CPU的生态系统 comsci cpu
计算机要从娃娃抓起...而孩子最喜欢玩游戏.... 要让国产CPU在国内市场形成自己的生态系统和产业链,国家和企业就不能够忘记游戏这个非常关键的环节.... 投入一些资金和资源,人力和政策,让游
JVM内存区域划分Eden Space、Survivor Space、Tenured Gen，Perm Gen解释商人shang jvm内存
jvm区域总体分两类，heap区和非heap区。heap区又分：Eden Space（伊甸园）、Survivor Space(幸存者区)、Tenured Gen（老年代-养老区）。非heap区又分：Code Cache(代码缓存区)、Perm Gen（永久代）、Jvm Stack(java虚拟机栈)、Local Method Statck(本地方法栈)。 HotSpot虚拟机GC算法采用分代收
页面上调用 QQ oloz qq
<A href="tencent://message/?uin=707321921&Site=有事Q我&Menu=yes"> <img style="border:0px;" src=http://wpa.qq.com/pa?p=1:707321921:1></a>
一些问题文强chu 问题
1.eclipse 导出 doc 出现“The Javadoc command does not exist.” javadoc command 选择 jdk/bin/javadoc.exe 2.tomcate 配置 web 项目 ..... SQL:3.mysql * 必须得放前面否则 select&nbs
生活没有安全感小桔子生活孤独安全感
圈子好小，身边朋友没几个，交心的更是少之又少。在深圳，除了男朋友，没几个亲密的人。不知不觉男朋友成了唯一的依靠，毫不夸张的说，业余生活的全部。现在感情好，也很幸福的。但是说不准难免人心会变嘛，不发生什么大家都乐融融，发生什么很难处理。我想说如果不幸被分手(无论原因如何)，生活难免变化很大，在深圳，我没交心的朋友。明
php 基础语法 aichenglong php 基本语法
1 .1 php变量必须以$开头 <?php $a=” b”; echo ?> 1 .2 php基本数据库类型 Integer float/double Boolean string 1 .3 复合数据类型数组array和对象 object 1 .4 特殊数据类型 null 资源类型(resource) $co
mybatis tools 配置详解 AILIKES mybatis
MyBatis Generator中文文档 MyBatis Generator中文文档地址： http://generator.sturgeon.mopaas.com/ 该中文文档由于尽可能和原文内容一致，所以有些地方如果不熟悉，看中文版的文档的也会有一定的障碍，所以本章根据该中文文档以及实际应用，使用通俗的语言来讲解详细的配置。本文使用Markdown进行编辑，但是博客显示效
继承与多态的探讨百合不是茶 JAVA面向对象继承对象
继承 extends 多态继承是面向对象最经常使用的特征之一：继承语法是通过继承发、基类的域和方法 //继承就是从现有的类中生成一个新的类，这个新类拥有现有类的所有extends是使用继承的关键字：在A类中定义属性和方法； class A{ //定义属性 int age； //定义方法 public void go
JS的undefined与null的实例 bijian1013 JavaScript JavaScript
<form name="theform" id="theform"> </form> <script language="javascript"> var a alert(typeof(b)); //这里提示undefined if(theform.datas
TDD实践（一） bijian1013 java 敏捷 TDD
一.TDD概述 TDD：测试驱动开发，它的基本思想就是在开发功能代码之前，先编写测试代码。也就是说在明确要开发某个功能后，首先思考如何对这个功能进行测试，并完成测试代码的编写，然后编写相关的代码满足这些测试用例。然后循环进行添加其他功能，直到完全部功能的开发。
[Maven学习笔记十]Maven Profile与资源文件过滤器 bit1129 maven
什么是Maven Profile Maven Profile的含义是针对编译打包环境和编译打包目的配置定制，可以在不同的环境上选择相应的配置，例如DB信息，可以根据是为开发环境编译打包，还是为生产环境编译打包，动态的选择正确的DB配置信息 Profile的激活机制 1.Profile可以手工激活，比如在Intellij Idea的Maven Project视图中可以选择一个P
【Hive八】Hive用户自定义生成表函数(UDTF) bit1129 hive
1. 什么是UDTF UDTF，是User Defined Table-Generating Functions，一眼看上去，貌似是用户自定义生成表函数，这个生成表不应该理解为生成了一个HQL Table，貌似更应该理解为生成了类似关系表的二维行数据集 2. 如何实现UDTF 继承org.apache.hadoop.hive.ql.udf.generic
tfs restful api 加auth 2.0认计 ronin47
　　目前思考如何给tfs的ngx-tfs api增加安全性。有如下两点：　　一是基于客户端的ip设置。这个比较容易实现。　　二是基于OAuth2.0认证，这个需要lua，实现起来相对于一来说，有些难度。　　现在重点介绍第二种方法实现思路。　　前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGe
jdk环境变量配置 byalias java jdk
进行java开发，首先要安装jdk，安装了jdk后还要进行环境变量配置： 1、下载jdk（http://java.sun.com/javase/downloads/index.jsp），我下载的版本是：jdk-7u79-windows-x64.exe 2、安装jdk-7u79-windows-x64.exe 3、配置环境变量：右击"计算机"-->&quo
《代码大全》表驱动法-Table Driven Approach-2 bylijinnan java
package com.ljn.base; import java.io.BufferedReader; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.Collections; import java.uti
SQL 数值四舍五入小数点后保留2位 chicony 四舍五入
1.round() 函数是四舍五入用，第一个参数是我们要被操作的数据，第二个参数是设置我们四舍五入之后小数点后显示几位。 2.numeric 函数的2个参数，第一个表示数据长度，第二个参数表示小数点后位数。例如：　　select cast(round(12.5,2) as numeric(5,2))
c++运算符重载 CrazyMizzz C++
一、加+，减-，乘*，除/ 的运算符重载 Rational operator*(const Rational &x) const{ return Rational(x.a * this->a); } 在这里只写乘法的，加减除的写法类似二、<<输出,>>输入的运算符重载 &nb
hive DDL语法汇总 daizj hive 修改列 DDL 修改表
hive DDL语法汇总１、对表重命名 hive> ALTER TABLE table_name RENAME TO new_table_name; 2、修改表备注 hive> ALTER TABLE table_name SET TBLPROPERTIES ('comment' = new_comm
jbox使用说明 dcj3sjt126com Web
参考网址：http://www.kudystudio.com/jbox/jbox-demo.html jBox v2.3 beta [ 点击下载] 技术交流QQGroup：172543951 100521167 [2011-11-11] jBox v2.3 正式版 - [调整&修复] IE6下有iframe或页面有active、applet控件
UISegmentedControl 开发笔记 dcj3sjt126com
// typedef NS_ENUM(NSInteger, UISegmentedControlStyle) { // UISegmentedControlStylePlain, // large plain &
Slick生成表映射文件 ekian scala
Scala添加SLICK进行数据库操作，需在sbt文件上添加slick-codegen包 "com.typesafe.slick" %% "slick-codegen" % slickVersion 因为我是连接SQL Server数据库，还需添加slick-extensions，jtds包 "com.typesa
ES-TEST gengzg test
package com.MarkNum; import java.io.IOException; import java.util.Date; import java.util.HashMap; import java.util.Map; import javax.servlet.ServletException; import javax.servlet.annotation
为何外键不再推荐使用 hugh.wang mysql DB
表的关联，是一种逻辑关系，并不需要进行物理上的“硬关联”，而且你所期望的关联，其实只是其数据上存在一定的联系而已，而这种联系实际上是在设计之初就定义好的固有逻辑。在业务代码中实现的时候，只要按照设计之初的这种固有关联逻辑来处理数据即可，并不需要在数据库层面进行“硬关联”，因为在数据库层面通过使用外键的方式进行“硬关联”，会带来很多额外的资源消耗来进行一致性和完整性校验，即使很多时候我们并不
领域驱动设计 julyflame VO DAO 设计模式 DTO po
概念： VO（View Object）：视图对象，用于展示层，它的作用是把某个指定页面（或组件）的所有数据封装起来。 DTO（Data Transfer Object）：数据传输对象，这个概念来源于J2EE的设计模式，原来的目的是为了EJB的分布式应用提供粗粒度的数据实体，以减少分布式调用的次数，从而提高分布式调用的性能和降低网络负载，但在这里，我泛指用于展示层与服务层之间的数据传输对
单例设计模式 hm4123660 java Singleton 单例设计模式懒汉式饿汉式
单例模式是一种常用的软件设计模式。在它的核心结构中只包含一个被称为单例类的特殊类。通过单例模式可以保证系统中一个类只有一个实例而且该实例易于外界访问，从而方便对实例个数的控制并节约系统源。如果希望在系统中某个类的对象只能存在一个，单例模式是最好的解决方案。 &nb
logback zhb8015 log logback
一、logback的介绍 Logback是由log4j创始人设计的又一个开源日志组件。logback当前分成三个模块：logback-core,logback- classic和logback-access。logback-core是其它两个模块的基础模块。logback-classic是log4j的一个改良版本。此外logback-class
整合Kafka到Spark Streaming——代码示例和挑战 Stark_Summer spark storm zookeeper PARALLELISM processing
作者Michael G. Noll是瑞士的一位工程师和研究员，效力于Verisign，是Verisign实验室的大规模数据分析基础设施（基础Hadoop）的技术主管。本文，Michael详细的演示了如何将Kafka整合到Spark Streaming中。期间， Michael还提到了将Kafka整合到 Spark Streaming中的一些现状，非常值得阅读，虽然有一些信息在Spark 1.2版
spring-master-slave-commondao 王新春 DAO spring dataSource slave master
互联网的web项目，都有个特点：请求的并发量高，其中请求最耗时的db操作，又是系统优化的重中之重。为此，往往搭建 db的一主多从库的数据库架构。作为web的DAO层，要保证针对主库进行写操作，对多个从库进行读操作。当然在一些请求中，为了避免主从复制的延迟导致的数据不一致性，部分的读操作也要到主库上。（这种需求一般通过业务垂直分开，比如下单业务的代码所部署的机器，读去应该也要从主库读取数

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他