锅巴QAQ

文本摘要常用数据集和方法研究综述

[1]侯圣峦,张书涵,费超群.文本摘要常用数据集和方法研究综述[J].中文信息学报,2019,33(05):1-16.

文章目录

- LCSTS
- - 数据集定义
- NLPCC
- - 数据集定义
- 自建数据集及其对应方法
- - 基于统计的方法
  - 基于图模型的方法
  - 基于词法链的方法
  - 基于篇章结构的方法
  - 基于机器学习的方法

为了解决抽取式摘要方法缺少训练数据的问题，已有方法通常将用于生成式文本摘要的数据集进行简单转换，例如， Cheng等【参考文献6】将CNN/ Daily Mail数据集中的每篇文本中句子与生成式摘要句计算匹配度，匹配度较高的句子作为抽取式摘要句，构成抽取式摘要方法的数据集。

数据集Gigaword、 CNN/ Daily mail、 LASTS等都是十万级规模，可满足深度神经网络训练的需求。

LCSTS

LCSTS（large scale Chinese short text summa rization dataset）链接：http://icrc.hitsz,educn/article/Show/139.html. 是【23—Hu B Chen Q, Zhu F. LCSTS:A large scale Chinese short text summarization dataset】从新浪微博获取的短文本新闻摘要数据库，规模超过200万。

随着微博等社交媒体软件的普及，部分工作提出了面向社交媒体文本的文本摘要算法。由于中文社交媒体文本大都是短文本，具有篇幅较短、存在较多噪声等特点，传统的文本摘要方法在这类文本上往往效果较差。

数据集定义

【24—Ma s, Sun X, XuJ, et al. Improving semantic relevance for Sequence-to- Sequence learning of Chinese social media text summarization】提出面向中文社交媒体短文本摘要的方法，基于深度学习的抽取式摘要，采用循环神经网络的“编码器–解码器”和“注意力”机制。较Hu等【23】的方法有所提升。

NLPCC

自然语言处理与中文计算会议（ CCF Conference on Natural Language Processing &.Chinese Computing, NLPCO）是由中国计算机学会（CCF）举办的自然语言文本测评会议，包括文本摘要、情感分析、自动问答等任务。 http://tcci.ccf.org.cn/conference

数据集定义

特点：新闻文本不分领域、不分类型，篇幅较长。

在此数据集上，【25—莫鹏，胡珀，黄湘冀，等。基于超图的文本摘要与关键词协同抽取研究】提出基于超图的文本摘要和关键词生成方法

将句子作为超边(hyperedge)，将词作为节点(vertice)构建超图(hypergraph)。

利用超图中句子与词之间的高阶信息来生成摘要和关键词。

【文献26—Xu H, Cao Y, Shang Y, et al. Adversarial reinforcement learning for Chinese text summarization】针对已有的利用极大似然估计来优化的生成式摘要模型存在的准确率低的问题，提出了
一种基于对抗增强学习的中文文本摘要方法，提升了基于深度学习方法在中文文本摘要上的准确率。
方法在LCSTS和NLPCC2015数据集上进行了测评。

自建数据集及其对应方法

基于统计的方法

常用的特征：句子所在位置、TF-IDF、n-gram等

文献27【An effective sentence-extraction technique using contextual information and statistical approaches for text summarization. Pattern Recognition letters，2008.】，提出一种基于上下文特征和统计特征的摘要句提取方法

将每两个相邻的句子合并为一个二元语言模型伪句子（ Bi-Gram pseudo sentence，BGPS），BGPS包含比单个句子更多的特征根据统计方法对BGPS进行重要程度打分，选取分值较高的BGPS对应的句子作为摘要句。

基于统计的文本摘要方法较为直观，抽取的特征相对简单，因此方法较易实现，但准确率较低。这类方法同样适用于中文文本摘要任务。

基于图模型的方法

文献【Comments oriented document summarization：understanding documents with readers’ feedback】中，对于web文本，不仅考虑文本内容本身，还将读者的评论信息加入文本摘要抽取

将评论作为节点，评论之间的关系作为边，利用图模型对评论的重要程度进行打分。两种方法：

通过评论的关键词来对候选摘要句进行打分；

将原文本和评论组成一个“伪文本”，对其进行打分。

文献29【林莉媛，王中卿，李寿山，等.基于PageRank的中文多文档文本情感摘要[J]. 中文信息学报，2014】，提出基于情感信息的PageRank多文本情感摘要方法，考虑了情感和主题两方面信息，数据集来自亚马逊中文网https://www.amazon.cn，收集15个产品的评论语料，每个产品包括200条评论，自建了包括15个主题的多文本摘要数据集。选取48个句子作为该主题的摘要句。

基于词法链的方法

文献31【Chen Y wang x, Guan Y. Automatic text summarization based on lexical chains】，首次将词法链应用到中文，提出了基于词法链的中文文本摘要。

首先利用HowNet作为词法链构建知识库，然后识别强词法链，最后基于启发式规则选取摘要句。

文献32【Yu L, Ma J, Ren F,et al. Automatic text summarization based on lexical chains and structural features 】，提出了基于词法链和结构特征的中文文本摘要方法。

同样利用HowNet构建词法链，结构特征包括句子的位置（如是否为首句）等。利用词法链特征和结构特征进行加权对句子的重要程度进行打分，选取摘要句。

文献33【Wu X，Xic F, Wu U, et al. PNFS; personalized web news filtering and summarization】，提出了个性化Web新闻的过滤和摘要系统PNFS

总结并提取能够刻画新闻主题的关键词。

关键词的提取利用基于词法链的方法[34]，利用词之间的语义相关性进行语义消歧并构建词法链。

传统词法链主要由名词和名词短语构成，缺少动词等所包含的语义信息。文献35，提出了全息词法链，包括名词、动词、形容词三类词法链，包括了文章的主要语义信息。根据句子中的全息词法链中的词特征，利用逻辑回归、支持向量机等机器学习方法学习摘要句。

基于篇章结构的方法

文献36【王继成，武港山，周源远，等.一种篇章结构指导的中文Web文档自动摘要方法】，提出中文Web文本自动摘要方法，首先分析段落之间的语义关联，将语义相近的段落合并，划分出主题层次，进而得到篇章结构。在篇章结构的指导下，使用统计的方法，结合启发式规则进行关键词和关键句子的提取，最终生成中文Web文本的摘要。

基于机器学习的方法

文献37【Hu P, He T, Ji D. Chinese text summarization based on thematic area detection】，提出了基于主题的中文单文本摘要方法

首先通过段落聚类发现文本所反映的主题，然后从每一个主题中选取与主题语义相关性最大的一句话作为摘要句，最后根据选取的摘要句在原文本中的顺序组成最终的摘要。

文献38【Baumel T, Cohen R, Elhadad M. Query-chain focused summarization】，提出了基于LDA主题模型的新型文本摘要任务：面向查询的更新摘要方法。

更新摘要是：已经提取出来摘要句，在避免冗余的前提下，将新内容加入摘要中。

面向查询的摘要：提取出与查询相关的重要句子作为摘要句。

综合以上两点：用户的第n条查询语句得到的结果要在前n-1条查询语句结果的摘要上进行更新摘要。

文献40【庞超，尹传环.基于分类的中文文本摘要方法.计算机科学，2018】，结合循环神经网络的“编码器–解码器”结构和基于分类的结构，提出了一种理解式文本摘要方法。同时在此结构中使用了“注意力”机制，提升了模型对于文本内容的表达能力。

。

文献40【庞超，尹传环.基于分类的中文文本摘要方法.计算机科学，2018】，结合循环神经网络的“编码器–解码器”结构和基于分类的结构，提出了一种理解式文本摘要方法。同时在此结构中使用了“注意力”机制，提升了模型对于文本内容的表达能力。

你可能感兴趣的:(NLP自然语言处理,自然语言处理,文本摘要,数据集,文本摘要方法)

9、AutoCAD 2009：块、插入与文件格式全解析老板来份香菜 AutoCAD 2009：从入门到精通 AutoCAD 2009 块创建插入块
AutoCAD2009：块、插入与文件格式全解析在AutoCAD2009中，块和插入功能以及不同的文件格式是提高绘图效率和实现多样化绘图需求的重要工具。下面将详细介绍这些功能的使用方法和相关操作。1.块的创建块是可以插入到其他绘图中的图形，它们包含在创建它们的绘图数据中。创建块的步骤如下：1.绘制图形：以1:50的比例绘制建筑符号，如双床符号。2.打开块定义对话框：左键单击“主页/块”面板中的“创
2019-10-03 BOOpan
潘蔚20191003日精进打卡感谢同事坚守岗位感谢姐夫给女儿送的礼品感谢舅妈的油和辣椒感谢叔叔一家邀请聚餐感谢同事帮忙买东西感谢婶婶对老妈的体谅二、行善利他第一次骑电动三轮载人三、反省感悟换一种方法未必有好的效果，但是这种方法一定是最伤人的！
内部类和匿名内部类 juconcurrent
前言内部类，定义在类或方法里面的类。通常情况下，我们将内部类总共拆分为以下几种类型：成员内部类局部内部类匿名内部类静态内部类成员内部类成员内部类是最普通的内部类，它定义在另一个类的内部，形如下面的形式：publicclassOuter{privateStringname;publicOuter(Stringname){this.name=name;}publicclassInner{publicv
万字长文，解读大模型技术原理（非常详细）零基础入门到精通，收藏这一篇就够了
大模型是指具有大规模参数和复杂计算结构的机器学习模型。本文从大模型的发展历程出发，对大模型领域的各个技术细节进行详细解读，供大家在了解大模型基本知识的过程中起到一定参考作用。一、大模型的定义大语言模型作为一个被验证可行的方向，其“大”体现在训练数据集广，模型参数和层数大，计算量大，其价值体现在通用性上，并且有更好的泛化能力。这些模型通常由深度神经网络构建而成，拥有数十亿甚至数千亿个参数。大模型的设
Windows游戏自动检测本地是否安装 (C++版)
Windows游戏自动检测实现(C++版)下面我将用C++实现Windows下自动检测已安装游戏的完整解决方案，包含注册表扫描、平台集成检测、快捷方式解析等多种方法：#include#include#include#include#include#include#include#include#include#include#include#include#include#pragmacommen
任务管理工具红黑榜：科学匹配你的生物缺陷类型花海如潮淹学习方法经验分享笔记
任务管理的本质与价值定义：任务管理是通过系统化方法将目标拆解为可执行单元，并优化其完成路径的过程。核心价值：对抗熵增：将混沌目标→有序行动认知卸载：释放大脑内存，专注决策而非记忆协作熵减：消除团队协调中的能量耗散现实中的五大深渊级痛点（附科学机制与血泪场景）痛点1：人脑记忆的生物学缺陷→任务黑洞神经科学原理：→工作记忆容量仅4±1条信息（Baddeley模型）→未记录任务24小时遗忘率40%（哈佛
抖音团购的开通方法是怎么样的？古楼
随着移动互联网和社交媒体的发展，短视频成为了人们日常生活中必不可少的一部分。为了满足用户的需求，抖音推出了团购功能，让用户可以在抖音上方便地进行团购活动。那么，如何在抖音上开通团购功能呢？本文将为您详细介绍抖音团购的开通方法。高省只是一个导购的优惠平台！不卖产品！它对接淘宝天猫，京东，拼多多，唯品会等电商平台，在原传统电商的基础上，加入了分享经济的元素，也就是传说中的自用省钱，分享赚钱。零成本创业
综合能力第6条：有目的性的做事平凡人阿白成长日记
我们每天都会做很多事情，有一些是每天都要做的小事，也有一些临时的“大事”，我们做任何事情其实都是要达到某种结果，也可以说是目的，没有目的的话，做事过程容易出现混乱，或者半途而废等诸多问题。反之有目的，我们会盯着目的，所有方式方法朝着目的进行，这样就会很高效达成我们想要的结果，如果事事都是如此，我们生活会变得很高效。要树立“有目的性的做事”这个信念，养成习惯，才能在生活中逐渐起到大效果。值得一提的是
安阳10家最热门权威亲子鉴定中心大全推荐（附2024年汇总鉴定）鼎律基因刘主任
我们需要了解什么是亲子鉴定。亲子鉴定是指通过科学的方法和技术，对涉及血缘关系的两个人之间的生物学关系进行鉴定的过程。常见的亲子鉴定方法有：DNA亲子鉴定、亲子鉴定、基因指纹亲子鉴定等。亲子鉴定的主要目的是确认孩子的生物学父母，以解决家庭纠纷、继承遗产等问题。1.安阳司法鉴定中心安阳亲子鉴定电话：195-4000-6126(微信同号，需要提前预约)安阳亲子鉴定地址：195-4000-6126河南省安
Selenium自动化测试实战指南：原理、工具与应用 Compass宁
本文还有配套的精品资源，点击获取简介：Selenium是一个用于Web应用程序自动化测试的开源工具，它通过提供API支持多种编程语言编写脚本，实现浏览器的自动化操作。本实例将详细介绍如何使用Selenium进行自动化测试，包括浏览器驱动的使用方法。学习Selenium可以提高软件测试效率，减少错误，并通过各种实例加深对自动化测试工具的理解。实例包括了如何安装、配置Selenium库和浏览器驱动，以
帧率、码流与分辨率：视频技术核心概念详解及关系分析关然
本文还有配套的精品资源，点击获取简介：在视频处理和流媒体领域，了解帧率、码流和分辨率对视频质量及存储需求至关重要。帧率决定了视频流畅度，分辨率影响清晰度和细节，而码流则关系到视频的压缩程度和质量。三者相互影响，需在实际应用中权衡。此外，DVR硬盘容量计算方法也与这些因素紧密相关。本篇内容将深入解析这些概念及其相互关系，并指导如何在不同需求下进行平衡和选择。1.帧率的定义及其对视频流畅度的影响在数字
浏览器标题闪烁功能 Krorainas 前端 javascript 前端 html5
浏览器窗体获得焦点则停止标题闪烁通知，失去焦点则开启标题闪烁通知功能描述窗体失焦的时候，标题就会闪补充说明：浏览器窗体获得焦点和失去焦点，Chrome和FireFox浏览器是window的onfocus,onblur方法；而IE浏览器则是document的onfocusin,onfocusout方法标签页标题闪烁浏览器窗体标题闪烁通知vartitleInit=document.title,isSh
用python自制简单小游戏----Pyinstaller库 AI 嗯啦 python pygame 开发语言
目录一、简单介绍Pyinstaller库主要特点基本使用方法打包流程说明注意事项二、实例演示1、井字棋2、猜单词3、猜数字三、找到自己打包的可执行文件现在你就会自己做小游戏了，快去和你的小伙伴分享吧在编程的世界里，没有什么比亲手打造一款属于自己的小游戏更能带来成就感了。当一行行代码在屏幕上跳动，最终幻化成可以操作的角色、有趣的关卡时，那种从0到1的创造喜悦，足以让每个开发者为之着迷。而Python
由几道数量关系考题引起的思考学习&实践爱好者数学广角随笔数学广角
由几道数量关系考题引起的思考考试题（如考公算题），解题时间不能太长，“限时性”倒逼我们在多种解法中选择最优路径，这种“在有限条件下追求效率最大化”的思维，是数学优化思想的生活化应用——数学从不只关注“能否解决问题”，更关注“如何高效解决问题”，这与工程优化、资源分配等现实场景中的核心需求高度契合。下面以几道数量关系题为例介绍，如何快速解答这类题？这些案例展示了在有限时间内选择高效解题方法的价值，体
黄厚江谈作文教学的基本定位水墨青花_7e78
今日阅读《用语文的方法教语文》第四部分——《把作文课上成作文课》之“作文教学的基本定位”：黄老师先引用了王荣生教授的调查发现——不少中学语文教师是没有作文教学的，指出“没有作文教学”，一是指没有正常的作文课，二是指没有明确清晰的作文教学思路，三是指对学生写作能力的提高没有有效的做法。（这三点每一条都切中时弊，正是我们身边的教学常态。）中学作文教学的基本定位要从不同角度来回答：1.从课程目标的角度看
Python读取.parquet文件 Henrietta's NOTES python pandas
提示：在MacOS和Jupyternotebook环境下的用法Device:MacOSPython:3.10.9Pandas:1.5.3Jupyternotebook问题描述直接用pandas中pd.read_parquet()即可，但是这个方法在和read_csv一样用之前需要先安装fastparquet活着pyarrow，方法如下：打开MacOS的终端，输入：pipinstallfastpar
多语言文本分类在AI应用中的实践 AI原生应用开发人工智能分类数据挖掘 ai
多语言文本分类在AI应用中的实践关键词：多语言文本分类、自然语言处理、机器学习、深度学习、BERT、迁移学习、跨语言模型摘要：本文深入探讨多语言文本分类在AI领域的应用实践。我们将从基础概念出发，逐步讲解其核心原理、技术架构和实现方法，并通过实际案例展示如何构建一个高效的多语言文本分类系统。文章将涵盖从传统机器学习方法到最先进的深度学习技术，特别关注跨语言迁移学习在实际业务场景中的应用。背景介绍目
自由写作（5分钟）摇曳生姿云
啃叶嘉莹老先生的《唐宋词十七讲》，进展比较慢，有时甚至会有翻上十几页都如春秋大梦般了无痕迹。这，也真是一种奇特的体验。刚好，手上又有黄梵老师的《意象的帝国》，于是，同时进行，发现还蛮好玩的。才读到《写作的真实过程》这节，黄老师在这一小节中提到：真实的写作过程，如同生命的进化过程，并没有“最终的形式”，每写一稿，都是作者暂时拼搏的结果……他几乎推翻了写作腹稿一说，提倡利用潜意识用自动写作的方法充分感
提升自我管理能力,你可以看这些书雪明明
阅读是最有效的提升自我管理能力的方法，今天小编就为大家带来6本非常值得推荐的自我管理书籍，加油哦！1、《自我管理必读12篇》这是一个充满机会的年代：只要你有足够的能力、抱负，不管出身为何，都能在自己选择的事业领域登上巅峰。不过，责任也总是伴随着机会而来。在职场中，你必须当自己的老板。你必须自行决定要在何处安身立命，知道何时该换职涯跑道，让自己努力投入工作，保持生产力。要做好这些事情，你必须深刻了解
抄书真的能赚钱吗？头条号抄书赚钱攻略，附带操作方法氧惠全网优惠
最近有很多人分享，有人在今日头条靠“抄书赚钱”的办法，而且一天一两百元，效果那是相当的不错，经过仔细研究才知道，原来是真抄书，把书中的精华内容，手抄下来。看到效果还不错，而且门槛相当的低，所以今天今天跟大家分享两个低门槛赚钱的方法，这个两个赚钱玩法也是比较适合零基础的宝妈、学生党、上班族利用闲暇的时间去做，一个月多赚小几千轻轻松松。一、淘宝客赚钱无需成本的淘客平台，高省APP就是最好的选择。不需要
MATLAB中绘制系统零极点图（Pole-Zero Map）的几种方法爱代码的小黄人 matlab 开发语言
以下是MATLAB中绘制系统零极点图（Pole-ZeroMap）的常见方法及各自适用场景总结，适用于你当前在分析符号表达式/系统传函后的使用需求：✅方法一：pzmap(tf(num,den))（最常用，推荐）用法：num_coeffs=sym2poly(num);den_coeffs=sym2poly(den);sys=tf(num_coeffs,den_coeffs);pzmap(sys);✅优
玩赚部落如何提高账号权重涨金币？揭秘看广告养机独家教程方法星火执行官
玩赚部落如何提高账号权重涨金币？揭秘看广告养机独家教程方法，步入2024年，若谈及备受瞩目的副业赚钱领域，广告副业项目无疑占据了显著位置。尽管市场上不乏山寨软件竞相模仿，但正版平台如玩赚部落，凭借其卓越的综合利润、稳定的运营环境以及适中的参与门槛，已然成为行业内的佼佼者。一、玩赚部落的正规入驻之路作为集广告收益与多元项目于一体的综合性平台，玩赚部落不仅提供了官方注册入口(文末即见)，还精心整合了旗
2023-04-07 爱学习的阿布
备考中医助理医师，时间规划和必备干货！备考中医助理医师这些干货内容你一定要知道，第一次考中医执业助理医师的可能对被考科目的重难点知识点还不是太了解，尤其是自学的同学可能会摸不着重点，今天我就来跟大家细说一下备考中医助理医师的那些干货内容我将分别从以下方面给大家介绍1.考试时间安排2.备考阶段技巧和方法3.备考中医助理医师重要知识点干货内容一.考试时间安排2月1-2月15进行网上报名2月20-3月5
react动态增加input框20180828 穆罕周 react
react动态增加input框20180828先在render里写好渲染的方法和点击的方法：二、点击的时候，先获取“记录新建或减少的描述字段的限制个数的数组”和“储存新增描述字段的input框的输入值数组”，若在限制个数之内，则同时给两者增加一个空元素渲染的时候，会根据限制个数的数组长度来return多少个input框，同时，显示的value值也是根据第几个i和储存值的数组的下标来匹配一一对应输入
103 觉知我们的补偿机制——走出绝望与恐惧健商君
我们可以怀抱爱意且不加批判地留意补偿行为何时出现，并感受行为背后的恐惧，来开始培养对补偿行为的觉知。当我们取悦讨好的时候，身体会有特定的感觉，我们可以试着去认出它。当我们退缩、战斗或控制的时候也是如此。从我自己的经验来看，认出这些补偿行为的最佳方法，就是对这些角色在身体上的感觉更为敏感。要松解我们的防御和补偿心态，需要一些承诺和慈悲。在有些情况下，事情不但没有变得容易反而变得更难，因为我们的防御变
MATLAB在工业缺陷检测中的应用
本文还有配套的精品资源，点击获取简介：缺陷检测、伤痕检测、瑕疵检测和划痕检测是工业自动化和质量控制中至关重要的环节，MATLAB作为一种高级编程环境，在图像处理和计算机视觉任务中扮演了重要角色。本文详细介绍了如何使用MATLAB实现这些检测过程，包括图像采集、预处理、特征提取和决策制定等步骤。通过介绍内置图像处理工具箱中的应用，色彩转换技术、边缘检测算法以及形态学操作等方法，我们阐述了如何识别和处
【电机驱动与运动控制】考试论述题宇宙爆肝锦标赛冠军笔记电机考试
文章目录0.要求1.传动机构和直流电机与机器人1.1问题描述1.2解决方案1.2.1调速系统的建立1.2.2对调速系统控制方式的改进1.2.3仿真分析1.3自己改进想法1.4参考文献2.交流/步进电机与机器人2.1问题描述2.2解决方案2.2.2缺点2.3自己改进想法2.4参考文献3.考试技巧与考试内容0.要求简短的问题描述解决方案以及必要的解释与论述（优缺点、可行性分析）该方法的不足以及自己的改
数据分析全攻略：从基础概念到实战应用的完整指南 SickeyLee 产品经理人工智能大数据信息可视化
数据分析全攻略：从基础概念到实战应用的完整指南数据分析已成为现代商业决策的核心驱动力，但很多人在面对数据时，常常陷入“不知道看什么、怎么分析、如何应用”的困境。本文将系统梳理数据分析的核心知识，从数据的本质到分析流程，从方法工具到实战指标，帮你搭建一套完整的数据分析思维框架，让数据真正为业务服务。一、数据是什么？不止于数字的“信息载体”提到数据，很多人会首先想到数字，但实际上数据的范畴远更广阔。数
爱奇艺i联盟：售会员卡赚钱代理方法大揭秘！浮沉导师
爱奇艺i联盟是什么？爱奇艺i联盟是爱奇艺官方打造的社交式会员销售平台。官方平台发货，无需个人压货，0成本，高回报，副业首选。自2018年成立以来，截止目前已有百万盟主加入，月收入可达10万+。如何加入爱奇艺i联盟？微信扫码免费加入在爱奇艺i联盟有两类赚钱方式，一种是自己售卡得佣金；另一种是邀请好友加盟，盟友售卡，自己得订单提成（白银及以上等级盟主才能获得盟友售卡返佣）。方式一：自己售卡得佣金进入爱
17.差异化教学法 didudi
“面对40-50人的大班级，我们的教学到底是要面向谁”本讲由这一问题入手做了详细的解答。本讲中陈老师提到了两个重要的教学方法：“精熟学习法”、“差异化教学法”，两种都指向同一处理方式-“差异化处理”。“精熟学习法”：老师在完成单元教学后，通过两次过程性评价，设置不同的任务，结合及时反馈系统，实现在课堂上对学生进行测试和评估。但是这种方式更应该迁移到“知识模块”的校正上，其根据学业成就对学生进行分类
解线性方程组 qiuwanchi
package gaodai.matrix; import java.util.ArrayList; import java.util.List; import java.util.Scanner; public class Test { public static void main(String[] args) { Scanner scanner = new Sc
在mysql内部存储代码 annan211 性能 mysql 存储过程触发器
在mysql内部存储代码在mysql内部存储代码，既有优点也有缺点，而且有人倡导有人反对。先看优点： 1 她在服务器内部执行，离数据最近，另外在服务器上执行还可以节省带宽和网络延迟。 2 这是一种代码重用。可以方便的统一业务规则，保证某些行为的一致性，所以也可以提供一定的安全性。 3 可以简化代码的维护和版本更新。 4 可以帮助提升安全，比如提供更细
Android使用Asynchronous Http Client完成登录保存cookie的问题 hotsunshine android
Asynchronous Http Client是android中非常好的异步请求工具除了异步之外还有很多封装比如json的处理，cookie的处理引用 Persistent Cookie Storage with PersistentCookieStore This library also includes a PersistentCookieStore whi
java面试题 Array_06 java 面试
java面试题第一，谈谈final, finally, finalize的区别。 final-修饰符（关键字）如果一个类被声明为final，意味着它不能再派生出新的子类，不能作为父类被继承。因此一个类不能既被声明为 abstract的，又被声明为final的。将变量或方法声明为final，可以保证它们在使用中不被改变。被声明为final的变量必须在声明时给定初值，而在以后的引用中只能
网站加速 oloz 网站加速
前序:本人菜鸟，此文研究总结来源于互联网上的资料，大牛请勿喷！本人虚心学习，多指教. 1、减小网页体积的大小，尽量采用div+css模式，尽量避免复杂的页面结构，能简约就简约。 2、采用Gzip对网页进行压缩； GZIP最早由Jean-loup Gailly和Mark Adler创建，用于UNⅨ系统的文件压缩。我们在Linux中经常会用到后缀为.gz
正确书写单例模式随意而生 java 设计模式单例
　　单例模式算是设计模式中最容易理解，也是最容易手写代码的模式了吧。但是其中的坑却不少，所以也常作为面试题来考。本文主要对几种单例写法的整理，并分析其优缺点。很多都是一些老生常谈的问题，但如果你不知道如何创建一个线程安全的单例，不知道什么是双检锁，那这篇文章可能会帮助到你。　　懒汉式，线程不安全　　当被问到要实现一个单例模式时，很多人的第一反应是写出如下的代码，包括教科书上也是这样
单例模式香水浓 java
懒汉调用getInstance方法时实例化 public class Singleton { private static Singleton instance; private Singleton() {} public static synchronized Singleton getInstance() { if(null == ins
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" AdyZhang apache http server
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" 每次到这一步都很小心防它的端口冲突问题，结果，特意留出来的80端口就是不能用，烦。解决方法确保几处： 1、停止IIS启动 2、把端口80改成其它（譬如90，800，，，什么数字都好） 3、防火墙(关掉试试) 在运行处输入 cmd 回车，转到apa
如何在android 文件选择器中选择多个图片或者视频？ aijuans android
我的android app有这样的需求，在进行照片和视频上传的时候，需要一次性的从照片/视频库选择多条进行上传但是android原生态的sdk中，只能一个一个的进行选择和上传。我想知道是否有其他的android上传库可以解决这个问题，提供一个多选的功能，可以使checkbox之类的，一次选择多个处理方法官方的图片选择器(但是不支持所有版本的androi，只支持API Level
mysql中查询生日提醒的日期相关的sql baalwolf mysql
SELECT sysid,user_name,birthday,listid,userhead_50,CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')),CURDATE(), dayofyear( CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')))-dayofyear(
MongoDB索引文件破坏后导致查询错误的问题 BigBird2012 mongodb
问题描述： MongoDB在非正常情况下关闭时，可能会导致索引文件破坏，造成数据在更新时没有反映到索引上。解决方案：使用脚本，重建MongoDB所有表的索引。 var names = db.getCollectionNames(); for( var i in names ){ var name = names[i]; print(name);
Javascript Promise bijian1013 JavaScript Promise
Parse JavaScript SDK现在提供了支持大多数异步方法的兼容jquery的Promises模式，那么这意味着什么呢，读完下文你就了解了。一.认识Promises “Promises”代表着在javascript程序里下一个伟大的范式，但是理解他们为什么如此伟大不是件简
[Zookeeper学习笔记九]Zookeeper源代码分析之Zookeeper构造过程 bit1129 zookeeper
Zookeeper重载了几个构造函数，其中构造者可以提供参数最多，可定制性最多的构造函数是 public ZooKeeper(String connectString, int sessionTimeout, Watcher watcher, long sessionId, byte[] sessionPasswd, boolea
【Java命令三】jstack bit1129 jstack
jstack是用于获得当前运行的Java程序所有的线程的运行情况(thread dump），不同于jmap用于获得memory dump [hadoop@hadoop sbin]$ jstack Usage: jstack [-l] <pid> (to connect to running process) jstack -F
jboss 5.1启停脚本　动静分离部署 ronin47
以前启动jboss，往各种xml配置文件，现只要运行一句脚本即可。start nohup sh /**/run.sh -c servicename -b ip -g clustername -u broatcast jboss.messaging.ServerPeerID=int -Djboss.service.binding.set=p
UI之如何打磨设计能力? brotherlamp UI ui教程 ui自学 ui资料 ui视频
在越来越拥挤的初创企业世界里，视觉设计的重要性往往可以与杀手级用户体验比肩。在许多情况下，尤其对于 Web 初创企业而言，这两者都是不可或缺的。前不久我们在《右脑革命：别学编程了，学艺术吧》中也曾发出过重视设计的呼吁。如何才能提高初创企业的设计能力呢?以下是 9 位创始人的体会。 1.找到自己的方式如果你是设计师，要想提高技能可以去设计博客和展示好设计的网站如D-lists或
三色旗算法 bylijinnan java 算法
import java.util.Arrays; /** 问题：假设有一条绳子，上面有红、白、蓝三种颜色的旗子，起初绳子上的旗子颜色并没有顺序，您希望将之分类，并排列为蓝、白、红的顺序，要如何移动次数才会最少，注意您只能在绳子上进行这个动作，而且一次只能调换两个旗子。网上的解法大多类似：在一条绳子上移动，在程式中也就意味只能使用一个阵列，而不使用其它的阵列来
警告:No configuration found for the specified action: \'s chiangfai configuration
1.index.jsp页面form标签未指定namespace属性。  <%@taglib prefix="s" uri="/struts-tags"%> ... <s:form action="submit" method="post"&g
redis -- hash_max_zipmap_entries设置过大有问题 chenchao051 redis hash
使用redis时为了使用hash追求更高的内存使用率，我们一般都用hash结构，并且有时候会把hash_max_zipmap_entries这个值设置的很大，很多资料也推荐设置到1000，默认设置为了512，但是这里有个坑 #define ZIPMAP_BIGLEN 254 #define ZIPMAP_END 255 /* Return th
select into outfile access deny问题 daizj mysql txt 导出数据到文件
本文转自：http://hatemysql.com/2010/06/29/select-into-outfile-access-deny%E9%97%AE%E9%A2%98/ 为应用建立了rnd的帐号，专门为他们查询线上数据库用的，当然，只有他们上了生产网络以后才能连上数据库，安全方面我们还是很注意的，呵呵。授权的语句如下： grant select on armory.* to rn
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
<?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('This example should only be run from a Web Brows
美国电影超短200句 dcj3sjt126com 电影
1. I see．我明白了。2. I quit! 我不干了!3. Let go! 放手!4. Me too．我也是。5. My god! 天哪!6. No way! 不行!7. Come on．来吧(赶快)8. Hold on．等一等。9. I agree。我同意。10. Not bad．还不错。11. Not yet．还没。12. See you．再见。13. Shut up!
Java访问远程服务 dyy_gusi httpclient webservice get post
随着webService的崛起，我们开始中会越来越多的使用到访问远程webService服务。当然对于不同的webService框架一般都有自己的client包供使用，但是如果使用webService框架自己的client包，那么必然需要在自己的代码中引入它的包，如果同时调运了多个不同框架的webService，那么就需要同时引入多个不同的clien
Maven的settings.xml配置 geeksun settings.xml
settings.xml是Maven的配置文件，下面解释一下其中的配置含义： settings.xml存在于两个地方： 1.安装的地方：$M2_HOME/conf/settings.xml 2.用户的目录：${user.home}/.m2/settings.xml 前者又被叫做全局配置，后者被称为用户配置。如果两者都存在，它们的内容将被合并，并且用户范围的settings.xml优先。
ubuntu的init与系统服务设置 hongtoushizi ubuntu
转载自： http://iysm.net/?p=178 init Init是位于/sbin/init的一个程序，它是在linux下，在系统启动过程中，初始化所有的设备驱动程序和数据结构等之后，由内核启动的一个用户级程序，并由此init程序进而完成系统的启动过程。 ubuntu与传统的linux略有不同，使用upstart完成系统的启动，但表面上仍维持init程序的形式。运行
跟我学Nginx+Lua开发目录贴 jinnianshilongnian nginx lua
使用Nginx+Lua开发近一年的时间，学习和实践了一些Nginx+Lua开发的架构，为了让更多人使用Nginx+Lua架构开发，利用春节期间总结了一份基本的学习教程，希望对大家有用。也欢迎谈探讨学习一些经验。目录第一章安装Nginx+Lua开发环境第二章 Nginx+Lua开发入门第三章 Redis/SSDB+Twemproxy安装与使用第四章 L
php位运算符注意事项 home198979 位运算 PHP &
$a = $b = $c = 0; $a & $b = 1; $b | $c = 1 问a,b,c最终为多少? 当看到这题时，我犯了一个低级错误，误以为位运算符会改变变量的值。所以得出结果是1 1 0 但是位运算符是不会改变变量的值的，例如： $a=1;$b=2; $a&$b; 这样a,b的值不会有任何改变
Linux shell数组建立和使用技巧 pda158 linux
1.数组定义　　[chengmo@centos5 ~]$ a=(1 2 3 4 5) 　　[chengmo@centos5 ~]$ echo $a 　　1 　　一对括号表示是数组，数组元素用“空格”符号分割开。　　 2.数组读取与赋值　　得到长度：　　[chengmo@centos5 ~]$ echo ${#a[@]} 　　5 　　用${#数组名[@或
hotspot源码(JDK7) ol_beta java HotSpot jvm
源码结构图，方便理解： ├─agent Serviceab
Oracle基本事务和ForAll执行批量DML练习 vipbooks oracle sql
基本事务的使用：从账户一的余额中转100到账户二的余额中去，如果账户二不存在或账户一中的余额不足100则整笔交易回滚 select * from account; -- 创建一张账户表 create table account( -- 账户ID id number(3) not null, -- 账户名称 nam

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他