hellohank

敏感词过滤算法实现

说到敏感词过滤，我也觉得这里没有必要写这个文章，因为前人已经前前后后有过很多种算法解决该问题。这里我之所以写这个文章，是因为我自己自创了一种算法（真的是自创哦，因为我在写这个算法的时候，完全是自己想出来的方式，没有借鉴任何代码！灵感来自于一篇文章中的一句话“如果能扫描一遍文本就能将所有的词找出来，那速度就是最快的”）。想法不周到或想得不周到，请大家砖头轻拍

背景

在网络日益发达的现在，也伴随着有益信息与造成不稳定因素的信息也随之日益泛滥，为了网民的思想健康，也为了社会的和谐，在许多对外公共场合下，有些内容是要经过审查才能显示的。在网络审查初期，都是通过人工审核，这种审核方式虽然准确且智能，但与网络文字产生的速度相比，其效率就显示微不足道了！因此，自动化的系统处理方式的需求越来越强烈……

目前拥有的处理方式

有需求就有市场，因此自动化处理的方式自然而然随之如雨后春笋般地迅速产生了一大批！其处理方式都是基于一点：敏感词库！然后基于该词库对目标文本进行敏感词提取操作，因此各自动化处理方式的唯一差别就在于敏感词提取算法的不同，因为算法不同，效率不同、结果也可能不同。而对于敏感词过滤算法来说，要掌握两个关键点：效率和准确率！效率就是对于大批量敏感词和长段的目标文本处理时要能在很短时间内响应；准确率就是对于一个敏感词要尽量区分语境，不能误将非敏感词判断为敏感词而过滤掉（如我们敏感词库的精确匹配与模糊匹配的定义）！
就我所知，目前较为流行且成熟的算法有：

简单文本搜索与替换

这种方式是最简单的，就是循环把每个敏感词在目标文本中从头到尾搜索一遍，如果有文本高亮或替换的话，那就找到一个就处理一个。这种方式的优缺点如下：

优点：

算法简单。对于开发人员来说，简单的算法会使代码实现上简单，开发难度最小！
缺点：
效率太低。因为循环每个敏感词，所以当敏感词很多、目标文本很长时，其效率可以说是该算法的致命问题！
匹配准备率太低。比如，有一个敏感词为as，那它边hash、class等中的as都会被匹配甚至被处理。
所以这个算法绝对不能使用！

传说中的DFA算法（亦称自动机算法）

上面的算法是以敏感词库为主体，对目标文本进行匹配，而这个算法是以目标文本为主体，其算法大概为：将所有敏感词构建为词图（即是将所有敏感词组织为一个图状关系，即，以任意一个字都可以查出以该字为开头的词），然后对文本进行逐一搜索并看每个字是否在图中存在，如果存在看是否有对应的词存在，如果存在，则匹配成功，记录下来，继续往下搜索直到搜索完整个文本！其详细的算法原理参见：http://wenku.baidu.com/view/2e9dad18a8114431b90dd896.html。

优点：

效率高于上面的算法；

缺点：

理论算法太过复杂，开发成本很大，而且网上没有该算法的源码或相应的包！而且该算法匹配率也比较低。再者就是该算法巨耗内存,而且启动很慢。

网友自创的TTMP算法（自称字符串多模式精确匹配）

其算法主要原理为：
1、首先扫描文章里面的每一个字符，只有当某一个字符是脏字表中任意一个脏词的第一个字符（称为“起始符”），我们才试图看看接下来是否是脏字（触发检索）。
2、但是我们也不是毫无头绪的就开始循环脏字表的每一个词条：
2.1、我们往后检索一个字符，先看一下这个字符是否是脏字表里面的任意一个字符，如果不是，就表明不可能是脏字表中的任何一个条目，就可以退出了。
2.2、如果是，我们就取从第一个被检出字符到目前扫描到的字符之间的字符串，求哈希值，看看能否从哈希表中检出一个脏词。
如果检出了，那就大功告成，否则继续检索后面一个字符（重复2.1、2.2），直至找不到，或者超出脏字表条目最大的长度。
2.3、如果都找不到，或者超长，那么接下来就回到刚才的那个“起始符”后一个字符继续扫描（重复1、2），直至整个文章结束。
详细的算法说明参考：http://www.cnblogs.com/sumtec/archive/2008/02/01/1061742.html。

其它可查算法

其它查到的算法还有：KMP算法是单模匹配算法，BM据说也是单模式的算法，WM算法是多模匹配……好吧，我承认，到最后的时候，我没有耐心再看下去了，因为这些算法都说自己很厉害，可是却都没有放出具体完整的可用的算法程序出来！开发难度还是存在的，这些方法都不是我的菜

我设想的一个算法——基于分词组件结合向量相似运算

在无尽的苦海探寻的过程中，我的大学数学知识不断滴从的我意识深处涌了出来！我突然想起一个可能可行的办法：因为网络上有许多性能很不错的分词工具（jar包形式的也大有存在），而且大学时有一种向量算法可以计算两个向量间的相似度的能力，于是就想到是否可以使用向量算法来解决该问题。该算法的主体思想为：将所有敏感词构建为一个向量，再将目标文本用分词工具分成若干个词并构建成另一个向量，然后将这两个向量进行相似值计算，得出哪些向量元素相同，并最终得知该目标文本中存在哪些敏感词！
呃……看来我还是对不起祖国对不起党！我已经不记得相应的向量算法了，而且也没有找到一个计算两个向量元素之间相同的算法（因为向量的高级算法太多、太复杂了）！看来从我意识深处涌出来的只是一些影子~
所以，这只是一个设想，而非真正实现方案！

敏感词过滤算法（自命名：聚合词树查询法）

该算法基于DFA并结合许多算法并进行相应的简化，最终其算法基本原理为：将所有敏感词库按模块聚合构建成一个词树（所谓聚合，就是将相同字开头的部分进行聚合，以减少对词的查询范围，相当于建立敏感词索引，如：他奶奶的、他妈的、他娘的，这三个词，聚合构建成词树时，“他”字就是这三个词的索引，同时每个词的结尾都有一个结束标志和该词的一些描述，如敏感级别等），然后从头到尾扫描一遍目标文本，当遇到以敏感词树中的索引的字时，查看后面的文本是否构成敏感词（如果这里有以这个敏感词开头的更长的敏感词时，以更长的为匹配结果，并判断该词在文本中前后是否有分隔符来区别其匹配方式），如果是则记录，一遍扫描完之后所有敏感词即被扫描出来了！

结语

我的这个算法不一定是最好的，但相比较上面几种算法，从成本、效果等整体上来说是很合适的！另外网上还有许多一些未公开算法的过滤方式，这些算法因为无法获知其算法，而无法为我所借鉴，因此平添几许遗憾！另外还有著名的算法有：KMP算法是单模匹配算法，BM据说也是单模式的算法，WM算法是多模匹配（WM算法详细描述：http://blog.chinaunix.net/space.php?uid=20435679&do=blog&cuid=228430）的等等。
该方法还有许多可优化的空间，如可增加多线程、可优化判断已记录的词直接跳过不匹配等方式。
算法的效率要注意尽量满足两点：尽量少的扫描目标文本（包括尽量少的回扫目标文本），尽快能从敏感词库中找到指定的词！不断做到这两点，则效率就越高！

效率上还有提升空间

目前只是单线程的一种操作，而且算法实现的代码上可能还有一些小小的改进余地，如变量定义与数据结构的定义等方面的实现。

匹配能力较弱

不能对处理的关键词匹配，比如，“鸦片”是一个敏感词的话，那如果用户刻意把它们分开，如写成“鸦$片”，那就无法匹配上了！

还可以运用于很多场景

运用的场景很多，如高亮指定的词、分词（可以指定以最长或最短模式匹配）、拼音与汉字间的转换等等字符串匹配功能！

注：附件中有两个文件，一个ppt，用于演示该算法的过程（用office2007打开效果最佳）；一个是源代码；请大家自己浏览，谢谢！

现在想来，这个名称更贴切的应该叫“关键词快速查找算法”！——2013-04-17注

你可能感兴趣的:(其它技术)

音视频编解码技术（二）：AAC 音频编码技术音视频开发老马音视频开发流媒体服务器 Android音视频开发视频编解码音视频网络协议实时音视频网络
一、AAC编码概述AAC是高级音频编码（AdvancedAudioCoding）的缩写，出现于1997年，最初是基于MPEG-2的音频编码技术，目的是取代MP3格式。2000年，MPEG-4标准出台，AAC重新集成了其它技术包括SBR或PS特性，目前AAC可以定义为⼀种由MPEG-4标准定义的有损音频压缩格式二、AAC编码规格简述AAC共有9种规格，以适应不同的场合的需要：MPEG-2AACLC低
膜拜大牛！灵魂一问-如何彻底防止APK反编译？成功定级腾讯T3-2 程序员东城程序员 android 移动开发面试
正文Android行业主要问题是初级Android太多了，会写xml和Activity的程序员太多了，初中级程序员面临很大的竞争，现状也就偏于高级开发者。越来越多的初中级Android程序员找不到满意的工作，甚至根本找不到工作！所以很多人觉得Android要凉了，甚至不惜转行，从头学其它技术。现在的Android招聘要求，已经不是多年之前的要求了。一、Android面试题Android面试题包括A
通过串口读取液位仪数据文叉叉
之前我们用测试工具模拟了串口通讯，并通过JAVA实现了串口数据接收和发送，今天来个实战，以某品牌的液位仪为实验设备，通过串口连接到上位机，用液位仪的通讯命令读取油罐的液位数据。液位仪是使用电子或其它技术用于检测液体表面，流量，流速的仪器，适用多种环境监测，如地下水监测，油站油罐中油位和水位监测等。如果你的电脑没有串口，请使用USB转串口来扩展，前面文章中有介绍。设备连接方式如下：液位仪连接图液位仪
信息隐藏研究新动向 Hard Coder 图像处理信息隐藏隐写术数字水印可逆数据隐藏图像灭菌对抗攻击模型保护
信息隐藏有三十年的研究历史，在隐写、数字水印、可逆数据隐藏等方面，国内外发展了一系列新技术与新方法。随着深度学习时代的来临，信息隐藏研究出现了新的变化。一方面，深度学习技术在信息隐藏的发展中发挥了重要作用；另一方面，信息隐藏也被运用到多种其它技术的研究中。
紫外线消毒器应用UV灯管技术优缺点对比紫外线消毒器紫外线消毒器紫外线消毒器
应用紫外线消毒器工艺与其他工艺相比有很大优势，其他工艺是无法相比的，因为这项工艺克服了传统的消毒中一系列缺点与问题，国外很多发达国家都在应用这项紫外线杀菌灯管，并的得到大量推广。紫外线消毒器主要优点如下所示：1.紫外线消毒技术杀菌效率高于其它技术，而且运行安全，对病毒有很高的灭活效率，在整个过程总不用使用任何化学药剂，减少二次污染。2.如果水中含有隐孢子虫和贾第虫这种杂质的话处理效果会更好。如果向
转：系统问题排查思路 aodizhi5710 数据库 php memcached
转：http://blog.51cto.com/sery/1676611#简单密码引起的血案作者：田逸（[email protected]）正在努力搬砖，一阵急促的电话铃想起，同事紧急告知，论坛访问很慢，其它技术人员已经折腾了半天找不到原因，需要尽快处理。首先简单了解了一些情况，运营的同事说前几天有管理员帐号被泄漏（咋泄漏的？设置简单密码，真像把后备箱那块砖拿过去拍他），被人用工具自动发帖，好家伙，一晚上发
前端面试每日 3+1 —— 第211天浪子神剑
今天的知识点(2019.11.13)——第211天(我也要出题)[html]如何防止他人窃取我的源代码或图片？[css]举例说明clear取值有哪些？[js]写个方法判断当前脚本运行在浏览器还是node环境中[软技能]除了前端以外还了解什么其它技术么？你自己最最厉害的技能是什么？《论语》，曾子曰：“吾日三省吾身”（我每天多次反省自己）。前端面试每日3+1题，以面试题来驱动学习，每天进步一点！让努力
计算机网络-ACL访问控制列表行則独善其身程序人生
上一篇介绍NAT时候就看到了ACL这个东西了，这个是什么意思？有什么作用呢？一、ACL访问控制列表访问控制列表(ACL,AccessControlList)是由一系列permit或deny语句组成的、有序规则的列表。ACL是一个匹配工具，能够对报文进行匹配和区分。简单来讲就是一个过滤列表，一般配合其它技术实现功能。ACL可以通过对网络中报文流的精确识别，与其他技术结合，达到控制网络访问行为、防止网
Kubernetes wmc995620 kubernetes 云原生
一、Kubernetes介绍Kubernetes1.1、应用部署方式演变在部署应用程序的方式上，主要经历了三个时代：●传统部署：互联网早期，会直接将应用程序部署在物理机上优点：简单，不需要其它技术的参与缺点：不能为应用程序定义资源使用边界，很难合理地分配计算资源，而且程序之间容易产生影响●虚拟化部署：可以在一台物理机上运行多个虚拟机，每个虚拟机都是独立的一个环境优点：程序环境不会相互产生影响，提
音视频编解码技术（二）：AAC 音频编码技术 weixin_30734435
一、AAC编码概述AAC是高级音频编码（AdvancedAudioCoding）的缩写，出现于1997年，最初是基于MPEG-2的音频编码技术，目的是取代MP3格式。2000年，MPEG-4标准出台，AAC重新集成了其它技术（PS,SBR），为区别于传统的MPEG-2AAC，故含有SBR或PS特性的AAC又称为MPEG-4AAC。AAC是新一代的音频有损压缩技术，它通过一些附加的编码技术（比如PS
webpack插件探索小飞牛牛
看了官网和一些其它技术文章，我觉得webpack插件主要搞清楚几个问题：1.他用来做为什么。2，什么时候做。3.怎么做。webpack做了什么监听编译中的事件，把功能嵌入到webpack的编译流程中功能包括很多，比如说，输出一些信息，修改文件，或者修改文件名等等。什么时候做借一张图说话。20200616220856437.pngwebpack编译流程的每一步都会触发事件，而plugin就是处理这些
数据安全保护之访问控制技术不夜De星空架构设计/设计模式
数据作为信息的重要载体，其安全问题在信息安全中占有非常重要的地位。为了能够安全可控地使用数据，需要多种技术手段作为保障，这些技术手段一般包括访问控制技术、加密技术、数据备份和恢复技术、系统还原技术等多种技术手段。本文侧重论述访问控制技术，有关其它技术的探讨将发表在后续文章中。本文由亿赛通科技发展有限公司投稿。数据作为信息的重要载体，其安全问题在信息安全中占有非常重要的地位。数据的保密性、可用性、可
主动循环技术-ACBT-培训笔记戴小苏
主动循环呼吸技术ACBT：一、概念：•主动循环呼吸技术（activecycleofbreathingtechniques，ACBT）是一组特定的呼吸训练，旨在去除支气管中多余的分泌物，并能改善肺功能而不加重低氧血症和气流阻塞。•ACBT是一种灵活的方案，任何患者，只要存在支气管分泌物过量的问题，都可以单独应用ACBT或辅以其它技术。二、分类①呼吸控制（BC）—放松•患者按自身的速度和深度进行潮式呼
Android学习之道 sweetying
前言Android学习渠道分享,国内外最值得花时间去学习的资源,很全面,成为Android资深工程师必备1.技术公众号一些经过检测，确属干货的技术（android为主）公众号(注：搜索公众号名称关注即可)鸿洋郭霖玉刚说HenCoder刘望舒ASCE1885code小生承香墨影安卓笔记侠伯特说CodeKK安卓杂货铺安卓进化论Android那些事吴小龙同学何俊林技术视界涉及其它技术的公众号（提升眼界的
TokenInsight：BTC链上基本面小幅回暖，全球期货持仓总量联动上升悟理趣道
据TokenInsight数据显示，反映区块链行业整体表现的TI指数北京时间02月02日8时报322.73点，较昨日同期上涨2.36点，涨幅为0.74%。此外，在TokenInsight密切关注的28个细分行业中，24小时内涨幅最高的为其它技术或协议行业，涨幅为6.58%；24小时内跌幅最高的为医疗应用行业，跌幅为20.61%。据监测显示，BTC全网活跃地址数较前日上升1.49%至56.68万，全
AAC音视频编码详解音视频开发老马 Android音视频开发音视频开发流媒体服务器 aac 音视频 ffmpeg 视频编解码实时音视频
一、AAC编码概述AAC是高级音频编码（AdvancedAudioCoding）的缩写，出现于1997年，最初是基于MPEG-2的音频编码技术，目的是取代MP3格式。2000年，MPEG-4标准出台，AAC重新集成了其它技术（PS,SBR），为区别于传统的MPEG-2AAC，故含有SBR或PS特性的AAC又称为MPEG-4AAC。AAC是新一代的音频有损压缩技术，它通过一些附加的编码技术（比如PS
购买国货—之八文山会友梦之蓝
为什么买华为？华为拥有手机技术，还有5G技术，这是通讯方面的基础技术。其它技术需要建立在5G技术之上，就是说5G是我们最牛。问题来了，你厉害了，侵害了美国的利益，因为它不能薅别的国家羊毛了，那么就不能躺着也挣钱了，所以美国举全国力量打击华为！因为华为动了美国的奶酪，那么美国动了别人的奶酪，别人就任人宰割么？假设华为失败了，我们还是买手机，但是外国品牌就会进入中国，那么我们就给外国打工，还有就是华为
kubernetes（k8s）介绍悲伤冰红茶 kubernetes 容器云原生
记录自己的学习历程应用部署方式演变在部署应用程序的方式上，主要经历了三个时代：传统部署：互联网早期，会直接将应用程序部署在物理机上优点：简单，不需要其它技术的参与缺点：不能为应用程序定义资源使用边界，很难合理地分配计算资源，而且程序之间容易产生影响虚拟化部署：可以在一台物理机上运行多个虚拟机，每个虚拟机都是独立的一个环境优点：程序环境不会相互产生影响，提供了一定程度的安全性缺点：增加了操作系统，浪
Kubernetes介绍 Cxttq~ kubernetes 容器云原生
Kubernetes介绍1.应用部署方式演变在部署应用程序的方式上，主要经历了三个时代：传统部署：互联网早期，会直接将应用程序部署在物理机上优点：简单，不需要其它技术的参与缺点：不能为应用程序定义资源使用边界，很难合理地分配计算资源，而且程序之间容易产生影响虚拟化部署：可以在一台物理机上运行多个虚拟机，每个虚拟机都是独立的一个环境优点：程序环境不会相互产生影响，提供了一定程度的安全性缺点：增加了操
k8s的安装部署，详细过程展示（保姆级安装教程） aa一叶知秋aa k8s kubernetes 容器云原生运维
k8s应用部署方式演变在部署应用程序的方式上，主要经历了三个时代：传统部署：互联网早期，会直接将应用程序部署在物理机上优点：简单，不需要其它技术的参与缺点：不能为应用程序定义资源使用边界，很难合理地分配计算资源，而且程序之间容易产生影响虚拟化部署：可以在一台物理机上运行多个虚拟机，每个虚拟机都是独立的一个环境优点：程序环境不会相互产生影响，提供了一定程度的安全性缺点：增加了操作系统，浪费了部分资源
容器集群k8s从入门到精通之kubernates介绍（第一章）背着行囊去远方学习笔记 kubernetes docker k8s
第一章kubernetes介绍本章节主要介绍应用程序在服务器上部署方式演变以及kubernetes的概念、组件和工作原理。应用部署方式演变在部署应用程序的方式上，主要经历了三个时代：传统部署：互联网早期，会直接将应用程序部署在物理机上优点：简单，不需要其它技术的参与缺点：不能为应用程序定义资源使用边界，很难合理地分配计算资源，而且程序之间容易产生影响虚拟化部署：可以在一台物理机上运行多个虚拟机，每
一篇文章理解Promise原理 Mr.怪兽 ui 前端 javascript es6
前提掌握知识：微任务包括：MutationObserver、Promise.then()或reject()、Promise为基础开发的其它技术，比如fetchAPI、V8的垃圾回收过程、Node独有的process.nextTick。宏任务包括：script、setTimeout、setInterval、setImmediate、I/O、UIrendering。javascript中事件循环(ev
Kubernetes (K8S)基本概念不减到100斤不吃锅包肉 kubernetes 容器云原生
就是将应用部署在Kubernetes集群中，方便管理。k8s为什么出现在部署应用程序的方式上，主要经历了三个时代：传统部署：互联网早期，会直接将应用程序部署在物理机上优点：简单，不需要其它技术的参与缺点：不能为应用程序定义资源使用边界，很难合理地分配计算资源，而且程序之间容易产生影响虚拟化部署：可以在一台物理机上运行多个虚拟机，每个虚拟机都是独立的一个环境优点：程序环境不会相互产生影响，提供了一定
Java高级面试总结 microsoft_love 技术 Java高级 Java面试
亮点1、公司系统架构2、业务架构说明3、个人其它技术对方公司了解1、规划阶段行业选定公司背景2、执行阶段跳槽准备用户包括四个，具体应对策略如下：技术经理：技术架构师：谈技术架构，谈业务架构。cto/ceo：谈业务，谈项目管理。人事：职业规划、绩效考核、五险一金（基数）、福利待遇，年终奖。3、心态要好string为什么是final的？字符串是恒定的，创建之后它们的值不能被改变1.线程安全2.支持字符
概率论入门之《统计机器学习导论》阅读笔记（第一，二章）生而为弟
第一章统计机器学习第一章主要介绍了机器学习的分类：监督学习，非监督学习，强化学习。然后介绍了监督学习的三大主要任务：回归，分类，排序，以及非监督学习的聚类。最后稍稍介绍了一下机器学习中的其它技术：集成学习，张量学习，在线学习，迁移学习，度量学习。当然这些与概率论关系不大，因此笔者在此略过。下面着重记录第二章的阅读笔记。第二章随机变量与概率分布2.1数学基础imageimageimageimage以
web前端开发和后端开发哪个好？成长中的小码农前端 javascript web开发 node.js
这几年互联网行业发展很快，很多人都想在这个行业中寻找到自己合适的岗位，特别是近几年手机普遍的情况下，与此同时，程序员这个职业走进了我们视野，那前端开发和后端开发哪个发展前景更好？对于想要学习计算机的初学者而言，首先要明白计算机行业和其它技术行业的职业要求没什么不同，一样的标准、一样的要求、一样的艰辛。学习没有捷径，专业没有好坏。学习任何一门技术都不是一蹴而就的事情，都需要循序渐进、由浅入深，都需要
【k8s】核心概念篇 Al6n Lee #Kubernets kubernetes 容器云原生人工智能大数据
文章目录应用部署方式演变容器编排问题k8s简介k8s组件master节点node节点附加组件组件之间调用流架构图核心概念服务的分类(无状态&有状态)专业术语应用部署方式演变在部署应用程序的方式上，主要经历了三个时代：传统部署->虚拟化部署->容器化部署传统部署：互联网早期，会直接将应用程序部署在物理机上优点：简单，不需要其它技术的参与缺点：不能为应用程序定义资源使用边界，很难合理地分配计算资源，而
安卓原生开发！Android面试题集2021版，附答案赵是水瓶座程序员 Android
正文Android行业主要问题是初级Android太多了，会写xml和Activity的程序员太多了，初中级程序员面临很大的竞争，现状也就偏于高级开发者。越来越多的初中级Android程序员找不到满意的工作，甚至根本找不到工作！所以很多人觉得Android要凉了，甚至不惜转行，从头学其它技术。现在的Android招聘要求，已经不是多年之前的要求了。为什么感觉不好找工作这个也是很多人的疑问，说投了很
UWB学习——day4 CoderXshuai UWB 学习
UWB学习——day4技术劣势技术细节UWB频段系统调制方式UWB帧结构芯片实例技术劣势干扰其它技术，UWB技术目前允许在未授权的3.1GHz至10.6GHz频谱上运行，但该频谱上有许多其它无线通讯所在的频带，容易互相产生干扰，反而限制了适用范围。时钟同步要求高，测距和定位需要高精度的时钟同步频谱利用率低，虽然拥有巨大的带宽，但实际上可能会浪费大部分带宽，因为UWB信号通常只占用一小部分频谱。这可
相信技术的力量 - RSAC 2020 (2) 安全乐观主义
生活总要继续，明天依旧会出现全新的病毒挑战，反思与改进才能令我们不断前行。此次国内研究机构两周内完成病毒分离和基因测序令全球刮目相看，在抗疫中发挥的作用举世皆知。也应该鼓励论文不受限制地大量去发，就像安全企业要坚定走出国门一样。让我们再来看看其它技术应用。荧光定量聚合酶链式反应PCR是核酸检测背后的关键技术，从1971年核酸体外扩增设想提出，1985年第一篇PCR论文发表，1996年第一台商业设备
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * <p>方法描述:sql语句查询返回List<Class> </p> * <p>方法备注: Class 只能是自定义类 </p> * @param calzz * @param sql * @return * <p>创建人：王川</p> * <p>创建时间：Jul

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他