panjf2000

搜索引擎之未登录词(Out Of Vocabulary)识别问题

有人问道：南京市长叫江大桥？

你怎么知道的？

因为看到一个标语——南京市长江大桥欢迎您。

未登录词识别问题也叫做：命名实体识别(Named Entity Recognition)

常见的未登录词包括：

人名：张三、陈方安生
地名：安湖路、龙腾苑四区
机构名：泰康人寿、欧姆龙公司
译名：安德森

组块识别(Chunking)

切分和标注多个词的单元

每个大的单元叫做组块(chunk)

用模式识别未登录词

例如“高东镇高东二路”，需要把“高东二路”这样不在词典中的路名识别出来。可以先把输入串抽象成待识别的标注序列，然后根据词类识别。例如：

利用模式来识别未登录街道名，识别规则可以表示成如下的形式：

镇后缀未登录街道 =>镇后缀 UNKNOW 号码街后缀

识别规则(Product)

lhs = new ArrayList<AddressSpan>(); //左边的模式
rhs = new ArrayList<AddressType>(); //右边的模式
//镇后缀  UNKNOW  号码  街后缀
rhs.add(AddressType.SuffixTown);
rhs.add(AddressType.Unknow);
rhs.add(AddressType.No);
rhs.add(AddressType.SuffixStreet);
//镇后缀 未登录街道
lhs.add(new AddressSpan(1,AddressType.SuffixTown));//归约长度是1
//把“UNKNOW  号码  街后缀”3个符号替换成“未登录街道”，因此归约长度是3
lhs.add(new AddressSpan(3,AddressType.Street));
//把规则加到文法库
addProduct(rhs, lhs);

模式文法(Pattern Grammar)

文法(Grammar)是规则的集合，规则的形式：

leftPattern => rightPattern

模式(Pattern)

描述单词的行为
用类型序列来描述模式：SuffixTown Street
词汇化(lexical)的模式：V for n: 动词后接‘for’然后接一个名词

模式文法识别未登录词

定义特征的类别：例如未登录词的上文，下文等。
根据特征词库对输入串做全切分：可以采用AdjList存储切分结果。
匹配规则来识别未登录词：可以把右边的模式组织成Trie树，左边的模式作为节点属性。全切分词图匹配上右边的模式后用左边的模式替换。

循环替换导致死锁

规则替换可能会进入死循环，因为可能出现重复应用规则的情况

A ->B ->A

通过检查每条规则来解决死锁问题

每个模式赋一个权重，用模式中的类型序列的权重和来衡量模式权重例如：

SuffixTown + Unknow + No +SuffixStreet = 6 + 8+ 5 + 7 = 26
SuffixTown + Street = 6 + 4 = 10

规则的左边的模式权重必须小于右边模式权重
应用这样的规则后整个文本的模式权重越来越小

从词图中匹配识别规则

根据基本词典生成的全切分词图

根据人名特征词图生成的人名全切分词图

根据译名特征词图生成的译名全切分词图

根据地名特征词图生成的地名全切分词图

根据机构名特征词图生成的机构名全切分词图

识别人名

人名特征：

单姓：赵钱孙李
复姓：诸葛欧阳
单名：刚强进选达
双名首字：建建治
双名尾字：军红国
日本姓：小泽松下
日本名：田一郎森三郎
译名用字：汤姆森杰克妮
上文：邀请约
下文：同学老师
连接：和

根据音调判断是否人名

中文起名会考虑到语音的因素。例如：

Yang2 yang2

杨阳

都是第二声。简称：22

可以统计中文人名的声调组合：

11=394

111=252

112=393

113=101

114=178

12=396

121=344

122=344

123=82

识别地名

地名相关的特征类型：

public enum AddressType {
Country //国家
,Municipality //直辖市
,SuffixMunicipality //特别行政区后缀
,Province //省
,City //市
,County //区
,Town //镇
,Street //街
,StreetNo //街门牌号
,No //编号
,Symbol //字母符号
,LandMark //地标建筑 例如 ** 大厦  门牌设施
,RelatedPos //相对位置
,Crossing //交叉路
,Village //村
,BuildingNo //楼号
,BuildingUnit //楼单元
,SuffixBuildingUnit //楼单元后缀
,SuffixBuildingNo //楼号后缀
,StartSuffix//(
,EndSuffix//)
,Unknow
…
}

识别译名

译名举例

费德勒辛德勒柴可夫斯基卡钦斯基

统计译名用字，然后根据65万译名统计字之间的转移概率，例如”汤姆”、“珍妮”

P(C1C2…Cn)=P(C1) P(C2|C1)…P(Cn|C1C2…Cn-1)

≈P(C1) P(C2|C1)…P(Cn|Cn-1)

识别机构名

未登录词概率估计

‍P(某个未登录词的概率)=

P(这类未登录词的概率)*P(这类未登录词中某个词的概率)

在人名代词附近有更高的人名概率‍

杨士春表示，考虑到两人的特殊身份，谭维维和王铮亮并不担任日常的教学工作，他们的工作主要包括：...。

新词发现

有研究显示，60％的分词错误是由新词导致的。

旧词新意：通过各种途径产生的、具有基本词汇所没有的新形式、新意义或新用法的词语。
全新词语：自某一时间点以来所首次出现的具有新词形的词汇。如果在一篇文档中“水”和“立方”结合紧密，则有“水立方”可能是一个新词。

因此对分词后的词序列建立二元统计模型。结合紧密的二元连接可能是新词。

基于统计的新词发现

‍判断二元连接词结合紧密程度的公式：

‍

如果词ｘ和ｙ的出现相互独立，则P(ｘ,ｙ)的值和ｐ(ｘ)ｐ(ｙ)的值相等，Ｉ(ｘ,ｙ)为0。如果ｘ和ｙ密切相关，P (ｘ,ｙ)将比P (ｘ) P (ｙ)大很多，Ｉ(ｘ,ｙ)值也就远大于0。如果ｘ和ｙ的几乎不会相邻出现，而它们各自出现的概率又比较大，那么Ｉ(ｘ,ｙ)将取负值，这时候ｘ和ｙ负相关。设f(C)是词C出现的次数，N是一个文档的总词数，则：

因此，两个词的信息熵：

新词发现实现

定义二元连接串：

public class Bigram {
  String one;//上一个词
  String two;//下一个词
  private int hashvalue = 0;
  
   Bigram(String first, String second) {
   this.one = first;
   this.two = second;
   this.hashvalue = (one.hashCode() ^ two.hashCode());
   }
}

int index = 0;
fullResults = new BigramsCounts[table.size()];
Bigrams key;
int freq;//频率
double logn = Math.log((double)n)/Math.log(2.0); //文档的总词数取对数
double temp;
double entropy;//信息熵
int bigramCount; //f(c1,c2)
for( Entry<Bigrams,int[]> e : table.entrySet()){//计算每个二元连接串的信息熵
  key = e.getKey();
  freq1 = oneFreq.get(key.one).freq;
  freq2 = oneFreq.get(key.two).freq;
  temp = Math.log((double)freq1)/Math.log(2.0) + Math.log((double)freq2)/Math.log(2.0);
  bigramCount = (e.getValue())[0];
  entropy = logn+Math.log((double)bigramCount)/Math.log(2.0) - temp;//信息熵
  fullResults[index++] = 
  new BigramsCounts(
  bigramCount,
  entropy,
  key.one,
  key.two);
}

基于规则的方法：

具有普遍意义的构词规则，例如“模仿秀”由“动词+名词”组成。

去除规则，符合去除规则的二元连接不算作新词：

例如“数词+量词”的组合。

你可能感兴趣的:(搜索引擎,out,of,vocabulary,未登录词,识别问题)

python怎么将图片上的文字识别提取出来? bug菌¹ 全栈Bug调优(实战版)python 计算机视觉机器学习
本文收录于《全栈Bug调优(实战版)》专栏，致力于分享我在项目实战过程中遇到的各类Bug及其原因，并提供切实有效的解决方案。无论你是初学者还是经验丰富的开发者，本文将为你指引出一条更高效的Bug修复之路，助你早日登顶，迈向财富自由的梦想！同时，欢迎大家关注、收藏、订阅本专栏，更多精彩内容正在持续更新中。让我们一起进步，Up！Up！Up！备注：部分问题/难题源自互联网，经过精心筛选和整理，结合数
cron表达式每天0点10分和30分_查找特定时间段cron任务方法媛源啊 cron表达式每天0点10分和30分
查找特定时间段cron任务方法今天有个同学问：“如何查找特定时间段的cron调度任务？”，这类问题通常是维护中经常遇到的，例如：生产系统升级时，比如0点生产业务处理任务停止，到了5点0分恢复生产业务处理程序运行，那么在0点到5点前的调度任务就要人工运行了。如果生产的cron调度任务有10个，一眼就能看完，如果有100个调度任务呢？这就要靠脚本来提取了。先来说下cron配置规则：#┌────────
diy nas配置推荐2020_从入门到高端！2020年11月组装电脑主机配置推荐+装机行情陈马登Morden diy nas配置推荐2020
目前显卡市场依然一卡难求的行情，直到11月份都没有得到缓解，反而显得越来越紧缺，从千元级到高端显卡全面紧张，包括英伟达新一代RTX30系列稀缺，从发布RTX3080开始，基本没有几个人原价到手，到手的价格基本都是溢价比较高的，现阶段一块显卡溢价达到大概近两千元，不过旗舰级RTX3090很快打破了这个局面，货源与价格几乎回归正常，这可能是因为价格真的贵需求量小的问题，但实际也没比RTX3090性能高
用自定义注解解决excel动态表头导出的问题 Java知识技术分享 java技术 excel java intellij-idea 数据库
导入的excel有固定表头+动态表头如何解决自定义注解：importjava.lang.annotation.*;/***自定义注解，用于动态生成excel表头*/@Target(ElementType.FIELD)@Retention(RetentionPolicy.RUNTIME)public@interfaceFieldLabel{//字段中文Stringlabel();//字段顺序into
【Python】车牌自动识别幽兰的天空 Python python opencv
实现车牌自动识别（LicensePlateRecognition,LPR）是计算机视觉和深度学习领域中的一个常见任务。用Python和OpenCV，结合其他深度学习库，可以建立一个简单的车牌识别系统。以下是一个基于这两者的基本实现思路和示例代码。实现步骤环境准备：安装必要的库：bashpipinstallopencv-pythonopencv-python-headlessnumpypillowp
selenium如何识别条形验证码，自动输入验证码老叶爱吃鱼（软件） UI自动化测试 python 开发语言
在自动化测试或网页爬取中，识别验证码是常见的难点。Selenium本身不具备直接识别验证码的能力，但可以通过结合第三方工具、OCR技术或人工介入等方式解决。以下是多种可行方案的详细实现思路及代码示例：一、方案一：使用第三方验证码识别服务（最推荐）原理通过API将验证码图片发送给专业识别平台，平台返回识别结果，适用于复杂验证码（如扭曲文字、点选式等）。常用平台打码平台：超级鹰、云打码、快识别等（需注
Python脚本，音频格式转换和视频格式转换
一、音频格式转换完整代码frompydubimportAudioSegmentimportosdefconvert_audio(input_dir,output_dir,target_format):ifnotos.path.exists(output_dir):os.makedirs(output_dir)forfilenameinos.listdir(input_dir):iffilename
文献阅读篇#8：YOLO如何实现多模态 hjs_deeplearning YOLO 人工智能深度学习目标检测多模态模态融合
一、引言YOLO众所周知是一个目标检测、跟踪、计数等等的视觉模型，对于YOLO来说，它的核心功能还是分类，识别出物体的类别并辅助以计数、跟踪等等功能。但是，光使用一个YOLO模型进行目标检测只能提取一张图片的特征，或者只能通过一条路去提取特征，最终输出结果。而前面提到的多模态，则会引入另一个维度的特征。例如二区Top期刊《Underwateracousticintelligentspectrums
轻松搞定！VSCode配置C/C++开发环境指南（Windows版） HappyAcmen 算法合集 vscode c语言 c++
本文面向新手开发者，只需简单五步，即可在Windows系统上搭建完整的C/C++开发环境！这里写目录标题第一步：安装必备工具⚙第二步：配置环境变量第三步：安装VSCode扩展第四步：创建项目并配置⚡第五步：配置核心文件（关键！）第六步：运行与调试常见问题解决高效技巧第一步：安装必备工具安装VSCode官网下载→一键安装（建议勾选"添加到PATH"）安装MinGW（GCC编译器）推荐下载：MinGW
黑客 vs. 网安：谁才是数字世界的主宰？ 2024年信息安全人员应该重点学什么？网安导师小李程序员编程网络安全 linux 运维服务器 excel web安全 python java
在当今数字化飞速发展的时代，信息安全问题日益严峻。黑客攻击、数据泄露、网络病毒等威胁不断涌现，企业和个人的隐私安全岌岌可危。随着人工智能、物联网、云计算、区块链等新技术的兴起，信息安全行业正面临着新的挑战和机遇。2024年信息安全行业面临的挑战和机遇**1.人工智能（AI）：**AI技术的广泛应用使得攻击者能够利用机器学习和自动化技术进行更具针对性的攻击。例如，恶意软件可以通过AI算法不断自我进化
软件工程领域测试用例设计的高效流程软件工程实践软件工程最佳实践 AI软件构建大数据系统架构软件工程测试用例 ai
软件工程领域测试用例设计的高效流程关键词：软件工程、测试用例设计、高效流程、测试覆盖、缺陷发现摘要：本文聚焦于软件工程领域中测试用例设计的高效流程。详细介绍了测试用例设计的背景知识，包括目的、预期读者等。通过生动形象的比喻解释核心概念，如测试用例像给软件做的“体检项目单”。阐述了核心概念间的关系，并给出了原理和架构的示意图及流程图。深入讲解了核心算法原理、数学模型，结合Python代码进行示例。通
基于MATLAB的图片中文字的提取及识别
随着计算机科学的飞速发展，以图像为主的多媒体信息迅速成为重要的信息传递媒介，在图像中，文字信息(如新闻标题等字幕)包含了丰富的高层语义信息，提取出这些文字，对于图像高层语义的理解、索引和检索非常有帮助。图像文字提取又分为动态图像文字提取和静态图像文字提取两种，其中，静态图像文字提取是动态图像文字提取的基础，其应用范围更为广泛，对它的研究具有基础性，所以本文主要讨论静态图像的文字提取技术。静态图像中
Python和OpenCV实现车牌识别的毕业设计案例媛源啊
本文还有配套的精品资源，点击获取简介：本项目通过Python和OpenCV库，实现了一个实用的车牌识别系统，包含图像捕获、预处理、车牌定位、车牌分割和字符识别等步骤。系统提供了一键运行的完整代码，使学生能够快速掌握计算机视觉和深度学习应用。遇到的挑战和解决方案也进行了讨论，比如光照变化、车牌角度不一致和污损的处理，以及数据增强技术和模型参数优化。1.车牌识别系统的基本理论和应用1.1车牌识别的背景
常用指令合集（DOS/Linux/git/Maven等）
文章目录常用指令收集vmware虚拟机联网设置ubuntu常见问题设置apt相关指令：gcc编译相关指令sqlite3VSCode快捷键：收索引擎技巧（google）Intelideashell--LinxvimgitDOS:mavendockerkubectl指令nginx配置redis-clientMySQLlinux下java进程排错MongoDBCentOSJDK安装配置UbuntuJDK
PyTorch实战：从零开始构建CIFAR-10图像分类模型 (附详细代码与图解) 电脑能手 pytorch 分类人工智能深度学习 python
PyTorch实战：从零开始构建CIFAR-10图像分类模型(附详细代码与图解)大家好！今天，我们将一起踏上一段激动人心的深度学习之旅：使用强大的PyTorch框架，从零开始构建一个卷积神经网络（CNN），来解决经典的CIFAR-10图像分类问题。无论你是深度学习的新手，还是希望巩固PyTorch基础知识的开发者，本文都将为你提供一个清晰、详尽的实战指南。本文目标读完本文，你将学会：加载和预处理C
GNhao，英国手机号如何购买注册全攻略详解
GNhao，英国手机号如何购买注册全攻略详解GNhao，英国手机号如何购买注册成为许多人关注的热点问题。无论是出国留学、工作还是旅游，拥有一个英国手机号非常重要。GN号将详细介绍GNhao，英国手机号如何购买注册的方法。购买注册的基础知识GNhao，英国手机号如何购买注册主要通过三大运营商完成，分别是EE、Vodafone和O2。选择合适的运营商，有助于后续GNhao，英国手机号如何购买注册流程的
【Linux】环境基础开发工具使用——gcc/g++使用风铃子加油 Linux linux 算法运维开发语言 xshell
Linux编译器-gcc/g++使用1.背景知识1.预处理（进行宏替换)2.编译（生成汇编)3.汇编（生成机器可识别代码）4.连接（生成可执行文件或库文件)2.gcc如何完成格式gcc[选项]要编译的文件[选项][目标文件]预处理(进行宏替换)预处理功能主要包括宏定义,文件包含,条件编译,去注释等。预处理指令是以#号开头的代码行。实例:gcc–Ehello.c–ohello.i选项“-E”,该选项
maven wrapper的下载和使用 agente 项目开发 maven java intellij idea
mavenwrapper的下载和使用目的安装mavenwrappermavenwrapper下载文件分析配置mavenwrappermavenwrapper的使用目的用户可以不安装maven也可以启动项目，并且可以避免协同开发过程中maven版本不一致而引发的问题。安装mavenwrapper打开Termianl，cd到项目的根目录下，执行以下命令：mvn-Nio.takari:maven:wra
kali Linux root密码修改 luozhonghua2000 渗透测试 linux 运维服务器 kali
kaliroot密码修改有时候是经常发生的，要么忘记，要么是必须限时要改的，今天记录下，修改方法，以便后续。KaliLinux的前身是BackTrackLinux发行版。KaliLinux是一个基于Debian的Linux发行版，它被认为是最好的渗透测试的Linux发行版之一，而且名副其实。作为一名从事渗透测试的人员，不懂KaliLinux的话，就out了。它他预装了数百种享誉盛名的渗透工具，使你
C++奇迹之旅：C++的单例模式阿森要自信【C++的奇迹之旅】单例模式 c++开发语言 linux 服务器
文章目录一、单例模式的核心原则二、基础实现（懒汉式，线程不安全）问题：三、线程安全的懒汉式（双重检查锁定）特点：四、饿汉式（线程安全）特点：五、C++11后的现代实现（Meyers'Singleton）优势：六、单例模式的销毁问题注意：七、单例模式的优缺点八、适用场景九、完整示例（现代实现）输出：完整代码实现输出结果关键点说明改进建议总结在C++中，单例模式（SingletonPattern）是一
Linux编译器————gcc/g++的使用情深不寿1208 linux 服务器
一、基本使用1.C语言编译vimmycode.c#编辑C代码gccmycode.c#编译生成a.out./a.out#运行可执行文件2.C++语言编译vimmycode.cpp#编辑C++代码g++mycode.cpp#编译生成a.out./a.out#运行可执行文件常用选项：-o：自定义输出文件名gccmycode.c-omyprogram#生成名为myprogram的可执行文件二、程序编译的四
AI人工智能代理工作流AI Agent WorkFlow：高并发场景下AI代理的性能调优 AI大模型应用之禅人工智能数学基础计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AI人工智能代理工作流AIAgentWorkFlow：高并发场景下AI代理的性能调优关键词：AI代理，工作流，性能调优，高并发，分布式系统，资源管理，负载均衡1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，AI代理（AIAgents）在各个领域的应用越来越广泛。AI代理作为自动化、智能化的执行实体，能够模拟人类智能行为，完成复杂的任务。在高并发场景下，例如在线服务、金融服务、智能城市等，A
计算机科学导论（10）什么是BIOS 奇妙之二进制 #计算机科学与操作系统 ubuntu 计算机基础
文章目录**一、BIOS的核心功能****二、BIOS的历史与技术局限****三、BIOS与UEFI的对比****四、现代BIOS的现状****总结**BIOS（BasicInput/OutputSystem，基本输入/输出系统）固化在计算机内主板上一个ROM芯片上的程序，是计算机启动时运行的底层固件程序（和硬件相关的程序习惯称为固件），是连接硬件与操作系统的桥梁，主要负责初始化硬件、加载操作系统
Linux系统基础网络配置老鸟精华篇【转】
文章出处：Linux系统基础网络配置老鸟精华篇对于linux高手看似简单的网络配置问题，也许要说出所以然来也并不轻松，因此仍然有太多的初学者徘徊在门外就不奇怪了，这里，老男孩老师花了一些时间总结了这个文档小结，也还不够完善，欢迎大家补充，交流。谢谢大家！20120827补充：http://oldboy.blog.51cto.com/2561410/974194深入浅出route命令小结目录：1）配
【C++】机试刷题总结day11——二、枚举和模拟（下）map非线性数据结构钰汐◇ 机试刷题总结 c++开发语言
机试课一、枚举和模拟（下）模拟问题——非线性数据结构mapmap词典本质是集合，内容是键值对分类构建：增：删：查：1、遍历2、查找改：例题1、手机键盘※※（完全没思考）思路：关键点：用map把关键信息组织起来易错点：代码：模拟解题关键：判断用什么数据结构存储信息一、枚举和模拟（下）模拟问题——非线性数据结构mapmap词典对比vector、set学习可以通过下标访问元素，下标可以是任意类型，元素也
Lock wait timeout exceeded； try restarting transaction mysql报错
Lockwaittimeoutexceeded;tryrestartingtransactionmysql报错问题描述：问题复现第一步：开启sql命令页面第二步：输入starttransaction;开启一个事务第三步：输入update语句不要提交第四步：书写测试类第五步：查看锁第五步：等待错误出现原因分析解决方案一、杀掉锁二、重启mysql三、设置锁定等待时间改大问题描述：提示：最近项目中频繁出
解决MySQL “Lock wait timeout exceeded； try restarting transaction“ 错误一勺菠萝丶 #MySQL mysql android 数据库
在处理MySQL数据库时，我们偶尔会遇到一个棘手的错误消息：“Lockwaittimeoutexceeded;tryrestartingtransaction”。这通常表明我们的一个事务在尝试获取资源时被阻塞了太长时间。在并发环境中，多个事务同时竞争相同的资源可能会导致这种情况发生。锁等待超时问题的原因锁等待超时是因为另一个事务持有了需要的锁，并且没有在配置的超时期限内释放。这可能是因为该事务非常
【求余的妙用：从奇偶判断到编程魔法】￥-oriented 算法开发语言经验分享
在数学的浩瀚星空中，求余运算如同一颗低调却闪耀的星辰，它看似简单，实则蕴含着无尽的能量，在编程与算法的世界里有着广泛而奇妙的用途。其中，判断奇偶数便是求余运算最基础且直观的应用。判断奇偶数：入门级的智慧判断一个数是奇数还是偶数，是我们在学习数学和编程初期常常会遇到的简单问题。传统的方法或许是通过不断除以2看是否能整除，但求余运算为我们提供了一个更为简洁高效的解决方案。当我们对一个整数进行求余运算，
AIX常见问题整理 pressman 技术 aix security ibm 平台 documentation 产品
AIX常见问题整理创建时间：2002-08-17文章属性：原创文章来源：www.cnsafe.net文章提交：mayi(mayi99_at_263.net)by:ciline来自：www.cnsafe.net提纲：用feprom_update升级Firmware2002-07-24CHRPSystems系统启动过程的LEDE1DC报错提示2002-07-24怎样在AIX5.1中建立热后备(hots
【PHP开发900个实用技巧】404.OAuth2.0实现：API授权的完整流程与安全配置
好的，老朋友！这就把干货满满的文章奉上，绝不藏私，保证完整无删减！告别"未授权访问404"！从0到1用PHP手撸OAuth2.0防护盾：详解授权码模式、令牌安全、刷新轮转与7大防御屏障，让你的API固若金汤。404.OAuth2.0实现：API授权的完整流程与安全配置1.OAuth2.0：核心概念一图看懂2.授权码模式：PHP手把手实战3.令牌安全与刷新：持续守护的秘密4.安全风险&防护：筑牢7道
windows下源码安装golang 616050468 golang安装 golang环境 windows
系统： 64位win7，开发环境：sublime text 2， go版本： 1.4.1 1. 安装前准备(gcc, gdb, git) golang在64位系
redis批量删除带空格的key bylijinnan redis
redis批量删除的通常做法： redis-cli keys "blacklist*" | xargs redis-cli del 上面的命令在key的前后没有空格时是可以的，但有空格就不行了： $redis-cli keys "blacklist*" 1) "blacklist:12: [email protected]
oracle正则表达式的用法 0624chenhong oracle 正则表达式
方括号表达示方括号表达式描述 [[:alnum:]] 字母和数字混合的字符 [[:alpha:]] 字母字符 [[:cntrl:]] 控制字符 [[:digit:]] 数字字符 [[:graph:]] 图像字符 [[:lower:]] 小写字母字符 [[:print:]] 打印字符 [[:punct：]] 标点符号字符 [[:space:]]
2048源码(核心算法有，缺少几个anctionbar，以后补上) 不懂事的小屁孩 2048
2048游戏基本上有四部分组成， 1：主activity，包含游戏块的16个方格，上面统计分数的模块 2：底下的gridview，监听上下左右的滑动，进行事件处理， 3：每一个卡片，里面的内容很简单，只有一个text，记录显示的数字 4：Actionbar，是游戏用重新开始，设置等功能(这个在底下可以下载的代码里面还没有实现) 写代码的流程 1：设计游戏的布局，基本是两块，上面是分
jquery内部链式调用机理换个号韩国红果果 JavaScript jquery
只需要在调用该对象合适(比如下列的setStyles)的方法后让该方法返回该对象（通过this 因为一旦一个函数称为一个对象方法的话那么在这个方法内部this（结合下面的setStyles）指向这个对象） function create(type){ var element=document.createElement(type); //this=element;
你订酒店时的每一次点击背后都是NoSQL和云计算蓝儿唯美 NoSQL
全球最大的在线旅游公司Expedia旗下的酒店预订公司，它运营着89个网站，跨越68个国家，三年前开始实验公有云，以求让客户在预订网站上查询假期酒店时得到更快的信息获取体验。云端本身是用于驱动网站的部分小功能的，如搜索框的自动推荐功能，还能保证处理Hotels.com服务的季节性需求高峰整体储能。 Hotels.com的首席技术官Thierry Bedos上个月在伦敦参加“2015 Clou
java笔记1 a-john java
1，面向对象程序设计（Object-oriented Propramming，OOP）：java就是一种面向对象程序设计。 2，对象：我们将问题空间中的元素及其在解空间中的表示称为“对象”。简单来说，对象是某个类型的实例。比如狗是一个类型，哈士奇可以是狗的一个实例，也就是对象。 3，面向对象程序设计方式的特性： 3.1 万物皆为对象。
C语言 sizeof和strlen之间的那些事 C/C++软件开发求职面试题必备考点（一） aijuans C/C++求职面试必备考点
找工作在即，以后决定每天至少写一个知识点，主要是记录，逼迫自己动手、总结加深印象。当然如果能有一言半语让他人收益，后学幸运之至也。如有错误，还希望大家帮忙指出来。感激不尽。后学保证每个写出来的结果都是自己在电脑上亲自跑过的，咱人笨，以前学的也半吊子。很多时候只能靠运行出来的结果再反过来
程序员写代码时就不要管需求了吗？ asia007 程序员不能一味跟需求走
编程也有2年了，刚开始不懂的什么都跟需求走，需求是怎样就用代码实现就行，也不管这个需求是否合理，是否为较好的用户体验。当然刚开始编程都会这样，但是如果有了2年以上的工作经验的程序员只知道一味写代码，而不在写的过程中思考一下这个需求是否合理，那么，我想这个程序员就只能一辈写敲敲代码了。我的技术不是很好，但是就不代
Activity的四种启动模式百合不是茶 android 栈模式启动 Activity的标准模式启动栈顶模式启动单例模式启动
android界面的操作就是很多个activity之间的切换,启动模式决定启动的activity的生命周期 ; 启动模式xml中配置 <activity android:name=".MainActivity" android:launchMode="standard&quo
Spring中@Autowired标签与@Resource标签的区别 bijian1013 java spring @Resource @Autowired @Qualifier
Spring不但支持自己定义的@Autowired注解，还支持由JSR-250规范定义的几个注解，如：@Resource、 @PostConstruct及@PreDestroy。 1. @Autowired @Autowired是Spring 提供的，需导入 Package:org.springframewo
Changes Between SOAP 1.1 and SOAP 1.2 sunjing Changes Enable SOAP 1.1 SOAP 1.2
JAX-WS SOAP Version 1.2 Part 0: Primer (Second Edition) SOAP Version 1.2 Part 1: Messaging Framework (Second Edition) SOAP Version 1.2 Part 2: Adjuncts (Second Edition) Which style of WSDL
【Hadoop二】Hadoop常用命令 bit1129 hadoop
以Hadoop运行Hadoop自带的wordcount为例， hadoop脚本位于/home/hadoop/hadoop-2.5.2/bin/hadoop，需要说明的是，这些命令的使用必须在Hadoop已经运行的情况下才能执行 Hadoop HDFS相关命令 hadoop fs -ls 列出HDFS文件系统的第一级文件和第一级
java异常处理（初级）白糖_ java DAO spring 虚拟机 Ajax
从学习到现在从事java开发一年多了，个人觉得对java只了解皮毛，很多东西都是用到再去慢慢学习，编程真的是一项艺术，要完成一段好的代码，需要懂得很多。最近项目经理让我负责一个组件开发，框架都由自己搭建，最让我头疼的是异常处理，我看了一些网上的源码，发现他们对异常的处理不是很重视，研究了很久都没有找到很好的解决方案。后来有幸看到一个200W美元的项目部分源码，通过他们对异常处理的解决方案，我终
记录整理-工作问题 braveCS 工作
1）那位同学还是CSV文件默认Excel打开看不到全部结果。以为是没写进去。同学甲说文件应该不分大小。后来log一下原来是有写进去。只是Excel有行数限制。那位同学进步好快啊。 2）今天同学说写文件的时候提示jvm的内存溢出。我马上反应说那就改一下jvm的内存大小。同学说改用分批处理了。果然想问题还是有局限性。改jvm内存大小只能暂时地解决问题，以后要是写更大的文件还是得改内存。想问题要长远啊
org.apache.tools.zip实现文件的压缩和解压，支持中文 bylijinnan apache
刚开始用java.util.Zip，发现不支持中文（网上有修改的方法，但比较麻烦）后改用org.apache.tools.zip org.apache.tools.zip的使用网上有更简单的例子下面的程序根据实际需求，实现了压缩指定目录下指定文件的方法 import java.io.BufferedReader; import java.io.BufferedWrit
读书笔记-4 chengxuyuancsdn 读书笔记
1、JSTL 核心标签库标签 2、避免SQL注入 3、字符串逆转方法 4、字符串比较compareTo 5、字符串替换replace 6、分拆字符串 1、JSTL 核心标签库标签共有13个，学习资料：http://www.cnblogs.com/lihuiyy/archive/2012/02/24/2366806.html 功能上分为4类： (1)表达式控制标签：out
[物理与电子]半导体教材的一个小问题 comsci 问题
各种模拟电子和数字电子教材中都有这个词汇-空穴书中对这个词汇的解释是; 当电子脱离共价键的束缚成为自由电子之后,共价键中就留下一个空位,这个空位叫做空穴我现在回过头翻大学时候的教材,觉得这个
Flashback Database --闪回数据库 daizj oracle 闪回数据库
Flashback 技术是以Undo segment中的内容为基础的，因此受限于UNDO_RETENTON参数。要使用flashback 的特性，必须启用自动撤销管理表空间。在Oracle 10g中， Flash back家族分为以下成员： Flashback Database， Flashback Drop，Flashback Query(分Flashback Query,Flashbac
简单排序:插入排序 dieslrae 插入排序
public void insertSort(int[] array){ int temp; for(int i=1;i<array.length;i++){ temp = array[i]; for(int k=i-1;k>=0;k--)
C语言学习六指针小示例、一维数组名含义，定义一个函数输出数组的内容 dcj3sjt126com c
# include <stdio.h> int main(void) { int * p; //等价于 int *p 也等价于 int* p; int i = 5; char ch = 'A'; //p = 5; //error //p = &ch; //error //p = ch; //error p = &i; //
centos下php redis扩展的安装配置3种方法 dcj3sjt126com redis
方法一 1.下载php redis扩展包代码如下复制代码 #wget http://redis.googlecode.com/files/redis-2.4.4.tar.gz 2 tar -zxvf 解压压缩包，cd /扩展包（进入扩展包然后运行phpize 一下是我环境中phpize的目录，/usr/local/php/bin/phpize (一定要
线程池(Executors) shuizhaosi888 线程池
在java类库中，任务执行的主要抽象不是Thread，而是Executor，将任务的提交过程和执行过程解耦 public interface Executor { void execute(Runnable command); } public class RunMain implements Executor{ @Override pub
openstack 快速安装笔记 haoningabc openstack
前提是要配置好yum源版本icehouse，操作系统redhat6.5 最简化安装，不要cinder和swift 三个节点 172 control节点keystone glance horizon 173 compute节点nova 173 network节点neutron control /etc/sysctl.conf net.ipv4.ip_forward =
从c面向对象的实现理解c++的对象（二） jimmee C++面向对象虚函数
1. 类就可以看作一个struct，类的方法，可以理解为通过函数指针的方式实现的，类对象分配内存时，只分配成员变量的，函数指针并不需要分配额外的内存保存地址。 2. c++中类的构造函数，就是进行内存分配(malloc)，调用构造函数 3. c++中类的析构函数，就时回收内存(free) 4. c++是基于栈和全局数据分配内存的，如果是一个方法内创建的对象，就直接在栈上分配内存了。专门在
如何让那个一个div可以拖动 lingfeng520240 html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml
第10章高级事件（中） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
计算两个经纬度之间的距离 roadrunners 计算纬度 LBS 经度距离
要解决这个问题的时候，到网上查了很多方案，最后计算出来的都与百度计算出来的有出入。下面这个公式计算出来的距离和百度计算出来的距离是一致的。 /** * * @param longitudeA * 经度A点 * @param latitudeA * 纬度A点 * @param longitudeB *
最具争议的10个Java话题 tomcat_oracle java
1、Java8已经到来。什么！？ Java8 支持lambda。哇哦，RIP Scala！　　随着Java8 的发布，出现很多关于新发布的Java8是否有潜力干掉Scala的争论，最终的结论是远远没有那么简单。Java8可能已经在Scala的lambda的包围中突围，但Java并非是函数式编程王位的真正觊觎者。　　2、Java 9 即将到来　　 Oracle早在8月份就发布
zoj 3826 Hierarchical Notation(模拟) 阿尔萨斯 rar
题目链接：zoj 3826 Hierarchical Notation 题目大意：给定一些结构体，结构体有value值和key值，Q次询问，输出每个key值对应的value值。解题思路：思路很简单，写个类词法的递归函数，每次将key值映射成一个hash值，用map映射每个key的value起始终止位置，预处理完了查询就很简单了。这题是最后10分钟出的，因为没有考虑value为{}的情

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他