Charzueus

双向最大匹配算法——基于词典规则的中文分词(Java实现)

一、中文分词理论描述

二、算法描述

1、正向最大匹配算法

2、反向最大匹配算法

3、双剑合璧

三、案例描述

四、JAVA实现完整代码

五、组装UI

六、总结

前言

这篇将使用Java实现基于规则的中文分词算法，一个中文词典将实现准确率高达85%的分词结果。使用经典算法：正向最大匹配和反向最大匹配算法，然后双剑合璧，双向最大匹配。

一、中文分词理论描述

根据相关资料，中文分词概念的理论描述，我总结如下：

中文分词是将一个汉字序列切分成一个一个单独的词，将连续的字序列按照一定的规范重新组合成词序列的过程，把字与字连在一起的汉语句子分成若干个相互独立、完整、正确的单词，词是最小的、能独立活动的、有意义的语言成分。

中文分词应用广泛，是文本挖掘的基础，在中文文本处理中意义重大，对于输入的一段中文，成功的进行中文分词，可以达到电脑自动识别语句含义的效果。目前，常用流行的以及分次效果好的工具库包括：jieba、HanLP、LTP、FudanNLP等。

我们知道，调用工具方便容易，但是如果自己实现写一个算法实现，那不是更加有成就感^_^。

接下来将一步步介绍最容易理解，最简单，效果还很不错的中文分词算法，据说准确率能达到85%！！

二、算法描述

1、正向最大匹配算法

所谓正向，就是从文本串左边正向扫描，取出子串与词典进行匹配。

算法我分为两步来理解：

假设初始化取最大匹配长度为MaxLen，当前位置pos=0，处理结果result=””，每次取词str，取词长度len，待处理串segstr。

len=MaxLen，取字符串0到len的子串，查找词典，若匹配到则赋值str，加到result，在保证pos+len<=segstr.length()情况下，pos=pos+len,向后匹配，直到字符串扫描完成，结束算法。
若词典未找到，若len>1,减小匹配长度同时len=MaxLen-1,执行步骤（1），否则，取出剩余子串,执行步骤（1）。

算法代码如下：

    public void MM(String str, int len, int frompos) {
        if (frompos + 1 > str.length())
            return;
        String curstr = "";
        //此处可以设置断点
        int llen = str.length() - frompos;
        if (llen <= len)//句末边界处理
            curstr = str.substring(frompos, frompos + llen);//substring获取的子串是下标frompos~frompos+llen-1
        else
            curstr = str.substring(frompos, frompos + len);
 
        if (dict.containsKey(curstr)) {
            result = result + curstr + "/ ";
            Len = MaxLen;
            indexpos = frompos + len;
            MM(str, Len, indexpos);
        } else {
            if (Len > 1) {
                Len = Len - 1;
            } else {
                result = result + str + "/ ";
                frompos = frompos + 1;
                Len = MaxLen;
            }
            MM(str, Len, frompos);
        }
    }

从算法代码看出，很容易理解，细节部分在于边界处理。

测试一下，我输入文本，"我爱自然语言处理，赞赏评论收藏我的文章是我的动力！赶紧关注！"

分词结果：

2、反向最大匹配算法

反向，则与正向相反，从文本串末向左进行扫描。

假设初始化取最大匹配长度为MaxLen，当前位置pos为字符串尾部，处理结果result=””，每次取词str，取词长度len，待处理串segstr。

len=MaxLen，取字符串pos-len到pos的子串，查找词典，若匹配到则赋值str，加到result，同时pos=pos-len,保证pos-len>=0,向前移动匹配，直到字符串扫描完成，结束算法。
若词典未找到，若len>1,减小匹配长度同时len=MaxLen-1,执行步骤（1），否则，取出剩余子串,执行步骤（1）。

算法逻辑类似，取相反方向处理。

public void RMM(String str, int len, int frompos) {
        if (frompos < 0)
            return;
        String curstr = "";
        //此处可以设置断点
        if (frompos - len + 1 >= 0)//句末边界处理
            curstr = str.substring(frompos - len + 1, frompos + 1);//substring获取的子串是下标frompos~frompos+llen-1
        else
            curstr = str.substring(0, frompos + 1);//到达句首
 
        if (dict.containsKey(curstr)) {
            RmmResult = curstr + "/ " + RmmResult;
            Len = MaxLen;
            indexpos = frompos - len;
            RMM(str, Len, indexpos);
        } else {
            if (Len > 1) {
                Len = Len - 1;
            } else {
                RmmResult = RmmResult + str + "/ ";
                frompos = frompos - 1;
                Len = MaxLen;
            }
            RMM(str, Len, frompos);
        }
    }

同样，细节部分在于边界处理，其他基本相同。

3、双剑合璧

这里所说的是正向与反向结合，实现双向最大匹配。

双向最大匹配算法，基于正向、反向最大匹配，对分词结果进一步处理，比较两个结果，做的工作就是遵循某些原则和经验，筛选出两者中更确切地分词结果。原则如下：

多数情况下，反向最大匹配效果更好，若分词结果相同，则返回RMM结果；
遵循切分最少词原则，更大匹配词为更好地分词结果，比较之后返回最少词的切分结果；
根据切分后词长度的大小，选择词长度大者为最终结果。

具体也需要看开始给定的最大匹配长度为多少。以下代码只实现了原则（1）、（2）。

    public String BMM() throws IOException {
        String Mr = MM_Seg();
        String RMr = RMM_Seg();
        if (Mr.equals(RMr)) {
            return "双向匹配相同，结果为：" + Mr;
        } else {
            List MStr;
            List RStr;
            MStr = Arrays.asList(Mr.trim().split("/"));
            RStr = Arrays.asList(RMr.trim().split("/"));
 
            if (MStr.size() >= RStr.size()) {//多数情况下，反向匹配正确率更高
                return "双向匹配不同，最佳结果为：" + RMr;
            } else
                return "双向匹配不同，最佳结果为：" + Mr;
        }
    }

另外，这与使用的词典大小有关，是否包含常用词。

三、案例描述

如果上面还不能完全理解，下面的例子可以更好的理解算法执行过程。

正向最大匹配算法：

取MaxLen=3，SegStr=”对外经济技术合作与交流不断扩大”,maxNum=3,len=3,result=””,pos=0,curstr=””.

第一次，curstr=”对外经”，查找词典，未找到，将len-1，得到curstr=”对外”，此时匹配到词典，将结果加入result=”对外/ ”.pos=pos+len.

第二次，curstr=”经济技”，查找词典，未找到，将len-1，得到curstr=”经济”，此时匹配到词典，将结果加入result=”对外/ 经济/ ”.pos=pos+len.

以此类推...

最后一次，边界，pos=13，因为只剩下”扩大”两个字，所以取出全部，查找词典并匹配到，将结果加入result=”对外/ 经济/ 技术/ 合作/ 与/ 交流/ 不断/ 扩大/ ”.此时pos+1>SegStr.length(),结束算法。

反向最大匹配算法：

取MaxLen=3，SegStr=”对外经济技术合作与交流不断扩大”,maxNum=3,len=3,result=””,pos=14,curstr=””.

第一次，curstr=”断扩大”，查找词典，未找到，将len-1，得到curstr=”扩大”，此时匹配到词典，将结果加入result=”扩大/ ”.pos=pos-len.

第二次，MaxLen=3，curstr=”流不断”，查找词典，未找到，将len-1，得到curstr=”不断”，此时匹配到词典，将结果加入result=”不断/ 扩大/ ”.pos=pos-len.

以此类推...

最后一次，边界，pos=1，因为只剩下”对外”两个字，所以取出全部，查找词典并匹配到，将结果加入result=”对外/ 经济/ 技术/ 合作/ 与/ 交流/ 不断/ 扩大/ ”.此时pos-1<0,结束算法。

四、JAVA实现完整代码

除了分词算法实现，还需要读入词典，对词典进行预处理，具体如下：

package ex1;
 
import java.io.BufferedReader;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.io.InputStreamReader;
import java.util.*;
 
 
public class seg {
 
    String result;
    String RmmResult;
    String segstring;
    int MaxLen;
    int Len;
    int indexpos;
    Map dict; 
 
    public seg(String inputstr, int maxlen) {//构造函数
        segstring = inputstr;
        MaxLen = maxlen;
        Len = MaxLen;
        indexpos = 0;
        result = "";
        RmmResult = "";
        dict = new HashMap();
 
    }
 
    public void ReadDic() throws FileNotFoundException, IOException {
        BufferedReader br = new BufferedReader(new InputStreamReader(new FileInputStream("chineseDic.txt"), "GBK"));
        String line = null;
        while ((line = br.readLine()) != null) {
            String[] words = line.trim().split(",");//词典包含词性标注，需要将词与标注分开，放入列表
            String word = words[0];
            String cx = words[1];
            dict.put(word, cx);
        }
        br.close();
    }
 
    public String MM_Seg() throws IOException {//正向最大匹配算法
        try {
            ReadDic();//读入字典
            MM(segstring, MaxLen, 0);//正向最大分词
            return result;
        } catch (IOException e) {
            return "Read Error!";
        }
    }
 
    public void MM(String str, int len, int frompos) {
        if (frompos + 1 > str.length())
            return;
        String curstr = "";
        //此处可以设置断点
        int llen = str.length() - frompos;
        if (llen <= len)//句末边界处理
            curstr = str.substring(frompos, frompos + llen);//substring获取的子串是下标frompos~frompos+llen-1
        else
            curstr = str.substring(frompos, frompos + len);
 
        if (dict.containsKey(curstr)) {
            result = result + curstr + "/ ";
            Len = MaxLen;
            indexpos = frompos + len;
            MM(str, Len, indexpos);
        } else {
            if (Len > 1) {
                Len = Len - 1;
            } else {
                result = result + str + "/ ";
                frompos = frompos + 1;
                Len = MaxLen;
            }
            MM(str, Len, frompos);
        }
    }
 
    public String RMM_Seg() throws IOException {//正向最大匹配算法
        try {
            ReadDic();//读入字典
            RMM(segstring, MaxLen, segstring.length() - 1);//正向最大分词
            return RmmResult;
        } catch (IOException e) {
            return "Read Error!";
        }
    }
 
    public void RMM(String str, int len, int frompos) {
        if (frompos < 0)
            return;
        String curstr = "";
        //此处可以设置断点
        if (frompos - len + 1 >= 0)//句末边界处理
            curstr = str.substring(frompos - len + 1, frompos + 1);//substring获取的子串是下标frompos~frompos+llen-1
        else
            curstr = str.substring(0, frompos + 1);//到达句首
 
        if (dict.containsKey(curstr)) {
            RmmResult = curstr + "/ " + RmmResult;
            Len = MaxLen;
            indexpos = frompos - len;
            RMM(str, Len, indexpos);
        } else {
            if (Len > 1) {
                Len = Len - 1;
            } else {
                RmmResult = RmmResult + str + "/ ";
                frompos = frompos - 1;
                Len = MaxLen;
            }
            RMM(str, Len, frompos);
        }
    }
 
    public String BMM() throws IOException {
        String Mr = MM_Seg();
        String RMr = RMM_Seg();
        if (Mr.equals(RMr)) {
            return "双向匹配相同，结果为：" + Mr;
        } else {
            List MStr;
            List RStr;
            MStr = Arrays.asList(Mr.trim().split("/"));
            RStr = Arrays.asList(RMr.trim().split("/"));
 
            if (MStr.size() >= RStr.size()) {//多数情况下，反向匹配正确率更高
                return "双向匹配不同，最佳结果为：" + RMr;
            } else
                return "双向匹配不同，最佳结果为：" + Mr;
        }
    }
 
    public String getResult() {
        return result;
    }
 
    public static void main(String[] args) throws IOException, Exception {
        seg s = new seg("我爱自然语言处理，赞赏评论收藏我的文章是我的动力！赶紧关注！", 3);
//        String result = s.MM_Seg();
        String result = s.RMM_Seg();
        System.out.println(result);
 
    }
}

View Code

五、组装UI

我是用的开发软件为是IDEA，一个方便之处可以拖动组件组装UI界面。也可以自行写JavaFX实现简单布局。

这是简单页面的设计：

UI界面可以有更好的用户体验，通过UI界面的元素调用方法，减少每次测试运行算法脚本的繁琐。

实验演示：

每次可以观察不同最大匹配长度分词后的结果。

"年中"词语解析：

在词典中，是这样的，可以发现满足最大匹配。

双向最大匹配算法，结果提示：

六、总结

这篇介绍了使用Java实现基于规则的中文分词算法，使用经典算法：正向最大匹配和反向最大匹配算法，然后双剑合璧，双向最大匹配。最后设计简单UI界面，实现稍微高效的中文分词处理，结果返回。

双向最大匹配算法原则，希望句子最长词保留完整、最短词数量最少、单字词问题，目前只解决了句子切分最少词问题。
正向反向匹配算法可以进一步优化结构，提高执行效率，目前平均耗时20ms。
UI界面增加输入输出提示语，方便用户使用，在正确的区域输入内容。
将最大匹配长度设置为可输入，实现每次可以观察不同MaxLen得到的切分结果。
双向最大匹配按钮点击之后，返回结果同时返回MM和RMM结果是否一样的提示，方便查看。

我的博客园：https://www.cnblogs.com/chenzhenhong/p/13748042.html

我的CSDN博客： https://blog.csdn.net/Charzous/article/details/108817914

本文链接： https://blog.csdn.net/Charzous/article/details/108817914

24年，我终于等到了叫妈妈的机会，可她。。。 48ac47d4b335
20多年的等待，我终于可以像其他孩子一样叫“妈妈”了，虽然并不是生我的那个人，但是却很感激。2岁左右因为爸爸精神有问题，同时妈妈跟奶奶相处的不好，妈妈就跟爸爸离婚，自己去了新疆，而我跟着爸爸一起生活，更确切的说是跟着爷爷奶奶，因为爸爸在家基本不管事。虽然爷爷奶奶把什么好的东西都给我，但是有一件事一直让我难以理解，就是别的孩子都是有妈妈的而我却没有，所以每次当别的小朋友提到妈妈时我就心里不是滋味，自
详解NIO Channel类沧澜sincerely Java 高并发 nio
目录什么是NIOChannel？为什么要学习NIOChannel？FileChannelSocketChannelDatagramChannel本篇文章内容的前置知识为NIOBuffer类，如果不了解，可点击链接学习详解NIOBuffer类及其属性和方法-CSDN博客什么是NIOChannel？在JavaNIO中，Channel（通道）是一种广义的I/O抽象，用于表示与数据源或数据目的地之间的连接
我比你们多一个世界本末丶
前一阵子群里在讨论音乐是什么我不知道音乐这东西本就很难定义更别说不同心境下不同的感受直到有一天在地铁里手机突然断电耳朵里的空灵婉转哀怨激昂戛然而止之后传来的各式方言和地铁轰鸣让我呆了好久才接受这个事实那感觉就好像从另一个世界被踢了出来那一刻就好像武林高手进入了梦寐以求的顿悟当然我不是什么武林高手也不会降龙十八掌和九阳神功但是我比你们多了一个世界音乐就是另一个世界早晚高峰时蚁巢一样的地铁散落着被树叶
如何使用 Docker 部署一个简单的 Node.js 应用 iOS开发届的一个人 node.js
如何使用Docker部署一个简单的Node.js应用在现代的软件开发中，容器化技术已经成为了提高开发效率和简化部署流程的重要工具。Docker是最流行的容器化工具之一，它可以帮助开发者打包应用程序以及其所有的依赖，使其在任何环境下都能一致地运行。本篇博客将向大家展示如何使用Docker来部署一个简单的Node.js应用。1.环境准备在开始之前，我们需要确保系统已经安装了以下工具：Docker：如果
常用的折叠展开过渡动画效果css
如何实现优雅的折叠展开动画效果在现代Web设计中，折叠展开动画是一种常见且实用的交互方式，它可以帮助用户在保持界面简洁的同时，灵活控制内容的显示与隐藏。本文将分享如何使用HTML、CSS和JavaScript实现一个平滑流畅的折叠展开动画效果。基本原理折叠展开动画的核心原理是通过CSS过渡(transition)来控制元素的高度、内边距和其他样式属性的变化。当用户点击触发按钮时，JavaScrip
10-08|人生不能只有生长，没有成长清风徐来
古人说：“法不轻传，道不贱卖，师不顺路，医不扣门”。现代对于心理咨询也是“不求不助”，其实所有的道理都是一样的，只有当一个人真正的有想要去改变的动力的时候，那才会有新的转机出现。如果一个人没有想要改变的动力和决心，那么即使大罗神仙来了没有用。天雨虽宽不润无根之草；佛法虽广不度无缘之人。佛经有一个故事：一日，佛陀和弟子出门，佛弟子看见一个老妇人，这个老妇人很可怜，穷困，疾病都在折磨着她，佛陀和他的弟
007｜2班｜1月织梦小组精选文章赏析——20180121 薛衡
作业雨情况：共10位战友（其中1位围观）围观|肖全|小庄稼未点评/迟点评陈清香｜007-63徐文晔｜007-65本期优秀文章：张冲｜007-66｜：砍柴挑水先生｜对避免思考的反思金句：人们为了逃避真正的思考，愿意做任何事情。精彩点评：这真的是一篇相当不错的反思文章，结构逻辑清晰，内容很具体。我说说自己对于第一性原理的认识，供参考。第一性原理的出现的背景是，正常情况下，一项技术会沿着路径不断升级，比
剧本杀【犯罪者的博弈游戏】复盘解析+凶手是谁+剧透结局+测评+怎么玩？ VX搜_彤彤速递
每天持续更新复盘有15000＋：线下剧本杀·百变大侦探·我是谜·谁是凶手·玩吧·剧本杀线上·戏精大侦探·魔王杀·儿童剧本杀...所有谜题在等着你去揭开。为了你获得更好的游戏体验，本文仅显示《犯罪者的博弈游戏》剧本杀部分真相复盘，获取完整真相复盘只需两步①【微信关注公众号：云云复盘】②回复【犯罪者的博弈游戏】即可查看获取哦案件详情:金氏集团是由金德生金老爷子创立的，而金老爷子已经病故。金德生有两个儿
centos7 安装yum环境时最后两个包一块安装的命令醋留香
后面的2个包,是互相依赖，所以一起安装rpm--nodeps--force-ivhyum-3.4.3-154.el7.centos.noarch.rpmyum-plugin-fastestmirror-1.1.31-42.el7.noarch.rpm（--nodeps--force强制安装）安装完后，查看yum安装情况yum-V
想做的事，为何要等到退休才做 19aa406b1f83
今天读到《世界尽头的咖啡馆》的第73页，本想全本看完后在写读后感，但一来怕读了又忘记，等想写的时候已经记不起要写得是什么感悟了，二来读到这一页确实给我很大的震撼。安妮原本的人生规划是“工作到六十岁，等到退休，才能去做自己想做的事。”其实我也对自己说过类似的话，不过不是等到退休，而是等自己赚够了足够的钱，然后带着老婆孩子天天去吃大餐，去看电影，去游山玩水。但赚多少钱才能算是足够的钱能？需要多久才能赚
Redux架构解析：状态管理的核心原理止观止架构前端 react.js redux
Redux作为JavaScript应用的状态管理库，其技术架构与核心原理围绕可预测的状态管理设计，通过严格的单向数据流和函数式编程理念实现复杂应用的状态控制。以下从设计理念、核心架构、工作流程、源码实现等角度进行系统性剖析：一、设计理念与原则单一数据源（SingleSourceofTruth）整个应用的状态存储在一个全局Store对象中，形成唯一的状态树（StateTree）。优势：简化状态共享和
Flink双流实时对账
在电商、金融、银行、支付等涉及到金钱相关的领域，为了安全起见，一般都有对账的需求。比如，对于订单支付事件，用户通过某宝付款，虽然用户支付成功，但是用户支付完成后并不算成功，我们得确认平台账户上是否到账了。针对上述的场景，我们可以采用批处理，或离线计算等技术手段，通过定时任务，每天结束后，扫描数据库中的数据，核对当天的支付数据和交易数据，进行对账。想要达到实时对账的效果，比如有的用户支付成功但是并没
Kafka 时间轮深度解析：如何O(1)处理定时任务 lifallen Kafka Java kafka linq 分布式 java 数据库数据结构 apache
TimingWheel（时间轮）TimingWheel是一种高效的、用于实现大量定时任务调度的算法结构。相比于传统的基于优先队列（PriorityQueue）的定时器（其添加/删除操作的时间复杂度为O(logn)），时间轮可以实现近乎O(1)的添加和删除操作，这在需要管理成千上万个定时任务的场景下（例如Kafka中的请求超时、延迟操作等）具有巨大的性能优势。可以把一个TimingWheel想象成一
从今天开始，打造完美天鹅颈~ 人鱼线vs马甲线
天鹅颈，顾名思义就是拥有像天鹅一样纤细修长的脖子。可以说，光滑紧致、纤细修长的脖子是最性感标志之一了，不仅穿衣服好看，还可以提高自身的气质，是女神的标配。最近，亚洲最时尚面孔公布倪妮获得了亚洲最时尚面孔排名第1名。倪妮的好看一直是被公认的，除了高级脸，时尚感，天鹅颈也是倪妮美丽中不可或缺的一部分。即使是身穿简单的吊带黑裙，也同样妩媚妖娆，即使没有浓妆艳抹，仅仅看纤细修长的天鹅颈，也十分抓人眼球。除
今天跑步路上遇见的跑友绝大部分都是女的_2022年4月22日跑步日记跑渣汤姆
跑步时间：2022年4月22日6:23跑步地点：马路上当时气温：十七度左右污染指数：73（空气质量为良）跑步距离：6.15公里跑步时长：48分47秒平均配速：7分56秒平均心率:131次/分钟（数据错误）平均步频：186步/分钟平均步幅：68厘米跑完后手测即时心率22*6=132次/分六十秒后手测即时心率17*6=102次/分今天跑步路上，虽然还是固定的路线，但今天路上遇见的跑友绝大部分都是女的，
2022-12-29 聆听美好世界
由于导致耳鸣的原因很多，而且大部分耳鸣发生的机制医学界目前为止尚未研究清楚，导致目前耳鸣医治的效果不理想。耳鸣困扰着越来越多的患者，同样它也困扰着许多医生。导致一部分医生甚至认为耳鸣无法医治，这也必将导致患者对自己所患耳鸣的医治失去了信心。
拉新人赚钱的app有吗?2023最新app拉新赚钱平台推荐! 氧惠帮朋友一起省
下了班做兼职也不是很累的事情，毕竟每天花个一两个小时完全够了。专注两小时可以做很多事情，比如我写这篇文章只需要20分钟，总之执行力和悟性永远是最重要的，加油！1.氧惠APP购物、看电影、点外卖、用氧惠APP！更优惠！氧惠（全网优惠上氧惠）——是与以往完全不同的抖客+淘客app！2023全新模式，我的直推也会放到你下面，送1:1超级补贴(邀请好友自购多少，你就推广得多少，非常厉害)，欢迎各位团队长体
静静0126幸福实修D5—制定60天新计划静静1007
#幸福是需要修出来的～每天进步1%～幸福实修14班～04组静静杭州#20180126（5/60）【幸福三朵玫瑰】昨日三朵玫瑰制定60天目标（完成）看书一小时（完成）陪伴女儿（完成）今日三朵玫瑰处理完积压工单看书一小时陪伴女儿【幸福实修目标】目标1：完成60天目标【幸福金句】#幸福实修#：D5静静#幸福实修#做自己不要在乎别人的看法发于心，乎于情不问人间【觉察日記】标题：#制定60天新计划#一说制定
一天学会超级玛丽小游戏_手把手教学_Java小游戏 62f5ecb72f71
超级玛丽是任天堂制作的一款小游戏,在的童年里一起玩这个游戏,大胡子,背带裤的马里奥,每关以马里奥在走到重点的前提下尽可能地收集金币。他在闯关过程中，会遇到怪物，可以通过踩死或者跳过。也会遇到深坑。给游戏增加了一定的难度。今天带大家用java制作制作这款小游戏,下面是课程介绍.课程介绍：在你的童年记忆里，是否有一个会蹦跳，会吃蘑菇的小人？超级玛丽是一款经典并且流行的小游戏，通过键盘来控制马里奥的移动
开开宝贝一百天了简爱自由
100天的小脚丫开开，我的宝贝，你今天刚好满一百天了，这是个值得纪念的日子！所以爸爸妈妈请了自己的好朋友一起吃顿饭，给你庆祝一下！但愿你能感受到爸妈心里的这份快乐！开开，妈妈在做邀请函的时候，翻了手机相册，回头看看你刚出生时候，真像个小不点呢，现在的你珠圆玉润，可爱极了。宝贝，这100天对爸妈来说，真的好长，但又感觉像一瞬间。不管爸妈的日子有多艰难，你一直都是爸妈心里最温暖的存在，看着你就忘却尘世
家庭关系对孩子的性格形成造成影响慧玲家庭教育
欢迎来到博星教育408将讲师朱老师课堂，这里是朱老师第1033天早安问候。孩子心理健康与家庭结构、父母关系和生活环境密不可分。社会学研究指出，家庭是一个互动的系统。在此过程中，父母的信念、情绪、行为等都会影响孩子的心理健康水平，进而影响孩子一生的发展。家庭关系，会对孩子的性格形成造成影响。蒙台梭利说过：每一种性格缺陷，都是由童年的不幸造成的。一个孩子的成长是生物遗传和环境交互作用的结果，不良的家庭
【算法训练营Day12】二叉树part2 十八岁讨厌编程算法训练营算法
文章目录翻转二叉树对称二叉树二叉树的最大深度二叉树的最小深度翻转二叉树题目链接：226.翻转二叉树解题逻辑：翻转二叉树也就是将所有非叶节点的左右孩子相互交换，那么我们就可以采用层序遍历判断非叶节点进行翻转：初始化一个辅助队列将根节点添加到队列中去弹出队头元素如果该元素的两个子节点均不为null则翻转两个子节点然后将子节点入队如此循环往复直到队列为空代码如下：classSolution{public
助力孩子成长日记第447天宋胤鋆妈妈
2019年2月23日星期六星期天晴今天是个难忘的日子，早上六点多四川的朋友发来微信说她已经到了潍坊火车站，正准备做上安丘的车来看我，心里是说不出的高兴，赶紧起床洗漱连早饭都没有顾上吃，就赶紧去超市，买菜买肉‘买水果，买了满满一大袋子，回到家就开始忙活，等我忙完又开始剁酸菜馅子，和面准备包酸菜馅的水饺，虽然她是南方人，我是北方人，但是她每次来都会让我给她包我们东北的酸菜馅的饺子吃，还没开始包水饺闺蜜
0201小土豆碎碎念星婷说成长
新的一年，新的开始。如果事情要改变，首先我要先改变，改变是即刻发生的。我是自己的人生主角，百分百为自己的人生负责，为自己做的每一个决定负责。相信什么，就会吸引什么。2022，我一定会活出闪闪发光的自己。好运和好孕，都会降临。所遇皆所期，平安喜乐。一定会上稿多多，成就满满。一定会中书多多，接单满满。一定会订单多多，生意兴隆。我是一个旺三代的女人，我会越来越健康，越来越美丽，越来越富有。我想要的一切都
每日早起打卡 Janyzhang
图片发自App六月初有参加叶武滨老师的易效能时间管理培训，愿意践行早睡早起和晨跑的，可以和小组成员一起参加打卡活动，再和别的小组进行评比。这两个都是非常好的习惯，所以我也非常乐意参与其中。目前已经进行到第8周，我们小组目前位居第二。为了更好的坚持和践行，前段时间我们小组制定规则，凡是在6:00以后打卡的，早上在群里发50元红包。我这两周基本上都在11:30才睡，而早起是一定要坚持的。但其实每天早上
2021-03-22 夫记
清晨自问我今天的目标是什么？今天最重要的一件事是什么？我今天要学哪些新知识？我今天要有怎样的心情？作息今日起床：0558昨日就寝：2305年度目标及关键点：项目本月重要成果：今日青蛙/番茄钟rplistreply昨日步数：8753昨日好习惯打卡：早起早睡阅读无氧
【0208今日悦读】zhen 甄艾
【书名】《非暴力沟通》【作者】马歇尔·卢森堡著阮胤华译【金句】当别人说“不”的时候，我们常常会认为他们是在拒绝我们。有时，我们甚至还会觉得自己受到了伤害。然而，如果我们能够体会他人的感受和需要，我们也许就会发现是什么使他们无法答应我们的请求。【感悟】我的先生很爱他的事业，在我看来是个事业狂（原来我认为是贬义词，现在觉得是褒义词），刚结婚没半年我们就经常吵架，我认为家庭和事业要兼顾，要求他少加班多陪
一个倒霉的家庭，有这5种倒霉的人搞笑的灵魂
一个上进的家庭，一定能红红火火；一个红火的家庭，成员不但身体健康，精神也开朗乐观，积极作为。而一个倒霉的家庭，一定家业凋零，心态不佳。越是家道衰弱的家庭，成员越是身体多病，精神萎靡，动不动就横眉竖目，难得看到什么好脸色。一个倒霉的家庭，很容易找到以下这5种倒霉的人：一、成事不足，败事有余。有些家庭，好不起来，其原因，就因为成员里有这么一位倒霉蛋，他像个“锉锅漏”，办不成好事，还总把家庭的好事给搅坏
今天开始戒烟抛硬币的杀手
分几个阶段，先从减量开始，循序渐进，贵在坚持。目标是明年年中之前完全戒断。戒烟确实不容易，成功者不足百分之几。我挑战一下自己。今天减量为平时的三分之一，还网购了一些口香糖，用以转移注意力。希望能够成功！
Http与Https区别和联系
一、HTTP详解HTTP（HyperTextTransferProtocol）是互联网数据通信的基础协议，用于客户端（浏览器）与服务器之间的请求-响应交互核心特性：1.无连接（Connectionless）每次请求/响应后立即断开TCP连接（早期HTTP/1.0）。HTTP/1.1默认启用持久连接（Connection:keep-alive），但逻辑上仍视为独立的请求2.无状态（Stateless
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 ([email protected]), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu

双向最大匹配算法——基于词典规则的中文分词(Java实现)

前言

一、中文分词理论描述

二、算法描述

1、正向最大匹配算法

2、反向最大匹配算法

3、双剑合璧

三、案例描述

四、JAVA实现完整代码

五、组装UI

六、总结

你可能感兴趣的:(双向最大匹配算法——基于词典规则的中文分词(Java实现))