lncy1991

使用IK中文分词器做敏感词过滤

需求

部分字段（可能为富文本）需要做敏感词过滤，敏感词词库由产品给出。

前置条件

项目使用的spring cloud全家桶，springboot版本2.1.0 ,项目中集成了spring Data elasticsearch 单独为一个子模块被各个服务引用，elasticsearch 插件版本为6.6.2，并且es插件中已经安装ik中文分词器

设计要求

1、敏感词能精确过滤，速度尽量快
2、如果敏感词有更新，要求能实时更新，并且更新过程尽量简单

实现过程

第一次方案设计

1、把敏感词导入数据库，再把数据库中的敏感词同步至ES
2、如果敏感词有更新，则通过任务调度器把数据同步至ES
3、使用IK分词器对输入文本进行分词，分词结果在ES中进行匹配查找，其中同步至ES的敏感词类型设置为 keyword，查找匹配使用termsQuery等精确匹配

测试结果：

1、ik分词器分词不理想，输入一段文本，由于IK分词器没有按照预期的分词结果进行分词，导致没有过滤出敏感词
2、teamsQuery默认一次只能输入1024个词，超过则会报错，尝试修改ES设置，增大参数，但是按照网上查找的资料设置失败。修复方案为写一个IK分词器工具类，对输入的文本进行分词检查，如果分词结果大于1024个，则去重后分组匹配，最后把结果放入一个list返回

过程要点

设置字段类型为Keyword，设置为keyword类型，则在索引过程中不分再词

    @Field(type = FieldType.Keyword)
    private String word;

IK分词工具类：

	public List getAnalyzes(String index, String analyzer, String text) {
        //调用ES客户端分词器进行分词
        AnalyzeRequestBuilder ikRequest = new AnalyzeRequestBuilder(elasticsearchTemplate.getClient(),
                AnalyzeAction.INSTANCE, index, text).setAnalyzer(analyzer);
        List ikTokenList = ikRequest.execute().actionGet().getTokens();
        // 赋值
        List searchTermList = new ArrayList<>();
        if (ToolUtil.isNotEmpty(ikTokenList)) {
            ikTokenList.forEach(ikToken -> {
                searchTermList.add(ikToken.getTerm());
            });
        }
        return searchTermList;
    }

匹配方式：

//sensitives = getAnalyzes(...)
QueryBuilder queryBuilder = QueryBuilders.termsQuery("word", sensitives);

QueryBuilder queryBuilder = QueryBuilders.multiMatchQuery(word, "word").analyzer(analyzer).operator(Operator.OR);

term为精确匹配，即不分词，而带match的查询则是先分词，再进行匹配

同步数据至es

	@Override
    public void fetchFromMysql() {
        log.info("从数据库同步敏感词至ES");        
        list = ;//查询数据库
        if (CollectionUtil.isNotEmpty(list)) {
            log.info("从数据库中查询到的敏感词总大小list.size={}", list.size());
            repository.deleteAll();
            repository.saveAll(list);
        }
        log.info("敏感词同步结束");
    }

第二次方案优化

1、主要是对分词进行优化，考虑到IK分词器支持自定义字典，于是把敏感词在导入数据库的同时，也生成一份字典，并把它配置到ik分词器插件中，使用的是本地字典

测试结果

1、已经达到初步预期，输入文本能按照预期的敏感词进行分词，并且返回正确的结果
2、缺点也很明显，如果有敏感词更新，一是需要更新数据库，然后通过调度器同步至ES，二是要更新ik分词器的字典，并且要重启es才能生效，第二点是麻烦，生产环境ES不能随便重启

过程要点

1、创建字典 sensitive_word.dic，其中一个词一行
2、上传sensitive_word.dic至服务器es的插件安装目录，如

[root@izwz970jhtovyr0spqrk88z ~]# cd /data/env/es66/plugins/ik/config/
[root@izwz970jhtovyr0spqrk88z config]# ll
总用量 8304
-rw-r--r-- 1 root root 5225922 2月  19 00:07 extra_main.dic
-rw-r--r-- 1 root root   63188 2月  19 00:07 extra_single_word.dic
-rw-r--r-- 1 root root   63188 2月  19 00:07 extra_single_word_full.dic
-rw-r--r-- 1 root root   10855 2月  19 00:07 extra_single_word_low_freq.dic
-rw-r--r-- 1 root root     156 2月  19 00:07 extra_stopword.dic
-rw-r--r-- 1 root root     700 4月   9 10:24 IKAnalyzer.cfg.xml
-rw-r--r-- 1 root root 3058510 2月  19 00:07 main.dic
-rw-r--r-- 1 root root     123 2月  19 00:07 preposition.dic
-rw-r--r-- 1 root root    1824 2月  19 00:07 quantifier.dic
-rw-r--r-- 1 root root   41628 4月   8 11:51 sensitive_word.dic
-rw-r--r-- 1 root root     164 2月  19 00:07 stopword.dic
-rw-r--r-- 1 root root     192 2月  19 00:07 suffix.dic
-rw-r--r-- 1 root root     752 2月  19 00:07 surname.dic

3、修改IKAnalyzer.cfg.xml文件，去掉扩展字典的注释，并赋值为上面上传的字典名称，如下示例：


        IK Analyzer 扩展配置
        
        sensitive_word.dic

4、重启es

第三次方案优化

1、主要对第二次优化方案的缺点进行改进，通过查找文档发现使用IK分词器的远程字典，可以达到热更新的效果

测试结果

1、分词结果已经达到预期
2、敏感词如果有更新，直接修改数据库的数据，然后通过调度器同步至ES即可
3、如果在生产过程中，ES崩溃重启，需要手动执行一次调度器同步数据至ES

过程要点

1、新增一个数据接口，数据接口返回为查询es上的敏感词，这里的坑是es的热更新请求是两次，第一次请求，检验响应的Header中的Last-Modified 和eTag是否有变化，有变化，再次请求，并且重新加载敏感词（ES的热更新监听是每分钟请求一次）

	@GetMapping("/getSensitiveWords")
    public void loadDic(HttpServletRequest request, HttpServletResponse response) {
        log.debug("================检查敏感词是否更新=================");
        Object object = RedisUtil.get(CacheConst.SENSITIVE_WORD_IS_UPDATED);
        String content = "";
        //ES进行两次请求，第一次校验Last-Modified 和eTag,如果这两个有变化，就会进行第二次请求，第二次请求时，才会把内容写入
        SensitiveWordResponseVO vo;
        if (ToolUtil.isNotEmpty(object)) {
            vo = (SensitiveWordResponseVO) object;
            log.info("【检查敏感词是否更新】，当前vo={}", JsonUtil.toJson(vo));
            if (vo.getUpdateTime() == 2) {
                log.debug("【检查敏感词是否更新】vo.getUpdateTime=1");
            }
            if (vo.getUpdateTime() == 1) {
                log.debug("【检查敏感词是否更新】vo.getUpdateTime=1");
                content = updateWords(content);
            } else {
                log.debug("【检查敏感词是否更新】vo.getUpdateTime={}", vo.getUpdateTime());
            }
        } else {
            vo = new SensitiveWordResponseVO();
            log.debug("【检查敏感词是否更新】通过redis未查找到对应vo");
            content = updateWords(content);
            vo.setUpdateTime(2);
            long now = System.currentTimeMillis();
            vo.setETag(String.valueOf(now));
            vo.setLastModified(String.valueOf(now));
            log.debug("【检查敏感词是否更新】更新redis完成，vo={}", vo);
        }
        OutputStream out = null;
        try {
            log.debug("【检查敏感词是否更新】执行response");
            out = response.getOutputStream();
            response.setHeader("Last-Modified", vo.getLastModified());
            response.setHeader("ETag", vo.getETag());
            response.setContentType("text/plain; charset=utf-8");
            out.write(content.getBytes("utf-8"));
            out.flush();
        } catch (IOException e) {
            log.error("【检查敏感词是否更新】catch IOException={}", e);
        } finally {
            vo.setUpdateTime(vo.getUpdateTime() - 1);
            if (vo.getUpdateTime() >= 0) {
                RedisUtil.set(CacheConst.SENSITIVE_WORD_IS_UPDATED, vo, CacheConst.TTL_YEAR);
            }
            log.debug("【检查敏感词是否更新】执行response finally vo={}", vo);
            if (null != out) {
                try {
                    out.close();
                } catch (IOException e) {
                    log.error("【检查敏感词是否更新】catch IOException={}", e);
                }
            }
        }
    }

    private String updateWords(String content) {
        list =;//查询es数据
        if (CollectionUtil.isNotEmpty(list)) {
            List words = list.stream().map(XXX::getWord).distinct().collect(Collectors.toList());
            content = StrUtil.join("\n", words);
        }
        return content;
    }

2、调度器更新同步数据库数据至ES方法：

	@Override
    public void fetchFromMysql() {
        log.info("从数据库同步敏感词至ES");
        List list = this.baseMapper.listDocument();
        if (CollectionUtil.isNotEmpty(list)) {
            log.info("从数据库中查询到的敏感词总大小list.size={}", list.size());
            repository.deleteAll();
            repository.saveAll(list);
            SensitiveWordResponseVO vo = new SensitiveWordResponseVO();
            vo.setUpdateTime(2);
            long now = System.currentTimeMillis();
            vo.setETag(String.valueOf(now));
            vo.setLastModified(String.valueOf(now));
            log.info("es同步完成，更新redis");
            RedisUtil.set(CacheConst.SENSITIVE_WORD_IS_UPDATED, vo, CacheConst.TTL_YEAR);
            log.info("更新redis完成，vo={}", vo);
        }
        log.info("敏感词同步结束");
    }

3、修改IKAnalyzer.cfg.xml文件，去掉远程扩展字典的注释，并赋值上面的接口请求路径，其中的ip:port可以为域名，如下示例：


        IK Analyzer 扩展配置
        
        
         
        
        
        http://ip:port/xxx/xxx/xxx/getSensitiveWords

总结

1、基本实现需求，过滤效果达到预期，并且速度也比较理想，稳定在100ms以内，最快12ms，并且主要时间消耗是在es的连接上（开发环境的ES）
2、加深了对es的使用
附上测试结果

04-09 17:08:48.148 INFO  [xxxx.aop.ControllerLog] - id=750252485 =========开始请求:xxxxController.testSensitiveWord()，参数:word=东风汽车集团fuck傻逼有限公司（英文名为Dongfeng Motor Corporation）是由国家单独出资、依法设立的有限责任公司，由中华人民共和国国务院国有资产监督管理委员会作为履行出资人义务的机构，根据法律、行政法规以及国务院的授权，代表国务院对公司依法履行出资人职责。 [1]  东风汽车公司是中国四大汽车集团之一，中国品牌500强，总部位于华中地区最大城市武汉，其前身是1969年始建于湖北十堰的“第二汽车制造厂”，经过五十年的建设，已陆续建成了十堰（主要以中、重型商用车 [2] 、零部件、汽车装备事业为主）、襄阳（以轻型商用车、乘用车为主）、武汉（以乘用车为主）、广州（以乘用车为主）四大基地。除此之外，还在上海、广西柳州、江苏盐城、四川南充、河南郑州、新疆、辽宁朝阳、浙江杭州、云南昆明等地设有分支企业。 [3]  2017年11月4日，国家工商行政管理总局公告，原东又粗又硬的肉棒风汽车公司名称变更为东风汽车集团有限公司。2017年11月14日，原东风汽车公司完成工商变更登记。 [4] 2018年《财富》世界500强排行榜第65名。 [5] 2019中国制造业企业500强排名第4位。 [6] 2019年10月16日，中国机械500强企业名单发布，东风位居第二。 [7] “一带一路”中国企业100强榜单排名第33位毛公安局,type=1,
04-09 17:08:48.149 DEBUG [c.x.s.e.s.impl.XySensitiveWordDocumentServiceImpl] - 开始敏感词过滤,原文=东风汽车集团fuck傻逼有限公司（英文名为Dongfeng Motor Corporation）是由国家单独出资、依法设立的有限责任公司，由中华人民共和国国务院国有资产监督管理委员会作为履行出资人义务的机构，根据法律、行政法规以及国务院的授权，代表国务院对公司依法履行出资人职责。 [1]  东风汽车公司是中国四大汽车集团之一，中国品牌500强，总部位于华中地区最大城市武汉，其前身是1969年始建于湖北十堰的“第二汽车制造厂”，经过五十年的建设，已陆续建成了十堰（主要以中、重型商用车 [2] 、零部件、汽车装备事业为主）、襄阳（以轻型商用车、乘用车为主）、武汉（以乘用车为主）、广州（以乘用车为主）四大基地。除此之外，还在上海、广西柳州、江苏盐城、四川南充、河南郑州、新疆、辽宁朝阳、浙江杭州、云南昆明等地设有分支企业。 [3]  2017年11月4日，国家工商行政管理总局公告，原东又粗又硬的肉棒风汽车公司名称变更为东风汽车集团有限公司。2017年11月14日，原东风汽车公司完成工商变更登记。 [4] 2018年《财富》世界500强排行榜第65名。 [5] 2019中国制造业企业500强排名第4位。 [6] 2019年10月16日，中国机械500强企业名单发布，东风位居第二。 [7] “一带一路”中国企业100强榜单排名第33位毛公安局
04-09 17:08:48.190 DEBUG [c.x.s.e.s.impl.XySensitiveWordDocumentServiceImpl] - 结束敏感词过滤，共发现敏感词3个，消耗时长=40 ms
04-09 17:08:48.190 INFO  [xxxx.aop.ControllerLog] - id=750252485 =========结束请求:CommonController.testSensitiveWord()，耗时:42 ms

工作记录 2017-01-20 月巴月巴白勺合鸟月半医疗行业开发技术分享 Microsoft Visual Studio开发技术分享健康医疗 C#
工作记录2017-01-20序号工作相关人员1修改从AmazingChart导出的数据的程序。处理AmazingChart的数据的导入，预计下周一可以提交。修改EDI837的生成。更新RD服务器。郝更新的问题1、更新了DataExport。1.1增加了BillingJobInfo\ProblemList、PatVisit\ProviderInfo\ProviderList、PatMas\Probl
【工作记录】python使用总结星光不负赶路人！ python
1.os库2.xlwt库3.xlrd库4.BeautifulSoup库5.panda库6.json库7.re正则8.ddddocr登录网站的时候，经常输入用户名和密码后会遇到验证码，ddddocr是一款强大的通用开源ocr识别库，具有高效、准确、易用的特点，广泛应用于图像处理和文字识别任务。importddddocrtry:login_page.wait_for_timeout(2000)#等待2
大三实习工作实录2025/3/6于济南ldsk 木子不设闹钟前端框架 devops 职场和发展程序人生
工作记录2025/3/6于ldsk今天完成了之前的新闻小程序.手机无法连接内网,故测试小程序无法显示图片(图片的src是内网http)如下图.今天才知道,网线才是连接内网的通路,下还是访问不了http前缀下的资源.IT公司开发,部署,构建,测试,上线有专门的工作流网站,我们公司的网站如下图可以看到上面有很多节点,前几个节点开发者有权限进行(唤醒(echo),构建(build),部署开发(Deplo
利用 AI 高效生成思维导图的简单实用方法 love530love 人工智能信息可视化
#工作记录适用于不支持直接生成思维导图的AI工具；适用于AI生成后不能再次编辑的思维导图。在日常的学习、工作以及知识整理过程中，思维导图是一种非常实用的工具，能够帮助我们清晰地梳理思路、归纳要点。而借助AI的强大能力，我们可以更加便捷地生成思维导图，下面就为大家详细介绍具体的操作方法。一、根据不同情况利用AI生成思维导图内容（一）给出主题让AI生成内容当我们有了一个想要梳理的主题，比如“Pytho
DeepSeek 作为一款智能工具，可以通过多种方式提升工作效率阿州_ 人工智能目标检测深度学习集成学习
以下是结合不同工作场景的具体应用建议，帮助您快速上手：一、效率提速场景自动化文档处理会议纪要：输入录音文字版，指令示例「提取会议决策点，按[时间、责任人、交付物]表格整理」合同审核：上传合同文本，指令「检查条款风险点，重点标注付款条款和违约责任」日报生成：输入工作记录，指令「将以下内容转为结构化日报：项目进展（70%）、问题阻塞、明日计划」数据智能分析销售报告：上传CSV数据，指令「分析Q3华北区
使用ndoe实现自动化完成增删改查接口光头程序员自动化运维
使用ndoe实现自动化完成增删改查接口最近工作内容比较繁琐，手里需要开发的项目需求比较多，常常在多个项目之间来回切换，有时候某些分支都不知道自己开发了什么、做了哪些需求，使用手写笔记的方式去记录分支到头来也是眼花缭乱，作为前端工作3年的弟弟想着为啥不能自己直接将这些数据存在数据库里，实现一个增删改查的日常工作记录管理呢？说干就开始搞！！！1、首先我们先安装mysql数据库1.1、这个就直接搜一个教
时间看得见（第65天/3650天）瓜小西呀
【第65天/3650天】时间管理：2819.04.17和玉多把钥匙拿到手了，玉多说终于可以睡个踏实的觉啦！工作记录住的地方要搬了，公司也要搬了。内心竟然毫无波澜？坚持！！！记住尚龙老师的那篇文章！生活记录养生：三杯白开水，一盒牛奶，泡脚15min。朋友和家人：在地铁上接到小叔的视频，所以聊了几句就挂啦。又是和朋友聊了很多话的一天。和拢龙，小李子阿紫聊了很多，小李子一直鼓励我坚持下去，她说坚持下去一
Spring Boot实现发QQ邮件 Deh0rs Java Spring Boot实战 spring boot 后端 java spring 服务器开发语言
博客主页:南来_北往系列专栏：SpringBoot实战引言尽管电子邮件已不再是主流的沟通方式，但在职场中仍有不少人偏好使用邮件进行交流。这不仅仅是为了通信，更重要的是作为一种正式的工作记录，确保客户对自己曾经提出的要求和需求负责。实战1、第一步添加依赖：org.springframework.bootspring-boot-starter-mail2、第二进行yml配置：spring:mail:#
工作记录：vue3配置proxy代理服务器醇醇大魔王 vue3 vue.js 前端 javascript
修改vie.config.ts下边的server//https://vitejs.dev/config/exportdefaultdefineConfig({plugins:[vue()],resolve:{alias:{"@":resolve(__dirname,"./src")}},server:{host:"0.0.0.0",//"0.0.0.0"network和loaclhost地址都会显
（临床资料整理归纳）中原焦点团队杨小杰坚持分享第340天2021-7-25第六期约练挑战第3周第3次共9次 yxjlady
临床资料整理归纳包括：一、一般资料1求助者的人口学资料2求助者生活状态3婚姻家庭4工作记录5社会交往6娱乐活动7自我描述8求助者个人内在世界的重要特点二、个人成长史资料1婴幼儿期2童年生活3少年期生活4青年期5个人成长中的重大转化，以及现在对他的评价三、求助者目前精神、身体和社会工作与社会交往状态1精神状态2身体状态3社会工作与社会交往
NO.194 每日复盘211107 石头爱写字
身体锻炼1.每日步数11000步。完成11200步。2.晨间锻炼，腹部锻炼第141天，趁早腹肌撕裂练习第57天。3.晚间锻炼，有氧锻炼15分钟。4.睡前冥想，5分钟。今日饮食1.早餐，玉米半根，燕麦片50g，牛奶250ml，鸡蛋一个。2.午餐，食堂用餐，快餐一份。3.晚餐，在家用餐，西红柿鸡蛋汤，蒸鲈鱼，西兰花，胡萝卜炒肉。工作记录1.继续恒利施工图，设计说明工程做法整理。2.梳理大秦展览馆方案，
工作记录（二十二）——专员 myth神话
售楼处的工作区域分两部分，售楼处大门以里的场地称为内业，大门以外的地方叫做外场。从事内业的工作者多是年轻漂亮的男女青年，保洁除外。在外场做宣传工作的多是岁数大一些的人，这一部分人叫渠道专员，我就是一名渠道专员。有了这个称谓后，我才明白专员的意思就是专业人员。专员一词我最初听说是在影视剧中，战争片中常有某某专员去部队指导工作，军官和士兵都敬佩有加。当时我不懂的是什么官职，以为是什么特别的官职。当我们
2023-10-09跑神张小雨_ff26
距离上一篇工作内容时隔28天，就好像跑了一个四周的神。一个月休了两次假。但是看工作记录，项目的各项安排是满满当当的。最近的需求对接和招投标相关工作多些，这是又往商务的墙头上跨了一步。今年还有大约80天，好像又是没做出什么成绩。年底汇报的PPT，要开始做起来了。如果中级经济师能考过，就也算是今年有点成绩。从今天开始刷题，也是来得及的。学习视频也有。如果要学写专业文章，到底是从哪里找位老师比较合适？先
【SOC】DMA时钟使用限制 Lambor_Ma SoC fpga开发单片机嵌入式硬件 SoC
#工作记录#先给出结论：在使用异步的时候DMA的配置时钟不要快于dma_core_clk。当使用DMA的时候，寄存器配置使用的是AHB接口，会使用config配置时钟频率。DMA内部还有一个dma_core_clk提供给core使用。DMA针对配置时钟和core时钟有两种工作模式，一种是异步，一种是同步。当使用同步的时候，不需要将AHB的信号同步到core时钟域。但是使用异步的时候，针对写寄存器的
工作记录（二）——上岗 myth神话
工作的第二天早上，领导布置完任务，我们就各自上岗，从此我就有了一个职称——渠道专员，任务是在规定的另一个售楼处门口，看到去买房子的人从里面出来，就把这个人喊到我们售楼处看房子再确定买不买。我和梁美分在一个岗位，领完物料以后，我们就上岗了。我和梁美来到另一家售楼处门口，先在要发给路人的广告单页上填写自己的电话号码，之后便是等待购房者，这种等待我感觉是守株待兔。梁美比我大一岁，脸上的皱纹也不多，皮肤挺
git分支选择错误进行操作后如何调整？ hutaotaotao git git
目录情况说明调整过程（1）回退版本且保存工作记录（2）在正确的分支上更新修改（3）将master版本回退情况说明代码的修改应当自己创建一个分支进行操作，但如果错误地在master分支上进行了修改，且commit了几次，以及push到了远程master分支，现在该如何将将所做的修改记录转移到正确的分支上，以及master版本回退，如何操作？当前本地分支在master，以下给出操作流程，仅供参考，不同
springboot/ssm工作量统计系统Java工作记录可视化管理系统web kirito学长-Java java spring boot 后端
springboot/ssm工作量统计系统Java工作记录可视化管理系统web基于springboot(可改ssm)+vue项目开发语言：Java框架：springboot/可改ssm+vueJDK版本：JDK1.8（或11）服务器：tomcat数据库：mysql5.7（或8.0）数据库工具：Navicat/sqlyog开发软件：eclipse//idea依赖管理包：Maven如需了解更多代码细节
【工作记录】AQS学习笔记泽济天下工作记录 java基础学习笔记 java AQS
简介在Java中，AbstractQueuedSynchronizer（AQS）是Java并发包(java.util.concurrent.locks)中一个用于构建锁和同步器框架的基础类。提供了一种实现阻塞锁和其他同步组件的底层机制。基本原理概述它的核心原理包括以下关键点：状态管理：AQS通过一个volatile类型的整型变量state来表示同步状态。比如在独占锁（如ReentrantLock）
【1226复盘翻盘】第70天唯其时物
第一：工作记录：科室主任外出办事。反思：001.当没站在一个科室管理者的角度考虑问题时，就会看到之前很多没想过的问题。002.科室管理首要的是安全，其次经济，做好自己应该做的事。003.各行各业到年底都比较忙，我们一定能行。行动：努力努力努力，主动主动主动。第二：读书使人进步记录：这几天看书明显少了。反思：001.为什么读书少？还是自我放松太多，还需要继续努力。002.读书的重点是思考和践行。行动
如何写好工作总结蜜糖771
一份好的工作总结，能够有效提升你的职场影响力。从你的总结报告中，上级既能看到你的成绩，又能看到你的思考力和进取心。这也决定了你是否可以成功在老板心中留下好印象，为升职加薪铺路。同时，好的总结对同事也有帮助，久而久之同事会更信任你，也更愿意在你需要的时候帮助你。如何写好工作总结短期工作总结：1、KPT模板工作内容——遇到的问题——自己的想法。适用于日常简单的工作记录，突出了回顾反思和未来应对。2、分
【工作记录】我为什么喜欢精神分析？平凡之路_XQ
综述《人格心理学》课程是我本学期所教的一门公选课，由于本科目是本校的第一次开课课程，同时也是我本学习认真钻研和摸索的课程，其中第三章《精神分析流派》是我最喜欢的部分，在此分享，借此管窥本课程教学方法和逻辑的合理性，发现不足之处，望批评指正。一、教材介绍《第二章：精神分析流派》处于中国轻工业出版社出版的《人格心理学》教材（第八版）的第三章，在第一章中的学习中，学生已经对人格的定义、特征以及人格心理学
【工作记录】基于docker+mysql部署单机版nacos2.0.4@20240219 泽济天下 docker mysql 容器 nacos
Nacos介绍Nacos是阿里巴巴开源的一款集服务发现、配置管理和服务元数据管理于一身的中间件，主要用于构建云原生应用和微服务架构。Nacos提供了一站式的解决方案，使得开发者能够更容易地实现服务治理和服务间的协作。以下是Nacos主要功能特点：服务发现：支持基于DNS或HTTP协议的服务注册与发现，能够实时更新服务实例的状态信息，帮助服务消费者快速找到可用的服务提供者。适用于多种主流框架和服务类
【工作记录】基于wait-for.sh控制docker-compose中服务启动顺序的一次实践@20240219 泽济天下 docker 容器运维
背景这个问题其实由来已久，尤其是在微服务部署过程中体现的尤为明显，就是服务的启动顺序问题。一个很常见的场景就是微服务启动过程中，应用服务会依赖于配置中心、注册中心、数据库、redis等基础服务，所以这些基础服务应当优先于应用服务启动。还有就是在服务器重启时由于容器设置了自动重启，如果不控制启动顺序的话就就会导致有些服务去读取配置中心配置时，由于配置中心尚未完全启动成功导致应用服务启动中断或者失败。
宇宙公民高效阅读之超级学习力（一）小媚娘
超级学习力的分享者是“来福老师”，我很喜欢她的声音，加上她那迷人的大脑，超强的执行力，立马变成来福老师的迷妹。来福老师分享说，关于个人天赋就分为能力天赋与意愿天赋。能力天赋是天生的，比如你游泳天生做得比其他事情好；意愿天赋是后天形成的，比如对某件事的认知程度、努力程度，如何选择等。那如何去找到自己的天赋呢？有两个方法：一是常做复盘，比如写日记、周记、工作记录等，二是问人和反思，向别人询问，从另一些
一花一世界——听黄耀红教授案例写作专题讲座 eggplant
(2022年12月26日星期一）曾经听了黄耀红博士进行案例写作的一个专题指导。讲座有这样几个启发。1.整个讲座清晰，案例的意义和价值，写什么，怎么写，线索思路很清楚。2.能够从溯源理解案例的价值，从哲学的层面开始说到教学的价值，很喜欢从哲学层面去分析案例的价值，四个观点印象深刻，解读非常的朴实浅白，个别与一般、具体与抽象、表现与存在、举一反三。这几个观点我进一步的认识到自己在日常的教学随笔工作记录
熊猫小课-职场写作成长营-第8课：写好工作总结，提升职场影响 klggg
一年时间也好快，在1月1号加入的007很快到年底，虽然都是以记学习笔记为主，写作上的技巧，能力并没提升多少，不管怎样也算坚持下来了，在有时写些文章，点评时也没感觉那么吃力了，想要提升还是得系统的学习，练习。熊猫小课的质量不错，这个课程看了好多遍，可以用到日常工作中，以下是课程内容小结。我们为什么要做工作总结KPT工作记录法Keep工作内容当前你正在做的事情Problem问题你遇到的问题Try想法你
学习工作记录【第451天】20190528 践行者周进
学习工作记录【第451天】20190528六项精进499期学院（努力一组）===================================周计划评分:【4】+【5】+【】+【】+【】+【】+【】=【】早睡:【1】（标准：11点）（每天1分）早起:【1】（标准：5点半）（每天1分）跑步:已完成【3】/（标准：30公里）（每3公里1分）养身运动:【1】（八段锦、金锋抖肘、太极、瑜伽等）（每天1-
今日运动与重点工作记录2022-01-25 人生的磨刀石
今日运动记录一、跳绳500次。单次最多140个。二、划船机。两组。每组40个。三、常规步行。今日阅读1.找到熊逸先生的书，读了几部分，深受启发。2.开主题出版工作会议。3.制定2022年专题策划工作安排会议。确定发展方向。4.组织启动撰稿工作。写于2022-01-25
【React工作记录七十八】React+hook+ts+ant design封装一个table的组件前端大歌谣前端总结前端项目工作实战 react.js 前端 javascript
前言我是歌谣我有个兄弟巅峰的时候排名c站总榜19叫前端小歌谣曾经我花了三年的时间创作了他现在我要用五年的时间超越他今天又是接近兄弟的一天人生难免坎坷大不了从头再来歌谣的意志是永恒的放弃很容易但是坚持一定很酷微信公众号前端小歌谣需求分析在前端项目中最常见的就是封装一个table的一个功能功能思维初始化版本（基础样式和分页）{...resetProps}onChange={onTableChange}
工作记录-适应性 DiscoveryT
这篇文章前几天就要写的，拖拖拉拉到了今天。今晚张把崽也送回去了，这下好了，突然闲下来，一个人睡觉，我还真不习惯呢？有了七七之后，一直是带着七七一起睡，后来七七白天放家里带，就带着六哥一起睡，张睡另一张床。看来当妈之后果然是忘记之前单身的日子怎么过的了……前几天一个从我们学校调走的同事给我打了电话，她家在长沙，孩子老公都在长沙。所以，去年下半年她调去了附近的一所乡镇中学，因为她想双休。在这里时，她连
Nginx负载均衡 510888780 nginx 应用服务器
Nginx负载均衡一些基础知识: nginx 的 upstream目前支持 4 种方式的分配 1)、轮询（默认）每个请求按时间顺序逐一分配到不同的后端服务器，如果后端服务器down掉，能自动剔除。 2)、weight 指定轮询几率，weight和访问比率成正比
RedHat 6.4 安装 rabbitmq bylijinnan erlang rabbitmq redhat
在 linux 下安装软件就是折腾，首先是测试机不能上外网要找运维开通，开通后发现测试机的 yum 不能使用于是又要配置 yum 源，最后安装 rabbitmq 时也尝试了两种方法最后才安装成功机器版本： [root@redhat1 rabbitmq]# lsb_release LSB Version: :base-4.0-amd64:base-4.0-noarch:core
FilenameUtils工具类 eksliang FilenameUtils common-io
转载请出自出处：http://eksliang.iteye.com/blog/2217081 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
xml文件解析SAX 不懂事的小屁孩 xml
xml文件解析:xml文件解析有四种方式， 1.DOM生成和解析XML文档(SAX是基于事件流的解析) 2.SAX生成和解析XML文档(基于XML文档树结构的解析) 3.DOM4J生成和解析XML文档 4.JDOM生成和解析XML 本文章用第一种方法进行解析，使用android常用的DefaultHandler import org.xml.sax.Attributes;
通过定时任务执行mysql的定期删除和新建分区，此处是按日分区酷的飞上天空 mysql
使用python脚本作为命令脚本，linux的定时任务来每天定时执行 #!/usr/bin/python # -*- coding: utf8 -*- import pymysql import datetime import calendar #要分区的表 table_name = 'my_table' #连接数据库的信息 host,user,passwd,db =
如何搭建数据湖架构？听听专家的意见蓝儿唯美架构
Edo Interactive在几年前遇到一个大问题：公司使用交易数据来帮助零售商和餐馆进行个性化促销，但其数据仓库没有足够时间去处理所有的信用卡和借记卡交易数据 “我们要花费27小时来处理每日的数据量，”Edo主管基础设施和信息系统的高级副总裁Tim Garnto说道：“所以在2013年，我们放弃了现有的基于PostgreSQL的关系型数据库系统，使用了Hadoop集群作为公司的数
spring学习——控制反转与依赖注入 a-john spring
控制反转（Inversion of Control，英文缩写为IoC）是一个重要的面向对象编程的法则来削减计算机程序的耦合问题，也是轻量级的Spring框架的核心。控制反转一般分为两种类型，依赖注入（Dependency Injection，简称DI）和依赖查找（Dependency Lookup）。依赖注入应用比较广泛。
用spool+unixshell生成文本文件的方法 aijuans xshell
例如我们把scott.dept表生成文本文件的语句写成dept.sql,内容如下: 　　set pages 50000; 　　set lines 200; 　　set trims on; 　　set heading off; 　　spool /oracle_backup/log/test/dept.lst; 　　select deptno||','||dname||','||loc
1、基础--名词解析(OOA/OOD/OOP) asia007 学习基础知识
OOA:Object-Oriented Analysis（面向对象分析方法）是在一个系统的开发过程中进行了系统业务调查以后，按照面向对象的思想来分析问题。OOA与结构化分析有较大的区别。OOA所强调的是在系统调查资料的基础上，针对OO方法所需要的素材进行的归类分析和整理，而不是对管理业务现状和方法的分析。　　OOA（面向对象的分析）模型由5个层次（主题层、对象类层、结构层、属性层和服务层）
浅谈java转成json编码格式技术百合不是茶 json编码 java转成json编码
json编码;是一个轻量级的数据存储和传输的语言在java中需要引入json相关的包,引包方式在工程的lib下就可以了 JSON与JAVA数据的转换（JSON 即 JavaScript Object Natation，它是一种轻量级的数据交换格式，非常适合于服务器与 JavaScript 之间的数据的交
web.xml之Spring配置(基于Spring+Struts+Ibatis) bijian1013 java web.xml SSI spring配置
指定Spring配置文件位置 <context-param> <param-name>contextConfigLocation</param-name> <param-value> /WEB-INF/spring-dao-bean.xml,/WEB-INF/spring-resources.xml, /WEB-INF/
Installing SonarQube（Fail to download libraries from server） sunjing Install Sonar
1. Download and unzip the SonarQube distribution 2. Starting the Web Server The default port is "9000" and the context path is "/". These values can be changed in &l
【MongoDB学习笔记十一】Mongo副本集基本的增删查 bit1129 mongodb
一、创建复本集假设mongod,mongo已经配置在系统路径变量上，启动三个命令行窗口，分别执行如下命令： mongod --port 27017 --dbpath data1 --replSet rs0 mongod --port 27018 --dbpath data2 --replSet rs0 mongod --port 27019 -
Anychart图表系列二之执行Flash和HTML5渲染白糖_ Flash
今天介绍Anychart的Flash和HTML5渲染功能 HTML5 Anychart从6.0第一个版本起，已经逐渐开始支持各种图的HTML5渲染效果了，也就是说即使你没有安装Flash插件，只要浏览器支持HTML5，也能看到Anychart的图形（不过这些是需要做一些配置的）。这里要提醒下大家，Anychart6.0版本对HTML5的支持还不算很成熟，目前还处于
Laravel版本更新异常4.2.8-> 4.2.9 Declaration of ... CompilerEngine ... should be compa bozch laravel
昨天在为了把laravel升级到最新的版本，突然之间就出现了如下错误： ErrorException thrown with message "Declaration of Illuminate\View\Engines\CompilerEngine::handleViewException() should be compatible with Illuminate\View\Eng
编程之美-NIM游戏分析-石头总数为奇数时如何保证先动手者必胜 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class Nim { /**编程之美 NIM游戏分析问题：有N块石头和两个玩家A和B，玩家A先将石头随机分成若干堆，然后按照BABA...的顺序不断轮流取石头，能将剩下的石头一次取光的玩家获胜，每次取石头时，每个玩家只能从若干堆石头中任选一堆，
lunce创建索引及简单查询 chengxuyuancsdn 查询创建索引 lunce
import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Docume
[IT与投资]坚持独立自主的研究核心技术 comsci it
和别人合作开发某项产品....如果互相之间的技术水平不同,那么这种合作很难进行,一般都会成为强者控制弱者的方法和手段..... 所以弱者,在遇到技术难题的时候,最好不要一开始就去寻求强者的帮助,因为在我们这颗星球上,生物都有一种控制其
flashback transaction闪回事务查询 daizj oracle sql 闪回事务
闪回事务查询有别于闪回查询的特点有以下3个：（1）其正常工作不但需要利用撤销数据，还需要事先启用最小补充日志。（2）返回的结果不是以前的“旧”数据，而是能够将当前数据修改为以前的样子的撤销SQL（Undo SQL）语句。（3）集中地在名为flashback_transaction_query表上查询，而不是在各个表上通过“as of”或“vers
Java I/O之FilenameFilter类列举出指定路径下某个扩展名的文件游其是你 FilenameFilter
这是一个FilenameFilter类用法的例子，实现的列举出“c:\\folder“路径下所有以“.jpg”扩展名的文件。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
C语言学习五函数，函数的前置声明以及如何在软件开发中合理的设计函数来解决实际问题 dcj3sjt126com c
# include <stdio.h> int f(void) //括号中的void表示该函数不能接受数据，int表示返回的类型为int类型 { return 10; //向主调函数返回10 } void g(void) //函数名前面的void表示该函数没有返回值 { //return 10; //error 与第8行行首的void相矛盾 } in
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Pl dcj3sjt126com centos
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again 处理很简单，修改文件“/etc/yum.repos.d/epel.repo”，将baseurl的注释取消， mirrorlist注释掉。即可。 &n
单例模式 shuizhaosi888 单例模式
单例模式懒汉式 public class RunMain { /** * 私有构造 */ private RunMain() { } /** * 内部类，用于占位，只有 */ private static class SingletonRunMain { priv
Spring Security（09）——Filter 234390216 Spring Security
Filter 目录 1.1 Filter顺序 1.2 添加Filter到FilterChain 1.3 DelegatingFilterProxy 1.4 FilterChainProxy 1.5
公司项目NODEJS实践0.1 逐行分析JS源代码 mongodb nginx ubuntu nodejs
一、前言前端如何独立用nodeJs实现一个简单的注册、登录功能，是不是只用nodejs+sql就可以了？其实是可以实现，但离实际应用还有距离，那要怎么做才是实际可用的。网上有很多nod
java.lang.Math liuhaibo_ljf java Math lang
System.out.println(Math.PI); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1)); System.out.println(Math.abs(111111111)); System.out.println(Mat
linux下时间同步 nonobaba ntp
今天在linux下做hbase集群的时候，发现hmaster启动成功了，但是用hbase命令进入shell的时候报了一个错误 PleaseHoldException: Master is initializing，查看了日志，大致意思是说master和slave时间不同步，没办法，只好找一种手动同步一下，后来发现一共部署了10来台机器，手动同步偏差又比较大，所以还是从网上找现成的解决方
ZooKeeper3.4.6的集群部署 roadrunners zookeeper 集群部署
ZooKeeper是Apache的一个开源项目，在分布式服务中应用比较广泛。它主要用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步、集群管理、配置文件管理、同步锁、队列等。这里主要讲集群中ZooKeeper的部署。 1、准备工作我们准备3台机器做ZooKeeper集群，分别在3台机器上创建ZooKeeper需要的目录。数据存储目录
Java高效读取大文件 tomcat_oracle java
　　读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法：　　Files.readLines(new File(path), Charsets.UTF_8); 　　FileUtils.readLines(new File(path)); 　　这种方法带来的问题是文件的所有行都被存放在内存中，当文件足够大时很快就会导致
微信支付api返回的xml转换为Map的方法 xu3508620 xml map 微信api
举例如下： <xml> <return_code><![CDATA[SUCCESS]]></return_code> <return_msg><![CDATA[OK]]></return_msg> <appid><

使用IK中文分词器做敏感词过滤

需求

前置条件

设计要求

实现过程

第一次方案设计

测试结果：

过程要点

第二次方案优化

测试结果

过程要点

第三次方案优化

测试结果

过程要点

总结

你可能感兴趣的:(工作记录)