小白说(๑• . •๑)

ES6.8.6 为索引映射(Mapping)创建自定义分词器，测试分词匹配效果

文章目录

- 环境
- 创建索引：配置自定义分词器、字段指定分词器
- - 自定义分词器参数说明
  - 创建索引：`custom_analyzer_comment`
- 使用索引中自定义的分词器进行分词分析
- - 自定义分词器`my_custom_analyzer`分词测试：
  - - 测试中文停用词、英文字母转小写
    - 测试敏感词替换：根据分词字符过滤配置替换敏感词
  - 自定义分词器`my_custom_analyzer_enstop`分词测试
- 附录
- - 在创建索引时出现的异常
  - - illegal_state_exception --> only value lists are allowed in serialized settings
- 参考链接

参考官网文档：
【 ES创建自定义词语分析器（自定义分析器接收参数，demo示例）】
【 ES创建索引时Mapping映射配置analyzer参数（为字段配置不同的分析器，demo示例）】

环境

elasticsearch6.8.6版本：已安装ik分词器、icu分词器、pinyin分词器（分词器版本要和es版本一致）
postman测试工具
视图工具elasticsearch-head（https://github.com/mobz/elasticsearch-head）

注！
以下postman截图中{{domain}}等于 http://127.0.0.1:9200

创建索引：配置自定义分词器、字段指定分词器

配置的分词器使用专业的中文分词器（IK分词器），配置分词模式为（ik_smart），配置字符过滤（char_filters）、过滤令牌（filter）。

自定义分词器参数说明

        【ES官网关于自定义分词器的参数说明】
        【ES官网关于定义分词器，type参数说明】
        【ES官网关于构建内置或者自定义分词器tokenizer参数说明】
        【ES官网关于char-filters字符过滤配置】

创建索引：`custom_analyzer_comment`

【ES官网，分词器API】

postman请求：

发送创建索引命令：参数有注释

# 创建索引：custom_analyzer_comment
PUT {{domain}}/custom_analyzer_comment


# 创建索引的参数：分词器配置、mapping字段映射配置
{
    "settings": {
        // 索引配置，配置分片
        "index": {
            "number_of_shards": "5",
            "number_of_replicas": "1"
        },
        // 分词器配置
        "analysis": {
            "analyzer": {
                // 把default的key替换为自定义分词器名称：(key)名称随意，但是该名称会被映射中字段配置为分词器
                "my_custom_analyzer": {
                    // 选项可缺省。类型设置为custom(自定义），或者缺省此配置
                    "type": "custom",
                    // 这是一个必填项。使用内置或者自定义的分词器，填写分词器名称。如：使用内置的simple分词器就填写simple；这里使用的是ik分词器，ik_smart
                    "tokenizer": "ik_smart",
                    // 类型数组。选择内置或者配置自定义配置-->字符过滤。如过滤一些中文敏感词
                    "char_filter": [
                        // 字符过滤器去除 HTML 元素（如）并解码 HTML 实体（如  & ）
                        "html_strip",
                        // 字符筛选器将指定字符串的任何匹配项替换为指定的替换项
                        // 同时也支持自定义名称，需要到与analyzer对象同级的char_filter做单独配置
                        // 敏感词过滤配置
                        "my_sensitive"
                    ],
                    // 类型数组。选择内置或者配置自定义配置--> 令牌筛选过滤
                    "filter": [
                        // 英文全部转为小写的令牌过滤标记，此项内置。
                        "lowercase",
                        // 配置一个自定义的中文停用词
                        "chinese_stop_word"
                    ],
                    // 配置编制索引时的间隙：缺省值100，详情看官网
                    "position_increment_gap": 100
                },
                // 配置第二个英文停用词分析器
                "my_custom_analyzer_enstop": {
                    // 自定义分词器
                    "type": "custom",
                    // 同样使用ik分词器
                    "tokenizer": "ik_smart",
                    "filter": [
                        "lowercase",
                        // 英文停用词过滤
                        "english_stop_sord"
                    ]
                }
            },
            // 把字符过滤放在和analyzer同级，为mapping类型字符映射做自定义配置
            "char_filter": {
                "my_sensitive": {
                    // 为analyzer.my_custom_analyzer.char_filter.my_sensitive做单独配置
                    "type": "mapping",
                    // 比如做敏感词替换
                    "mappings": [
                        "操 => *",
                        "我操 => **",
                        "草 => 艹"
                    ]
                }
            },
            // 令牌过滤放在和analyzer同级，为filter中chinese_stop_word做自定义配置
            "filter": {
                // 配置自定义的中文停用词
                // 这个名字是analyzer中定义的中文停用词配置
                "chinese_stop_word": {
                    "type": "stop",
                    "stopwords": [
                        "嗯",
                        "啊",
                        "这",
                        "是",
                        "哦",
                        "噢",
                        "那"
                    ]
                },
                "english_stop_sord": {
                    "type": "stop",
                    "stopwords": "_english_"
                }
            }
        }
    },
    // 配置字段映射关系、配置字段类型、配置字段指定分词器
    "mapping": {
        "_doc": {
            "properties": {
                // 评论ID
                "id": {
                    "type": "long"
                },
                // 用户网名
                "username": {
                    "type": "text",
                    // 以下三个分词器同时生效：新增字段索引时、字段查询时
                    // analyzer：将索引指向my_custom_analyzer分词器
                    "analyzer": "my_custom_analyzer",
                    // search_analyzer：指向my_custom_analyzer_enstop分词器
                    "search_analyzer": "my_custom_analyzer_enstop",
                    // 指向my_custom_analyzer分词器，并保证不从一个被引用的短语中删除停用词
                    // 如：被引号括起来的短语“This is a sanmao”这里面的停用词不会被删除
                    "search_quote_analyzer": "my_custom_analyzer"
                },
                // 评论内容
                "comment_content": {
                    "type": "text",
                    "analyzer": "my_custom_analyzer",
                    "search_analyzer": "my_custom_analyzer_enstop",
                    "search_quote_analyzer": "my_custom_analyzer"
                },
                // 评论创建时间
                "create_date": {
                    "type": "date"
                },
                // 评论展示状态：1 允许展示 0 评论被屏蔽
                "show_status": {
                    "type": "int"
                },
                // 评论是否删除 1 已删除、0未删除
                "deleted": {
                    "type": "int"
                }
            }
        }
    }
}

使用索引中自定义的分词器进行分词分析

自定义分词器my_custom_analyzer分词测试：

分词结果查询：
        【ES6.8.6 分词器安装&使用、查询分词结果（内置分词器、icu、ik、pinyin分词器）-CSDN博客】

        my_custom_analyzer分词器：使用了ik_smart粗粒度分词器，支持过滤html标签、支持替换敏感词（替换的敏感词见请求参数）、支持英文全转为小写、支持中文停用词（自定义中文停用词，停用词见请求参数）

测试中文停用词、英文字母转小写

postman请求：
请求命令：

GET /custom_analyzer_comment/_analyze 参数===> { "analyzer": "my_custom_analyzer", "text": "这，这，这，你？啥也不是。答：哦，那是什么？ | This is a SANMAO" } 预期结果===> "这"，被停用，在分词中被删除； "哦"，被停用，在分词中被删除； "那"，被停用，在分词中被删除；（实际与预期不符，"那是"被分词为短语，所以"那"没有被停用）

分词结果：
        根据filter->chinese_stop_word中配置的停用词，未被组成短语的，都被在分词中删除，英文字母也都被转为了小写，返回结果符合预期。但是根据返回结果看，不止配置的中文停用词，英文停用词也在分词结果中被删除。

{ "tokens": [ { "token": "你", "start_offset": 6, "end_offset": 7, "type": "CN_CHAR", "position": 3 }, { "token": "啥", "start_offset": 8, "end_offset": 9, "type": "CN_CHAR", "position": 4 }, { "token": "也", "start_offset": 9, "end_offset": 10, "type": "CN_CHAR", "position": 5 }, { "token": "不是", "start_offset": 10, "end_offset": 12, "type": "CN_WORD", "position": 6 }, { "token": "答", "start_offset": 13, "end_offset": 14, "type": "CN_CHAR", "position": 7 }, { "token": "那是", "start_offset": 17, "end_offset": 19, "type": "CN_WORD", "position": 9 }, { "token": "什么", "start_offset": 19, "end_offset": 21, "type": "CN_WORD", "position": 10 }, { "token": "sanmao", "start_offset": 35, "end_offset": 41, "type": "ENGLISH", "position": 11 } ] }

测试敏感词替换：根据分词字符过滤配置替换敏感词

postman请求：

请求命令：

GET /custom_analyzer_comment/_analyze 参数===> { "analyzer": "my_custom_analyzer", "text": "我草尼玛，你知道，你在说神马？操，我操，我草。这，真啥也不是！" } 预期结果===> "草"，被替换"艹"； "操"，被替换"*"；（实际不符合预期，直接被删除了） "我操"，被替换"**"；（实际不符合预期，直接被删除了） "我草"，被替换"我艹"；

分词结果：
        敏感词替换分词生效。但是替换的星号直接在分词结果中被删除。

{ "tokens": [ { "token": "我", "start_offset": 0, "end_offset": 1, "type": "CN_CHAR", "position": 0 }, { "token": "艹", "start_offset": 1, "end_offset": 2, "type": "CN_CHAR", "position": 1 }, { "token": "尼玛", "start_offset": 2, "end_offset": 4, "type": "CN_WORD", "position": 2 }, { "token": "你", "start_offset": 5, "end_offset": 6, "type": "CN_CHAR", "position": 3 }, { "token": "知道", "start_offset": 6, "end_offset": 8, "type": "CN_WORD", "position": 4 }, { "token": "你", "start_offset": 9, "end_offset": 10, "type": "CN_CHAR", "position": 5 }, { "token": "在说", "start_offset": 10, "end_offset": 12, "type": "CN_WORD", "position": 6 }, { "token": "神马", "start_offset": 12, "end_offset": 14, "type": "CN_WORD", "position": 7 }, { "token": "我", "start_offset": 20, "end_offset": 21, "type": "CN_CHAR", "position": 8 }, { "token": "艹", "start_offset": 21, "end_offset": 22, "type": "CN_CHAR", "position": 9 }, { "token": "真", "start_offset": 25, "end_offset": 26, "type": "CN_CHAR", "position": 11 }, { "token": "啥", "start_offset": 26, "end_offset": 27, "type": "CN_CHAR", "position": 12 }, { "token": "也", "start_offset": 27, "end_offset": 28, "type": "CN_CHAR", "position": 13 }, { "token": "不是", "start_offset": 28, "end_offset": 30, "type": "CN_WORD", "position": 14 } ] }

自定义分词器my_custom_analyzer_enstop分词测试

        my_custom_analyzer_enstop分词器：使用了ik_smart粗粒度分词器，支持英文全转为小写、支持英文停用词。
postman测试：综合测试，敏感词，中文停用词、大小写是否会如预期被分词器处理。

请求命令：

# 测试分词结果 GET /custom_analyzer_comment/_analyze # 参数 ==> { "analyzer": "my_custom_analyzer_enstop", "text": "我草尼玛，你知道，你在说神马？操，我操，我草。这，真啥也不是！| This is a SANMAO" }

分词结果：
        敏感词没有替换、中文停用词没有替换，符合预期分词；
        英文停用词删除、英文大小转小写，符合预期分词；

{ "tokens": [ { "token": "我", "start_offset": 0, "end_offset": 1, "type": "CN_CHAR", "position": 0 }, { "token": "草", "start_offset": 1, "end_offset": 2, "type": "CN_CHAR", "position": 1 }, { "token": "尼玛", "start_offset": 2, "end_offset": 4, "type": "CN_WORD", "position": 2 }, { "token": "你", "start_offset": 5, "end_offset": 6, "type": "CN_CHAR", "position": 3 }, { "token": "知道", "start_offset": 6, "end_offset": 8, "type": "CN_WORD", "position": 4 }, { "token": "你", "start_offset": 9, "end_offset": 10, "type": "CN_CHAR", "position": 5 }, { "token": "在说", "start_offset": 10, "end_offset": 12, "type": "CN_WORD", "position": 6 }, { "token": "神马", "start_offset": 12, "end_offset": 14, "type": "CN_WORD", "position": 7 }, { "token": "操", "start_offset": 15, "end_offset": 16, "type": "CN_CHAR", "position": 8 }, { "token": "我", "start_offset": 17, "end_offset": 18, "type": "CN_CHAR", "position": 9 }, { "token": "操", "start_offset": 18, "end_offset": 19, "type": "CN_CHAR", "position": 10 }, { "token": "我", "start_offset": 20, "end_offset": 21, "type": "CN_CHAR", "position": 11 }, { "token": "草", "start_offset": 21, "end_offset": 22, "type": "CN_CHAR", "position": 12 }, { "token": "这", "start_offset": 23, "end_offset": 24, "type": "CN_CHAR", "position": 13 }, { "token": "真", "start_offset": 25, "end_offset": 26, "type": "CN_CHAR", "position": 14 }, { "token": "啥", "start_offset": 26, "end_offset": 27, "type": "CN_CHAR", "position": 15 }, { "token": "也", "start_offset": 27, "end_offset": 28, "type": "CN_CHAR", "position": 16 }, { "token": "不是", "start_offset": 28, "end_offset": 30, "type": "CN_WORD", "position": 17 }, { "token": "sanmao", "start_offset": 43, "end_offset": 49, "type": "ENGLISH", "position": 18 } ] }

附录

在创建索引时出现的异常

        可能因es版本不同，出现配置字段类型不一样。

illegal_state_exception --> only value lists are allowed in serialized settings

        错误原因：在序列化设置中仅允许值列表。分析是某个配置字段接收的参数类型不正确。

        错误返回：

{ "error": { "caused_by": { "reason": "only value lists are allowed in serialized settings", "type": "illegal_state_exception" }, "reason": "Failed to load settings from [{\"index\":{\"number_of_shards\":\"5\",\"number_of_replicas\":\"1\"},\"analysis\":{\"filter\":[{\"chinese_stop_word\":{\"type\":\"stop\",\"stopwords\":[\"嗯\",\"啊\",\"这\",\"是\",\"哦\",\"噢\",\"那\"]}}],\"char_filter\":[{\"mappings\":[\"操 => *\",\"我操 => **\",\"草 => 艹\"],\"type\":\"mapping\"}],\"analyzer\":{\"my_custom_analyzer_enstop\":{\"filter\":[\"lowercase\",\"english_stop\"],\"type\":\"custom\",\"tokenizer\":\"ik_smart\"},\"my_custom_analyzer\":{\"filter\":[\"lowercase\",\"chinese_stop_word\"],\"char_filter\":[\"html_strip\",\"mapping\"],\"position_increment_gap\":100,\"type\":\"custom\",\"tokenizer\":\"ik_smart\"}}}}]", "root_cause": [ { "reason": "Failed to load settings from [{\"index\":{\"number_of_shards\":\"5\",\"number_of_replicas\":\"1\"},\"analysis\":{\"filter\":[{\"chinese_stop_word\":{\"type\":\"stop\",\"stopwords\":[\"嗯\",\"啊\",\"这\",\"是\",\"哦\",\"噢\",\"那\"]}}],\"char_filter\":[{\"mappings\":[\"操 => *\",\"我操 => **\",\"草 => 艹\"],\"type\":\"mapping\"}],\"analyzer\":{\"my_custom_analyzer_enstop\":{\"filter\":[\"lowercase\",\"english_stop\"],\"type\":\"custom\",\"tokenizer\":\"ik_smart\"},\"my_custom_analyzer\":{\"filter\":[\"lowercase\",\"chinese_stop_word\"],\"char_filter\":[\"html_strip\",\"mapping\"],\"position_increment_gap\":100,\"type\":\"custom\",\"tokenizer\":\"ik_smart\"}}}}]", "type": "settings_exception" } ], "type": "settings_exception" }, "status": 500 }

        错误修改：

... "char_filter": [ { // 为analyzer.my_custom_analyzer.char_filter.mapping做单独配置 "type": "mapping", // 比如做敏感词替换 "mappings": [ "操 => *", "我操 => **", "草 => 艹" ] } ] ... 修改为 ... "char_filter": { "my_sensitive": { // 为analyzer.my_custom_analyzer.char_filter.my_sensitive做单独配置 "type": "mapping", // 比如做敏感词替换 "mappings": [ "操 => *", "我操 => **", "草 => 艹" ] } } ...

参考链接

elasticsearch中使用停用词过滤器_es停用词-CSDN博客

一个功能强大、操作易用的屏幕录制.Net开源工具草稿箱编程乐趣 c#.net 开源
推荐一款免费开源的屏幕录制工具，凭借其强大的功能和用户友好的界面，受到非常多人喜欢！01项目简介该工具不仅支持全屏录制，还提供区域录制、游戏录制和摄像头录制等多种模式。不管是录制软件操作、游戏、直播、网络教学、课件制作还是在线视频，都可以满足你的需求。此外该工具还可以录制多种屏幕内容，如鼠标点击和键盘的输入等。02功能特色1、支持截屏功能；2、支持桌面、窗口、自定义区域录制；3、支持录制鼠标点击或
uniapp 自定义图片预览组件PicturePreview（Vue3、组合式、ts）舍予一前端知识汇总 uni-app javascript 前端
组件import{ref}from'vue';constimages=ref>([]);constcurrentIndex=ref(0);constshow=ref(false);constscale=ref(1);functiononSwiperChange(e:any){scale.value=1;currentIndex.value=e.detail.current;}constonScal
ES6新增扩展：字符串-数值-数组-函数-对象
字符串的扩展判断字符串是否包含在另一个字符中lets='h'//结果：trues.startsWith('hello')//是否在头部//结果：falses.endWith('hello')//是否在尾部//结果:trues.includes('hello')//字符串中是否存在字符串补全letb='how'//结果：aahowb.padStart('5','a')//不足5个字符，在头部补缺少的
第20节课： jQuery基础—简化JavaScript编程的强大工具学问小小谢 HTML学习 javascript jquery 前端 html 学习交互搜索引擎
目录jQuery简介为什么使用jQuery？jQuery选择器基本选择器属性选择器伪类选择器事件处理事件绑定常见事件类型事件触发动画效果基本动画自定义动画实践：使用jQuery增强网页交互示例：创建一个带有动画效果的按钮示例：创建一个交互式的导航菜单结语在Web开发中，JavaScript是实现网页交互和动态效果的核心语言。然而，原生JavaScript的语法有时显得繁琐，为了提高开发效率，jQu
【spark床头书系列】Spark Streaming 编程权威使用指南 BigDataMLApplication spark 大数据流数据处理#大数据 spark 大数据分布式
SparkStreaming编程权威使用指南文章目录SparkStreaming编程权威使用指南概述快速示例基本概念链接初始化StreamingContext离散化流（DStreams）输入DStreams和Receivers基本源文件流基于自定义接收器的流作为流的RDD队列高级源自定义源接收器的可靠性在DStreams上的转换操作updateStateByKey操作transform操作窗口操作
实习成长之路：关于ElasticSearch深度分页带来的思考，如何解决深度分页和跳页会写代码的花城实习踩坑之路 reids 并发 elasticsearch 搜索引擎分布式
问题引入我们在平常使用ElasticSearch构建查询条件的时候一般用的都是from+size的方式进行分页查询，但是如果我们的页数太深/页面大小太大(from*size)>10000就会引发一个错误，我们将会得到一个错误这是为什么呢？因为ES的分页查询其实是这样来的因为ElasticSeach的天生分布式的原因，我们的数据是分散在几个分片中的，而我们设置了from+size需要对全部数据进行查
Elasticsearch from+size与scroll混合使用实现深度分页搜索爱喝咖啡的程序员 #分布式搜索引擎
目录一.需求二.思考三.实现方案一.需求环境准备:JDK1.8Elasticsearch7.3.1RestHighLevelClient客户端对Elasticsearch做深度分页，比如第1500页，每页20条记录，且需要支持前后翻页。二.思考由于index.max_result_window的限制，直接使用from+size无法搜索满足条件10000条以上的记录。如果贸然增大index.max_
微软官方工具箱 PowerToys，提升工作效率小马不是哥哥 notepad++ipad pdf python django
今天为大家介绍一个实用的工具箱——PowerToys。这是微软官方开发的一组工具集合，能够为Windows用户提供额外的功能，从而提升工作效率。主要特性键盘管理器：键盘管理器允许用户通过重新映射按键以及创建自定义键盘快捷键来提高工作效率。你可以轻松地将不常用的键映射为常用的功能，或者创建全新的快捷键组合。“总在最前面”功能：“总在最前面”功能允许用户将特定应用程序窗口固定在最前面，即使焦点切换到其
Qt: QT图形绘制简介大白萝卜不紧张 qt qt 开发语言
1.QPainter描述：QPainter是Qt最常用的绘图类。它提供了一组丰富的功能来绘制各种形状、文本和图像。用途：适用于自定义绘制，比如在QWidget或QGraphicsView中绘制。功能：绘制基本图形（线条、矩形、圆形、多边形等）。绘制文本和图像。支持渐变、纹理和抗锯齿效果。2.QGraphicsView和QGraphicsScene描述：QGraphicsView是一个用于显示和管理
Window系统下开发Qt——在图片上绘制图形十年编程老舅 QT开发 qt c++qt5 开发语言 ui
在图像处理程序中，经常需要在图片上绘制一些图像，用以提示用户或展示一些信息。例如，需要绘制一个矩形框，显示当前处理的图像是原图像的一部分。一般在Qt中，可以使用QLabel控件来显示图片。但是使用QLabel既显示图片又显示自己绘制的图形，会很不方便。可以自定义个类，继承自QLabel，并且重写QLabel的paintEvent方法，在此方法中，绘制自己的图形。QT文章推荐阅读：Qt开发必备技术栈
Spring MVC学习笔记万般滋味皆生活后端开发 spring springmvc
文章目录SpringMVC什么是MVC设计模式？SpringMVC的核心组件SpringMVC的工作流程如何使用？SpringMVC注解SpringMVC数据绑定SpringMVC模型数据解析SpringMVC自定义数据转换器SpringMVCREST特点如何使用SpringMVC文件上传下载SpringMVC表单标签库常用的表单标签SpringMVC数据校验SpringMVCSpringMVC是
使用scikit-learn中的KNN包实现对鸢尾花数据集或者自定义数据集的的预测。 Jam-Young scikit-learn python 信息可视化
使用scikit-learn中的KNN包实现对鸢尾花数据集或者自定义数据集的的预测。#导入鸢尾花数据集fromsklearn.datasetsimportload_iris,fetch_20newsgroups#数据化可视包importseabornassnsimportmatplotlib.pyplotaspltimportpandasaspdfromsklearn.model_selectio
Vue.js组件开发-实现导出PDF文件可自定义添加水印及水印样式方向 LCG元前端 vue.js pdf javascript
使用Vue实现导出PDF文件并添加水印，同时支持设置水印样式、方向和自定义水印内容。步骤安装依赖：使用html2canvas将HTML内容转换为canvas，使用jspdf生成PDF文件。创建Vue组件：在组件中实现水印生成、HTML转canvas、canvas转PDF的功能。设置水印样式和方向：支持自定义水印内容、字体、颜色、透明度、旋转角度等。导出PDF文件：将带有水印的HTML内容导出为PD
ESP8266恢复出厂设置指南纪想娇
ESP8266恢复出厂设置指南ESP8266恢复出厂设置项目地址:https://gitcode.com/Resource-Bundle-Collection/b8579简介本文档旨在指导用户如何将ESP8266Wi-Fi模块恢复到其出厂默认状态。ESP8266是一款广受欢迎的嵌入式Wi-Fi解决方案，常用于物联网项目。当遇到配置混乱、固件问题或想要清除自定义设置时，恢复出厂设置变得尤为重要。恢复
层次聚类构建层次结构的簇纠结哥_Shrek 聚类数据挖掘机器学习
层次聚类（HierarchicalClustering）可以通过自定义函数来完成。层次聚类可以分为两种方法：凝聚型（Agglomerative）和分裂型（Divisive）。这里主要介绍一种常用的凝聚型方法，它是自底向上的方法，逐步合并最近的簇，直到达到预定的簇数量或者所有数据点合并成一个簇。可以使用距离度量来衡量不同簇之间的相似性（例如欧氏距离），并通过最短距离来决定哪些簇合并。最终，我们将通过
自定义穿梭框 vue穿梭框不停留 npm组件 vue js html vue.js css3
基于vue和elementUI的穿梭框elementUI中提供了很强大的穿梭框组件，但是在具体的项目或是业务中，还会有一些特殊的需求没有办法满足。所以抽空做了这个穿梭框组件，供我们当前所迭代的产品使用，目前时初步试用，会再根据试用过程中做的优化再度更新。现在发出来是希望如果有遇到同样开发需求的童鞋，可以一起来完善这个组件。安装npminstalltransfer-table代码仓链接link.简介
Feign介绍及使用阿柒爱吃鱼笔记 java spring cloud
菜单Feign介绍Feign基本使用1.导入依赖2.启用Feign3.编写StoreClient接口4.调用FeignClientFeign自定义配置配置文件中配置java代码中配置Feign配置超时重试配置超时时间重试机制Feigh切换Client使用OkHttp配置超时重试1.引入okhttp依赖2.OkHttp配置类3.开启okhttpFeign介绍Feign是一个声明式的Web服务客户端，
27.useFetch @大迁世界 php react.js javascript react native 开发语言
在React应用开发中，处理网络请求是一个常见而重要的任务。虽然JavaScript的fetchAPI提供了一种现代化的方式来进行网络请求，但在React组件中使用它可能会变得复杂。useFetch钩子提供了一种声明式的方法来处理网络请求，简化了错误处理、加载状态管理和请求取消等复杂操作。以下是如何实现和使用这个自定义钩子：const useFetch = (url, options) => {
Docker常用知识点问题晚风-夏不凉 docker
1.dockerfile基础命令及作用—copy和add区别—为什么要指定workdir—expose作用，能不能不用，不用会导致什么情况？—env，不用怎么打镜像—from2.dockerfile编写规范—jdk版本—依赖问题—shell指令引用—字体和时区配置3.多阶段构建优点4.构建过程—-t，-rm参数意思—构建文件（dockerfile）可以自定义名吗5.执行过程—不做端口映射会有什么情
AcWing-789. 数的范围-【二分】【小数二分】 superkcl2022 #AcWing 数据结构二分法
文章目录题目C++自定义二分小数二分题目给定一个按照升序排列的长度为n的整数数组，以及q个查询。对于每个查询，返回一个元素k的起始位置和终止位置（位置从0开始计数）。如果数组中不存在该元素，则返回-1-1。输入格式第一行包含整数n和q，表示数组长度和询问个数。第二行包含n个整数（均在1∼10000范围内），表示完整数组。接下来q行，每行包含一个整数k，表示一个询问元素。输出格式共q行，每行包含两个
26.useScript @大迁世界 javascript 前端 react.js 开发语言 ecmascript
在Web应用开发中，动态加载外部脚本是一个常见需求，特别是在需要集成第三方库或服务时。然而，在React应用中管理脚本加载可能会变得复杂。useScript钩子提供了一种优雅的方式来处理外部脚本的加载、错误处理和清理，使得在React组件中动态加载脚本变得简单和可靠。以下是如何实现和使用这个自定义钩子：const useScript = src => { const [status, setSt
【Sql Server】随机查询一条表记录，并重重温回顾下存储过程的封装和使用 web13688565871 面试学习路线阿里巴巴数据库 oracle
大家好，我是，欢迎来到《小5讲堂》。这是《SqlServer》系列文章，每篇文章将以博主理解的角度展开讲解。温馨提示：博主能力有限，理解水平有限，若有不对之处望指正！目录前言随机查询语句存储过程基本概念基本结构基础例子存储过程封装文章推荐前言温故而知新，最近在写sql查询语句，需求是随机查询表的其中一条记录。基于这个查询，顺便把数据库自定义函数、存储过程这个两个知识点重温固定下。因此，本篇文章将在
Groovy中的操作符重载：实现对象的自定义运算 t0_54manong python java 前端个人开发
在编程中，操作符重载是一种强大的功能，它允许程序员为自定义的类定义操作符的行为。Groovy语言提供了非常灵活的机制来支持操作符重载，通过定义特定的方法，我们可以让对象支持各种操作符运算。本文将通过一个简单的实例，展示如何在Groovy中实现操作符重载。Groovy操作符重载的基本原理在Groovy中，操作符重载的核心在于定义特定的方法。这些方法与操作符一一对应，当操作符被使用时，Groovy会自
Eclipse 代码模板：提升开发效率的利器 froginwe11 开发语言
Eclipse代码模板：提升开发效率的利器引言在软件开发领域，代码模板是一种常见且实用的工具。它可以帮助开发者快速生成代码框架，提高开发效率。Eclipse作为一款功能强大的集成开发环境（IDE），内置了丰富的代码模板。本文将详细介绍Eclipse代码模板的使用方法，以及如何通过自定义模板提升开发效率。Eclipse代码模板概述Eclipse代码模板是指在编写代码时，自动生成的代码片段。这些代码片
python websocket爬虫_python爬虫----爬取阿里数据银行websocket接口 weixin_39722917 python websocket爬虫
业务需求：爬取阿里品牌数据银行的自定义模块==>>>人群透视==>>>查看报告==>>数据最终获取页面：页面获取情况如下：绿色的就是我们需要模拟的请求，红色朝下的就是请求对应的数据，通过rid参数来找寻对应请求和数据，这个rid和时间戳很类似，没错这就是一个13位的时间戳，和随机数组合而成的：randomID=str(int(time.time()*1000))+str(self.count).z
史上最强！Spring Boot 3.3 高效批量插入万级数据的多种方案 m0_74825074 面试学习路线阿里巴巴 spring boot 后端 java
SpringBoot3.3多种方式实现高效批量插入万级数据，史上最强！在大数据处理场景下，如何高效地将大量数据插入数据库是一个重要课题。本文基于SpringBoot3.3及MyBatis-Plus，介绍几种高效的批量插入数据的方法，包括：使用JDBC批处理使用自定义SQL批处理单条插入（for循环）拼接SQL语句插入MyBatis-Plus的saveBatch方法循环插入+开启批处理模式每种方式都
Python爬虫获取custom-1688自定义API操作接口不会玩技术的技术girl Python API 1688API python 爬虫开发语言
一、引言在电子商务领域，1688作为国内领先的B2B平台，提供了丰富的API接口，允许开发者获取商品信息、店铺信息等。其中，custom接口允许开发者进行自定义操作，获取特定的数据。本文将详细介绍如何使用Python调用1688的custom接口，并对获取到的数据进行分析和应用。二、准备工作注册1688开放平台账号访问1688开放平台官网，注册一个账号并完成相关认证。这是获取API接口权限的前提。
protoc-go-inject-tag 使用教程农彩媛Louise
protoc-go-inject-tag使用教程项目地址:https://gitcode.com/gh_mirrors/pr/protoc-go-inject-tag项目介绍protoc-go-inject-tag是一个用于在生成的Go结构体中注入自定义标签的工具。在使用ProtocolBuffers（protobuf）生成Go代码时，默认情况下生成的结构体标签是固定的，无法灵活设置。protoc
【实践】给proto的message添加自定义tag JYCJ_ Golang 我的思考前端开发语言后端 go golang
背景通常来说，使用proto定义message的Field是使用下划线，比如：#proto定义messageReq{stringkey_name=1;}#生成的.pb.go中req的定义typeReqstruct{stateprotoimpl.MessageStatesizeCacheprotoimpl.SizeCacheunknownFieldsprotoimpl.UnknownFieldsKe
python实现http文件服务器访问下载 lljss2020 Python HTML python http 服务器
//1.pyimporthttp.serverimportsocketserverimportosimportthreadingimportsys#获取当前脚本所在的目录DIRECTORY=os.path.dirname(os.path.abspath(__file__))#设置服务器的端口PORT=8000#自定义Handler，将根目录设置为脚本所在目录classMyHTTPRequestHa
rust的指针作为函数返回值是直接传递，还是先销毁后创建？ wudixiaotie 返回值
这是我自己想到的问题，结果去知呼提问，还没等别人回答，我自己就想到方法实验了。。 fn main() { let mut a = 34; println!("a's addr:{:p}", &a); let p = &mut a; println!("p's addr:{:p}", &a
java编程思想 -- 数据的初始化百合不是茶 java 数据的初始化
1.使用构造器确保数据初始化 /* *在ReckInitDemo类中创建Reck的对象 */ public class ReckInitDemo { public static void main(String[] args) { //创建Reck对象 new Reck(); } }
[航天与宇宙]为什么发射和回收航天器有档期 comsci
地球的大气层中有一个时空屏蔽层,这个层次会不定时的出现,如果该时空屏蔽层出现,那么将导致外层空间进入的任何物体被摧毁,而从地面发射到太空的飞船也将被摧毁... 所以,航天发射和飞船回收都需要等待这个时空屏蔽层消失之后,再进行 &
linux下批量替换文件内容商人shang linux 替换
1、网络上现成的资料　　格式: sed -i "s/查找字段/替换字段/g" `grep 查找字段 -rl 路径` 　　linux sed 批量替换多个文件中的字符串　　sed -i "s/oldstring/newstring/g" `grep oldstring -rl yourdir` 　　例如：替换/home下所有文件中的www.admi
网页在线天气预报 oloz 天气预报
网页在线调用天气预报 <%@ page language="java" contentType="text/html; charset=utf-8" pageEncoding="utf-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transit
SpringMVC和Struts2比较杨白白 springMVC
1. 入口 spring mvc的入口是servlet，而struts2是filter（这里要指出，filter和servlet是不同的。以前认为filter是servlet的一种特殊），这样就导致了二者的机制不同，这里就牵涉到servlet和filter的区别了。参见：http://blog.csdn.net/zs15932616453/article/details/8832343 2
refuse copy, lazy girl! 小桔子 copy
妹妹坐船头啊啊啊啊！都打算一点点琢磨呢。文字编辑也写了基本功能了。。今天查资料，结果查到了人家写得完完整整的。我清楚的认识到： 1.那是我自己觉得写不出的高度 2.如果直接拿来用，很快就能解决问题 3.然后就是抄咩~~ 4.肿么可以这样子，都不想写了今儿个，留着作参考吧！拒绝大抄特抄，慢慢一点点写！
apache与php整合 aichenglong php apache web
一 apache web服务器 1 apeche web服务器的安装 1)下载Apache web服务器 2)配置域名(如果需要使用要在DNS上注册) 3)测试安装访问http://localhost/验证是否安装成功 2 apache管理 1)service.msc进行图形化管理 2)命令管理，配
Maven常用内置变量 AILIKES maven
Built-in properties ${basedir} represents the directory containing pom.xml ${version} equivalent to ${project.version} (deprecated: ${pom.version}) Pom/Project properties Al
java的类和对象百合不是茶 JAVA面向对象类对象
java中的类： java是面向对象的语言，解决问题的核心就是将问题看成是一个类，使用类来解决 java使用 class 类名来创建类，在Java中类名要求和构造方法，Java的文件名是一样的创建一个A类： class A{ } java中的类：将某两个事物有联系的属性包装在一个类中，再通
JS控制页面输入框为只读 bijian1013 JavaScript
在WEB应用开发当中，增、删除、改、查功能必不可少，为了减少以后维护的工作量，我们一般都只做一份页面，通过传入的参数控制其是新增、修改或者查看。而修改时需将待修改的信息从后台取到并显示出来，实际上就是查看的过程，唯一的区别是修改时，页面上所有的信息能修改，而查看页面上的信息不能修改。因此完全可以将其合并，但通过前端JS将查看页面的所有信息控制为只读，在信息量非常大时，就比较麻烦。
AngularJS与服务器交互 bijian1013 JavaScript AngularJS $http
对于AJAX应用（使用XMLHttpRequests）来说，向服务器发起请求的传统方式是：获取一个XMLHttpRequest对象的引用、发起请求、读取响应、检查状态码，最后处理服务端的响应。整个过程示例如下： var xmlhttp = new XMLHttpRequest(); xmlhttp.onreadystatechange
[Maven学习笔记八]Maven常用插件应用 bit1129 maven
常用插件及其用法位于：http://maven.apache.org/plugins/ 1. Jetty server plugin 2. Dependency copy plugin 3. Surefire Test plugin 4. Uber jar plugin 1. Jetty Pl
【Hive六】Hive用户自定义函数(UDF) bit1129 自定义函数
1. 什么是Hive UDF Hive是基于Hadoop中的MapReduce，提供HQL查询的数据仓库。Hive是一个很开放的系统，很多内容都支持用户定制，包括：文件格式：Text File，Sequence File 内存中的数据格式： Java Integer/String, Hadoop IntWritable/Text 用户提供的 map/reduce 脚本：不管什么
杀掉nginx进程后丢失nginx.pid，如何重新启动nginx ronin47 nginx 重启 pid丢失
nginx进程被意外关闭，使用nginx -s reload重启时报如下错误：nginx: [error] open() “/var/run/nginx.pid” failed (2: No such file or directory)这是因为nginx进程被杀死后pid丢失了，下一次再开启nginx -s reload时无法启动解决办法：nginx -s reload 只是用来告诉运行中的ng
UI设计中我们为什么需要设计动效 brotherlamp UI ui教程 ui视频 ui资料 ui自学
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用你的产品。
Spring中JdbcDaoSupport的DataSource注入问题 bylijinnan java spring
参考以下两篇文章： http://www.mkyong.com/spring/spring-jdbctemplate-jdbcdaosupport-examples/ http://stackoverflow.com/questions/4762229/spring-ldap-invoking-setter-methods-in-beans-configuration Sprin
数据库连接池的工作原理 chicony 数据库连接池
随着信息技术的高速发展与广泛应用，数据库技术在信息技术领域中的位置越来越重要，尤其是网络应用和电子商务的迅速发展，都需要数据库技术支持动态Web站点的运行，而传统的开发模式是：首先在主程序（如Servlet、Beans）中建立数据库连接；然后进行SQL操作，对数据库中的对象进行查询、修改和删除等操作；最后断开数据库连接。使用这种开发模式，对
java 关键字 CrazyMizzz java
关键字是事先定义的，有特别意义的标识符，有时又叫保留字。对于保留字，用户只能按照系统规定的方式使用，不能自行定义。 Java中的关键字按功能主要可以分为以下几类：（1）访问修饰符 public,private,protected p
Hive中的排序语法 daizj 排序 hive order by DISTRIBUTE BY sort by
Hive中的排序语法 2014.06.22 ORDER BY hive中的ORDER BY语句和关系数据库中的sql语法相似。他会对查询结果做全局排序，这意味着所有的数据会传送到一个Reduce任务上，这样会导致在大数量的情况下，花费大量时间。与数据库中 ORDER BY 的区别在于在hive.mapred.mode = strict模式下，必须指定 limit 否则执行会报错。
单态设计模式 dcj3sjt126com 设计模式
单例模式（Singleton）用于为一个类生成一个唯一的对象。最常用的地方是数据库连接。使用单例模式生成一个对象后，该对象可以被其它众多对象所使用。 <?phpclass Example{ // 保存类实例在此属性中 private static&
svn locked dcj3sjt126com Lock
post-commit hook failed (exit code 1) with output: svn: E155004: Working copy 'D:\xx\xxx' locked svn: E200031: sqlite: attempt to write a readonly database svn: E200031: sqlite: attempt to write a
ARM寄存器学习 e200702084 数据结构 C++c C#F#
无论是学习哪一种处理器，首先需要明确的就是这种处理器的寄存器以及工作模式。 ARM有37个寄存器，其中31个通用寄存器，6个状态寄存器。 1、不分组寄存器（R0-R7）不分组也就是说说，在所有的处理器模式下指的都时同一物理寄存器。在异常中断造成处理器模式切换时，由于不同的处理器模式使用一个名字相同的物理寄存器，就是
常用编码资料 gengzg 编码
List<UserInfo> list=GetUserS.GetUserList(11); String json=JSON.toJSONString(list); HashMap<Object,Object> hs=new HashMap<Object, Object>(); for(int i=0;i<10;i++) {
进程 vs. 线程 hongtoushizi 线程 linux 进程
我们介绍了多进程和多线程，这是实现多任务最常用的两种方式。现在，我们来讨论一下这两种方式的优缺点。首先，要实现多任务，通常我们会设计Master-Worker模式，Master负责分配任务，Worker负责执行任务，因此，多任务环境下，通常是一个Master，多个Worker。如果用多进程实现Master-Worker，主进程就是Master，其他进程就是Worker。如果用多线程实现
Linux定时Job：crontab -e 与 /etc/crontab 的区别 Josh_Persistence linux crontab
一、linux中的crotab中的指定的时间只有5个部分：* * * * * 分别表示：分钟，小时，日，月，星期，具体说来：第一段代表分钟 0—59 第二段代表小时 0—23 第三段代表日期 1—31 第四段代表月份 1—12 第五段代表星期几，0代表星期日 0—6 如： */1 * * * * 每分钟执行一次。 *
KMP算法详解 hm4123660 数据结构 C++算法字符串 KMP
字符串模式匹配我们相信大家都有遇过，然而我们也习惯用简单匹配法（即Brute-Force算法)，其基本思路就是一个个逐一对比下去，这也是我们大家熟知的方法，然而这种算法的效率并不高，但利于理解。假设主串s="ababcabcacbab",模式串为t="
枚举类型的单例模式 zhb8015 单例模式
E.编写一个包含单个元素的枚举类型[极推荐]。代码如下： public enum MaYun {himself; //定义一个枚举的元素，就代表MaYun的一个实例private String anotherField;MaYun() {//MaYun诞生要做的事情//这个方法也可以去掉。将构造时候需要做的事情放在instance赋值的时候：/** himself = MaYun() {*
Kafka+Storm+HDFS ssydxa219 storm
cd /myhome/usr/stormbin/storm nimbus &bin/storm supervisor &bin/storm ui &Kafka+Storm+HDFS整合实践kafka_2.9.2-0.8.1.1.tgzapache-storm-0.9.2-incubating.tar.gzKafka安装配置我们使用3台机器搭建Kafk
Java获取本地服务器的IP 中华好儿孙 java Web 获取服务器ip地址
System.out.println("getRequestURL:"+request.getRequestURL()); System.out.println("getLocalAddr:"+request.getLocalAddr()); System.out.println("getLocalPort:&quo

ES6.8.6 为索引映射(Mapping)创建自定义分词器，测试分词匹配效果

文章目录

环境

创建索引：配置自定义分词器、字段指定分词器

自定义分词器参数说明

创建索引：custom_analyzer_comment

使用索引中自定义的分词器进行分词分析

自定义分词器my_custom_analyzer分词测试：

测试中文停用词、英文字母转小写

测试敏感词替换：根据分词字符过滤配置替换敏感词

自定义分词器my_custom_analyzer_enstop分词测试

附录

在创建索引时出现的异常

illegal_state_exception --> only value lists are allowed in serialized settings

参考链接

你可能感兴趣的:(#,elasticsearch,es6,自定义分词器,分词器,中文分词)

创建索引：`custom_analyzer_comment`

自定义分词器`my_custom_analyzer`分词测试：

自定义分词器`my_custom_analyzer_enstop`分词测试