dianqiulai2465

Elasticsearch Query DSL 整理总结（二）—— 要搞懂 Match Query，看这篇就够了

原文链接： http://www.cnblogs.com/reycg-blog/p/10002794.html

引言
构建示例
match
- operator 参数
- analyzer
- lenient 参数
Fuzziness
- fuzzniess 参数
  - 什么是模糊搜索？
  - Levenshtein Edit Distance
  - fuzziness 参数取值规则
- prefix_length
Zero terms Query
Cutoff frequency
synonyms
小结
参考文档
系列文章列表
- Query DSL
- Java Rest Client API

引言

昨天是感恩节，上幼儿园的女儿在老师的叮嘱下，晚上为我和老婆洗了脚(形式上的^_^)，还给我们每人端了一杯水。看着孩子一天天的长大，懂事，感觉很开心，话说咱们程序员这么辛苦是为了什么？不就是为了老婆，孩子，热炕头，有一个温暖幸福的家庭，再捎带着用代码改变一下世界吗？想到这里，顿时觉得学习，创作博客的劲头也的更足了。哈哈，扯远了，书归正传，今天我们来聊聊 Match Query。

Match Query 是最常用的 Full Text Query 。无论需要查询什么字段， match 查询都应该会是首选的查询方式。它既能处理全文字段，又能处理精确字段。

构建示例

为了能够在后面能深入理解 Match Query 中的各个属性的意义，我们先构建一个 index 示例(有兴趣的同学只要将下面字段粘贴到 sense 中就可以创建)。

PUT matchtest
{ 
}

PUT matchtest/_mapping/people
{
  "properties": {
    "age": {
      "type": "integer"
    },
    "hobbies": {
      "type": "text"
    },
    "name": {
      "type": "keyword"
    }
  }
}

PUT matchtest/people/1
{
  "name" : "Jim",
  "age": 10,
  "hobbies": "football, basketball, pingpang"
}


PUT matchtest/people/2
{
  "name" : "Tom",
  "age": 12,
  "hobbies": "swimming, football"
}

match

operator 参数

match 查询是一种 bool 类型的查询。什么意思呢？举个例子，查询 people type 的 hobbies 为 football basketball

GET matchtest/people/_search
{
  "query": {
    "match": {
      "hobbies": "football basketball"
    }
  }
}

会将上面的两个文档都搜索出来。为什么？上面的查询其实隐藏了一个默认参数operator ，它的默认值是 or ，也就是说上面的查询也可以写成这种形式

GET matchtest/people/_search
{
  "query": {
    "match": {
      "hobbies": {
        "query": "football basketball",
        "operator": "or"
      }
    }
  }
}

这样就比较容易理解了，既然是 or 操作符，就表示只要查询的文档的 hobbies 字段中含有 football 和 basketball 任意一个，就可以被匹配到。

如果将 operator 操作符的值改为 and ，则表示需要同时包含 football 和 basketball ，得到的结果就只能是文档 1 Jim 小朋友了。

analyzer

analyzer 属性是指在对查询文本分析时的分析器

如果没有指定则会使用字段mapping 时指定的分析器
如果字段在 mapping 时也没有明显指定，则会使用默认的 search analyzer。

这里我们也没有指定，就会使用默认的，就不举例了，在后面文章讲解 analyzer 时再拓展。

lenient 参数

默认值是 false ，表示用来在查询时如果数据类型不匹配且无法转换时会报错。如果设置成 true 会忽略错误。

例如，例子中的 age 是 integer 类型的，如果查询 age=xxy ，就会导致无法转换而报错。

GET matchtest/_search
{
  "query": {
    "match": {
      "age" : {
        "query": "xxx"
      }
    }
  }
}

而如果将 lenient 参数设置为 true ，就会忽略这个错误

GET matchtest/_search
{
  "query": {
    "match": {
      "age" : {
        "query": "xxx",
        "lenient": true
      }
    }
  }
}

注意，如果将 age 字段的值设置为字符串 "10", 来查询，由于能够转换成整数，这时 elastic 内部会将字符串先转换成整数再做查询，不会报错。

Fuzziness

fuzzniess 参数

fuzziness 参数可以使查询的字段具有模糊搜索的特性。来先了解下什么是模糊搜索。

什么是模糊搜索？

模糊搜索是指系统允许被搜索信息和搜索提问之间存在一定的差异，这种差异就是“模糊”在搜索中的含义。例如，查找名字Smith时，就会找出与之相似的Smithe， Smythe， Smyth， Smitt等。

——百度百科

通过模糊搜索可以查询出存在一定相似度的单词，那么怎么计算两个单词是否有相似度以及相似度的大小呢？这就要了解下另外一个概念：Levenshtein Edit Distance

Levenshtein Edit Distance

Levenshtein Edit Distance 叫做莱文斯坦距离**，是编辑距离的一种。指两个字串之间，由一个转成另一个所需的最少编辑操作次数。允许的编辑操作包括将一个字符替换成另一个字符，插入一个字符，删除一个字符。

例如，单词 "god" 只需要插入一个 'o' 字符就可以变为 "good"，因此它们之间的编辑距离为 1。

fuzziness 参数取值规则

了解了上面两个概念，回过头再来看下 fuzziness 参数。

在查询 text 或者 keyword 类型的字段时, fuzziness 可以看做是莱文斯坦距离。

fuzziness 参数的取值如下

0,1,2 表示最大可允许的莱文斯坦距离
AUTO

会根据词项的长度来产生可编辑距离，它还有两个可选参数，形式为AUTO:[low],[high]，分别表示短距离参数和长距离参数；如果没有指定，默认值是 AUTO:3,6 表示的意义如下
- 0..2
  
  单词长度为 0 到 2 之间时必须要精确匹配，这其实很好理解，单词长度太短是没有相似度可言的，例如 'a' 和 'b'。
- 3..5
  
  单词长度 3 到 5 个字母时，最大编辑距离为 1
- >5
  
  单词长度大于 5 个字母时，最大编辑距离为 2
最佳实践: fuzziness 在绝大多数场合都应该设置成 AUTO

如果不设置 fuziness 参数，查询是精确匹配的。

来看例子，上面创建了一个 doc

PUT matchtest/people/1
{
  "name" : "Jim",
  "age": 10,
  "hobbies": "football, basketball, pingpang"
}

设置 fuzziness 为 AUTO ，

其中 hobbies 字段的值 football 长度 > 5, 此时我们找一个编辑距离为 2 的单词 footba22 来查询，应该匹配到
其中 name 字段的值 jim 长度在 3 和 5 之间，此时找一个编辑距离为 1 的单词 jiO 应匹配到，而编辑距离为 2 的 jOO 就不应匹配到。

来，验证下

GET matchtest/_search
{
  "query": {
    "match": {
      "hobbies": {
        "query": "footba22",
        "fuzziness": "AUTO"
      }
    }
  }
}

GET matchtest/_search
{
  "query": {
    "match": {
      "name": {
        "query": "jiO",
        "fuzziness": "AUTO"
      }
    }
  }
}


GET matchtest/_search
{
  "query": {
    "match": {
      "name": {
        "query": "jOO",
        "fuzziness": "AUTO"
      }
    }
  }
}

prefix_length

prefix_length 表示不能没模糊化的初始字符数。由于大部分的拼写错误发生在词的结尾，而不是词的开始，使用 prefix_length 就可以完成优化。注意 prefix_length 必须结合 fuzziness 参数使用。

例如，在查询 hobbies 中的 football 时，将 prefix_length 参数设置为 3,这时 foatball 将不能被匹配。

GET matchtest/_search
{
  "query": {
    "match": {
      "hobbies": {
        "query": "foatball",
        "fuzziness": "AUTO",
        "prefix_length": 3
      }
    }
  }
}

TODO（max_expansions 参数对于 match 查询而言，没理解表示的意义，如果您知道这个参数的用法，请给我留言告知，不胜感谢！）

Zero terms Query

先看例子, 先创建一个文档 zero_terms_query_test 其中 message 字段使用 stop 分析器，这个分析器会将 stop words 停用词在索引时全都去掉。

PUT matchtest1

PUT matchtest1/_mapping/zero_terms_query_test
{
  "properties": {
    "message": {
      "type": "text",
      "analyzer": "stop"
    }
  }
}


PUT matchtest1/zero_terms_query_test/1
{
  "message": "to be or not to be"
}

GET matchtest1/_search
{
  "query": {
    "match": {
      "message": {
        "query": "to be or not to be",
        "operator": "and",
        "zero_terms_query": "none"
      }
    }
  }
}

那么就像 message 字段中的 to be or not to be 这个短语中全部都是停止词，一过滤，就什么也没有了,得不到任何 tokens, 那搜索时岂不什么都搜不到。

POST _analyze
{
  "analyzer": "stop",
  "text": "to be or not to be"
}

zero_terms_query 就是为了解决这个问题而生的。它的默认值是 none ,就是搜不到停止词（对 stop 分析器字段而言）,如果设置成 all ，它的效果就和 match_all 类似，就可以搜到了。

GET matchtest1/_search
{
  "query": {
    "match": {
      "message": {
        "query": "to be or not to be",
        "operator": "and",
        "zero_terms_query": "all"
      }
    }
  }
}

Cutoff frequency

查询字符串时的词项会分成低频词（更重要）和高频词（次重要）两类，像前面所说的停用词（stop word）就属于高频词，它虽然出现频率较高，但在匹配时可能并不太相关。实际上，我们往往是想要文档能尽可能的匹配那些低频词，也就是更重要的词项。

要实现这个需求，只要在查询时配置 cutoff_frequency 参数就可以了。假设我们将 cutoff_frequency 设置成 0.01 就表示

任何词项在文档中超过 1%，被认为是高频词
其他的词项会被认为低频词

从而将高频词（次重要的词）挪到可选子查询中，让它们只参与评分，而不参与匹配；高频词（更重要的词）参与匹配和评分。

这样一来，就不再需要 stopwords 停用词文件了，从而变成了动态生成停用词: 高频词就会被看做是停用词。这种配置只是对于词项比较多的场合如 email body，文章等适用，文字太少， cutoff_frequency 选项设置的意义就不大了。

cutoff_frequency 配置有两种形式

指定为一个分数（ 0.01 ）表示出现频率
指定为一个正整数（ 5 ）则表示出现次数

下面给个例子, 在创建的 3 个文档中都包含 "be " 的单词，在查询时将 cutoff_frequency 参数设置为 2，表示 "be" 就是高频词，只会参与评分，但在匹配时不做考虑。

此时查询的内容为 "to be key" ，由于 "be" 词项是高频词，因为在文档中必须要存在 "to" 或者 "key" 才能匹配，因此文档 3 不能匹配。

PUT /matchtest2

PUT matchtest2/_mapping/cutoff_frequency_test
{
  "properties": {
    "message": {
      "type": "text"
    }
  }
}

PUT matchtest2/cutoff_frequency_test/1
{
  "message": "to be or not to be to be or"
}

PUT matchtest2/cutoff_frequency_test/2
{
  "message": "be key or abc"
}

PUT matchtest2/cutoff_frequency_test/3
{
  "message": "or to be or to to be or"
}

GET matchtest2/_search
{
  "query": {
    "match": {
      "message": {
        "query": "to be key",
        "cutoff_frequency": 2
      }
    }
  }
}

synonyms

synonyms 是指同义词，只要索引和字段中配置了同义词过滤器，match 查询是支持多词条的同义词扩展的。在应用过滤器后，解析器会对每个多次条同义词创建一个语句查询。

例如，同义词 USA, united states of America 就会构建出 (USA OR ("united states of America"))。看下面例子：

PUT /matchtest4
{
    "settings": {
        "index" : {
            "analysis" : {
                "analyzer" : {
                    "synonym" : {
                        "tokenizer" : "whitespace",
                        "filter" : ["synonym"]
                    }
                },
                "filter" : {
                    "synonym" : {
                        "type" : "synonym",
                        "synonyms" : [
                            "USA, united states of America"
                        ]
                    }
                }
            }
        }
    }
}

PUT /matchtest4/_mapping/synonyms_test
{
  "properties": {
    "message": {
      "type": "text",
      "analyzer": "synonym"
    }
  }
}

PUT /matchtest4/synonyms_test/1
{
  "message": "united states of America people"
}


GET /matchtest4/_search
{
  "query": {
    "match": {
      "message": {
        "query": "USA"
      }
    }
  }
}

小结

本文以代码实例的方式完整的讲解了 Match Query 的各种使用场景和参数意义。下篇会讲解 Match Phrase Query 敬请期待。

参考文档

Elasticsearch Query DSL Match Query

系列文章列表

Query DSL

Query DSL 概要，MatchAllQuery，全文查询简述

Java Rest Client API

Elasticsearch Java Rest Client API 整理总结 (一)——Document API
Elasticsearch Java Rest Client API 整理总结 (二) —— SearchAPI
Elasticsearch Java Rest Client API 整理总结 (三)——Building Queries

转载于:https://www.cnblogs.com/reycg-blog/p/10002794.html

Kubernetes控制平面组件：APIServer 基于 Webhook Toeken令牌的认证机制详解 grahamzhu 云原生学习专栏 kubernetes apiserver 企业认证系统 webhook令牌 token TokenReview 系统集成
云原生学习路线导航页（持续更新中）kubernetes学习系列快捷链接Kubernetes架构原则和对象设计（一）Kubernetes架构原则和对象设计（二）Kubernetes架构原则和对象设计（三）Kubernetes控制平面组件：etcd（一）Kubernetes控制平面组件：etcd（二）Kubernetes控制平面组件：etcd常用配置参数Kubernetes控制平面组件：etcd高可用
【数据结构】二叉树的特性多多钟意你吖阶段一：数据结构数据结构二叉树二叉树的特性
作者简介：大家好呀！我是路遥叶子，大家可以叫我叶子哦！❣️个人主页：【路遥叶子的博客】博主信息：四季轮换叶，一路招摇胜！专栏【安利Java零基础】【数据结构-Java语言描述】希望大家多多支持一起进步呀！~❤️若有帮助，还请【关注➕点赞➕收藏】，不行的话我再努力努力呀！————————————————⚡版权声明：本文由【路遥叶子】原创、在CSDN首发、需要转载请联系博主。想寻找共同成长的小伙伴，请
平均数1（acwing）c/c++/java/python xinghuitunan c++c语言 java python
读取两个浮点数AA和BB的值，对应于两个学生的成绩。请你计算学生的平均分，其中AA的成绩的权重为3.53.5，BB的成绩的权重为7.57.5。成绩的取值范围在00到1010之间，且均保留一位小数。输入格式输入占两行，每行包含一个浮点数，第一行表示AA，第二行表示BB。输出格式输出格式为MEDIA=X，其中XX为平均分，结果保留五位小数。数据范围0≤A,B≤10.00≤A,B≤10.0输入样例：5.
利用Redis发布订阅模式、SSE实现分布式实时站内信系统 weixin_38515820 Java redis redis 分布式 java
文章目录前言一、SSE是什么？二、单机与集群的站内信实现方式有何区别？三、Redis发布、订阅模式有何特点？四、代码演示1.数据模型小结2.引入依赖3.配置RedissonClient4.编写RestController用于测试5.编写用户消息订阅逻辑6.实现消息的发布7.实现广播消息的订阅8.个人与团队消息的订阅8.效果演示总结前言站内信功能在各大系统中被广泛应用，本文结合工作的实际场景，使用j
2016年2月小记录 weixin_30485799 开发工具
2.2发现自己bzoj第一版屯了不少题，就先A几道吧。bzoj1016:[JSOI2008]最小生成树计数，就是kruskal求出最小生成树后暴力一下就行了，其实不知道为什么可以过，反正就是可以过。bzoj1007:[HNOI2008]水平可见直线这题的结论太强了，按斜率排序，维护一个栈，判断交点就行啦，然后被卡精度了，不过这题idea特别好bzoj1011:[HNOI2008]遥远的行星这题就是
玩客云折腾之路 - (Armbian/Armv7l) 搭建Gitea - 通过二进制文件安装 wangvic21 linux Armbian 玩客云 git arm
玩客云折腾之路基于Armbian，完成docker、挂载U盘、gitea部署等文章目录玩客云折腾之路前言一、Git托管工具的选择？二、Gitea安装步骤1.docker安装（失败）2.二进制安装安装数据库创建用户安装Gitea下载配置目录个性化目录配置-U盘创建自启服务配置Gitea前言记录一下玩客云如何安装gitea，实现代码的托管。由于Docker镜像无Armv7镜像，需要通过命令行运行可执行
矩阵-矩阵置零 Vacant Seat 矩阵二维数组 java
矩阵置零给定一个mxn的矩阵，如果一个元素为0，则将其所在行和列的所有元素都设为0。请使用原地算法。在计算机科学中，一个原地算法（in-placealgorithm）是一种使用小的，固定数量的额外之空间来转换资料的算法。当算法执行时，输入的资料通常会被要输出的部分覆盖掉。不是原地算法有时候称为非原地（not-in-place）或不得其所（out-of-place）。输入：二维数组输出：二维数组思路
线代好学吗？ Vacant Seat
快期末考了，这两天的学期效率比在家高了几倍，这一周都在学习线代，在宿舍，自习室，图书馆都拿着一本太原理工大学线性代数第二版在那里翻，感觉线性代数这个东西挺有意思，挺灵活的，在这里，我总结一下一点关于线性代数的知识，也有一些是我之前入的坑吧，感觉有用的就点个赞吧！！！求四阶行列式说到这里我感觉还挺搞笑的，我之前一直以为行列式的计算都是按照二阶，三阶行列式那样对角线上的元素相乘，然后判断符号相加，就是
前端性能优化:页面加载速度慢怎么办？好运连连女士面试题性能优化前端
文章目录前端性能优化如何识别页面加载速度慢的原因性能优化的方式提高资源的请求速度http缓存--提升二次访问的响应速度CDN缓存静态资源缓存webpack的hash策略-文件资源缓存减少资源请求量图片懒加载代码构建优化webpack资源压缩treesharking-js代码的精简分包按需加载浏览器渲染优化webworkerGPU加速前端性能优化如何识别页面加载速度慢的原因方式1:lighthous
股指期货合约交易时怎么选择合约？股指期货连续合约是什么？财财有个期权懂金融财经
先选对标的指数，再选活跃的主力合约，近月合约最常用。股指期货合约交易时怎么选择合约？首先，先确定标的的指数我国的股指期货标的一共有四个，分别是沪深300股指期货、上证50股指期货、中证500股指期货以及中证1000股指期货。主要就看你要做那个标的就好了，你看好的是那个标的的行情就行。接着看合约的到期月份每个合约都有对应的到期合约，这个在上面都有写，主要看你觉得这个波动是多久，分别选择近月合约、次月
error Command failed with exit code 1 泡泡Java 前端 html 后端 asp.net javascript
从传统JQuery转变到Node.js最烦的就是一接手新项目就得npminstall，浪费大量时间不说还总会报莫明其妙的错误，这次又遇到了一个errorCommandfailedwithexitcode1。因为它的相关处报的问题可能和npm本身有关，我就用yarninstall规避，并且也确实能yarnstart跑通项目。但就在我想把它打包成dist的时候，yarnbuild就又抛出了这么一个问题
Web of Science如何导出参考文献（EndNote）泡泡Java 前端 html WebofScience EndNote 论文管理引用格式学术资源
打开WebofScience网站，找到要下载的论文，选中，然后导出到EndNote导出后用EndNote打开下载的CIW文件，选中，然后用Word打开，如图所示，插入引文，样式处可点击下拉三角，选择需要的引文格式。
PostgreSQL：更新字段慢喝醉酒的小白 PG postgresql 数据库
目录标题PostgreSQL慢查询优化与`pg_stat_statements`使用1.启用慢查询日志2.使用`pg_stat_statements`扩展收集查询统计信息3.查找执行时间较长的查询4.分析慢查询的执行计划5.优化查询6.检查并发连接和系统资源7.进一步优化8.查看某条SQL1.**如何生成`query_id`**2.**`query_id`是否会变化？**3.**是否会变动？**4
CSS垂直居中终极方案：告别复杂计算，拥抱现代布局 engchina LINUX css 前端
CSS垂直居中终极方案：告别复杂计算，拥抱现代布局前言：为什么垂直居中如此重要？一、2024年最推荐的3种方案1.Flexbox布局（首推方案）2.Grid布局（未来趋势）3.Transform方案（传统场景备用）二、方案对比与选型指南三、实战技巧与避坑指南常见问题排查企业级项目实践四、延伸学习：现代布局新趋势1.Subgrid布局2.逻辑属性支持3.容器查询（实验性）五、升级建议与工具链总结前言
early_printk函数川渝小神丢 Linux系统
分析Linux内核启动流程时可以知道，在调用setup_arch函数之前就已经调用过printk函数了，但是这个时候的printk函数只是将打印信息放在缓存区中，并没有打印到控制台上，因为这个时候控制台还没有被初始化。只有在start_kernel函数中的console_init函数被调用后，控制台才会被注册、初始化，printk函数打印的内容才会被真正地输出到屏幕上。如果想在console_in
【C++】二分算法介绍＋图片（ programming expert 算法 c++数据结构
二分答案（BinarySearchforAnswer）是一种在单调性基础上通过二分搜索来逼近问题解的算法。它常用于解决一些最优化问题，特别是那些可以通过“判定问题”来验证答案是否可行的问题。以下是对二分答案算法的详细介绍以及一个C++代码示例。二分答案算法的基本原理‌确定单调性‌：首先，必须确保问题的解在某个范围内是单调的，即随着某个参数的变化，问题的解呈现单调递增或递减的性质。‌设计判定函数‌：
Java数据结构与算法(买卖股票的最佳时机二贪心算法) 盘门 java数据结构与算法实战 java 开发语言
前言买卖股票最佳时机二，此时不限次数的买卖的要求获得的利益最大化。暴力算法依旧可行，可以参考之前的练习。.-力扣（LeetCode）贪心算法原理参考:Java数据结构与算法(盛水的容器贪心算法)-CSDN博客实现原理1.定义最大利润res和下标前值pre。2.下标移动比较当前股票值prices[i]与前值大小，前值小于当前值则加入利润res。3.随着下标移动前值更新。具体代码实现classSolu
基于动态规划与0-1整数规划模型的多阶段生产决策问题研究 NovakG_ 数据挖掘动态规划数学建模算法
摘要随着市场竞争的日益激烈，企业将以产品质量作为其发展战略重心，以适应激烈的市场竞争与不断变化的用户需求。本文针对某畅销电子产品生产过程中的决策问题，应用统计学中单边检验、二项分布与正态分布的方法，以最小化产品生产成本为目标，建立了动态规划与0-1整数规划模型。通过数学建模与模拟，为企业的生产提供了科学有效的生产决策依据，降低生产成本并优化资源配置。针对问题一，主要解决两个问题：一是需要设计一个最
观察者模式（C语言实现） Tyrion-Lannister 设计模式
一.概述Observer模式要解决的问题为：建立一个一（Subject）对多（Observer）的依赖关系，并且做到当“一”变化的时候，依赖这个“一”的多也能够同步改变。Sbuject相当于通知者，它提供依赖于它的观察者Observer的注册（Attach）和注销（Detach）操作，并且提供了使得依赖于它的所有观察者同步的操作（Notify）。Observer相当于观察者，则提供一个Update
区块链中的递归长度前缀（RLP）序列化详解 Linke- 区块链区块链以太坊
文章目录1.什么是RLP序列化？2.RLP的设计目标与优势3.RLP处理的数据类型4.RLP编码规则详解字符串的编码规则列表的编码规则5.RLP解码原理6.RLP在以太坊中的应用场景7.编码示例分析8.总结1.什么是RLP序列化？递归长度前缀（RLP）是一种专为区块链设计的序列化方法，主要用于将复杂数据结构（如嵌套列表、字符串）转换为二进制格式。其核心思想是通过添加长度前缀明确数据边界，确保数据在
高级SQL技术在Python项目中的应用：更进一步的数据分析与集成 Neo Evolution Python sql python 数据分析数据结构学习数据库
引言在第一篇中，我们深入探讨了ORM框架SQLAlchemy的高级用法以及性能优化策略。然而，要充分释放数据库的潜力，我们还需要掌握更多高级SQL特性，并将其与强大的数据分析工具生态系统有效集成。本篇将聚焦于窗口函数、CTE递归查询、JSON操作、全文搜索以及与Pandas的无缝集成，раскрывая高级SQL在数据分析领域的强大威力。窗口函数与分析查询：洞察数据背后的模式窗口函数是现代SQL标
数据结构之【顺序表实现】(c语言实现) zl_dfq 数据结构顺序表数据结构
强烈建议看完上一期博客之后再来看这一期：数据结构之【顺序表简介】3.实现顺序表的增删查改静态顺序表的缺陷较大，所以下面展示的是动态顺序表的相关函数3.1初始化结构体变量创建之后，首先初始化一下才好#defineINIT_CAPACITY10voidSLINIT(SL*ps){assert(ps);ps->arr=(SLDataType*)malloc(sizeof(SLDataType)*INIT
android 框架组件,Android 架构组件介绍臀总 android 框架组件
Android架构组件介绍Android,Architecture,Components,架构2018.08.08我们在Android开发的过程中，总是在和一些问题纠缠，比如在生命周期的管理，在屏幕旋转的时候重新布局，绘制，保存还原数据等。我们也一直在致力于减少内存的占用，减少内存泄漏的风险，优化我们的代码，特别在大项目中，要增加代码的可维护性。AndroidArchitectureCompone
《程序员练习生》第2期什么年龄开始编程最好道知极限编程程序员练习生编程语言程序员
最适合开始编程的年龄是10岁开始，坚持下来，18岁之前会小有成就，并衣食无忧。1.为什么是10岁很多人听到编程两个字，就下意识的感觉这是非常高深的技术，至少需要完成高中，甚至是要上了大学才能开始学习的技术。其实不然，编程是一个包含非常多内容的技术，可以从广度和深度不同层面去考量编程技术的难度。对于初学者来说，学习编程的目的不是为了搞科学研究，而是熟悉并习惯编程的思维方式，这一点非常重要；其次是掌握
vcpkg 安装使用技巧 (详细-建议收藏) Nsequence 开发语言
一、vcpkg简介vcpkg是一个用于管理C++库的开源工具，由微软推出。它可以帮助开发者轻松地获取、构建和安装大量的C++开源库，解决了在不同平台上编译和管理第三方库的复杂性问题，尤其在Windows平台下优势明显。二、vcpkg的安装（1）下载vcpkg从vcpkg的GitHub仓库（）下载最新版本的vcpkg。你可以使用Git克隆仓库，命令如下：```gitgitclonehttps://g
《西瓜书》大白话思想总结-第三章小溪子子西瓜书概率论机器学习分类
第三章3.1+3.2分类和回归是监督式学习，都是根据数据，分析特征，作出预测，只是预测的值是离散的叫分类，连续的叫回归。为什么叫线性回归呢？因为线性就可以看成是直线，直线当然是连续的。而所给的直线就是根据离散点拟合出来的线，其本质就是一种预测。那么根据离散点的特征，给出了预测方程的这个直线，就符合回归的定义。因此，这就叫作线性回归。（个人理解，不一定对）这个拟合直线的方程，或者叫预测的函数，各个自
如何创建自定义Retriever来增强LLM应用程序 llzwxh888 服务器运维 python
引言在许多大语言模型（LLM）应用中，我们需要从外部数据源中检索信息，以便生成更准确和相关的响应。这些信息往往通过Retriever模块检索，然后用于生成提示，供LLM进行处理和响应。在这篇文章中，我们将深入探讨如何创建一个自定义Retriever，并提供代码示例来帮助你在自己的项目中实现这一功能。主要内容Retriever接口要创建一个自定义Retriever，你需要扩展BaseRetrieve
算法随笔_57 : 游戏中弱角色的数量程序趣谈算法 python 数据结构
上一篇:算法随笔_56:好子数组的最大分数-CSDN博客=====题目描述如下:你正在参加一个多角色游戏，每个角色都有两个主要属性：攻击和防御。给你一个二维整数数组properties，其中properties[i]=[attacki,defensei]表示游戏中第i个角色的属性。如果存在一个其他角色的攻击和防御等级都严格高于该角色的攻击和防御等级，则认为该角色为弱角色。更正式地，如果认为角色i弱
【接口测试实战(十)】接口测试之token鉴权实战黑黑白白君测试实战软件测试接口 token postman
部分前情：《【接口测试实战(零)】接口测试简介》《【接口测试实战(一)】搭建接口测试环境》《【接口测试实战(二)】根据接口文档使用postman测试》《【接口测试实战(五)】接口测试之断言实战》《【接口测试实战(七)】postman之变量与沙盒实战》《【接口测试实战(八)】postman之Collections和数据驱动测试实战》《【接口测试实战(九)】接口测试之cookie实战》文章目录1）鉴权
VBA连接sql server数据库基本操作 OdooWizard VBA VBA
不多说，直接看代码'连接数据库'定义数据链接对象，保存连接数据库信息Setcnn=CreateObject("ADODB.Connection")'定义记录集对象，保存数据表Setrs=CreateObject("ADODB.Recordset")'定义数据库链接字符串‘DataSource：数据库服务器IP地址‘InitialCatalog：数据库名称‘UserID：数据库登录用户名‘Passw
戴尔笔记本win8系统改装win7系统 sophia天雪 win7 戴尔改装系统 win8
戴尔win8 系统改装win7 系统详述第一步：使用U盘制作虚拟光驱： 1）下载安装UltraISO：注册码可以在网上搜索。 2）启动UltraISO，点击“文件”—》“打开”按钮，打开已经准备好的ISO镜像文
BeanUtils.copyProperties使用笔记 bylijinnan java
BeanUtils.copyProperties VS PropertyUtils.copyProperties 两者最大的区别是： BeanUtils.copyProperties会进行类型转换，而PropertyUtils.copyProperties不会。既然进行了类型转换，那BeanUtils.copyProperties的速度比不上PropertyUtils.copyProp
MyEclipse中文乱码问题 0624chenhong MyEclipse
一、设置新建常见文件的默认编码格式，也就是文件保存的格式。在不对MyEclipse进行设置的时候，默认保存文件的编码，一般跟简体中文操作系统（如windows2000，windowsXP）的编码一致，即GBK。在简体中文系统下，ANSI 编码代表 GBK编码;在日文操作系统下，ANSI 编码代表 JIS 编码。 Window-->Preferences-->General -
发送邮件不懂事的小屁孩 send email
import org.apache.commons.mail.EmailAttachment; import org.apache.commons.mail.EmailException; import org.apache.commons.mail.HtmlEmail; import org.apache.commons.mail.MultiPartEmail;
动画合集换个号韩国红果果 html css
动画指一种样式变为另一种样式 keyframes应当始终定义0 100 过程 1 transition 制作鼠标滑过图片时的放大效果 css .wrap{ width: 340px;height: 340px; position: absolute; top: 30%; left: 20%; overflow: hidden; bor
网络最常见的攻击方式竟然是SQL注入蓝儿唯美 sql注入
NTT研究表明，尽管SQL注入（SQLi）型攻击记录详尽且为人熟知，但目前网络应用程序仍然是SQLi攻击的重灾区。信息安全和风险管理公司NTTCom Security发布的《2015全球智能威胁风险报告》表明，目前黑客攻击网络应用程序方式中最流行的，要数SQLi攻击。报告对去年发生的60亿攻击行为进行分析，指出SQLi攻击是最常见的网络应用程序攻击方式。全球网络应用程序攻击中，SQLi攻击占
java笔记2 a-john java
类的封装： 1，java中，对象就是一个封装体。封装是把对象的属性和服务结合成一个独立的的单位。并尽可能隐藏对象的内部细节（尤其是私有数据） 2，目的：使对象以外的部分不能随意存取对象的内部数据（如属性），从而使软件错误能够局部化，减少差错和排错的难度。 3，简单来说，“隐藏属性、方法或实现细节的过程”称为——封装。 4，封装的特性： 4.1设置
[Andengine]Error：can't creat bitmap form path “gfx/xxx.xxx” aijuans 学习Android遇到的错误
最开始遇到这个错误是很早以前了，以前也没注意，只当是一个不理解的bug，因为所有的texture，textureregion都没有问题，但是就是提示错误。昨天和美工要图片，本来是要背景透明的png格式，可是她却给了我一个jpg的。说明了之后她说没法改，因为没有png这个保存选项。我就看了一下，和她要了psd的文件，还好我有一点
自己写的一个繁体到简体的转换程序 asialee java 转换繁体 filter 简体
今天调研一个任务，基于java的filter实现繁体到简体的转换，于是写了一个demo，给各位博友奉上，欢迎批评指正。实现的思路是重载request的调取参数的几个方法，然后做下转换。
android意图和意图监听器技术百合不是茶 android 显示意图隐式意图意图监听器
Intent是在activity之间传递数据;Intent的传递分为显示传递和隐式传递显式意图：调用Intent.setComponent() 或 Intent.setClassName() 或 Intent.setClass()方法明确指定了组件名的Intent为显式意图，显式意图明确指定了Intent应该传递给哪个组件。隐式意图;不指明调用的名称,根据设
spring3中新增的@value注解 bijian1013 java spring @Value
在spring 3.0中，可以通过使用@value，对一些如xxx.properties文件中的文件，进行键值对的注入，例子如下： 1.首先在applicationContext.xml中加入： <beans xmlns="http://www.springframework.
Jboss启用CXF日志 sunjing log jboss CXF
1. 在standalone.xml配置文件中添加system-properties： <system-properties> <property name="org.apache.cxf.logging.enabled" value=&
【Hadoop三】Centos7_x86_64部署Hadoop集群之编译Hadoop源代码 bit1129 centos
编译必需的软件 Firebugs3.0.0 Maven3.2.3 Ant JDK1.7.0_67 protobuf-2.5.0 Hadoop 2.5.2源码包 Firebugs3.0.0 http://sourceforge.jp/projects/sfnet_findbug
struts2验证框架的使用和扩展白糖_ 框架 xml bean struts 正则表达式
struts2能够对前台提交的表单数据进行输入有效性校验，通常有两种方式： 1、在Action类中通过validatexx方法验证，这种方式很简单，在此不再赘述； 2、通过编写xx-validation.xml文件执行表单验证，当用户提交表单请求后，struts会优先执行xml文件，如果校验不通过是不会让请求访问指定action的。本文介绍一下struts2通过xml文件进行校验的方法并说
记录-感悟 braveCS 感悟
再翻翻以前写的感悟，有时会发现自己很幼稚，也会让自己找回初心。 2015-1-11 1. 能在工作之余学习感兴趣的东西已经很幸福了； 2. 要改变自己，不能这样一直在原来区域，要突破安全区舒适区，才能提高自己，往好的方面发展； 3. 多反省多思考；要会用工具，而不是变成工具的奴隶； 4. 一天内集中一个定长时间段看最新资讯和偏流式博
编程之美-数组中最长递增子序列 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class LongestAccendingSubSequence { /** * 编程之美数组中最长递增子序列 * 书上的解法容易理解 * 另一方法书上没有提到的是，可以将数组排序（由小到大）得到新的数组， * 然后求排序后的数组与原数
读书笔记5 chengxuyuancsdn 重复提交 struts2的token验证
1、重复提交 2、struts2的token验证 3、用response返回xml时的注意 1、重复提交 (1)应用场景 (1-1)点击提交按钮两次。 (1-2)使用浏览器后退按钮重复之前的操作，导致重复提交表单。 (1-3)刷新页面 (1-4)使用浏览器历史记录重复提交表单。 (1-5)浏览器重复的 HTTP 请求。 (2)解决方法 (2-1)禁掉提交按钮 (2-2)
[时空与探索]全球联合进行第二次费城实验的可能性 comsci
二次世界大战前后,由爱因斯坦参加的一次在海军舰艇上进行的物理学实验 -费城实验至今给我们大家留下很多迷团..... 关于费城实验的详细过程,大家可以在网络上搜索一下,我这里就不详细描述了在这里,我的意思是,现在
easy connect 之 ORA-12154: TNS: 无法解析指定的连接标识符 daizj oracle ORA-12154
用easy connect连接出现“tns无法解析指定的连接标示符”的错误，如下： C:\Users\Administrator>sqlplus username/pwd@192.168.0.5:1521/orcl SQL*Plus: Release 10.2.0.1.0 – Production on 星期一 5月 21 18:16:20 2012 Copyright (c) 198
简单排序:归并排序 dieslrae 归并排序
public void mergeSort(int[] array){ int temp = array.length/2; if(temp == 0){ return; } int[] a = new int[temp]; int
C语言中字符串的\0和空格 dcj3sjt126com c
\0 为字符串结束符，比如说： abcd (空格)cdefg；存入数组时，空格作为一个字符占有一个字节的空间，我们
解决Composer国内速度慢的办法 dcj3sjt126com Composer
用法：有两种方式启用本镜像服务： 1 将以下配置信息添加到 Composer 的配置文件 config.json 中（系统全局配置）。见“例1” 2 将以下配置信息添加到你的项目的 composer.json 文件中（针对单个项目配置）。见“例2” 为了避免安装包的时候都要执行两次查询，切记要添加禁用 packagist 的设置，如下 1 2 3 4 5
高效可伸缩的结果缓存 shuizhaosi888 高效可伸缩的结果缓存
/** * 要执行的算法，返回结果v */ public interface Computable<A, V> { public V comput(final A arg); } /** * 用于缓存数据 */ public class Memoizer<A, V> implements Computable<A,
三点定位的算法 haoningabc c 算法
三点定位，已知a,b,c三个顶点的x,y坐标和三个点都z坐标的距离，la，lb,lc 求z点的坐标原理就是围绕a,b,c 三个点画圆，三个圆焦点的部分就是所求但是，由于三个点的距离可能不准，不一定会有结果，所以是三个圆环的焦点，环的宽度开始为0，没有取到则加1 运行 gcc -lm test.c test.c代码如下 #include "stdi
epoll使用详解 jimmee c linux 服务端编程 epoll
epoll - I/O event notification facility在linux的网络编程中，很长的时间都在使用select来做事件触发。在linux新的内核中，有了一种替换它的机制，就是epoll。相比于select，epoll最大的好处在于它不会随着监听fd数目的增长而降低效率。因为在内核中的select实现中，它是采用轮询来处理的，轮询的fd数目越多，自然耗时越多。并且，在linu
Hibernate对Enum的映射的基本使用方法 linzx0212 enum Hibernate
枚举 /** * 性别枚举 */ public enum Gender { MALE(0), FEMALE(1), OTHER(2); private Gender(int i) { this.i = i; } private int i; public int getI
第10章高级事件（下） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
孙子兵法 roadrunners 孙子兵法
始计第一孙子曰：兵者，国之大事，死生之地，存亡之道，不可不察也。故经之以五事，校之以计，而索其情：一曰道，二曰天，三曰地，四曰将，五曰法。道者，令民于上同意，可与之死，可与之生，而不危也；天者，阴阳、寒暑、时制也；地者，远近、险易、广狭、死生也；将者，智、信、仁、勇、严也；法者，曲制、官道、主用也。凡此五者，将莫不闻，知之者胜，不知之者不胜。故校之以计，而索其情，曰
MySQL双向复制 tomcat_oracle mysql
本文包括: 主机配置从机配置建立主-从复制建立双向复制背景按照以下简单的步骤: 参考一下：在机器A配置主机(192.168.1.30) 在机器B配置从机(192.168.1.29) 我们可以使用下面的步骤来实现这一点步骤1：机器A设置主机在主机中打开配置文件 ,
zoj 3822 Domination(dp) 阿尔萨斯 Mina
题目链接：zoj 3822 Domination 题目大意：给定一个N∗M的棋盘，每次任选一个位置放置一枚棋子，直到每行每列上都至少有一枚棋子，问放置棋子个数的期望。解题思路：大白书上概率那一张有一道类似的题目，但是因为时间比较久了，还是稍微想了一下。dp[i][j][k]表示i行j列上均有至少一枚棋子，并且消耗k步的概率（k≤i∗j）,因为放置在i+1~n上等价与放在i+1行上，同理