jacksonary

ES学习记录9——关于Term

9.2.4 Term Vector

返回一个特定文档的信息和字段的统计信息，这里的文档可以索引中存储的文档，也可以是用户手动提供的，Term vector默认是实时的（而不是接近实时），这可以通过realtime=false进行更改，下面是个小栗子：

GET /twitter/_doc/1/_termvectors

// 也可以使用url中的参数指定为检索信息的字段
GET /twitter/_doc/1/_termvectors?fields=message

或者也可以在请体中添加请求字段，还可以使用通配符匹配指定的字段，注意/_termvector在ES 2.0中就已经被弃用了，替换为/_termvectors。

返回值

有三类值可以被请求：term information, term statistics and field statistics，默认情况下，所有的term information和字段statistics都会被返回，但term statistics不返回。

term information

字段中term的频率(总是被返回)；
term的定位(positions: true)；
开始和偏移(offsets: true)；
term payloads(payloads: true)作为base64编码字节。

如果请求信息没有存储在索引中，如果可能的话它将在运行时计算。此外，trem vetors可以不仅仅计算索引中已存在的文档，而且可以包含用户提供的文档。

Term statistics(Term统计信息，即将该某个字段里面的单词全都拆开成独立的单词进行分析)

将term_statistics设置为true将会返回这个Term statistics：

term_freq(total term frequency)，term的频率(在当前文档中该term出现的次数)；
doc_freq(document frequency)文档频率(包含当前term的文档数量，含有该term的文档有多少)；
ttf(该term在所有文档中出现的次数)
tokens包含该term的详细信息：
- position：以单词为单位(不含空格)，一个单词占一个索引，从0开始，表示该term的索引位置；
- start_offset：以字符为单位(包含空格)，一个字符占一个索引，从0开始，表示该term的第一个字符的索引位置(包含该位置)；
- end_offset：以字符为单位(包含空格)，一个字符占一个索引，从0开始，表示该term的最后一个字符的索引位置(不包含该位置)；
- payload：主要用于自定字段的权重；

默认情况下，这些值不会被返回，因为term statistics可能会对性能有严重的影响。

Field statistics(字段统计信息)

将field_statistics(默认为true)设置为false将会忽略：

doc_sount文档数(索引下总共有多少文档包含了这个字段，只要字段名相同就算，字段值不一定要相同)；
sum_doc_freq文档频率的总和(在这个字段中所有term的文档频率总和，这里理解下来，每个文档中该字段中总共含有多个单词，将所有包含该字段的文档都这样计算后进行加和即可，注意同一个文档中重复出现的单词只算一次，不同文档中含有相同单词可以重复算)；
sum_ttf(sum of total term frequencies)总的term频率之和(在该字段中每个trem的总频率之和，我自己理解下来就是每个文档中该字段中总共含有多个单词，将所有包含该字段的文档都这样计算后进行加和，这里不管同一文档中对应字段中的单词是否重复)；

Terms Filtering

使用filter参数，还可以根据其 tf-idf 的分数过滤返回的term，这对于找出文档的良好特征 term 可能是有用的，下面是支持的子参数：

`max_num_terms`	每个字段必须返回的最大term数量，默认 `25`
`min_term_freq`	忽略源文档中低于此频率的单词，默认 `1`
`max_term_freq`	忽略源文档中超过此频率的单词，默认无界
`min_doc_freq`	忽略至少在这么多文档中没有出现的术语，默认 `1`.
`max_doc_freq`	忽略超过这么多文档中出现的单词，默认无界
`min_word_length`	最小字长，低于该字长将被忽略，默认 `0`.
`max_word_length`	最大字长，高于该字长将被忽略，默认无界 (`0`).

行为

term和字段统计并不是准确的，删除的文档也是计算到里面的，仅为请求的文档所在的分片检索信息。因此，term和字段统计仅用作相对度量，而绝对数量在此上下文中没有意义。默认情况下，当人造文档请求term vector，从随机选择的碎片中获取统计信息，使用routing取寻找命中特定的碎片。

案例1：返回存储的term vetors

// 1.创建一个存储了term vectors的索引
PUT /twitter/
{ "mappings": {
    "_doc": { // 文档类型
      "properties": { // 文档各个属性字段的定义
        "text": {
          "type": "text",
          "term_vector": "with_positions_offsets_payloads",
          "store" : true,
          "analyzer" : "fulltext_analyzer"
         },
         "fullname": {
          "type": "text",
          "term_vector": "with_positions_offsets_payloads",
          "analyzer" : "fulltext_analyzer"
        }
      }
    }
  },
  "settings" : {
    "index" : {
      "number_of_shards" : 1,
      "number_of_replicas" : 0
    },
    "analysis": {
      "analyzer": {
        "fulltext_analyzer": {
          "type": "custom",
          "tokenizer": "whitespace",
          "filter": [
            "lowercase",
            "type_as_payload"
          ]
        }
      }
    }
  }
}

// 2.往索引中添加文档
PUT /twitter/_doc/1
{
  "fullname" : "John Doe",
  "text" : "twitter test test test "
}

PUT /twitter/_doc/2
{
  "fullname" : "Jane Doe",
  "text" : "Another twitter test ..."
}

// 3.获取id为1的文档所有信息和text字段的统计信息
GET /twitter/_doc/1/_termvectors
{
  "fields" : ["text"],
  "offsets" : true,
  "payloads" : true,
  "positions" : true,
  "term_statistics" : true,
  "field_statistics" : true
}

// 响应的结果
{
  "_index": "twitter",
  "_type": "_doc",
  "_id": "1",
  "_version": 1,
  "found": true,
  "took": 11,
  "term_vectors": {
    "text": {
      "field_statistics": {
        "sum_doc_freq": 6, // 文档1中text字段含2个单词(test出现3次只能算一次)，文档2中含4个单词，所以总共是6
        "doc_count": 2, // 文档1和2都包含text字段，所以为2
        "sum_ttf": 8 // 文档1中text字段含4个单词，同样文档2含4个单词，总和为8
      },
      "terms": {
        "test": {
          "doc_freq": 2, // “test”这个term总共在文档1和文档2中出现过，所以出现term的文档上为2
          "ttf": 4,
          "term_freq": 3, // 在文档1中“test”这个term出现了3次
          "tokens": [
            {
              "position": 1, // 第一个test在1号位出现
              "start_offset": 8, // test的第一个字符从8号位开始
              "end_offset": 12, // test的在12号位结束
              "payload": "d29yZA==" // 自定义权重
            },
            {
              "position": 2,
              "start_offset": 13,
              "end_offset": 17,
              "payload": "d29yZA=="
            },
            {
              "position": 3,
              "start_offset": 18,
              "end_offset": 22,
              "payload": "d29yZA=="
            }
          ]
        },
        "twitter": {
          "doc_freq": 2,
          "ttf": 2,
          "term_freq": 1,
          "tokens": [
            {
              "position": 0,
              "start_offset": 0,
              "end_offset": 7,
              "payload": "d29yZA=="
            }
          ]
        }
      }
    }
  }
}

案例2：运行时生成term vectors

未明确存储在索引中的term vectors将在运行中自动计算，以下请求将返回id为1的文档中字段的所有信息和统计信息，即使这些term尚未明确存储在索引中，注意对于text字段，term不会重新生成。

GET /twitter/_doc/1/_termvectors
{
  "fields" : ["text", "some_field_without_term_vectors"],
  "offsets" : true,
  "positions" : true,
  "term_statistics" : true,
  "field_statistics" : true
}

案例3：手动给的文档

Term vector也可以使用人造文档生成，适用于不在索引中的文档，比如这个案例将会返回和案例1一样的响应，使用的映射由index和type决定。如果动态映射是打开的状态(默认就是打开的)，不在原始映射的文档字段将会被动态创建。

GET /twitter/_doc/_termvectors
{
  "doc" : {
    "fullname" : "John Doe",
    "text" : "twitter test test test"
  }
}

此外，可以通过使用per_field_analyzer参数提供与现场不同的分析器。这对于以任何方式生成term vector是有用的，尤其是在使用人工文档时。当为已经存储term vector的字段提供分析器时，term vector将重新生成:

GET /twitter/_doc/_termvectors
{
  "doc" : {
    "fullname" : "John Doe",
    "text" : "twitter test test test"
  },
  "fields": ["fullname"],
  "per_field_analyzer" : { //提供新分析器
    "fullname": "keyword"
  }
}

// 上述命令的响应
{
  "_index": "twitter",
  "_type": "_doc",
  "_version": 0,
  "found": true,
  "took": 0,
  "term_vectors": {
    "fullname": {
      "field_statistics": {
        "sum_doc_freq": 4,
        "doc_count": 2,
        "sum_ttf": 4
      },
      "terms": {
        "John Doe": {
          "term_freq": 1,
          "tokens": [
            {
              "position": 0,
              "start_offset": 0,
              "end_offset": 8
            }
          ]
        }
      }
    }
  }
}

案例4： term 过滤

返回的 term 可以基于它们的 tf-idf 分数进行过滤，下面的这个案例从具备被给的plot字段值的人造文档获取3个最有意思的关键词，注意关键词Tony或者任何停止的单词都不是响应的一部分，作为它们的 tf-idf 必须很低，小栗子如下：

GET /imdb/_doc/_termvectors
{
    "doc": {
      "plot": "When wealthy industrialist Tony Stark is forced to build an armored suit after a life-threatening incident, he ultimately decides to use its technology to fight against evil."
    },
    "term_statistics" : true,
    "field_statistics" : true,
    "positions": false,
    "offsets": false,
    "filter" : {
      "max_num_terms" : 3,
      "min_term_freq" : 1,
      "min_doc_freq" : 1
    }
}

// 上述的例子我没有调试通过404，索引改成本地索引后term vector中为空
{
   "_index": "imdb",
   "_type": "_doc",
   "_version": 0,
   "found": true,
   "term_vectors": {
      "plot": {
         "field_statistics": {
            "sum_doc_freq": 3384269,
            "doc_count": 176214,
            "sum_ttf": 3753460
         },
         "terms": {
            "armored": {
               "doc_freq": 27,
               "ttf": 27,
               "term_freq": 1,
               "score": 9.74725
            },
            "industrialist": {
               "doc_freq": 88,
               "ttf": 88,
               "term_freq": 1,
               "score": 8.590818
            },
            "stark": {
               "doc_freq": 44,
               "ttf": 47,
               "term_freq": 1,
               "score": 9.272792
            }
         }
      }
   }
}

9.2.5 Multi termvectors 接口

这个接口允许一次获取多个termvector，检索 term vector 的文档由index、type、id指定，但是这些文档也可以是在请求体中人工提供的。响应包含了一个包含所有获取的 termvectors 的doc数组，每个元素有由termvectors接口提供的结构体。

POST /_mtermvectors
{
   "docs": [
      {
         "_index": "twitter",
         "_type": "_doc",
         "_id": "2",
         "term_statistics": true
      },
      {
         "_index": "twitter",
         "_type": "_doc",
         "_id": "1",
         "fields": [
            "message"
         ]
      }
   ]
}

_mtermvectors端点也可以用于索引，这种情况下请求不是必需的：

POST /twitter/_mtermvectors
{
   "docs": [
      {
         "_type": "_doc",
         "_id": "2",
         "fields": [
            "message"
         ],
         "term_statistics": true
      },
      {
         "_type": "_doc",
         "_id": "1"
      }
   ]
}

// 以及这一类
POST /twitter/_doc/_mtermvectors
{
   "docs": [
      {
         "_id": "2",
         "fields": [
            "message"
         ],
         "term_statistics": true
      },
      {
         "_id": "1"
      }
   ]
}

如果所有的请求的文档都在同一个索引下的同一个类型中，并且参数也一样，那请求可以简写成：

POST /twitter/_doc/_mtermvectors
{
    "ids" : ["1", "2"],
    "parameters": {
        "fields": [
                "message"
        ],
        "term_statistics": true
    }
}

此外，和termvectors接口一样， term vector 将会为提供文档的用户生成，使用的映射由_index和_type决定：

POST /_mtermvectors
{
   "docs": [
      {
         "_index": "twitter",
         "_type": "_doc",
         "doc" : {
            "user" : "John Doe",
            "message" : "twitter test test test"
         }
      },
      {
         "_index": "twitter",
         "_type": "_doc",
         "doc" : {
           "user" : "Jane Doe",
           "message" : "Another twitter test ..."
         }
      }
   ]
}

蓝桥杯拔河 wuqingshun314159 蓝桥杯十五届蓝桥杯C/C++B组蓝桥杯职场和发展算法 c++c语言数据结构
问题描述小明是学校里的一名老师，他带的班级共有n名同学，第i名同学的力量值为a_i。在闲暇之余，小明决定在班级里组织一场拔河比赛。为了保证比赛双方实力尽可能接近，需要在这n名同学中挑选出两个队伍：每个队伍内的同学编号连续，分别为：{a_l1,a_l1+1,...,a_r1}{a_l2,a_l2+1,...,a_r2}满足：l1≤r1#includeusingnamespacestd;typedef
Linux的权限巷子里的童年ya linux 运维服务器 centos
基本权限与归属读取：允许查看内容-readr写入：允许修改内容-writew可执行：允许运行和切换-excutex1、对于文本文件：r读取权限：cat、less、grep、head、tailw写入权限：vim、>、>>x可执行权限：Shell与Python\Go2、对于目录：r读取权限：ls命令查看目录内容w写入权限：能够创建、删除、修改等目录的内容x执行权限：能够cd切换到此目录下（进入此目录）
正则表达式基本语法和Java中的简单使用 XF鸭 SX记录正则表达式
先来个例子publicstaticfinalPatternCHINESE_PATTERN=Pattern.compile("[\\u4e00-\\u9fa5]");/检测字符串是否包含汉字Stringtext="Hello世界";booleanhasChinese=CHINESE_PATTERN.matcher(text).find();//返回true//提取所有汉字Matchermatcher
gdal geometry java_GDAL Geometry对象操作 - 创建对象 weixin_39887577 gdal geometry java
说明：在运行下列代码前，需要加入GDAL/OGR的引用，并导入命名空间usingOSGeo.OGR;并注册驱动器定义了PrintGeometry函数，用于打印输出几何对象，在代码中不再一一调用privatestaticvoidPrintGeometry(Geometrygeo){Console.WriteLine(geo.ExportToJson(null));stringstrWkt;geo.E
mysql外键设置 moxiaoran5753 mysql 数据库
在mysql表设计时，如果巧用外键设置，可以给我们的开发带有很大的便利。应用场景：子表依赖于父表，或父子表存在某种关联；那么就存在父表或子表数据发生变化时，对应的子表或父表的数据应该作何改变；主要涉及以下处理：CASCADE,NOACTION,RESTRICT,SETNULL;下面简要概括下这4个设置适用的场景：1.CASCADE（级联操作）ONDELETECASCADE：当父表中的某条记录被删除
mybatis-plus使用聚合函数查询平均分 moxiaoran5753 mybatis
mybatis-plus使用聚合函数Avg查询平均分时，返回值是BigDecimal，这一点需要注意，不能直接使用Double或float来接收返回值，下面是使用示例：publicDoublegetAvgStore(Listids){QueryWrapperqueryWrapper=newQueryWrapper>resultList=baseMapper.selectMaps(queryWrap
大模型微调方法之Delta-tuning 空白II 大语言模型论文解读微调方法介绍微调方法 delta-tuning 论文解读大语言模型
大模型微调方法之Delta-tuning大模型微调方法自从23年之后可谓是百花齐放，浙大有团队在8月将关于大模型微调方法的综述上传了ArXiv。论文将微调方法总结为等几个类别。本次讨论的1大模型业务分类当前的大模型行业可谓百花齐放，自然语言处理（naturallanguageprocessing,NLP）、计算机视觉（computervision,CV）、音频处理（audioprocessing,
鸿蒙开发：正则中的match和matchAll
前言本文基于Api13关于正则表达式，其实之前也撰写过相关文章，但没有对match和matchAll做过详细的分析，虽然都是用于常见的字符串匹配，但是在使用方式上还是具有一定的区别；大家记住一点，正则表达式适用于所有的编程语言，可能有些语法和使用方式有些不同，但基本的原理是一样的。我们先看下源码：match：将字符串与正则表达式匹配，并返回一个包含该搜索结果的数组。/***Matchesastri
筛选素数的三种方法小赖同学吖算法 c++
判断一个数是不是素数，相信大家都知道，那么如果每一个数，都规规矩矩的使用判断[1,本身]是否有除了本身和1，以外的可以整除的数，这样的做法显然不可取的，如果查看1~n的素数，这样的时间复杂度为O（n^2）1.朴素筛法这个筛法的思想是，每一次把枚举到的数x的倍数筛选掉，这样就可以优化一些时间复杂度为O(N*lnN)具体代码#includeusingnamespacestd;intn,cnt;cons
3.19刷题山遥路源算法刷题 c++
P6443[COCI2010/2011#1]TIMSKO-洛谷#includeusingnamespacestd;intmain(){intn,m,k,maxp=0;cin>>m>>n>>k;for(inti=0;iusingnamespacestd;chara[15][15];intmain(){intr,c,k;cin>>r>>c;for(inti=0;i>a[i][j];}}cin>>k;i
3.21刷题山遥路源算法刷题 c++
P6723[COCI2015/2016#5]ZAMKA-洛谷#includeusingnamespacestd;intweisum(intn){intsum=0;while(n){sum+=n%10;n/=10;}returnsum;}intmain(){intl,d,x,minn=10000,maxm=0;cin>>l>>d>>x;for(inti=l;imaxm)maxm=i;}}coutus
3.15刷题山遥路源算法刷题 c++
P6337[COCI2007/2008#2]CRNE-洛谷#includeusingnamespacestd;intmain(){intn;cin>>n;//横加竖最大。n/2,n/2+1if(n%2==0){coutusingnamespacestd;chara[25][25];intmain(){intr,c;stringmins="zz",t;cin>>r>>c;for(inti=1;i>a
2.22-2.27刷题记录山遥路源算法刷题 c++
2.22P1420最长连号-洛谷#includeusingnamespacestd;inta[10010];intmain(){intn,ans=0,l=1;cin>>n;for(inti=0;i>a[i];}for(inti=1;ians)ans=l;}coutusingnamespacestd;intmain(){inta,b,bi=19,yu;cin>>a>>b;yu=a*10+b;cout
3.22 codeforces小结 Brokenrivers 总结随记 Codeforces 算法竞赛编译错误签到题实战经验
说来好笑，也算接触小半年算法了，这次算是第一次"正式"的打cf。之前因为一些原因比较倾向于找个空闲时间上oj上刷题，虽然知道cf对一个搞算法竞赛的人的重要性，但是一直没去蹲点打比赛（我觉得就是我们宿舍这破网上个cf要转两分钟圈圈还经常崩的原因），最多会在比赛结束找比赛题目的文档练习。这次因为组队了，希望能和队友实时交流，手机开了梯子热点打完了这次的cf。感觉就是，自己像个傻子一样，提交代码的语言选
C# WinForms 输入验证实战：正则表达式从入门到高效应用 Ro小陌窗体 C#WinForms 算法 c#正则表达式开发语言
在C#WinForms开发中，正则表达式常用于验证用户输入（如文本框内容）。以下是结合WinForms的详细正则表达式应用指南：1.正则表达式基础使用System.Text.RegRegularExpressions命名空间：csharpusingSystem.Text.RegularExpressions;常用类：Regex2.WinForms输入验证示例场景：验证邮箱输入csharppriva
残疾人员检测数据集VOC+YOLO格式3168张5类别 FL1623863129 数据集 YOLO 深度学习机器学习
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：3168标注数量(xml文件个数)：3168标注数量(txt文件个数)：3168标注类别数：5标注类别名称(注意yolo格式类别顺序不和这个对应，而以labels文件夹classes.txt为准):["person-ba
寻找通义灵码 AI 程序员 {头号玩家} ，体验 QwQ-Plus、DeepSeek 满血版的通义灵码云原生
2025年1月，通义灵码AI程序员全面上线，同时支持VSCode、JetBrainsIDEs，是国内首个真正落地的AI程序员。近期，通义灵码能力再升级全新上线模型选择功能，目前已经支持QwQ-plus、DeepSeek满血版模型，用户可以在VSCode和JetBrains里搜索并下载最新通义灵码插件，在输入框里选择模型，即可轻松切换模型。通义灵码联合CHERRY中国全网发起寻找AI程序员{头号玩家
3.22刷题山遥路源算法刷题 c++
B3763[语言月赛202305]团体程序设计天梯赛-洛谷#includeusingnamespacestd;intmain(){intx,jichu=0,jinjie=0,dingbu=0;for(inti=0;i>x;jichu+=x;}if(jichu>=80){for(inti=0;i>x;jinjie+=x;}if(jinjie>=40){for(inti=0;i>x;dingbu+=x
大模型的应用与微调：如何调用 LLM？从 OpenAI API 到本地部署晴天彩虹雨 AI 大模型 ai 语言模型 gpt 人工智能
本篇文章将详细介绍如何调用大语言模型（LLM），涵盖OpenAIAPI、DeepSeek、Manus、通义千问等模型的调用方式，并探讨如何在本地部署LLM进行推理。1.调用OpenAIAPI（GPT系列）OpenAI提供了RESTfulAPI供开发者调用GPT系列模型。示例：使用Python调用OpenAIAPIimportopenaiopenai.api_key="your_api_key"re
Git更改暂存 : Git Pull 错误的快速解决方法 robot_learner git
你是否遇到过在运行gitpull时出现如下错误？error:cannotpullwithrebase:Youhaveunstagedchanges.error:pleasecommitorstashthem.该消息表明Git检测到你的工作目录中存在尚未暂存或提交的修改。为了防止在执行pull操作时产生冲突或潜在的数据丢失，Git提示你需要先提交或暂存这些更改。今天，我将向你展示如何使用stash命
idear 出现unable to save setting:failed to save settings.please restart intellij idea异常不开心就吐槽 intellij-idea
1.idea出现一下异常unabletosavesetting:failedtosavesettings.pleaserestartintellijidea2.解决办法先关闭IDEA，然后找到C:\Users\wuxin.IntelliJIdea2019.3\system\caches（管理员目录中的位置），删除caches目录中所有的文件（不要删除caches目录），再启动IDEA就可以了。3.
python实现简易任务管理器 Roc-xb python 服务器 linux
本章教程，主要利用python实现一个简单的任务管理器，可以快速结束任务进程。目录一、实例代码二、效果演示一、实例代码#!/usr/bin/python#-*-coding:UTF-8-*-"""@author:Roc-xb"""#encoding:utf-8importsubprocessdefexecute_cmd(command):subprocess.run('chcp65001',she
Chapter 27: Expression Templates_《C++ Templates》notes 郭涤生 c/c++c++开发语言笔记
ExpressionTemplatesKeyConcepts:Part1:CoreConcepts&CodeImplementationPart2:AdvancedConcepts&ExtensionsPart3:OptimizationAnalysisMultipleChoiceQuestions(HardDifficulty)DetailedDesignQuestionsAnswers&Exp
内部类（四大类型） *+ java 开发语言
内部类分为四种一.实例内部类classOutclass{publicintdate1=1;publicstaticintdate2=2;privateintdate3=3;classInnerClass{publicintdate4=4;publicstaticfinalintdate5=5;privateintdate6=6;publicvoidtest(){System.out.println
【图片合并PDF】多个文件夹里的图片合并PDF，一次性批量合并多个文件夹里的图片转成PDF，基于WPF完成方案分享平安喜乐-开开心心 PDF处理类 pdf wpf 多个文件夹图片合并PDF 图片转PDF的批量操作方法
一、项目背景在日常工作和生活中，我们经常需要将多个文件夹中的图片合并成一个PDF文件。例如，整理旅行照片、制作项目报告、归档文档等场景。手动逐一将图片转换为PDF并合并非常耗时且容易出错。因此，开发一个自动化工具来批量处理多个文件夹中的图片并将其合并为一个PDF文件，可以大大提高工作效率。本项目旨在开发一个基于WPF（WindowsPresentationFoundation）的桌面应用程序，用户
SQLServer : DDL,DML,DQL,DCL的区别 SJ15630070060 Sql Server sqlserver 数据库
01、DDL（DataDefinitionLanguages）语句：即数据库定义语句，用来创建数据库中的表、索引、视图、存储过程、触发器等对象。SQLServerDLL语法是指SQLServer数据库定义域发的语法规则集合，主要包括创建、修改和删除数据库对象的语句。常用的语句关键字有：【createtable创建表】、【altertable修改表】、【droptable删除表】、【truncate
算法竞赛备赛——【数论】高精度 Aurora_wmroy 算法竞赛备赛算法 c++数据结构蓝桥杯
高精度高精度计算，也被称作大整数计算，运用了一些算法结构来支持更大整数间的运算（数字大小超过语言内建整型）。加法P1601A+BProblem（高精）-洛谷#includeusingnamespacestd;constintN=10100;inta[N],b[N],c[N];intinit(intx[]){//读入数返回位数strings;cin>>s;intl=s.size();for(inti
k8s故障排查一 zuo84526076
问题一：报错cannotallocatememory或者nospaceleftondevice，修复K8S内存泄露问题问题描述一.当k8s集群运行日久以后，有的node无法再新建pod，并且出现如下错误，当重启服务器之后，才可以恢复正常使用。查看pod状态的时候会出现以下报错。applyingcgroup…caused:mkdir…nospaceleftondevice或者在describepod
ngx_http_escape_location_name 若云止水 nginx
定义在src\http\ngx_http.cstaticngx_int_tngx_http_escape_location_name(ngx_conf_t*cf,ngx_http_core_loc_conf_t*clcf){u_char*p;size_tlen;uintptr_tescape;escape=2*ngx_escape_uri(NULL,clcf->name.data,clcf->na
ngx_escape_uri 若云止水 websocket 网络协议网络
定义在src/core/ngx_string.huintptr_tngx_escape_uri(u_char*dst,u_char*src,size_tsize,ngx_uint_ttype);定义在src\core\ngx_string.cuintptr_tngx_escape_uri(u_char*dst,u_char*src,size_tsize,ngx_uint_ttype){ngx_ui
JAVA基础灵静志远位运算加载 Date 字符串池覆盖
一、类的初始化顺序 1 （静态变量，静态代码块）-->（变量，初始化块）--> 构造器同一括号里的，根据它们在程序中的顺序来决定。上面所述是同一类中。如果是继承的情况，那就在父类到子类交替初始化。二、String 1 String a = "abc"; JAVA虚拟机首先在字符串池中查找是否已经存在了值为"abc"的对象，根
keepalived实现redis主从高可用 bylijinnan redis
方案说明两台机器（称为A和B），以统一的VIP对外提供服务 1.正常情况下，A和B都启动，B会把A的数据同步过来（B is slave of A） 2.当A挂了后，VIP漂移到B；B的keepalived 通知redis 执行：slaveof no one，由B提供服务 3.当A起来后，VIP不切换，仍在B上面；而A的keepalived 通知redis 执行slaveof B，开始
java文件操作大全 0624chenhong java
最近在博客园看到一篇比较全面的文件操作文章，转过来留着。 http://www.cnblogs.com/zhuocheng/archive/2011/12/12/2285290.html 转自http://blog.sina.com.cn/s/blog_4a9f789a0100ik3p.html 一.获得控制台用户输入的信息 &nbs
android学习任务不懂事的小屁孩工作
任务完成情况搞清楚带箭头的pupupwindows和不带的使用已完成熟练使用pupupwindows和alertdialog，并搞清楚两者的区别已完成熟练使用android的线程handler,并敲示例代码进行中了解游戏2048的流程，并完成其代码工作进行中-差几个actionbar 研究一下android的动画效果，写一个实例已完成复习fragem
zoom.js 换个号韩国红果果 oom
它的基于bootstrap 的 https://raw.github.com/twbs/bootstrap/master/js/transition.js transition.js模块引用顺序 <link rel="stylesheet" href="style/zoom.css"> <script src=&q
详解Oracle云操作系统Solaris 11.2 蓝儿唯美 Solaris
当Oracle发布Solaris 11时，它将自己的操作系统称为第一个面向云的操作系统。Oracle在发布Solaris 11.2时继续它以云为中心的基调。但是，这些说法没有告诉我们为什么Solaris是配得上云的。幸好，我们不需要等太久。Solaris11.2有4个重要的技术可以在一个有效的云实现中发挥重要作用：OpenStack、内核域、统一存档（UA）和弹性虚拟交换（EVS）。
spring学习——springmvc（一） a-john springMVC
Spring MVC基于模型-视图-控制器（Model-View-Controller，MVC）实现，能够帮助我们构建像Spring框架那样灵活和松耦合的Web应用程序。 1，跟踪Spring MVC的请求请求的第一站是Spring的DispatcherServlet。与大多数基于Java的Web框架一样，Spring MVC所有的请求都会通过一个前端控制器Servlet。前
hdu4342 History repeat itself-------多校联合五 aijuans 数论
水题就不多说什么了。 #include<iostream>#include<cstdlib>#include<stdio.h>#define ll __int64using namespace std;int main(){ int t; ll n; scanf("%d",&t); while(t--)
EJB和javabean的区别 asia007 bean ejb
EJB不是一般的JavaBean,EJB是企业级JavaBean,EJB一共分为3种,实体Bean,消息Bean,会话Bean,书写EJB是需要遵循一定的规范的,具体规范你可以参考相关的资料.另外,要运行EJB,你需要相应的EJB容器,比如Weblogic,Jboss等,而JavaBean不需要,只需要安装Tomcat就可以了 1.EJB用于服务端应用开发, 而JavaBeans
Struts的action和Result总结百合不是茶 struts Action配置 Result配置
一:Action的配置详解: 下面是一个Struts中一个空的Struts.xml的配置文件 <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC &quo
如何带好自已的团队 bijian1013 项目管理团队管理团队
在网上看到博客" 怎么才能让团队成员好好干活"的评论，觉得写的比较好。原文如下：我做团队管理有几年了吧，我和你分享一下我认为带好团队的几点： 1.诚信对团队内成员，无论是技术研究、交流、问题探讨，要尽可能的保持一种诚信的态度，用心去做好，你的团队会感觉得到。 2.努力提
Java代码混淆工具 sunjing ProGuard
Open Source Obfuscators ProGuard http://java-source.net/open-source/obfuscators/proguardProGuard is a free Java class file shrinker and obfuscator. It can detect and remove unused classes, fields, m
【Redis三】基于Redis sentinel的自动failover主从复制 bit1129 redis
在第二篇中使用2.8.17搭建了主从复制，但是它存在Master单点问题，为了解决这个问题，Redis从2.6开始引入sentinel，用于监控和管理Redis的主从复制环境，进行自动failover，即Master挂了后，sentinel自动从从服务器选出一个Master使主从复制集群仍然可以工作，如果Master醒来再次加入集群，只能以从服务器的形式工作。什么是Sentine
使用代理实现Hibernate Dao层自动事务白糖_ DAO spring AOP 框架 Hibernate
都说spring利用AOP实现自动事务处理机制非常好，但在只有hibernate这个框架情况下，我们开启session、管理事务就往往很麻烦。 public void save(Object obj){ Session session = this.getSession(); Transaction tran = session.beginTransaction(); try
maven3实战读书笔记 braveCS maven3
Maven简介是什么？ Is a software project management and comprehension tool.项目管理工具是基于POM概念(工程对象模型) [设计重复、编码重复、文档重复、构建重复，maven最大化消除了构建的重复] [与XP：简单、交流与反馈；测试驱动开发、十分钟构建、持续集成、富有信息的工作区] 功能：
编程之美-子数组的最大乘积 bylijinnan 编程之美
public class MaxProduct { /** * 编程之美子数组的最大乘积 * 题目: 给定一个长度为N的整数数组，只允许使用乘法，不能用除法，计算任意N-1个数的组合中乘积中最大的一组，并写出算法的时间复杂度。 * 以下程序对应书上两种方法，求得“乘积中最大的一组”的乘积——都是有溢出的可能的。 * 但按题目的意思，是要求得这个子数组，而不
读书笔记-2 chengxuyuancsdn 读书笔记
1、反射 2、oracle年-月-日时-分-秒 3、oracle创建有参、无参函数 4、oracle行转列 5、Struts2拦截器 6、Filter过滤器(web.xml) 1、反射 (1)检查类的结构在java.lang.reflect包里有3个类Field,Method,Constructor分别用于描述类的域、方法和构造器。 2、oracle年月日时分秒 s
[求学与房地产]慎重选择IT培训学校 comsci it
关于培训学校的教学和教师的问题,我们就不讨论了,我主要关心的是这个问题培训学校的教学楼和宿舍的环境和稳定性问题我们大家都知道，房子是一个比较昂贵的东西，特别是那种能够当教室的房子... &nb
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系 daizj oracle rman filesperset PARALLELISM
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系转 PARALLELISM --- 我们还可以通过parallelism参数来指定同时"自动"创建多少个通道： RMAN > configure device type disk parallelism 3 ; 表示启动三个通道，可以加快备份恢复的速度。
简单排序:冒泡排序 dieslrae 冒泡排序
public void bubbleSort(int[] array){ for(int i=1;i<array.length;i++){ for(int k=0;k<array.length-i;k++){ if(array[k] > array[k+1]){
初二上学期难记单词三 dcj3sjt126com sciet
concert 音乐会 tonight 今晚 famous 有名的；著名的 song 歌曲 thousand 千 accident 事故；灾难 careless 粗心的，大意的 break 折断；断裂；破碎 heart 心（脏） happen 偶尔发生，碰巧 tourist 旅游者；观光者 science （自然）科学 marry 结婚 subject 题目；
I.安装Memcahce 1. 安装依赖包libevent Memcache需要安装libevent,所以安装前可能需要执行 Shell代码收藏代码 dcj3sjt126com redis
wget http://download.redis.io/redis-stable.tar.gz tar xvzf redis-stable.tar.gz cd redis-stable make 前面3步应该没有问题，主要的问题是执行make的时候，出现了异常。异常一： make[2]: cc: Command not found 异常原因：没有安装g
并发容器 shuizhaosi888 并发容器
通过并发容器来改善同步容器的性能，同步容器将所有对容器状态的访问都串行化，来实现线程安全，这种方式严重降低并发性，当多个线程访问时，吞吐量严重降低。并发容器ConcurrentHashMap 替代同步基于散列的Map，通过Lock控制。 &nb
Spring Security（12）——Remember-Me功能 234390216 Spring Security Remember Me 记住我
Remember-Me功能目录 1.1 概述 1.2 基于简单加密token的方法 1.3 基于持久化token的方法 1.4 Remember-Me相关接口和实现
位运算焦志广位运算
一、位运算符Ｃ语言提供了六种位运算符： & 按位与 | 按位或 ^ 按位异或 ~ 取反 << 左移 >> 右移 1. 按位与运算按位与运算符"&"是双目运算符。其功能是参与运算的两数各对应的二进位相与。只有对应的两个二进位均为1时，结果位才为1 ，否则为0。参与运算的数以补码方式出现。例如：9&am
nodejs 数据库连接 mongodb mysql liguangsong mongodb mysql node 数据库连接
1.mysql 连接 package.json中dependencies加入 "mysql":"~2.7.0" 执行 npm install 在config 下创建文件 database.js
java动态编译 olive6615 java HotSpot jvm 动态编译
在HotSpot虚拟机中，有两个技术是至关重要的，即动态编译(Dynamic compilation)和Profiling。 HotSpot是如何动态编译Javad的bytecode呢？Java bytecode是以解释方式被load到虚拟机的。HotSpot里有一个运行监视器，即Profile Monitor,专门监视
Storm0.9.5的集群部署配置优化 roadrunners 优化 storm.yaml
nimbus结点配置（storm.yaml）信息： # Licensed to the Apache Software Foundation (ASF) under one # or more contributor license agreements. See the NOTICE file # distributed with this work for additional inf
101个MySQL 的调节和优化的提示 tomcat_oracle mysql
　1. 拥有足够的物理内存来把整个InnoDB文件加载到内存中——在内存中访问文件时的速度要比在硬盘中访问时快的多。　　2. 不惜一切代价避免使用Swap交换分区 – 交换时是从硬盘读取的，它的速度很慢。　　3. 使用电池供电的RAM（注：RAM即随机存储器）。　　4. 使用高级的RAID（注：Redundant Arrays of Inexpensive Disks，即磁盘阵列
zoj 3829 Known Notation(贪心) 阿尔萨斯 ZOJ
题目链接：zoj 3829 Known Notation 题目大意：给定一个不完整的后缀表达式，要求有2种不同操作，用尽量少的操作使得表达式完整。解题思路：贪心，数字的个数要要保证比∗的个数多1，不够的话优先补在开头是最优的。然后遍历一遍字符串，碰到数字+1，碰到∗-1,保证数字的个数大于等1，如果不够减的话，可以和最后面的一个数字交换位置（用栈维护十分方便），因为添加和交换代价都是1

ES学习记录9——关于Term

9.2.4 Term Vector

9.2.5 Multi termvectors 接口

你可能感兴趣的:(#,ES,Elasticsearch)