D_A_I_H_A_O

谷粒商城微服务分布式高级篇ElasticSearch二——重要概念及原理

文章目录

面向文档
索引
分布式特性
分布式集群
集群健康
添加索引
增加故障转移
横向扩展
继续扩展
应对故障
数据结构

什么是文档？
文档元数据

_index
_type
_id

其他元数据

_source
_all
_uid

Elasticsearch搜索原理

正排索引和倒排索引

正排索引
倒排索引

分词

分词机制
分词API
Elasticsearch自带的分词器
中文分词
Character Filters
Token Filter
自定义分词api
分词使用场景

面向文档

应用中的对象很少只是简单的键值列表，更多时候它拥有复杂的数据结构，比如包含日期、地理位置、另一个对象或者数组。

总有一天你会想到把这些对象存储到数据库中。将这些数据保存到由行和列组成的关系数据库中，就好像是把一个丰富，信息表现力强的对象拆散了放入一个非常大的表格中：你不得不拆散对象以适应表模式（通常一列表示一个字段），然后又不得不在查询的时候重建它们。

Elasticsearch是面向文档(document oriented)的，这意味着它可以存储整个对象或文档(document)。然而它不仅仅是存储，还会索引(index)每个文档的内容使之可以被搜索。在Elasticsearch中，你可以对文档（而非成行成列的数据）进行索引、搜索、排序、过滤。这种理解数据的方式与以往完全不同，这也是Elasticsearch能够执行复杂的全文搜索的原因之一。

ELasticsearch使用Javascript对象符号(JavaScript Object Notation)，也就是JSON，作为文档序列化格式。JSON现在已经被大多语言所支持，而且已经成为NoSQL领域的标准格式。它简洁、简单且容易阅读。

以下使用JSON文档来表示一个用户对象：

{
    "email":      "[email protected]",
    "first_name": "John",
    "last_name":  "Smith",
    "info": {
        "bio":         "Eco-warrior and defender of the weak",
        "age":         25,
        "interests": [ "dolphins", "whales" ]
    },
    "join_date": "2014/05/01"
}

尽管原始的user对象很复杂，但它的结构和对象的含义已经被完整的体现在JSON中了，在Elasticsearch中将对象转化为JSON并做索引要比在表结构中做相同的事情简单的多。

NOTE

尽管几乎所有的语言都有相应的模块用于将任意数据结构转换为JSON，但每种语言处理细节不同。具体请查看“serialization” or“marshalling”两个用于处理JSON的模块。Elasticsearch官方客户端会自动为你序列化和反序列化JSON。

索引

在Elasticsearch中存储数据的行为就叫做索引(indexing)，不过在索引之前，我们需要明确数据应该存储在哪里。

在Elasticsearch中，文档归属于一种类型(type),而这些类型存在于索引(index)中，我们可以画一些简单的对比图来类比传统关系型数据库：

Relational DB -> Databases -> Tables -> Rows -> Columns
Elasticsearch -> Indices   -> Types  -> Documents -> Fields

Elasticsearch集群可以包含多个索引(indices)（数据库)，每一个索引可以包含多个类型(types)（表)，每一个类型包含多个文档(documents)（行)），然后每个文档包含多个字段(Fields)（列)。

索引含义的区分
你可能已经注意到索引(index)这个词在Elasticsearch中有着不同的含义，所以有必要在此做一下区分:

索引（名词）如上文所述，一个索引(index)就像是传统关系数据库中的数据库，它是相关文档存储的地方，index的复数是indices 或indexes。

索引（动词）索引一个文档表示把一个文档存储到索引（名词）里，以便它可以被检索或者查询。这很像SQL中的INSERT关键字，差别是，如果文档已经存在，新的文档将覆盖旧的文档

倒排索引: 传统数据库为特定列增加一个索引，例如B-Tree索引来加速检索。Elasticsearch和Lucene使用一种叫做倒排索引(inverted index)的数据结构来达到相同目的。默认情况下，文档中的所有字段都会被索引（拥有一个倒排索引），只有这样他们才是可被搜索的

将数据内容打碎成关键字，将索引建立在内容关键字上，通过关键字关联主键，叫做倒排索引

分布式特性

Elasticsearch为分布式而生，而且它的设计隐藏了分布式本身的复杂性。

Elasticsearch致力于隐藏分布式系统的复杂性。以下这些操作都是在底层自动完成的：

1、将你的文档分区到不同的容器或者分片(shards)中，它们可以存在于一个或多个节点中。
2、将分片均匀的分配到各个节点，对索引和搜索做负载均衡。
3、冗余每一个分片，防止硬件故障造成的数据丢失。
4、将集群中任意一个节点上的请求路由到相应数据所在的节点。
5、无论是增加节点，还是移除节点，分片都可以做到无缝的扩展和迁移

Elasticsearch用于构建高可用和可扩展的系统。扩展的方式可以是购买更好的服务器(纵向扩展(vertical scale or scaling up))或者购买更多的服务器（横向扩展(horizontal scale or scaling out)

对于大多数数据库而言，横向扩展意味着你的程序将做非常大的改动才能利用这些新添加的设备。对比来说，Elasticsearch天生就是分布式的：它知道如何管理节点来提供高扩展和高可用。这意味着你的程序不需要关心这些

分布式集群

如果我们启动一个单独的节点，它还没有数据和索引，这个集群看起来就像图

一个节点(node)就是一个Elasticsearch实例，而一个集群(cluster)由一个或多个节点组成，它们具有相同的cluster.name，它们协同工作，分享数据和负载。当加入新的节点或者删除一个节点时，集群就会感知到并平衡数据。

集群中一个节点会被选举为主节点(master),它将临时管理集群级别的一些变更，例如新建或删除索引、增加或移除节点等。主节点不参与文档级别的变更或搜索，这意味着在流量增长的时候，该主节点不会成为集群的瓶颈。任何节点都可以成为主节点。我们例子中的集群只有一个节点，所以它会充当主节点的角色。

做为用户，我们能够与集群中的任何节点通信，包括主节点。每一个节点都知道文档存在于哪个节点上，它们可以转发请求到相应的节点上。我们访问的节点负责收集各节点返回的数据，最后一起返回给客户端。这一切都由Elasticsearch处理.

集群健康

在Elasticsearch集群中可以监控统计很多信息，但是只有一个是最重要的：集群健康(cluster health)。集群健康有三种状态：green、yellow或red。

GET /_cluster/health

在一个没有索引的空集群中运行如上查询，将返回这些信息：

{
   "cluster_name":          "elasticsearch",
   "status":                "green", <1>
   "timed_out":             false,
   "number_of_nodes":       1,
   "number_of_data_nodes":  1,
   "active_primary_shards": 0,
   "active_shards":         0,
   "relocating_shards":     0,
   "initializing_shards":   0,
   "unassigned_shards":     0
}

status 是我们最感兴趣的字段
status字段提供一个综合的指标来表示集群的的服务状况。三种颜色各自的含义：

颜色	意义
green	所有主要分片和复制分片都可用
yellow	所有主要分片可用，但不是所有复制分片都可用
red	不是所有的主要分片都可用

添加索引

为了将数据添加到Elasticsearch，我们需要索引(index)——一个存储关联数据的地方。实际上，索引只是一个用来指向一个或多个分片(shards)的“逻辑命名空间(logical namespace)”.

一个分片(shard)是一个最小级别“工作单元(worker unit)”,它只是保存了索引中所有数据的一部分。
分片就是一个Lucene实例，并且它本身就是一个完整的搜索引擎。
文档存储在分片中，并且在分片中被索引，但是我们的应用程序不会直接与它们通信，取而代之的是直接与索引通信。

分片是Elasticsearch在集群中分发数据的关键。把分片想象成数据的容器。文档存储在分片中，然后分片分配到你集群中的节点上。当你的集群扩容或缩小， Elasticsearch将会自动在你的节点间迁移分片，以使集群保持平衡。

分片可以是主分片(primary shard)或者是复制分片(replica shard)。你索引中的每个文档属于一个单独的主分片，所以主分片的数量决定了索引最多能存储多少数据。

理论上主分片能存储的数据大小是没有限制的，限制取决于你实际的使用情况。分片的最大容量完全取决于你的使用状况：硬件存储的大小、文档的大小和复杂度、如何索引和查询你的文档，以及你期望的响应时间。

复制分片只是主分片的一个副本，它可以防止硬件故障导致的数据丢失，同时可以提供读请求，比如搜索或者从别的shard取回文档。

当索引创建完成的时候，主分片的数量就固定了，但是复制分片的数量可以随时调整

让我们在集群中唯一一个空节点上创建一个叫做blogs的索引。默认情况下，一个索引被分配5个主分片，但是为了演示的目的，我们只分配3个主分片和一个复制分片（每个主分片都有一个复制分片）：

PUT /blogs
{
   "settings" : {
      "number_of_shards" : 3,
      "number_of_replicas" : 1
   }
}

附带索引的单一节点集群：

我们的集群现在看起来就像上图——三个主分片都被分配到Node 1。如果我们现在检查集群健康(cluster-health)，我们将见到以下信息：

{
   "cluster_name":          "elasticsearch",
   "status":                "yellow", <1>
   "timed_out":             false,
   "number_of_nodes":       1,
   "number_of_data_nodes":  1,
   "active_primary_shards": 3,
   "active_shards":         3,
   "relocating_shards":     0,
   "initializing_shards":   0,
   "unassigned_shards":     3 <2>
}

集群的健康状态yellow表示所有的主分片(primary shards)启动并且正常运行了——集群已经可以正常处理任何请求——但是复制分片(replica shards)还没有全部可用。事实上所有的三个复制分片现在都是unassigned状态——它们还未被分配给节点。在同一个节点上保存相同的数据副本是没有必要的，如果这个节点故障了，那所有的数据副本也会丢失。

现在我们的集群已经功能完备，但是依旧存在因硬件故障而导致数据丢失的风险

增加故障转移

在单一节点上运行意味着有单点故障的风险——没有数据备份。幸运的是，要防止单点故障，我们唯一需要做的就是启动另一个节点。

为了测试在增加第二个节点后发生了什么，你可以使用与第一个节点相同的方式启动第二个节点,一个节点可以启动多个Elasticsearch实例

只要第二个节点与第一个节点有相同的cluster.name（请看./config/elasticsearch.yml文件），它就能自动发现并加入第一个节点所在的集群。如果没有，检查日志找出哪里出了问题。这可能是网络广播被禁用，或者防火墙阻止了节点通信。

如果我们启动了第二个节点，这个集群看起来就像下图。
双节点集群——所有的主分片和复制分片都已分配:

第二个节点已经加入集群，三个复制分片(replica shards)也已经被分配了——分别对应三个主分片，这意味着在丢失任意一个节点的情况下依旧可以保证数据的完整性。
文档的索引将首先被存储在主分片中，然后并发复制到对应的复制节点上。这可以确保我们的数据在主节点和复制节点上都可以被检索。
cluster-health现在的状态是green，这意味着所有的6个分片（三个主分片和三个复制分片）都已可用：

{
   "cluster_name":          "elasticsearch",
   "status":                "green", <1>
   "timed_out":             false,
   "number_of_nodes":       2,
   "number_of_data_nodes":  2,
   "active_primary_shards": 3,
   "active_shards":         6,
   "relocating_shards":     0,
   "initializing_shards":   0,
   "unassigned_shards":     0
}

集群的状态是green
我们的集群不仅是功能完备的，而且是高可用的。

横向扩展

随着应用需求的增长，我们该如何扩展？如果我们启动第三个节点，我们的集群会重新组织自己，就像图4：

图4：包含3个节点的集群——分片已经被重新分配以平衡负载：

Node3包含了分别来自Node 1和Node 2的一个分片，这样每个节点就有两个分片，和之前相比少了一个，这意味着每个节点上的分片将获得更多的硬件资源（CPU、RAM、I/O）。

分片本身就是一个完整的搜索引擎，它可以使用单一节点的所有资源。我们拥有6个分片（3个主分片和三个复制分片），最多可以扩展到6个节点，每个节点上有一个分片，每个分片可以100%使用这个节点的资源。

继续扩展

如果我们要扩展到6个以上的节点，要怎么做？

主分片的数量在创建索引时已经确定。实际上，这个数量定义了能存储到索引里数据的最大数量（实际的数量取决于你的数据、硬件和应用场景）。然而，主分片或者复制分片都可以处理读请求——搜索或文档检索，所以数据的冗余越多，我们能处理的搜索吞吐量就越大。

复制分片的数量可以在运行中的集群中动态地变更，这允许我们可以根据需求扩大或者缩小规模。让我们把复制分片的数量从原来的1增加到2：

PUT /blogs/_settings
{
   "number_of_replicas" : 2
}

图5：增加number_of_replicas到2：

从图中可以看出，blogs索引现在有9个分片：3个主分片和6个复制分片。这意味着我们能够扩展到9个节点，再次变成每个节点一个分片。这样使我们的搜索性能相比原始的三节点集群增加三倍。

当然，在同样数量的节点上增加更多的复制分片并不能提高性能，因为这样做的话平均每个分片的所占有的硬件资源就减少了（译者注：大部分请求都聚集到了分片少的节点，导致一个节点吞吐量太大，反而降低性能），你需要增加硬件来提高吞吐量。

不过这些额外的复制节点使我们有更多的冗余：通过以上对节点的设置，我们能够承受两个节点故障而不丢失数据。

应对故障

Elasticsearch可以应对节点失效，所以让我们继续尝试。如果我们杀掉第一个节点的进程（以下简称杀掉节点），我们的集群看起来就像这样：

我们杀掉的节点是一个主节点。一个集群必须要有一个主节点才能使其功能正常，所以集群做的第一件事就是各节点选举了一个新的主节点：Node 2。

主分片1和2在我们杀掉Node 1时已经丢失，我们的索引在丢失主分片时不能正常工作。如果此时我们检查集群健康，我们将看到状态red：不是所有主分片都可用！

幸运的是丢失的两个主分片的完整拷贝存在于其他节点上，所以新主节点做的第一件事是把这些在Node 2和Node 3上的复制分片升级为主分片，这时集群健康回到yellow状态。这个提升是瞬间完成的，就好像按了一下开关。

为什么集群健康状态是yellow而不是green？
我们有三个主分片，但是我们指定了每个主分片对应两个复制分片，当前却只有一个复制分片被分配，这就是集群状态无法达到green的原因，不过不用太担心这个：当我们杀掉Node 2，我们的程序依然可以在没有丢失数据的情况下继续运行，因为Node 3还有每个分片的拷贝。

如果我们重启Node 1，集群将能够重新分配丢失的复制分片，集群状况与上一节的图5：增加number_of_replicas到2 类似。如果Node 1依旧有旧分片的拷贝，它将会尝试再利用它们，它只会从主分片上复制在故障期间有数据变更的那一部分。

以上学习Elasticsearch权威指南，提取码：jdbw

数据结构

什么是文档？

在Elasticsearch中，文档(document)这个术语有着特殊含义。它特指最顶层结构或者根对象(root object)序列化成的JSON数据（以唯一ID标识并存储于Elasticsearch中）。

文档元数据

一个文档不只有数据。它还包含了元数据(metadata)——关于文档的信息。三个必须的元数据节点是：

描述文档数据的数据叫元数据

_index

索引(index)类似于关系型数据库里的“数据库”——它是我们存储和索引关联数据的地方。

事实上，我们的数据被存储和索引在分片(shards)中，索引只是一个把一个或多个分片分组在一起的逻辑空间。然而，这只是一些内部细节——我们的程序完全不用关心分片。对于我们的程序而言，文档存储在索引(index)中。剩下的细节由Elasticsearch关心既可。

这个名字必须是全部小写，不能以下划线开头，不能包含逗号。

_type

在应用中，我们使用对象表示一些“事物”，例如一个用户、一篇博客、一个评论，或者一封邮件。每个对象都属于一个类(class)，这个类定义了属性或与对象关联的数据。user类的对象可能包含姓名、性别、年龄和Email地址。

在关系型数据库中，我们经常将相同类的对象存储在一个表里，因为它们有着相同的结构。同理，在Elasticsearch中，我们使用相同类型(type)的文档表示相同的“事物”，因为他们的数据结构也是相同的。

每个类型(type)都有自己的映射(mapping)或者结构定义，就像传统数据库表中的列一样。所有类型下的文档被存储在同一个索引下，但是类型的映射(mapping)会告诉Elasticsearch不同的文档如何被索引

_type的名字可以是大写或小写，不能包含下划线或逗号。我们将使用blog做为类型名。

6.x后，_type不再起作用

_id

id仅仅是一个字符串，它与_index和_type组合时，就可以在Elasticsearch中唯一标识一个文档。当创建一个文档，你可以自定义_id，也可以让Elasticsearch帮你自动生成。

其他元数据

_source

_source：文档的原始Json数据，包括每个字段的内容

默认情况下，Elasticsearch 用 JSON 字符串来表示文档主体保存在 _source 字段中。像其他保存的字段一样，_source 字段也会在写入硬盘前压缩。

映射禁用 _source 字段：

PUT /my_index
{
    "mappings": {
        "my_type": {
            "_source": {
                "enabled":  false
            }
        }
    }
}

在搜索请求中你可以通过限定 _source字段来请求指定字段：

GET /_search
{
    "query":   { "match_all": {}},
    "_source": [ "title", "created" ]
}

这些字段会从 _source 中提取出来，而不是返回整个 _source 字段

_all

将所有字段内容整合起来，默认禁用(用于对所有字段内容的检索)

一个所有其他字段值的特殊字符串字段。query_string在没有指定字段时默认用 _all 字段查询。

_uid

_type 和 _id 连接成的 type#id

默认情况下，_uid 是被保存（可取回）和索引（可搜索）的。_type 字段被索引但是没有保存，_id 和 _index 字段则既没有索引也没有储存，它们并不是真实存在的。

尽管如此，你仍然可以像真实字段一样查询 _id 字段。Elasticsearch 使用 _uid 字段来追溯 _id。虽然你可以修改这些字段的 index 和 store 设置，但是基本上不需要这么做。

_id 字段有一个你可能用得到的设置：path 设置告诉 Elasticsearch 它需要从文档本身的哪个字段中生成 _id

从 doc_id 字段生成 _id：

PUT /my_index
{
    "mappings": {
        "my_type": {
            "_id": {
                "path": "doc_id" <1>
            },
            "properties": {
                "doc_id": {
                    "type":   "string",
                    "index":  "not_analyzed"
                }
            }
        }
    }
}

然后，当你索引一个文档时：_id 值由文档主体的 doc_id 字段生成。

POST /my_index/my_type
{
    "doc_id": "123"
}

_id 正确的生成了

{
    "_index":   "my_index",
    "_type":    "my_type",
    "_id":      "123", <1>
    "_version": 1,
    "created":  true
}

警告：虽然这样很方便，但是注意它对 bulk 请求（见【bulk 格式】）有个轻微的性能影响。处理请求的节点将不能仅靠解析元数据行来决定将请求分配给哪一个分片，而需要解析整个文档主体。

Elasticsearch搜索原理

正排索引和倒排索引

正排索引

记录文档Id到文档内容、单词的关联关系
DAIHAO：1，2

docid	content
1	DAIHAO哈哈哈哈哈
2	哈哈哈DAIAHO
3	哈哈哈哈哈

倒排索引

记录单词到文档id的关联关系，包含：
单词词典（Term DicTionary）：记录所有文档的单词，一般比较大
倒排索引（Posting List）：记录单词倒排列表的关联信息

例如：DAIHAO

一、单词词典（Term DicTionary）
DAIHAO

二、倒排索引（Posting List）

DocId(文档id)	TF(单词频率)	Position(位置)	Offset(偏移量)
1	1	0	<0,2>
3	1	0	<0,2>

DocId：文档id，文档的原始信息
TF：单词频率，记录该词再文档中出现的次数，用于后续相关性算分
Position：位置，记录Field分词后，单词所在的位置，从0开始
Offset：偏移量，记录单词在文档中开始和结束位置，用于高亮显示等

三、内存结构
使用的B+Tree
B+Tree测试网址
每个文档字段都有自己的倒排索引

分词

分词是指将文本转换成一系列单词（term or token）的过程，也可以叫做文本分析，在es里面称为Analysis

Java是最好的语言->Java，是最好的，语言

分词机制

Character Filter 对原始文本进行处理（洗）例：去除html标签、特殊字符等
Tokenizer 将原始文本进行分词（拆）例：培训机构–>培训，机构
Token Filters 分词后的关键字进行加工例：转小写、删除语气词、近义词和同义词等

分词API

1、直接指定测试（指定分词器）

Request:

POST _analyze
{
  "analyzer": "standard",
  "text":"hello 1111"
}

Response:

{
  "tokens": [
    {
      "token": "hello",			#分词
      "start_offset": 0,		#开始偏移
      "end_offset": 5,			#结束偏移
      "type": "",		#单词类型
      "position": 0				#位置
    },
    {
      "token": "world",
      "start_offset": 6,
      "end_offset": 11,
      "type": "",
      "position": 1
    }
  ]
}

2、针对索引的字段进行分词测试（利用该字段的分词器）

Request：

POST daihao/_analyze
{
  "field": "name",
  "text":"hello world"
}

Response:

{
  "tokens": [
    {
      "token": "hello",
      "start_offset": 0,
      "end_offset": 5,
      "type": "",
      "position": 0
    },
    {
      "token": "world",
      "start_offset": 6,
      "end_offset": 11,
      "type": "",
      "position": 1
    }
  ]
}

3、自定义分词器
Request:

POST _analyze
{
  "tokenizer": "standard",
  "filter": ["lowercase"],
  "text":"Hello WORLD"
}

Response:

{
  "tokens": [
    {
      "token": "hello",
      "start_offset": 0,
      "end_offset": 5,
      "type": "",
      "position": 0
    },
    {
      "token": "world",
      "start_offset": 6,
      "end_offset": 11,
      "type": "",
      "position": 1
    }
  ]
}

Elasticsearch自带的分词器

分词器（Analyzer）	特点
Standard（es默认）	支持多语言，按词切分并做小写处理
Simple	按照非字母切分，小写处理
Whitespace	按照空格来切分
Stop	去除语气助词，如the、an、的、这等
Keyword	不分词
Pattern	正则分词，默认\w+,即非字词符号做分割符
Language	常见语言的分词器（30+）

中文分词

分词器名称	介绍	特点	地址
IK	实现中英文单词切分	自定义词库	https://github.com/medcl/elasticsearch-analysis-ik
Jieba	python流行分词系统	支持分词和词性标注支持繁体、自定义、并行分词	http://github.com/sing1ee/elasticsearch-jieba-plugin
Hanlp	由一系列模型于算法组成的java工具包	普及自然语言处理在生产环境中的应用	https://github.com/hankcs/HanLP
THULAC	清华大学中文词法分析工具包	具有中文分词和词性标注功能	https://github.com/microbun/elasticsearch-thulac-plugin

Character Filters

在进行Tokenizer之前对原始文本进行处理，如增加、删除或替换字符等

操作	含义
HTMLStrip	去除html标签和转换html实体
Mapping	字符串替换操作
Pattern	Replace

注意：进行处理后，会影响后续tokenizer解析的position和offset

Request：

POST _analyze
{
  "tokenizer": "keyword",
  "char_filter": ["html_strip"],
  "text":"B⁺Trees
"
}

Response:

{
  "tokens" : [
    {
      "token" : """


B+Trees


""",
      "start_offset" : 0,
      "end_offset" : 38,
      "type" : "word",
      "position" : 0
    }
  ]
}

Token Filter

对输出的单词（term）进行增加、删除、修改等操作

操作	含义
Lowercase	将所有term转换为小写
stop	删除stop words
NGram	和Edge NGram连词分割
Synonym	添加近义词的term

Request:

POST _analyze
{
  "tokenizer": "standard",
  "text":"a Hello World",
  "filter": [
      "stop",
      "lowercase",
      {
        "type":"ngram",
        "min_gram":3,
        "max_gram":4
        
      }
    ]
}

Response:

{
  "tokens" : [
    {
      "token" : "hel",
      "start_offset" : 2,
      "end_offset" : 7,
      "type" : "",
      "position" : 1
    },
    {
      "token" : "hell",
      "start_offset" : 2,
      "end_offset" : 7,
      "type" : "",
      "position" : 1
    },
    {
      "token" : "ell",
      "start_offset" : 2,
      "end_offset" : 7,
      "type" : "",
      "position" : 1
    },
    {
      "token" : "ello",
      "start_offset" : 2,
      "end_offset" : 7,
      "type" : "",
      "position" : 1
    },
    {
      "token" : "llo",
      "start_offset" : 2,
      "end_offset" : 7,
      "type" : "",
      "position" : 1
    },
    {
      "token" : "wor",
      "start_offset" : 8,
      "end_offset" : 13,
      "type" : "",
      "position" : 2
    },
    {
      "token" : "worl",
      "start_offset" : 8,
      "end_offset" : 13,
      "type" : "",
      "position" : 2
    },
    {
      "token" : "orl",
      "start_offset" : 8,
      "end_offset" : 13,
      "type" : "",
      "position" : 2
    },
    {
      "token" : "orld",
      "start_offset" : 8,
      "end_offset" : 13,
      "type" : "",
      "position" : 2
    },
    {
      "token" : "rld",
      "start_offset" : 8,
      "end_offset" : 13,
      "type" : "",
      "position" : 2
    }
  ]
}

自定义分词api

Request:

PUT my_analyzer
{
  "settings": {
    "analysis": {
      "analyzer": {
        "my":{
          "tokenizer":"punctuation",
          "type":"custom",
          "char_filter":["emoticons"],
          "filter":["lowercase","english_stop"]
        }
      },
      "tokenizer": {
        "punctuation":{
          "type":"pattern",
          "pattern":"[.,!?]"
        }
      },
      "char_filter": {
        "emoticons":{
          "type":"mapping",
          "mappings":[
              ":)=>_happy_",
              ":(=>_sad_"
            ]
        }
      },
      "filter": {
        "english_stop":{
          "type":"stop",
          "stopwords":"_english_"
        }
      }
    }
  }
}

测试：

POST my_analyzer/_analyze
{
  "analyzer": "my",
  "text":"l'm a :) person,and you?"
}

{
  "tokens": [
    {
      "token": "l'm a _happy_ person",
      "start_offset": 0,
      "end_offset": 15,
      "type": "word",
      "position": 0
    },
    {
      "token": "and you",
      "start_offset": 16,
      "end_offset": 23,
      "type": "word",
      "position": 1
    }
  ]
}

分词使用场景

1、索引时分词：创建或更新文档时，会对相应得文档进行分词(指定字段分词)

PUT my_test
{
“mappings”:{
“doc”:{
“properties”:{
“title”:{
“type”:”text”,
“analyzer”:”ik_smart”
}
}
}
}
}

2、查询时分词：查询时会对查询语句进行分词

POST my_test/_search
{
“query”:{
“match”:{
“message”:{
“query”:”hello”,
“analyzer”:”standard”
}
}
}
}

PUT my_test
{
“mappings”:{
“doc”:{
“properties”:{
“title”:{
“type”:”text”,
“analyzer”:”whitespace”,
“search_analyzer”:”standard”				#查询指定分词器
}
}
}
}
}

一般不需要特别指定查询时分词器，直接使用索引时分词器即可，否则会出现无法匹配得情况，如果不需要分词将字段type设置成keyword，可以节省空间

该篇主要学习对ES的概念理解，一时不明白没关系很正常，没事多看看。

自己总结的xmind：提取码:v8n8

你可能感兴趣的:(谷粒商城)

谷粒商城学习笔记，第七天：性能压测+缓存+分布式锁「已注销」数据库分布式 redis java 多线程
谷粒商城学习笔记，第七天：性能压测+缓存+分布式锁一、性能压测我们希望通过压测发现其他测试更难发现的错误：内存泄漏、并发与同步。1、性能指标吞吐量、响应时间QPSTPS、错误率RT:ResponseTime响应时间HPS:hitspersecond每秒点击次数TPS：Transactionpersecond系统每秒处理交易数QPS：querypersecond每秒处理查询次数2、JMeter下载地
Day03_谷粒商城（谷粒商城高级篇二）摘要 BlackTurn 项目总结
文章目录笔记P102—P124是讲解ES的知识，和谷粒商城项目完全无关P125—P127是讲解SpringBoot整合ESP128—P129商品上架功能0P130商品上架功能1P131商品上架功能2P132商品上架功能3P133商品上架功能4P134—P135商品上架功能—测试P136—P138首页展示一级、二级、三级目录P139nginx搭建域名访问环境1P140nginx搭建域名访问环境1P1
Day03_谷粒商城（谷粒商城高级篇二）目录 BlackTurn 项目总结
P102—P124是讲解ES的知识，和谷粒商城项目完全无关P125—P127是讲解SpringBoot整合ES，涉及到如何把ES加入到我们这个项目的P128—P129商品上架功能解说P130商品上架功能的实现1P131商品上架功能的实现2P132商品上架功能的实现3P133商品上架功能的实现4P134—P135商品上架功能—测试p136到p138是搭建了首页，p139和p140是让我们借助ngin
分布式电商项目谷粒商城学习笔记＜4＞怎么又有bug单 SpringBoot 分布式 java 开发语言阿里压力测试
文章目录十五、压力测试1.一些基本概念2.JVM内存机制3.压测记录4.Nginx动静分离5.优化三级分类查询十六、redisson分布式锁与缓存1.概念2.redis3.缓存失效缓存穿透缓存雪崩缓存击穿互斥锁：4.缓存击穿如何复制微服务：5.分布式缓存概念原则基本流程6.Redisson环境搭建可重入锁锁的续期读写锁信号量（Semaphore）闭锁7.缓存和数据库一致性十五、压力测试这里是使用j
【java后端学习路线4】SpringBoot+MyBatisPlus+Redis学习指南，985本海硕自学转码程序员城南 java后端学习路线 java spring boot mybatis redis
JAVA后端学习路线路线总览javase->Mysql->计算机网络->JavaWeb->Maven(1)->Spring->SpringMVC->Mybatis->Maven(2)->Linux->Git->SpringBoot->MyBatisPlus->Redis->JVM->JUC->Nginx->Docker->RabbitMQ->SpringCloud->项目(谷粒商城/仿牛客网)方法
谷粒商城08:PowerDesigner数据库设计极速入门 ssk521125 科技数据库
在谷粒商城的开发过程中，数据库设计是至关重要的一环。PowerDesigner作为一款强大的数据库设计工具，能够帮助开发者高效地创建、管理和维护数据库模型。接下来，让我们快速入门，了解如何使用PowerDesigner进行谷粒商城的数据库设计。一、认识PowerDesigner（一）功能概述PowerDesigner是一款功能全面的建模工具，涵盖了数据库设计、业务流程建模、应用程序架构设计等多个领
全网最全谷粒商城记录_06、环境-使用vagrant快速创建linux虚拟机——3、linux虚拟机初始化、启动、连接、退出、正常关机、再次启动登录被开发耽误的大厨学生可免费】虚拟机 VirtualBox Vagrant Linux
目录3、vagrant快速给VirtualBox里边创建一个Linux虚拟机（1）初始化一个虚拟机（2）启动虚拟环境（3）连接虚拟机（4）退出连接的虚拟机（5）虚拟机退出-正常关机***（6）以后再次，只需简单操作：虚拟机右键启动或vagrantup命令启动、vagrantssh连接虚拟机启动虚拟机-方式1【不推荐】启动虚拟机-方式2【推荐】【快速创建linux虚拟机，详细介绍】我们先要安装一个L
全网最全谷粒商城记录_06、环境-使用vagrant快速创建linux虚拟机——1、VirtualBox下载安装被开发耽误的大厨学生可免费】虚拟机 VirtualBox Vagrant Linux
目录一、VirtualBox下载安装1、VirtualBox下载2、CPU开启虚拟化3、VirtualBox安装【快速创建linux虚拟机，详细介绍】我们先要安装一个Linux虚拟机来简化开发，比如redis、mysql、rabbitMQ等等，我们后端项目开发真实环境，都是装在Linux里面的。一、VirtualBox下载安装1、VirtualBox下载好，接下来呢，我们就一起来搭建项目的开发环境
全网最全谷粒商城记录_06、环境-使用vagrant快速创建linux虚拟机——2、vagrant镜像仓库、下载、安装、验证被开发耽误的大厨学生可免费】虚拟机 VirtualBox Vagrant Linux
目录二、VirtualBox里边安装虚拟的Linux系统1、vagrant镜像仓库、vagrant下载2、vagrant安装、验证【快速创建linux虚拟机，详细介绍】我们先要安装一个Linux虚拟机来简化开发，比如redis、mysql、rabbitMQ等等，我们后端项目开发真实环境，都是装在Linux里面的。二、VirtualBox里边安装虚拟的Linux系统1、vagrant镜像仓库、vag
谷粒商城——缓存的读写一致性 qq_45007794 缓存
1.缓存一致性在此之前需要介绍一下缓存更新（也叫缓存一致性）的两种模式：当对缓存中数据进行修改时，可以用双写模式或失效模式来更新缓存。双写模式指的是将修改后的数据就是写入数据库之后再去写缓存。失效模式指的是将修改后的数据就是写入数据库之后删除对应缓存，当有用户查询时再重新建立新的缓存。2.不同类型的数据的上锁方式1.对于实时性要求很强的数据，如果修改完数据库，需要保证缓存中的数据也更新为相应的最新
谷粒商城实战笔记-275~276-商城业务-订单服务-订单确认页完成小手追梦谷粒商城笔记谷粒商城
文章目录一，275-商城业务-订单服务-订单确认页完成1，防止订单重复提交二，276-商城业务-订单服务-原子验令牌Lua脚本Java代码包括内容：275-商城业务-订单服务-订单确认页完成276-商城业务-订单服务-原子验令牌一，275-商城业务-订单服务-订单确认页完成这一节的主要内容是：分析用户点击“提交订单”时，前端发送给后台的数据，包括token，总金额，收货地址，支付方式publicc
分布式基础——谷粒商城【一章节】杳杳博客 Java Spring 分布式
前期配置：虚拟机安装VirtyalBox管理器vagrant安装centos7的虚拟机可以使用镜像科大镜像：https://docker.mirrors.ustc.edu.cn/网易：https://hub-mirror.c.163.com/阿里云镜像获取地址：https://cr.console.aliyun.com/cn-hangzhou/instances/mirrors登录后#中科大的镜像
谷粒商城实战笔记-282~283-商城业务-订单服务-提交订单的问题小手追梦谷粒商城笔记谷粒商城
文章目录一，282-商城业务-订单服务-提交订单的问题调试过程中出现的问题services面板介绍什么是ServicesPanel？主要作用解决的痛点使用方法二，283-商城业务-分布式事务-本地事务在分布式下的问题分布式事务问题解决方案分布式事务处理流程事务保证一，282-商城业务-订单服务-提交订单的问题这一节的主要内容是测试正常情况下的订单提交流程是否顺畅。调试过程中出现的问题出现异常后，因
谷粒商城实战笔记-279~280-商城业务-订单服务-订单验价-保存订单小手追梦谷粒商城笔记谷粒商城
文章目录一，279-商城业务-订单服务-订单验价1，创建订单时计算总价代码分析2，比较总价二，280-商城业务-订单服务-保存订单数据代码分析一，279-商城业务-订单服务-订单验价这一节的主要内容是验价：前端从购物车到confirm界面会算一次总价提交订单生成订单时会重新计算一次总价比较这两次总价1，创建订单时计算总价/***计算价格价格的方法*@paramorderEntity*@paramo
谷粒商城实战笔记-269~271-商城业务-订单服务-bug修改小手追梦谷粒商城笔记谷粒商城
文章目录一，269-商城业务-订单服务-bug修改二，270-商城业务-订单服务-订单确认页渲染三，271-商城业务-订单服务-订单确认页库存查询四，272-商城业务-订单服务-订单确认页模拟运费效果一，269-商城业务-订单服务-bug修改并没有复现这个bug。二，270-商城业务-订单服务-订单确认页渲染模板调整。三，271-商城业务-订单服务-订单确认页库存查询本节处理：①多个收获地址，选择
谷粒商城实战笔记-274-商城业务-订单服务-接口幂等性讨论小手追梦谷粒商城笔记幂等
文章目录一、什么是幂等性二、哪些情况需要防止三、什么情况下需要幂等四、幂等解决方案1、token机制2、各种锁机制3、各种唯一约束一、什么是幂等性接口幂等性就是用户对于同一操作发起的一次请求或者多次请求的结果是一致的，不会因为多次点击而产生了副作用。比如说支付场景，用户购买了商品支付扣款成功，但是返回结果的时候网络异常，此时钱已经扣了，用户再次点击按钮，此时会进行第二次扣款，返回结果成功，用户查询
谷粒商城day13-配置及测试微服务基本CRUD功能我才是真的封不觉谷粒商城配置及测试微服务CRUD功能
1.引入mysql驱动的依赖与servlet的依赖2.将RRException类从renren_fast拷过来3.删除xss相关处理跨站访问的类4.创建application.yml配置数据源配置mybatismapper扫描路径，配置主键自增spring:datasource:username:rootpassword:rooturl:jdbc:mysql://192.168.56.10:330
MySQL高级篇——排序、分组、分页优化程序员小海绵【vincewm】 Java学习路线数据库 sql java
导航：【Java笔记+踩坑汇总】Java基础+进阶+JavaWeb+SSM+SpringBoot+瑞吉外卖+SpringCloud+黑马旅游+谷粒商城+学成在线+MySQL高级篇+设计模式+牛客面试题目录5.排序优化5.1排序优化建议5.2测试5.2.1案例验证5.3.2练习5.3范围查询时索引字段选择5.4filesort算法5.4.1双路排序和单路排序5.4.2调优filesort6.分组优化
谷粒商城【成神路】-【6】——商品维护会敲代码的小张谷粒商城【弑神战】前端 java 后端 spring cloud 分布式架构 gateway
目录1.发布商品2.获取分类关联品牌3.获取分类下所有分组和关联属性4.商品保存功能5.sup检索6.sku检索1.发布商品获取用户系统等级~，前面生成了后端代码，在因为添加了网关，所以要配置陆游规则在网管层配置会员服务的路由规则，精确的路由放到上面#会员服务-id:member_routeuri:lb://gulimall-memberpredicates:-Path=/api/member/*
谷粒商城【成神路】-【5】——品牌管理会敲代码的小张谷粒商城【弑神战】spring cloud 容器 java 前端框架后端分布式中间件
目录1.新建品牌分类2.导入前端代码3.页面优化4.阿里云开通oss5.文件上传6.表单后端校验JSR3031.新建品牌分类在renren-fast客户端中，创建二级菜单，注意菜单的路由2.导入前端代码在使用逆向生成工具的时候，已经将前端代码生成直接放入到product目录下即可3.页面优化在导入代码后，对页面进行优化，如显示状态，利用elementUI；代码全部放到文章最后4.阿里云开通oss登
谷粒商城【成神路】-【7】——库存系统会敲代码的小张谷粒商城【弑神战】java graphql spring cloud 后端分布式 spring boot 架构
目录1.仓库维护1.1配置网关陆游规则1.2修改模糊查询2.仓库库存3.采购需需求3.1采购的模糊检索3.2合并采购单3.3领取采购单3.4完成采购4.spu规格4.1获取spu规格4.2更新spu规格1.仓库维护开打界面查看发送的请求路径，因为我们配置类网关，所以目前报错将库存服务启动，注册到nacos服务中心1.1配置网关陆游规则配置完网关之后，我们再次刷新页面，就可以查询到结果，包括新增，修
谷粒商城-P19 杜阿福 leetcode 链表算法
项目结构创建&提交到码云数据库初始化保持docker数据库一直打开dockerupdateredis--restart=always连不上了，发现配置文件错了换了一个配置文件。快速开发使用开源的脚手架人人开源(gitee.com)使用renren-fast作为后台开发，使用renren-fast-vue作为前端使用renren-generator生成product代码。逆向工程搭建&使用XXX分布
【Java面试题汇总】Java基础篇——String+集合+泛型+IO+异常+反射（2023版）程序员小海绵【vincewm】 Java面试题汇总 Java学习路线 jvm java 开发语言
导航：【黑马Java笔记+踩坑汇总】JavaSE+JavaWeb+SSM+SpringBoot+瑞吉外卖+SpringCloud+黑马旅游+谷粒商城+学成在线+设计模式+牛客面试题目录三、String3.1.String常量池3.2.请你说说String类3.3.newString("abc")创建了几个字符串对象？3.4.String、StringBuffer、Stringbuilder有什么区
谷粒商城-前端基础 ✿ﾟ卡笨卡笔记 vue vue.js node.js javascript
1、技术栈简介前端技术栈类对比一、VSCode使用下载vsCode用于前端管理系统。在vsCode里安装插件。AutoCloseTagAutoRenameTagChineseESlintHTMLCSSSupportHTMLSnippetsJavaScriptES6LiveServeropeninbrowerVeturVue2Snippets二、ES61、简介ECMAScript6.0(以下简称ES
谷粒商城【成神路】-【4】——分类维护会敲代码的小张数据库 java 前端 spring cloud vue.js javascript 后端
目录1.删除功能的实现2.新增功能的实现3.修改功能的实现4.拖拽功能1.删除功能的实现1.1逻辑删除逻辑删除：不删除数据库中真实的数据，用指定字段，显示的表示是否删除1.在application.yml中加入配置mybatis-plus:global-config:db-config:logic-delete-value:1#1代表删除logic-not-delete-value:0#0代表没删
谷粒商城【成神路】-【3】——三级分类会敲代码的小张谷粒商城【弑神战】java 前端数据库
目录1.查询三级分类2.前端页面搭建3.添加网关4.解决跨域5.显示分类6.显示复选框1.查询三级分类1.controller直接调用service层的接口@RequestMapping("/list/tree")publicRlist(){ListentityList=categoryService.listWithTree();returnR.ok().put("data",entityLis
谷粒商城【成神路】-【2】——alibaba组件会敲代码的小张谷粒商城【弑神战】java 服务器前端 spring boot spring cloud 后端 nginx
目录1.注册中心nacos2.feign的加入2.nacos作为配置中心3.网关搭建1.注册中心nacos1.启动nacos小张这里启动的是三台nacos作为集群~192.168.20.129:8848，192.168.20.130:9948，192.168.20.131:8848;(使用集群的话最低三台)2.启动nginx在启动nginx之前，启动keepalived，用虚拟ip漂移，搭建两台n
谷粒商城基础篇——Day01 一只懒鱼儿谷粒商城 java idea vue.js
01、分布式基础&项目环境搭建一、项目简介1.项目背景1.1电商模式市面上有5种常见的电商模式B2B、B2C、C2B、C2C、O2O1)B2B模式B2B(BusinesstoBusiness)，是指商家和商家建立的商业关系，如阿里巴巴2)B2C模式B2C(BusinesstoConsumer)就是我们经常看到的供应商直接把商品卖给用户，即“商对客”模式，也就是通常所说的商业零售，直接面向消费者销售
谷粒商城——第一篇前后端基础 pskyfly java spring cloud javascript vue
谷粒商城——前后端基础概述微服务架构微服务划分环境搭建安装虚拟机下载链接：VirtualBox：https://download.virtualbox.org/virtualbox/6.0.12/VirtualBox-6.0.12-133076-Win.exeVagrant：https://releases.hashicorp.com/vagrant/2.2.5/vagrant_2.2.5_x86
相关技术notion笔记整理肝点啥_董晓宁
最近发现notion这款笔记很好用，在上共享一下：1.最近的知识整理算法JVMMySQL及优化redis谷粒商城分布式电商项目2.脑图整理基于原制作者：用微笑去面对所有基础上添加改进
jquery实现的jsonp掉java后台知了ing java jsonp jquery
什么是JSONP？先说说JSONP是怎么产生的：其实网上关于JSONP的讲解有很多，但却千篇一律，而且云里雾里，对于很多刚接触的人来讲理解起来有些困难，小可不才，试着用自己的方式来阐释一下这个问题，看看是否有帮助。 1、一个众所周知的问题，Ajax直接请求普通文件存在跨域无权限访问的问题，甭管你是静态页面、动态网页、web服务、WCF，只要是跨域请求，一律不准； 2、
Struts2学习笔记 caoyong struts2
SSH : Spring + Struts2 + Hibernate 三层架构(表示层,业务逻辑层,数据访问层) MVC模式 (Model View Controller) 分层原则:单向依赖，接口耦合 1、Struts2 = Struts + Webwork 2、搭建struts2开发环境 a>、到www.apac
SpringMVC学习之后台往前台传值方法满城风雨近重阳 springMVC
springMVC控制器往前台传值的方法有以下几种： 1.ModelAndView 通过往ModelAndView中存放viewName：目标地址和attribute参数来实现传参： ModelAndView mv=new ModelAndView(); mv.setViewName="success
WebService存在的必要性？一炮送你回车库 webservice
做Java的经常在选择Webservice框架上徘徊很久，Axis Xfire Axis2 CXF ，他们只有一个功能，发布HTTP服务然后用XML做数据传输。是的，他们就做了两个功能，发布一个http服务让客户端或者浏览器连接，接收xml参数并发送xml结果。当在不同的平台间传输数据时，就需要一个都能解析的数据格式。但是为什么要使用xml呢？不能使json或者其他通用数据
js年份下拉框 3213213333332132 java web ee
<div id="divValue">test...</div>测试 //年份 <select id="year"></select> <script type="text/javascript"> window.onload =
简单链式调用的实现技术归来朝歌方法调用链式反应编程思想
在编程中，我们可以经常遇到这样一种场景：一个实例不断调用它自身的方法，像一条链条一样进行调用这样的调用你可能在Ajax中，在页面中添加标签： $("<p>").append($("<span>").text(list[i].name)).appendTo("#result"); 也可能在HQ
JAVA调用.net 发布的webservice 接口 darkranger webservice
/** * @Title: callInvoke * @Description: TODO(调用接口公共方法) * @param @param url 地址 * @param @param method 方法 * @param @param pama 参数 * @param @return * @param @throws BusinessException
Javascript模糊查找 | 第一章循环不能不重视。 aijuans Way
最近受我的朋友委托用js+HTML做一个像手册一样的程序，里面要有可展开的大纲，模糊查找等功能。我这个人说实在的懒，本来是不愿意的，但想起了父亲以前教我要给朋友搞好关系，再加上这也可以巩固自己的js技术，于是就开始开发这个程序，没想到却出了点小问题，我做的查找只能绝对查找。具体的js代码如下： function search(){ var arr=new Array("my
狼和羊，该怎么抉择 atongyeye 工作
狼和羊，该怎么抉择在做一个链家的小项目，只有我和另外一个同事两个人负责，各负责一部分接口，我的接口写完，并全部测联调试通过。所以工作就剩下一下细枝末节的，工作就轻松很多。每天会帮另一个同事测试一些功能点，协助他完成一些业务型不强的工作。今天早上到公司没多久，领导就在QQ上给我发信息，让我多协助同事测试，让我积极主动些，有点责任心等等，我听了这话，心里面立马凉半截，首先一个领导轻易说
读取android系统的联系人拨号百合不是茶 android sqlite数据库内容提供者系统服务的使用
联系人的姓名和号码是保存在不同的表中,不要一下子把号码查询来,我开始就是把姓名和电话同时查询出来的,导致系统非常的慢关键代码: 1, 使用javabean操作存储读取到的数据 package com.example.bean; /** * * @author Admini
ORACLE自定义异常 bijian1013 数据库自定义异常
实例： CREATE OR REPLACE PROCEDURE test_Exception ( ParameterA IN varchar2, ParameterB IN varchar2, ErrorCode OUT varchar2 --返回值,错误编码 ) AS /*以下是一些变量的定义*/ V1 NUMBER; V2 nvarc
查看端号使用情况征客丶 windows
一、查看端口在windows命令行窗口下执行： >netstat -aon|findstr "8080" 显示结果： TCP 127.0.0.1:80 0.0.0.0:0 &
【Spark二十】运行Spark Streaming的NetworkWordCount实例 bit1129 wordcount
Spark Streaming简介 NetworkWordCount代码 /* * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file distributed with
Struts2 与 SpringMVC的比较 BlueSkator struts2 spring mvc
1. 机制：spring mvc的入口是servlet，而struts2是filter，这样就导致了二者的机制不同。 2. 性能：spring会稍微比struts快。spring mvc是基于方法的设计，而sturts是基于类，每次发一次请求都会实例一个action，每个action都会被注入属性，而spring基于方法，粒度更细，但要小心把握像在servlet控制数据一样。spring
Hibernate在更新时，是可以不用session的update方法的(转帖） BreakingBad Hibernate update
地址：http://blog.csdn.net/plpblue/article/details/9304459 public void synDevNameWithItil() {Session session = null;Transaction tr = null;try{session = HibernateUtil.getSession();tr = session.beginTran
读《研磨设计模式》-代码笔记-观察者模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; import java.util.Observable; import java.util.Observer; /** * “观
重置MySQL密码 chenhbc mysql 重置密码忘记密码
如果你也像我这么健忘，把MySQL的密码搞忘记了，经过下面几个步骤就可以重置了（以Windows为例，Linux/Unix类似）： 1、关闭MySQL服务 2、打开CMD，进入MySQL安装目录的bin目录下，以跳过权限检查的方式启动MySQL mysqld --skip-grant-tables 3、新开一个CMD窗口，进入MySQL mysql -uroot
再谈系统论，控制论和信息论 comsci 设计模式生物能源企业应用领域模型
再谈系统论，控制论和信息论偶然看
oracle moving window size与 AWR retention period关系 daizj oracle
转自： http://tomszrp.itpub.net/post/11835/494147 晚上在做11gR1的一个awrrpt报告时,顺便想调整一下AWR snapshot的保留时间,结果遇到了ORA-13541这样的错误.下面是这个问题的发生和解决过程. SQL> select * from v$version; BANNER -------------------
Python版B树 dieslrae python
话说以前的树都用java写的,最近发现python有点生疏了,于是用python写了个B树实现,B树在索引领域用得还是蛮多了,如果没记错mysql的默认索引好像就是B树... 首先是数据实体对象,很简单,只存放key,value class Entity(object): '''数据实体''' def __init__(self,key,value)
C语言冒泡排序 dcj3sjt126com 算法
代码示例： # include <stdio.h> //冒泡排序 void sort(int * a, int len) { int i, j, t; for (i=0; i<len-1; i++) { for (j=0; j<len-1-i; j++) { if (a[j] > a[j+1]) // >表示升序
自定义导航栏样式 dcj3sjt126com 自定义
-(void)setupAppAppearance { [[UILabel appearance] setFont:[UIFont fontWithName:@"FZLTHK—GBK1-0" size:20]]; [UIButton appearance].titleLabel.font =[UIFont fontWithName:@"FZLTH
11.性能优化-优化-JVM参数总结 frank1234 jvm参数性能优化
1.堆 -Xms --初始堆大小 -Xmx --最大堆大小 -Xmn --新生代大小 -Xss --线程栈大小 -XX:PermSize --永久代初始大小 -XX:MaxPermSize --永久代最大值 -XX:SurvivorRatio --新生代和suvivor比例,默认为8 -XX:TargetSurvivorRatio --survivor可使用
nginx日志分割 for linux HarborChung nginx linux 脚本
nginx日志分割 for linux 默认情况下，nginx是不分割访问日志的，久而久之，网站的日志文件将会越来越大，占用空间不说，如果有问题要查看网站的日志的话，庞大的文件也将很难打开，于是便有了下面的脚本使用方法，先将以下脚本保存为 cutlog.sh，放在/root 目录下，然后给予此脚本执行的权限复制代码代码如下: chmo
Spring4新特性——泛型限定式依赖注入 jinnianshilongnian spring spring4 泛型式依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
centOS安装GCC和G++ liuxihope centos gcc
Centos支持yum安装，安装软件一般格式为yum install .......，注意安装时要先成为root用户。按照这个思路，我想安装过程如下：安装gcc：yum install gcc 安装g++： yum install g++ 实际操作过程发现，只能有gcc安装成功，而g++安装失败，提示g++ command not found。上网查了一下，正确安装应该
第13章 Ajax进阶（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
How to determine BusinessObjects service pack and fix pack blueoxygen BO
http://bukhantsov.org/2011/08/how-to-determine-businessobjects-service-pack-and-fix-pack/ The table below is helpful. Reference BOE XI 3.x 12.0.0. y BOE XI 3.0 12.0. x. y BO
Oracle里的自增字段设置 tomcat_oracle oracle
　大家都知道吧，这很坑，尤其是用惯了mysql里的自增字段设置，结果oracle里面没有的。oh，no 　　我用的是12c版本的，它有一个新特性，可以这样设置自增序列，在创建表是，把id设置为自增序列 create table t ( id 　　　　 number generated by default as identity (start with 1 increment b
Spring Security（01）——初体验 yang_winnie spring Security
Spring Security（01）——初体验博客分类： spring Security Spring Security入门安全认证首先我们为Spring Security专门建立一个Spring的配置文件，该文件就专门用来作为Spring Security的配置