ly的学习笔记

ElasticSearch笔记

第一章、ES概述

1.概念介绍

查询：宽泛的概念！只要将某个东西查询出来！

精确查询：

模糊查询：

搜索：一种特定的查询！搜索一般指通过某个关键字，检索出和关键字相关的信息！

搜索引擎，不适合使用关系型数据库存储数据！

原因： ①在搜索时，只输入关键字，希望可以得到匹配关键字的所有的数据！如果使用数据库，在查询时一定需要模糊查询，模糊查询会导致索引失效，全表扫描！效率低！

select xxx from xxx where xxx like  %aaa%  //索引失效，有索引，查询引擎不会用

select xxx from xxx where xxx like  aaa%  //索引有效，加速查询

②关系型数据库查询时，不能分词，联想，得到的不是期望的结果！

2.几个框架

solr : 和es的作用是一样的，都是用于搜索！

solr一般用于中小数据量的静态搜索(数据，很少发生变化)！

es可以用于PB级别数据量的动态搜索(数据可能会不断新增，变化)！

效率上： solr（老大哥）：小数据量，静态搜索，优于es！

    solr在插入数据时，创建索引会有IO阻塞，效率低！

es(新人) ：大数量，动态搜索，优于solr！

es在插入数据时，创建索引，无阻塞！ 不是实时，接近实时搜索，延迟秒级！

依赖： solr 依赖 zk

es不依赖任何框架！

数据类型： solr 丰富： xml,json

 es 单一：  json

扩展性： es更容易扩展，天然集群！

Lucene: 搜索场景，常用的API集合！

本质是一个框架，可以集成到项目中，提供搜索场景常用的API，方便开发！

搜索工具包！

业界公认的非常优秀的搜索框架！

Nutch : 是一个可以直接使用的产品！基于lucene提供web浏览器的搜索产品！小型google!

ES ： es内置了Lucene，使Lunece变得更好用！使用RESTFUL风格，使用ES！

  直接通过浏览器，发送REST请求，使用ES完成数据的CRUD！

3.全文检索和倒排索引

全文检索：

最初的含义： 提供一个关键字，在整篇文章中，搜索和关键字匹配的片段！

应用开发含义：	提供一个关键字，在整个数据库中，搜索和关键字匹配的数据！

如果要实现全文检索，必须依赖倒排索引！

索引：是一种数据结构，加速查询！

类似一本百科全书的目录，根据目录直接跳转到感兴趣的书页！

正排索引：在mysql中创建的索引，在hbase中创建的索引，都属于正排索引！

举例： 《唐诗三百首》(数据库)

 目录(正排索引)：  诗名 ------>  哪一页 ------> 诗的内容

搜索 《静夜思》

倒排索引：

举例： 《唐诗三百首》(数据库)

目录(倒排索引)： 存储的不是诗名和页面的对应关系！

词语   ------>  在哪些诗中出现了，诗是哪一页

	明月-------->  《静夜思》 200页， 《xxx》300页

	搜索：包含明月的古诗有哪些

	搜索引擎都使用倒排索引！

4.ES的特点

天然分片：数据在写入时，会被分为若干片，每一片会分布到集群的不同节点！

优势：横向扩容！负载均衡！提高并行IO能力！

天然集群：一台ES实例也可以组成一个集群！方便扩容！如果集群需要增加节点！

只需要在其他节点安装ES，直接启动，自动在网段中寻找ES集群，自动加入集群！

天然索引： mysql和其他的数据库，需要手动创建索引！ ES在插入数据后自动创建索引！

文档：

https://www.elastic.co/guide/en/elasticsearch/reference/6.6/index.html

5.REST

REST是一种思想和理念！推崇使用标准的url路径，表达对资源的操作方式！本质是为了简化和规范url路径的写法！

没有REST之前：在浏览器发送一个url时，可以随意写

举例：查询1号员工

[http://hadoop102:8088/gmall/getEmployeeById?id=1](http://hadoop102:8088/gmall/getEmployeeById?id=1)

[http://hadoop102:8088/gmall/findEmployeeById?id=1](http://hadoop102:8088/gmall/findEmployeeById?id=1)

http://hadoop102:8088/gmall/retreveEmployeeById?id=1

http://hadoop102:8088/gmall/queryEmployeeById?id=1

http://hadoop102:8088/gmall/tongguoidchaxunyuangong?id=1

规范： /资源/id

可使用不同的请求方式，表达对资源的操作意图！

REST : /Employee/1

发送GET，代表查询

发送POST，代表新增

发送PUT，代表修改

发送DELETE ,代表删除

发送HEAD ， 判断是否存在

http://hadoop102:8088/gmall/Emp/1 GET

框架使用RESTFUL的开发理念！这个框架支持REST风格的API操作！

6.B-tree

B(balance)-tree： B树，多路平衡(自愈)树

B+tree： B-tree的改进

LSM树(mysql,hbase)

第二章、ES安装

1.安装包下载

官网: https://www.elastic.co/cn/downloads/elasticsearch

本次学习基于6.6.0版本

2.将安装包上传到linux上并解压

一.安装

# 1.解压elasticsearch-6.6.0.tar.gz到/opt/module目录下
tar -zxvf elasticsearch-6.6.0.tar.gz -C /opt/module/
# 2.在/opt/module/elasticsearch-6.6.0路径下创建data文件夹
mkdir data

# 3.修改配置文件(config/elasticsearch.yml)
#-----------------------Cluster-----------------------
cluster.name: my-application
#-----------------------Node-----------------------
node.name: node-102
#-----------------------Paths-----------------------
path.data: /opt/module/elasticsearch-6.6.0/data
path.logs: /opt/module/elasticsearch-6.6.0/logs
#-----------------------Memory-----------------------
bootstrap.memory_lock: false
bootstrap.system_call_filter: false
#-----------------------Network-----------------------
network.host: hadoop102 
#-----------------------Discovery-----------------------
discovery.zen.ping.unicast.hosts: ["hadoop102","hadoop103","hadoop104"]

# 4.将 /opt/module/elasticsearch 分发至各节点
xsync /opt/module/elasticsearch
# 5.修改hadoop103,hadoop104上的配置文件(修改node.name,network.host)

二.配置Linux系统环境

参考:http://blog.csdn.net/satiling/article/details/59697916

# 1.借用root权限,编辑/etc/security/limits.conf 添加类似如下内容,注意*不要省略
* soft nofile 65536
* hard nofile 131072
* soft nproc 2048
* hard nproc 4096
# 2.借用root权限修改配置sysctl.conf (/etc/sysctl.conf)
#添加如下配置
vm.max_map_count=655360
#并执行命令
sysctl -p
#3.以上修改的配置分发到各节点
xsync /etc/security/limits.conf
xsync /etc/sysctl.conf
#4.重启linux

三.启动elasticsearch

[atguigu@hadoop102 elasticsearch]$ bin/elasticsearch

打开浏览器访问hadoop102:9200

群起脚本

[atguigu@hadoop102 bin]$ vi es.sh
#!/bin/bash
es_home=/opt/module/elasticsearch-6.6.0
case $1  in
 "start") {
  for i in hadoop102 hadoop103 hadoop104
  do
    echo "==============$i=============="
ssh $i  "source /etc/profile;${es_home}/bin/elasticsearch >/dev/null 2>&1 &"
sleep 4s;
  done

};;
"stop") {
  for i in hadoop102 hadoop103 hadoop104
  do
    echo "==============$i=============="
    ssh $i "ps -ef|grep $es_home |grep -v grep|awk '{print \$2}'|xargs kill" >/dev/null 2>&1
  done

};;
esac

3.Kibana

一.安装

#1.解压kibana-6.6.0-linux-x86_64.tar.gz到/opt/module下
tar -zxvf kibana-6.6.0-linux-x86_64.tar.gz -C /opt/module/
mv kibana-6.6.0-linux-x86_64/ kibana/
#2.修改配置文件
vim config/kibana.yml
server.port: 5601
server.host: "hadoop102"
eleasticsearch.hosts: ["http://hadoop102:9200"]

二.启动kibana(先启动eleasticsearch)

[atguigu@hadoop102 kibana]$ bin/kibana

打开浏览器访问 hadoop102:5601

三.修改之前es的启动脚本

#!/bin/bash
es_home=/opt/module/elasticsearch-6.6.0
kibana_home=/opt/module/kibana
case $1  in
 "start") {
  for i in hadoop102 hadoop103 hadoop104
  do
    echo "==============$i=============="
ssh $i  "source /etc/profile;${es_home}/bin/elasticsearch >/dev/null 2>&1 &"
sleep 4s;
  done
  sleep 2s;
  nohup ${kibana_home}/bin/kibana > kibana.log 2>&1 &
};;
"stop") {
  ps -ef | grep ${kibana_home} | grep -v grep | awk '{print $2}'| xargs kill
  for i in hadoop102 hadoop103 hadoop104
  do
    echo "==============$i=============="
    ssh $i "ps -ef|grep $es_home |grep -v grep|awk '{print \$2}'|xargs kill" >/dev/null 2>&1
  done
};;
esac

第三章、ES操作

1.管理性命令

GET /_cat

# 带_xxx，都是系统内置的关键字
#查看节点状况
GET /_cat/nodes?v
#查看健康状况
GET /_cat/health
#查看所有的index
get /_cat/indices

2.index操作

#一个库
#查index



#查看所有的index
GET /_cat/indices

#查看某个index的信息
GET /_cat/indices/.kibana_1

#查看某个index的元数据信息
GET /stu1

##查看某个index的表结构
GET /.kibana_1/_mapping

#新增Index
#手动创建  需要在创建index时指定mapping信息
#6.0版本一个Index只能创建一个type，名称随意
PUT stu
{
  "mappings": {
    "table1":{
      "properties":{
        "id":{
          "type":"keyword"
        },
        "name":{
          "type":"text"
        },
        "sex":{
          "type":"integer"
        },
        "birth":{
          "type":"date"
        }
      }
    }
  }
}



#自动创建  直接向一个不存在的Index插入数据，在插入数据时，系统根据数据的类型，自动推断mapping，自动创建mapping
# POST  /indexname/typename/id
POST /stu1/table1/1
{
  "id":"1001",
  "name":"jack"
}



#删除index
DELETE /stu1


#修改index   需要执行迁移操作，从一个index读取数据，写入一个新的index

#判断是否存在index  404 - Not Found代表不存在 ，200代表存在
HEAD /stu

3.type操作


#type就等价于index
#7.0之后没有type的概念了，6.0一个index只允许创建一个type，因此index 等价于 type

#查 type  和查index一致

#删除type 就是删除index

#创建type 就是创建index

#判断type是否存在 405 - Method Not Allowed 判断index

4.数据操作


#查
#全表查询
GET /stu/table1/_search

#查询单个元素 GET /indexname/typename/id
# _id才是唯一标识
GET /stu/table1/1

#增
#POST  /indexname/typename/id
POST /stu/table1/2
{
  "id":"tom",
  "name":"tom"
}

#POST也可以实现更新操作，如果当前记录的ID不存在，就insert，存在就update。 更新是全量更新
POST /stu/table1/2
{
  "id":"1003"
}


#POST新增，不指定ID，就随机生成ID
POST /stu/table1/
{
  "id":"tom",
  "name":"tom"
}

#增量更新
#400 : 客户端发送的参数不符合要求
#404 ： 客户端发送的url路径匹配不上
#405 ：  客户端发送的url，对应的请求方式不符合
POST /stu/table1/rx4wNHwBb4g3p3m-lruA/_update
{
  "doc": {
    "id":"1003"
  }
}



#改 PUT
#新增   PUT在新增时，必须指定id!
PUT /stu/table1/3
{
  "id":"1003",
  "name":"marry"
}
 
#405    /stu/table1/只允许POST，不允许PUT
PUT /stu/table1/
{
  "id":"1003",
  "name":"marry"
}

#id存在就更新，不存在就插入，默认也是全量更新
PUT /stu/table1/3
{
  "name":"jack"
}
 

#不能增量更新
PUT /stu/table1/rx4wNHwBb4g3p3m-lruA/_update
{
  "doc": {
    "id":"1004"
  }
}

# 4xxx开头的都是客户端错误
# 405: 客户端发送的请求方式错误，例如只允许发POST，你发了PUT
# 400 : 请求参数格式错误。没有按照人家指定的格式发参数




#删
DELETE /stu/table1/rx4wNHwBb4g3p3m-lruA


#判断是否存在
HEAD /stu/table1/rx4wNHwBb4g3p3m-lruA

HEAD /stu/table1/1

5.分词操作


# text(允许分词)   keyword(不允许分词)



# 默认的分词器，用来进行英文分词，按照空格分
GET /_analyze
{
  "text": "I am a teacher!"
  
}

#不能分词
GET /_analyze
{
  "keyword": "I am a teacher!"
  
}

# 汉语按照字切分
GET /_analyze
{
  "text": "国庆节快乐"
  
}




#ik_smart：  智能分词。切分后的所有单词的总字数等于 被切词的总字数   输入总字数=输出总字数
GET /_analyze
{
  "analyzer": "ik_smart", 
  "text": "国庆节快乐"
  
}

#ik_max_word： 最大化分词。 输入总字数 <= 输出总字数
GET /_analyze
{
  "analyzer": "ik_max_word", 
  "text": "国庆节快乐"
  
}

#只是切词，没有NLP(自然语言处理)，没有感情，不会思考，听不懂人话
GET /_analyze
{
  "analyzer": "ik_max_word", 
  "text": "爱好抽烟喝酒烫头洗屁股眼子"
  
}

6.子属性

java中：
public class Person{

	public String name;
	public Address address;

}

public class Address{
		public String provinceName;

}

provinceName称为是Person类的 级联(层级联系)属性， 或子属性(属性的属性)

json中：
person:
{
	age: 20
  address:{
  	"provinceName":"广东"
  
  }

  
}

注意：

 "name" : {
            "type" : "text",
            "fields" : {
              "aaa" : {
                "type" : "keyword",
                "ignore_above" : 256
              }
            }
          }
          
     text类型的字段，如果将来需要聚合，一定需要为其设置一个子属性，子属性的类型必须是keyword类型！

7.批量导入数据语法

#导入数据：
#_bulk代表批量写
#格式 ：  {"action": {metadata}}\n {data}
# action: insert,update,delete, index(upsert): 存在就更新，不存在就插入
#metadata 指定当前向哪个index，哪个type，哪个id进行写
#_id: id  _index:xxx _type:哪个type

8.DSL中的常见关键字

关键字	含义	类比SQL
query	查询	select
bool	多个组合条件	selext xxx from xxx where age=20 and gender=male
filter	一个过滤条件	where
term	精确匹配	=
match	全文检索，会分词
must	在过滤条件中使用，代表必须包含
fuzzy	模糊音匹配	dick 联想到 nick pick
from	从哪一条开始取,索引从0开始
size	取多少条	limit
_source	只选择某些字段	select 字段
match_phrase	短语匹配，将输入的查询内容整个作为整体进行查询，不切词
multi_match	一次到多个子弹中匹配内容

第四章、聚合

1.结构

aggregations|aggs

"aggregations" : 
{
    --aggregation_name：聚合字段名
    "" : 
    {
      --聚合运算的类型，类比,sum,avg,count(Term),min,max    sum(）
        "" :
        {
            	--num 对什么字段进行聚合
            <aggregation_body>
        }
        -- 对哪些表进行聚合，类比tablea，不写，将meta写在url
        [,"meta" : {  [<meta_data_body>] } ]?

        --子聚合，在当前聚合的基础上，继续聚合
        [,"aggregations" : { [<sub_aggregation>]+ } ]?
    }

--
    [,"" : { ... } ]*
}

count 等价于  term 
count(*)  ========  sum(if(gender = 'male',1,0))

select
	a,max(sum_num) --子聚合
from
    (select
        a,b,sum(num) sum_num，max(num) max_num
    from tablea
    where xxx
    group by a,b) tmp
group by a

2.聚合报错


 "type": "illegal_argument_exception",
  "reason": "Fielddata is disabled on text fields by default. Set fielddata=true on [gender] in order to load fielddata in memory by uninverting the inverted index. 
        
  Note that this can however use significant memory. Alternatively use a keyword field instead."
        
TEXT类型，因为涉及到分词，无法被聚合！
        
 解决： 使用KEYWORD类型
        
        
a_column(text)
中国人  ------> 中国，国人，中国人

3.聚合练习

- 见第五章综合练习

第五章、综合练习

#导入测试数据
#建表
PUT /test
{
    "mappings" : {
      "emps" : {
        "properties" : {
          "empid" : {
            "type" : "long"
          },
          "age" : {
            "type" : "long"
          },
          "balance" : {
            "type" : "double"
          },
          "name" : {
            "type" : "text",
            "fields" : {
              "keyword" : {
                "type" : "keyword",
                "ignore_above" : 256
              }
            }
          },
           "gender" : {
            "type" : "text",
            "fields" : {
              "keyword" : {
                "type" : "keyword",
                "ignore_above" : 256
              }
            }
          },
          "hobby" : {
            "type" : "text",
            "analyzer":"ik_max_word",
            "fields" : {
              "keyword" : {
                "type" : "keyword",
                "ignore_above" : 256
              }
            }
          }
        }
      }
    }
  }


#导数据
POST /test/emps/_bulk
{"index":{"_id":"1"}}
{"empid":1001,"age":20,"balance":2000,"name":"李三","gender":"男","hobby":"吃饭睡觉"}
{"index":{"_id":"2"}}
{"empid":1002,"age":30,"balance":2600,"name":"李小三","gender":"男","hobby":"吃粑粑睡觉"}
{"index":{"_id":"3"}}
{"empid":1003,"age":35,"balance":2900,"name":"张伟","gender":"女","hobby":"吃,睡觉"}
{"index":{"_id":"4"}}
{"empid":1004,"age":40,"balance":2600,"name":"张伟大","gender":"男","hobby":"打篮球睡觉"}
{"index":{"_id":"5"}}
{"empid":1005,"age":23,"balance":2900,"name":"大张伟","gender":"女","hobby":"打乒乓球睡觉"}
{"index":{"_id":"6"}}
{"empid":1006,"age":26,"balance":2700,"name":"张大喂","gender":"男","hobby":"打排球睡觉"}
{"index":{"_id":"7"}}
{"empid":1007,"age":29,"balance":3000,"name":"王五","gender":"女","hobby":"打牌睡觉"}
{"index":{"_id":"8"}}
{"empid":1008,"age":28,"balance":3000,"name":"王武","gender":"男","hobby":"打桥牌"}
{"index":{"_id":"9"}}
{"empid":1009,"age":32,"balance":32000,"name":"王小五","gender":"男","hobby":"喝酒,吃烧烤"}
{"index":{"_id":"10"}}
{"empid":1010,"age":37,"balance":3600,"name":"赵六","gender":"男","hobby":"吃饭喝酒"}
{"index":{"_id":"11"}}
{"empid":1011,"age":39,"balance":3500,"name":"张小燕","gender":"女","hobby":"逛街,购物,买"}
{"index":{"_id":"12"}}
{"empid":1012,"age":42,"balance":3400,"name":"李三","gender":"男","hobby":"逛酒吧,购物"}
{"index":{"_id":"13"}}
{"empid":1013,"age":42,"balance":3400,"name":"李球","gender":"男","hobby":"体育场,购物"}
{"index":{"_id":"14"}}
{"empid":1014,"age":22,"balance":3400,"name":"李健身","gender":"男","hobby":"体育场,购物"}
{"index":{"_id":"15"}}
{"empid":1015,"age":22,"balance":3400,"name":"Nick","gender":"男","hobby":"坐飞机,购物"}

#0.查询的两种方式
#①.RESTFUL的查询方式，参数是需要附加在url的后面


#②ES定义的DSL(特定领域语言)，需要根据DSL的语法规则将参数写在请求体中


#1.全表查询，按照年龄降序排序
#① RESTFUL   知道在ES中，不同的参数是什么操作 q代表查询 sort代表排序
GET /test/emps/_search?q=*&sort=age:desc

#②DSL  学习DSL的语法规则
GET /test/emps/_search
{
  "query": {
    "match_all": {
      
    }
  },
  "sort": [
    {
      "age": {
        "order": "desc"
      }
    }
  ]
  
}


#2.全表查询，按照年龄降序排序，再按照工资降序排序，只取前5条记录的empid，age，balance

GET /test/emps/_search
{
  "query": {
    "match_all": {}
  },
  "sort": [
    {
      "age": {
        "order": "desc"
      }
    },
    {
      "balance": {
        "order": "desc"
      }
    }
  ],
  "from": 0
  , "size": 5,
  "_source": ["empid","age","balance"]
}



#3.匹配之match分词匹配： 搜索hobby是吃饭睡觉的员工
GET /_analyze
{
  "analyzer": "ik_max_word",
  "text": "吃饭睡觉"
}

GET /test/emps/_search
{
  "query": {
    "match": {
      "hobby": "吃饭睡觉"
    }
  }
}

#4.匹配之match/term不分词匹配： 搜索工资是2000的员工  
#只有text类型可以切词，balance是double类型，无法切词
#ES不建议对无法切词的类型，使用 match
GET /test/emps/_search
{
  "query": {
    "match": {
      "balance": 2000
    }
  }
}
#  匹配之term不分词匹配： 搜索工资是2000的员工 
GET /test/emps/_search
{
  "query": {
    "term": {
      "balance": 2000
    }
  }
}
# 
#5.匹配之match不分词匹配： 搜索hobby是吃饭睡觉的员工
# keyword类型不能切词，只需要使用 一个 keyword类型的hobby就行了
GET /test/emps/_search
{
  "query": {
    "match": {
      "hobby.keyword": "吃饭睡觉"
    }
  }
}

#6.匹配之短语匹配： 搜索hobby是吃饭的员工
GET /test/emps/_search
{
  "query": {
    "match_phrase": {
      "hobby": "吃饭睡觉"
    }
  }
}
#7.匹配之多字段匹配： 搜索name或hobby中带球的员工
GET /test/emps/_search
{
  "query": {
    "multi_match": {
      "query": "球",
      "fields": ["name","hobby"]
    }
  }
}
#8.匹配之多条件匹配，搜索男性中喜欢购物的员工
GET /test/emps/_search
{
  "query": {
   
    "bool": {
      "must": [
        {
          "match": {
            "hobby": "购物"
          }
        },
        {
          "term": {
            "gender": {
              "value": "男"
            }
          }
        }
      ]
    }
  }
}




#9.匹配之多条件匹配，搜索男性中喜欢购物，还不能爱去酒吧的员工
GET /test/emps/_search
{
  "query": {
   
    "bool": {
      "must": [
        {
          "match": {
            "hobby": "购物"
          }
        },
        {
          "term": {
            "gender": {
              "value": "男"
            }
          }
        }
      ],
      "must_not": [
        {
          "match": {
            "hobby": "酒吧"
          }
        }
      ]
    }
  }
}

#10.匹配之多条件匹配，搜索男性中喜欢购物，还不能爱去酒吧的员工，最好在20-30之间
#should 加分
GET /test/emps/_search
{
  "query": {
   
    "bool": {
      "must": [
        {
          "match": {
            "hobby": "购物"
          }
        },
        {
          "term": {
            "gender": {
              "value": "男"
            }
          }
        }
      ],
      "must_not": [
        {
          "match": {
            "hobby": "酒吧"
          }
        }
      ],
      "should": [
        {
          "range": {
            "age": {
              "gt": 20,
              "lt": 30
            }
          }
        }
      ]
    }
  }
}
#11.匹配之多条件匹配，搜索男性中喜欢购物，还不能爱去酒吧的员工，最好在20-30之间，不要40岁以上的
GET /test/emps/_search
{
  "query": {
   
    "bool": {
      "must": [
        {
          "match": {
            "hobby": "购物"
          }
        },
        {
          "term": {
            "gender": {
              "value": "男"
            }
          }
        }
      ],
      "must_not": [
        {
          "match": {
            "hobby": "酒吧"
          }
        },
        {
          "range": {
            "age": {
              "gt": 40
            }
          }
        }
      ],
      "should": [
        {
          "range": {
            "age": {
              "gt": 20,
              "lt": 30
            }
          }
        }
      ]
    }
  }
}



GET /test/emps/_search
{
  "query": {
   
    "bool": {
      "must": [
        {
          "match": {
            "hobby": "购物"
          }
        },
        {
          "term": {
            "gender": {
              "value": "男"
            }
          }
        }
      ],
      "must_not": [
        {
          "match": {
            "hobby": "酒吧"
          }
        }
      ],
      "should": [
        {
          "range": {
            "age": {
              "gt": 20,
              "lt": 30
            }
          }
        }
      ],
      "filter": {
        "range": {
          "age": {
            "lte": 40
          }
        }
      }
    }
  }
}

#12.匹配之字段模糊联想匹配，搜索Nick
GET /test/emps/_search
{
  "query": {
    "fuzzy": {
      "name": "Dick"
    }
  }
  
}
#13.聚合之单聚合，统计男女员工各多少人
#如果想取全部的聚合结果，size >= 分组数
GET /test/emps/_search
{
  "aggs": {
    "gendercount": {
      "terms": {
        "field": "gender.keyword",
        "size": 2
      }
    }
  }
}

#14.聚合之先查询再聚合，统计喜欢购物的男女员工各多少人
GET /test/emps/_search
{
  "query": {
    "match": {
      "hobby": "购物"
    }
  }, 
  "aggs": {
    "gendercount": {
      "terms": {
        "field": "gender.keyword",
        "size": 2
      }
    }
  }
}
#15.聚合之多聚合，统计喜欢购物的男女员工各多少人，及这些人总体的平均年龄
GET /test/emps/_search
{
  "query": {
    "match": {
      "hobby": "购物"
    }
  }, 
  "aggs": {
    "gendercount": {
      "terms": {
        "field": "gender.keyword",
        "size": 2
      }
    },
    "avgage":{
      "avg": {
        "field": "age"
      }
    }
  }
}
#16.聚合之多聚合和嵌套聚合，统计喜欢购物的男女员工各多少人，及这些人不同性别的平均年龄

GET /test/emps/_search
{
  "query": {
    "match": {
      "hobby": "购物"
    }
  },
  "aggs": {
    "gendercount": {
      "terms": {
        "field": "gender.keyword",
        "size": 2
      },
      "aggs": {
        "avgage": {
          "avg": {
            "field": "age"
          }
        }
      }
    }
  }
}

第六章、别名

1.对应关系

别名和索引是N对N的关系！

1个别名对于 N个索引！

1个索引可以拥有多个别名！

别名的主要应用场景：

在hive中有分区表，常见按照数据的日期分区。比如表ods_a,按照dt分区

	/ ods_a /  dt= 2021-07-07

	/ ods_a /  dt= 2021-07-08

只查询某一天的数据，使用分区字段进行过滤

	where dt=  2021-07-07

如果是全表查询，不加where过滤！

在ES中，如何实现一个分区表的效果？

要实现分区的效果：

	只能将每天产生的数据，放入到一个独立的index中

2021-07-07  ----------> ods_a_2021-07-07_index

2021-07-08 ----------> ods_a_2021-07-08_index

       只查询某一天的数据，只查询某个对应的index

2021-07-07 ------>  GET ods_a_2021-07-07_index

       查询这个月的所有数据？

这个月的index在创建时，为它们赋予一个别名  2021-07_index

	使用别名查询：  GET  2021-07_index

查询每一天所有的数据？

每个index在创建时，为它们赋予一个别名  ods_a_index

使用别名查询：  GET  ods_a_index

2.别名练习

#别名的查询

#查询所有的别名
GET /_cat/aliases?v

#查某个index的别名
GET /movie_index/_alias

#增
#在创建Index时，直接指定
PUT movie_index
{  
  "aliases": {
    "movie1": {},
     "movie2": {}
  },
  "mappings": {
    "movie_type":{
      "properties": {
        "id":{
          "type": "long"
        },
        "name":{
          "type": "text",
          "analyzer": "ik_smart"
        }
      }
    }
  }
}


#为已经创建好的index，添加别名
POST _aliases
{
  "actions": [
    {
      "add": {
        "index": "movie_index",
        "alias": "movie3"
      }
    }
  ]
}

#使用别名来引用一个index的子集
POST _aliases
{
  "actions": [
    {
      "add": {
        "index": "test",
        "alias": "man",
        "filter": {
          "term": {
            "gender": "男"
          }
        }
      }
    }
  ]
}

GET /man/_search

#将movie_index的别名 movie3删除，为test添加movie3

POST _aliases
{
  "actions": [
    {
      "remove": {
        "index": "movie_index",
        "alias": "movie3"
      }
    },
    {
      "add": {
        "index": "test",
        "alias": "movie3"
      }
    }
  ]
}

第七章、模版

1.模版练习

#查看

#查看当前所有定义的模板
GET /_cat/templates

#新增
#index_patterns 指当你创建的索引名称符合当前模板的index_patterns时，调用模板帮你创建index
PUT /_template/template_movie2020
{
  "index_patterns": ["movie_test*"],
  "aliases" : { 
    "{index}-query": {},
    "movie_test-query":{}
  },
  "mappings": { 
"_doc": {
      "properties": {
        "id": {
          "type": "keyword"
        },
        "movie_name": {
          "type": "text",
          "analyzer": "ik_smart"
        }
      }
    }
  }
}

GET /test

#Rejecting mapping update to [movie_index] as the final mapping would have more than 1 type: [movie_type, t1]

#movie2 是一个别名,指向movie_index
# PUT /movie_index/t1/1
# movie_index 的唯一type 是movie_type,你又指定了t1，冲突了
PUT /movie2/t1/1
{
  "name":"jack"
}

GET /_cat/aliases

GET /movie_index



PUT /hahah/t1/1
{
  "name":"jack"
}

GET /movie_test2

PUT /movie_test2/_doc/1
{
  "name":"jack"
}

HEAD /_template/template_movie2020

第八章、Java API操作

1.准备工作

新建maven工程,导入依赖

<dependency>
        <groupId>org.apache.httpcomponentsgroupId>
        <artifactId>httpclientartifactId>
        <version>4.5.5version>
    dependency>

    <dependency>
        <groupId>org.apache.httpcomponentsgroupId>
        <artifactId>httpmimeartifactId>
        <version>4.3.6version>
    dependency>

    <dependency>
        <groupId>io.searchboxgroupId>
        <artifactId>jestartifactId>
        <version>5.3.3version>
    dependency>

    <dependency>
        <groupId>net.java.dev.jnagroupId>
        <artifactId>jnaartifactId>
        <version>4.5.2version>
    dependency>

    <dependency>
        <groupId>org.codehaus.janinogroupId>
        <artifactId>commons-compilerartifactId>
        <version>2.7.8version>
    dependency>

    <dependency>
        <groupId>org.elasticsearchgroupId>
        <artifactId>elasticsearchartifactId>
        <version>6.6.0version>
    dependency>
    <dependency>
            <groupId>org.projectlombokgroupId>
            <artifactId>lombokartifactId>
            <version>1.18.12version>
            <scope>providedscope>
   dependency>

javabean(Emp.java)

package com.atgugu.esdemo.pojo;

import lombok.AllArgsConstructor;
import lombok.Data;
import lombok.NoArgsConstructor;

@NoArgsConstructor
@AllArgsConstructor
@Data
public class Emp {
    private String empid;
    private Integer age;
    private Double balance;
    private String name;
    private String gender;
    private String hobby;
}

2.读数据

package com.atgugu.esdemo;

import com.atgugu.esdemo.pojo.Emp;
import io.searchbox.client.JestClient;
import io.searchbox.client.JestClientFactory;
import io.searchbox.client.config.HttpClientConfig;
import io.searchbox.core.Search;
import io.searchbox.core.SearchResult;

import java.io.IOException;
import java.util.List;

/**
 * 一般步骤
 *    1.创建一个客户端
 *    2.连接服务端
 *    3.准备命令
 *    4.发送命令
 *    5.如果是查询,接收服务端返回的结果
 *    -------------------------------------
 *    Jest客户端大量使用以下两种模式
 *    工厂模式: new 对象Factory().get对象()
 *    建筑者模式: new 对象Builder().build()
 *    在建筑者模式中大量使用了java语法糖
 *    A.B() 返回 A
 *    -------------------------------------
 */

public class ReadDemo01 {
    public static void main(String[] args) throws IOException {
        //建厂
        JestClientFactory jestClientFactory = new JestClientFactory();
        //设置连接的集群地址
        HttpClientConfig httpClientConfig = (new HttpClientConfig.Builder("http://hadoop102:9200")).build();

        jestClientFactory.setHttpClientConfig(httpClientConfig);
        //获取连接
        JestClient jestClient = jestClientFactory.getObject();

        String queryString = "{\n" +
                "  \"query\": {\n" +
                "    \"match\": {\n" +
                "      \"hobby\": \"购物\"\n" +
                "    }\n" +
                "  },\n" +
                "  \"aggs\": {\n" +
                "    \"gendercount\": {\n" +
                "      \"terms\": {\n" +
                "        \"field\": \"gender.keyword\",\n" +
                "        \"size\": 2\n" +
                "      },\n" +
                "      \"aggs\": {\n" +
                "        \"avgage\": {\n" +
                "          \"avg\": {\n" +
                "            \"field\": \"age\"\n" +
                "          }\n" +
                "        }\n" +
                "      }\n" +
                "    }\n" +
                "  }\n" +
                "}";
        // 使用 GET /test/emps/_search
        Search search = new Search.Builder(queryString)
                .addIndex("test")
                .addType("emps")
                .build();
        SearchResult searchResult = jestClient.execute(search);
        //遍历返回最后的结果
        System.out.println("total:"+ searchResult.getTotal());
        System.out.println("max_score:"+ searchResult.getMaxScore());
        List<SearchResult.Hit<Emp, Void>> hits = searchResult.getHits(Emp.class);
        for (SearchResult.Hit<Emp, Void> hit : hits) {
            System.out.println("_index:"+hit.index);
            System.out.println("_type:"+hit.type);
            System.out.println("_id:"+hit.id);
            System.out.println("_source:"+hit.source);
        }
        //关闭
        jestClient.shutdownClient();
    }

}

3.读数据(面向对象)

package com.atgugu.esdemo;

import com.atgugu.esdemo.pojo.Emp;
import io.searchbox.client.JestClient;
import io.searchbox.client.JestClientFactory;
import io.searchbox.client.config.HttpClientConfig;
import io.searchbox.core.Search;
import io.searchbox.core.SearchResult;
import io.searchbox.core.search.aggregation.AvgAggregation;
import io.searchbox.core.search.aggregation.MetricAggregation;
import io.searchbox.core.search.aggregation.TermsAggregation;
import org.elasticsearch.index.query.MatchQueryBuilder;
import org.elasticsearch.search.aggregations.AggregationBuilders;
import org.elasticsearch.search.aggregations.bucket.terms.TermsAggregationBuilder;
import org.elasticsearch.search.builder.SearchSourceBuilder;

import java.io.IOException;
import java.util.List;

/**
 * 一般步骤
 *    1.创建一个客户端
 *    2.连接服务端
 *    3.准备命令
 *    4.发送命令
 *    5.如果是查询,接收服务端返回的结果
 *    -------------------------------------
 *    Jest客户端大量使用以下两种模式
 *    工厂模式: new 对象Factory().get对象()
 *    建筑者模式: new 对象Builder().build()
 *    在建筑者模式中大量使用了java语法糖
 *    A.B() 返回 A
 *    -------------------------------------
 */

public class ReadDemo02 {
    public static void main(String[] args) throws IOException {
        //建厂
        JestClientFactory jestClientFactory = new JestClientFactory();
        //设置连接的集群地址
        HttpClientConfig httpClientConfig = (new HttpClientConfig.Builder("http://hadoop102:9200")).build();

        jestClientFactory.setHttpClientConfig(httpClientConfig);
        //获取连接
        JestClient jestClient = jestClientFactory.getObject();
        //创建一个对象,通过这个对象,将查询条件封装
        //封装match
        MatchQueryBuilder matchQueryBuilder = new MatchQueryBuilder("hobby", "购物");
        //封装aggs
        TermsAggregationBuilder aggregationBuilder  = AggregationBuilders.terms("gendercount").field("gender.keyword").size(2)
                .subAggregation(AggregationBuilders.avg("avgage").field("age"));
        //将match放入query
        String querySource = new SearchSourceBuilder().query(matchQueryBuilder).aggregation(aggregationBuilder).toString();

        // 使用 GET /test/emps/_search
        Search search = new Search.Builder(querySource)
                .addIndex("test")
                .addType("emps")
                .build();
        SearchResult searchResult = jestClient.execute(search);
        //遍历返回最后的结果
        System.out.println("total:"+ searchResult.getTotal());
        System.out.println("max_score:"+ searchResult.getMaxScore());
        List<SearchResult.Hit<Emp, Void>> hits = searchResult.getHits(Emp.class);
        for (SearchResult.Hit<Emp, Void> hit : hits) {
            System.out.println("_index:"+hit.index);
            System.out.println("_type:"+hit.type);
            System.out.println("_id:"+hit.id);
            System.out.println("_source:"+hit.source);
        }
        MetricAggregation aggregations = searchResult.getAggregations();
        TermsAggregation genderCount = aggregations.getTermsAggregation("gendercount");
        List<TermsAggregation.Entry> buckets = genderCount.getBuckets();
        for (TermsAggregation.Entry bucket : buckets) {
            System.out.println(bucket.getKey() + ":" + bucket.getCount());
            AvgAggregation avgage = bucket.getAvgAggregation("avgage");
            System.out.println(avgage.getAvg());
        }
        //关闭
        jestClient.shutdownClient();
    }

}

4.写数据(新增)

package com.atgugu.esdemo;

import com.atgugu.esdemo.pojo.Emp;
import io.searchbox.client.JestClient;
import io.searchbox.client.JestClientFactory;
import io.searchbox.client.config.HttpClientConfig;
import io.searchbox.core.DocumentResult;
import io.searchbox.core.Index;


import java.io.IOException;
import java.util.List;

/**
 *  新增或修改:index
 *  删除:Delete
 *
 */

public class WriteDemo01 {
    public static void main(String[] args) throws IOException {
        //建厂
        JestClientFactory jestClientFactory = new JestClientFactory();
        //设置连接的集群地址
        HttpClientConfig httpClientConfig = (new HttpClientConfig.Builder("http://hadoop102:9200")).build();

        jestClientFactory.setHttpClientConfig(httpClientConfig);
        //获取连接
        JestClient jestClient = jestClientFactory.getObject();
        //将写的数据封装为一个对象
        Emp emp = new Emp("1018", 30, 22.22, "jack", "男", "吃饭");
        //PUT /test/emps/16
        Index index = new Index.Builder(emp)
                .type("emps")
                .index("test")
                .id("18")
                .build();


        DocumentResult result = jestClient.execute(index);
        System.out.println(result.getResponseCode());
        //关闭
        jestClient.shutdownClient();
    }

}

5.写数据(批量写)

package com.atgugu.esdemo;

import com.atgugu.esdemo.pojo.Emp;
import io.searchbox.client.JestClient;
import io.searchbox.client.JestClientFactory;
import io.searchbox.client.config.HttpClientConfig;
import io.searchbox.core.*;

import java.io.IOException;

/**
 *  新增或修改:index
 *  删除:Delete
 *  批量写:Bulk
 *
 */

public class WriteDemo02 {
    public static void main(String[] args) throws IOException {
        //建厂
        JestClientFactory jestClientFactory = new JestClientFactory();
        //设置连接的集群地址
        HttpClientConfig httpClientConfig = (new HttpClientConfig.Builder("http://hadoop102:9200")).build();

        jestClientFactory.setHttpClientConfig(httpClientConfig);
        //获取连接
        JestClient jestClient = jestClientFactory.getObject();
        //将写的数据封装为一个对象
        Emp emp = new Emp("1018", 30, 22.22, "jack", "男", "吃饭");
        //PUT /test/emps/16
        Index index = new Index.Builder(emp)
                .type("emps")
                .index("test")
                .id("16")
                .build();
        Delete delete = new Delete.Builder("18").index("test").type("emps").build();
        //将多次操作组装到一个Bulk中
        Bulk bulk = new Bulk.Builder()
                .addAction(index)
                .addAction(delete).build();


        BulkResult bulkResult = jestClient.execute(bulk);
        System.out.println(bulkResult.getResponseCode());
        //关闭
        jestClient.shutdownClient();
    }

}

你可能感兴趣的:(#,spark项目,elasticsearch,搜索引擎,java)

【VSCode】VSCode常用插件 Ctrl Z. vscode ide 编辑器
Chinese(Simplified)(简体中文)LanguagePackforVisualStudioCode：简体中文支持插件HTML/CSS/JavaScriptSnippets：支持HTML/CSS/JavaScript快速匹配输入HTMLSnippets：这个插件提供了一系列HTML代码片段，通过简单的缩写就可以快速生成常用的HTML结构。例如，输入!并按下Tab键，就可以快速生成一个完
java 实现数据库备份李逍遙️ mysql 数据库 java mysql
importcom.guangyi.project.model.system.DataBaseInFo;importjava.io.BufferedReader;importjava.io.File;importjava.io.FileOutputStream;importjava.io.IOException;importjava.io.InputStream;importjava.io.Inp
linux 安装jdk1.8 李逍遙️ linux 运维服务器
通过终端，使用wget命令下载JDK：wgethttps://download.java.net/openjdk/jdk8u41/ri/openjdk-8u41-b04-linux-x64-14_jan_2020.tar.gz解压下载的文件。你可以使用tar命令解压：tar-xzfopenjdk-8u41-b04-linux-x64-14_jan_2020.tar.gz将解压后的JDK移动到/op
实现一个完整的计算器（Java）李逍遙️
直接上代码importjava.awt.BorderLayout;importjava.awt.Color;importjava.awt.GridLayout;importjava.awt.event.ActionEvent;importjava.awt.event.ActionListener;importjavax.swing.JButton;importjavax.swing.JFrame;
java word转pdf三种方法（附有需要的jar）李逍遙️ word转pdf java
一.jacob1.jar下载jacob.jar和jacob-1.17-x64.dll下载提取码：01212.在jdk/bin目录下引入.dll文件（64位：jacob-1.17-x64.dll32位：jacob-1.17-x86.dll）3.转换代码importcom.jacob.activeX.ActiveXComponent;importcom.jacob.com.Dispatch;impor
需求池膨胀时如何科学排序优先级需求分析
需求池膨胀时如何科学排序优先级主要依靠数据驱动、战略对齐、风险评估**。其中数据驱动是关键，通过收集历史数据、用户反馈与市场趋势，对各项需求进行量化评估，帮助企业在需求膨胀时做出精准排序和资源配置。实践表明，数据驱动的决策可使需求响应速度提升约30%，大大优化资源分配效果。一、需求池膨胀现象的背景与挑战、需求池指的是企业内部或市场上积累的各类需求、项目或功能请求。随着企业发展和市场环境变化，需求池
Flutter 适配HarmonyOS NEXT：调用原生功能实现相册选取与拍照
Flutter适配鸿蒙系统：调用原生功能实现相册选取与拍照项目背景我们的移动端项目基于Flutter开发，为控制开发周期与成本，采用了HarmonyOSNEXT（简称鸿蒙）的Flutter兼容库，并更新了部分三方库为鸿蒙的Flutter兼容库。在图片视频选择与拍摄功能上，我们之前调用的是Android和iOS的原生方法，现在需要为鸿蒙开发一套原生配合使用的方案。遇到的问题鸿蒙的Flutter兼容库
LangChain入门：使用Python和通义千问打造免费的Qwen大模型聊天机器人南七小僧人工智能网站开发 AI技术产品经理服务器数据库 windows
前言LangChain是一个用于开发由大型语言模型（LargeLanguageModels，简称LLMs）驱动的应用程序的框架。它提供了一个灵活的框架，使得开发者可以构建具有上下文感知能力和推理能力的应用程序，这些应用程序可以利用公司的数据和APIs。这个框架由几个部分组成。LangChain库：Python和JavaScript库。包含了各种组件的接口和集成，一个基本的运行时，用于将这些组件组合
泛型擦除和TypeToken liudachu java
泛型可以让代码更加通用，但同时也可能会导致一些类型信息在运行时丢失，这就是所谓的类型擦除。Guava的TypeToken帮咱们巧妙地解决了这个问题。第1章：泛型编程的挑战先来说说泛型。在Java中，泛型是一种在编译时进行类型检查的机制。它让咱们能在类、接口、方法中使用类型参数，比如List或者Map。这样的好处是代码更安全，更易读，同时还能重用。但是，泛型也有个大问题——类型擦除。听起来有点高深，
mysql 统计同一字段不同值的个数 liudachu Mysql数据库 mysql
在一个项目中,制作呃echart图表的时候，遇到一个需求，需要从后端接口获取数据----售票员的姓名和业绩所以需要在订单表中，获取不同售票员的订单数量。订单表解决方案汇总MySQL统计一个列中不同值的数量需求：MySQL统计一个列中不同值的数量，其中origin是用户来源，其中的值有iPhone、Android、Web三种，现在需要分别统计由这三种渠道注册的用户数量。方案1:SELECTcount
2025美团最新面试题—Java程序减少GC的设计程序员共鸣 java jvm 开发语言
1.对象复用与池化线程局部变量：通过ThreadLocal缓存线程私有对象，避免竞争。可变对象：优先使用可修改对象（如StringBuilder代替String拼接）。2.减少对象创建避免隐式装箱：使用基本类型（int而非Integer）。优化循环：避免在循环内创建临时对象。静态不可变对象：将常量声明为staticfinal（如配置参数）。3.数据结构优化预分配容量：初始化集合时指定合理大小（如A
pygmsh 项目常见问题解决方案葛雨禹
pygmsh项目常见问题解决方案pygmsh:spider_web:GmshforPython项目地址:https://gitcode.com/gh_mirrors/py/pygmsh1.项目基础介绍和主要编程语言项目名称:pygmsh项目简介:pygmsh是一个结合了Gmsh和Python的开源项目。它通过提供Gmsh的Python接口，简化了复杂几何体的创建过程。pygmsh提供了许多有用的抽
【第11章】亿级电商平台订单系统-海量数据架构设计 cherry5230 架构系统架构架构分布式
1-1本章导学课程导学课程定位：大型系统架构设计核心难点解析核心项目：BToB电商平台订单系统（年交易额200亿级）本章知识体系1.核心概念辨析海量数据vs大数据本质区别解析常见认知误区说明2.方法论框架海量数据处理核心思想分布式计算原理数据分片策略弹性扩展机制3.数据库架构设计方法论体系读写分离模式分库分表策略数据分区方案缓存层设计4.数据处理体系海量数据处理之道批处理与流处理数据压缩技术异步处
探索 LangChain、Hugging Face、LM Studio 等 AI 应用工具 Alex程 langchain 人工智能
目录1.LangChainv0.2简介安装概念指南简单试用(1)模型选择(2)基础操作(3)更多操作Runnable调用链的连接Runnable并行自定义函数RunnableLambda额外assign参数(4)langchain.js2.HuggingFace简介如何调用API3.LMStudio简介LMStudio服务器JavaScript/TypeScriptSDK4.Dify.AI简介安装
火山云与腾讯云的优势对比苹果企业签名分发腾讯云云计算
首先，我需要确定用户的需求是什么。可能他们是在选择云服务提供商，或者在做市场调研。用户可能是企业的IT决策者，或者是开发人员，需要了解哪个平台更适合他们的项目。接下来，我得收集火山云和腾讯云的基本信息。火山云是字节跳动旗下的，虽然进入市场较晚，但可能有字节的技术支持，比如大数据和AI方面的优势。腾讯云作为老牌厂商，生态完善，产品线全，尤其在游戏、社交等领域有优势。需要对比的方面包括：背景与市场地位
美团Leaf分布式ID生成器使用教程：号段模式与Snowflake模式详解 Cloud_. 分布式
引言在分布式系统中，生成全局唯一ID是核心需求之一。美团开源的Leaf提供了两种分布式ID生成方案：号段模式（高可用、依赖数据库）和Snowflake模式（高性能、去中心化）。本文将手把手教你如何配置和使用这两种模式，并解析其核心机制。一、Leaf号段模式使用教程1.环境准备数据库：MySQL5.7+Java环境：JDK1.8+Leaf源码：从GitHub克隆Leaf仓库（推荐使用feature/
java八股文之常见的集合 qq_45923849 java 开发语言
一、数组的索引为什么从0开始？寻址公式：数组的首地址+索引乘以存储数据的类型大小在根据数组索引获取元素的时候，会用索引和寻址公式来计算内存所对应的元素数据。如果数组的索引从1开始，寻址公式中，就需要增加一次减法操作（数组的首地址-1），对于CPU来说就多了一次指令，性能会降低。二、数组进行查找操作的时间复杂度如果是通过下标，查询的时间复杂度是O(1)如果不通过下标，和使用的查找方式有关–从头往后顺
《React开发实践：掌握Redux与Hooks应用》——开启你的前端进阶之旅 JJCTO袁龙前端 react.js 前端框架
文章标题《React开发实践：掌握Redux与Hooks应用》——开启你的前端进阶之旅在前端开发的浪潮中，React.js已经成为开发者们不可或缺的利器。它以其高效、灵活的特性，成为构建现代Web应用的首选框架之一。然而，随着项目复杂度的增加，如何更好地管理状态、优化性能、提升代码可维护性，成为每个开发者必须面对的挑战。幸运的是，我最近出版的《React开发实践：掌握Redux与Hooks应用》这
Webpack常见面试题总结 xiangzhihong8 React Native 前端 webpack 前端 javascript
一、谈谈你对Webpack的理解1.1背景Webpack的目标是实现前端项目的模块化，从而更高效地管理和维护项目中的每一个资源。在早期的前端项目中，我们通过文件划分的形式来实现模块化，也就是将每个功能及其相关状态数据各自单独放到不同的JS文件中。约定每个文件是一个独立的模块，然后再将这些js文件引入到页面，一个script标签对应一个模块，然后再调用模块化的成员。比如：但这种模块化开发的弊端也十分
初级面试题：数据类型面试题大揭秘佩奇的技术笔记 Java面试小册 java 开发语言
一、引言在Java开发的面试中，数据类型相关的问题经常出现。面试官通过这些问题考察候选人对Java基础的理解程度以及在实际开发中对数据类型的运用能力。本文将深入剖析常见的数据类型面试题，帮助读者全面掌握这些知识点。二、基本数据类型与引用数据类型面试题：int和Integer的区别是什么？答案：int是基本数据类型，占用4个字节内存，直接存储数值；Integer是int对应的引用数据类型，即包装类，
Django 中@login_required 配置详解换个网名有点难数据库 python sqlite
在Django中对@login_required进行配置，主要涉及全局配置和视图函数局部配置两方面，下面为你详细介绍配置方法。全局配置全局配置主要是设定默认的登录URL，也就是当未登录用户尝试访问被@login_required装饰的视图时，会被重定向到的页面。你可以在项目的settings.py文件里对这个默认的登录URL进行配置。步骤打开项目的settings.py文件。添加或修改LOGIN_
最完整的webpack Dll打包与采坑总结仰望星空的代码 Vue.js踩坑记 vue.js webpack dll打包打包优化
webpack已经成为前端主流的项目打包工具，对于前端开发必不可少。在前端项目依赖第三方库过多，项目比较大文件比较多时，webpack打包的速度也会被拖成蜗牛，是时候优化一下webapck的打包速度了。在优化打包速度方面有不少方法方式，其中一个比较重要的方式是DllPlugin。DllPlugin把第三方库打包成动态链接库（动态链接库：windows系统中库文件概念，这里是借用了这一概念。），Dl
List 和 Set 的区别不会搬砖的淡水鱼数据结构 list windows 数据结构
List和Set的区别在Java中，List和Set都是Collection接口的子接口，但它们的存储结构、特点、使用场景不同。对比项List（有序、可重复）Set（无序、不可重复）是否允许重复元素✅允许❌不允许是否有序✅按插入顺序排序❌无序（TreeSet除外）是否可以有null✅允许多个null✅只允许一个null底层数据结构数组、链表哈希表、红黑树访问方式通过索引访问通过iterator遍历
Java WebSocket与项目页面（通常是HTML + JavaScript）之间建立连接并传输数据 hh_fine java websocket html
JavaWebSocket与项目页面（通常是HTML+JavaScript）之间建立连接并传输数据1.创建JavaWebSocket服务器：使用JavaWebSocketAPI创建一个WebSocket服务器端点。2.在HTML页面中使用JavaScript连接WebSocket：通过JavaScript的WebSocketAPI与JavaWebSocket服务器建立连接。3.双向数据传输：实现服
Ts学习笔记初学者7. 学习笔记 typescript
一、Ts与Js区别TsJsJavaScript的超集，用于解决大型项目的代码复杂性一种脚本语言，用于创建动态网页。强类型，支持静态和动态类型动态弱类型语言可以在编译期间发现并纠正错误只能在运行时发现错误不允许改变变量的数据类型变量可以被赋予不同类型的值二、Ts基础类型：boolean,number,string,undefined,null,any,unknown,void，neverany,un
Lodash源码分析-every,some,size,includes 初学者7. Loadsh源码分析 javascript 前端
collection相关的函数，collection指的是一组用于处理集合（如数组或对象）的工具函数。lodash源码研读之every,some,size,includes一、源码地址GitHub地址:GitHub-lodash/lodash:AmodernJavaScriptutilitylibrarydeliveringmodularity,performance,&extras.官方文档地址
Lodash源码分析-uniq,uniqBy,uniqWith 初学者7. Loadsh源码分析 javascript 前端
lodash源码研读之uniq,uniqBy,uniqWith一、源码地址GitHub地址:GitHub-lodash/lodash:AmodernJavaScriptutilitylibrarydeliveringmodularity,performance,&extras.官方文档地址:Lodash官方文档二、结构分析uniq,uniqBy,uniqWith基于baseUniq模块。三、函数介
《Flutter从入门到实战：手把手构建跨平台应用（万字深度解析）》前端极客探险家 flutter
目录标题前言：为什么选择Flutter？一、Flutter基础篇：环境搭建与核心概念1.1开发环境配置1.2项目结构深度解析二、核心机制：Widget与渲染原理2.1Widget树构建原理2.2状态管理方案对比三、企业级开发实战3.1工程化架构设计3.2典型功能实现四、进阶开发技巧4.1性能优化方案4.2平台特定代码集成五、项目实战：开发企业级Todo应用（深度扩展版）5.1项目初始化与工程化配置
推荐一个开源的高效头像生成工具，支持API调用计算机小手经验分享开源软件
一、简介集成多种头像生成方案，包括：ugly-avatar、multiavatar、jdenticon、facesjs、dicebear等支持docker部署，支持API调用项目开源地址：GitHub-luler/hello_avatar:轻松搭建生成简易头像的api服务二、安装准备好docker、docker-compose环境新建docker-compose.yml，配置内容如下:versio
泛目录程序：2025快云站群程序的SEO优化功能云惠科技大数据泛目录
快云站群程序的SEO优化功能围绕搜索引擎算法设计，具体包含以下核心模块：1.关键词智能布局密度检测与优化：自动分析内容关键词密度，建议合理区间（2%-8%），避免堆砌或遗漏；多词策略支持：可针对单篇内容设置主关键词+长尾词组合，覆盖更多搜索场景；标题/摘要自动生成：根据关键词智能生成高点击率的标题和Meta描述，提升搜索展示效果。2.内链自动化系统内容关联推荐：基于语义分析，自动在文章中插入相关内
设计模式介绍 tntxia 设计模式
设计模式来源于土木工程师克里斯托弗亚历山大（http://en.wikipedia.org/wiki/Christopher_Alexander）的早期作品。他经常发表一些作品，内容是总结他在解决设计问题方面的经验，以及这些知识与城市和建筑模式之间有何关联。有一天，亚历山大突然发现，重复使用这些模式可以让某些设计构造取得我们期望的最佳效果。亚历山大与萨拉-石川佳纯和穆雷西乐弗斯坦合作
android高级组件使用(一) 百合不是茶 android RatingBar Spinner
1、自动完成文本框（AutoCompleteTextView） AutoCompleteTextView从EditText派生出来，实际上也是一个文本编辑框，但它比普通编辑框多一个功能：当用户输入一个字符后，自动完成文本框会显示一个下拉菜单，供用户从中选择，当用户选择某个菜单项之后，AutoCompleteTextView按用户选择自动填写该文本框。使用AutoCompleteTex
[网络与通讯]路由器市场大有潜力可挖掘 comsci 网络
如果国内的电子厂商和计算机设备厂商觉得手机市场已经有点饱和了,那么可以考虑一下交换机和路由器市场的进入问题..... 这方面的技术和知识,目前处在一个开放型的状态,有利于各类小型电子企业进入 &nbs
自写简单Redis内存统计shell 商人shang Linux shell 统计Redis内存
#!/bin/bash address="192.168.150.128:6666,192.168.150.128:6666" hosts=(${address//,/ }) sfile="staticts.log" for hostitem in ${hosts[@]} do ipport=(${hostitem
单例模式(饿汉 vs懒汉) oloz 单例模式
package 单例模式; /* * 应用场景:保证在整个应用之中某个对象的实例只有一个 * 单例模式种的《懒汉模式》 * */ public class Singleton { //01 将构造方法私有化，外界就无法用new Singleton()的方式获得实例 private Singleton(){}; //02 申明类得唯一实例 priva
springMvc json支持杨白白 json springmvc
1.Spring mvc处理json需要使用jackson的类库，因此需要先引入jackson包 2在spring mvc中解析输入为json格式的数据:使用@RequestBody来设置输入 @RequestMapping("helloJson") public @ResponseBody JsonTest helloJson() {
android播放，掃描添加本地音頻文件小桔子
最近幾乎沒有什麽事情，繼續鼓搗我的小東西。想在項目中加入一個簡易的音樂播放器功能，就像華為p6桌面上那麼大小的音樂播放器。用過天天動聽或者QQ音樂播放器的人都知道，可已通過本地掃描添加歌曲。不知道他們是怎麼實現的，我覺得應該掃描設備上的所有文件，過濾出音頻文件，每個文件實例化為一個實體，記錄文件名、路徑、歌手、類型、大小等信息。具體算法思想，
oracle常用命令 aichenglong oracle dba 常用命令
1 创建临时表空间 create temporary tablespace user_temp tempfile 'D:\oracle\oradata\Oracle9i\user_temp.dbf' size 50m autoextend on next 50m maxsize 20480m extent management local
25个Eclipse插件 AILIKES eclipse插件
提高代码质量的插件1. FindBugsFindBugs可以帮你找到Java代码中的bug，它使用Lesser GNU Public License的自由软件许可。2. CheckstyleCheckstyle插件可以集成到Eclipse IDE中去，能确保Java代码遵循标准代码样式。3. ECLemmaECLemma是一款拥有Eclipse Public License许可的免费工具，它提供了
Spring MVC拦截器+注解方式实现防止表单重复提交 baalwolf spring mvc
原理：在新建页面中Session保存token随机码，当保存时验证，通过后删除，当再次点击保存时由于服务器端的Session中已经不存在了，所有无法验证通过。 1.新建注解： ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
《Javascript高级程序设计(第3版)》闭包理解 bijian1013 JavaScript
“闭包是指有权访问另一个函数作用域中的变量的函数。”--《Javascript高级程序设计(第3版)》看以下代码： <script type="text/javascript"> function outer() { var i = 10; return f
AngularJS Module类的方法 bijian1013 JavaScript AngularJS Module
AngularJS中的Module类负责定义应用如何启动，它还可以通过声明的方式定义应用中的各个片段。我们来看看它是如何实现这些功能的。一.Main方法在哪里如果你是从Java或者Python编程语言转过来的，那么你可能很想知道AngularJS里面的main方法在哪里？这个把所
[Maven学习笔记七]Maven插件和目标 bit1129 maven插件
插件(plugin)和目标(goal) Maven，就其本质而言，是一个插件执行框架，Maven的每个目标的执行逻辑都是由插件来完成的，一个插件可以有1个或者几个目标，比如maven-compiler-plugin插件包含compile和testCompile，即maven-compiler-plugin提供了源代码编译和测试源代码编译的两个目标使用插件和目标使得我们可以干预
【Hadoop八】Yarn的资源调度策略 bit1129 hadoop
1. Hadoop的三种调度策略 Hadoop提供了3中作业调用的策略， FIFO Scheduler Fair Scheduler Capacity Scheduler 以上三种调度算法，在Hadoop MR1中就引入了，在Yarn中对它们进行了改进和完善.Fair和Capacity Scheduler用于多用户共享的资源调度 2. 多用户资源共享的调度
Nginx使用Linux内存加速静态文件访问 ronin47
Nginx是一个非常出色的静态资源web服务器。如果你嫌它还不够快，可以把放在磁盘中的文件，映射到内存中，减少高并发下的磁盘IO。先做几个假设。nginx.conf中所配置站点的路径是/home/wwwroot/res，站点所对应文件原始存储路径：/opt/web/res shell脚本非常简单，思路就是拷贝资源文件到内存中，然后在把网站的静态文件链接指向到内存中即可。具体如下：
关于Unity3D中的Shader的知识 brotherlamp unity unity资料 unity教程 unity视频 unity自学
首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，然后我们来看下Unity3D自带的60多个S
CopyOnWriteArrayList vs ArrayList bylijinnan java
package com.ljn.base; import java.util.ArrayList; import java.util.Iterator; import java.util.List; import java.util.concurrent.CopyOnWriteArrayList; /** * 总述： * 1.ArrayListi不是线程安全的，CopyO
内存中栈和堆的区别 chicony 内存
1、内存分配方面：堆：一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式是类似于链表。可能用到的关键字如下：new、malloc、delete、free等等。栈：由编译器(Compiler)自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中
回答一位网友对Scala的提问 chenchao051 scala map
本来准备在私信里直接回复了，但是发现不太方便，就简要回答在这里。问题写道对于scala的简洁十分佩服，但又觉得比较晦涩，例如一例，Map("a" -> List(11,111)).flatMap(_._2)，可否说下最后那个函数做了什么，真正在开发的时候也会如此简洁？谢谢先回答一点，在实际使用中，Scala毫无疑问就是这么简单。
mysql 取每组前几条记录 daizj mysql 分组最大值最小值每组三条记录
一、对分组的记录取前N条记录：例如：取每组的前3条最大的记录 1.用子查询： SELECT * FROM tableName a WHERE 3> (SELECT COUNT(*) FROM tableName b WHERE b.id=a.id AND b.cnt>a. cnt) ORDER BY a.id,a.account DE
HTTP深入浅出 http请求 dcj3sjt126com http
HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP，使HTTP客户（如Web浏览器）能够从HTTP服务器(Web服务器)请求信息和服务，HTTP目前协议的版本是1.1.HTTP是一种无状态的协议，无状态是指Web浏览器和Web服务器之间不需要建立持久的连接，这意味着当一个客户端向服务器端发出请求，然后We
判断MySQL记录是否存在方法比较 dcj3sjt126com mysql
把数据写入到数据库的时，常常会碰到先要检测要插入的记录是否存在，然后决定是否要写入。　　我这里总结了判断记录是否存在的常用方法：　　sql语句： select count ( * ) from tablename; 　　然后读取count(*)的值判断记录是否存在。对于这种方法性能上有些浪费，我们只是想判断记录记录是否存在，没有必要全部都查出来。
对HTML XML的一点认识 e200702084 html xml
感谢http://www.w3school.com.cn提供的资料 HTML 文档中的每个成分都是一个节点。节点根据 DOM，HTML 文档中的每个成分都是一个节点。 DOM 是这样规定的：整个文档是一个文档节点每个 HTML 标签是一个元素节点包含在 HTML 元素中的文本是文本节点每一个 HTML 属性是一个属性节点注释属于注释节点 Node 层次
jquery分页插件 genaiwei jquery Web 前端分页插件
//jquery页码控件// 创建一个闭包 (function($) { // 插件的定义 $.fn.pageTool = function(options) { var totalPa
Mybatis与Ibatis对照入门于学习 Josh_Persistence mybatis ibatis 区别联系
一、为什么使用IBatis/Mybatis 对于从事 Java EE 的开发人员来说，iBatis 是一个再熟悉不过的持久层框架了，在 Hibernate、JPA 这样的一站式对象 / 关系映射（O/R Mapping）解决方案盛行之前，iBaits 基本是持久层框架的不二选择。即使在持久层框架层出不穷的今天，iBatis 凭借着易学易用、
C中怎样合理决定使用那种整数类型？秋风扫落叶 c 数据类型
如果需要大数值(大于32767或小于32767), 使用long 型。否则, 如果空间很重要 (如有大数组或很多结构), 使用 short 型。除此之外, 就使用 int 型。如果严格定义的溢出特征很重要而负值无关紧要, 或者你希望在操作二进制位和字节时避免符号扩展的问题, 请使用对应的无符号类型。但是, 要注意在表达式中混用有符号和无符号值的情况。 &nbs
maven问题 zhb8015 maven问题
问题1： Eclipse 中新建maven项目无法添加src/main/java 问题 eclipse创建maevn web项目，在选择maven_archetype_web原型后，默认只有src/main/resources这个Source Floder。按照maven目录结构，添加src/main/ja
(二)androidpn-server tomcat版源码解析之--push消息处理 spjich java androdipn 推送
在 (一)androidpn-server tomcat版源码解析之--项目启动这篇中，已经描述了整个推送服务器的启动过程，并且把握到了消息的入口即XmppIoHandler这个类，今天我将继续往下分析下面的核心代码，主要分为3大块，链接创建，消息的发送，链接关闭。先贴一段XmppIoHandler的部分代码 /** * Invoked from an I/O proc
用js中的formData类型解决ajax提交表单时文件不能被serialize方法序列化的问题中华好儿孙 JavaScript Ajax Web 上传文件 FormData
var formData = new FormData($("#inputFileForm")[0]); $.ajax({ type:'post', url:webRoot+"/electronicContractUrl/webapp/uploadfile", data:formData, async: false, ca
mybatis常用jdbcType数据类型 ysj5125094 mybatis mapper jdbcType
MyBatis 通过包含的jdbcType 类型 BIT FLOAT CHAR