南波塞文

全文检索-Elasticsearch-进阶检索

文章目录

前言
一、SearchAPI
- 1.1 URL 后接参数检索
- 1.2 URL 加请求体检索
二、Query DSL
- 2.1 基本语法格式
- 2.2 匹配查询 match
- 2.3 短语匹配 match_phase
- 2.4 多字段匹配 multi_match
- 2.5 复合查询 bool
- 2.6 过滤 filter
- 2.7 查询 term
- 2.8 聚合 aggregations
三、Mapping
- 3.1 介绍
- 3.2 新版本改变
- 3.3 查询索引的映射
- 3.4 创建映射
- 3.5 添加新的字段映射
- 3.6 更新映射
- 3.7 数据迁移
四、分词
- 4.1 安装 ik 分词器
- 4.2 测试分词器
- 4.3 自定义词库
五、附录-安装 nginx
- 5.1 安装步骤
- 5.2 创建分析文本

前言

本文记录谷粒商城高级篇的 Elasticsearch 进阶检索部分，续上之前记录的 Elasticsearch入门篇。

一、SearchAPI

ES 支持两种基本方式检索 :

一个是通过使用 REST request URI 发送搜索参数（uri + 检索参数）
另一个是通过使用 REST request body 来发送它们（uri + 请求体）

1.1 URL 后接参数检索

GET bank/_search  检索 bank 下所有信息，包括 type 和 docs  

GET bank/_search?q=*&sort=account_number:asc 请求参数方式检索

响应结果解释：
took - Elasticsearch 执行搜索的时间（毫秒）
time_out - 告诉我们搜索是否超时
_shards - 告诉我们多少个分片被搜索了，以及统计了成功/失败的搜索分片
hits - 搜索结果
hits.total - 搜索结果
hits.hits - 实际的搜索结果数组（默认为前 10 的文档）
sort - 结果的排序 key（键）（没有则按 score 排序）
score 和 max_score - 相关性得分和最高得分（全文检索用）

1.2 URL 加请求体检索

请求体中写查询条件，语法：

GET bank/_search
{
  "query": {
    "match_all": {}
  },
  "sort": [
    {
      "account_number": "asc"
    },
    {
      "balance": "desc"
    }
  ]
}

示例：查询出所有，先按照 accout_number 升序排序，再按照 balance 降序排序

二、Query DSL

2.1 基本语法格式

Elasticsearch 提供了一个可以执行查询的 Json 风格的 DSL（domain-specific language 领域特定语言）。这个被称为 Query DSL。该查询语言非常全面，并且刚开始的时候感觉有点复杂，真正学好它的方法是从一些基础的示例开始的。

GET bank/_search
{
  "query": {
    "match_all": {}
  },
  "sort": [
 {
      "balance": {
        "order": "desc"
 }
 }
  ],
  "from": 10,
  "size": 10,
  "_source": ["balance", "firstname"]
}

示例：查询所有记录，按照 balance 降序排序，只返回第 11 条记录到第 20 条记录，只显示 balance 和 firstname 字段。

query 定义如何查询，
match_all 查询类型【代表查询所有的所有】，es 中可以在 query 中组合非常多的查
询类型完成复杂查询
除了 query 参数之外，我们也可以传递其它的参数以改变查询结果。如 sort，size
from + size 限定，完成分页功能
sort 排序，多字段排序，会在前序字段相等时后续字段内部排序，否则以前序为准
_source 返回部分字段

2.2 匹配查询 match

1.基本类型 ( 非字符串 ) ，精确匹配

GET bank/_search
{
  "query": {
    "match": {
      "account_number": "30"
     }
   }
}

2.字符串，全文检索

GET bank/_search
{
  "query": {
    "match": {
      "address": "mill road"
    }
  }
}

全文检索按照评分进行排序，会对检索条件进行分词匹配。
查询 address 中包含 mill 或者 road 或者 mill road 的所有记录，并给出相关性得分。

2.3 短语匹配 match_phase

将需要匹配的值当成一个整体单词 ( 不分词 ) 进行检索

GET bank/_search
{
  "query": {
    "match_phrase": {
      "address": "mill road"
    }
  }
}

2.4 多字段匹配 multi_match

GET bank/_search
{
  "query": {
    "multi_match": {
      "query": "mill land",
      "fields": [
        "state",
        "address"
      ]
    }
  }
}

multi_match 中的 query 也会进行分词。
查询 state 包含 mill 或 land 或者 address 包含 mill 或 land 的记录。

2.5 复合查询 bool

复合语句可以合并任何其他查询语句，包括复合语句。复合语句之间可以相互嵌套，可以表达复杂的逻辑。

搭配使用 must,must_not，should

must: 必须达到 must 指定的条件。 ( 影响相关性得分 )

must_not: 必须不满足 must_not 的条件。 ( 不影响相关性得分 )

should: 如果满足 should 条件，则可以提高得分。如果不满足，也可以查询出记录。 ( 影响相关性得分 )

示例：查询出地址包含 mill，且性别为 M，年龄不等于 28 的记录，且优先展示 firstname 包含 Winnie 的记录。

GET bank/_search
{
  "query": {
    "bool": {
      "must": [
        {
          "match": {
            "address": "mill"
          }
        },
        {
          "match": {
            "gender": "M"
          }
        }
      ],
      "must_not": [
        {
          "match": {
            "age": "28"
          }
        }
      ],
      "should": [
        {
          "match": {
            "firstname": "Winnie"
          }
        }
      ]
    }
  }
}

2.6 过滤 filter

不影响相关性得分，查询出满足 filter 条件的记录。
在 bool 中使用。

GET bank/_search
{
  "query": {
    "bool": {
      "filter": {
        "range": {
          "age": {
            "gte": 18,
            "lte": 30
          }
        }
      }
    }
  }
}

2.7 查询 term

匹配某个属性的值。
全文检索字段用 match，其他非 text 字段匹配用 term
keyword：文本精确匹配 ( 全部匹配 )
match_phase：文本短语匹配

规范：非 text 字段精确匹配使用 term

GET bank/_search
{
  "query": {
    "term": {
      "age": "20"
    }
  }
}

2.8 聚合 aggregations

聚合提供了从数据中分组和提取数据的能力。最简单的聚合方法大致等于 SQL GROUP
BY 和 SQL 聚合函数。在 Elasticsearch 中，您有执行搜索返回 hits（命中结果），并且同时返回聚合结果，把一个响应中的所有 hits（命中结果）分隔开的能力。这是非常强大且有效的，您可以执行查询和多个聚合，并且在一次使用中得到各自的（任何一个的）返回结果，使用一次简洁和简化的 API 来避免网络往返。

# 聚合语法
"aggregations" : {
    "<聚合名称 1>" : {
        "<聚合类型>" : {
            <聚合体内容>
        }
        [,"元数据" : {  [<meta_data_body>] }]?
        [,"aggregations" : { [<sub_aggregation>]+ }]?
    }
    [,"聚合名称 2>" : { ... }]*
}

示例 1：搜索 address 中包含 mill 的所有人的年龄分布 ( 前 10 条 ) 以及平均年龄，以及平均薪资

GET bank/_search
{
  "query": {
    "match": {
      "address": "mill"
    }
  },
  "aggs": {
    "aggAge": {
      "terms": {
        "field": "age",
        "size": 10
      }
    },
    "ageAvg": {
      "avg": {
        "field": "age"
      }
    },
    "balanceAvg": {
      "avg": {
        "field": "balance"
      }
   }
  }
}

如果不想返回 hits 结果，可以在最后面设置 size:0

GET bank/_search
{
  "query": {
    "match": {
      "address": "mill"
    }
  },
  "aggs": {
    "ageAggr": {
      "terms": {
        "field": "age",
        "size": 10
      }
    }
  },
  "size": 0
}

示例 2：按照年龄聚合，并且请求这些年龄段的这些人的平均薪资

GET bank/_search
{
  "query": {
    "match_all": {}
  },
  "aggs": {
    "age_avg": {
      "terms": {
        "field": "age",
        "size": 1000
      },
      "aggs": {
        "banlances_avg": {
          "avg": {
            "field": "balance"
          }
        }
      }
    }
  },
  "size": 1000
}

示例 3：查出所有年龄分布，并且这些年龄段中 M 的平均薪资和 F 的平均薪资以及这个年龄段的总体平均薪资

GET bank/_search
{
  "query": {
    "match_all": {}
  },
  "aggs": {
    "age_agg": {
      "terms": {
        "field": "age",
        "size": 100
      },
      "aggs": {
        "gender_agg": {
          "terms": {
            "field": "gender.keyword",
            "size": 100
          },
          "aggs": {
            "balance_avg": {
              "avg": {
                "field": "balance"
              }
            }
          }
        },
        "balance_avg": {
          "avg": {
            "field": "balance"
          }
        }
      }
    }
  },
  "size": 1000
}

三、Mapping

3.1 介绍

Mapping 是用来定义一个文档 (document) ，以及它所包含的属性 (field) 是如何存储和索引的。

定义哪些字符串属性应该被看做全文本属性 (full text fields)
定义哪些属性包含数字，日期或地理位置
定义文档中的所有属性是否都能被索引 (_all 配置)
日期的格式
自定义映射规则来执行动态添加属性

3.2 新版本改变

ES7 去 tpye 概念

关系型数据库中两个数据库表示是独立的，即使他们里面有相同名称的列也不影响使用，但 ES 中不是这样的。elasticsearch 是基于 Lucence 开发的搜索引擎，而 ES 中不同 type 下名称相同的 field 最终在 Lucence 中的处理方式是一样的。

为了区分不同 type 下的同一名称的字段，Lucence 需要处理冲突，导致检索效率下降
去掉type就是为了提高ES处理数据的效率。

ES7.x 版本：URL 中的 type 参数为可选。

URL中的type参数为可选。比如，索引一个文档不再要求提供文档类型。

ES8.x 版本：不支持 URL 中的 type 参数

不再支持URL中的type参数。

解决：将索引从多类型迁移到单类型，每种类型文档一个独立索引

所有类型可以参考文档:https://www.elastic.co/guide/en/elasticsearch/reference/7.17/mapping-types.html

3.3 查询索引的映射

GET my-index/_mapping
{
  "my-index" : {
    "mappings" : {
      "properties" : {
        "age" : {
          "type" : "integer"
        },
        "email" : {
          "type" : "keyword"
        },
        "name" : {
          "type" : "text"
        }
      }
    }
  }
}

3.4 创建映射

PUT /my-index
{
  "mappings": {
    "properties": {
      "age": {
        "type": "integer"
      },
      "email": {
        "type": "keyword"
      },
      "name": {
        "type": "text"
      }
    }
  }
}

#返回结果
{
  "acknowledged" : true,
  "shards_acknowledged" : true,
  "index" : "my-index"
}

3.5 添加新的字段映射

PUT /my-index/_mapping
{
  "properties": {
    "employee-id": {
      "type": "keyword",
      "index": false
    }
  }
}
# index控制属性值是否被索引,默认是true。false的话就是不被索引,作为冗余存储

查看添加新字段的变化

{
  "my-index" : {
    "mappings" : {
      "properties" : {
        "age" : {
          "type" : "integer"
        },
        "email" : {
          "type" : "keyword"
        },
        "employee-id" : {
          "type" : "keyword",
          "index" : false
        },
        "name" : {
          "type" : "text"
        }
      }
    }
  }
}

3.6 更新映射

对于已经存在的映射字段，我们不能更新。更新必须创建新的索引进行数据迁移。

3.7 数据迁移

先创建出 newbank 的正确映射，然后使用如下方式进行数据迁移

#创建新的索引
PUT /newbank
{
  "mappings": {
    "properties": {
      "account_number": {
        "type": "long"
      },
      "address": {
        "type": "text"
      },
      "age": {
        "type": "integer"
      },
      "balance": {
        "type": "long"
      },
      "city": {
        "type": "keyword"
      },
      "email": {
        "type": "keyword"
      },
      "employer": {
        "type": "keyword"
      },
      "firstname": {
        "type": "text"
      },
      "gender": {
        "type": "keyword"
      },
      "lastname": {
        "type": "text",
        "fields": {
          "keyword": {
            "type": "keyword",
            "ignore_above": 256
          }
        }
      },
      "state": {
        "type": "keyword"
      }
    }
  }
}

#返回结果
{
  "acknowledged" : true,
  "shards_acknowledged" : true,
  "index" : "newbank"
}

POST _reindex
{
  "source": {
    "index": "bank",
    "type": "account"
  },
  "dest": {
    "index": "newbank"
  }
}

返回结果

#! Deprecation: [types removal] Specifying types in reindex requests is deprecated.
{
  "took" : 7617,
  "timed_out" : false,
  "total" : 1000,
  "updated" : 0,
  "created" : 1000,
  "deleted" : 0,
  "batches" : 1,
  "version_conflicts" : 0,
  "noops" : 0,
  "retries" : {
    "bulk" : 0,
    "search" : 0
  },
  "throttled_millis" : 0,
  "requests_per_second" : -1.0,
  "throttled_until_millis" : 0,
  "failures" : [ ]
}

四、分词

一个 tokenizer（分词器）接收一个字符流，将之分割为独立的 tokens（词元，通常是独立的单词），然后输出 tokens 流。

例如 whitespace tokenizer 遇到空白字符时分割文本，它会将文本 “Quick brown fox!” 分割为 Quick，brown，fox!。

该 tokenizer（分词器）还负责记录各个 term（词条）的顺序或 position 位置（用于 phrase 短语和 word proximity 词近邻查询），以及 term（词条）所代表的原始 word（单词）的 start（起始）和 end（结束）的 character offsets（字符偏移量）（用于高亮显示搜索的内容）。

Elasticsearch 提供了很多内置的分词器，可以用来构建 custom analyzers（自定义分词器）。

4.1 安装 ik 分词器

注意：不能用默认 elasticsearch-plugin install xxx.zip 进行自动安装

1.进入elasticsearch 插件挂载

cd /mydata/elasticsearch/plugins

2.创建 ik 目录

mkdir ik

3.进入 ik 目录

cd ik

4.下载 ik 分词器

wget https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.4.2/elasticsearch-analysis-ik-7.4.2.zip

5.下载成功

[root@localhost ik]# wget https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.4.2/elasticsearch-analysis-ik-7.4.2.zip
--2023-05-09 16:49:36--  https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.4.2/elasticsearch-analysis-ik-7.4.2.zip
正在解析主机 github.com (github.com)... 20.205.243.166
正在连接 github.com (github.com)|20.205.243.166|:443... 已连接。
已发出 HTTP 请求，正在等待回应... 302 Found
位置：https://objects.githubusercontent.com/github-production-release-asset-2e65be/2993595/19827980-fef3-11e9-8cda-384bc0d9396c?X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=AKIAIWNJYAX4CSVEH53A%2F20230509%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20230509T084937Z&X-Amz-Expires=300&X-Amz-Signature=dede12056de2e09b1386e24e2db04835a7283f829d4e35f4ce0d268b9fa36780&X-Amz-SignedHeaders=host&actor_id=0&key_id=0&repo_id=2993595&response-content-disposition=attachment%3B%20filename%3Delasticsearch-analysis-ik-7.4.2.zip&response-content-type=application%2Foctet-stream [跟随至新的 URL]
--2023-05-09 16:49:37--  https://objects.githubusercontent.com/github-production-release-asset-2e65be/2993595/19827980-fef3-11e9-8cda-384bc0d9396c?X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=AKIAIWNJYAX4CSVEH53A%2F20230509%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20230509T084937Z&X-Amz-Expires=300&X-Amz-Signature=dede12056de2e09b1386e24e2db04835a7283f829d4e35f4ce0d268b9fa36780&X-Amz-SignedHeaders=host&actor_id=0&key_id=0&repo_id=2993595&response-content-disposition=attachment%3B%20filename%3Delasticsearch-analysis-ik-7.4.2.zip&response-content-type=application%2Foctet-stream
正在解析主机 objects.githubusercontent.com (objects.githubusercontent.com)... 185.199.109.133, 185.199.108.133, 185.199.110.133, ...
正在连接 objects.githubusercontent.com (objects.githubusercontent.com)|185.199.109.133|:443... 已连接。
已发出 HTTP 请求，正在等待回应... 200 OK
长度：4504487 (4.3M) [application/octet-stream]
正在保存至: “elasticsearch-analysis-ik-7.4.2.zip”

100%[=========================================================================================================================================================================>] 4,504,487   1.44MB/s 用时 3.0s   

2023-05-09 16:49:41 (1.44 MB/s) - 已保存 “elasticsearch-analysis-ik-7.4.2.zip” [4504487/4504487])

6.下载成功后解压到 ik 目录

unzip elasticsearch-analysis-ik-7.4.2.zip

7.修改 ik 目录读写权限

chmod -R 777 ik/

8.进入 docker 的 bash 控制台

docker exec -it elasticsearch /bin/bash

9.进入 elasticsearch 的 bin 执行如下命令

[root@21fddd211b43 bin]# elasticsearch-plugin list
ik

出现 ik 表明安装完成

4.2 测试分词器

1.Kibana 使用 ik_smart 检索

4.3 自定义词库

ik 分词器没办法识别新的词汇和网络用语，所以需要我们自己自定义词库来达到扩展词库的目的。
1.修改配置文件

ik 分词器的配置文件在容器中的路径：

/usr/share/elasticsearch/plugins/ik/config/IKAnalyzer.cfg.xml。

修改这个文件可以通过修改映射文件，文件路径：

/mydata/elasticsearch/plugins/ik/config/IKAnalyzer.cfg.xml

编辑配置文件：

vim /mydata/elasticsearch/plugins/ik/config/IKAnalyzer.cfg.xml


DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
<comment>IK Analyzer 扩展配置comment>

<entry key="ext_dict">entry>

<entry key="ext_stopwords">entry>

<entry key="remote_ext_dict">http://192.168.57.129/es/fenci.txtentry>


properties>

修改配置 remote_ext_dict 的属性值，指定一个远程网站文件的路径，比如 http://www.xxx.com/ikwords.text。

这里我们可以自己搭建一套 nginx 环境，然后把 ikwords.text 放到 nginx 根目录。

修改 IKAnalyzer.cfg.xml 后重启 elasticsearch

docker restart elasticsearch

访问 Kibana 如下图

五、附录-安装 nginx

5.1 安装步骤

1.在 /mydata 目录下创建 nginx 目录

mkdir nginx

2.进入 nginx 目录安装 nginx

[root@localhost mydata]# docker run -p 80:80 --name nginx -d nginx:1.10
Unable to find image 'nginx:1.10' locally
1.10: Pulling from library/nginx
6d827a3ef358: Pull complete 
1e3e18a64ea9: Pull complete 
556c62bb43ac: Pull complete 
Digest: sha256:6202beb06ea61f44179e02ca965e8e13b961d12640101fca213efbfd145d7575
Status: Downloaded newer image for nginx:1.10
4026fb105bd2a0905512b553bcea6452eacb55b2c4499ceef4a148c6023f60c9

3.将容器内的配置文件拷贝到 nginx 目录别忘了后面的点

docker container cp nginx:/etc/nginx .

4.修改文件名称

mv nginx conf

5.把这个 conf 移动到 /mydata/nginx 下

mv conf/ nginx

6.终止原容器

docker stop nginx

7.执行命令删除原容器

docker rm nginx

8.创建新的 nginx

docker run -p 80:80 --name nginx \
-v /mydata/nginx/html:/usr/share/nginx/html \
-v /mydata/nginx/logs:/var/log/nginx \
-v /mydata/nginx/conf:/etc/nginx \
-d nginx:1.10

9.给 nginx 的 html 下面放的所有资源可以直接访问

vi index.html

10.编写 html

<h1>Gulimallh1>

11.安装成功，访问效果如下图

5.2 创建分析文本

1.html 目录下创建 es 目录，在 es 目录下创建文本

mkdir es

cd es

vi fenci.txt

尚硅谷
乔碧萝

编写文本，esc 后 shift + ： wq 保存退出。访问如下图

你可能感兴趣的:(ElasticSearch,检索分析引擎,gulimall,谷粒商城,elasticsearch,全文检索,大数据)

Lab17_ Blind SQL injection with out-of-band data exfiltration 远川_Horizon web安全 sql
文章目录前言：进入实验室构造payload前言：实验室标题为：带外数据泄露的SQL盲注简介：本实验包含一个SQL盲目注入漏洞。应用程序使用跟踪Cookie进行分析，并执行包含提交的Cookie值的SQL查询。SQL查询是异步执行的，对应用程序的响应没有影响。但是，您可以触发与外部域的带外交互。该数据库包含一个名为users的表，其中的列名为username和password。您需要利用SQL盲目注
Manus：全球首款通用型 Agent 产品，智能体时代大幕开启 zhz5214 AI 人工智能 ai AI编程 AI写作
Manus，这款由Monica推出的前沿AI产品，凭借独特的创新设计与卓越性能，即将在智能领域引发一场技术变革。流客科技，作为科技领域持续探索创新的品牌，始终关注此类前沿技术突破，深信这样的创新产品将有力推动行业发展。Manus旨在应对复杂多变的任务场景。无论是深入的市场调研、高效精准的文件处理、精心规划的旅行安排，还是专业细致的数据分析，它都展现出强大实力。自主任务规划与执行：Manus能够将复
Imagen原理与代码实例讲解 AI天才研究院计算 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Imagen原理与代码实例讲解1.背景介绍在人工智能领域中,图像生成一直是一个具有挑战性的任务。传统的计算机视觉模型通常专注于理解和分析现有图像,而生成全新的高质量图像则需要更高级的技术。随着深度学习技术的不断发展,生成式对抗网络(GenerativeAdversarialNetworks,GAN)等新型模型逐渐展现出了令人惊叹的图像生成能力。谷歌的Imagen就是一种基于大型视觉语言模型的全新图
大数据分析服务器硬件配置如何选择 elva428204358 服务器服务器
大数据，现如今已被人工智能替代。我们先不讨论人工智能，就大数据而言，我们都是在强调他的技术，而我们在用大数据时候，经常用它的来神话它的影响。例如，广告投放精准化，社会安全管理有序，医药行业智能化等。一、建立大数据分析服务器的五个基本方面1、可视化分析：大数据分析的使用者有大数据分析专家，同时还有普通用户，但是他们二者对于大数据分析最基本的要求就是可视化分析，因为可视化分析能够直观的呈现大数据特点，
今天全网爆火的Manus到底是什么？Manus的功能与意义深度解析 AndrewHZ 深度学习新浪潮算法深度学习语言模型 LLM AI Agent AI 智能体 Manus
Manus是2025年3月6日由中国团队推出的全球首款通用型AIAgent（智能体），其核心特点是能够自主规划并执行复杂任务，而非仅提供建议或答案。该产品因宣称“知行合一”的能力（如自动生成PPT、分析股票、筛选简历等）迅速引发行业热议，甚至导致官网因流量激增崩溃，邀请码被炒至数万元。一、Manus是什么？功能定位Manus被定义为“通用智能体”，能够通过独立思考调用工具链完成复杂任务，例如：文档
四大主流 CRM 系统深度解析：谁才是企业的最佳选择？ wq54wq 大数据人工智能
CRM能够提升客户关系管理效率，通过对客户信息的全面收集和分析，实时跟踪客户活动、需求和偏好，为客户提供个性化服务，增强客户对企业的信任和满意度，进而促进客户的忠诚度和长期稳定的合作关系。同时，CRM系统还能实现销售流程优化，帮助销售团队更好地跟踪销售机会、管理销售线索，制定个性化销售策略，提高销售业绩。此外，它促进跨部门协作，让销售、市场、客服等团队共享客户信息和交流记录，实现全面的客户视图，提
无监督AI训练:机遇与挑战并存 AI天才研究院计算 ChatGPT DeepSeek R1 &大数据AI人工智能大模型 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
无监督AI训练：机遇与挑战并存关键词：无监督学习、AI训练、机器学习、聚类算法、降维技术、深度学习摘要：本文深入探讨无监督AI训练这一新兴领域，首先介绍了其基本概念与原理，然后详细解析了无监督AI训练的核心技术，如聚类算法和降维技术，以及无监督深度学习。接着，本文通过实际项目案例分析，展示了无监督AI训练的应用实践。最后，本文分析了无监督AI训练面临的挑战，并展望了其未来发展趋势。通过本文的阅读，
提高客户体验：人类计算在营销中的应用 AI天才研究院 ChatGPT AI大模型企业级应用开发实战 DeepSeek R1 &大数据AI人工智能大模型大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
人类计算与营销：开启个性化时代的未来人类计算与营销：开启个性化时代的未来关键词：人工智能、个性化营销、客户体验、数据驱动、客户关系管理摘要：本文探讨了人类计算在营销中的应用，包括语音识别、人脸识别、自然语言处理等技术，以及如何通过这些技术实现个性化营销、客户关系管理和用户体验优化。文章分析了当前技术的发展趋势和面临的挑战，并提出了未来发展的方向。引言随着人工智能技术的飞速发展，人类计算在各个领域中
《DeepSeek+Langchain落地实操:RAG知识增强检索和智能体实战开发》 AI周红伟 langchain
大数据与人工智能实战专家—周红伟老师法国科学院数据算法博士/曾任阿里人工智能专家/曾任马上消费金融风控负责人课程背景LangChain是一项旨在赋能开发人员利用语言模型构建端到端应用程序的强大框架。它的设计理念在于简化和加速利用大型语言模型（LLM）和对话模型构建应用程序的过程。这个框架提供了一套全面的工具、组件和接口，旨在简化基于大型语言模型和对话模型的应用程序开发过程。LangChain本质上
【2024】LeetCode HOT 100——技巧「已注销」 leetcode 算法职场和发展
目录1.只出现一次的数字1.1C++实现1.2Python实现1.3时空分析2.多数元素2.1C++实现2.2Python实现2.3时空分析3.颜色分类3.1C++实现3.2Python实现3.3时空分析4.下一个排列4.1C++实现4.2Python实现4.3时空分析5.寻找重复数5.1C++实现5.2Python实现5.3时空分析1.只出现一次的数字原题链接：136.只出现一次的数字只需注意到
JSP开发案例教程【5.3】 BinaryStarXin JSP开发案例教程 java 数据库开发语言 javascript Hibernate 和 ORM 访问 MySQL
11.3.1Hibernate和ORM当使用一种面向对象的程序设计语言来进行应用开发时，从项目开始起一直采用面向对象分析、面向对象设计、面向对象编程，但到了持久层数据库访问时，又必须重返关系数据库的访问方式，这是一种非常糟糕的感觉。于是需要一种工具，它可以把关系型数据库包装成面向对象的模型，这个工具就是ORM框架。ORM（ObjectRelationalMapping，对象关系映射）的实现思想就是
旋转编码器原理与应用详解：从结构到实战 | 零基础入门STM32第四十七步触角01010001 STM32 stm32 嵌入式硬件单片机
主题内容教学目的/扩展视频旋转编码器电路原理，跳线设置，结构分析。驱动程序与调用。熟悉电路和驱动程序。师从洋桃电子，杜洋老师文章目录一、旋转编码器是什么？二、内部结构揭秘2.1机械组件解剖2.2核心部件说明三、电路工作原理3.1信号生成机制3.2硬件连接方案四、关键技术解析4.1消抖处理4.2方向识别算法五、典型应用场景六、开发板实战演示七、选型注意事项八、相关资源（图1：开发板与旋转编码器连接示
mysql面试知识点 mysql
leftjoin和innerjoin区别leftjoin在右表没有匹配项的时候，会将左表拼接上右表，右表的字段以null填充。innerjoin在右表没有匹配项的时候，该结果不显示innoDB默认的存储引擎支持事务、支持物理外键天生支持行锁、手动支持表锁使用聚簇索引（索引和数据在同一个文件）索引概念一种排好序，能够提升查询性能的数据结构分类聚簇索引（主键索引）索引和行数据都在一个叶子节点上非聚簇索
为什么打开串口的提示窗口都提示两遍可可乐不加冰软件报错问题命令模式
问题根源分析在ModbusRTU类中，initializePort方法会在打开串口时通过emitportOpened(true)发送信号。如果MainWindow类中同时通过以下两种方式触发弹窗，就会导致提示重复：直接弹窗：在按钮点击事件中手动调用QMessageBox::information。信号槽弹窗：将portOpened信号连接到另一个显示弹窗的槽函数。解决方案1.移除冗余弹窗逻辑修改M
[网络安全提高篇] 一二八.恶意软件分析之利用MS Defender实现恶意样本家族批量标注（含学术探讨） Eastmount 网络安全自学篇 web安全恶意软件分析恶意样本家族标注 MS Defender
2024新的战场，继续奋斗。“网络安全提高班”新的100篇文章即将开启，包括Web渗透、内网渗透、靶场搭建、CVE复现、攻击溯源、实战及CTF总结，它将更加聚焦，更加深入，也是作者的慢慢成长史。换专业确实挺难的，Web渗透也是块硬骨头，但我也试试，看看自己未来四年究竟能将它学到什么程度，漫漫长征路，偏向虎山行。享受过程，一起加油~前文介绍了IDAPython配置过程和基础用法，然后尝试提取恶意软件
企业用户指南：2024年CRM深度分析 CC_54321 阿里云人工智能
在数字化转型的浪潮中，客户关系管理（CRM）系统已成为企业提升竞争力、优化客户体验的关键工具。本文将深度解析2024年市场上表现最佳的CRM系统，从品牌介绍、产品功能到优势特色，为企业提供全面的选型参考。一、怎样挑选适合企业的CRM?1.明确业务需求在开始寻找CRM系统之前，企业首先需要明确自己的业务需求。这包括：客户管理需求：是否需要追踪客户信息、沟通历史和购买行为销售管理需求：是否需要管理销售
构建卓越的客户服务与支持：C# CRM系统深度解析墨夶 C#学习资料1 c#开发语言
在当今竞争激烈的商业环境中，提供优质的客户服务和支持是企业成功的关键之一。一个高效、可靠的客户关系管理（CRM）系统可以帮助企业更好地理解客户需求，提升客户满意度，并最终促进业务增长。本文将深入探讨如何使用C#开发一个功能全面的CRM系统，特别是其中的客户服务与支持模块，我们将详细讲解代码实现，并附上丰富的注释帮助你快速上手。一、需求分析与架构设计为了满足现代企业的多样化需求，我们的CRM系统需要
网络安全 api 网络安全 ast技术 Hacker_LaoYi web安全 github git
随着应用或者API被攻击利用已经越来越多，虽然来自开源组件的漏洞加剧了这一现象的发生，但是，其实主要还是在于应用程序或者API本身没有做好防范，根源在于源代码本身的质量没有严格把控。AST是指ApplicationSecurityTesting，主要包括静态应用测试（SAST）、交互式应用测试（IAST）、动态应用测试（DAST）以及软件成分分析（SCA）等工具。应用测试工具AST是专门用于检测源
数据安全策略与实践：从理论到落地 Echo_Wish 大数据高阶实战秘籍大数据
数据安全策略与实践：从理论到落地在大数据时代，数据早已成为企业和机构的核心资产，但随之而来的数据泄露、非法访问和滥用问题也屡见不鲜。从用户隐私到企业机密，再到国家级信息安全，无一不受到数据安全的影响。那么，如何构建高效的数据安全策略并在实际中落地实施？这是我们今天要探讨的核心话题。一、数据安全为何重要？数据泄露的影响在2021年某著名社交平台数据泄露事件中，超过5亿用户的个人信息被曝光，直接导致了
Ubuntu 下 nginx-1.24.0 源码分析 - cycle-＞modules[i]-＞ctx 若云止水 ubuntu nginx linux
ngx_module_s结构体中的ctx字段是Nginx模块系统的核心设计之一。这个字段的主要作用是提供特定类型模块的上下文信息。ctx字段实际上是一个指向模块特定上下文结构的指针。根据模块类型的不同，ctx可以指向不同的上下文结构，比如：对于HTTP模块，指向ngx_http_module_t对于Core模块，指向ngx_core_module_t对于Event模块，指向ngx_event_mo
Dask vs. Apache Spark: 大数据处理的利器对比与应用实例步入烟尘 Python超入门指南全册 apache spark 大数据
本文已收录于《Python超入门指南全册》本专栏专门针对零基础和需要进阶提升的同学所准备的一套完整教学，从基础到精通不断进阶深入，后续还有实战项目，轻松应对面试，专栏订阅地址：https://blog.csdn.net/mrdeam/category_12647587.html优点：订阅限时19.9付费专栏，私信博主还可进入全栈VIP答疑群，作者优先解答机会（代码指导、远程服务），群里大佬众多可以
Python3 与 VSCode：深度对比分析 lly202406 开发语言
Python3与VSCode：深度对比分析引言Python3和VisualStudioCode（VSCode）在软件开发领域扮演着举足轻重的角色。Python3作为一门强大的编程语言，拥有丰富的库和框架，广泛应用于数据科学、人工智能、网络开发等多个领域。而VSCode作为一款轻量级且功能强大的代码编辑器，以其出色的性能和丰富的插件支持，受到了广大开发者的喜爱。本文将对Python3和VSCode进
小C语言--词法分析程序柒七爱吃麻辣烫 c语言 java 开发语言
小C语言文法1.→(){}2.→||3.→;4.→,|5.→|6.→||||7.→()|()8.→()9.→(;;)10.→{}11.→;12.→=|13.→|14.→>|=|→+|-|16.→*|/|17.→||()18.→||19.→|20.→a|b|…|z|A|B|…|Z21.→0|1|2|3|4|5|6|7|8|922.→main23.→if24.→else25.→for26.→while
简记_ MCU管脚的防静电处理土豆19891021 EMC 嵌入式硬件
一、分析（一）接口处的信号要先过ESD/TVS管，然后拉到被保护器件；建个ESD电路发生器的模型，代入到我们的电路中去分析：继电器实现这两个“开关”，并且还会感应出一些额外的RLC寄生。ESD的频谱是宽带的（指的是各种频率分量都有），频率范围大概是几十MHz到500MHz，ESD波形具有0.7~1ns的上升沿，通过上升沿跟最大带宽的计算公式0.35/tr，可得最大带宽约为：0.35/0.7ns=0
每日一题——搜索二维矩阵 tt555555555555 面经算法题 C语言算法数据结构 leetcode
搜索二维矩阵一、题目背景二、题目描述示例1：示例2：约束条件：三、解题思路分析1.**错误思路回顾**2.**Z字形查找算法**算法步骤：3.**算法优势**四、代码实现代码说明：五、测试用例测试用例1：测试用例2：测试用例3：六、总结一、题目背景在LeetCode上，有一道经典的二维矩阵搜索问题——“搜索二维矩阵II”。题目要求在一个具有特定性质的二维矩阵中查找目标值。矩阵的每一行从左到右升序排
POJ 2227 -- The Wedding Juicer（bfs+优先队列） Ac-try 队列/优先队列搜索
题目大意：一个W*H的网格，每个单位格的高度不一样，往这个网格注水，问能储存多少水；思路分析：四周不能注水，和木桶原理一样，要以最低的高度作为能储水的高度，否则水就会溢出；将网格最外层的点开始加入队列，每次去高度最小的点作为“木桶”最低边，看其连接的点，如果高度大于自己加入队列，否则注水至自己的高度加入队列。代码实现：#include#include#includeusingnamespacest
MySQL集群：高可用架构的利与弊异常驯兽师 mysql 架构数据库
在互联网应用快速发展的今天，数据库的高可用性和扩展性成为许多团队关注的焦点。MySQL集群作为一种常见的解决方案，被广泛用于解决单点故障和性能瓶颈的问题。但它是否适合所有场景？本文将从实际应用的角度，分析MySQL集群的核心特点、优势与不足。1.什么是MySQL集群？MySQL集群（MySQLCluster）并不是指简单的“多个MySQL服务器”，而是一种基于分布式架构的数据库解决方案。它通过将数
洛谷P3586 [POI 2015] LOG Logistyka 分析与解答里欧布鲁斯算法 c++
操作1是对序列的修改，重点来看如何实现操作2维护一个长度为n的序列，一开始都是0，支持以下两种操作：Uka将序列中第k个数修改为a。Zcs在这个序列上，每次选出c个正数，并将它们都减去1，询问能否进行s次操作。每次询问独立，即每次询问不会对序列进行修改。“减去1”的操作如何直观得被感受呢，可以把一个数写成很多个1累积而成的形式例如，现在有一组数13243，可以表示成下面这样424523451234
宽带,带宽,光纤,光猫,WiFi,路由器,令人傻傻搞不清?这篇文章讲明白他们之间的关系. *星之卡比* 智能路由器网络
宽带,带宽,光纤,光猫,WiFi,路由器,令人傻傻搞不清?这篇文章讲明白他们之间的关系.想要家里能上网,就得找运营商办理宽带上网服务(如:电信,联通等),这样能上网的信号就会通过光纤传输到你家里.问题来了,啥叫宽带?宽带和带宽是什么呢?带宽(bandwidth),简单理解为频带宽度单位时间内通过网络通信信道传输的最大数据量,一般单位是mps(兆比特每秒),家里一般办的是百兆光纤但是一百兆比特每秒下
使用OpenCV和MediaPipe库——驼背检测（姿态监控） WenJGo AI学习之路 Python之路 opencv 人工智能计算机视觉算法 python numpy
目录驼背检测的运用1.驾驶姿态与疲劳关联分析2.行业应用案例1.教育场景痛点分析2.智能教室系统架构代码实现思路1.初始化与配置2.MediaPipe和摄像头设置3.主循环4.资源释放RGB与BGR的区别一、本质区别二、OpenCV的特殊性内存结构示意图：三、转换必要性分析转换流程图示：四、常见问题场景五、性能优化建议六、底层原理七、验证实验八、现代发展趋势整体代码效果展示驼背检测的运用1.驾驶姿
用MiddleGenIDE工具生成hibernate的POJO（根据数据表生成POJO类） AdyZhang POJO eclipse Hibernate MiddleGenIDE
推荐:MiddlegenIDE插件, 是一个Eclipse 插件. 用它可以直接连接到数据库, 根据表按照一定的HIBERNATE规则作出BEAN和对应的XML ，用完后你可以手动删除它加载的JAR包和XML文件! 今天开始试着使用
.9.png Cb123456 android
“点九”是andriod平台的应用软件开发里的一种特殊的图片形式，文件扩展名为：.9.png 　　智能手机中有自动横屏的功能,同一幅界面会在随着手机(或平板电脑)中的方向传感器的参数不同而改变显示的方向,在界面改变方向后,界面上的图形会因为长宽的变化而产生拉伸,造成图形的失真变形。　　我们都知道android平台有多种不同的分辨率，很多控件的切图文件在被放大拉伸后，边
算法的效率天子之骄算法效率复杂度最坏情况运行时间大O阶平均情况运行时间
算法的效率效率是速度和空间消耗的度量。集中考虑程序的速度，也称运行时间或执行时间，用复杂度的阶(O)这一标准来衡量。空间的消耗或需求也可以用大O表示，而且它总是小于或等于时间需求。以下是我的学习笔记： 1.求值与霍纳法则，即为秦九韶公式。 2.测定运行时间的最可靠方法是计数对运行时间有贡献的基本操作的执行次数。运行时间与这个计数成正比。
java数据结构何必如此 java 数据结构
Java 数据结构 Java工具包提供了强大的数据结构。在Java中的数据结构主要包括以下几种接口和类：枚举（Enumeration）位集合（BitSet）向量（Vector）栈（Stack）字典（Dictionary）哈希表（Hashtable）属性（Properties）以上这些类是传统遗留的，在Java2中引入了一种新的框架-集合框架(Collect
MybatisHelloWorld 3213213333332132
//测试入口TestMyBatis package com.base.helloworld.test; import java.io.IOException; import org.apache.ibatis.io.Resources; import org.apache.ibatis.session.SqlSession; import org.apache.ibat
Java|urlrewrite|URL重写|多个参数 7454103 java xml Web 工作
个人工作经验！如有不当之处，敬请指点 1.0 web -info 目录下建立 urlrewrite.xml 文件类似如下： <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE u
达梦数据库+ibatis darkranger sql mysql ibatis SQL Server
--插入数据方面如果您需要数据库自增... 那么在插入的时候不需要指定自增列. 如果想自己指定ID列的值, 那么要设置 set identity_insert 数据库名.模式名.表名; ----然后插入数据; example: create table zhabei.test( id bigint identity(1,1) primary key, nam
XML 解析四种方式 aijuans android
XML现在已经成为一种通用的数据交换格式,平台的无关性使得很多场合都需要用到XML。本文将详细介绍用Java解析XML的四种方法。 XML现在已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。对于XML本身的语法知识与技术细节,需要阅读相关的技术文献,这里面包括的内容有DOM(Document Object
spring中配置文件占位符的使用 avords
1.类 <?xml version="1.0" encoding="UTF-8"?><!DOCTYPE beans PUBLIC "-//SPRING//DTD BEAN//EN" "http://www.springframework.o
前端工程化-公共模块的依赖和常用的工作流 bee1314 webpack
题记：一个人的项目，还有工程化的问题嘛？我们在推进模块化和组件化的过程中，肯定会不断的沉淀出我们项目的模块和组件。对于这些沉淀出的模块和组件怎么管理？另外怎么依赖也是个问题？你真的想这样嘛？ var BreadCrumb = require(‘../../../../uikit/breadcrumb’); //真心ugly。
上司说「看你每天准时下班就知道你工作量不饱和」，该如何回应？ bijian1013 项目管理沟通 IT职业规划
问题：上司说「看你每天准时下班就知道你工作量不饱和」，如何回应正常下班时间6点，只要是6点半前下班的，上司都认为没有加班。 Eno-Bea回答，注重感受，不一定是别人的虽然我不知道你具体从事什么工作与职业，但是我大概猜测，你是从事一项不太容易出现阶段性成果的工作
TortoiseSVN，过滤文件征客丶 SVN
环境： TortoiseSVN 1.8 配置：在文件夹空白处右键选择 TortoiseSVN -> Settings 在 Global ignote pattern 中添加要过滤的文件：多类型用英文空格分开 *name ：过滤所有名称为 name 的文件或文件夹 *.name ：过滤所有后缀为 name 的文件或文件夹 --------
【Flume二】HDFS sink细说 bit1129 Flume
1. Flume配置 a1.sources=r1 a1.channels=c1 a1.sinks=k1 ###Flume负责启动44444端口 a1.sources.r1.type=avro a1.sources.r1.bind=0.0.0.0 a1.sources.r1.port=44444 a1.sources.r1.chan
The Eight Myths of Erlang Performance bookjovi erlang
erlang有一篇guide很有意思： http://www.erlang.org/doc/efficiency_guide 里面有个The Eight Myths of Erlang Performance： http://www.erlang.org/doc/efficiency_guide/myths.html Myth: Funs are sl
java多线程网络传输文件(非同步)-2008-08-17 ljy325 java 多线程 socket
利用 Socket 套接字进行面向连接通信的编程。客户端读取本地文件并发送；服务器接收文件并保存到本地文件系统中。使用说明:请将TransferClient, TransferServer, TempFile三个类编译，他们的类包是FileServer. 客户端: 修改TransferClient: serPort, serIP, filePath, blockNum,的值来符合您机器的系
读《研磨设计模式》-代码笔记-模板方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.ResultSet;
配置心得 chenyu19891124 配置
时间就这样不知不觉的走过了一个春夏秋冬，转眼间来公司已经一年了，感觉时间过的很快，时间老人总是这样不停走，从来没停歇过。作为一名新手的配置管理员，刚开始真的是对配置管理是一点不懂，就只听说咱们公司配置主要是负责升级，而具体该怎么做却一点都不了解。经过老员工的一点点讲解，慢慢的对配置有了初步了解，对自己所在的岗位也慢慢的了解。做了一年的配置管理给自总结下： 1.改变从一个以前对配置毫无
对“带条件选择的并行汇聚路由问题”的再思考 comsci 算法工作软件测试嵌入式领域模型
2008年上半年，我在设计并开发基于”JWFD流程系统“的商业化改进型引擎的时候，由于采用了新的嵌入式公式模块而导致出现“带条件选择的并行汇聚路由问题”(请参考2009-02-27博文)，当时对这个问题的解决办法是采用基于拓扑结构的处理思想，对汇聚点的实际前驱分支节点通过算法预测出来，然后进行处理，简单的说就是找到造成这个汇聚模型的分支起点，对这个起始分支节点实际走的路径数进行计算，然后把这个实际
Oracle 10g 的clusterware 32位下载地址 daizj oracle
Oracle 10g 的clusterware 32位下载地址 http://pan.baidu.com/share/link?shareid=531580&uk=421021908 http://pan.baidu.com/share/link?shareid=137223&uk=321552738 http://pan.baidu.com/share/l
非常好的介绍：Linux定时执行工具cron dongwei_6688 linux
Linux经过十多年的发展，很多用户都很了解Linux了，这里介绍一下Linux下cron的理解，和大家讨论讨论。cron是一个Linux 定时执行工具，可以在无需人工干预的情况下运行作业，本文档不讲cron实现原理，主要讲一下Linux定时执行工具cron的具体使用及简单介绍。新增调度任务推荐使用crontab -e命令添加自定义的任务（编辑的是/var/spool/cron下对应用户的cr
Yii assets目录生成及修改 dcj3sjt126com yii
assets的作用是方便模块化，插件化的，一般来说出于安全原因不允许通过url访问protected下面的文件，但是我们又希望将module单独出来，所以需要使用发布，即将一个目录下的文件复制一份到assets下面方便通过url访问。 assets设置对应的方法位置 \framework\web\CAssetManager.php assets配置方法在m
mac工作软件推荐 dcj3sjt126com mac
mac上的Terminal + bash ＋ screen组合现在已经非常好用了，但是还是经不起iterm＋zsh＋tmux的冲击。在同事的强烈推荐下，趁着升级mac系统的机会，顺便也切换到iterm＋zsh＋tmux的环境下了。我为什么要要iterm2 切换过来也是脑袋一热的冲动，我也调查过一些资料，看了下iterm的一些优点： * 兼容性好，远程服务器 vi 什么的低版本能很好兼
Memcached(三)、封装Memcached和Ehcache frank1234 memcached ehcache spring ioc
本文对Ehcache和Memcached进行了简单的封装，这样对于客户端程序无需了解ehcache和memcached的差异，仅需要配置缓存的Provider类就可以在二者之间进行切换，Provider实现类通过Spring IoC注入。 cache.xml <?xml version="1.0" encoding="UTF-8"?>
Remove Duplicates from Sorted List II hcx2013 remove
Given a sorted linked list, delete all nodes that have duplicate numbers, leaving only distinct numbers from the original list. For example,Given 1->2->3->3->4->4->5,
Spring4新特性——注解、脚本、任务、MVC等其他特性改进 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
MySQL安装文档 liyong0802 mysql
工作中用到的MySQL可能安装在两种操作系统中，即Windows系统和Linux系统。以Linux系统中情况居多。安装在Windows系统时与其它Windows应用程序相同按照安装向导一直下一步就即，这里就不具体介绍，本文档只介绍Linux系统下MySQL的安装步骤。 Linux系统下安装MySQL分为三种：RPM包安装、二进制包安装和源码包安装。二
使用VS2010构建HotSpot工程 p2p2500 HotSpot OpenJDK VS2010
1. 下载OpenJDK7的源码： http://download.java.net/openjdk/jdk7 http://download.java.net/openjdk/ 2. 环境配置 ▶
Oracle实用功能之分组后列合并 seandeng888 oracle 分组实用功能合并
1 实例解析由于业务需求需要对表中的数据进行分组后进行合并的处理，鉴于Oracle10g没有现成的函数实现该功能，且该功能如若用JAVA代码实现会比较复杂，因此，特将SQL语言的实现方式分享出来，希望对大家有所帮助。如下：表test 数据如下： ID,SUBJECTCODE,DIMCODE,VALUE 1&nbs
Java定时任务注解方式实现 tuoni java spring jvm xml jni
Spring 注解的定时任务，有如下两种方式：第一种： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http
11大Java开源中文分词器的使用方法和分词效果对比 yangshangchuan word分词器 ansj分词器 Stanford分词器 FudanNLP分词器 HanLP分词器
本文的目标有两个： 1、学会使用11大Java开源中文分词器 2、对比分析11大Java开源中文分词器的分词效果本文给出了11大Java开源中文分词的使用方法以及分词结果对比代码，至于效果哪个好，那要用的人结合自己的应用场景自己来判断。 11大Java开源中文分词器，不同的分词器有不同的用法，定义的接口也不一样，我们先定义一个统一的接口： /** * 获取文本的所有分词结果, 对比