李思苇

elasticsearch ingest-attachment 对于 word、pdf等文件内容的索引

【转】ElasticSearch 全文检索实战
【转】ElasticSearch 5.3 载入PDF数据
1.简介
ElasticSearch只能处理文本，不能直接处理文档。要实现 ElasticSearch 的附件导入需要以下两个步骤：

  一、对多种主流格式的文档进行文本抽取。

  二、将抽取出来的文本内容导入 ElasticSearch。

Ingest-Attachment是一个开箱即用的插件，替代了较早版本的Mapper-Attachment插件，使用它可以实现对（PDF,DOC等）主流格式文件的文本抽取及自动导入。

Elasticsearch5.x 新增一个新的特性 Ingest Node，此功能支持定义命名处理器管道 pipeline，pipeline中可以定义多个处理器，在数据插入 ElasticSearch 之前进行预处理。而 Ingest Attachment Processor Plugin 提供了关键的预处理器 attachment，支持自动对入库文档的指定字段作为文档文件进行文本抽取，并将抽取后得到的文本内容和相关元数据加入原始入库文档。

由于 ElasticSearch 是基于 JSON 格式的文档数据库，所以附件文档在插入 ElasticSearch 之前必须进行 Base64 编码。

以下使用 REST API 调用方式。

2.环境
ElasticSearch 5.3.0

ElasticSearch-head-master插件  （安装指路 Elasticsearch学习--elasticsearch-head插件安装）

Ingest-attachment插件  （官方介绍 Ingest Attachment Processor Plugin）

Cygwin  （curl+perl）

3.实现步骤
3.1 建立自己的文本抽取管道pipeline

curl -X PUT "localhost:9200/_ingest/pipeline/attachment" -d '{
 "description" : "Extract attachment information",
 "processors":[
 {
    "attachment":{
        "field":"data",
        "indexed_chars" : -1,
        "ignore_missing":true
     }
 },
 {
     "remove":{"field":"data"}
 }]}'

3.2 创建新的索引
此处索引名为estest。

curl -X PUT “localhost:9200/estest” -d’{
“settings”:{
“index”:{
“number_of_shards”:1,
“number_of_replicas”:0
}}}’

3.3 载入数据
方法一：直接载入base64源码

首先要确定base64编码正确，否则因为乱码可能无法正确生成attachment。

可在 http://encode.urih.com/ 和 http://decode.urih.com/ 先进行编解码测试。

这里: index-pdftest type-pdf id-1 皆为自定义

curl -X PUT "localhost:9200/pdftest/pdf/1?pipeline=attachment" -d '
{
   "data":"QmFzZTY057yW56CB6K+05piOCuOAgOOAgEJhc2U2NOe8lueggeimgeaxguaKijPkuKo45L2N5a2X6IqC77yIMyo4PTI077yJ6L2s5YyW5Li6NOS4qjbkvY3nmoTlrZfoioLvvIg0KjY9MjTvvInvvIzkuYvlkI7lnKg25L2N55qE5YmN6Z2i6KGl5Lik5LiqMO+8jOW9ouaIkDjkvY3kuIDkuKrlrZfoioLnmoTlvaLlvI/jgIIg5aaC5p6c5Ymp5LiL55qE5a2X56ym5LiN6LazM+S4quWtl+iKgu+8jOWImeeUqDDloavlhYXvvIzovpPlh7rlrZfnrKbkvb/nlKgnPSfvvIzlm6DmraTnvJbnoIHlkI7ovpPlh7rnmoTmlofmnKzmnKvlsL7lj6/og73kvJrlh7rnjrAx5oiWMuS4qic9J+OAggoK44CA44CA5Li65LqG5L+d6K+B5omA6L6T5Ye655qE57yW56CB5L2N5Y+v6K+75a2X56ym77yMQmFzZTY05Yi25a6a5LqG5LiA5Liq57yW56CB6KGo77yM5Lul5L6/6L+b6KGM57uf5LiA6L2s5o2i44CC57yW56CB6KGo55qE5aSn5bCP5Li6Ml42PTY077yM6L+Z5Lmf5pivQmFzZTY05ZCN56ew55qE55Sx5p2l44CC"
}'

载入结果显示：（这一版data数据尚未删除）

方法二：载入PDF的同时进行转码导入

首先跳转至指定文件目录

这里我的文件ABC.pdf放在目录D:\ElasticSearch\File下

cd D:/ElasticSearch/File
使用perl脚本的解码功能：

“’base64 -w 0 ABC.pdf | perl -pe's/\n/\\n/g'‘”
完整代码：

curl -X PUT "localhost:9200/estest/pdf/10?pipeline=attachment" -d '
{
   "data":" '`base64 -w 0 ABC.pdf | perl -pe's/\n/\\n/g'`' "
}'

结果如图，可以导入成功：

全文索引，查询指定字段

注意查询字段名称，这个真的纠结了我太久……

curl -X POST "localhost:9200/pdftest/pdf/_search?pretty" -d '{
  "query":{
     "match":{
        "attachment.content":"编码"
 }}}'

查询结果：

   total=1 意为找到一个，由此验证字段可查询。

{
  "took" : 1,
  "timed_out" : false,
  "_shards" : {
    "total" : 5,
    "successful" : 5,
    "failed" : 0
  },
  "hits" : {
    "total" : 1,
    "max_score" : 1.0446626,
    "hits" : [
      {
        "_index" : "pdftest",
        "_type" : "pdf",
        "_id" : "6",
        "_score" : 1.0446626,
        "_source" : {
          "data" : "QmFzZTY057yW56CB6K+05piOCuOAgOOAgEJhc2U2NOe8lueggeimgeaxguaKijPkuKo45L2N5a2X6IqC77yIMyo4PTI077yJ6L2s5YyW5Li6NOS4qjbkvY3nmoTlrZfoioLvvIg0KjY9MjTvvInvvIzkuYvlkI7lnKg25L2N55qE5YmN6Z2i6KGl5Lik5LiqMO+8jOW9ouaIkDjkvY3kuIDkuKrlrZfoioLnmoTlvaLlvI/jgIIg5aaC5p6c5Ymp5LiL55qE5a2X56ym5LiN6LazM+S4quWtl+iKgu+8jOWImeeUqDDloavlhYXvvIzovpPlh7rlrZfnrKbkvb/nlKgnPSfvvIzlm6DmraTnvJbnoIHlkI7ovpPlh7rnmoTmlofmnKzmnKvlsL7lj6/og73kvJrlh7rnjrAx5oiWMuS4qic9J+OAggoK44CA44CA5Li65LqG5L+d6K+B5omA6L6T5Ye655qE57yW56CB5L2N5Y+v6K+75a2X56ym77yMQmFzZTY05Yi25a6a5LqG5LiA5Liq57yW56CB6KGo77yM5Lul5L6/6L+b6KGM57uf5LiA6L2s5o2i44CC57yW56CB6KGo55qE5aSn5bCP5Li6Ml42PTY077yM6L+Z5Lmf5pivQmFzZTY05ZCN56ew55qE55Sx5p2l44CC",
          "attachment" : {
            "content_type" : "text/plain; charset=UTF-8",
            "language" : "lt",
            "content" : "Base64编码说明\n　　Base64编码要求把3个8位字节（3*8=24）转化为4个6位的字节（4*6=24），之后在6位的前面补两个0，形成8位一个字节的形式。 如果剩下的字符不足3个字节，则用0填充，输出字符使用'='，因此编码后输出的文本末尾可能会出现1或2个'='。\n\n　　为了保证所输出的编码位可读字符，Base64制定了一个编码表，以便进行统一转换。编码表的大小为2^6=64，这也是Base64名称的由来。",
            "content_length" : 212 }
        }
      }
    ]
  }
}

5.参考目录
convert the file into base64 in elasticsearch for attachment

ElasticSearch 全文检索实战

elasticsearch使用附件进行中文检索，无法查询中文的问题

Getting error while parsing documents

Sending Attachments: Unexpected end-of-input in VALUE_STRING

How to index a pdf file in Elasticsearch 5.0.0 with ingest-attachment plugin?

6.想法
其实流程走下来还挺简单，但当时小白入门，我还是困扰了挺久的，查阅各路资料最终成功导入。虽然也不厉害，但还是记录一下，缕清整个流程，希望能帮到大家。^_^

一、概述
Elasticsearch 是一个分布式的 RESTful 风格的搜索和数据分析引擎，它基于 Lucene 实现了强大的全文检索功能。本文针对一个通用的应用场景，讲解如何利用 ElasticSearch 快速实现对关系型数据库文本和常见文档格式附件的全文检索。

二、应用场景
描述
数字图书馆有一套基于 MySQL 的电子书管理系统，电子书的基本信息保存在数据库表中，书的数字内容以多种常见的文档格式（PDF、Word、PPT、RTF、TXT、CHM、EPUB等）保存在存储系统中。现在需要利用 ElasticSearch 实现一套全文检索系统，以便用户可以通过对电子书的基本信息和数字内容进行模糊查询，快速找到相关书籍。

数据结构
数据库表 BOOK 结构:

CREATE TABLE book (
id varchar(100) NOT NULL,
title varchar(50) DEFAULT NULL,
desc varchar(1000) DEFAULT NULL,
path varchar(200) DEFAULT NULL,
create_time datetime DEFAULT NULL,
update_time datetime DEFAULT NULL,
PRIMARY KEY (id)
) ENGINE=InnoDB DEFAULT CHARSET=utf8
字段意义
id 主键
title 书名
desc 介绍
path 存储路径
create_time 创建时间
update_time 更新时间
逻辑约束：创建书籍记录时，create_time 等于 update_time，即当前时间，每次更新书籍时，更新 update_time 时间。全文检索系统根据 update_time 时间更新书籍索引。

三、技术方案
示意图

基本思路就是：

定期扫描 MySQL 中的 book 表，根据字段 update_time 批量抓取最新的电子书数据。
从 path 字段获取电子书数字内容的文档存储路径。从存储系统中抓取电子书文档并进行 BASE64编码。
将从 book 表批量抓取的数据转换为 JSON 文档，并将 BASE64编码后的电子书文档合并入 JSON，一同写入 ElasticSearch，利用 ElasticSearch 的插件 Ingest Attachment Processor Plugin 对电子书文档进行文本抽取，并进行持久化，建立全文索引。
本文采用开源数据处理工具 Apache NiFi http://nifi.apache.org 来实现上述流程，具体使用方法后续实施过程会详细讲解。如果读者不了解 Apache NiFi ，也可以使用 Logstash、Kettle 等工具或者使用自己熟悉的编程语言开发应用来完成上述流程。

四、安装并初始化 ElasticSearch
安装 ElasticSearch
访问ElasticSearch官网，根据操作系统选择下载软件包，并安装
https://www.elastic.co/downloads/elasticsearch
当前最新版本是 v6.2.4

Linux/Unix 下运行 bin/elasticsearch (在windows操作系统下运行 bin\elasticsearch.bat )

ElasticSearch的默认服务端口是 9200，所有 API 都可以通过 REST 方式调用。

关于JVM内存：ElasticSearch是基于Java开发，部署需要配置合理的JVM Heap内存，官方建议分配内存不高于本机物理内存的二分之一，最好不要超过32G。具体配置方法如下：

设置环境变量 ES_HEAP_SIZE，ElasticSearch启动时会读取这个环境变量。在命令行运行如下：

export ES_HEAP_SIZE=8g
安装中文分词插件
IK Analysis for Elasticsearch 是开源社区比较流行的中文分词插件
官网：https://github.com/medcl/elasticsearch-analysis-ik

安装方法：
在安装目录下运行

./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.2.4/elasticsearch-analysis-ik-6.2.4.zip
运行结果：

➜ elasticsearch-6.2.4 ./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.2.4/elasticsearch-analysis-ik-6.2.4.zip
-> Downloading https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.2.4/elasticsearch-analysis-ik-6.2.4.zip
[=================================================] 100%
-> Installed analysis-ik
安装成功后，在 plugin 文件夹下可以看到出现了 analysis-ik 文件夹。

安装附件文本抽取插件
ElasticSearch 官方提供插件：
Ingest Attachment Processor Plugin
https://www.elastic.co/guide/en/elasticsearch/plugins/current/ingest-attachment.html#ingest-attachment

此插件开箱即用，用于实现常见格式文档的文本抽取，它基于另一个开源的文本抽取工具库 Apache Tika http://tika.apache.org 实现。

安装方法：
在安装目录下运行

./bin/elasticsearch-plugin install ingest-attachment
安装过程中提示此插件需要一些额外的权限，输入y回车，继续安装即可，运行结果：

-> Downloading ingest-attachment from elastic
[=================================================] 100%
@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@
@ WARNING: plugin requires additional permissions @
@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@
* java.lang.RuntimePermission accessDeclaredMembers
* java.lang.RuntimePermission getClassLoader
* java.lang.reflect.ReflectPermission suppressAccessChecks
* java.security.SecurityPermission createAccessControlContext
* java.security.SecurityPermission insertProvider
* java.security.SecurityPermission putProviderProperty.BC
See http://docs.oracle.com/javase/8/docs/technotes/guides/security/permissions.html
for descriptions of what these permissions allow and the associated risks.

Continue with installation? [y/N]y
-> Installed ingest-attachment
安装成功后，在 plugin 文件夹下可以看到出现了 ingest-attachment 文件夹。

重新启动 ElasticSearch
所有插件安装完成后重新启动 ElasticSearch

五、文档附件的文本抽取
解决方式
ElasticSearch只能处理文本，不能直接处理二进制文档。要利用 ElasticSearch 实现附件文档的全文检索需要 2 个步骤：

对多种主流格式的文档进行文本抽取。
将抽取出来的文本内容导入 ElasticSearch ，利用 ElasticSearch强大的分词和全文索引能力。

上文安装的 Ingest Attachment Processor Plugin 是一个开箱即用的插件，使用它可以帮助 ElasticSearch 自动完成这 2 个步骤。

基本原理是利用 ElasticSearch 的 Ingest Node 功能，此功能支持定义命名处理器管道 pipeline，pipeline中可以定义多个处理器，在数据插入 ElasticSearch 之前进行预处理。而 Ingest Attachment Processor Plugin 提供了关键的预处理器 attachment，支持自动对入库文档的指定字段作为文档文件进行文本抽取，并将抽取后得到的文本内容和相关元数据加入原始入库文档。

因为 ElasticSearch 是基于 JSON 格式的文档数据库，所以附件文档在插入 ElasticSearch 之前必须进行 Base64 编码。

当然，Attachment Processor Plugin 不是唯一方案。如果需要深入定制文档抽取功能，或基于功能解耦等考量，完全可以利用 Apache Tika http://tika.apache.org 实现独立的文档抽取应用。

建立文本抽取管道
ElasticSearch 支持 REST API，我们可以用 cURL、Postman 等工具调用。为方便查看，本文使用如下这种表示方式来展示 REST 调用，请注意，它并不是可执行代码。

PUT http://localhost:9200/_ingest/pipeline/attachment

{
“description”: “Extract attachment information”,
“processors”: [
{
“attachment”: {
“field”: “data”,
“ignore_missing”: true
}
},
{
“remove”: {
“field”: “data”
}
}
]
}
以上，我们建立了 1 个命名 pipeline 即 “attachment”，其中定义了 2 个预处理器 “attachment” 和 “remove” ，它们按定义顺序对入库数据进行预处理。

“attachment” 预处理器即上文安装的插件 “Ingest Attachment Processor Plugin” 提供，将入库文档字段 “data” 视为文档附件进行文本抽取。要求入库文档必须将文档附件进行 BASE64编码写入 “data” 字段。

文本抽取后, 后续不再需要保留 BASE64 编码的文档附件，将其持久化到 ElasticSearch 中没有意义，”remove” 预处理器用于将其从源文档中删除。

如何使用 pipeline
按照 ElasticSearch 的 API 定义，插入文档时可以在请求地址末尾加
?pipeline=attachment 的形式指定使用上文建立的 “attachment” 命名 pipeline。

六、建立文档结构映射
ElasticSearch 是文档型数据库，以 JSON 文档为处理对象。文档结构以 mapping 形式定义，相当于关系型数据库建立表结构。以下，我们建立 MySQL 的 book 表在 ElasticSearch 中的文档结构映射。

PUT http://localhost:9200/book

{
  "mappings": {
    "idx": {
      "properties": {
        "id": {
          "type": "keyword"
        },
        "title": {
          "type": "text",
          "analyzer": "ik_max_word"
        },
        "desc": {
          "type": "text",
          "analyzer": "ik_max_word"
        },
        "path": {
          "type": "keyword"
        },
        "create_time": {
          "type": "date",
          "format": "yyyy-MM-dd HH:mm:ss||yyyy-MM-dd||epoch_millis"
        },
        "update_time": {
          "type": "date",
          "format": "yyyy-MM-dd HH:mm:ss||yyyy-MM-dd||epoch_millis"
        },
        "attachment": {
          "properties": {
            "content": {
              "type": "text",
              "analyzer": "ik_max_word"
            }
          }
        }
      }
    }
  }
}

除了 book 表中的原有字段外，我们在 ElasticSearch 中增加了 “attachment” 字段，这个字段是 “attachment” 命名 pipeline 抽取文档附件中文本后自动附加的字段。这是一个嵌套字段，其包含多个子字段，包括抽取文本 content 和一些文档信息元数据。

在本文的应用场景中，我们需要对 book 的 title、desc 和 attachment.content 进行全文检索，所以在建立 mapping 时，我们为这 3 个字段指定分析器 “analyzer” 为 “ik_max_word”，以让 ElasticSearch 在建立全文索引时对它们进行中文分词。

七、安装并配置 Apache NiFi
Apache NiFi (http://nifi.apache.org) 是一个易用、强大、可靠的数据处理、分发系统。本文使用它来完成数据流转处理，如果读者使用其它工具或者自行编程开发应用，请忽略本章。

本文不是专门的 Apache NiFi 教程，只针对相关应用场景介绍如何使用 Apache NiFi。

安装 Apache NiFi
在 Apache NiFi 官网下载并解压到本地，本文当前最新版本为 1.6.0
下载地址：http://nifi.apache.org/download.html

Apache NiFi 基于 java 开发，要求运行环境为 JDK 8.0 以上。

常用配置在 conf 目录下的 nifi.properties 和 bootstrap.conf 文件中，详见：NiFi System Administrator’s Guide

其中，web 控制台端口在 nifi.proerties 文件中的 nifi.web.http.port 参数修改，默认值 8080。JVM启动参数在 bootstrap.conf 文件中，内存分配在 # JVM memory settings 段，默认 -Xms512m -Xmx512m。

下载 MySQL Connector/J
因为 NiFi 需要连接 MySQL 抓取数据，请到 MySQL 官网下载 MySQL Connector/J
https://dev.mysql.com/downloads/connector/j/

本文当前最新版本 5.1.46，将 mysql-connector-java-5.1.46-bin.jar 拷贝到 NiFi 安装目录备用。

启动 Apache NiFi
命令行进入 Apache NiFi 目录，运行命令 ./bin/nifi.sh start

Apache NiFi 的常用命令：

命令说明
run 交互式启动
start 后台启动
stop 停止
status 查看服务状态
Apache NiFi 提供图形化的 Web 管理控制台，内置丰富的功能组件，通过拖拽的方式即可建立数据处理流程, 启动以后访问 http://localhost:8080/nifi ，控制台如下图:

NiFi控制台

配置数据处理流程
篇幅有限，本文不详细讲解 Apache NiFi，如果读者有兴趣，请前往阅读官方文档：
http://nifi.apache.org/docs.html

导入模板
Apache NiFi 支持将配置好的流程保存为模板，鼓励社区开发者之间分享模板。本章及使用的流程模板已上传至开源项目：
https://gitee.com/streamone/full-text-search-in-action
模板文件在 /nifi/FullText-mysql.xml

下载模板文件 FullText-mysql.xml ，然后点击控制台左侧 “Operate” 操作栏里的 “Upload Template” 上传模板。

上传模板

应用模板
拖拽控制台顶部一排组件图标中的 “Template” 到空白网格区域，在弹出的 “Add Template” 窗口中选择刚刚上传的模板 “FullText-mysql”，点击 “Add”。空白网格区域将出现如下下图的 “process group”，它是一组 “processor” 的集合，我们的处理流程就是由这组 “processor” 按照数据处理逻辑有序组合而成。

NiFi模板

双击此 “process group” 进入，将看到完整的流程配置，如下图：

NiFi process group

运行这个流程之前需要完成几个配置项：

配置并启动数据库连接池
在空白网格处点击鼠标右键，在弹出菜单中点击 “configure”，在弹出的 “FullText-mysql Configuration” 窗口中打开 “controller services” 标签页如下图，点击表格中 “DBCPConnectionPool” 右侧 “Configure” 图标，进行数据库连接池配置。 NiFi controller services
在弹出的 “Configure Controller Service” 窗口中打开 “PROPERTIES” 标签页，在表格中填写 MySQL数据库相关信息，如下图：配置数据库连接池
其中的 “Database Driver Location(s)” 填写我们下载的 “mysql-connector-java-5.1.46-bin.jar” 路径。配置好数据库连接池以后点击 “APPLY” 回到 “controller services” 标签页，点击表格中 “DBCPConnectionPool” 右侧 “Enable” 图标启动数据库连接池。

修改变量
在空白网格处点击鼠标右键，在弹出菜单中点击 “variables”，打开 “Variables” 窗口，修改表格中的 “elasticSearchServer” 参数值为 ElasticSearch 服务地址，修改表格中的 “rootPath” 参数为电子书数字文档在文件系统中的根路径。

回到 “process group” 流程页面，在空白网格处点击鼠标右键，在弹出菜单中点击 “start” 菜单，启动流程。

至此，我们完成了本文应用场景中 Apache NiFi 的流程配置。Apache NiFi 每隔 10 秒扫描 MySQL 的 book 表，抓取最新的电子书数据，处理后导入 ElasticSearch。

八、全文检索查询
完成以上内容，我们应该已经将 MySQL 数据库中的电子书信息导入 ElasticSearch，并建立了全文索引。

本章应用场景中，我们想要对电子书的 “title”、”desc”、”attachment.content” (抽取文本) 进行全文检索，帮助用户快速找到关键词为 “计算” 的全部电子书。

ElasticSearch 提供 REST API，各种编程语言都可以很方便地实现客户端调用，官方提供了多种语言的 client :
https://www.elastic.co/guide/en/elasticsearch/client/index.html

本章沿用前述方式展示全文检索请求结构：

POST http://localhost:9200/book/idx/_search

{
“query”: {
“multi_match”: {
“query”: “计算”,
“fields”: [“title”, “desc”, “attachment.content”]
}
},
“_source”: {
“excludes”: [“attachment.content”]
},
“from”: 0, “size”: 200,
“highlight”: {
“encoder”: “html”,
“pre_tags”: [““],
“post_tags”: [““],
“fields”: {
“title”: {},
“desc”: {},
“attachment.content”: {}
}
}
}
我们采用 “multi_match” 进行跨多字段查询。
关于 “multi_match” 的更多信息，请前往 https://www.elastic.co/guide/en/elasticsearch/reference/current/query-dsl-multi-match-query.html

“_source” 用于从返回结果中将 “attachment.conent” 字段过滤掉，因为此字段是从电子书中抽取的文本，内容太大，我们不希望在列表查询中显示它。

ElasticSearch 默认是分页查询，以 “from” 和 “size” 分别表示偏移量和每页记录数。

“highlight” 是高亮配置，其中 “fields” 属性中配置的字段高亮信息都会被查询结果返回。”encoder” 是在对关键词加高亮标签之前对原文转义的方式。”pre_tags” 和 “post_tags” 是关键词高亮标签。
关于 “highlight” 的更多信息，请前往 https://www.elastic.co/guide/en/elasticsearch/reference/current/search-request-highlighting.html

请注意，这段不是可执行程序，这样写仅仅是为了方便查看。以下为对应的 cURL 调用命令：

curl -X POST \
http://localhost:9200/book/idx/_search \
-H ‘Cache-Control: no-cache’ \
-H ‘Content-Type: application/json’ \
-d ‘{
“query”: {
“multi_match”: {
“query”: “计算”,
“fields”: [“title”, “desc”, “attachment.content”]
}
},
“_source”: {
“excludes”: [“attachment.content”]
},
“from”: 0, “size”: 200,
“highlight”: {
“encoder”: “html”,
“pre_tags”: [““],
“post_tags”: [““],
“fields”: {
“title”: {},
“desc”: {},
“attachment.content”: {}
}
}
}’

你可能感兴趣的:(elastic)

【Elasticsearch】ignore_malformed risc123456 Elasticsearch elasticsearch
在Elasticsearch中，`ignore_malformed`是一个字段映射参数，用于控制在索引文档时，如果字段数据不符合其定义的数据类型，Elasticsearch应该如何处理这种情况。具体来说，`ignore_malformed`参数决定了是否忽略格式错误的数据，而不是直接拒绝整个文档。作用当启用`ignore_malformed`参数时（设置为`true`），Elasticsearch
Elasticsearch冷热分离与索引生命周期管理 Cloud_Tech elasticsearch 大数据数据分析数据库阿里云
本文介绍在Elasticsearch集群上，通过生命周期管理ILM（IndexLifecycleManagement）功能，实现冷热数据分离的实践流程。通过本实践，您既可以实现在保证集群读写性能的基础上，自动维护集群上的冷热数据，又能通过优化集群架构，降低企业生产成本。背景信息当今大数据时代，数据时刻在更新变化。尤其是随着时间的积累，存储在Elasticsearch中的数据会越来越多，当数据达到一
Elasticsearch常用命令墨明&棋妙 elasticsearch spring cloud 全文检索搜索引擎
1、安装教程windows环境下elasticsearch安装教程(超详细)-hualess-博客园(cnblogs.com)Elasticsearch下载地址：https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-7.17.18-windows-x86_64.zip2、安装分词器，elasticsearch-anal
Elasticsearch Data streams数据流实操 OliverCaro Elasticsearch elasticsearch
现有以下文档，请编写一个名为test_data_stream数据流满足以下请求：{"@timestamp":"2099-03-08T11:04:05.000Z","message":"test"}数据流索引的主分片数为3，副本分片数为1将上述文档填充到数据流中去基于ES7.13版本#创建索引生命周期管理来管理数据流索引PUT_ilm/policy/data_stream_ilm{"policy":
Elasticsearch索引生命周期管理编程 ByteWhisper elasticsearch jenkins 大数据编程
Elasticsearch索引生命周期管理编程在本文中，我们将探讨如何通过编程方式进行Elasticsearch索引生命周期管理。索引生命周期管理是一种自动化管理索引的方法，它可以根据预定义的规则自动执行索引的创建、删除和归档等操作。这种管理方法可以帮助您有效地管理索引，并根据数据的重要性和访问频率来优化存储和性能。Elasticsearch提供了索引生命周期管理（IndexLifecycleMa
【Elasticsearch】Set up a data stream 创建data stream risc123456 Elasticsearch elasticsearch
在Elasticsearch中，数据流（DataStream）是一种用于管理时间序列数据的高级功能，它通过自动管理索引的生命周期和版本控制，简化了大规模时间序列数据的存储和查询。以下是结合上述翻译内容，对Elasticsearch中设置数据流的详细步骤和概念的总结：---1.数据流的概念数据流是一种用于管理时间序列数据的结构，它通过一个或多个后端索引来存储数据。数据流的主要优势包括：•自动生命周期
Elasticsearch ILM 索引生命周期管理讲解与实战少林码僧 elasticsearch 大数据
ESILM索引生命周期管理讲解与实战ElasticsearchILM索引生命周期管理：深度解析与实战演练1.引言1.1背景介绍1.2研究意义2.ILM核心概念2.1ILM的四个阶段2.1.1Hot阶段2.1.2Warm阶段2.1.3Cold阶段2.1.4Delete阶段3.ILM实战指南3.1定义ILM策略3.1.1创建ILM策略3.1.2应用ILM策略到索引模板3.2索引别名与滚动3.2.1创建
【Elasticsearch】索引生命周期管理相关的操作（Index Lifecycle Actions） risc123456 Elasticsearch elasticsearch
Elasticsearch的IndexLifecycleManagement(ILM)是一种用于管理索引生命周期的工具，它允许用户根据索引的使用阶段（如热、温、冷、冻结）自动执行一系列操作。以下是详细解释Elasticsearch中的索引生命周期操作（IndexLifecycleActions）：1.Allocate（分配）•功能：将索引分片移动到具有不同性能特征的节点上，并可以调整副本的数量。•
Elasticsearch索引生命周期 Cloud-Future elasticsearch Elasticsearch
索引生命周期阶段定义Elasticsearch在ILM（IndexLifecycleManagement）中定义了索引生命周期的5个阶段：Hot（热）：索引处于活动状态，能够更新（增改删）和查询。Warm（暖）：处于该阶段的索引不再支持更新，但是能够被查询。Cold（冷）：该阶段的索引不再支持更新，只能支持很少的查询，查询较慢！Frozen（冻结）：该阶段的所有不再支持更新，也很少查询，查询很慢！
【Elasticsearch】创建时间序列数据流 Time Series Data Stream，简称TSDS risc123456 Elasticsearch elasticsearch
在Elasticsearch中，设置时间序列数据流（TimeSeriesDataStream，简称TSDS）是一种高效管理和存储时间序列数据的方法。时间序列数据是指按照时间顺序记录的数据点，例如传感器数据、日志数据或任何随时间变化的指标。TSDS通过优化索引结构和生命周期管理，帮助用户高效地存储、查询和分析这类数据。以下是详细说明如何在Elasticsearch中设置TSDS的步骤和关键概念：--
【Elasticsearch】索引生命周期管理操作之Allocate(分配) risc123456 Elasticsearch elasticsearch
在Elasticsearch中，Allocate（分配）是一个与索引生命周期管理（IndexLifecycleManagement,ILM）相关的重要操作，用于控制索引分片在集群中的分配策略。它允许用户根据不同的阶段（如Warm、Cold）动态调整索引的副本数量和分片的分配规则，以优化性能、降低成本或满足特定的存储需求。1.Allocate的作用Allocate操作的主要功能包括：•调整副本数量：
es查询所欲_Elasticsearch URI search 查询语法整理 weixin_39865102 es查询所欲
ElasticsearchURIsearch一、请求体查询与空查询1.请求体查询(requestbodysearch)简单查询语句(lite)是一种有效的命令行adhoc查询。但是，如果你想要善用搜索，你必须使用请求体查询(requestbodysearch)API。之所以这么称呼，是因为大多数的参数以JSON格式所容纳而非查询字符串。请求体查询(以下简称查询)，并不仅仅用于处理查询，而且还可以高
ElasticSearch 回郭肉 java elasticsearch 搜索引擎
ElasticSearch基础学习目标理解什么是倒排索引理解什么是ES搜索引擎掌握ES搜索引擎的索引库操作掌握ES搜索引擎的类型映射掌握ES搜索引擎的文档操作1搜索技术搜索技术在我们日常生活的方方面面都会用到，例如：综合搜索网站：百度、谷歌等电商网站：京东、淘宝的商品搜索软件内数据搜索：我们用的开发工具，如Idea的搜索功能这些搜索业务有一些可以使用数据库来完成，有一些却不行。因此我们今天会学习一
【实战 ES】实战 Elasticsearch：快速上手与深度实践-1.3.1单节点安装（Docker与手动部署）言析数智实战 elasticsearch docker 大数据
点击关注不迷路点击关注不迷路点击关注不迷路文章大纲10分钟快速部署`Elasticsearch`单节点环境1.系统环境要求1.1硬件配置推荐1.2软件依赖2.`Docker`部署方案2.1部署流程2.2参数说明2.3性能优化建议3.手动部署方案3.1安装步骤3.2核心配置项3.3启动服务4.部署方式对比5.验证安装结果5.1基础健康检查5.2性能测试6.常见问题排查6.1启动失败问题6.2性能优化
elasticsearch用curl查询 qiuJun998 elasticsearch 权限 curl查询值
curl:-X:指定http的请求方式，有HEAD、GET、POST、PUT、DELETE-d:指定要传输的数据-H:指定http的请求头信息curl-XPUThttp://ip:port/索引名?pretty--创建索引curl-XGEThttp://ip:port/_cat/indices?v--查看当前es的所有索引信息curl-XGEThttp://ip:port/索引名?pretty--
Elasticsearch（一）：安装Elasticsearch + kibana + ik分词器 Gooooa Elasticsearch elasticsearch安装 es安装 ik分词器 kibana安装
原文来源自黑马的课程1.Elasticsearch介绍和安装用户访问我们的首页，一般都会直接搜索来寻找自己想要购买的商品。而商品的数量非常多，而且分类繁杂。如果能正确的显示出用户想要的商品，并进行合理的过滤，尽快促成交易，是搜索系统要研究的核心。面对这样复杂的搜索业务和数据量，使用传统数据库搜索就显得力不从心，一般我们都会使用全文检索技术，比如之前大家学习过的Solr。不过今天，我们要讲的是另一个
使用curl命令在Linux下访问Elasticsearch的RESTful API JipForth linux elasticsearch restful
Elasticsearch是一个强大的开源分布式搜索和分析引擎，它提供了一个RESTfulAPI，用于与其进行交互。在Linux系统中，我们可以使用curl命令来访问Elasticsearch的RESTfulAPI，执行各种操作，如索引文档、搜索、聚合等。本文将详细介绍如何使用curl命令在Linux下与Elasticsearch进行交互。安装curl首先，我们需要确保curl已安装在Linux系
【Elasticsearch】（Java 版）浪子西科大数据 java elasticsearch java 大数据
Elasticsearch（Java版）文章目录Elasticsearch（Java版）**1.Elasticsearch简介****1.1什么是Elasticsearch？****1.2核心概念****2.安装与配置****2.1环境要求****2.2安装步骤****Linux/macOS****Windows****2.3验证安装****2.4配置参数****3.Java客户端操作****3.
《基于Django和ElasticSearch的学术论文搜索推荐系统的设计与实现》开题报告 Python数据分析与机器学习毕业论文/研究报告 elasticsearch 大数据搜索引擎课程设计 python django 开发语言
目录一、选题的背景和意义（一）选题背景（二）选题意义2.1.提升科研效率2.2促进学术创新2.3优化资源配置二、选题的国内外现状与总结（一）国内现状（二）国外现状（三）总结三、选题的主要内容和拟解决关键问题（一）主要内容1.数据库设计与实现2.搜索功能实现3.推荐功能实现4.用户管理与交互功能实现（二）拟解决关键问题1.数据质量与整合难题解决措施：2.搜索精准度与性能优化解决措施：四、选题的设计方
RagFlow专题三、RagFlow 关键技术（向量数据库、文档分块、Prompt 设计与召回排序优化）伯牙碎琴大模型 prompt 大模型 AI Rag RagFlow
深入解析RagFlow关键技术：向量数据库、文档分块、Prompt设计与召回排序优化在前一篇文章中，我们详细探讨了RagFlow的核心架构，包括数据检索、语义搜索（BM25&向量搜索）以及知识融合，并了解了如何通过RagFlow机制优化信息检索和生成质量。本篇文章将深入解析RagFlow的关键技术，包括：向量数据库（FAISS、Milvus、Elasticsearch）——负责高效的语义检索与存储
ES 的分布式架构原理能说一下么（ES 是如何实现分布式的啊）？小新杂谈社后端面试 elasticsearch 分布式架构搜索引擎
面试题ES的分布式架构原理能说一下么（ES是如何实现分布式的啊）？面试官心理分析在搜索这块，lucene是最流行的搜索库。几年前业内一般都问，你了解lucene吗？你知道倒排索引的原理吗？现在早已经out了，因为现在很多项目都是直接用基于lucene的分布式搜索引擎——ElasticSearch，简称为ES。而现在分布式搜索基本已经成为大部分互联网行业的Java系统的标配，其中尤为流行的就是ES，
【Elasticsearch】Elasticsearch集群在分布式环境下的管理屿小夏 Elasticsearch elasticsearch 分布式大数据
文章目录前言一、集群规划与设计1.1集群拓扑结构设计1.2节点角色分配1.3分片与副本配置二、集群管理与运维2.1集群监控2.2故障处理2.3性能优化三、扩展与升级3.1集群扩展3.2集群升级3.3灾备与容灾️总结前言Elasticsearch是一种高度可扩展的开源搜索引擎，可以在大规模分布式环境中处理和存储海量数据。随着数据量的增长，单节点的Elasticsearch难以满足业务需求，因而集群部
【Elasticsearch】一文读懂ES向量搜索：原理剖析与技术全景程序员大任 ElasticSearch elasticsearch
注：本文若未说明ES版本则为7.10，其他版本会特别标记，由于ES版本不同，部分差异较大，具体请以官方文档为准一、向量搜索的核心原理1.1向量化表示的本质现代AI技术将文本、图像等非结构化数据转化为高维向量（通常128-1024维），这些向量在数学空间中携带语义特征。如：文本嵌入(Embedding)：BERT等模型生成768维向量图像特征：ResNet提取2048维特征向量1.2向量搜索简介向量
大数据处理实践探索 ---- 笔试面试题：ElasticSearch shiter 大数据机器学习实践探索笔试面试题 elasticsearch
ES中的倒排索引是什么？传统的检索方式是通过文章，逐个遍历找到对应关键词的位置。倒排索引，是通过分词策略，形成了词和文章的映射关系表，也称倒排表，这种词典+映射表即为倒排索引。其中词典中存储词元，倒排表中存储该词元在哪些文中出现的位置。有了倒排索引，就能实现O(1)时间复杂度的效率检索文章了，极大的提高了检索效率。加分项：倒排索引的底层实现是基于：FST（FiniteStateTransducer
ElasticSearch常见面试题汇总 Java布道者 elasticsearch jenkins 大数据
一、ElasticSearch基础：1、什么是Elasticsearch：2、Elasticsearch的基本概念：3、什么是倒排索引：4、DocValues的作用：5、text和keyword类型的区别：6、什么是停顿词过滤：7、query和filter的区别？二、ES的写入流程：1、es写数据的过程：2、写数据的底层原理：三、ES的更新和删除流程：四、ES的搜索流程：1、Query阶段：2、F
java面试题：Elasticsearch面试突击【2022年最新】 91科技常见JAVA面试题 elasticsearch java
目录1、为什么要使用Elasticsearch?（或回答什么是ES？）2、elasticsearch的倒排索引是什么？3、倒排索引的搜索过程是什么样的？4、elasticsearch索引数据多了怎么办，如何调优，部署5、elasticsearch是如何实现master选举的6.详细描述一下Elasticsearch索引文档的过程7、如何对Elasticsearch进行性能优化？1、为什么要使用El
ElasticSearch是如何实现分布式的？ weixin_30517001 大数据 java 面试
面试题es的分布式架构原理能说一下么（es是如何实现分布式的啊）？面试官心理分析在搜索这块，lucene是最流行的搜索库。几年前业内一般都问，你了解lucene吗？你知道倒排索引的原理吗？现在早已经out了，因为现在很多项目都是直接用基于lucene的分布式搜索引擎——ElasticSearch，简称为es。而现在分布式搜索基本已经成为大部分互联网行业的Java系统的标配，其中尤为流行的就是es，
使用 nodejs 和 ElasticSearch 快速搭建全文检索 dbLenis 数据库 java 编程语言大数据 linux
点击蓝色“有关SQL”关注我哟加个“星标”，天天与10000人一起快乐成长上次群友问我，Python怎么学，我说四个小时足够了，你们不信。这次，我用2个小时，仅仅用Google，快速搭建了一个nodejs+Elasticsearch的小Demo.足可见，在有搜索的年代，快速上手一门技术，已经不是什么难事。1安装1.1下载地址https://nodejs.org/en/download提供windo
Nodejs基础使用Elasticsearch(二) 小黑前端攻城狮 elasticsearch node.js vue.js javascript
／*链接到elasticsearch数据库*／varelasticsearch=require('elasticsearch');varclient=newelasticsearch.Client({host:'192.168.1.107:9200',log:'error'});1.统计索引数据：client.count({index:['telegram_message','telegram_u
SpringBoot整合easy-es rkmhr_sef 面试学习路线阿里巴巴 spring boot elasticsearch 后端
一、easy-es简介EasyES是一款基于Elasticsearch官方提供的RestHighLevelClient开发的ORM框架，旨在简化开发流程并提高效率。EasyES在保持RestHighLevelClient原有功能的基础上进行增强，而不做任何改变。它采用与Mybatis-Plus相似的语法，使得开发者可以无缝迁移至EasyES，无需额外学习成本。EasyES的核心理念是将简单、易用性
log4j对象改变日志级别 3213213333332132 java log4j level log4j对象名称日志级别
log4j对象改变日志级别可批量的改变所有级别，或是根据条件改变日志级别。 log4j配置文件： log4j.rootLogger=ERROR,FILE,CONSOLE,EXECPTION #log4j.appender.FILE=org.apache.log4j.RollingFileAppender log4j.appender.FILE=org.apache.l
elk+redis 搭建nginx日志分析平台 ronin47 elasticsearch kibana logstash
elk+redis 搭建nginx日志分析平台 logstash,elasticsearch,kibana 怎么进行nginx的日志分析呢？首先，架构方面，nginx是有日志文件的，它的每个请求的状态等都有日志文件进行记录。其次，需要有个队列，redis的l
Yii2设置时区 dcj3sjt126com PHP timezone yii2
时区这东西，在开发的时候，你说重要吧，也还好，毕竟没它也能正常运行，你说不重要吧，那就纠结了。特别是linux系统，都TMD差上几小时，你能不痛苦吗？win还好一点。有一些常规方法，是大家目前都在采用的1、php.ini中的设置，这个就不谈了，2、程序中公用文件里设置，date_default_timezone_set一下时区3、或者。。。自己写时间处理函数，在遇到时间的时候，用这个函数处理（比较
js实现前台动态添加文本框，后台获取文本框内容 171815164 文本框
<%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://w
持续集成工具 g21121 持续集成
持续集成是什么？我们为什么需要持续集成？持续集成带来的好处是什么？什么样的项目需要持续集成？... 持续集成(Continuous integration ,简称CI)，所谓集成可以理解为将互相依赖的工程或模块合并成一个能单独运行
数据结构哈希表(hash)总结永夜-极光数据结构
1.什么是hash 来源于百度百科: Hash，一般翻译做“散列”，也有直接音译为“哈希”的，就是把任意长度的输入，通过散列算法，变换成固定长度的输出，该输出就是散列值。这种转换是一种压缩映射，也就是，散列值的空间通常远小于输入的空间，不同的输入可能会散列成相同的输出，所以不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。
乱七八糟程序员是怎么炼成的
eclipse中的jvm字节码查看插件地址： http://andrei.gmxhome.de/eclipse/ 安装该地址的outline 插件后重启，打开window下的view下的bytecode视图 http://andrei.gmxhome.de/eclipse/ jvm博客： http://yunshen0909.iteye.com/blog/2
职场人伤害了“上司” 怎样弥补 aijuans 职场
由于工作中的失误，或者平时不注意自己的言行“伤害”、“得罪”了自己的上司，怎么办呢？　　在职业生涯中这种问题尽量不要发生。下面提供了一些解决问题的建议：　　一、利用一些轻松的场合表示对他的尊重　　即使是开明的上司也很注重自己的权威，都希望得到下属的尊重，所以当你与上司冲突后，最好让不愉快成为过去，你不妨在一些轻松的场合，比如会餐、联谊活动等，向上司问个好，敬下酒，表示你对对方的尊重，
深入浅出url编码 antonyup_2006 应用服务器浏览器 servlet weblogic IE
出处：http://blog.csdn.net/yzhz 杨争 http://blog.csdn.net/yzhz/archive/2007/07/03/1676796.aspx 一、问题：编码问题是JAVA初学者在web开发过程中经常会遇到问题，网上也有大量相关的
建表后创建表的约束关系和增加表的字段百合不是茶标的约束关系增加表的字段
下面所有的操作都是在表建立后操作的,主要目的就是熟悉sql的约束,约束语句的万能公式 1,增加字段(student表中增加姓名字段) alter table 增加字段的表名 add 增加的字段名增加字段的数据类型 alter table student add name varchar2(10); &nb
Uploadify 3.2 参数属性、事件、方法函数详解 bijian1013 JavaScript uploadify
一.属性属性名称默认值说明 auto true 设置为true当选择文件后就直接上传了，为false需要点击上传按钮才上传。 buttonClass ” 按钮样式 buttonCursor ‘hand’ 鼠标指针悬停在按钮上的样子 buttonImage null 浏览按钮的图片的路
精通Oracle10编程SQL(16)使用LOB对象 bijian1013 oracle 数据库 plsql
/* *使用LOB对象 */ --LOB(Large Object)是专门用于处理大对象的一种数据类型，其所存放的数据长度可以达到4G字节 --CLOB/NCLOB用于存储大批量字符数据，BLOB用于存储大批量二进制数据，而BFILE则存储着指向OS文件的指针 /* *综合实例 */ --建立表空间 --#指定区尺寸为128k,如不指定，区尺寸默认为64k CR
【Resin一】Resin服务器部署web应用 bit1129 resin
工作中，在Resin服务器上部署web应用，通常有如下三种方式：配置多个web-app 配置多个http id 为每个应用配置一个propeties、xml以及sh脚本文件配置多个web-app 在resin.xml中,可以为一个host配置多个web-app <cluster id="app&q
red5简介及基础知识白糖_ 基础
简介 Red5的主要功能和Macromedia公司的FMS类似，提供基于Flash的流媒体服务的一款基于Java的开源流媒体服务器。它由Java语言编写，使用RTMP作为流媒体传输协议，这与FMS完全兼容。它具有流化FLV、MP3文件，实时录制客户端流为FLV文件，共享对象，实时视频播放、Remoting等功能。用Red5替换FMS后,客户端不用更改可正
angular.fromJson boyitech AngularJS AngularJS 官方API AngularJS API
angular.fromJson 描述: 把Json字符串转为对象使用方法: angular.fromJson(json); 参数详解: Param Type Details json string JSON 字符串返回值: 对象, 数组, 字符串或者是一个数字示例: <!DOCTYPE HTML> <h
java-颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I bylijinnan java
public class ReverseWords { /** * 题目：颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I.词以空格分隔。 * 要求： * 1.实现速度最快,移动最少 * 2.不能使用String的方法如split,indexOf等等。 * 解答：两次翻转。 */ publ
web实时通讯 Chen.H Web 浏览器 socket 脚本
关于web实时通讯，做一些监控软件。由web服务器组件从消息服务器订阅实时数据，并建立消息服务器到所述web服务器之间的连接，web浏览器利用从所述web服务器下载到web页面的客户端代理与web服务器组件之间的socket连接，建立web浏览器与web服务器之间的持久连接；利用所述客户端代理与web浏览器页面之间的信息交互实现页面本地更新，建立一条从消息服务器到web浏览器页面之间的消息通路
[基因与生物]远古生物的基因可以嫁接到现代生物基因组中吗? comsci 生物
大家仅仅把我说的事情当作一个IT行业的笑话来听吧..没有其它更多的意思如果我们把大自然看成是一位伟大的程序员,专门为地球上的生态系统编制基因代码,并创造出各种不同的生物来,那么6500万年前的程序员开发的代码,是否兼容现代派的程序员的代码和架构呢?
oracle 外部表 daizj oracle 外部表 external tables
oracle外部表是只允许只读访问，不能进行DML操作，不能创建索引，可以对外部表进行的查询，连接，排序，创建视图和创建同义词操作。 you can select, join, or sort external table data. You can also create views and synonyms for external tables. Ho
aop相关的概念及配置 daysinsun AOP
切面(Aspect): 通常在目标方法执行前后需要执行的方法（如事务、日志、权限），这些方法我们封装到一个类里面，这个类就叫切面。连接点（joinpoint） spring里面的连接点指需要切入的方法，通常这个joinpoint可以作为一个参数传入到切面的方法里面（非常有用的一个东西）。通知（Advice）通知就是切面里面方法的具体实现，分为前置、后置、最终、异常环
初一上学期难记忆单词背诵第二课 dcj3sjt126com english word
middle 中间的，中级的 well 喔，那么；好吧 phone 电话，电话机 policeman 警察 ask 问 take 拿到；带到 address 地址 glad 高兴的，乐意的 why 为什么 China 中国 family 家庭 grandmother (外)祖母 grandfather (外)祖父 wife 妻子 husband 丈夫 da
Linux日志分析常用命令 dcj3sjt126com linux log
1.查看文件内容 cat -n 显示行号 2.分页显示 more Enter 显示下一行空格显示下一页 F 显示下一屏 B 显示上一屏 less /get 查询"get"字符串并高亮显示 3.显示文件尾 tail -f 不退出持续显示 -n 显示文件最后n行 4.显示头文件 head -n 显示文件开始n行 5.内容排序 sort -n 按照
JSONP 原理分析 fantasy2005 JavaScript jsonp jsonp 跨域
转自 http://www.nowamagic.net/librarys/veda/detail/224 JavaScript是一种在Web开发中经常使用的前端动态脚本技术。在JavaScript中，有一个很重要的安全性限制，被称为“Same-Origin Policy”（同源策略）。这一策略对于JavaScript代码能够访问的页面内容做了很重要的限制，即JavaScript只能访问与包含它的
使用connect by进行级联查询 234390216 oracle 查询父子 Connect by 级联
使用connect by进行级联查询 connect by可以用于级联查询，常用于对具有树状结构的记录查询某一节点的所有子孙节点或所有祖辈节点。来看一个示例，现假设我们拥有一个菜单表t_menu，其中只有三个字段：
一个不错的能将HTML表格导出为excel,pdf等的jquery插件 jackyrong jquery插件
发现一个老外写的不错的jquery插件，可以实现将HTML 表格导出为excel,pdf等格式，地址在： https://github.com/kayalshri/ 下面看个例子，实现导出表格到excel,pdf <html> <head> <title>Export html table to excel an
UI设计中我们为什么需要设计动效 lampcy UI UI设计
关于Unity3D中的Shader的知识首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，
如何禁止页面缓存 nannan408 html jsp cache
禁止页面使用缓存~ ------------------------------------------------ jsp:页面no cache： response.setHeader("Pragma","No-cache"); response.setHeader("Cache-Control","no-cach
以代码的方式管理quartz定时任务的暂停、重启、删除、添加等 Everyday都不同定时任务管理 spring-quartz
【前言】在项目的管理功能中，对定时任务的管理有时会很常见。因为我们不能指望只在配置文件中配置好定时任务就行了，因为如果要控制定时任务的 “暂停” 呢？暂停之后又要在某个时间点 “重启” 该定时任务呢？或者说直接 “删除” 该定时任务呢？要改变某定时任务的触发时间呢？ “添加” 一个定时任务对于系统的使用者而言，是不太现实的，因为一个定时任务的处理逻辑他是不
EXT实例 tntxia ext
（1）增加一个按钮 JSP: <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); Stri
数学学习在计算机研究领域的作用和重要性 xjnine Math
最近一直有师弟师妹和朋友问我数学和研究的关系，研一要去学什么数学课。毕竟在清华，衡量一个研究生最重要的指标之一就是paper,而没有数学，是肯定上不了世界顶级的期刊和会议的，这在计算机学界尤其重要！你会发现，不论哪个领域有价值的东西，都一定离不开数学！在这样一个信息时代，当google已经让世界没有秘密的时候，一种卓越的数学思维，绝对可以成为你的核心竞争力. 无奈本人实在见地