百慕倾君

Elasticsearch基础1——搜索引擎发展史和工作流程、es/es-head/kibana的基础安装

文章目录

一、搜索引擎
- 1.1 搜索引擎的发展背景
- 1.2 Lucene和Elasticsearch
- 1.3 Solr和Elasticsearch对比
- 1.4 数据搜索方式
- 1.5 搜索引擎
- - 1.5.1 搜索引擎工作流程
  - 1.5.2 网络爬虫原理流程
  - 1.5.3 网页分析
  - 1.5.4 正排索引和倒排索引
二、Elasticsearch基础安装
- 1.2 概述简介
- 2.2 安装
- - 2.2.1 Windows安装
  - - 2.2.1.1 安装ES
    - 2.2.1.2 基础设置
    - - 2.2.1.2.1 关闭geoip数据库更新
      - 2.2.1.2.2 关闭es密码登录
      - 2.2.1.2.3 设置特定IP访问
    - 2.2.1.2 安装es-head插件
    - 2.2.1.3 安装Kibana
    - - 2.2.1.3.1 汉化设置
  - 2.2.2 Linux安装
  - - 2.2.2.1 安装es
    - 2.2.2.2 安装es-head
    - 2.2.2.3 安装kibana

一、搜索引擎

1.1 搜索引擎的发展背景

搜索引擎发展五个阶段：

第一阶段：FTP 文件检索阶段。

该阶段的搜索引擎比如 Archie，只检索多个 FTP 服务器上存储的文件。我们搜索文件时需要输入精确文件名才能进行搜索，搜索出来的结果就是给我们提示FTP地址，可以从这个FTP地址下载我们搜索的文件。

第二阶段：分类目录导航阶段。

该阶段的搜索引擎就是一个导航网站，比如hao123、搜狗浏览器主页等网站。这种网站上面都是把各种网址分类好，当我们使用此种搜索引擎时，只需要从各个分类目录里找到我们想要的网址，单击其网站链接后进入相应的网站。

第三阶段：文本相关性检索阶段。

当互联网上的内容逐渐丰富时，网页内容和形态也开始多样化，页面中就开始出现内容与网页地址和网页标题大相径庭的情况，第二阶段的搜索引擎功能弊端就开始显形。所以为了解决这个问题，第三阶段就出现了。

第三阶段搜索引擎开始引入全文搜索技术，用来保证搜索引擎检索到的网页标题与网页全文内容强一致性。

使用这类搜索引警时，我们将输入的查询信息提交给搜索引擎后台服务器，搜索引擎服务器通过查阅已经索引好的网页全文信息，返回一些相关程度高的页面信息。计算输入的查询信息与网页内容相关性判断的模型主要有布尔模型、概率模型、向量空间模型等。

这个阶段的搜索引擎代表有Ala Vista、Excite等。

第四阶段：网页链接分析阶段。

此阶段的代表作就是谷歌搜索，最大的特性就是通过结合网页内容的重要性和相似程度来改善搜索的信息质量。

此阶段的搜索引擎使用的网站链接形式与当前基本相同，外部链接表示推荐，通过计算每个网站的推荐链接的数量，就可以判断一个网站的流行性和重要性。

第五阶段：用户意图识别阶段。

这个阶段的目的是更人性化的为每个用户服务，代表有百度搜索。

在使用这类搜索引擎时，不同用户查询同一个关键词时，检索出来的结果可能不同。

同一个用户搜索同样的关键词也会因时因地的不同而有所差异。比如当用户在搜索引擎上首次输入“TAL”时，可能是想查找 TAL 股票代码对应的好未来公司的网站;当用户在好未来的办公区内搜索“TAL”时，有可能是想查看 TAL 股票代码的实时股价。

搜索引擎的两大分类：

站外搜索：也就是全网搜索，目前主流的搜索引擎基本都是全网搜索，如谷歌、百度。主攻网站外部链接和网站品牌推广。

站内搜索：比如微博、京东、饿了么、淘宝、美团等。主攻网站内部结构、内容。

1.2 Lucene和Elasticsearch

说Elasticsearch之前，需要先了解一下Lucene，因为ElasticSearch 是在Lucene 之上封装出来的一个工具。

Lucene是一个免费、开源、高性能信息检索工具包，是以纯Java语言编写出来的一个jar包，并不包含搜索引擎系统。只包含索引结构、读写索引的工具、排序、搜索规则…等工具类。

Lucene的由来：

在Google公司成立着力于研发搜索引擎之后，一位名叫Doug Cutting的美国工程师，也迷上了搜索引擎。他做了一个用于文本搜索的函数库（姑且理解为软件的功能组件），命名为Lucene。

这个人后面也搞出了大数据Hadoop。

Lucene为什么只是个工具包？

因为创始人当初研究它的初衷主要是为软件开发人员提供一个简单易用的工具包，主要提供倒排素引的查询结构，以方便软件开发人员在其业务系统中实现全文检索的功能。

Elasticsearch的由来：

一个叫做Shay Banon的开发者给老婆构建一个食谱的搜索引擎，方便他老婆学习厨师，并开始构建一个早期版本的Lucene。

直接基于Lucene工作会比较困难，所以他开始抽象Lucene代码以便Java程序员可以在应用中添加搜索功能。他发布了他的第一个开源项目，叫做“Compass”。

后来他找到一份工作，这份工作处在高性能和内存数据网格的分布式环境中，因此高性能的、实时的、分布式的搜索引擎也是理所当然需要的。然后他决定重写Compass库使其成为一个独立的服务叫做Elasticsearch。

在2010年2月公开第一个Elasticsearch版本，并成为当时Github上最受欢迎的项目之一，一家主营Elasticsearch的公司就此成立。

Elasticsearch是什么？

Elaticsearch，简称为es，是一个开源的高扩展的分布式全文检索引擎，它可以近乎实时的存储、检索数据，本身扩展性很好可以扩展到上百台服务器，处理PB级别的数据。

es也使用Java开发并使用Lucene作为其核心来实现所有索引和搜索的功能，但是它的目的是通过简单的RESTful API来隐藏Lucne的复杂性，从而让全文搜索变得简单。

谁在使用Elasticsearch？

维基百科，有用到全文检索、高亮，根据权重搜索推荐。

The Guardian(国外新闻网站)，用户行为日志(点击，浏览，收藏，评论)+社交网络数据(对某某新闻的相关看法)，数据分析，给到每篇新闻文章的作者，让他知道他的文章的公众反馈(好，坏，热门，垃圾，鄙视，崇拜)

Stack Overflow(国外的程序异常讨论论坛 )，IT问题，程序的报错，提交上去，有人会跟你讨论和回答，全文检索，搜索相关问题和答案，程序报错了，就会将报错信息粘贴到里面去，搜索有没有对应的答案。

GitHub( 开源代码管理 )，搜索上千亿行代码。

电商网站，检索商品。

日志数据分析，logstash采集日志，ES进行复杂的数据分析，ELK技术，elasticsearch+logstash+kibana=ELK。

商品价格监控网站，用户设定某商品的价格闻值，当低于该阔值的时候，发送通知消息给用户，比如说订阅牙膏的监控，如果高露洁牙膏的家庭套装低于50块钱，就通知我，我就去买。

BI系统，商业智能，Business lnteligence。比如说有个大型商场集团，BI，分析一下某某区域最近3年的用户消费金额的趋势以及用户群体的组成构成，产出相关的数张报表，*区，最近3年，每年消费金额呈现100%的增长，而且用户群体85%是高级白领，开一个新商场。ES执行数据分析和挖掘，Kibana进行数据可视化。

国内: 站内搜索(电商，招聘，门户)，IT系统搜索 (OA，CRM，ERP)，数据分析。

Lucene的优点：

索引文件格式独立于应用平台。Lucene 定义了一套以8 位字节为基础的索引文件格式，使得兼容系统或者不同平台的应用能够共享建立的索引文件。

索引速度快。在传统全文检索引擎的倒排索引的基础上，实现了分块索引，能够针对新的文件建立小文件索引，提升索引速度。然后通过与原有索引的合并，达到优化的目的。

简单易学。优秀的面向对象的系统架构，降低了 Lucene 扩展的学习难度，方便扩充新功能

跨语言。设计了独立于语言和文件格式的文本分析接口，索引器通过接收 Token 流完成索引文件的创立，用户扩展新的语言和文件格式，只需实现文本分析的接口即可。

强大的查询引擎。Lucene 默认实现了一套强大的查询引擎，用户无须自己编写代码即可通过系统获得强大的查询能力。Lucene 默认实现了布尔操作、模糊查询、分组查询等。

Lucene的主要模块作用：

Analysis模块：主要负责词法分析及语言处理，也就是我们常说的分词，通过该模块可最终形成存储或者搜索的最小单元 Term。

Index模块：主要负责索引的创建工作。

Store 模块：主要负责索引的读和写，主要是对文件的一些操作，其主要目的是抽象出和平台文件系统无关的存储。

QueryParser 模块：主要负责语法分析，把查询语生成 Lucene 底层可以识别的条件。

Search 模块：主要负责对索引的搜索工作。

Similarity模块：主要负责相关性打分和排序的实现。

Lucene核心术语：

Term：索引中最小的存储和查询单元。对于英文语境而言，一般是指一个单词；对于中文语境而言，一般是指一个分词后的词。

词典(Term Dictionary)：是 Term的集合。词典的数据结构有很多种，各有优缺点。如可以通过排序数组(通过二分查找来检索数据)、HashMap(哈希表，检索速度更快，属于空间换时间的模式).FST(Finite-State Transducer，有很好的压缩率)等来实现。

倒排表(Posting List)：一篇文章通常由多个词组成，倒排表记录的是某个词在哪些文章中出现过。

正向信息：原始的文档信息，可以用来做排序、聚合、展示等。

段(Segment)：索引中最小的独立存储单元。一个索引文件由一个或者多个段组成。在 Lucene中，段有不变性，段一旦生成，在段上只能读取、不可写入。

1.3 Solr和Elasticsearch对比

Solr是什么？

Solr 是Apache下的一个顶级开源项目，采用lava开发，它是基于Lucene的全文搜索服务器。Sor提供了比Lucene更为丰富的查询语言，同时实现了可配置、可扩展，并对索引、搜索性能进行了优化。

Solr可以独立运行，运行在Jetty、Tomcat等这些Servlet容器中，Solr索引的实现方法很简单，用 POST 方法向Solr服务器发送一个描述 Field 及其内容的 XML文档，Solr根据xml文档添加、删除、更新索。Solr 搜索只需要发送 HTTP GET 求，然后对 Sol返回Xm、ison等格式的查询结果进行解析，组织页面布局。Solr不提供构建UI的功能，Solr提供了一个管理界面，通过管理界面以查询Solr的配置和运行情况。

solr是基于lucene开发企业级搜索服务器，实际上就是封装了lucene。

Solr是一个独立的企业级搜索应用服务器，它对外提供类似于Web-service的AP接口。用户可以通过http请求，向搜索引擎服务器提交一定格式的文件，生成索引;也可以通过提出查找请求，并得到返回结果。

总结：

es安装简单，Solr安装略微复杂。

Solr 利用 Zookeeper 进行分布式管理，而 Elasticsearch 自身带有分布式协调管理功能。

Solr 支持更多格式的数据，比如SON、XML、CSV，而 Elasticsearch 仅支持ison文件格式

Solr官方提供的功能更多，而 Elasticsearch 本身更注重于核心功能，高级功能多有第三方插件提供，例如图形化界面需要kibana来支撑。

Solr 查询快，但更新索引时慢( 即插入删除慢 )，用于电商等查询多的应用。ES建立索引快(即查询慢)，即实时性查询快，用于facebook新浪等搜索。Solr 是传统搜索应用的有力解决方案，但 Elasticsearch 更适用于新兴的实时搜索应用。

Solr比较成熟，有一个更大，更成熟的用户、开发和贡献者社区，而 Elasticsearch相对开发维护者较少，更新太快，学习使用成本较高。

1.4 数据搜索方式

2种数据类型：

结构化数据：一般放入关系数据库(如 MySQL、Oracle 等)，这是因为结构化数据有固定的数据格式和有限个数的字段，因此可以通过二维化的表结构来承载* 。

非结构化数据：一般会放入 MongoDB 中，这是因为非结构化的数据长度不定且无固定数据格式，显然在关系数据库中存储这类数据较为困难。

数据搜索方式：

结构化数据搜索：顺序扫描、关键词精确匹配、关键词部分匹配等。

非结构化数据搜索：顺序扫描和全文检索两种方法。不难看出，对于非结构化数据而言，顺序扫描是效率很低的方法，因此全文检索技术应运而生。

全文检索过程：

在实现全文检索的过程中，一般都需要提取非结构化数据中的有效信息，重新组织数据的承载结构形式。而搜索数据时，需要基于新结构化的数据展开，从而达到提高搜索速度的目的。显而易见，全文检索是一种空间换时间的做法一一前期进行数据索引的创建，需要花费一定的时间和空间，但能显著提高后期搜索的效率。

1.5 搜索引擎

1.5.1 搜索引擎工作流程

搜索引擎的工作原理分两个阶段，网页数据爬取和索引阶段、搜索阶段。

第一阶段，网页数据爬取和索引阶段。包含网络爬虫、数据预处理、数据索引三个主要动作。

第一步，网络爬虫尽可能快、尽可能全地发现和爬取互联网上的网页，爬取到一个新网页后还要继续通过该页面中的链接来爬取其他网页，是个不间断的工作。

第二步，网络爬虫爬取到的网页存入网页库，存入过程中会进行查重检查，因为互联网上的网页有一定的重复性。网页库里存储的网页信息与我们在浏览器看到的页面内容相同。

第三步，网页数据预处理程序不断地从网页库中取出网页进行预处理工作，之后网页就被浓缩成以关键词为核心的内容。

常见的预处理动作：去除噪声内容（版权声明文字、导航条、广告等）、关键词处理(如中文分词、去除停止词)、网页间链接关系计算等。

还有各类文件文档(如 PDF、Word、WPS、XLS、PPT、TXT 等)、多媒体文件(如图片、视频)等，这些内容均需进行相应的数据预处理动作。

第四步，数据预处理后，要进行数据索引过程。索引过程先后经历正向索引和倒排索引阶段，最终建立索引库。随着新的网页等内容不断地被加入网页库，索引库的更新和维护往往也是增量进行的。

第二阶段，搜索阶段。包含搜索关键词、输入内容预处理、搜索关键词查询三个主要动作。

第一步，用户输入的关键词。

第二步，对输入内容进行预处理。比如删除不必要的标点符号、停用词、空格、字符拼写错误识别等，然后进行相关的分词。

第三步，分词后搜索引擎系统将向索引库发出搜索请求。

第四步，索引库会将包含搜索关键词的相关网页从索引库中找出来，搜索引擎根据索引库返回的内容进行排序处理，最终返回给用户。

1.5.2 网络爬虫原理流程

什么是网络爬虫？

网络爬虫是我们常说的的俗称，还有别称诸如网络探测器、Crawler 爬行器、Spider 蜘蛛、Robot 机器人等等，只是网络爬虫或网络蜘蛛的叫法更加生动一点，因为网页爬取程序像虫子和蜘蛛一样在网络间爬来爬去，从一个网页链接爬到另一个网页链接。

网络爬虫方式：

一般采用并行爬取的方式，可以提高爬取效率。

网络爬虫的核心工作：

工作核心是在网页搜集效率、质量和对目标网站的友好程度上。

网络爬虫要用最少的资源、最少的时间，搜集尽可能多的高质量网页，同时对目标网站的内容抓取不影响网站的正常运转和使用。

网络爬虫工作流程：

第一步，网络爬虫在爬取网页时，搜索引擎先会建立两张不同的表。如上图B表记录已经访问过的URL网址，A表记录没有访问过的URL网址。

第二步，当第一个网络爬虫爬取某个外部链接页面 URL 时，会把该网站的URL 下载回来分析，处理好这个 URL 后，将该 URL 存入已经访问过的表中。

第三步，当第二个网络爬虫从其他网站或页面中又发现了这个 URL 时，它会在已访问列表中有对比查看有没有该URL的访问记录。若有，则爬虫程序会自动丢弃该URL，不再访问。

网络爬虫工作策略：

网络爬虫方式有两种，“先深度后广度”和“先广度后深度”。可以把爬取网页的过程想象成一个有向图。

一般采用“先深度后广度”的方式。

网页的收录模式：

全量收集：每次爬取网页都更新全部数据内容。该模式的资源开销大、付出成本高、内容更新的时效性不高、网络宽带消耗高，而且全量更新数据耗时，所以一般定期展开。

增量搜集：这种模式主要用于搜集新网页、搜集更新的网页，删除不存在的页面。当然，相较于全量收集，网络爬虫的系统设计也会复杂一些，但时效性好。

提高网站被抓去的效果方式：

对于网站而言，被各家主流搜索引擎收录是共同的夙愿。所以，网站往往采取一些技术手段告知搜索引擎来抓取内容。

一般网站可以使用SiteMap 。

SiteMap 的核心作用就是向网络抓取工具提供一些提示信息，以便它们更有效地抓取网站。

SiteMap 的最简单实现形式就是 XML 文件。当然，各家搜索引擎定义的 SiteMap 不尽相同，如百度SiteMap 分为三种格式：txt 文本格式、XML格式和 SiteMap 索引格式。

网站管理员还可以结合 SEO(Search Engine Optimization，搜索引擎优化)来改善网站的被抓取效果。

实现网络爬虫的方式：

对软件开发人员来说，我们可以基于现有的爬虫框架来实现对网络数据的爬取。

Java 语言栈的用户可以使用 WebMagicGecco。

Python 语言栈的用户可以使用 Scrapy。

Go 语言栈的用户可以使用YiSpider。

1.5.3 网页分析

网络爬虫将爬取的网页数据存储到网页库，然后网页分析程序将自动对网页进行分析。分析后，网页数据将变成网页中关键词组、链接与关键词的相关度、网页重要程度等信息。

网页分析主要动作：

网页内容摘要：一般由网页正文生成，摘要一般会显示在搜索结果的展示区。

链接分析：链接其实是一种投票、一种信任。网站被主动链接的次数越多，说明互联网环境下其他网站对该网站的投票越多、信任越多，该网站在互联网中越流行。

本质上这就是一种分布式系统下的共识投票。如果将网页间的链接关系视作有向图，则网页的链接关系就会变成入度和出度。入度指网页能通过其他网页的链接来访问；出度指网页中链接了其他网页。因此，入度大网页，说明其被多个网页引用，这也意味着该网页比较权威、比较流行和热门。

网页重要程度计算：用于衡量网站的权威性。

越权威的网站，越容易被其他网站主动链接。网站被引用的次数越多，说明该网站越重要。对搜索引擎而言，在返回相关性强的内容时，应该尽量先返回权威网站的内容；对搜索引擎的用户而言，这样往往更能匹配他们的需要。因此这也是评价搜索引擎体验好坏的核心指标之一。

关键词提取分词：中英文分词差异大，英文分词较简单，中文分词常用算法分两类。一类是基于字典的机械式分词，另一类是基于统计的分词。

基于字典的分词方法：一般会按照一定的策略将待分析的汉字串与一个充分大的词典的词条进行匹配，若在词典中找到某个字符串词条，则匹配成功。所以此种方法的核心是字符串的匹配，分为正向匹配和逆向匹配两种。

正向匹配，指的是在匹配字符串时从左向右匹配。

逆向匹配，是从右向左匹配。

正向或逆向匹配过程中，按匹配长度的不同，还可以细分为最大/最长匹配和最小/最短匹配。

基于字典的分词算法一般常用正向最大匹配、逆向最大匹配，或者是组合模式。

基于统计的分词算法：该算法无须词典，一般会根据汉字与汉字相邻出现的概率来进行分词。因此基于统计的分词算法往往需要构建一个语料库，并不断更新。在分词前，算法需要进行预处理，即对语料库中相邻出现的各个字的组合进行统计，计算两个汉字间的组合概率。

去除噪声：去除如广告、无关的导航条、版权信息、调查问卷等和文章主体内容无关的内容。

内容摘要的生成方式：

静态生成方式：在网页分析阶段即可从网页内容中提取。虽然这种方式“短、平、快”，但缺点也很明显，即当呈现搜索结果时，展示的摘要可能与搜索的关键词无关。

动态生成方式：即根据查询关键词在文档中的位置，提取其周边的文字，并高亮显示。

1.5.4 正排索引和倒排索引

正排索引：

当搜索引擎索引程序提取关键词时，为该页面建立与关键词的对应关系的过程，称做正排索引。

在正排索引中，以网页映射关系为 Key、以分词的列表为 Value。在搜索时是以查询语句的网页映射关系为Key 进行搜索对应的Value值。

倒排索引：

当用户在搜索引擎搜索框中输入关键词时，搜索引擎会把和关键词有关的页面展现给用户，这个过程就叫做倒排索引。

在倒排索引种，是以网页映射关系为 Key、以分词的列表为 Value。在搜索时是以查询语句的分词列表为Key 来进行搜索的。

总结：

索引对象还可以分为基于词的索引，和基于字的索引。

以基于词的索引查询时会更加高效，因为基于词内容比基于字做索引的索引内容少。

倒排索引中有词条(Term)、词典 (Term Dictionary)、倒排表(Post List)三个名词。

词条，是索引里面最小的存储和查询单元。一般来说，在英文语境中词条是一个单词，在中文语境中词条指的是分词后的一个词组。

词典，又称字典，是词条的集合。单词词典一般是由网页或文章集合中出现过的所有词构成的字符串集合。

倒排表，记录的是词出现在哪些文档里、出现的位置和频率等。在倒排表中，每条记录被称为一个倒排项。

词典和倒排表是分两部分存储的，词典存储在内存中，倒排表存储在磁盘上。

二、Elasticsearch基础安装

1.2 概述简介

Elasticsearch 是一个分布式、可扩展、近实时的高性能搜索与数据分析引擎。Elasticsearch基于 Apache Lucene 构建，采用 Java 编写，并使用 Lucene 构建索引、提供搜索功能。

Elasticsearch 的目标是让全文搜索功能的落地变得简单。

特点和优势：

分布式实时文件存储。Elasticsearch 可将被索引文档中的每一个字段存入索引，以便字段可以被检索到。

实时分析的分布式搜索引擎。Elasticsearch 的索引分拆成多个分片，每个分片可以有零个或多个副本。集群中的每个数据节点都可承载一个或多个分片，并且协调和处理各种操作:负载再平衡和路由会自动完成。

高可拓展性。Elasticsearch 可以扩展到上百台服务器，处理 PB 级别的结构化或非结构化数据。

可插拔插件支持。Elasticsearch 支持多种插件，如分词插件、同步插件、Hadoop 插件可视化插件等。

如下图为最新的数据库排名。

2.2 安装

Elasticsearch官网

Elasticsearch官网下载地址

官网kibana下载地址

github es-head下载地址

注意事项：

1.版本选择， ES 7.x 及之前版本，选择 Java 8。
2. ES 8.0版本：Java版本仅支持 Java 17。
3. ES 8.1及以上版本：支持Java 17 以及 Java 18，建议 Java 17，因为对应版本的 Logstash 不支持 Java 18。

2.2.1 Windows安装

2.2.1.1 安装ES

准备好以下安装包。

es依赖java环境，所以也要提前装好java环境，高版本已经内置了java环境。

解压es安装包。

各目录释义：

bin ：可执行脚本文件，包括es服务启动、插件管理、函数命令等等。

config ：配置文件目录，如elasticsearch.yml（ES 配置文件）、jvm.options（java虚拟机相关配置文件）、log4j2.properties（日志配置文件）等等。

jdk ： 7.x版本之后才有的目录，自带内置的 JDK环境。

lib ： es依赖的java库。

logs ：默认日志文件储存路径。

modules ： ES 所有功能模块，如Cluster、Discovery、Indices、X-pack 等等。

plugins ： ES 已经安装的插件，默认没有插件，所以刚开始是空的。

data ：默认数据存放目录，包含节点、分片、索引、文档的所有数据。

2.进入bin目录，双击elasticsearch.bat，启动服务。和7.x 版本不同的是，ES 8.x 启动之后会输出以下信息，此时服务已经启动成功了，而7.x版本启动时控制台输出 started 时代表服务启动成功。

3.网页访问显示需要输入账号密码。在es7.0版本之后的安装包默认自带了xpack开启密码校验功能。

4.进入bin目录，为elasticsearch内部用户创建随机密码。也可以重置密码。

elasticsearch-setup-passwords auto

#重置密码命令。
elasticsearch-reset-password -u elastic -i

5.用新账户密码再次登录成功。

2.2.1.2 基础设置

2.2.1.2.1 关闭geoip数据库更新

1.我们再回过头来看日志，这里有个报错，是因为启动时会更新地图的一些数据库，关闭geoip数据库的更新操作即可。

2.修改es配置文件，添加如下一行。

vim elasticsearch.yml

#关闭geoip数据库更新。
ingest.geoip.downloader.enabled: false

2.重启es，之后就没有了。

3.密码可以访问web端。

2.2.1.2.2 关闭es密码登录

高版本的es代码里内置默认开启密码登录，我这里测试就去掉密码登录，省事。

1.修改es配置文件，添加如下两行。

vim elasticsearch.yml

#关闭es密码登陆设置。
xpack.security.enabled: false
xpack.security.transport.ssl.enabled: false

2.重启es，再次访问web端就不需要密码了。

2.2.1.2.3 设置特定IP访问

1.前面访问都是使用本地主机环回地址访问，若要使用特定IP访问需要修改es配置文件，对如下参数进行修改。

# 为es实例绑定特定的IP地址，若设置成0.0.0.0，则监听本地所有IPV4地址。
network.host: 192.168.0.100

#为es实例设置特定的端口
http.port: 9200

#集群配置项，用于启动当前节点时，发现其他节点的初始列表。必须开启，因为es单节点自认为主节点。
discovery.seed_hosts: ["192.168.0.100"]

2.重启es，此时就可以通过特定IP访问。

2.2.1.2 安装es-head插件

es-head依赖nodejs环境编译，需要提前准备。

nodejs下载地址

1.直接点击node-v18.13.0-x64.msi程序，安装完成后可以通过node -v查看版本，能查看到则安装成功。

2.解压es-head安装包，查看package.json文件可以看到，需要安装依赖服务。

3.安装依赖服务。直接使用npm install安装会报错，版本导致，可以用cnpm install来安装。

# 网上都是说是npm install可以安装，但是异常慢。
1.安装cnpm。
npm install -g cnpm --registry=https://registry.npm.taobao.org

2.安装依赖。
cnpm install

4.启动服务，访问网页，但连接会有跨域问题。

npm run start

5.配置elasticsearch.yml文件，添加如下三行，解决跨域问题，并允许使用密码连接。

http.cors.enabled: true  #启用http端口，允许跨源REST请求。
http.cors.allow-origin: "*"   #允许所有人请求。
http.cors.allow-headers: Authorization,X-Requested-With,Content-Type,Content-Length   #es设置安全密码后，es-head允许使用密码访问。

6.重启es，使用密码连接。

http://localhost:9100/?auth_user=es_user&auth_password=es_password

2.2.1.3 安装Kibana

初识ELK：

ELK是Elasticsearch、Logstash、 Kibana三大开源框架首字母大写简称，市面上也被成为Elastic Stack。

Elasticsearch是一个基于Lucene、分布式、通过Restful方式进行交与的近实时搜索平台框架。像类似百度、谷歌这种大数据全文搜索引警的场景都可以使用Elasticsearch作为底层支持架，可见Elasticsearch提供的搜索能力确实强大,市面上很多时候我们简称Elasticsearch为es。

Logstash是ELK的中央数据流引擎，用于从不同目标( 文件/数据存储/MQ)收集的不同格式数据，经过过滤后支持输出到不同目的地(文件/MQ/redis/elasticsearch/kafka等 )。

Kibana是一个针对Elasticsearch的开源分析及可视化平台，用来搜索、查看交互存储在Elasticsearch索引中的数据。使用Kibana可以通过各种图表进行高级数据分析及展示。Kibana让海量数据更容易理解。操作简单，基于浏览器的用户界面可以快速创建仪表板( dashboard)实时显示Elasticsearch查询动态。

Kibana官网

1.下载解压kibana安装包。注意ELK三组件版本需要一致，并且也依赖node.js环境。

2.进入bin目录启动kibana.bat文件会发现报错，原因是不能使用localhost来访问，需要修改成固定IP地址。

3.修改kibana配置文件，填写成固定IP。

4.再次启动，访问web端。

也可以修改配置文件，用固定IP来访问。

2.2.1.3.1 汉化设置

1.kibana支持汉化，可以在以下目录看到有个中文包。

2.在kibana配置文件添加汉化设置，i18n.locale: “zh-CN”。

3.重启kibana，再次登录网页，就是汉字了。

2.2.2 Linux安装

2.2.2.1 安装es

1.不需要安装java环境。

注意事项：

es依赖jdk环境，现在高版本的es压缩包中自带有jdk。

若已提前安装了jdk环境，则es启动时，会优先找linux中的jdk。若此时jdk的版本不一致，就会造成jdk不能正常运行。

所以，若Linux服务本来没有配置jdk，则会直接使用es目录下默认的jdk，反而不会报错。

2.创建用户，不然直接使用root用户启动会报错。

[root@localhost elasticsearch-8.5.2]# useradd es-qingjun
[root@localhost elasticsearch-8.5.2]# chown es-qingjun:es-qingjun -R /opt/elasticsearch-8.5.2/

3.切换至创建的用户，启动es，可以看到有个初始密码。因为8版本开始默认开启ssl认证的，可以使用https登录web端。

[root@localhost elasticsearch-8.5.2]# su es-qingjun
[es-qingjun@localhost elasticsearch-8.5.2]$ ./bin/elasticsearch

日志释义：

es首次启动时，会自动进行安全设置。
第一步：为传输层和 HTTP 层生成 TLS 证书和密钥。
第二步：TLS 配置设置被写入elasticsearch.yml
第三步：为 elastic 用户生成密码。
第四步：为 Kibana 生成一个注册令牌。

高亮白色字体释义：

第一串高亮白色字符：ES给elastic账户设置的默认密码，需要记下来。

第二串高亮白色字符：CA证书的密钥信息。

第三串高亮白色字符：ES给Kibana生成的访问令牌，Kibana访问ES服务需要用到这个。

4.如果不想使用密码登录，可以进入es配置文件关闭ssl认证，再重启es。

[es-qingjun@localhost elasticsearch-8.5.2]$ vim config/elasticsearch.yml
xpack.security.enabled: false  #该参数修改成false。

[es-qingjun@localhost elasticsearch-8.5.2]$ ./bin/elasticsearch

2.2.2.2 安装es-head

1.安装node.js环境，注意版本不要太高，不然会跟linux本身的依赖库包版本冲突报错。

[root@localhost bck]# tar zxf node-v16.9.0-linux-x64.tar.gz 
[root@localhost bck]# mv node-v16.9.0-linux-x64 /usr/local/node

[root@localhost bck]# tail -2 /etc/profile
export node_home=/usr/local/node
export PATH=$node_home/bin:$PATH

[root@localhost bck]# source /etc/profile
[root@localhost bck]# node -v
v16.9.0

2.解压es-head安装包，安装依赖。注意这里需要进入解压出来的目录里执行命令。

#安装cnpm
[root@localhost elasticsearch-head-5.0.0]# npm install -g cnpm --registry=https://registry.npm.taobao.org

#安装依赖
[root@localhost elasticsearch-head-5.0.0]# cnpm install

3.启动es-head

[root@localhost elasticsearch-head-5.0.0]# npm run start

4.访问页面。

5.修改es配置文件，添加如下两行，解决跨域问题。

[root@localhost elasticsearch-8.5.2]# vi config/elasticsearch.yml 
http.cors.enabled: true
http.cors.allow-origin: "*"

6.重启es，es-head就可以连接es了。

2.2.2.3 安装kibana

1.解压安装包，修改配置文件。

[root@localhost bck]# tar zxf kibana-8.5.2-linux-x86_64.tar.gz -C ../
[root@localhost bck]# cd ../kibana-8.5.2/

[root@localhost kibana-8.5.2]# vi config/kibana.yml
server.host: "192.168.130.140"    #修改成固定IP。
elasticsearch.hosts: ["http://192.168.130.140:9200"]   #修改es固定IP。
i18n.locale: "zh-CN"  #汉化。

2.启动kibana，访问网页。

#kibana不能使用root用户启动，可以加这个参数启动，也可以新建一个用户，并对安装目录修改权限。

#方式一：
[root@localhost kibana-8.5.2]# ./bin/kibana --allow-root


#方式二：
[root@localhost kibana-8.5.2]# chmod kibana
[root@localhost kibana-8.5.2]# chown kibana:kibana -R /opt/kibana-8.5.2/
[root@localhost kibana-8.5.2]# su - kibana
[kibana@localhost ~]$ cd /opt/kibana-8.5.2/
[kibana@localhost kibana-8.5.2]$ ./bin/kibana

你可能感兴趣的:(elasticsearch,elasticsearch,大数据,linux,运维)

麒麟系统使用-进行.NET开发 mystonelxj 麒麟系统 .net 麒麟系统控制台及web
文章目录前言一、搭建dotnet环境1.获取相关资源2.配置dotnet二、使用dotnet三、其他说明总结前言麒麟系统的内核是基于linux的，如果需要进行.NET开发，则需要安装特定的应用。由于NETFramework是仅适用于Windows版本的.NET，所以要进行.NET开发需要特定的安装及配置。使用.NET方式与在windows环境下使用有些出入。本文将细致讲解在如何在麒麟系统中使用.N
【DeepSeek实战】3、Ollama实战指南：LobeChat+多网关架构打造高可用大模型集群无心水 Ollama实战指南 LobeChat实战 DeepSeek实战 DeepSeek全栈应用开发 AI入门大模型 CSDN技术干货
一、企业级大模型集群架构全景解析在人工智能落地应用的过程中，大模型服务的高可用性、成本控制和灵活扩展能力成为企业关注的核心痛点。本方案通过LobeChat前端、AI网关层和Ollama模型集群的三层架构设计，实现了无需复杂运维即可部署的生产级大模型服务体系。该架构不仅支持负载均衡、故障转移和模型热切换等企业级特性。还通过量化技术将硬件成本降低60%以上，为中小企业提供了与商业云服务相当的性能体验。
Mariadb-Server的二进制安装 linux土老帽 linux土老帽 mariadb linux centos
搭建环境：OS:centos7.6版本mariadb:mariadb-10.2.25-linux-x86_64.tar.gz#下载地址：DownloadMariaDBServer-MariaDB.org1.创建用户组useradd-r-s/sbin/nologin-d/data/mysqlmysql#创建用户-r系统账户-s指定shell/sbin/nologin-d指定家目录但是不创建原因是系统
MySql主从备份Slave 甚享享 mysql 数据库
Mysql主从备份可以在除主服务器外的其他服务器是部署从库，用于实时备份生产环境数据，核心是mysql的log-bin日志（二进制日志），主库开启bin日志后，从库通过日志同步(SlaveI/O)和回放(SlaveSQL)实现数据同步.因为设置主从备份时，需要指定主库lob-bin日志运行行数，所以之前的数据需要通过“数据同步”或者手动同步完成修改配置文件Linux:my.cnfWindows:m
Mysql 主从备份龙那个猫robot 数据库 mysql
英文好的可以直接去mysql官网查看https://dev.mysql.com/doc/refman/5.7/en/replication.html1环境准备我这里准备两套linux虚拟机，主mysql服务器,从mysql服务区ip192.168.1.30ip192.168.1.1001.1备份主mysql数据库1.2从数据库恢复主mysql数据库1.3配置主mysql服务器配置server-id
让一个程序在后台运行 Hi_kenyon python linux 网络
PartI:如何让一个程序在后台运行，在关闭终端的时候，命令或者进行不会被中断在Linux上，如果你希望一个命令在后台持续运行，即使你关闭终端，它不会被终止，有几种常用的方法可以实现这个目的：方法一：使用nohupnohup（nohangup）命令可以让进程忽略挂起（HUP）信号，这样即使关闭终端也不会结束。nohupyour-command>output.log2>&1&your-command
ubuntu切换目录命令 Joel Jin ubuntu ubuntu linux
UbuntuLinux命令查看目录信息1.切换目录命令的使用cd~效果:cd..效果:cd.效果cd-效果1.切换目录命令的使用命令说明cd目录切换到指定目录cd~切换到当前用户的主目录cd…两个点切换到上一级目录cd.切换到当前目录cd-切换到上一次目录cd~效果:root@root1:~#cd/etc/acpiroot@root1:/etc/acpi#cd~root@root1:~#cd…效果
linux服务器上创建一个文件需要授权一次的问题根源：umask qq_30024063 linux 运维服务器
umask命令用于设置文件的默认权限掩码。文件的权限掩码决定了新建文件的默认权限。umask命令的语法如下：umask[-S][模式]其中，-S选项用于以符号方式显示当前的权限掩码。模式表示要设置的新的权限掩码，可以使用八进制或者符号两种方式。在Linux系统中，每个文件都有三个属性：所有者权限、所属组权限和其他用户权限。每个属性有读、写和执行三个权限，分别用r、w和x表示。对于每一个属性，权限可
如何用Docker部署Mysql 小楠小楠小楠 docker mysql 容器
1.安装Docker确保已安装Docker，并启动Docker服务。Linux：bash复制sudoaptupdatesudoaptinstalldocker.iosudosystemctlstartdockersudosystemctlenabledocker2.拉取MySQL镜像从DockerHub拉取官方MySQL镜像。bash复制dockerpullmysql:latest3.启动MySQ
瑞芯微RK3506工业芯片实例方案解析：从架构到场景的深度实践淡远-九鼎创展科技架构嵌入式硬件人工智能电脑
一、芯片技术架构解析瑞芯微RK3506作为2024年第四季度推出的工业级MPU，采用三核Cortex-A7（1.5GHz）+单核Cortex-M0（200MHz）的异构架构，形成独特的"3+1"处理核心组合。这种设计通过AMP多核调度技术，实现了Linux、RTOS、Bare-metal系统的混合运行，典型配置如"2×A7运行Linux（HMI交互）+1×A7运行RTOS（协议处理）+M0裸机（实
【网络】Linux 内核优化实战 - net.core.rmem_max 锅锅来了 Linux性能优化原理和实战网络 linux 运维
目录参数作用与原理默认值与查看方法调整场景与方法适用场景调整方法与其他参数的协同性能影响与注意事项典型案例总结net.core.rmem_max是Linux内核中控制套接字接收缓冲区（ReceiveBuffer）最大允许值的参数。它与net.core.rmem_default（默认值）共同决定了网络数据接收的性能上限和内存使用策略。以下是详细解析：参数作用与原理核心功能：限制单个套接字接收缓冲区的
RK3566系统移植 | 基于rk-linux-sdk移植uboot（2017.09） Mculover666 linux
文章目录一、测试已有的配置二、移植到fireflyROC-RK3566开发板1.新建单板2.新建设备树3.编译4.测试一、测试已有的配置查看rksdk中提供的uboot中对于rk3566的配置：rk3566.config内容如下：CONFIG_BASE_DEFCONFIG="rk3568_defconfig"CONFIG_LOADER_INI="RK3566MINIALL.ini"因为rk3566
Linux I/O 文件操作详解：从系统调用到实际工程应用平凡灵感码头 linux学习 linux 运维服务器
一、写在前面在Linux或任何类Unix操作系统中，文件是一切的核心——无论是硬盘上的文本文件，还是串口设备、GPIO寄存器、甚至网络接口，几乎都被抽象为“文件”。理解Linux下的I/O文件操作机制，不仅是嵌入式开发的基础，也是进行系统编程与底层控制的关键。二、I/O的本质：一切皆文件Linux将外设抽象成文件的方式，统一了对各种资源的操作模型。你可以用open打开串口设备/dev/ttyS0，
【网络】Linux 内核优化实战 - net.ipv4.tcp_rmem 和 net.core.rmem_default 关系锅锅来了 Linux性能优化原理和实战网络 linux tcp/ip
net.ipv4.tcp_rmem和net.core.rmem_default都是Linux内核中控制网络接收缓冲区的参数，但它们的作用范围、优先级和使用场景存在明显区别。以下是详细对比：核心区别参数net.ipv4.tcp_rmemnet.core.rmem_default作用协议仅针对TCP协议针对所有网络协议（TCP、UDP等）参数类型三元组：mindefaultmax单个值：默认缓冲区大小
Memfault 简介及在Nordic nRF91 系列 DK的应用
1：Memfault是一个云平台，它允许您和您的团队持续监控设备、调试固件问题，并将OTA更新部署到您的设备群，从而以软件的速度交付硬件产品。Memfault以嵌入式优先：支持运行在任何实时操作系统（RTOS）或Android、Linux等操作系统上的嵌入式系统和设备它适用于任何设备：从功能强大的SoC一直到功能受限的MCU，Memfault都能适配您设备的可用闪存、RAM和带宽我们的SDK是专为
Linux ps 指令 halugin Linux指令 linux 运维
Linuxps指令ps（ProcessStatus）是Linux系统中用于查看进程状态的核心命令行工具。它提供系统当前运行进程的快照，显示进程ID、CPU和内存使用情况、运行状态等信息。作为系统管理员或开发人员，ps是监控系统资源、排查性能问题和管理系统进程的必备工具。其灵活的选项和输出格式使其适用于从简单查询到复杂分析的各种场景。什么是ps指令？概述ps是一个经典的Linux/Unix命令，用于
Linux netstat 指令 halugin Linux指令 linux 运维
Linuxnetstat指令netstat（NetworkStatistics）是Linux系统中用于查看网络状态、连接、路由表和接口统计信息的经典命令行工具。它为系统管理员和开发人员提供了强大的网络诊断功能，帮助分析网络连接、监控流量以及排查网络问题。尽管在现代Linux系统中，netstat正在被更新的工具（如ss）部分取代，但其简单性和广泛适用性使其仍然是许多场景下的首选工具。什么是nets
Linux ss 指令 halugin Linux指令 linux 运维
Linuxss指令ss（SocketStatistics）是Linux系统中用于显示网络套接字（socket）信息的现代命令行工具，是netstat的继任者，性能更高、输出更简洁。它提供详细的网络连接、监听端口和协议统计信息，广泛用于网络监控、故障排查和性能分析。相比传统的netstat，ss直接从内核获取数据显示更快，功能更强大，适合现代Linux系统。什么是ss指令？ss是Linux系统中的一
三阶落地：腾讯云Serverless+Spring Cloud的微服务实战架构大熊计算机 #腾讯云架构腾讯云 serverless
云原生演进的关键挑战（1）传统微服务架构痛点资源利用率低（非峰值期资源闲置率>60%）运维复杂度高（需管理数百个容器实例）突发流量处理能力弱（扩容延迟导致P99延迟飙升）（2）Serverless的破局价值腾讯云SCF（ServerlessCloudFunction）提供：毫秒级计费粒度（成本下降40%~70%）百毫秒级弹性伸缩（支持每秒万级并发扩容）零基础设施运维同步调用异步事件用户请求API网
大数据面试必备：Kafka性能优化 Producer与Consumer配置指南
Kafka面试题-在Kafka中，如何通过配置优化Producer和Consumer的性能?回答重点在Kafka中，通过优化Producer和Consumer的配置，可以显著提高性能。以下是一些关键配置项和策略：1、Producer端优化:batch.size：批处理大小。增大batch.size可以使Producer每次发送更多的消息，但要注意不能无限制增大，否则会导致内存占用过多。linger
Linux操作系统，故障排查月堂 linux 运维服务器
案例1：GRUB引导故障故障现象：系统启动卡在"GRUB>"提示符，无法进入系统原因分析：GRUB配置文件损坏（/boot/grub/grub.cfg）引导文件被误删或磁盘损坏解决步骤：在GRUB命令行依次执行：insmodxfssetroot=(hd0,msdos1)linux/vmlinuz-root=/dev/sda1initrd/initramfs-.imgboot进入系统后执行：grub
linux mysql命令行操作
命令行,linux,命令行操作相关学习资料：https://edu.51cto.com/video/797.htmlhttps://edu.51cto.com/video/1400.htmlhttps://edu.51cto.com/video/3832.htmlLinuxMySQL命令行操作入门指南作为一名刚入行的开发者，掌握Linux系统下的MySQL命令行操作是一项基本技能。本文将带你一步步
Ansible——lookup,过滤器凤凰战士芭比Q Ansible ansible linux
文章目录Ansible——lookup,过滤器lookup读取文件lookup生成随机密码lookup读取环境变量lookup读取Linux命令的执行结果lookup读取template变量替换后的文件lookup读取配置文件lookup读取DNS解析的值过滤器过滤器使用的位置过滤器对普通变量的操作过滤器对文件路径的操作过滤器对字符串变量的操作过滤器对JSON的操作过滤器对数据结构的操作过滤器的链
【linux】yum工具篇 nanguochenchuan Linux操作系统 linux 运维服务器
Yum工具概述Yum（YellowdogUpdaterModified）是RedHat系列Linux发行版（如CentOS、Fedora）中最核心的软件包管理工具，它基于RPM包管理系统构建，通过自动解决依赖关系极大简化了软件管理流程。与直接使用rpm命令相比，Yum能自动处理软件包依赖，让系统管理员从"依赖地狱"中解脱出来。Yum工作原理深度解析Yum的工作流程可分为四个关键阶段：仓库配置读取：
Linux命令行基础：常用命令与技巧 m0_73843831 chrome 前端 Linux 命令行常用命文件操作权限管理
1.Linux命令行概述Linux命令行（也称为终端或Shell）是Linux操作系统中与用户交互的文本界面。通过命令行，用户可以执行各种任务，如文件管理、进程控制、系统配置等。相比图形用户界面（GUI），命令行具有更高的效率和灵活性，尤其适用于服务器管理和自动化任务。本文将涵盖以下内容：常用命令文件与目录操作权限管理进程管理命令行技巧2.常用命令2.1文件与目录操作ls功能：列出当前目录下的文件
Linux tcp_info：监控TCP连接的秘密武器 CodeWithMe 网络 linux tcp/ip
深入解析Linuxtcp_info：TCP状态的实时监控利器在开发和运维网络服务时，我们常常遇到这些问题：我的TCP连接为什么速度慢？是发生了重传，还是窗口太小？拥塞控制到底有没有生效？这些问题的答案，其实隐藏在内核的tcp_info结构中。本文将详细介绍：tcp_info是什么，怎么用？各字段含义和实际用途在调优TCP服务中的应用实践一、什么是tcp_info？tcp_info是Linux内核中
【Linux】ghb工具 nanguochenchuan Linux操作系统 linux 运维服务器
GDB简介GDB（GNUDebugger）是Linux系统中最强大的命令行调试工具，由GNU项目开发。作为程序员调试C/C++程序的利器，GDB能帮助你：定位程序崩溃原因分析程序运行状态跟踪变量值变化检测内存错误安装与配置安装方法#Ubuntu/Debiansudoaptinstallgdb#CentOS/RHELsudoyuminstallgdb#ArchLinuxsudopacman-Sgdb
Linux命令行操作基础 EnigmaCoder Linux linux 运维服务器
目录前言目录结构✍️语法格式操作技巧Tab补全光标操作基础命令登录和电源管理命令⚙️login⚙️last⚙️exit⚙️shutdown⚙️halt⚙️reboot文件命令⚙️浏览目录类命令pwdcdls⚙️浏览文件类命令catmorelessheadtail⚙️目录操作类命令mkdirrmdir⚙️文件操作类命令mvrmtouchfindgziptar⚙️cp前言大家好！我是EnigmaCod
图扑软件智慧云展厅，开启数字化展馆新模式智慧园区可视化 5g 人工智能大数据安全云计算
随着疫情的影响以及新兴技术的不断发展，展会的发展形式也逐渐从线下转向线上。通过“云”上启动、云端互动、双线共频的形式开展。通过应用大数据、人工智能、沉浸式交互等多重技术手段，构建数据共享、信息互通、精准匹配的高精度“云展厅”，突破时空壁垒限制。图扑软件运用HT强大的渲染功能，数字孪生“云展位”，1:1复现实际展厅内部独特的结构造型和建筑特色。也可以第一人称视角漫游，模拟用户在展厅内的参观场景，在保
go关闭linux进程,Golang信号处理和优雅退出守护进程凯然 go关闭linux进程
Golang中的信号处理信号类型个平台的信号定义或许有些不同。下面列出了POSIX中定义的信号。Linux使用34-64信号用作实时系统中。命令mansignal提供了官方的信号介绍。在POSIX.1-1990标准中定义的信号列表信号值动作说明SIGHUP1Term终端控制进程结束(终端连接断开)SIGINT2Term用户发送INTR字符(Ctrl+C)触发SIGQUIT3Core用户发送QUIT
矩阵求逆（JAVA）利用伴随矩阵 qiuwanchi 利用伴随矩阵求逆矩阵
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(利用伴随矩阵) * @author 邱万迟
单例（Singleton）模式 aoyouzi 单例模式 Singleton
3.1 概述如果要保证系统里一个类最多只能存在一个实例时，我们就需要单例模式。这种情况在我们应用中经常碰到，例如缓存池，数据库连接池，线程池，一些应用服务实例等。在多线程环境中，为了保证实例的唯一性其实并不简单，这章将和读者一起探讨如何实现单例模式。 3.2
[开源与自主研发]就算可以轻易获得外部技术支持,自己也必须研发 comsci 开源
现在国内有大量的信息技术产品，都是通过盗版，免费下载，开源，附送等方式从国外的开发者那里获得的。。。。。。虽然这种情况带来了国内信息产业的短暂繁荣，也促进了电子商务和互联网产业的快速发展，但是实际上，我们应该清醒的看到，这些产业的核心力量是被国外的
页面有两个frame,怎样点击一个的链接改变另一个的内容 Array_06 UI XHTML
<a src="地址" targets="这里写你要操作的Frame的名字" />搜索然后你点击连接以后你的新页面就会显示在你设置的Frame名字的框那里 targerts="",就是你要填写目标的显示页面位置 ===================== 例如： <frame src=&
Struts2实现单个/多个文件上传和下载 oloz 文件上传 struts
struts2单文件上传：步骤01:jsp页面  　　<form action="fileUplo
推荐10个在线logo设计网站 362217990 logo
在线设计Logo网站。 1、http://flickr.nosv.org（这个太简单） 2、http://www.logomaker.com/?source=1.5770.1 3、http://www.simwebsol.com/ImageTool 4、http://www.logogenerator.com/logo.php?nal=1&tpl_catlist[]=2 5、ht
jsp上传文件香水浓 jsp fileupload
1. jsp上传 Notice： 1. form表单 method 属性必须设置为 POST 方法，不能使用 GET 方法 2. form表单 enctype 属性需要设置为 multipart/form-data 3. form表单 action 属性需要设置为提交到后台处理文件上传的jsp文件地址或者servlet地址。例如 uploadFile.jsp 程序文件用来处理上传的文
我的架构经验系列文章 - 前端架构 agevs JavaScript Web 框架 UI jQuer
框架层面：近几年前端发展很快，前端之所以叫前端因为前端是已经可以独立成为一种职业了，js也不再是十年前的玩具了，以前富客户端RIA的应用可能会用flash/flex或是silverlight，现在可以使用js来完成大部分的功能，因此js作为一门前端的支撑语言也不仅仅是进行的简单的编码，越来越多框架性的东西出现了。越来越多的开发模式转变为后端只是吐json的数据源，而前端做所有UI的事情。MVCMV
android ksoap2 中把XML(DataSet) 当做参数传递 aijuans android
我的android app中需要发送webservice ，于是我使用了 ksop2 进行发送，在测试过程中不是很顺利,不能正常工作.我的web service 请求格式如下 [html] view plain copy <Envelope xmlns="http://schemas.
使用Spring进行统一日志管理 + 统一异常管理 baalwolf spring
统一日志和异常管理配置好后，SSH项目中，代码以往散落的log.info() 和 try..catch..finally 再也不见踪影！统一日志异常实现类： [java] view plain copy package com.pilelot.web.util; impor
Android SDK 国内镜像 BigBird2012 android sdk
一、镜像地址： 1、东软信息学院的 Android SDK 镜像，比配置代理下载快多了。配置地址， http://mirrors.neusoft.edu.cn/configurations.we#android 2、北京化工大学的： IPV4:ubuntu.buct.edu.cn IPV4:ubuntu.buct.cn IPV6:ubuntu.buct6.edu.cn
HTML无害化和Sanitize模块 bijian1013 JavaScript AngularJS Linky Sanitize
一.ng-bind-html、ng-bind-html-unsafe AngularJS非常注重安全方面的问题，它会尽一切可能把大多数攻击手段最小化。其中一个攻击手段是向你的web页面里注入不安全的HTML，然后利用它触发跨站攻击或者注入攻击。考虑这样一个例子，假设我们有一个变量存
[Maven学习笔记二]Maven命令 bit1129 maven
mvn compile compile编译命令将src/main/java和src/main/resources中的代码和配置文件编译到target/classes中，不会对src/test/java中的测试类进行编译 MVN编译使用 maven-resources-plugin:2.6:resources maven-compiler-plugin:2.5.1:compile &nbs
【Java命令二】jhat bit1129 Java命令
jhat用于分析使用jmap dump的文件，，可以将堆中的对象以html的形式显示出来，包括对象的数量，大小等等，并支持对象查询语言。 jhat默认开启监听端口7000的HTTP服务，jhat是Java Heap Analysis Tool的缩写 1. 用法： [hadoop@hadoop bin]$ jhat -help Usage: jhat [-stack <bool&g
JBoss 5.1.0 GA:Error installing to Instantiated: name=AttachmentStore state=Desc ronin47
进到类似目录 server/default/conf/bootstrap，打开文件 profile.xml找到： Xml代码<bean name="AttachmentStore" class="org.jboss.system.server.profileservice.repository.AbstractAtta
写给初学者的6条网页设计安全配色指南 brotherlamp UI ui自学 ui视频 ui教程 ui资料
网页设计中最基本的原则之一是，不管你花多长时间创造一个华丽的设计，其最终的角色都是这场秀中真正的明星——内容的衬托我仍然清楚地记得我最早的一次美术课，那时我还是一个小小的、对凡事都充满渴望的孩子，我摆放出一大堆漂亮的彩色颜料。我仍然记得当我第一次看到原色与另一种颜色混合变成第二种颜色时的那种兴奋，并且我想，既然两种颜色能创造出一种全新的美丽色彩，那所有颜色
有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。写一个函数实现。复杂度是什么。 bylijinnan java 算法面试
import java.util.Random; import java.util.Set; import java.util.TreeSet; /** * http://weibo.com/1915548291/z7HtOF4sx * #面试题#有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。 * 写一个函数实现。复杂度是什么
struts2获得request、session、application方式 chiangfai application
1、与Servlet API解耦的访问方式。 a.Struts2对HttpServletRequest、HttpSession、ServletContext进行了封装，构造了三个Map对象来替代这三种对象要获取这三个Map对象，使用ActionContext类。 -----> package pro.action; import java.util.Map; imp
改变python的默认语言设置 chenchao051 python
import sys sys.getdefaultencoding() 可以测试出默认语言，要改变的话，需要在python lib的site-packages文件夹下新建： sitecustomize.py，这个文件比较特殊，会在python启动时来加载，所以就可以在里面写上： import sys sys.setdefaultencoding('utf-8') &n
mysql导入数据load data infile用法 daizj mysql 导入数据
我们常常导入数据！mysql有一个高效导入方法，那就是load data infile 下面来看案例说明基本语法： load data [low_priority] [local] infile 'file_name txt' [replace | ignore] into table tbl_name [fields [terminated by't'] [OPTI
phpexcel导入excel表到数据库简单入门示例 dcj3sjt126com PHP Excel
跟导出相对应的，同一个数据表，也是将phpexcel类放在class目录下，将Excel表格中的内容读取出来放到数据库中 <?php error_reporting(E_ALL); set_time_limit(0); ?> <html> <head> <meta http-equiv="Content-Type"
22岁到72岁的男人对女人的要求 dcj3sjt126com
22岁男人对女人的要求是：一，美丽，二，性感，三，有份具品味的职业，四，极有耐性，善解人意，五，该聪明的时候聪明，六，作小鸟依人状时尽量自然，七，怎样穿都好看，八，懂得适当地撒娇，九，虽作惊喜反应，但看起来自然，十，上了床就是个无条件荡妇。 32岁的男人对女人的要求，略作修定，是：一，入得厨房，进得睡房，二，不必服侍皇太后，三，不介意浪漫蜡烛配盒饭，四，听多过说，五，不再傻笑，六，懂得独
Spring和HIbernate对DDM设计的支持 e200702084 DAO 设计模式 spring Hibernate 领域模型
A：数据访问对象 DAO和资源库在领域驱动设计中都很重要。DAO是关系型数据库和应用之间的契约。它封装了Web应用中的数据库CRUD操作细节。另一方面，资源库是一个独立的抽象，它与DAO进行交互，并提供到领域模型的“业务接口”。资源库使用领域的通用语言，处理所有必要的DAO，并使用领域理解的语言提供对领域模型的数据访问服务。
NoSql 数据库的特性比较 geeksun NoSQL
Redis 是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。目前由VMware主持开发工作。 1. 数据模型作为Key-value型数据库，Redis也提供了键（Key）和值（Value）的映射关系。除了常规的数值或字符串，Redis的键值还可以是以下形式之一： Lists （列表） Sets
使用 Nginx Upload Module 实现上传文件功能 hongtoushizi nginx
转载自： http://www.tuicool.com/wx/aUrAzm 普通网站在实现文件上传功能的时候，一般是使用Python，Java等后端程序实现，比较麻烦。Nginx有一个Upload模块，可以非常简单的实现文件上传功能。此模块的原理是先把用户上传的文件保存到临时文件，然后在交由后台页面处理，并且把文件的原名，上传后的名称，文件类型，文件大小set到页面。下
spring-boot-web-ui及thymeleaf基本使用 jishiweili spring thymeleaf
视图控制层代码demo如下： @Controller @RequestMapping("/") public class MessageController { private final MessageRepository messageRepository; @Autowired public MessageController(Mes
数据源架构模式之活动记录 home198979 PHP 架构活动记录数据映射
hello!架构一、概念活动记录（Active Record）：一个对象，它包装数据库表或视图中某一行，封装数据库访问，并在这些数据上增加了领域逻辑。对象既有数据又有行为。活动记录使用直截了当的方法，把数据访问逻辑置于领域对象中。二、实现简单活动记录活动记录在php许多框架中都有应用，如cakephp。 <?php /** * 行数据入口类 *
Linux Shell脚本之自动修改IP pda158 linux centos Debian 脚本
作为一名 Linux SA，日常运维中很多地方都会用到脚本，而服务器的ip一般采用静态ip或者MAC绑定，当然后者比较操作起来相对繁琐，而前者我们可以设置主机名、ip信息、网关等配置。修改成特定的主机名在维护和管理方面也比较方便。如下脚本用途为：修改ip和主机名等相关信息，可以根据实际需求修改，举一反三！ #!/bin/sh #auto Change ip netmask ga
开发环境搭建独浮云 eclipse jdk tomcat
最近在开发过程中，经常出现MyEclipse内存溢出等错误，需要重启的情况，好麻烦。对于一般的JAVA+TOMCAT项目开发，其实没有必要使用重量级的MyEclipse，使用eclipse就足够了。尤其是开发机器硬件配置一般的人。 &n