sas???

[全文检索]Lucene基础入门.

本打算直接来学习Solr, 现在先把Lucene的只是捋一遍.
本文内容:

1、搜索引擎的发展史

2、 Lucene入门

3、 Lucene的API详解

4、索引调优

5、 Lucene搜索结果排名规则

1 搜索引擎的发展史

1.1 搜索引擎的发展史

萌芽：Archie、Gopher

起步：Robot（网络机器人）和spider（网络爬虫）

1、 Robot：网络机器人，自动在网络中运行，完成特定任务的程序，如刷票器、抢票软件等。

2、 spider：网络爬虫，是一中特殊的机器人，抓取（下载）并分析网络资源，包括网页里面的超链接、图片、数据库、音频、视频等资源信息。

发展：excite、galaxy、yahoo

繁荣：infoseek、altavista、Google、百度

1.2 搜索引擎的原理

1.2.1 信息检索过程

1、构建文本库

2、建立索引

3、进行搜索

4、对结果进行排序

1.2.2 原理

搜索引擎的工作原理，通过用户输入的信息，通过网络爬虫即搜索服务器，将各与之相关的网站信息抓取并存放到自己的数据服务器中，在存入数据服务器的过程中将这些数据信息需要创建索引库，用户查询的结果信息都是来源与索引库信息，如果点击该结果超链接则访问的是该网站信息，如果选择“快照”则访问的是缓存信息。

那为什么要建立索引库呢？建立索引库的过程就是将该结果建立索引，通俗一点的理解就是建立目录的过程。

1.3 搜索引擎的使用场景

1.3.1 使用场景

1、电商网站的搜索，如京东、天猫等

2、论坛、BBS等站内搜索

3、垂直领域的搜索，垂直领域：即专门做一件事。如818工作网、拉勾网等都属于垂直领域。

4、 Windows的资源管理器中的搜索

5、 Word中的Ctrl+F、eclipse中的Ctrl+shift+T等单机软件的搜索

这些都是属于信息检索的范围。

1.3.2 倒排索引

倒排索引，就是提取信息并建立索引（目录）的过程中，搜索时，根据关键字找到资源的具体位置。如：

2 Lucene入门

2.1 什么是Lucene

2.1.1 概念

Lucene是apache下的一个开放源代码的全文检索引擎工具包。提供了完整的查询引擎和索引引擎，部分文本分析引擎。Lucene的目的是为软件开发人员提供一个简单易用的工具包，以方便的在目标系统中实现全文检索的功能。

2.1.2 Lucene与搜索引擎的区别

全文检索系统是按照全文检索理论建立起来的用于提供全文检索服务的软件系统。全文检索系统是一个可以运行的系统，包括建立索引、处理查询返回结果集、增加索引、优化索引结构等功能。例如：百度搜索、eclipse帮助搜索、淘宝网商品搜索。

搜索引擎是全文检索技术最主要的一个应用，例如百度。搜索引擎起源于传统的信息全文检索理论，即计算机程序通过扫描每一篇文章中的每一个词，建立以词为单位的倒排文件，检索程序根据检索词在每一篇文章中出现的频率和每一个检索词在一篇文章中出现的概率，对包含这些检索词的文章进行排序，最后输出排序的结果。全文检索技术是搜索引擎的核心支撑技术。

Lucene和搜索引擎不同，Lucene是一套用java或其它语言写的全文检索的工具包，为应用程序提供了很多个api接口去调用，可以简单理解为是一套实现全文检索的类库，搜索引擎是一个全文检索系统，它是一个单独运行的软件系统。

Lucene开源免费，它既不是搜索引擎，也不是可直接运行的软件，它只是一套API，可以根据该API开发自己的搜索系统。

2.2 掌握什么

这里我们使用的是Lucene4.x版本，我们需要知道是如何创建索引的，并根据输入的信息将我们的结果查询出来这样的一套流程。

2.3 企业中如何使用Lucene

例如BBS贴吧的站内搜索，它是如何完成的呢？难道是查询数据库的信息并将结果返回的么？

2.4 入门程序

2.4.1 下载Lucene

官网，http://lucene.apache.org/，我们通过官网下载我们需要的jar包。目前最新的版本5.3.1，那这里我们使用的是4.10.2这个版本。

2.4.2 创建索引

2.4.2.1 导入jar包

解压我们的zip压缩文件，导入我们需要的jar包。这里我们需要分词器的包、Lucene的核心包、高亮显示的包和查询需要的包。

2.4.2.2 创建索引

在发帖并提交时，我们创建帖子的索引库。

创建索引库的过程：将文本内容-à转换成Document对象（该对象中有很多Field，可以把该Document对象当做是一个帖子），然后在通过IndexWriter创建我们的索引。

2.4.2.2.1 代码

代码里提到了分词器的概念，这个再将API的时候在细说。

2.4.2.2.2 索引库

2.4.2.3 查看索引库

我们通过lukeall工具查看创建的索引库中的内容。我们通过java –jar xxx.jar的方式运行我们的lukeall工具，并通过该工具查看我们创建的索引库的内部结构。

2.4.2.3.1 overview

目录库，分词后的词条信息。

2.4.2.3.2 document

也就是内容库。存放数据的。

2.4.3 基于索引搜索

2.4.3.1 检索过程

检索过程。

2.4.3.2 代码

3 Lucene API详解

3.1 创建索引API

3.1.1 Directory

l Directory，指的是文件磁盘的索引路径

l RAMDirectory，指的是内存中的索引路径

3.1.2 Analyzer

3.1.2.1 原理

Analyzer是一个抽象类，在Lucene的lucene-analyzers-common包中提供了很多分析器，比如：org.apache.lucene.analysis.standard.standardAnalyzer标准分词器，它是Lucene的核心分词器，它对分析文本进行分词、大写转成小写、去除停用词、去除标点符号等操作过程。

什么是停用词？停用词是为节省存储空间和提高搜索效率，搜索引擎在索引页面或处理搜索请求时会自动忽略某些字或词，这些字或词即被称为Stop Words(停用词)。比如语气助词、副词、介词、连接词等，通常自身并无明确的意义，只有将其放入一个完整的句子中才有一定作用，如常见的“的”、“在”、“是”、“啊”等。

如下是org.apache.lucene.analysis.standard.standardAnalyzer的部分源码：

final StandardTokenizer src = new StandardTokenizer(getVersion(), reader);//创建分词器

src.setMaxTokenLength(maxTokenLength);

TokenStream tok = new StandardFilter(getVersion(), src);//创建标准分词过滤器

tok = new LowerCaseFilter(getVersion(), tok);//在标准分词过滤器的基础上加大小写转换过滤

tok = new StopFilter(getVersion(), tok, stopwords);//在上边过滤器基础上加停用词过滤

3.1.2.2 中文分词器

学过英文的都知道，英文是以单词为单位的，单词与单词之间以空格或者逗号句号隔开。而中文则以字为单位，字又组成词，字和词再组成句子。所以对于英文，我们可以简单以空格判断某个字符串是否为一个单词，比如I love China，love 和 China很容易被程序区分开来；但中文“我爱中国”就不一样了，电脑不知道“中国”是一个词语还是“爱中”是一个词语。把中文的句子切分成有意义的词，就是中文分词，也称切词。我爱中国，分词的结果是：我爱中国。

3.1.2.3 Lucene自带分词器

l StandardAnalyzer：

单字分词：就是按照中文一个字一个字地进行分词。如：“我爱中国”，
效果：“我”、“爱”、“中”、“国”。

l CJKAnalyzer

二分法分词：按两个字进行切分。如：“我是中国人”，效果：“我是”、“是中”、“中国”“国人”。

上面两个分词器无法满足需求。

l SmartChineseAnalyzer

对中文支持较好，但扩展性差，扩展词库，禁用词库和同义词库等不好处理

3.1.2.4 第三方产品

名称	最近更新	速度 ( 网上情报 )	扩展性支持、其它
mmseg4j	2013	complex 60W 字 /s (1200 KB/s) simple 100W 字 /s (1900 KB/s)	使用 sougou 词库，也可自定义 (complex\simple\ MaxWord)
IKAnalyzer	2012	IK2012 160W 字 /s (3000KB/s)	支持用户词典扩展定义、支持自定义停止词 ( 智能 \ 细粒度 )
Ansj	2014	BaseAnalysis 300W 字 /s hlAnalysis 40W 字 /s	支持用户自定义词典，可以分析出词性，有新词发现功能
paoding	2008	100W 字 /s	支持不限制个数的用户自定义词库

这里我们使用IK分词器。那如何使用IK分词器呢？

1、解压压缩文件，并将该两个配置文件放入src中。

2、导入jar包

导入FF_u1的jar包，该版本支持4.x，而u6仅仅支持4.x之前的版本。

3、使用该分词器的前后对比

standardanalyzer：

IKanalyzer ：

3.1.3 IndexableFiled

l LongField，分词，有多个词条

l StringField，建立索引时不分词，将该内容作为一个完整的词条Term

l TextField，建立索引时分词，有多个词条

l Store：YES或NO不影响是否分词；YES，会在Document中存储，NO，不会在Document中存储

3.1.4 IndexWriter

Lucene3.5之后，IndexWriter的初始化有了一个IndexConfig来作为其初始化的参数，当我们在使用IndexWrier的时候一定要注意在最后把writer关闭，否则抛出异常。其实这个异常是因为lucene进入到索引目录中，发现里面就是一个write.lock。而IndexWriter的构造函数在试图获取另外一个IndexWriter已经加锁的索引目录时就会抛出一个LockObtainFailedException。

当IndexWriter在初始化索引的时候会为这个索引加锁，等到初始化完成之后会调用其close()方法关闭IndexWriter，在close()这个方法的内部其实也是调用了unlock()来释放锁，当程序结束后IndexWriter没有正常关闭的时候这个锁也就没有被释放，等待下次对同样的索引文件创建IndexWriter的时候就会抛出该异常。

执行上面代码，就会报如下错误。

编写工具类，在使用完IndexWriter后自动关闭。

通俗一点讲：就是该对象销毁后才释放锁对象，因为都是将信息放入同一个索引库中。如果指定不是同一索引库是没有问题的，但是需要执行commit方法，因为close方法中包含了commit方法。

3.2 基于索引库检索API

检索最重要的就是根据你的Query去搜索信息，因此我们Lucene的API中提供了很多的Query对象，我们根据不同的Query对象独有的特性去检索我们需要的信息。

3.2.1 QueryParser

针对单一字段，解析查询信息并分词进行搜索。

3.2.2 MultiFiledQueryParser

针对多字段，解析查询信息并分词进行搜索。

3.2.3 TermQuery

根据词条搜索，使用该对象不会在去解析查询信息并分词。词条就是索引库的最小单位，不可再继续分词。

3.2.4 WildcardQuery

模糊搜索：*代表0个或多个字符；？代表一个字符

3.2.5 FuzzyQuery

相似度搜索，例如，我们想搜JQuery，但是在输入框输入jquary。

FuzzyQuery的构造方法：

FuzzyQuery(Term term)：默认支持模糊字数为2；

FuzzyQuery(Term term, int maxEdits)：maxEdits：模糊字数，[0,2]之间，若为0，相当于TermQuery。

FuzzyQuery(Term term, int maxEdits, int prefixLength)：prefixLength，指定要有多个前缀字母必须完全匹配。

3.2.6 NumericRangeQuery

数字范围搜索（演示：略），最后两个参数的含义是：minInclusive，是否最小包含，maxInclusive，是否最大包含

3.2.7 MatchAllDocsQuery

查询所有的结果。

3.2.8 小结

使用Query对象的优先顺序

1、 TermQuery，词条搜索

2、若输入内容太长，可用：QueryParser，将输入内容解析并切词

3、若输入内容太短，可用：WildcardQuery，模糊查询

4、若输入内容有误，可用：FuzzyQuery，相似度查询

3.3 BooleanQuery

BooleanQuery，组合查询，通过该Query对象可以将上面各种Query进行任意组合。

构造方法：

add(Query query, BooleanClause.Occur occur)：query，各种其他的query；occur，该变量的取值有三种，分别为：MUST（必须满足）、MUST_NOT（必须不满足）、SHOULD（可以满足）。

MUST+MUST：两个Query查询对象的交集

MUST+MUST_NOT：两个Query查询对象的补集

SHOULD+SHOULD：两个Query查询对象的并集。

3.4 结论

词条：就是将查询的信息通过指定的各种Query对象的本身特有的属性去匹配词条；

Document：就是将匹配后的结果返回。

4 索引调优

4.1 概念

索引调优：就是在创建索引时，将我们的创建的索引库的内容和磁盘内容加载到内存中，执行完之后，并将内存中的索引库的内容加载到磁盘上。

RAMDirectory是内存的一个区域，当虚拟机退出后，里面的内容也会随之消失

RAMDirectory的性能要好于FSDirectory, 因此可以结合使用，在虚拟机退出时，将RAM内容转到FSDirectory。

4.2 代码

索引调优代码：

CREATE：会写到索引库并覆盖原索引库

CREATE_OR_APPEND：将内存库信息追加到索引库中。

5 Lucene搜索结果排名规则

5.1 结果得分

5.1.1 Lucene文档的得分算法

idf举例：

有很多不同的数学公式可以用来计算TF-IDF。这边的例子以上述的数学公式来计算。词频 (TF) 是一词语出现的次数除以该文件的总词语数。假如一篇文件的总词语数是100个，而词语“母牛”出现了3次，那么“母牛”一词在该文件中的词频就是3/100=0.03。一个计算文件频率 (DF) 的方法是测定有多少份文件出现过“母牛”一词，然后除以文件集里包含的文件总数。所以，如果“母牛”一词在1,000份文件出现过，而文件总数是10,000,000份的话，其逆向文件频率就是 lg(10,000,000 / 1,000)=4。最后的TF-IDF的分数为0.03 * 4=0.12。

5.1.2 改变boost值来改变文档得分

boost，激励因子，默认值是1，可以手动更改。我们可以设置boost值来改变搜索结果排名。而且设置boost值后，该信息保存在Document文档的norm中。

5.1.2.1 在索引库中创建100个索引

5.1.2.2 搜索索引库中的内容

查询的结果：

而且所有的Document中的NORM的值都是一样。

得分一样。那么我想让第88条记录排在第一位怎么办？我们只有设置它的激励因子（boost）值即可。

1、设置得分

2、结果

3、 NORM值

设置boost（激励因子），可以改变得分以及Norm值。

5.2 结果高亮显示

结果高亮显示，也就是将搜索内容进行了高亮显示。例如，百度，查询java

所以说高亮显示就是将搜索的信息结果通过HTML标签进行样式的处理。可以对标题也可以对文本进行高亮显示。

5.2.1 定义高亮器

5.2.2 使用高亮

5.2.3 结果显示

docker容器基础入门霉逝 docker 容器运维
docker容器技术基础入门文章目录docker容器技术基础入门@[toc]1.docker基本概念2.Docker的引擎的组成以及功能3.docker的架构4.docker安装、配置加速器以及常用指令4.1安装docker软件包4.2开启docker并查看状态4.3配置阿里云镜像加速器4.4docker常用命令1.docker基本概念docker是容器技术的一个前端工具，容器是内核的一项技术，d
浅析AI大模型现状及其应用，零基础入门到精通，收藏这篇就够了程序员_大白互联网程序员大模型人工智能数据挖掘大模型
随着人工智能技术的迅猛发展，AI大模型已经成为全球科技竞争的焦点，展现出巨大的发展潜力和广阔的应用前景。AI大模型的应用落地正引发行业关注，技术进步正促使AI大模型的应用逐步从云端向终端设备延伸，从通用模型向针对特定行业的定制化解决方案转变，其商业潜力和对行业的影响不断增强。与此同时，国内外企业在大模型领域的竞争日趋激烈。AI大模型蓬勃发展AI大模型主要特征AI大模型具有泛化性(知识迁移到新领域)
2025年全国CTF夺旗赛-从零基础入门到竞赛，看这一篇就稳了！白帽安全-黑客4148 网络安全 web安全 linux 密码学 CTF python ddos
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包目录一、CTF简介二、CTF竞赛模式三、CTF各大题型简介四、CTF学习路线4.1、初期1、html+css+js（2-3天）2、apache+php（4-5天）3、mysql（2-3天）4、python(2-3天)5、burpsuite（1-2天）4.2、中期1、SQL注入（7-8天）2、文件上传（7-8天）3、其他漏洞（14-15
【第四天】零基础入门刷题Python-算法篇-数据结构与算法的介绍-两种常见的递归算法（持续更新） Long_poem python 算法开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、Python数据结构与算法的详细介绍1.Python中的常用的搜索算法2.两种常见的递归算法3.两种详细的递归算法代码1）斐波那契数列2）阶乘总结前言提示：这里可以添加本文要记录的大概内容：第一天Python数据结构与算法的详细介绍第二天五种常见的排序算法第三天两种常见的搜索算法第四天两种常见的递归算法第五天一种常见的
参加【2025年春季】全国CTF夺旗赛-从零基础入门到竞赛，看这一篇就稳了！白帽子凯哥 web安全学习安全 CTF夺旗赛网络安全
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包目录一、CTF简介二、CTF竞赛模式三、CTF各大题型简介四、CTF学习路线4.1、初期1、html+css+js（2-3天）2、apache+php（4-5天）3、mysql（2-3天）4、python(2-3天)5、burpsuite（1-2天）4.2、中期1、SQL注入（7-8天）2、文件上传（7-8天）3、其他漏洞（14-15
参加【2025年春季】全国CTF夺旗赛-从零基础入门到竞赛，看这一篇就稳了！白帽子凯哥 web安全学习安全 CTF夺旗赛网络安全
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包目录一、CTF简介二、CTF竞赛模式三、CTF各大题型简介四、CTF学习路线4.1、初期1、html+css+js（2-3天）2、apache+php（4-5天）3、mysql（2-3天）4、python(2-3天)5、burpsuite（1-2天）4.2、中期1、SQL注入（7-8天）2、文件上传（7-8天）3、其他漏洞（14-15
Python3【字符串】：文本操作的瑞士军刀李智 - 重庆 Python 精讲精练 -从入门到实战 python 开发语言经验分享编程实战趣味编程编程技巧
Python3【字符串】：文本操作的瑞士军刀内容简介本系列文章是为Python3学习者精心设计的一套全面、实用的学习指南，旨在帮助读者从基础入门到项目实战，全面提升编程能力。文章结构由5个版块组成，内容层层递进，逻辑清晰。基础速通：n个浓缩提炼的核心知识点，夯实编程基础；经典范例：10个贴近实际的应用场景，深入理解Python3的编程技巧和应用方法；避坑宝典：10个典型错误解析，提供解决方案，帮助
Python3 字典：解锁高效数据存储的钥匙李智 - 重庆 Python 精讲精练 -从入门到实战 python 经验分享编程实战趣味编程编程技巧
Python3字典：解锁高效数据存储的钥匙内容简介本系列文章是为Python3学习者精心设计的一套全面、实用的学习指南，旨在帮助读者从基础入门到项目实战，全面提升编程能力。文章结构由5个版块组成，内容层层递进，逻辑清晰。基础速通：n个浓缩提炼的核心知识点，夯实编程基础；经典范例：10个贴近实际的应用场景，深入理解Python3的编程技巧和应用方法；避坑宝典：10个典型错误解析，提供解决方案，帮助读
ESP32-C3入门教程蓝牙篇③——基于微信小程序和Esp Blufi实现 WiFi配网小康师兄 ESP32-C3入门教程微信小程序小程序 blufi ESP32 WiFi配网
基于微信小程序和EspBlufi实现WiFi配网文章目录一、前言二、软件框架三、软件流程四、API介绍五、全部源码一、前言本文基于VSCodeIDE进行编程、编译、下载、运行等操作基础入门章节请查阅：ESP32-C3入门教程基础篇①——基于VSCode构建HelloWorld教程目录大纲请查阅：ESP32-C3入门教程——导读二、软件框架
ESP32-C3入门教程基础篇④——ADC（模拟量转数字量）单次读取简单实例小康师兄 ESP32-C3入门教程 ESP32 ESP32-C3 ADC 模数转换模拟量转数字量
文章目录一、前言二、硬件接线三、知识点3.1ADC电压范围3.2ADC精度3.3ADC校准3.4ADC读取四、全部源码五、运行演示六、参考一、前言本文基于VSCodeIDE进行编程、编译、下载、运行等操作基础入门章节请查阅：ESP32-C3入门教程基础篇①——基于VSCode构建HelloWorld教程目录大纲请查阅：ESP32-C3入门教程——导读ADC转换是将输入模拟电压转换为数字值。ADC原
ESP32-C3入门教程 WiFi篇⑦——基于SoftAP 的 WiFi 智能配网小康师兄 ESP32-C3入门教程物联网 esp32 WiFi配网 SoftAP WiFi
文章目录一、前言二、WiFi配网方式三、功能简述四、源码实现一、前言本文基于VSCodeIDE进行编程、编译、下载、运行等操作基础入门章节请查阅：ESP32-C3入门教程基础篇①——基于VSCode构建HelloWorld教程目录大纲请查阅：ESP32-C3入门教程——导读二、WiFi配网方式WiFi配网即：用户通过App/小程序/网页等途径将WiFi的SSID和密码等信息发送给ESP32，方式有
免费AI大模型API汇总（非常详细），零基础入门到精通，看这一篇就够了大模型扬叔人工智能免费AI大模型API汇总大模型
前言一、免费大模型API一览大模型免费版本免费限制控制台（api_key等）讯飞星火大模型spark-litetokens：总量无限；QPS：2；(每秒发送的请求数)有效期：不限访问链接百度千帆大模型平台ERNIE-Speed-8KRPM=300，TPM=300000（RPM是每分钟请求数（RequestsPerMinute），TPM是指每分钟处理的tokens数量）访问链接ERNIE-Speed
参加【2025年春季】全国CTF夺旗赛-从零基础入门到竞赛，看这一篇就稳了！白帽子凯哥 web安全学习安全 CTF夺旗赛网络安全
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包目录一、CTF简介二、CTF竞赛模式三、CTF各大题型简介四、CTF学习路线4.1、初期1、html+css+js（2-3天）2、apache+php（4-5天）3、mysql（2-3天）4、python(2-3天)5、burpsuite（1-2天）4.2、中期1、SQL注入（7-8天）2、文件上传（7-8天）3、其他漏洞（14-15
mysql5.7全文检索方案,深度解析MySQL 5.7之中文全文检索渚熏 mysql5.7全文检索方案
前言其实全文检索在MySQL里面很早就支持了，只不过一直以来只支持英文。缘由是他从来都使用空格来作为分词的分隔符，而对于中文来讲，显然用空格就不合适，需要针对中文语义进行分词。这不，从MySQL5.7开始，MySQL内置了ngram全文检索插件，用来支持中文分词，并且对MyISAM和InnoDB引擎有效。在使用中文检索分词插件ngram之前，先得在MySQL配置文件里面设置他的分词大小，比如，[m
mysql 5.7全文索引_MySql5.7 使用全文索引 wonder-yyc mysql 5.7全文索引
一、ngramandMeCabfull-textparser插件全文检索在MySQL里面很早就支持了，只不过一直以来只支持英文。缘由是他从来都使用空格来作为分词的分隔符，而对于中文来讲，显然用空格就不合适，需要针对中文语义进行分词。但从MySQL5.7开始，MySQL内置了ngram全文检索插件，用来支持中文分词，并且对MyISAM和InnoDB引擎有效。二、必要的参数设置在使用中文检索分词插件n
mysql5.7中文全文检索,让MySQL支持中文全文检索无我的舞者 mysql5.7中文全文检索
因为中文词间并没有明显的区隔，所以中文的分词是按照字典、词库的匹配和词的频度统计，或是基于句法、语法分析的分词，而MySQL并不具备此功能，所以MySQL对中文全文检索的支持几乎为零。目前很多网站和系统都提供了全文搜索功能，用户可以输入词或者语句来定位匹配的记录。在后台，可以使用Select查询中的Like语句来执行这种查询，尽管这种方法可行，但对于全文查找而言，这是一种效率极端低下的方法，尤其在
如何用3个月零基础入门网络安全？_网络安全零基础怎么学习白帽黑客啊一 web安全学习安全密码学网络安全
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包前言写这篇教程的初衷是很多朋友都想了解如何入门/转行网络安全，实现自己的“黑客梦”。文章的宗旨是：1.指出一些自学的误区2.提供客观可行的学习表3.推荐我认为适合小白学习的资源.大佬绕道哈！基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包一、自学网络安全学习的误区和陷阱1.不要试图先成为一名程序员（以编程为基础的学习）
ELK介绍小馋喵知识杂货铺性能 elk
ELK是由三个开源项目组成的日志管理解决方案，分别是Elasticsearch、Logstash和Kibana。这三个工具协同工作，提供强大的日志收集、处理、存储和可视化能力。通常，ELK被用于大规模的日志分析和数据监控，帮助开发人员和运维团队快速发现问题、进行故障排查和性能优化。1.Elasticsearch（E）Elasticsearch是一个基于Lucene的开源搜索引擎，提供实时的分布式搜
【成人版python基础入门】第一章开篇——与 Python 的浪漫相遇精通代码大仙 python python 开发语言
开篇——与Python的浪漫相遇在这个数字化日益menjadi成主流的时代，掌握一门编程语言似乎已经成为了每个人不可推卸的责任。如果你正在寻找一种既强大又易学的语言，那么Python就是你心中的“白月光”。这不仅仅是因为它简洁明了的语法，良好的社区支持，更因为它那无可比拟的跨平台性——无论你的电脑是Windows、MacOS还是Linux，Python都将无差别地陪伴在你身边。现在，让我们一起进入
【成人版python基础入门】第一章循环与条件判断——让程序“活”起来精通代码大仙 python python 服务器
循环与条件判断——让程序“活”起来在与Python的第一次浪漫相遇之后，我们已经学会了如何使用变量、数据类型、输入输出和基本运算符。现在，是时候让我们的程序“活”起来，让它能够像人一样思考和做出决策。这一篇教程将带你深入学习Python的循环和条件判断，这些基本概念是编写复杂程序的基石。通过风趣的例子和实际代码示例，我们将一起探索Python的逻辑世界。条件判断：if、elif、else语句条件判
Python 入门路线（2025 极简无废话版）墨鱼爆蛋 Python python 开发语言编程
大家好，梳理一个Python从入门到精通路线大家都挺忙的，突出一个无废话注：时间仅供参考第一阶段：基础入门(0-3个月)1.Python基础语法开发环境搭建(Python安装、IDE选择)变量和数据类型运算符和表达式控制流(if/else、循环)函数定义与调用基本输入输出2.数据结构基础列表(List)和元组(Tuple)字典(Dict)和集合(Set)字符串处理文件操作3.错误处理try/exc
【Redis】golang操作Redis基础入门 m0_74825360 面试学习路线阿里巴巴 redis golang 数据库
【Redis】golang操作Redis基础入门大家好我是寸铁??总结了一篇【Redis】golang操作Redis基础入门sparkles:喜欢的小伙伴可以点点关注??Redis的作用Redis（RemoteDictionaryServer）是一个开源的内存数据库，它主要用于存储键值对，并提供多种数据结构的支持。Redis的主要作用包括：1.缓存:Redis可以作为缓存系统，将常用的数据缓存在内
Python基础入门之随机数种子(seed)方法的使用我的小星星 python 前端 linux Python
随机数在编程中经常被用到，而在Python中，我们可以使用random模块来生成随机数。然而，有时候我们需要控制随机数的生成过程，使得每次运行程序时得到的随机数序列是可重复的。这时，就可以使用随机数种子(seed)方法来实现这个目的。随机数种子是一个整数值，它作为随机数生成算法的起始输入值。当使用相同的种子值时，每次生成的随机数序列都是相同的。这对于调试程序和复现实验结果非常有用。在Python中
【零基础入门Go语言】错误处理：如何更优雅地处理程序异常和错误随心Coding 理想主义花朵 golang 开发语言后端
随着软件开发的不断发展，软件系统的规模和复杂性日益增加，错误处理的重要性也愈发凸显。作为开发者，我们都希望自己编写的代码能够像精密的机器一样，稳定、高效地运行。然而，现实往往不尽如人意，错误总是会在不经意间出现，打乱我们的节奏，影响开发进度。有时候，一个小小的错误可能会耗费我们大量的时间和精力去排查和修复。但如果我们掌握了良好的错误处理技巧，就能将这些“麻烦”转化为提升代码质量的契机。接下来，让我
网络工程师不能不懂的知识-电脑CMD命令大全，零基础入门到精通，收藏这篇就够了程序媛尤尤网络 linux 运维服务器 web安全学习
在Windows操作系统中，命令提示符（CMD）是一个强大的工具，允许用户通过输入命令来执行各种操作。无论是系统管理、网络配置，还是文件管理，CMD都能提供高效的解决方案。一、基本命令cd：更改目录用法：cd[目录名]示例：cdC:\Users\YourUsername\Documents说明：此命令用于切换到指定的目录。dir：列出目录内容用法：dir[目录名]示例：dirC:\说明：列出指定目
ASP.NET Core微服务架构：从入门到精通的Ocelot实践 LaotLisp 架构 asp.net 微服务
微服务架构的兴起使得开发人员能够构建高度可伸缩、松耦合的应用程序。在ASP.NETCore中，Ocelot是一个流行的开源库，它提供了一个简单而强大的方式来构建和管理微服务架构。在本文中，我们将深入探讨如何使用Ocelot从基础入门，逐步实现一个完整的微服务架构。步骤1：安装Ocelot首先，我们需要在ASP.NETCore应用程序中安装Ocelot。在VisualStudio中，可以通过NuGe
深度学习从入门到精通：全面指南 AI天才研究院计算大数据AI人工智能 AI大模型企业级应用开发实战 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
《深度学习从入门到精通：全面指南》文章目录《深度学习从入门到精通：全面指南》文章关键词文章摘要引言第一部分：深度学习基础入门第1章：深度学习概述1.1深度学习的基本概念1.2深度学习的发展历程1.3深度学习的基本原理神经网络前向传播反向传播第2章：深度学习框架入门2.1TensorFlow入门TensorFlow环境搭建TensorFlow基本数据结构2.2PyTorch入门PyTorch环境搭建
Python增强办公效率的11个实用代码段，零基础入门到精通，收藏这一篇就够了 Python_chichi 互联网程序员网络安全 python java 大数据
引言在日常工作中，许多任务可以通过编程自动化来提高效率。本文将介绍一些实用的Python脚本，用于批量创建文件夹、重命名文件、处理Excel数据、合并PDF文件等。这些工具能显著减少重复性工作，提升工作效率。1.快速生成批量文件夹工作中经常需要创建多个文件夹来分类存储不同类型的文件。手动创建不仅耗时还容易出错。利用Python可以快速生成批量文件夹。importosdefcreate_folder
【第二天】零基础入门刷题Python-算法篇-数据结构与算法的介绍-五种常见的排序算法（持续更新） Long_poem 排序算法算法 python
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、Python数据结构与算法的详细介绍1.Python中的常用的排序算法1.排序算法的介绍2.五种详细的排序算法代码总结前言提示：这里可以添加本文要记录的大概内容：第一天Python数据结构与算法的详细介绍第二天五种常见的排序算法提示：以下是本篇文章正文内容，下面案例可供参考一、Python数据结构与算法的详细介绍1.P
【Python】成功解决ValueError: zero-size array to reduction operation minimum which has no identity 高斯小哥 BUG解决方案合集 python 新手入门学习 debug
【Python】成功解决ValueError:zero-sizearraytoreductionoperationminimumwhichhasnoidentity个人主页：高斯小哥高质量专栏：Matplotlib之旅：零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程希望得到您的订阅和支持~创作高质量博文(平均质量分92+)，分享更多关于深度学习、PyTorch、
PHP如何实现二维数组排序？ IT独行者二维数组 PHP 排序　
二维数组在PHP开发中经常遇到，但是他的排序就不如一维数组那样用内置函数来的方便了，（一维数组排序可以参考本站另一篇文章【PHP中数组排序函数详解汇总】）。二维数组的排序需要我们自己写函数处理了，这里UncleToo给大家分享一个PHP二维数组排序的函数：代码： functionarray_sort($arr,$keys,$type='asc'){ $keysvalue= $new_arr
【Hadoop十七】HDFS HA配置 bit1129 hadoop
基于Zookeeper的HDFS HA配置主要涉及两个文件,core-site和hdfs-site.xml。测试环境有三台 hadoop.master hadoop.slave1 hadoop.slave2 hadoop.master包含的组件NameNode, JournalNode, Zookeeper，DFSZKFailoverController
由wsdl生成的java vo类不适合做普通java vo darrenzhu VO wsdl webservice rpc
开发java webservice项目时，如果我们通过SOAP协议来输入输出，我们会利用工具从wsdl文件生成webservice的client端类，但是这里面生成的java data model类却不适合做为项目中的普通java vo类来使用，当然有一中情况例外，如果这个自动生成的类里面的properties都是基本数据类型，就没问题，但是如果有集合类，就不行。原因如下： 1)使用了集合如Li
JAVA海量数据处理之二（BitMap）周凡杨 java 算法 bitmap bitset 数据
路漫漫其修远兮，吾将上下而求索。想要更快，就要深入挖掘 JAVA 基础的数据结构，从来分析出所编写的 JAVA 代码为什么把内存耗尽，思考有什么办法可以节省内存呢？啊哈！算法。这里采用了 BitMap 思想。首先来看一个实验：指定 VM 参数大小： -Xms256m -Xmx540m
java类型与数据库类型 g21121 java
很多时候我们用hibernate的时候往往并不是十分关心数据库类型和java类型的对应关心，因为大多数hbm文件是自动生成的，但有些时候诸如：数据库设计、没有生成工具、使用原始JDBC、使用mybatis(ibatIS)等等情况，就会手动的去对应数据库与java的数据类型关心，当然比较简单的数据类型即使配置错了也会很快发现问题，但有些数据类型却并不是十分常见，这就给程序员带来了很多麻烦。 &nb
Linux命令 510888780 linux命令
系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpuinfo 显示C
java常用JVM参数墙头上一根草 java jvm参数
-Xms：初始堆大小，默认为物理内存的1/64(<1GB)；默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时，JVM就会增大堆直到-Xmx的最大限制 -Xmx：最大堆大小，默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时，JVM会减少堆直到 -Xms的最小限制 -Xmn：新生代的内存空间大小，注意：此处的大小是（eden+ 2
我的spring学习笔记9-Spring使用工厂方法实例化Bean的注意点 aijuans Spring 3
方法一： <bean id="musicBox" class="onlyfun.caterpillar.factory.MusicBoxFactory" factory-method="createMusicBoxStatic"></bean> 方法二：
mysql查询性能优化之二 annan211 UNION mysql 查询优化索引优化
1 union的限制有时mysql无法将限制条件从外层下推到内层，这使得原本能够限制部分返回结果的条件无法应用到内层查询的优化上。如果希望union的各个子句能够根据limit只取部分结果集，或者希望能够先排好序在合并结果集的话，就需要在union的各个子句中分别使用这些子句。例如想将两个子查询结果联合起来，然后再取前20条记录，那么mys
数据的备份与恢复百合不是茶 oracle sql 数据恢复数据备份
数据的备份与恢复的方式有: 表,方案 ,数据库; 数据的备份: 导出到的常见命令; 参数说明 USERID 确定执行导出实用程序的用户名和口令 BUFFER 确定导出数据时所使用的缓冲区大小，其大小用字节表示 FILE 指定导出的二进制文
线程组 bijian1013 java 多线程 thread java多线程线程组
有些程序包含了相当数量的线程。这时，如果按照线程的功能将他们分成不同的类别将很有用。线程组可以用来同时对一组线程进行操作。创建线程组：ThreadGroup g = new ThreadGroup(groupName); &nbs
top命令找到占用CPU最高的java线程 bijian1013 java linux top
上次分析系统中占用CPU高的问题，得到一些使用Java自身调试工具的经验，与大家分享。 (1)使用top命令找出占用cpu最高的JAVA进程PID:28174 (2)如下命令找出占用cpu最高的线程 top -Hp 28174 -d 1 -n 1 32694 root 20 0 3249m 2.0g 11m S 2 6.4 3:31.12 java
【持久化框架MyBatis3四】MyBatis3一对一关联查询 bit1129 Mybatis3
当两个实体具有1对1的对应关系时，可以使用One-To-One的进行映射关联查询 One-To-One示例数据以学生表Student和地址信息表为例，每个学生都有都有1个唯一的地址(现实中，这种对应关系是不合适的，因为人和地址是多对一的关系)，这里只是演示目的学生表 CREATE TABLE STUDENTS (
C/C++图片或文件的读写 bitcarter 写图片
先看代码： /*strTmpResult是文件或图片字符串 * filePath文件需要写入的地址或路径 */ int writeFile(std::string &strTmpResult,std::string &filePath) { int i,len = strTmpResult.length(); unsigned cha
nginx自定义指定加载配置 ronin47
进入 /usr/local/nginx/conf/include 目录，创建 nginx.node.conf 文件，在里面输入如下代码： upstream nodejs { server 127.0.0.1:3000; #server 127.0.0.1:3001; keepalive 64; } server { liste
java-71-数值的整数次方.实现函数double Power(double base, int exponent)，求base的exponent次方 bylijinnan double
public class Power { /** *Q71-数值的整数次方 *实现函数double Power(double base, int exponent)，求base的exponent次方。不需要考虑溢出。 */ private static boolean InvalidInput=false; public static void main(
Android四大组件的理解 Cb123456 android 四大组件的理解
分享一下，今天在Android开发文档-开发者指南中看到的: App components are the essential building blocks of an Android
[宇宙与计算]涡旋场计算与拓扑分析 comsci 计算
怎么阐述我这个理论呢？。。。。。。。。。首先：宇宙是一个非线性的拓扑结构与涡旋轨道时空的统一体。。。。我们要在宇宙中寻找到一个适合人类居住的行星，时间非常重要，早一个刻度和晚一个刻度，这颗行星的
同一个Tomcat不同Web应用之间共享会话Session cwqcwqmax9 session
实现两个WEB之间通过session 共享数据查看tomcat 关于 HTTP Connector 中有个emptySessionPath 其解释如下： If set to true, all paths for session cookies will be set to /. This can be useful for portlet specification impleme
springmvc Spring3 MVC，ajax，乱码 dashuaifu spring jquery mvc Ajax
springmvc Spring3 MVC @ResponseBody返回，jquery ajax调用中文乱码问题解决 Spring3.0 MVC @ResponseBody 的作用是把返回值直接写到HTTP response body里。具体实现AnnotationMethodHandlerAdapter类handleResponseBody方法，具体实
搭建WAMP环境 dcj3sjt126com wamp
这里先解释一下WAMP是什么意思。W:windows，A：Apache，M：MYSQL，P：PHP。也就是说本文说明的是在windows系统下搭建以apache做服务器、MYSQL为数据库的PHP开发环境。工欲善其事，必须先利其器。因为笔者的系统是WinXP，所以下文指的系统均为此系统。笔者所使用的Apache版本为apache_2.2.11-
yii2 使用raw http request dcj3sjt126com http
Parses a raw HTTP request using yii\helpers\Json::decode() To enable parsing for JSON requests you can configure yii\web\Request::$parsers using this class: 'request' =&g
Quartz-1.8.6 理论部分 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2207691 一.概述基于Quartz-1.8.6进行学习，因为Quartz2.0以后的API发生的非常大的变化，统一采用了build模式进行构建；什么是quartz? 答：简单的说他是一个开源的java作业调度框架，为在 Java 应用程序中进行作业调度提供了简单却强大的机制。并且还能和Sp
什么是POJO？ gupeng_ie java POJO 框架 Hibernate
POJO--Plain Old Java Objects(简单的java对象) POJO是一个简单的、正规Java对象，它不包含业务逻辑处理或持久化逻辑等，也不是JavaBean、EntityBean等，不具有任何特殊角色和不继承或不实现任何其它Java框架的类或接口。 POJO对象有时也被称为Data对象，大量应用于表现现实中的对象。如果项目中使用了Hiber
jQuery网站顶部定时折叠广告 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/4.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>网页顶部定时收起广告jQuery特效 - HoverTree<
Spring boot内嵌的tomcat启动失败 kane_xie spring boot
根据这篇guide创建了一个简单的spring boot应用，能运行且成功的访问。但移植到现有项目（基于hbase）中的时候，却报出以下错误： SEVERE: A child container failed during start java.util.concurrent.ExecutionException: org.apache.catalina.Lif
leetcode: sort list michelle_0916 Algorithm linked list sort
Sort a linked list in O(n log n) time using constant space complexity. ====analysis======= mergeSort for singly-linked list ====code======= /** * Definition for sin
nginx的安装与配置,中途遇到问题的解决 qifeifei nginx
我使用的是ubuntu13.04系统，在安装nginx的时候遇到如下几个问题，然后找思路解决的，nginx 的下载与安装 wget http://nginx.org/download/nginx-1.0.11.tar.gz tar zxvf nginx-1.0.11.tar.gz ./configure make make install 安装的时候出现
用枚举来处理java自定义异常 tcrct java enum exception
在系统开发过程中，总少不免要自己处理一些异常信息，然后将异常信息变成友好的提示返回到客户端的这样一个过程，之前都是new一个自定义的异常，当然这个所谓的自定义异常也是继承RuntimeException的，但这样往往会造成异常信息说明不一致的情况，所以就想到了用枚举来解决的办法。 1，先创建一个接口，里面有两个方法，一个是getCode, 一个是getMessage public
erlang supervisor分析 wudixiaotie erlang
当我们给supervisor指定需要创建的子进程的时候，会指定M,F,A,如果是simple_one_for_one的策略的话，启动子进程的方式是supervisor:start_child(SupName, OtherArgs),这种方式可以根据调用者的需求传不同的参数给需要启动的子进程的方法。和最初的参数合并成一个数组，A ++ OtherArgs。那么这个时候就有个问题了，既然参数不一致，那