fan0128

Solr Facet技术的应用与研究

问题背景

在《搜索引擎关键字智能提示的一种实现》一文中介绍过，美团的CRM系统负责管理销售人员的门店(POI)和项目(DEAL)信息，提供统一的检索功能，其索引层采用的是SolrCloud。在用户搜索时，如果能直观地给出每个品类的POI数目，各个状态的DEAL数目，可以更好地引导用户进行搜索，进而提升搜索体验。

需求分析

例如，下图是用户搜索项目(DEAL)的界面，当选中一个人或者组织节点后，需要实时显示状态分组和快捷分组的每个项的DEAL数目：
项目搜索界面

为了实现上述导航效果，可以采用以下两个方案：

方案一, 针对每个导航项发送一个Ajax请求，去Solr服务器查询对应的DEAL数目。该方案问题在于，当导航项比较多时，扩展性不好。

方案二, 应用Solr自带的Facet技术实现以导航为目的的搜索，查询结果根据分类添加count信息。

DEAL的Solr索引设计如下：

schema.xml：
<field name="deal_id" type="int" indexed="true" stored="true" />       //deal id
<field name="title" type="text_ika" indexed="true" stored="false" />   //标题      
<field name="bd_id" type="int" indexed="true" stored="false" />        //负责人id
<field name="begin_time" type="long" indexed="true" stored="false" />  //项目开始时间
<field name="end_time" type="long" indexed="true" stored="false" />    //项目结束时间
<field name="status" type="int" indexed="true" stored="false" />       //项目状态
<field name="can_buy" type="boolean" indexed="true" stored="false" />  //是否可以购买
...省略     
本文的例子中用于facet的字段有status，can_buy，begin_time，end_time

注：
Facet的字段必须被索引，无需分词，无需存储。无需分词是因为该字段的值代表了一个整体概念，无需存储是因为一般而言用户所关心的并不是该字段的具体值，而是作为对查询结果进行分组的一种手段，用户一般会沿着这个分组进一步深入搜索。

Facet是Solr的高级搜索功能之一，Solr作者给出的定义是导航(Guided Navigation)、参数化查询(Paramatic Search)。Facet的主要好处是在搜索的同时，可以按照Facet条件进行分组统计，给出导航信息，改善搜索体验。Facet搜索主要分为以下几类：

1. Field Facet
搜索结果按照Facet的字段分组并统计，Facet字段通过在请求中加入”facet.field”参数加以声明，如果需要对多个字段进行Facet查询，那么将该参数声明多次，Facet字段必须被索引。例如，以下表达式是以DEAL的status和can_buy属性为facet.field进行查询：

select?q=*:*&facet=true&facet.field=status&facet.field=can_buy&wt=json

Facet查询需要在请求参数中加入”facet=on”或者”facet=true”让Facet组件起作用，返回结果：

"facet_counts”: { 
     "facet_queries": {}, 
     "facet_fields":  { "status": [ "32", 96, 
                                     "0", 40, 
                                     "8", 81, 
                                    "16", 50, 
                                   "127", 80, 
                                    "64", 27 ] ,

                       "can_buy": [ "true", 236, 
                                    "false", 21 ]
                      }, 
     "facet_dates": {}, 
     "facet_ranges": {} 
 }

分组count信息包含在“facet_fields”中，分别按照"status"和“can_buy”的值分组，比如状态为32的DEAL数目有96个，能购买的DEAL数目(can_buy=true)是236。

Field Facet主要参数：

 facet.field：Facet的字段
 facet.prefix：Facet字段前缀
 facet.limit：Facet字段返回条数
 facet.offset：开始条数，偏移量，它与facet.limit配合使用可以达到分页的效果
 facet.mincount：Facet字段最小count，默认为0
 facet.missing：如果为on或true，那么将统计那些Facet字段值为null的记录
 facet.method：取值为enum或fc，默认为fc，fc表示Field Cache
 facet.enum.cache.minDf：当facet.method=enum时，参数起作用，文档内出现某个关键字的最少次数

2. Date Facet
日期类型的字段在索引中很常见，如DEAL上线时间，线下时间等，某些情况下需要针对这些字段进行Facet。时间字段的取值有无限性，用户往往关心的不是某个时间点而是某个时间段内的查询统计结果，Solr为日期字段提供了更为方便的查询统计方式。字段的类型必须是DateField(或其子类型)。需要注意的是，使用Date Facet时，字段名、起始时间、结束时间、时间间隔这4个参数都必须提供。
与Field Facet类似，Date Facet也可以对多个字段进行Facet。并且针对每个字段都可以单独设置参数。

3. Facet Query
Facet Query利用类似于filter query的语法提供了更为灵活的Facet。通过facet.query参数，可以对任意字段进行筛选。

基于Solr facet的实现

本文的例子，需要查询DEAL的“状态”和“快捷选项”导航信息。由于，有的状态DEAL数目不仅与状态(status)字段有关，还与开始时间(begin_time)和(end_time)相关，且各个快捷选项的DEAL数目的计算字段各不相同，要求比较灵活的查询，所以本文拟采用Facet Query方式实现。
以下代码是采用solrJ构造facet查询对象的过程：

public SolrQuery buildFacetQuery(Date now) {
    SolrQuery solrQuery = new SolrQuery();

    solrQuery.setFacet(true);//设置facet=on
    solrQuery.setFacetLimit(10);//限制facet返回的数量
    solrQuery.setQuery("*:*");

    long nowTime = now.getTime() / 1000;
    long minTime = minTimeStamp;
    long maxTime = maxTimeStamp;

    solrQuery.addFacetQuery("status:0");  //待撰写
    solrQuery.addFacetQuery("status:8");  //撰写中
    solrQuery.addFacetQuery("status:16"); //已终审
    solrQuery.addFacetQuery("status:32 AND " + "begin_time:[" + nowTime + " TO " + maxTime + " ]");      //已上架-待上线
    solrQuery.addFacetQuery("status:32 AND " + "begin_time:[" + minTime + " TO " + nowTime + "] AND " +  //已上架-上线中
            "end_time:[" + nowTime + " TO " + maxTime + " ]");
    solrQuery.addFacetQuery("status:32 AND " + "end_time:[" +  minTime + " TO " + nowTime + "]");  //已上架-已下线

    return solrQuery;
}

说明：
"status:0" 查询满足条件的结果集中status=0的Deal数目,
"status:32 AND " + "begin_time:[" + nowTime + " TO " + maxTime + " ]”，查询满足条件的结果集中，status=32且begin_time大于现在时间的Deal数目,
依次类推

返回结果:

"status:0":756, 
"status:8":28,  
"status:16":21,  
"status:32 AND begin_time:[1401869128 TO 1956499199 ]":4,  
"status:32 AND begin_time:[0 TO 1401869128] AND end_time:[1401869128 TO 1956499199 ]":41,   
"status:32 AND end_time:[0 TO 1401869128]":10}

上述结果可知，“已上架-待上线”导航项对应的DEAL数为4个。

Solr Facet查询分析

1. Solr HTTP请求分发

当一个Restful(HTTP)查询请求到达SolrCloud服务器，首先由SolrDispatchFilter(实现javax.servlet.Filter)处理，该类负责分发请求到相应的SolrRequestHandler。具体分发操作在SolrDispatchFilter的doFilter方法中进行：

public void doFilter(ServletRequest request, ServletResponse response, FilterChain chain, boolean retry) {
             ......                 
        handler = core.getRequestHandler( path );
        if( handler == null && parser.isHandleSelect() ) {
          if( "/select".equals( path ) || "/select/".equals( path ) ) {

            solrReq = parser.parse( core, path, req );
            String qt = solrReq.getParams().get( CommonParams.QT );
            handler = core.getRequestHandler( qt );                 //分发到相应的handler
             .......

     if( handler != null ) {
              ......                
            this.execute( req, handler, solrReq, solrRsp );       //处理请求
            HttpCacheHeaderUtil.checkHttpCachingVeto(solrRsp, resp, reqMethod);                
              ......              
        return; 
      }
    }
}

protected void execute( HttpServletRequest req, SolrRequestHandler handler, SolrQueryRequest sreq, SolrQueryResponse rsp) {
   sreq.getContext().put( "webapp", req.getContextPath() );
   sreq.getCore().execute( handler, sreq, rsp );
}

接着，调用solrCore的execute方法：

public void execute(SolrRequestHandler handler, SolrQueryRequest req, SolrQueryResponse rsp) {
     ......    
handler.handleRequest(req,rsp);   // handler处理请求
postDecorateResponse(handler, req, rsp);
     ......
}

从上述代码逻辑可以看出，请求的实际处理是由SolrRequestHandler来完成的。

2. SolrRequestHandler处理过程

SolrRequestHandler的类继承结构，如下图所示：
SolrRequestHandler的类集成结构

SolrRequestHandler请求处理器的接口，只有两个方法，一个是初始化信息，主要是配置时的默认参数，另一个就是处理请求的接口。
具体处理逻辑主要由SearchHandler类实现。

public interface SolrRequestHandler extends SolrInfoMBean {
   public void init(NamedList args);   //初始化信息
   public void handleRequest(SolrQueryRequest req, SolrQueryResponse rsp);  //处理请求
}

SearchHandler实现SolrRequestHandler，SolrCoreAware，在SolrCore初始化的过程中调用SolrRequestHandler中的inform(SolrCore core)，首先是将solrconfig.xml里配置的各个处理组件按一定顺序组装起来，先是first-Component，默认的component，last-component，这些处理组件会按照它们的顺序来执行。如果没有配置，则加载默认组件，方法如下：

protected List<String> getDefaultComponents()
{
   ArrayList<String> names = new ArrayList<String>(6);
   names.add( QueryComponent.COMPONENT_NAME );
   names.add( FacetComponent.COMPONENT_NAME );
   names.add( MoreLikeThisComponent.COMPONENT_NAME );
   names.add( HighlightComponent.COMPONENT_NAME );
   names.add( StatsComponent.COMPONENT_NAME );
   names.add( DebugComponent.COMPONENT_NAME );
   names.add( AnalyticsComponent.COMPONENT_NAME );
   return names;
}

SearchHandler中的component对象包含有QueryComponent、FacetComponent、HighlightComponent等，其中QueryComponent主要负责查询部分，FacetComponent处理facet、HighlightComponent负责高亮显示。SearchHandler在请求处理过程中，由SearchHandler.handleRequestBody(SolrQueryRequest req, SolrQueryResponse rsp)方法依次调用component的prepare、process、distributedProcess方法(分布式搜索本文暂不讨论) 。QueryComponent调用SolrIndexSearcher，SolrIndexSearcher继承了lucene的IndexSearcher类进行搜索，FacetComponent实现对Term的层面的统计，下图是SearchComponent的类图结构：

3. FacetComponent Facet查询分析

由上述分析可知，Solr的Facet功能实际上是由FacetComponent组件来实现的，具体实现在FacetComponent.process方法中：

public void process(ResponseBuilder rb) throws IOException
{
   if (rb.doFacets) {
       SolrParams params = rb.req.getParams();
       SimpleFacets f = new SimpleFacets(rb.req, rb.getResults().docSet,params, rb );   //最终facet查询委托给SimpleFacets类进行处理 
       NamedList<Object> counts = f.getFacetCounts();   
     ......  
  }
}

首先QueryComponent处理q参数里的查询，查询的结果的DocID保存在docSet里，这里是一个无序的document ID 的集合。然后把docSet封装在SimpleFacets中，调用SimpleFacets.getFacetCounts()获取统计结果：

public NamedList<Object> getFacetCounts() {
   ......
   facetResponse = new SimpleOrderedMap<Object>();
   facetResponse.add("facet_queries", getFacetQueryCounts());
   facetResponse.add("facet_fields", getFacetFieldCounts());
   facetResponse.add("facet_dates", getFacetDateCounts());
   facetResponse.add("facet_ranges", getFacetRangeCounts());     
   ......

   return facetResponse;
}

由上可知，返回给客户端的结果有四种类型facet_queries、facet_fields、facet_dates、facet_ranges，分别调用getFacetQueryCounts()，getFacetFieldCounts()，getFacetDateCounts()，getFacetRangeCounts()完成查询。

4. getFacetQueryCounts统计count过程

由于篇幅原因，上述四个方法不一一展开分析，本文用到的查询主要是Facet Query，下面分析一下getFacetQueryCounts方法源码：

public NamedList<Integer> getFacetQueryCounts() throws IOException,SyntaxError {
   NamedList<Integer> res = new SimpleOrderedMap<Integer>();

   String[] facetQs = params.getParams(FacetParams.FACET_QUERY);

   if (null != facetQs && 0 != facetQs.length) {
     for (String q : facetQs) {                    // 循环统计每个facet query的count
       parseParams(FacetParams.FACET_QUERY, q);

       Query qobj = QParser.getParser(q, null, req).getQuery();

       if (qobj == null) {
         res.add(key, 0);
       } else if (params.getBool(GroupParams.GROUP_FACET, false)) {
         res.add(key, getGroupedFacetQueryCount(qobj));
       } else {
         res.add(key, searcher.numDocs(qobj, docs));   //
       }
    }
   }

   return res;
}

该方法的返回类型NamedList是一个有序的name/value容器，保存每个facet query和对应的count值。由代码可知，在for循环体中逐个统计facet query的count值，其中，parseParams方法中把”key”设置成本次循环的facet query变量“q“，由于GroupParams.GROUP_FACET的值是false(group类似与mysql的group by功能，一般不会打开)，所以count值实际是由searcher.numDocs(qobj, docs)方法负责计算，这里的searcher类型是SolrIndexSearcher。

SolrIndexSearcher的numDocs方法源码如下：

public int numDocs(Query a, DocSet b) throws IOException {
 if (filterCache != null) {   
   Query absQ = QueryUtils.getAbs(a);              //如果为negative，则返回相应的补集
   DocSet positiveA = getPositiveDocSet(absQ);     //查询absQ 获取docSet集合
   return a==absQ ? b.intersectionSize(positiveA) : b.andNotSize(positiveA);

 } else {
   TotalHitCountCollector collector = new TotalHitCountCollector();
   BooleanQuery bq = new BooleanQuery();
   bq.add(QueryUtils.makeQueryable(a), BooleanClause.Occur.MUST);
   bq.add(new ConstantScoreQuery(b.getTopFilter()), BooleanClause.Occur.MUST);
   super.search(bq, null, collector);

   return collector.getTotalHits();
}

}

参数a传入facet query对象，参数b传入经过QueryComponent组件处理后得到DocSet集合。DocSet存储的是无序的文档标识号(ID)，ID并不是我们在schema.xml里配置的unique key，而是Solr内部的一个文档标识，其次，DocSet还封装了集合运算的方法，如“求交集”、”求差集”。

由于，我们在solrconfig.xml中配置了filterCache：

<filterCache class="solr.FastLRUCache" 
             size="512" 
             initialSize="512" 
             autowarmCount="0”/>

于是，numDocs方法中filterCache对象不为null，运行到下面三行代码：

Query absQ = QueryUtils.getAbs(a);              //如果为negative，则返回相应的补集
DocSet positiveA = getPositiveDocSet(absQ);     //查询absQ 获取docSet集合
return a==absQ ? b.intersectionSize(positiveA) : b.andNotSize(positiveA);  //集合运算

首先，通过QueryUtils.getAbs(a)将查询对象a统一转化为一个“正向查询对象”absQ，getPositiveDocSet(absQ)方法查询absQ对应的DocSet集合：getPositiveDocSet方法首先查询filterCache中是否存在absQ查询对象对应的结果，存在，则直接返回结果，否则，从索引中查询并把结果保存到filterCache中。

接下来进行集合运算，如果Query对象a和absQ是同一个对象，表明本次查询是“正向查询”，则进行”交集“运算b.intersectionSize(positiveA)，否则进行”差集“运算，最终返回结果集的size。由此可见，facet query对应的count值是集合交集和差集运算后的集合的size。

BTW，如果没有用到filterCache，会每次都构造一个BooleanQuery查询对象到索引中去查询。

5. FacetComponent Facet排序
Solr的FacetComponet支持两种排序: count和index。count是按每个词出现的次数，index是按词的字典顺序。如果查询参数不指定facet.sort，Solr默认是按count排序。排序功能是在FacetComponet的finishStage方法中完成的，详见源码。

总结

本文介绍了Solr Facet技术，并在此基础上实现了DEAL搜索的导航功能，然后从源码级别分析了Solr处理Facet请求的详细过程。

参考资料

SimpleFacetParameters http://wiki.apache.org/solr/SimpleFacetParameters
使用Apache Lucene和Solr 4实现下一代搜索和分析 http://www.ibm.com/developerworks/cn/java/j-solr-lucene/
Faceted Search with Solr http://searchhub.org/2009/09/02/faceted-search-with-solr/

转载地址：http://tech.meituan.com/solr-facet.html

Day32 Web自动化进阶 lookout99 软件测试 python 自动化测试工具
系列文章目录Day01软件测试基础总结Day02测试用例知识点总结（上）Day03测试用例知识点总结（下）Day04禅道-从安装到卸载Day05MySql的基础使用Day06MySql知识点总结Day07MySql知识点再总结与多表查询Day08redis的基础知识Day08VMware的安装、Linux系统安装和Linux基础命令Day09Linux常用命令总结Day10Linux环境部署和项目
Day33 PO模型 lookout99 软件测试 python 自动化测试工具
系列文章目录Day01软件测试基础总结Day02测试用例知识点总结（上）Day03测试用例知识点总结（下）Day04禅道-从安装到卸载Day05MySql的基础使用Day06MySql知识点总结Day07MySql知识点再总结与多表查询Day08redis的基础知识Day08VMware的安装、Linux系统安装和Linux基础命令Day09Linux常用命令总结Day10Linux环境部署和项目
【LLaMA 3实战】2、LLaMA 3对话能力全解析：从架构革新到多智能体实战指南无心水 LLaMA 3 模型实战专栏 llama LLaMA 3对话能力全解析 LLaMA 3 AI大模型多智能体 CSDN技术干货 Meta
引言：LLaMA3对话能力的革命性突破当Meta发布LLaMA3时，其对话能力的跃升重新定义了开源大模型的边界。这款拥有128K上下文窗口的开源模型，不仅在MT-Bench评测中超越GPT-3.5，更通过分组查询注意力(GQA)等架构创新，实现了推理速度30%的提升。本文将从底层架构到应用实战，系统拆解LLaMA3对话能力的技术奥秘，包含核心机制解析、训练策略、工程优化及多智能体系统开发，助你全面
Java：动态代理Proxy 十秒耿直拆包选手 Java Programming up java
动态代理在Java中有着广泛的应用，比如SpringAOP、Hibernate数据查询、测试框架的后端mock、RPC远程调用、Java注解对象获取、日志、用户鉴权、全局性异常处理、性能监控，甚至事务处理等。基本概念假设有一个表示接口的Class对象(有可能只包含一个接口)，它的确切类型在编译时无法知道。要想构造一个实现这些接口的类，就需要使用newInstance方法或反射找出这个类的构造器。但
数据库 DML 语句详解：语法与注意事项步行cgn 数据库数据库 oracle
数据库DML语句详解：语法与注意事项DML（DataManipulationLanguage，数据操作语言）用于操作数据库中的数据，主要包括SELECT、INSERT、UPDATE、DELETE等语句。下面我将详细说明每种操作的语法、使用场景和关键注意事项。一、SELECT查询语句基本语法SELECT[DISTINCT]column1,column2,...FROMtable_name[WHERE
实时股票API接口的调用方法 (原创教程) kk_stoper python 开发语言 java javascript 数据结构
1.准备工作接口类型：实时综合行情接口支持品种：贵金属，商品期货，外汇，A股，港股，美股查询方式：HTTP,WebSocket申请密钥：https://infoway.io官方对接文档：https://infoway.readme.io/reference/ws-subscription2.获取股票清单这个接口用来查询股票的名单，比如我可以获取美股清单：importrequestsurl="htt
一个 new 操作耗时1秒？用原型模式，性能提升100倍！ java干货 Spring boot 原型模式
你是否也曾深陷在对象创建的性能泥潭，当new一个对象的成本极其高昂（例如，需要复杂的数据库查询、网络IO或大量计算），导致你的SpringBoot应用响应缓慢，资源消耗巨大？是时候用原型设计模式(PrototypeDesignPattern)来解脱了！这是一种创建型设计模式，它允许你通过复制现有的实例来创建新的对象，而不是从头开始创建，从而大幅提升性能和灵活性。在SpringBoot中，这个模式的
计算机系统中隐藏的‘时间陷阱’——为什么你的代码总比预期慢10倍？尤物程序猿 java 开发语言
引言大家经常遇到一个诡异现象：明明算法时间复杂度算得好好的，为什么实际运行速度总比预期慢得多？你以为是数据库查询的锅，优化了SQL却收效甚微；你怀疑是网络延迟，但抓包数据又显示一切正常。这背后可能隐藏着计算机系统中鲜为人知的“时间陷阱”——那些未被计入传统性能分析，却真实吞噬效率的底层机制。本文将揭示5个最典型的陷阱，从CPU缓存失效到操作系统调度暗坑，并用真实案例展示如何绕过它们。陷阱1：CPU
实战｜StarRocks 通过 JDBC Catalog 访问 MongoDB 的数据
方案介绍本文档介绍如何通过StarRocks的JDBCCatalog功能，结合MongoDBBIConnector，将MongoDB数据便捷接入StarRocks，实现数据打通和SQL查询分析，以下是整体流程图。前提条件StarRocks环境：版本≥3.0，支持JDBCCatalog功能。MongoDBBIConnector：已安装并运行，版本需与MongoDB兼容（参考MongoDB官方文档）。
Flutter多设备之响应式布局 harmonyos
Flutter多设备之响应式布局参考鸿蒙原生响应式布局场景，保持相似体验。布局能力使用场景使用说明断点将窗口宽度划分为不同的范围（即断点），监听窗口尺寸变化，当断点改变时同步调整页面布局。依赖扩展库：breakpoint媒体查询媒体查询支持监听窗口宽度、横竖屏、深浅色、设备类型等多种媒体特征，当媒体特征发生改变时同步调整页面布局。直接使用FlutterSDK中MediaQuery，无需额外适配栅格
苍穹外卖Day07 guslegend windows
缓存菜品问题用户端小程序展示的菜品数据都是通过查询数据库获得，如果用户端访问量比较大，数据库访问压力随之增大。结果：系统响应慢、用户体验差解决方案通过Redis来缓存菜品数据，减少数据库查询操作缓存逻辑分析：每个分类下的菜品保存一份缓存数据数据库中菜品数据有变更时清理缓存数据DishController代码改写(用户端)publicResult>list(LongcategoryId){//构造r
苍穹外卖Day09 guslegend windows java 开发语言
订单管理模块用户端/***历史订单查询**@parampage*@parampageSize*@paramstatus订单状态1待付款2待接单3已接单4派送中5已完成6已取消*@return*/@GetMapping("/historyOrders")@ApiOperation("历史订单查询")publicResultpage(intpage,intpageSize,Integerstatus)
MySQL(107)如何进行分片查询？辞暮尔尔-烟火年年 MySQL mysql 数据库
进行分片查询时，需要根据分片键确定查询应在哪些分片上执行。分片查询的复杂性在于需要处理跨分片查询的情况。以下是一个更为详细的示例，展示如何在分片数据库中进行查询，并结合Java代码进行实现。1.环境准备假设我们继续使用SpringBoot和MySQL，且需要查询的表是orders表。我们已经有了分片的数据库环境和数据源配置。2.项目依赖在pom.xml中添加必要的依赖：org.springfram
使用datafusion和tpchgen-rs进行完整的TPCH 22个查询的基准测试 l1t 数据库编程语言软件工程 rust github database
1.从源码编译bench二进制文件。下载datafusion源码,解压到目录，比如/par/dafu，cd/par/dafu/benchmarksexportCARGO_INCREMENTAL=1exportPATH=/par:/par/mold240/bin:$PATH因为mold默认使用并行编译，而这些二进制文件很大，如果出现资源不足情况，就会编译失败：(signal:9,SIGKILL:ki
Python采集淘宝商品评论API接口概述，json格式数据参考 ID_18007905473 python API python json 前端
一、淘宝商品评论API接口概述淘宝开放平台提供了taobao.item.reviews.get接口，用于获取指定商品的评论数据。该接口支持分页查询、多条件筛选（如时间范围、评分等级）和自定义返回字段，适用于电商数据分析、竞品研究和用户行为洞察等场景。核心功能：分页获取评论：支持通过page_no和page_size参数控制返回数据的分页。多维度筛选：可按时间范围（start_date、end_da
Python爬虫：爬取物流公司运输数据与包裹跟踪信息 Python爬虫项目 python 爬虫开发语言数据挖掘旅游
一、前言随着电商行业的蓬勃发展，物流服务已成为不可或缺的一部分。消费者对物流运输状态的关注越来越高，实时查询包裹的运输进度成为日常生活的一部分。物流公司爬虫正是为了自动化获取物流公司的运输数据和包裹的跟踪信息，帮助消费者、商家以及物流公司本身进行数据分析、优化物流链条和提高客户体验。本文将详细介绍如何使用Python爬虫从多个物流公司网站或API接口中抓取运输数据、包裹跟踪信息以及相关的统计分析数
HashMap HansenPole825 哈希算法散列表算法
一、结构1.数组（桶数组）初始容量默认16。数组元素成为桶，每个桶存储链表或红黑树（jdk1.8及以后）。2.链表当不同key的哈希值映射到同一桶式，以链表形式存储。3.红黑树jdk1.8及以后引入红黑树：当链表长度大于等于8且桶数组长度大于等于64式，链表转化为红黑树，查询时间从O（n）降为O（logn）。树节点小于6时退化为链表二、关键机制1.哈希计算（jdk1.8）staticfinalin
前端react面试题之实现网页多选搜索框烟雨-yaya 前端 react.js 前端框架
需求提供100位用户信息。其用户信息含：{id:1,age:42,name:'张小强',address:"北京"},；要求1:需要设计可以多选择来筛选得到指点条件用户表，可以选择=>各阶段年龄端或者不同地区的。选择的条件，可以清空；要求2:选择的条件，需要在页面路由上呈现；方便其他用户copy，可以查询到一样的结果；实例网页实现实现需要提前下载相关依赖哈，nanoidimportReact,{Fr
Spring AI 结合 MCP MySQL 实现对话式数据库查询没刮胡子软件开发技术实战专栏人工智能AI Spring 数据库 spring 人工智能 spring-ai mcp-server mysql
在现代应用开发中，将人工智能与数据库查询结合可以创造更自然、更智能的用户交互方式。下面我将详细介绍如何使用SpringAI框架结合MCP（可能指MySQL连接池或相关组件）实现对话中的数据库查询功能。什么是SpringAI和MCPMySQLSpringAI框架概述SpringAI是基于Spring生态的人工智能集成框架，它提供了：与大型语言模型(LLM)的集成能力对话管理和自然语言处理功能业务逻辑
数据库的查询爱吃草莓的土拨鼠️ 数据库
一.单表查询1.简单数据查询a.显示指定字段列：使用“*”显示全部字段列；列出字段名显示指定字段列。b.显示字段列别名：使用AS关键字为字段指定别名，方便理解。c.显示计算的列值：通过算术运算符(+-*/%)对字段进行计算，得到新的列值。d.消除重复行：使用DISTINCT参数消除查询结果中的重复行。e.限制行数：利用LIMIT控制返回的行数，可指定偏移量和行数。f.排序：ORDERBY子句按指定
Spring Cache+Redis缓存方案详解：从代码到实践大手你不懂 Java Java项目实战 Redis spring 缓存 redis
描述：在现代Java开发中，缓存是提升系统性能的核心手段之一。本文通过实际代码案例，深入解析SpringCache与Redis的集成原理，结合项目中的ModuleDatabaseInfoService接口和RedisConfig配置，探讨如何通过声明式缓存实现高效的数据库访问优化。一、核心代码解析1.服务接口设计（拿查询数据源配置信息举例）publicinterfaceModuleDatabase
八、分页查询 2301_78148620 支持向量机
1.limit关键字用来限制查询返回的记录数语法：slelect列名1别名1,列名2别名2，...from表名1别名1join表名2别名2on多表连接条件where分组前的条件groupby分组字段having分组后的条件orderby排序字段1asc|desc,排序字段2asc|desclimit[参数1，]参数2可以接收一个或两个数字参数1用来指定起始行的索引，索引默认从0开始，即第一行的索引
Flask(六) 数据库操作SQLAlchemy @昵称不存在 Flask 数据库 flask
文章目录一、准备工作二、最小化可运行示例✅补充延迟绑定方式（推荐方式）三、数据库基本操作（增删改查）1.插入数据（增）2.查询数据（查）3.更新数据（改）4.删除数据（删）四、其他有用方法五、常用字段类型六、初始化数据库脚本（推荐）sqlalchemy实例基本使用常见方法速查多表查询（JOIN）原始SQL语句（可选）示例：分页+排序推荐：使用Flask-SQLAlchemy提供的简写风格完整的Fl
Oracle 临时表空间相关操作 dazhong2012 数据库 oracle 数据库
一、临时表空间概述临时表空间（TemporaryTablespace）是Oracle数据库中用于存储临时数据的特殊存储区域，其数据在会话结束或事务提交后自动清除，重启数据库后彻底消失。主要用途包括：存储排序操作（如ORDERBY）的中间结果支持哈希连接（HashJoin）等复杂查询索引创建时的临时数据存储核心特点：数据非永久性，关闭数据库后自动删除不能存储永久性对象（如表、视图）独立于永久表空间管
短视频运营怎样提高视频剪辑效率？矩阵营销老黄新媒体运营流量运营营销剪辑
提高短视频剪辑效率的核心在于将“智能工具”融入全流程管理，并建立标准化操作体系。一、前期策划与素材管理1.AI爆款脚本拆解使用视频宝AI生成模版功能，精准查询全网爆款视频，拆解爆款脚本结构，自动分离视频、音频、字幕，避免盲目剪辑。2.素材管理按标签化管理素材（如“产品特写逆光”“口播惊叹句12种版本”），上传云端储存，组织内部各成员都能在线共享素材。还可以自行储备大量无版权空镜素材，存储时添加“季
MySQL之全场景常用工具链 AA-代码批发V哥 MySQL mysql 数据库运维
MySQL之全场景常用工具链一、基础连接与客户端工具1.1mysql命令行客户端1.2MySQLWorkbench：官方可视化1.3NavicatPremium二、管理与开发工具2.1phpMyAdmin：Web端管理首选2.2HeidiSQL：轻量Windows客户端三、性能优化工具3.1EXPLAIN：查询优化3.2SHOWPROFILE：细粒度性能分析3.3慢查询日志：捕获性能痛点四、备份与
InnoDB的页分裂、页合并及优化策略 flydroid mysql 数据库
文章目录B+树结构1.非叶子节点（索引节点）2.叶子节点（数据节点）3.层级关系4.B+树vsB树的核心区别5.B+树查询流程示例1.页分裂（PageSplit）触发条件分裂过程分裂类型性能影响2.页合并（PageMerge）触发条件合并过程性能影响3.页分裂与合并的根因B+树的平衡性要求动态数据操作的必然结果4.页分裂与合并的优化策略减少页分裂减少页合并5.示例分析页分裂场景页合并场景总结Inn
excel中vba开发工具品尚公益团队 excel 前端 javascript
1、支持单元格点击出现弹框进行选择支持模多次模糊查询PrivateSubCommandButton1_Click()Callvehicle_查询EndSubPrivateSubWorksheet_Activate()Callvehicle_取出车架号和公司名称'取出不重复的车架号'Sheet13.ComboBox1.Visible=False'车架号显示'Sheet13.ComboBox2.Vis
路由器对不同数据帧的处理 lulinhao 数通基础学习网络数据帧
一、单播A：目的MAC地址是自己的MAC地址路由器在接收接口上收到帧，检查目的MAC地址，发现该地址与接收接口的MAC地址完全匹配，得知这个帧是发给自己的，就会接收该帧，并且剥离数据链路层的帧头和帧尾，开始处理数据包。A1：数据包的目的IP地址是单播1.目的IP地址是自己的IP地址，路由器将数据包交给上层协议栈处理2.目的IP地址不是自己的IP地址，查询路由表，如果没有找到匹配的路由条目，静默丢弃
《网络安全自学教程》- SQL注入漏洞详解士别三日wyx 《网络安全自学教程》sql 数据库网络安全安全 web安全
《网络安全自学教程》SQL注入的原理其实很简单：由于后端过滤不严格，把用户输入的数据当成SQL语句执行了。SQL注入1、SQL注入常出现在哪些功能？2、SQL注入危害3、SQL注入分类4、判断是否存在SQL注入5、SQL注入方式6、SQL注入防御6.1、预编译1、SQL注入常出现在哪些功能？凡是涉及「数据库操作的功能」，都有可能存在SQL注入，比如：搜索框等查询功能。用户注册/用户登录功能。密码找
java的(PO,VO,TO,BO,DAO,POJO) Cb123456 VO TO BO POJO DAO
转: http://www.cnblogs.com/yxnchinahlj/archive/2012/02/24/2366110.html ------------------------------------------------------------------- O/R Mapping 是 Object Relational Mapping（对象关系映
spring ioc原理（看完后大家可以自己写一个spring） aijuans spring
最近，买了本Spring入门书：spring In Action 。大致浏览了下感觉还不错。就是入门了点。Manning的书还是不错的，我虽然不像哪些只看Manning书的人那样专注于Manning,但怀着崇敬的心情和激情通览了一遍。又一次接受了IOC 、DI、AOP等Spring核心概念。先就IOC和DI谈一点我的看法。IO
MyEclipse 2014中Customize Persperctive设置无效的解决方法 Kai_Ge MyEclipse2014
高高兴兴下载个MyEclipse2014，发现工具条上多了个手机开发的按钮，心生不爽就想弄掉他！结果发现Customize Persperctive失效！！有说更新下就好了，可是国内Myeclipse访问不了，何谈更新... so~这里提供了更新后的一下jar包，给大家使用！ 1、将9个jar复制到myeclipse安装目录\plugins中 2、删除和这9个jar同包名但是版本号较
SpringMvc上传 120153216 springMVC
@RequestMapping(value = WebUrlConstant.UPLOADFILE) @ResponseBody public Map<String, Object> uploadFile(HttpServletRequest request,HttpServletResponse httpresponse) { try { //
Javascript----HTML DOM 事件何必如此 JavaScript html Web
HTML DOM 事件允许Javascript在HTML文档元素中注册不同事件处理程序。事件通常与函数结合使用，函数不会在事件发生前被执行！注：DOM：指明使用的 DOM 属性级别。 1.鼠标事件属性
动态绑定和删除onclick事件 357029540 JavaScript jquery
因为对JQUERY和JS的动态绑定事件的不熟悉，今天花了好久的时间才把动态绑定和删除onclick事件搞定!现在分享下我的过程。在我的查询页面，我将我的onclick事件绑定到了tr标签上同时传入当前行(this值)参数，这样可以在点击行上的任意地方时可以选中checkbox，但是在我的某一列上也有一个onclick事件是用于下载附件的，当
HttpClient|HttpClient请求详解 7454103 apache 应用服务器网络协议网络应用 Security
HttpClient 是 Apache Jakarta Common 下的子项目，可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包，并且它支持 HTTP 协议最新的版本和建议。本文首先介绍 HTTPClient，然后根据作者实际工作经验给出了一些常见问题的解决方法。HTTP 协议可能是现在 Internet 上使用得最多、最重要的协议了，越来越多的 Java 应用程序需
递归逐层统计树形结构数据 darkranger 数据结构
将集合递归获取树形结构: /** * * 递归获取数据 * @param alist:所有分类 * @param subjname:对应统计的项目名称 * @param pk:对应项目主键 * @param reportList: 最后统计的结果集 * @param count:项目级别 */ public void getReportVO(Arr
访问WEB-INF下使用frameset标签页面出错的原因 aijuans struts2
<frameset rows="61,*,24" cols="*" framespacing="0" frameborder="no" border="0">
MAVEN常用命令 avords
Maven库： http://repo2.maven.org/maven2/ Maven依赖查询： http://mvnrepository.com/ Maven常用命令： 1. 创建Maven的普通java项目： mvn archetype:create -DgroupId=packageName
PHP如果自带一个小型的web服务器就好了 houxinyou apache 应用服务器 Web PHP 脚本
最近单位用PHP做网站，感觉PHP挺好的，不过有一些地方不太习惯，比如，环境搭建。PHP本身就是一个网站后台脚本，但用PHP做程序时还要下载apache，配置起来也不太很方便，虽然有好多配置好的apache+php+mysq的环境，但用起来总是心里不太舒服，因为我要的只是一个开发环境，如果是真实的运行环境，下个apahe也无所谓，但只是一个开发环境，总有一种杀鸡用牛刀的感觉。如果php自己的程序中
NoSQL数据库之Redis数据库管理(list类型) bijian1013 redis 数据库 NoSQL
3.list类型及操作 List是一个链表结构，主要功能是push、pop、获取一个范围的所有值等等，操作key理解为链表的名字。Redis的list类型其实就是一个每个子元素都是string类型的双向链表。我们可以通过push、pop操作从链表的头部或者尾部添加删除元素，这样list既可以作为栈，又可以作为队列。 &nbs
谁在用Hadoop？ bingyingao hadoop 数据挖掘公司应用场景
Hadoop技术的应用已经十分广泛了，而我是最近才开始对它有所了解，它在大数据领域的出色表现也让我产生了兴趣。浏览了他的官网，其中有一个页面专门介绍目前世界上有哪些公司在用Hadoop，这些公司涵盖各行各业，不乏一些大公司如alibaba,ebay,amazon,google,facebook,adobe等，主要用于日志分析、数据挖掘、机器学习、构建索引、业务报表等场景,这更加激发了学习它的热情。
【Spark七十六】Spark计算结果存到MySQL bit1129 mysql
package spark.examples.db import java.sql.{PreparedStatement, Connection, DriverManager} import com.mysql.jdbc.Driver import org.apache.spark.{SparkContext, SparkConf} object SparkMySQLInteg
Scala: JVM上的函数编程 bookjovi scala erlang haskell
说Scala是JVM上的函数编程一点也不为过，Scala把面向对象和函数型编程这两种主流编程范式结合了起来，对于熟悉各种编程范式的人而言Scala并没有带来太多革新的编程思想，scala主要的有点在于Java庞大的package优势，这样也就弥补了JVM平台上函数型编程的缺失，MS家.net上已经有了F#，JVM怎么能不跟上呢？对本人而言
jar打成exe bro_feng java jar exe
今天要把jar包打成exe，jsmooth和exe4j都用了。遇见几个问题。记录一下。两个软件都很好使，网上都有图片教程，都挺不错。首先肯定是要用自己的jre的，不然不能通用，其次别忘了把需要的lib放到classPath中。困扰我很久的一个问题是，我自己打包成功后，在一个同事的没有装jdk的电脑上运行，就是不行，报错jvm.dll为无效的windows映像，如截图最后发现
读《研磨设计模式》-代码笔记-策略模式-Strategy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 策略模式定义了一系列的算法，并将每一个算法封装起来，而且使它们还可以相互替换。策略模式让算法独立于使用它的客户而独立变化简单理解： 1、将不同的策略提炼出一个共同接口。这是容易的，因为不同的策略，只是算法不同，需要传递的参数
cmd命令值cvfM命令 chenyu19891124 cmd
cmd命令还真是强大啊。今天发现jar -cvfM aa.rar @aaalist 就这行命令可以根据aaalist取出相应的文件例如：在d：\workspace\prpall\test.java 有这样一个文件，现在想要将这个文件打成一个包。运行如下命令即可比如在d：\wor
OpenJWeb(1.8) Java Web应用快速开发平台 comsci java 框架 Web 项目管理企业应用
OpenJWeb(1.8) Java Web应用快速开发平台的作者是我们技术联盟的成员，他最近推出了新版本的快速应用开发平台 OpenJWeb(1.8)，我帮他做做宣传 OpenJWeb快速开发平台以快速开发为核心，整合先进的java 开源框架，本着自主开发+应用集成相结合的原则，旨在为政府、企事业单位、软件公司等平台用户提供一个架构透
Python 报错：IndentationError: unexpected indent daizj python tab 空格缩进
IndentationError: unexpected indent 是缩进的问题，也有可能是tab和空格混用啦 Python开发者有意让违反了缩进规则的程序不能通过编译，以此来强制程序员养成良好的编程习惯。并且在Python语言里，缩进而非花括号或者某种关键字，被用于表示语句块的开始和退出。增加缩进表示语句块的开
HttpClient 超时设置 dongwei_6688 httpclient
HttpClient中的超时设置包含两个部分： 1. 建立连接超时，是指在httpclient客户端和服务器端建立连接过程中允许的最大等待时间 2. 读取数据超时，是指在建立连接后，等待读取服务器端的响应数据时允许的最大等待时间在HttpClient 4.x中如下设置： HttpClient httpclient = new DefaultHttpC
小鱼与波浪 dcj3sjt126com
一条小鱼游出水面看蓝天，偶然间遇到了波浪。　　小鱼便与波浪在海面上游戏，随着波浪上下起伏、汹涌前进。　　小鱼在波浪里兴奋得大叫：“你每天都过着这么刺激的生活吗？简直太棒了。”　　波浪说：“岂只每天过这样的生活，几乎每一刻都这么刺激！还有更刺激的，要有潮汐变化，或者狂风暴雨，那才是兴奋得心脏都会跳出来。”　　小鱼说：“真希望我也能变成一个波浪，每天随着风雨、潮汐流动，不知道有多么好！”　　很快，小鱼
Error Code: 1175 You are using safe update mode and you tried to update a table dcj3sjt126com mysql
快速高效用：SET SQL_SAFE_UPDATES = 0；下面的就不要看了！今日用MySQL Workbench进行数据库的管理更新时，执行一个更新的语句碰到以下错误提示： Error Code: 1175 You are using safe update mode and you tried to update a table without a WHERE that
枚举类型详细介绍及方法定义 gaomysion enum javaee
转发 http://developer.51cto.com/art/201107/275031.htm 枚举其实就是一种类型，跟int, char 这种差不多，就是定义变量时限制输入的，你只能够赋enum里面规定的值。建议大家可以看看，这两篇文章，《java枚举类型入门》和《C++的中的结构体和枚举》，供大家参考。枚举类型是JDK5.0的新特征。Sun引进了一个全新的关键字enum
Merge Sorted Array hcx2013 array
Given two sorted integer arrays nums1 and nums2, merge nums2 into nums1 as one sorted array. Note:You may assume that nums1 has enough space (size that is
Expression Language 3.0新特性 jinnianshilongnian el 3.0
Expression Language 3.0表达式语言规范最终版从2013-4-29发布到现在已经非常久的时间了；目前如Tomcat 8、Jetty 9、GlasshFish 4已经支持EL 3.0。新特性包括：如字符串拼接操作符、赋值、分号操作符、对象方法调用、Lambda表达式、静态字段/方法调用、构造器调用、Java8集合操作。目前Glassfish 4/Jetty实现最好，对大多数新特性
超越算法来看待个性化推荐 liyonghui160com 超越算法来看待个性化推荐
一提到个性化推荐，大家一般会想到协同过滤、文本相似等推荐算法，或是更高阶的模型推荐算法，百度的张栋说过，推荐40%取决于UI、30%取决于数据、20%取决于背景知识，虽然本人不是很认同这种比例，但推荐系统中，推荐算法起的作用起的作用是非常有限的。就像任何
写给Javascript初学者的小小建议 pda158 JavaScript
　　一般初学JavaScript的时候最头痛的就是浏览器兼容问题。在Firefox下面好好的代码放到IE就不能显示了，又或者是在IE能正常显示的代码在firefox又报错了。　　如果你正初学JavaScript并有着一样的处境的话建议你：初学JavaScript的时候无视DOM和BOM的兼容性，将更多的时间花在了解语言本身（ECMAScript）。只在特定浏览器编写代码（Chrome/Fi
Java 枚举 ShihLei java enum 枚举
注：文章内容大量借鉴使用网上的资料，可惜没有记录参考地址，只能再传对作者说声抱歉并表示感谢！一基础 1）语法枚举类型只能有私有构造器（这样做可以保证客户代码没有办法新建一个enum的实例）枚举实例必须最先定义 2）特性 &nb
Java SE 6 HotSpot虚拟机的垃圾回收机制 uuhorse java HotSpot GC 垃圾回收 VM
官方资料，关于Java SE 6 HotSpot虚拟机的garbage Collection，非常全，英文。 http://www.oracle.com/technetwork/java/javase/gc-tuning-6-140523.html Java SE 6 HotSpot[tm] Virtual Machine Garbage Collection Tuning &