wbj0110

Lucene关于实现Similarity自定义排序

开场白:
作为一个人才网站的搜索功能,不但需要考滤搜索性能与效率，与需要注意用户体验,主要体现于用户对搜索结果的满意程度.大家都知道Lucene的排序中,如果单纯使用Lucene的DefaultSimilarity作为一个相似度的排序,意思是说总体上越相关的记录需要排得越前,但事与愿违.这样使用户体现也表现得相当糟糕.关键字"程序员"标题中也不能保证全部都匹配到(搜索结果来自 www.jobui.com 职友集) [下图]

起因：之很长一段时间我都注重于搜索性能与速度的提高,而对于搜索结果对用户的体验却一直没有太多的关注,现在需要关注一下用户体现这个东西了.同时技术上也作为一些调整.具体表现如下.
1,用户最需要的搜索结果是标题命中.
2,因为我们从事人才招聘行业,所以职位的发布时间需要最新的.

所以经过各部门商量,职位搜索的结果排序应该是,相关度优先,然后才是职位的发布时间倒序.即如果关键字匹配是一定要全部命中了才会排在第一位,然后再是只命中一部分关键字记录.具体如下图,(搜索"php 开发",这样的话,只有php,开发这两个关键字都全部匹配了才会排前.然后全部命中关键字的记录按职位的发布时间来递减.)

开始:主要是继承Lucene中的Similarity作为一个相似度的实现,这里简单介绍一下相关的介绍
主要是几个排序影响因素去想的
在看代码之前先看看我们Lucene排序的一些影响因为,大家可以在搜索的时候，开启Explain的选项,这样就能看得清楚了
比如说,我现在要搜索 "开发工程" 这些关键字,然后就会把每一个Document的得分情况都列出来,大家就知道了,同时大家有没发现,这一个详细情况跟Similarity的需要实现的方法的因素基本都是对应的..比如 idf,tf queryNorm等方法..这样大家就有一个可以参考分析的方法了.

200.0 = (MATCH) sum of: 
  100.0 = (MATCH) weight(Name:开发^100.0 in 5), product of: 
    100.0 = queryWeight(Name:开发^100.0), product of: 
      100.0 = boost 
      1.0 = idf(docFreq=4, maxDocs=6) 
      1.0 = queryNorm 
    1.0 = (MATCH) fieldWeight(Name:开发 in 5), product of: 
      1.0 = tf(termFreq(Name:开发)=0) 
      1.0 = idf(docFreq=4, maxDocs=6) 
      1.0 = fieldNorm(field=Name, doc=5) 
  100.0 = (MATCH) weight(Name:工程^100.0 in 5), product of: 
    100.0 = queryWeight(Name:工程^100.0), product of: 
      100.0 = boost 
      1.0 = idf(docFreq=2, maxDocs=6) 
      1.0 = queryNorm 
    1.0 = (MATCH) fieldWeight(Name:工程 in 5), product of: 
      1.0 = tf(termFreq(Name:工程)=1) 
      1.0 = idf(docFreq=2, maxDocs=6) 
      1.0 = fieldNorm(field=Name, doc=5) 
  0.0 = (MATCH) weight(Info:开发^0.0 in 5), product of: 
    0.0 = queryWeight(Info:开发^0.0), product of: 
      0.0 = boost 
      1.0 = idf(docFreq=4, maxDocs=6) 
      1.0 = queryNorm 
    1.0 = (MATCH) fieldWeight(Info:开发 in 5), product of: 
      1.0 = tf(termFreq(Info:开发)=2) 
      1.0 = idf(docFreq=4, maxDocs=6) 
      1.0 = fieldNorm(field=Info, doc=5) 
  0.0 = (MATCH) weight(Info:工程^0.0 in 5), product of: 
    0.0 = queryWeight(Info:工程^0.0), product of: 
      0.0 = boost 
      1.0 = idf(docFreq=0, maxDocs=6) 
      1.0 = queryNorm 
    1.0 = (MATCH) fieldWeight(Info:工程 in 5), product of: 
      1.0 = tf(termFreq(Info:工程)=0) 
      1.0 = idf(docFreq=0, maxDocs=6) 
      1.0 = fieldNorm(field=Info, doc=5)

现在先看看实现 Similarity 类的方法

 1 package com.kernaling;  
 2     
 3 import org.apache.lucene.index.FieldInvertState;  
 4     
 5 public class BaicaiPositionSimilarity extends Similarity {  
 6     
 7       /** Implemented as 
 8        *  <code>state.getBoost()*lengthNorm(numTerms)</code>, where 
 9        *  <code>numTerms</code> is {@link FieldInvertState#getLength()} if {@link 
10        *  #setDiscountOverlaps} is false, else it's {@link 
11        *  FieldInvertState#getLength()} - {@link 
12        *  FieldInvertState#getNumOverlap()}. 
13        * 
14        *  <p><b>WARNING</b>: This API is new and experimental, and may suddenly 
15        *  change.</p> */  
16       @Override  
17       public float computeNorm(String field, FieldInvertState state) {  
18         final int numTerms;  
19         if (discountOverlaps)  
20           numTerms = state.getLength() - state.getNumOverlap();  
21         else  
22           numTerms = state.getLength();  
23         return (state.getBoost() * lengthNorm(field, numTerms));  
24       }  
25           
26       /** Implemented as <code>1/sqrt(numTerms)</code>. */  
27       @Override  
28       public float lengthNorm(String fieldName, int numTerms) {  
29 //        System.out.println("fieldName:" + fieldName + "\tnumTerms:" + numTerms);  
30 //      return (float)(1.0 / Math.sqrt(numTerms));  
31           return 1.0f;  
32       }  
33           
34       /** Implemented as <code>1/sqrt(sumOfSquaredWeights)</code>. */  
35       @Override  
36       public float queryNorm(float sumOfSquaredWeights) {  
37 //      return (float)(1.0 / Math.sqrt(sumOfSquaredWeights));\  
38         return 1.0f;  
39       }  
40     
41       /** Implemented as <code>sqrt(freq)</code>. */  
42 //        term freq 表示 term 在一个document的出现次数,这里设置为1.0f表示不考滤这个因素影响  
43 //    @Override  
44 //    public float tf(float freq) {  
45         return 1.0f;  
46     
47       }  
48             
49       /** Implemented as <code>1 / (distance + 1)</code>. */  
50          //这里表示匹配的 term　与 term之间的距离因素,同样也不应该受影响  
51       @Override  
52       public float sloppyFreq(int distance) {  
53         return 1.0f;  
54       }  
55             
56       /** Implemented as <code>log(numDocs/(docFreq+1)) + 1</code>. */  
57           //这里表示匹配的docuemnt在全部document的影响因素,同理也不考滤  
58       @Override  
59       public float idf(int docFreq, int numDocs) {  
60         return 1.0f;  
61       }  
62             
63       /** Implemented as <code>overlap / maxOverlap</code>. */  
64           //这里表示每一个Document中所有匹配的关键字与当前关键字的匹配比例因素影响,同理也不考滤.  
65       @Override  
66       public float coord(int overlap, int maxOverlap) {  
67         return 1.0f;  
68       }  
69     
70       // Default false  
71       protected boolean discountOverlaps;  
72     
73       /** Determines whether overlap tokens (Tokens with 
74        *  0 position increment) are ignored when computing 
75        *  norm.  By default this is false, meaning overlap 
76        *  tokens are counted just like non-overlap tokens. 
77        * 
78        *  <p><b>WARNING</b>: This API is new and experimental, and may suddenly 
79        *  change.</p> 
80        * 
81        *  @see #computeNorm 
82 */  
83       public void setDiscountOverlaps(boolean v) {  
84         discountOverlaps = v;  
85       }  
86     
87       /**@see #setDiscountOverlaps */  
88       public boolean getDiscountOverlaps() {  
89         return discountOverlaps;  
90       }  
91 }

按上面的相似度因素影响,基本上都设置为不受其他影响了,现在只剩下了关键字匹配数据的影响了,也就是我们需求中需要的.
然后做一个测试类:

  1 package com.kernaling;  
  2     
  3 import java.io.File;  
  4 import java.io.StringReader;  
  5     
  6 import org.apache.lucene.document.Document;  
  7 import org.apache.lucene.document.Field;  
  8 import org.apache.lucene.index.IndexWriter;  
  9 import org.apache.lucene.index.Term;  
 10 import org.apache.lucene.index.IndexWriter.MaxFieldLength;  
 11 import org.apache.lucene.search.BooleanClause;  
 12 import org.apache.lucene.search.BooleanQuery;  
 13 import org.apache.lucene.search.Explanation;  
 14 import org.apache.lucene.search.IndexSearcher;  
 15 import org.apache.lucene.search.ScoreDoc;  
 16 import org.apache.lucene.search.Sort;  
 17 import org.apache.lucene.search.SortField;  
 18 import org.apache.lucene.search.TermQuery;  
 19 import org.apache.lucene.search.TopDocs;  
 20 import org.apache.lucene.search.TopFieldCollector;  
 21 import org.apache.lucene.store.NIOFSDirectory;  
 22 import org.wltea.analyzer.IKSegmentation;  
 23 import org.wltea.analyzer.Lexeme;  
 24 import org.wltea.analyzer.lucene.IKAnalyzer;  
 25     
 26 public class LuceneSortSample {  
 27     public static void main(String[] args) {  
 28         try{  
 29     
 30             String path = "./Index";  
 31             IKAnalyzer analyzer = new IKAnalyzer();  
 32             MySimilarity similarity = new MySimilarity();  
 33                 
 34             boolean isIndex = false;    // true:要索引,false:表示要搜索   
 35                 
 36             if(isIndex){  
 37                 IndexWriter writer = new IndexWriter(new NIOFSDirectory(new File(path)),analyzer,MaxFieldLength.LIMITED);  
 38                 writer.setSimilarity(similarity);   //设置相关度  
 39                     
 40                 Document doc_0 = new Document();  
 41                 doc_0.add(new Field("Name","java 开发人员", Field.Store.YES, Field.Index.ANALYZED));  
 42                 doc_0.add(new Field("Info","招聘 网站开发人员,要求一年或以上工作经验", Field.Store.YES, Field.Index.ANALYZED));  
 43                 doc_0.add(new Field("Time","20100201", Field.Store.YES, Field.Index.NOT_ANALYZED));  
 44                 writer.addDocument(doc_0);  
 45                     
 46                     
 47                 Document doc_1 = new Document();  
 48                 doc_1.add(new Field("Name","高级开发人员(java 方向)", Field.Store.YES, Field.Index.ANALYZED));  
 49                 doc_1.add(new Field("Info","需要有四年或者以上的工作经验,有大型项目实践,java基本扎实", Field.Store.YES, Field.Index.ANALYZED));  
 50                 doc_1.add(new Field("Time","20100131", Field.Store.YES, Field.Index.NOT_ANALYZED));  
 51                 writer.addDocument(doc_1);  
 52                     
 53                     
 54                 Document doc_2 = new Document();  
 55                 doc_2.add(new Field("Name","php 开发工程师", Field.Store.YES, Field.Index.ANALYZED));  
 56                 doc_2.add(new Field("Info","主要是维护公司的网站php开发,能独立完成网站的功能", Field.Store.YES, Field.Index.ANALYZED));  
 57                 doc_2.add(new Field("Time","20100201", Field.Store.YES, Field.Index.NOT_ANALYZED));  
 58                 writer.addDocument(doc_2);  
 59                     
 60                     
 61                 Document doc_3 = new Document();  
 62                 doc_3.add(new Field("Name","linux 管理员", Field.Store.YES, Field.Index.ANALYZED));  
 63                 doc_3.add(new Field("Info","管理及维护公司的linux服务器,职责包括完成mysql数据备份及日常管理,apache的性能调优等", Field.Store.YES, Field.Index.ANALYZED));  
 64                 doc_3.add(new Field("Time","20100201", Field.Store.YES, Field.Index.NOT_ANALYZED));  
 65                 writer.addDocument(doc_3);  
 66                     
 67                     
 68                 Document doc_4 = new Document();  
 69                 doc_4.add(new Field("Name","lucene开发工作师", Field.Store.YES, Field.Index.ANALYZED));  
 70                 doc_4.add(new Field("Info","需要两年或者以上的从事lucene java 开发工作的经验,需要对算法,排序规则等有相关经验,java水平及基础要扎实", Field.Store.YES, Field.Index.ANALYZED));  
 71                 doc_4.add(new Field("Time","20100131", Field.Store.YES, Field.Index.NOT_ANALYZED));  
 72                 writer.addDocument(doc_4);  
 73                     
 74                     
 75                 Document doc_5 = new Document();  
 76                 doc_5.add(new Field("Name","php 软件工程师", Field.Store.YES, Field.Index.ANALYZED));  
 77                 doc_5.add(new Field("Info","具有大量的php开发经验,如熟悉 java 开发,数据库管理则更佳", Field.Store.YES, Field.Index.ANALYZED));  
 78                 doc_5.add(new Field("Time","20100130", Field.Store.YES, Field.Index.NOT_ANALYZED));  
 79                 writer.addDocument(doc_5);  
 80                     
 81                 writer.close();  
 82                 System.out.println("数据索引完成");  
 83             }else{  
 84                 IndexSearcher search = new IndexSearcher(new NIOFSDirectory(new File(path)));  
 85                 search.setSimilarity(similarity);  
 86                 String keyWords = "java开发";  
 87                     
 88                     
 89                 String fiels[] = {"Name","Info"};  
 90                     
 91                 BooleanQuery bq = new BooleanQuery();  
 92                 for(int i=0;i<fiels.length;i++){  
 93                         
 94                     IKSegmentation se = new IKSegmentation(new StringReader(keyWords), true);  
 95                     Lexeme le = null;  
 96                         
 97                     while((le=se.next())!=null){  
 98                         String tKeyWord = le.getLexemeText();  
 99                         String tFeild = fiels[i];  
100                         TermQuery tq = new TermQuery(new Term(fiels[i], tKeyWord));  
101                             
102                         if(tFeild.equals("Name")){  //在Name这一个Field需要给大的比重  
103                             tq.setBoost(100.0f);  
104                         }else{  
105                             tq.setBoost(0.0f);      //其他的不需要考滤  
106                         }  
107                             
108                         bq.add(tq, BooleanClause.Occur.SHOULD); //关键字之间是 "或" 的关系  
109                     }  
110                 }  
111                 System.out.println("搜索条件Query:" + bq.toString());  
112                 System.out.println();  
113                 Sort sort = new Sort(new SortField[]{new SortField(null,SortField.SCORE,false),new SortField("Time", SortField.INT,true)});  
114                 //先按记录的得分排序,然后再按记录的发布时间倒序  
115                 TopFieldCollector collector = TopFieldCollector.create(sort , 10  ,  false , true ,  false ,  false);  
116                     
117                 long l = System.currentTimeMillis();  
118                 search.search(bq, collector);  
119                 TopDocs tDocs = collector.topDocs();  
120                     
121                 ScoreDoc sDocs[] = tDocs.scoreDocs;  
122     
123                 int len = sDocs.length;  
124                     
125                 for(int i=0;i<len;i++){  
126                     ScoreDoc tScore = sDocs[i];  
127 //                  tScore.score 从Lucene3.0开始已经不能通过这样来得到些文档的得分了  
128                     int docId = tScore.doc;  
129                     Explanation exp = search.explain(bq, docId);  
130                         
131                     Document tDoc = search.doc(docId);  
132                     String Name = tDoc.get("Name");  
133                     String Info = tDoc.get("Info");  
134                     String Time = tDoc.get("Time");  
135                         
136                     float score = exp.getValue();  
137 //                  System.out.println(exp.toString());　如果需要打印文档得分的详细信息则可以通过此方法  
138                     System.out.println("DocId:"+docId+"\tScore:" + score + "\tName:" + Name + "\tTime:" + Time + "\tInfo:" + Info);  
139                 }  
140                 l = System.currentTimeMillis() - l;  
141                 System.out.println("搜索用时:" + l + "ms");  
142                 search.close();  
143             }  
144                 
145         }catch(Exception ex){  
146             ex.printStackTrace();  
147         }  
148     }  
149 }

建立完索引后然后就可以直接搜索了.效果图如下:

可以看到,我们现在搜索关键字"开发工程", 然后就可以看到DocID:为 0,2为关键字全部命中的文档,然后这两个文档就按时间倒序排了.
然后,DocId 1,4,5的话,就只匹配到部分的关键字,它肯定会比全部命中关键字的记录要排序要后,然后中命中部分关键字的记录又会按发布时间来倒序排了一次
对了，我是用 Lucene3.0 作为开发包的.与Lucene2.XX的很多接口都改了,包括Similarity 的继承类的方法也不同, 所以大家要注思,不过经过测试,只要相同的实现那么效果也是一样的.

注意:从上边的测试结果可以看到一个疑问,这些记录匹配的关键字 开发工程　中,无论是命中全部关键字还是一个,得到的score都是一样的,但是排序的时候却按我们之前设置的意义去排序,理论上来说,只匹配一半的关键字,score会是全部匹配的一半的,这里的话,不知道是否是一个bug.有待继续研究.同时职友集www.jobui.com与百才招聘 www.baicai.com 这两个网站的搜索功能还没有把这个想法用到上边去,现在只在本地的测试服务器中有效,因为这段时间有其他事情要做.请大家见谅.过年后左右,大家会有一个全新的搜索体验..谢谢.

来自互联网

什么是 React Native 程序猿经理 react native react.js javascript
ReactNative（简称RN）是Facebook于2015年4月开源的跨平台移动应用开发框架，它是Facebook早先开源的JS框架React在原生移动应用平台的衍生产物，支持iOS和安卓两大平台。以下是关于ReactNative的详细介绍：一、基本概述定义：ReactNative是一个使用React和应用平台的原生功能来构建Android和iOS应用的开源框架。起源：由Facebook开发并
python实现冒泡排序完整算法_利用python实现冒泡排序算法实例代码 weixin_39610759
利用python实现冒泡排序算法实例代码冒泡排序冒泡排序（英语：BubbleSort）是一种简单的排序算法。它重复地遍历要排序的数列，一次比较两个元素，如果他们的顺序错误就把他们交换过来。遍历数列的工作是重复地进行直到没有再需要交换，也就是说该数列已经排序完成。这个算法的名字由来是因为越小的元素会经由交换慢慢“浮”到数列的顶端。冒泡排序算法的运作如下：1、比较相邻的元素。如果第一个比第二个大（升序
服务器物理机如何实现系统快照,Lvm快照实现物理备份之自动化陶宇飞服务器物理机如何实现系统快照
环境：一台刚刚干净的linux服务器，使用centos系统create_kz.sh创建Lvm快照，实现备份#!/usr/bin/bash#创建一个lvm快照read-p'请输入新加磁盘的名字：'cpnamea=`lsblk|grep'sdb'|wc-l`if[!$a-eq1]thenecho'---'>/sys/class/scsi_host/host0/scanecho'---'>/sys/cl
BP神经网络概述及其预测的Python和MATLAB实现追蜻蜓追累了神经网络回归算法深度学习机器学习启发式算法 lstm gru
##一、背景###1.1人工神经网络的起源人工神经网络（ArtificialNeuralNetwork,ANN）受生物神经网络的启发，模拟大脑神经元之间的连接和信息处理方式。尽管早在1943年就有学者如McCulloch和Pitts提出了数学模型，但人工神经网络真正被广泛研究是在20世纪80年代。###1.2BP神经网络的兴起反向传播（BackPropagation，简称BP）算法是20世纪80年
React Hooks 基于 JS 闭包原理实现，但是闭包也会带来很多麻烦头脑旋风 javascript react.js 前端 react native
文章开始之前希望大家支持一下我独立开发的微信小程序“头脑旋风”，或微信扫描我的头像进入，谢谢支持~文章目录1.JS中的闭包2.ReactHooks中的闭包3.过时的闭包4.修复过时闭包的问题5.Hook中过时的闭包总结1.JS中的闭包下面定义了一个工厂函数createIncrement(i)，它返回一个increment函数。之后，每次调用increment函数时，内部计数器的值都会增加i。fun
基于ADB Shell 实现的 Android TV、电视盒子万能遥控器 — ADB Remote ATV sw-code adb android 电视盒子 tv
OrangePiZero3AndroidTV、电视盒子万能遥控器ADBRemoteATVAndroidTV的遥控器，基于ADBShell命令ADBRemoteATV是一个AndroidTV的遥控器，基于ADBShell命令，泛用性更高。下面的shell命令，是软件的基本原理，通过shell命令可模拟物理遥控器的基本按键，此外还可以快捷启动指定APP、借助手机软键盘输入中/英字符等。#输入事件adb
聊聊如何实现Android 放大镜效果咖啡老师 android
一、前言很久没有更新Android原生技术内容了，前些年一直在做跨端方向开发，最近换工作用重新回到原生技术，又回到了熟悉但有些生疏的环境，真是感慨万分。近期也是因为准备做地图交互相关的需求，功能非常复杂，尤其是交互部分，不过再复杂的交互，只要一点点将它拆解，分而治之，问题还是可以解决，就比如接下来要做的放大镜功能。二、功能设计该功能的场景是在操作地图时，对于边缘的精细化操作（像素级别的）需要在放大
3.解析logback.xml配置文件入口 uncleqiao slf4j logback slf4j
文章目录一、前言二、源码解析LogbackServiceProviderDefaultJoranConfiguratorJoranConfigurator三、总结一、前言前面介绍了slf4j相关的知识点,提到了实现模块是通过SLF4JServiceProvider进行自定义日志框架的,本节就来介绍logback的LogbackServiceProvider二、源码解析LogbackServiceP
React Native Sabrina_FN APP测试 react native react.js javascript
一、react框架简介：是一个用于构建用户界面的JavaScript库，主要用于构建UI，只专注于实现MVC中View层面的实现特点：声明式设计：使用声明式的编成方式，使得react逻辑足够简化高效：采用VirtualDom(虚拟dom)，减少与dom间交互的花费灵活：可以与已知库或者框架很好的配合JSX：执行速度快，类型安全、在编译过程中就能发现错误，像XML的JavaScript语法扩展，编写
使用 RunnableParallel 并行执行步骤的实践指南 GEAWfaacc 服务器 linux 运维 python
在现代软件开发中，优化计算效率是非常关键的任务。尤其在涉及大规模数据处理或复杂计算时，并行执行成为提高性能的重要手段。LangChain提供了RunnableParallel工具，能够方便地将多个计算过程并行化执行。本文将通过实例代码，深入解析如何利用RunnableParallel实现计算过程的并行化。技术背景介绍RunnableParallel是一个强大的工具，可以将多个可运行的任务（即Run
2024年Vue面试题汇总 2401_89210258 vue.js 前端 javascript
流程图如下：vue核心知识——语法篇1.请问v-if和v-show有什么区别？相同点：两者都是在判断DOM节点是否要显示。不同点：a.实现方式：v-if是根据后面数据的真假值判断直接从Dom树上删除或重建元素节点。v-show只是在修改元素的css样式，也就是display的属性值，元素始终在Dom树上。b.编译过程：v-if切换有一个局部编译/卸载的过程，切换过程中合适地销毁和重建内部的事件监听
【深度学习】Pytorch：导入导出模型参数 T0uken 深度学习 pytorch 人工智能
PyTorch是深度学习领域中广泛使用的框架，熟练掌握其模型参数的管理对于模型训练、推理以及部署非常重要。本文将全面讲解PyTorch中关于模型参数的操作，包括如何导出、导入以及如何下载模型参数。什么是模型参数模型参数是指深度学习模型中需要通过训练来优化的变量，如神经网络中的权重和偏置。这些参数存储在PyTorch的torch.nn.Module对象中，通过以下方式访问：importtorchim
RabbitMQ-消息可靠性以及延迟消息 mikey棒棒棒 java 中间件开发语言消息可靠性死信交换机惰性队列 rabbitmq
目录消息丢失一、发送者的可靠性1.1生产者重试机制1.2生产者确认机制1.3实现生产者确认（1）开启生产者确认（2）定义ReturnCallback（3）定义ConfirmCallback二、MQ的持久化2.1数据持久化2.2LazyQueue2.2.1控制台配置Lazy模式2.2.2代码配置Lazy模式2.2.3更新已有队列为lazy模式三、消费者的可靠性3.1消费者确认机制3.2失败重试机制3
AWS VPC及其网络还是转转云原生 aws 网络云计算
目录：AWS概述EMRServerlessAWSVPC及其网络关于AWS网络架构的思考网络作为云服务的交付手段，同时也是云内部体系的支撑骨架，是一项不可或缺的基础设施，所以这个系列先从AWS上的网络环境开始讲起。VPC（VirtualPrivateCloud）VPC是AWS上的一项重要且常用服务，它提供逻辑上隔离的私有网络环境。所谓隔离，即为该VPC与Internet以及其它VPC相隔绝，限制其间
Python气象数据分析：风速预报订正、台风预报数据智能订正、机器学习预测风电场的风功率、浅水模型、预测ENSO等小艳加油大气科学 python 人工智能气象机器学习
目录专题一Python和科学计算基础专题二机器学习和深度学习基础理论和实操专题三气象领域中的机器学习应用实例专题四气象领域中的深度学习应用实例更多应用Python是功能强大、免费、开源，实现面向对象的编程语言，在数据处理、科学计算、数学建模、数据挖掘和数据可视化方面具备优异的性能，这些优势使得Python在气象、海洋、地理、气候、水文和生态等地学领域的科研和工程项目中得到广泛应用。可以预见未来Py
python tornado websocket ping_tornado WebSocket详解 weixin_39978276 python tornado websocket ping
1.什么是WebSocketwebsocket和长轮询的区别是客户端和服务器之间是持久连接的双向通信。协议使用ws://URL格式，但它在是在标准HTTP上实现的。2.tornado的WebSocket模块tornado在websocket模块中提供了一个WebSocketHandler类，这个类提供了和已连接的客户端通信的WebSocket事件和方法的钩子。open方法，新的WebSocket连
沈阳市DRG分组BR2组分析条形码D drg分组器 drg 健康医疗
关于沈阳BR2组入组规则总结（脑缺血性疾患）第二版沈阳征先科技有限公司2023-10-1诊断G45.004（后循环缺血）在CHS-DRG1.1中所属ADRG为BZ1(神经系统其他疾患)。经多家医院BR2入组情况分析：G45.004在沈阳入ADRG为BR2(脑缺血性疾患)。沈阳BR2入DRG组并未按照国家标准进行一般或严重并发症或合并症判断。沈阳BR2组权重和费率：权重BR21脑缺血性疾患，伴严重并
pytest 通过实例讲清单元测试、集成测试、测试覆盖率 Coding Is Fun pytest 单元测试集成测试
1.单元测试概念定义:单元测试是对代码中最小功能单元的测试，通常是函数或类的方法。目标:验证单个功能是否按照预期工作，而不依赖其他模块或外部资源。特点:快速、独立，通常是开发者最先编写的测试。示例：pytest实现单元测试#功能模块：一个简单的数学函数defadd(x,y):"""加法函数"""returnx+ydefdivide(x,y):"""除法函数，包含除零检查"""ify==0:rais
【线性代数】列主元法求矩阵的逆 BlackPercy 线性代数 Julialang 线性代数矩阵机器学习
列主元方法是一种用于求解矩阵逆的数值方法，特别适用于在计算机上实现。其基本思想是通过高斯消元法将矩阵转换为上三角矩阵，然后通过回代求解矩阵的逆。以下是列主元方法求解矩阵AAA的逆的步骤：步骤1：初始化构造增广矩阵[A∣I][A|I][A∣I]，其中III是nnn阶单位矩阵。步骤2：列主元选择对于第kkk列（k=1,2,…,nk=1,2,\ldots,nk=1,2,…,n），找到列主元，即找到iki
RT-DETR改进策略【Neck】| PRCV 2023，SBA（Selective Boundary Aggregation）：特征融合模块，描绘物体轮廓重新校准物体位置，解决边界模糊问题 Limiiiing RT-DETR改进专栏人工智能计算机视觉深度学习 RT-DETR
一、本文介绍本文主要利用DuAT中的SBA模块优化RT-DETR的目标检测网络模型。SBA模块借鉴了医疗图像分割中处理边界信息的独特思路，通过创新性的结构设计，在维持合理计算复杂度的基础上，巧妙融合浅层的边界细节特征与深层的语义信息，实现边界特征的精准提取与语义信息的有效整合。将其应用于RT-DETR的改进过程中，能够使模型着重聚焦于目标物体的边界区域，降低背景及其他无关信息的影响，强化目标物体的
盗梦空间：真的能实现从梦中偷取信息吗？烁月_o9 安全网络 web安全其他
《盗梦空间》是一部2010年上映的科幻电影。它由克里斯托弗·诺兰执导，莱昂纳多·迪卡普里奥主演。影片剧情游走于梦境与现实之间，讲述了一群专业的盗梦贼，利用先进的技术进入他人梦境，从他人的潜意识中进行信息提取或者植入的故事。例如，主角柯布是经验老到的窃贼，他带领团队执行了一项在目标人物费舍深层梦境中植入想法的艰难任务，他们在梦境里层层深入，每一层都有不同的危险和挑战，包括被目标人物潜意识中的防御者攻
自学 python 中的异步编程 asyncio (五)：asyncio 与线程thread Eaton5959 python
自学python中的异步编程asyncio(一)：学习基本概念自学python中的异步编程asyncio(二)：asyncio模块与核心组件自学python中的异步编程asyncio(三)：asyncio实现基本异步编程自学python中的异步编程asyncio(四)：基本的异步IO编程自学python中的异步编程asyncio(五)：asyncio与线程thread自学python中的异步编程a
Powerbi可视化分析第三方插件.rar id16721140 powerbi
PBI可视化分析插件，可实现多样化展示！！！！！要的留言！100%StackedBarChartbyAkvelon.pbiviz100%StackedColumnChartbyAkvelon.pbiviz3AGSystems-BarChartWithAbsoluteVariance.pbiviz3AGSystems-BarChartWithRelativeVariance.pbiviz3AGSys
数据结构之循环队列C语言实现（详细） ck8719 数据结构与算法队列数据结构算法 leetcode c#
队列的一些说明队列的定义队列，一种特殊的线性表特点：只允许在一端输入，在另一端输出。输入端称为队尾，输出端称为队头因此，队列，又称为先进先出表（FIFO），类似于生活中的排队，先来的排在前头，后来的排在后头，一个一个办理业务。队列有两种，一种叫做循环队列（顺序队列），另一种叫做链式队列。这一篇讲的是循环队列，链式队列在另外一篇文章中链式队列讲解与C++实现循环数组循环队列使用的是数组，但是这个数组
NextJs - 服务端组件如何拿到当前页面的URL或者参数 Zong_0915 javascript 前端开发语言 NextJs
NextJs-服务端组件如何拿到当前页面的URL或者参数前言一.NextJs如何拿到当前页面URL二.NextJs拿URL参数的两种方式前言NextJs中，如果你是服务端组件，并且是App路由模式，如果想拿到当前URL，我们只能通过中间件获取，并通过header来实现交互。想再学习下中间件的可以参考我的这篇文章：NextJs初级篇-安装|路由|中间件一.NextJs如何拿到当前页面URL我们编写根
库函数的模拟实现（memset、memcmp）扶我起来我还能再做一题 c语言开发语言
一、memset函数说明还是贴上cplusplus的网址！函数总结：功能:memset函数将指定的值填充到内存块中。这个值被解释为无符号字符（unsignedchar），并且连续地设置内存块的前num个字节。参数:ptr:指向要填充的内存块的指针。value:要设置的值。虽然这个值以int类型传递，但实际填充时会将其转换为无符号字符。num:要设置的字节数，使用size_t类型，这是一个无符号整型
【Python】super() 函数和 MRO 顺序的实例剖析彭彭不吃虫子 python 开发语言
1.构造函数（__init__(self[,...])）在类中定义__init__()方法，可以实现在实例化对象的时候进行个性化定制：>>>classC:... def__init__(self,x,y):... self.x=x... self.y=y... defadd(self):... returnself.x+self.y... defmu
基于R语言的DICE模型实践技术应用；评估气候变化对经济的影响以及不同减排政策的经济成本和效益 KY_chenzhao DICE模型 R语言气候变化
DICE模型是一个动态综合气候经济模型，由诺贝尔经济学奖得主WilliamNordhaus开发，用于评估气候变化对经济的影响以及不同减排政策的经济成本和效益。以下是一个关于DICE模型在气候变化影响评估中的实际应用案例，结合R语言代码进行讲解。实际案例：评估全球碳税政策的影响假设我们要评估一项全球碳税政策对经济增长、碳排放和气候变化的影响。我们将使用DICE模型的基本框架来进行分析。模型构建经济部
循环队列C语言实现 Helpsen 数据结构与算法 c语言开发语言后端
循环队列C语言实现特性：先进先出(FirstInFirstOut=FIFO)，取数从队列的开头取，存储从队列尾部存。第一个元素又称首元素,最后一个元素又称尾元素。Linux系统三大队列：消息队列：进程间通信的一种手段。工作队列：延后执行的一种手段。等待队列：随时随地让进程休眠并且让进程随时随地被唤醒。/*循环队列*/#include#include/*声明描述队列属性的结构体*/typedefst
构建一个查询分析系统 AWsggdrg 数据库 python
技术背景介绍在构建一个查询分析系统时，需要能够加载文档、使用聊天模型、生成嵌入、创建向量存储并执行检索。这些过程的目标是将用户输入的查询优化，以实现更为精准的检索结果。本文将通过一个端到端的示例展示如何使用查询分析提升检索结果的相关性。我们将着眼于如何对LangChain的YouTube视频进行检索，并通过查询分析解决原始用户问题直接传递给搜索引擎时可能出现的失败模式。核心原理解析查询分析的核心在
java工厂模式 3213213333332132 java 抽象工厂
工厂模式有 1、工厂方法 2、抽象工厂方法。下面我的实现是抽象工厂方法, 给所有具体的产品类定一个通用的接口。 package 工厂模式; /** * 航天飞行接口 * * @Description * @author FuJianyong * 2015-7-14下午02:42:05 */ public interface SpaceF
nginx频率限制+python测试 ronin47 nginx 频率 python
部分内容参考：http://www.abc3210.com/2013/web_04/82.shtml 首先说一下遇到这个问题是因为网站被攻击，阿里云报警，想到要限制一下访问频率，而不是限制ip（限制ip的方案稍后给出）。nginx连接资源被吃空返回状态码是502，添加本方案限制后返回599，与正常状态码区别开。步骤如下：
java线程和线程池的使用 dyy_gusi ThreadPool thread Runnable timer
java线程和线程池一、创建多线程的方式 java多线程很常见，如何使用多线程，如何创建线程，java中有两种方式，第一种是让自己的类实现Runnable接口，第二种是让自己的类继承Thread类。其实Thread类自己也是实现了Runnable接口。具体使用实例如下： 1、通过实现Runnable接口方式 1 2
Linux 171815164 linux
ubuntu kernel http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.1.2-unstable/ 安卓sdk代理 mirrors.neusoft.edu.cn 80 输入法和jdk sudo apt-get install fcitx su
Tomcat JDBC Connection Pool g21121 Connection
Tomcat7 抛弃了以往的DBCP 采用了新的Tomcat Jdbc Pool 作为数据库连接组件，事实上DBCP已经被Hibernate 所抛弃，因为他存在很多问题，诸如：更新缓慢，bug较多，编译问题，代码复杂等等。 Tomcat Jdbc P
敲代码的一点想法永夜-极光 java 随笔感想
入门学习java编程已经半年了,一路敲代码下来,现在也才1w+行代码量,也就菜鸟水准吧,但是在整个学习过程中,我一直在想,为什么很多培训老师,网上的文章都是要我们背一些代码?比如学习Arraylist的时候,教师就让我们先参考源代码写一遍,然
jvm指令集程序员是怎么炼成的 jvm 指令集
转自：http://blog.csdn.net/hudashi/article/details/7062675#comments 将值推送至栈顶时 const ldc push load指令 const系列该系列命令主要负责把简单的数值类型送到栈顶。(从常量池或者局部变量push到栈顶时均使用) 0x02 &nbs
Oracle字符集的查看查询和Oracle字符集的设置修改 aijuans oracle
本文主要讨论以下几个部分：如何查看查询oracle字符集、修改设置字符集以及常见的oracle utf8字符集和oracle exp 字符集问题。一、什么是Oracle字符集 Oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储，处理，检索数据。它使数据库工具，错误消息，排序次序，日期，时间，货
png在Ie6下透明度处理方法 antonyup_2006 css 浏览器 Firebug IE
由于之前到深圳现场支撑上线，当时为了解决个控件下载，我机器上的IE8老报个错，不得以把ie8卸载掉，换个Ie6,问题解决了，今天出差回来，用ie6登入另一个正在开发的系统，遇到了Png图片的问题，当然升级到ie8(ie8自带的开发人员工具调试前端页面JS之类的还是比较方便的，和FireBug一样，呵呵)，这个问题就解决了，但稍微做了下这个问题的处理。我们知道PNG是图像文件存储格式，查询资
表查询常用命令高级查询方法(二) 百合不是茶 oracle 分页查询分组查询联合查询
----------------------------------------------------分组查询 group by having --平均工资和最高工资 select avg(sal)平均工资,max(sal) from emp ; --每个部门的平均工资和最高工资
uploadify3.1版本参数使用详解 bijian1013 JavaScript uploadify3.1
使用：绑定的界面元素<input id='gallery'type='file'/>$("#gallery").uploadify({设置参数，参数如下}); 设置的属性： id: jQuery(this).attr('id'),//绑定的input的ID langFile: 'http://ww
精通Oracle10编程SQL(17)使用ORACLE系统包 bijian1013 oracle 数据库 plsql
/* *使用ORACLE系统包 */ --1.DBMS_OUTPUT --ENABLE:用于激活过程PUT,PUT_LINE,NEW_LINE,GET_LINE和GET_LINES的调用 --语法：DBMS_OUTPUT.enable(buffer_size in integer default 20000); --DISABLE:用于禁止对过程PUT,PUT_LINE,NEW
【JVM一】JVM垃圾回收日志 bit1129 垃圾回收
将JVM垃圾回收的日志记录下来，对于分析垃圾回收的运行状态，进而调整内存分配(年轻代，老年代，永久代的内存分配)等是很有意义的。JVM与垃圾回收日志相关的参数包括： -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -Xloggc -XX:+PrintGC 通
Toast使用白糖_ toast
Android中的Toast是一种简易的消息提示框，toast提示框不能被用户点击，toast会根据用户设置的显示时间后自动消失。创建Toast 两个方法创建Toast makeText(Context context, int resId, int duration) 参数：context是toast显示在
angular.identity boyitech AngularJS AngularJS API
angular.identiy 描述: 返回它第一参数的函数. 此函数多用于函数是编程. 使用方法: angular.identity(value); 参数详解: Param Type Details value * to be returned. 返回值: 传入的value 实例代码: <!DOCTYPE HTML>
java-两整数相除，求循环节 bylijinnan java
import java.util.ArrayList; import java.util.List; public class CircleDigitsInDivision { /** * 题目：求循环节，若整除则返回NULL，否则返回char*指向循环节。先写思路。函数原型：char*get_circle_digits(unsigned k,unsigned j)
Java 日期周年 Chen.H java C++c C#
/** * java日期操作(月末、周末等的日期操作) * * @author * */ public class DateUtil { /** */ /** * 取得某天相加(减)後的那一天 * * @param date * @param num *
[高考与专业]欢迎广大高中毕业生加入自动控制与计算机应用专业 comsci 计算机
不知道现在的高校还设置这个宽口径专业没有,自动控制与计算机应用专业,我就是这个专业毕业的,这个专业的课程非常多,既要学习自动控制方面的课程,也要学习计算机专业的课程,对数学也要求比较高.....如果有这个专业,欢迎大家报考...毕业出来之后,就业的途径非常广..... 以后
分层查询（Hierarchical Queries） daizj oracle 递归查询层次查询
Hierarchical Queries If a table contains hierarchical data, then you can select rows in a hierarchical order using the hierarchical query clause: hierarchical_query_clause::= start with condi
数据迁移 daysinsun 数据迁移
最近公司在重构一个医疗系统，原来的系统是两个.Net系统，现需要重构到java中。数据库分别为SQL Server和Mysql，现需要将数据库统一为Hana数据库，发现了几个问题，但最后通过努力都解决了。 1、原本通过Hana的数据迁移工具把数据是可以迁移过去的，在MySQl里面的字段为TEXT类型的到Hana里面就存储不了了，最后不得不更改为clob。 2、在数据插入的时候有些字段特别长
C语言学习二进制的表示示例 dcj3sjt126com c basic
进制的表示示例 # include <stdio.h> int main(void) { int i = 0x32C; printf("i = %d\n", i); /* printf的用法 %d表示以十进制输出 %x或%X表示以十六进制的输出 %o表示以八进制输出 */ return 0; }
NsTimer 和 UITableViewCell 之间的控制 dcj3sjt126com ios
情况是这样的: 一个UITableView, 每个Cell的内容是我自定义的 viewA viewA上面有很多的动画, 我需要添加NSTimer来做动画, 由于TableView的复用机制, 我添加的动画会不断开启, 没有停止, 动画会执行越来越多. 解决办法: 在配置cell的时候开始动画, 然后在cell结束显示的时候停止动画查找cell结束显示的代理
MySql中case when then 的使用 fanxiaolong casewhenthenend
select "主键", "项目编号", "项目名称","项目创建时间", "项目状态","部门名称","创建人" union (select pp.id as "主键", pp.project_number as &
Ehcache（01）——简介、基本操作 234390216 cache ehcache 简介 CacheManager crud
Ehcache简介目录 1 CacheManager 1.1 构造方法构建 1.2 静态方法构建 2 Cache 2.1&
最容易懂的javascript闭包学习入门 jackyrong JavaScript
http://www.ruanyifeng.com/blog/2009/08/learning_javascript_closures.html 闭包（closure）是Javascript语言的一个难点，也是它的特色，很多高级应用都要依靠闭包实现。下面就是我的学习笔记，对于Javascript初学者应该是很有用的。一、变量的作用域要理解闭包，首先必须理解Javascript特殊
提升网站转化率的四步优化方案 php教程分享数据结构 PHP 数据挖掘 Google 活动
网站开发完成后,我们在进行网站优化最关键的问题就是如何提高整体的转化率，这也是营销策略里最最重要的方面之一，并且也是网站综合运营实例的结果。文中分享了四大优化策略：调查、研究、优化、评估，这四大策略可以很好地帮助用户设计出高效的优化方案。 PHP开发的网站优化一个网站最关键和棘手的是，如何提高整体的转化率，这是任何营销策略里最重要的方面之一，而提升网站转化率是网站综合运营实力的结果。今天，我就分
web开发里什么是HTML5的WebSocket？ naruto1990 Web html5 浏览器 socket
当前火起来的HTML5语言里面，很多学者们都还没有完全了解这语言的效果情况，我最喜欢的Web开发技术就是正迅速变得流行的 WebSocket API。WebSocket 提供了一个受欢迎的技术，以替代我们过去几年一直在用的Ajax技术。这个新的API提供了一个方法，从客户端使用简单的语法有效地推动消息到服务器。让我们看一看6个HTML5教程介绍里的 WebSocket API：它可用于客户端、服
Socket初步编程——简单实现群聊 Everyday都不同 socket 网络编程初步认识
初次接触到socket网络编程，也参考了网络上众前辈的文章。尝试自己也写了一下，记录下过程吧：服务端：（接收客户端消息并把它们打印出来） public class SocketServer { private List<Socket> socketList = new ArrayList<Socket>(); public s
面试：Hashtable与HashMap的区别（结合线程） toknowme
昨天去了某钱公司面试，面试过程中被问道 Hashtable与HashMap的区别？当时就是回答了一点，Hashtable是线程安全的，HashMap是线程不安全的，说白了，就是Hashtable是的同步的，HashMap不是同步的，需要额外的处理一下。今天就动手写了一个例子，直接看代码吧 package com.learn.lesson001; import java
MVC设计模式的总结 xp9802 设计模式 mvc 框架 IOC
随着Web应用的商业逻辑包含逐渐复杂的公式分析计算、决策支持等，使客户机越来越不堪重负，因此将系统的商业分离出来。单独形成一部分，这样三层结构产生了。其中‘层’是逻辑上的划分。三层体系结构是将整个系统划分为如图2.1所示的结构[3] （1）表现层（Presentation layer）：包含表示代码、用户交互GUI、数据验证。该层用于向客户端用户提供GUI交互，它允许用户

Lucene关于实现Similarity自定义排序

你可能感兴趣的:(Lucene关于实现Similarity自定义排序)