Ke_Ca

Geohash应用——附近乡镇信息挖掘（提升检索召回与准确）

摘要

Geohash在LBS领域的应用开发很常见，常常应用于查询附近的人或门店等应用程序中。这里不再介绍Geohash的原理，其原理详见：GeoHash核心原理解析。这里主要讲一个Geohash的另一种应用：挖掘热点地名/地址信息，补充实体POI（Point Of interest)信息，辅助扩大检索召回。

一、背景介绍

二、解决方案

三、拓展与思考

四、代码实现

五、参考文献

一、背景介绍

在LBS检索中，用户检索query往往是where+what的检索，例如：q=桂平市西山镇长安小学。为了提高检索准确率，必然是会想办法解析出where，桂平市、西山镇，然后给用户查找what=长安小学。如果提供给检索的数据（这里指POI点）信息很全，比如：数据的地址字段（addr）含有“西山镇”，又或者名字字段（name）包含西山镇，例如：长安小学（西山镇分校），又或者有其他地址信息中包含“西山镇”，都可以辅助引擎检索召回，同时，当长安小学有很多时，数据字段越丰富，越准确，还能进一步提升排序的合理性。

但现实世界往往是极其残酷的，说的不夸张一点，提供给检索引擎的数据，几乎都是东拼西凑的，数据制作工艺参差不齐。数据信息除了错，最大的问题之一就是信息不全，不够精细。特别是对于那些多源数据融合的检索数据，往往都存在类似问题。仅对LBS领域来说，一些小作坊的POI数据，往往存在缺失“省/市/区”三级以下的“地理信息”，即乡/镇/村/道路/道路门牌等。在这样的情况下，如何能够给那些“地理”信息不全的POI进行信息补全呢？从而提高检索的召回率与准确率。此文，正是要讨论解决的这一难题，它的解决方案，恰恰是Geohash的一个典型应用案例。

二、解决方案

思路：针对一个POI点，查找它附近点的地理信息。将附近点的地域信息经过一定的筛选和过滤，然后赋值给该POI点上的某个字段，从而补全该POI点的地理信息。

不难发现，一提及“附近”，这就很容易想到Geohash。这里提出一个极其简单的解决方案，在实际应用中，各位还需结合自己的业务进行完善。

前提条件：

<1> 已有“地名地址信息;行政区划”类目的POI数据，此类数据为：省、市、区、街道/乡/镇、村等行政区划的POI数据;

<2> 每个POI数据均具有名称、地址、省、市、区、经纬度、行政区划编码、类别等基础字段。

任务需求：利用以上“地名地址信息;行政区划”类目的POI数据，为其他POI点补充“地理信息” ，新增hot_place字段存放。

【注】仅补充区级以下，不用补充省、市、区一级的地理信息，因为它们已经是基础字段信息了。默认是必备的。

具体解决方案与步骤

<1> 利用Geohash算法，对已有“地名地址信息;行政区划”类目的POI数据进行编码，构建词表，存放在town_geohash.map文件中。

<2> 遍历目标POI数据，利用经纬度字段计算出自身的Geohash值，再由该值查找出其附近8个格子的Geohash值。（类似9宫格，自身与其周边的8个方格，具体如图）；

<3> 利用步骤2得到的9个格子的Geohash值，查找构建的行政区划词表（town_geohash.map），找出每个格子对应的行政区划数据（名称和经纬度），并计算每个行政区划数据与目标POI点的距离。

<4> 设定一个距离阈值r。目标POI点与要添加的行政区划数据的距离必须小于r，才能成为候选集。在候选集中，取距离最近的行政区划信息，补充至目标POI上，并存入hot_place字段。这里的筛选条件，是最简单的距离限制条件，并取最小值。

以上4个步骤，就完成了任务需求。需要注意的是，步骤4中设定的距离阈值r，其实是影响到Geohash精度的选取的，即Geohash值的长度。这里，需要注意；因为步骤<1>构建词表与步骤<2>计算每个目标POI点的Geohash，需保持相同的Geohash精度值（即长度）。

三、拓展与思考

上一节，在实现步骤<4>提到，筛选条件仅用了距离因子进行了限制。并最终选取距离最小的一个。筛选条件，是一个值得思考和深究的地方。它极大影响了添加“地理信息”的准确率。

此文的任务需求是：增添行政区划数据，一个POI在一个级别也就只有一个行政区划信息。所以，找距离最小的一个，在这个任务场景下，仅靠距离因素限制，一般问题也不大，往往准确率也能达标。但如果增加的是“热点地名，商圈”等地理信息。比如，王府井，理想国大厦，望京，中关村等。仅利用距离因子作为限制条件，现实情况下，准确率常常是不达标的。那么，应该怎么做呢？

如果是热点地名与商圈的地理信息补充，可以考虑，利用目标POI点与其周边格子所处位置，进行限制。比如，必须呈包含目标POI点的态势时，才能添加。怎么定义包含态势呢？这个读者可以自行定义与实现。这里举2个实例：

a、目标点处于中心位，其余8个格子都包含“望京”这样一个商圈地理信息。这是典型的包含态势，目标POI点可增加商圈“望京”；

b、目标点上/下（南北），左/右（东西），对角线格子均具有相同的地理信息，这种也可视为呈包含态势（大致如图2-1所呈现的样子）。

图2-1，展示了目标POI点以及周边8个格子的示意图。可以想象每个Geohash的格子都包含了一些地理信息。

图2-1，目标POI点与其周边8个格子的9宫格示意图

为了提高添加的“地理信息”的准确度。总结一下，本人能想到的限制条件主要有以下3方面：

1、距离条件是基础，必须有距离限制；

2、目标POI点所处格子与欲添加地理信息所处格子的位置态势进行限制；

3、为目标POI点增加某一个地理信息，该地理信息在单个格子出现的次数，以及它被距离条件筛选后，总体出现的次数。

【注】某个地理信息出现的次数：可理解为有多少个POI具有该地理信息。

四、代码实现

代码实现，使用的是scala语言。Scala可以方便的调用Java语言的jar包。因此，你也可以理解为是Java实现的。这里有利用了Java的两个重要的jar包。

利用Spatial4j包计算两个经纬度之间的球面距离；利用ch.hsr.geohash包获取一个geohash周边8个网格（geohash）的方法


    org.locationtech.spatial4j
    spatial4j
    0.7



      ch.hsr
      geohash
      1.3

以上两个包都能计算Geohash值。Geohash的长度对应了不同的精度。长度与精度对照表如下（最长为12）：

geohash码长度	宽度	高度
1	5,009.4km	4,992.6km
2	1,252.3km	624.1km
3	156.5km	156km
4	39.1km	19.5km
5	4.9km	4.9km
6	1.2km	609.4m
7	152.9m	152.4m
8	38.2m	19m
9	4.8m	4.8m
10	1.2m	59.5cm
11	14.9cm	14.9cm
12	3.7cm	1.9cm

按照第二章解决方案的1~4的步骤实现。这里先要敲定距离阈值r，假定r=2公里，则Geohash的长度应选5（即4.9km,4.9km的格子）。由对照表可知如果选择Geohash长度为6（对应1.2km，0.6km），构造出的9宫格，是不满足需求的，会有漏掉满足距离目标POI点为2公里的行政区划POI点的。这是为什么，请大家自己思考吧。

先把行政区划数据和结果词表geohash_map词表文件的样例贴出：

//这里对行政区划POI做了信息抽取，直接是town-name city  经纬度，存放到town.txt文件中，具体格式如下：
舒庄乡  周口市  114.454095,33.509907
幸福乡  乐山市  103.89755,28.939625
张家塬镇        宝鸡市  107.117532,34.699135
大林乡  忻州市  112.723693,38.856616
穆店乡  淮安市  118.605614,32.917239

//由town.txt构建的Geohash词表，存放在geohash_map词表中，第一列是5位的Geohash值，后面是城镇信息，具体格式如下：
wscey: 万福镇|吉安市|114.885236,27.419279
ws4wq: 新亨镇|揭阳市|116.289072,23.624153
wqry3: 和川镇|临汾市|112.23623,36.264385
wt45m: 石鼻镇|南昌市|115.573624,28.726617
ybe87: 铁林街道|伊春市|128.833531,47.864312
wq3d9: 免古池乡|临夏回族自治州|103.42043,35.619691

步骤1：利用行政区划POI构建geohash_map词表

 /**
   * @define 利用原始词表town.txt构建geohash_map词表.
   * @param fpath
   * @param output
   * @param len
   */
  def init_town_map(fpath: String, output: String, len: Int = 5): Unit = {
    val geohash_map = scala.collection.mutable.Map[String, List[String]]()
    Source.fromFile(fpath,"UTF-8").getLines().toList.filter(_.trim != "").foreach(line => 
    {
      val split_line = line.split("\t", -1)
      if (split_line.size == 3) {
        val town = split_line(0)
        val city = split_line(1)
        val loc = split_line(2).split(",", -1)
        val geohash_code = get_geohash_code(split_line(2))
        val tmplist = List[String](town + "|" + city + "|" + loc.mkString(","))
        if (geohash_map.contains(geohash_code)) {
          geohash_map(geohash_code) = geohash_map(geohash_code) ++ tmplist
        } else {
          geohash_map += (geohash_code -> tmplist)
        }
      }
    })

    val out = new PrintWriter(output)
    for((k,v) <- geohash_map){
      out.println(k+": " + v.mkString("\t"))
    }
    out.close()
  }

  /**
    * @define 依据经纬度以及指定长度,计算Geohash值.默认长度指定为5.
    * @param loc_str
    * @param len
    * @return
    */
  def get_geohash_code(loc_str:String,len:Int = 5):String = {
    val loc = loc_str.split(",",-1)
    val lon = loc(0).toDouble
    val lat = loc(1).toDouble
    val geohash_code = GeohashUtils.encodeLatLon(lat, lon, len)
    geohash_code
  }

步骤2：这里给出了如何找出9宫格的Geohash值。代码实现时，不仅找到了9个方格的geohash，还给每个方案设定了标记值，标注方向。标记值与格子位置的对应关系如下图所示。有了格子相对目标POI点的方向标注，后续才可能实现第三节所说的依据“位置态势”进行限制。其中，目标POI所处的格子，方向标注是MY。

import ch.hsr.geohash.GeoHash
import org.locationtech.spatial4j.context.SpatialContext
import org.locationtech.spatial4j.distance.DistanceUtils
import org.locationtech.spatial4j.io.GeohashUtils
 /**
   * @define 包括自己一共会找到9个格子(涵盖自己和相邻的8个格子),分别用标
   *  记"MY,N,NE,E,SE,S,SW,W,NW"标记出格子的方位,其中MS,是该点自己所处格子的标记.
   * @param lon
   * @param lat
   * @return
   */
  def find_nearby_geohash(lon:Double,lat:Double):Array[Tuple2[GeoHash,String]] = {
    val nearby_town_array = ArrayBuffer[Tuple2[GeoHash,String]]()
    try{
      val geohash:GeoHash = GeoHash.withCharacterPrecision(lat,lon,5)
      nearby_town_array += Tuple2(geohash,"MY")
      val nearby_town = geohash.getAdjacent
      //N, NE, E, SE, S, SW, W, NW
      val direct_flag_list = "N,NE,E,SE,S,SW,W,NW".split(",",-1)
      for(i <- 0 until nearby_town.size){
        val geohash_item = nearby_town(i)
        val direct_flag = direct_flag_list(i)
        nearby_town_array += Tuple2(geohash_item,direct_flag)
      }
    }catch {
      case e:Exception => {}
    }
    nearby_town_array.toArray
  }

步骤3：利用步骤2得到的9个格子的Geohash值，查找构建的行政区划词表（town_geohash.map），找出每个格子对应的行政区划数据（名称和经纬度），并计算每个行政区划数据与目标POI点的距离。

//存放所有找到的行政区划数据（行政区划的一些信息值，存放为String类型，与目标POI的距离，Double类型） 
val all_nearby_towns = ListBuffer[Tuple2[String,Double]]()

//9个格子的geohash值和方向标注均被保存在一个存放为Tuple2类型的数组中。遍历这个数组，获取每个格子中的行政区划数据（名称，城市，经纬度）。 
val nearby_town:Array[Tuple2[GeoHash,String]] = find_nearby_geohash(lon,lat)  //find_nearby_geohash 在上面步骤2实现了该方法
if(nearby_town.size > 0){
      nearby_town.foreach(geohash_item => {
        val geohash_code = geohash_item._1.toBase32
        val direct_flag = geohash_item._2
        if(geohash_map.contains(geohash_code)){
          val nearby_town_list =  geohash_map(geohash_code).map(town_item => {
            var item = Tuple2[String,Double](town_item,10000.0)
            val tmparr = town_item.split("\\|",-1)
            if(tmparr.size == 3){
              val town = tmparr(0)
              val gcity = tmparr(1)
              val loc2 = tmparr(2).split(",",-1)
              if(city == "" ){
                val distance = get_distance(Tuple2(lon,lat),Tuple2(loc2(0).toDouble,loc2(1).toDouble))
                item = (town_item+"|"+nearby_geohash,distance)
              }else{
                if(city.startsWith(gcity) || gcity.startsWith(city)){
                  val distance = get_distance(Tuple2(lon,lat),Tuple2(loc2(0).toDouble,loc2(1).toDouble))
                  item = (town_item+"|"+nearby_geohash,distance)
                }
              }
            }
            item
          }).filter(_._2 <= 2.0 )           //此处，直接将距离大于2公里的行政信息都已剔除了
          if(nearby_town_list.size > 0){
            all_nearby_towns ++=  nearby_town_list
          }
        }
      })
}

 /**
   * @define 提供一对经纬度坐标,计算两个点的球面距离
   * @param loc1
   * @param loc2
   * @return
   */
  def get_distance(loc1:Tuple2[Double,Double], loc2:Tuple2[Double,Double]):Double = {
    val geo:SpatialContext = SpatialContext.GEO
    val geo_shape = geo.getShapeFactory
    val p1 = geo_shape.pointXY(loc1._1,loc1._2)
    val p2 = geo_shape.pointXY(loc2._1,loc2._2)
    val distance:Double = geo.calcDistance(p1,p2) * DistanceUtils.DEG_TO_KM
    get_litpoint_level(distance,2)  //单位:km，该函数仅是设定获取小数点后几位。
  }
  
  def get_litpoint_level(num:Double,level:Int):Double = {
    val  bg:BigDecimal = new BigDecimal(num)
    bg.setScale(level, BigDecimal.ROUND_HALF_UP).doubleValue()
  }

步骤4：取距离最小的作为添加的行政区划信息。这里的代码实现方式是：将所有存放行政区化信息的List，按照距离排序（升序）。然后，取第一个元素，即距离最小的那个行政区划信息。

//all_nearby_towns按照距离进行升序排序，步骤3的代码中已经限定了存放的元素都必须小于2公里。
//所以，这里没有重复限定2公里。都必定是<=2公里的元素
val sort_nearby_towns = all_nearby_towns.sortWith(_._2 < _._2)  
val nearest_town = sort_nearby_towns.head    //取第1个元素，作为添加的行政区划信息。

另外，这里认为，不存在同时有1个以上的行政区划的点，与目标POI点的距离一样。默认，最小值仅存在一个。因此，代码实现没有考虑上述极端情况。

写到这里，4个步骤均以实现完成了。拓展一节中提到的更多筛选限制的条件。其实，在步骤3或步骤4中均可增加代码实现。比如，上述步骤3中的代码实现，如果认真阅读，可以发现，代码实现中，多了一个城市的限定比较。行政区划的数据信息，它所归属的城市必须与目标POI所属城市相同，才能进入候选集。否则，无论远近，均不能作为候选集。

五、参考文献

1、Java中“附近的人”实现方案讨论及代码实现

2、按距离搜索邻近城市的一种实现

3、Geohash求当前区域周围8个区域编码的一种思路

【Vue】从零开始创建一个vue项目 Pota-to成长日记 vue.js 前端 javascript
一、环境准备（编程基础配置）1.安装Node.js与npm作用：Node.js是JavaScript运行环境，npm是包管理工具（类似“应用商店”），Vue项目依赖它们。步骤：访问Node.js官网，下载LTS版本（长期支持版。双击安装包，默认勾选所有选项，一路点击“Next”完成安装。验证安装：node-v#显示版本号npm-v#显示版本号配置国内镜像加速（解决下载慢问题）：npmconfigs
论文摘要生成器：用TextRank算法实现文献关键信息提取 Atlas Shepherd python 算法自然语言处理 python 信息可视化
我们基于python代码，使用PyQt5创建图形用户界面（GUI），同时支持中英文两种语言的文本论文文献关键信息提取。PyQt5：用于创建GUI应用程序。jieba：中文分词库，用于中文文本的处理。re：正则表达式模块，用于文本清理和句子分割。numpy：提供数值计算能力，如数组操作、矩阵运算等，主要用于TextRank算法的实现。importsysimportreimportjiebaimpor
基于微信小程序的文章管理系统的设计与开发(源码+lw+部署文档+讲解等) #Takagi S# 微信小程序 notepad++小程序
文章目录前言项目背景介绍技术栈后端框架SSM前端框架Vue数据库MySQL（MyStructuredQueryLanguage）微信小程序具体实现截图详细视频演示系统测试系统测试目的系统功能测试系统测试结论代码参考数据库参考源码获取前言博主介绍：✌新人博主,工作经验两年+、专注于Java、小程序技术领域和毕业项目实战✌文末获取源码+数据库感兴趣的可以先收藏起来，还有大家在毕设选题，项目以及论文编写
java中将字符串逆序输出的两种方法一直开心 java string
importjava.util.Scanner;publicclassreverse{publicstaticvoidmain(String[]args){//将字符串倒顺序输出/*Scannersc=newScanner(System.in);Stringstr=sc.nextLine();char[]chArr=str.toCharArray();//char[]小写for(inti=chAr
KMeans实战——聚类和轮廓系数评估啤酒数据集巷955 机器学习人工智能
原理：在数据分析和机器学习中，聚类是一种常用的无监督学习方法，用于将数据集中的样本划分为若干个簇，使得同一簇内的样本相似度较高，而不同簇之间的样本相似度较低。KMeans算法是其中最常用的聚类算法之一。本文将介绍如何使用KMeans算法对啤酒数据集进行聚类，并使用轮廓系数（SilhouetteScore）来评估聚类结果的质量。1.数据准备首先，我们需要导入必要的库并加载数据集。本文使用的数据集是一
安当TDE透明加密技术：为Manus大模型构建用户会话数据保护的“安全金库” 安当加密安全
摘要在人工智能技术深度落地的今天，大模型开发者面临的核心挑战已从算法优化转向数据安全。作为垂直领域大模型的代表，Manus凭借其强大的语义理解与个性化交互能力，在金融、医疗、教育等行业获得广泛应用。然而，其海量的用户会话数据存储与调用场景，也面临着数据泄露、非法篡改等安全威胁。上海安当基于TDE（TransparentDataEncryption）透明加密技术，推出了一套针对Manus大模型的用户
Struts2.0 完整开发包：核心组件与实践应用一人一猫浪迹天涯
本文还有配套的精品资源，点击获取简介：Struts2.0作为基于MVC模式的JavaWeb应用框架，通过一套完整的库文件支持应用程序的搭建和运行。本文详细介绍了Struts2.0的核心组件，包括Action、Result、Interceptor、ValueStack和OGNL等，并解释了这些组件如何与lib包协同工作。此外，还探讨了lib包的具体构成，如struts2-core.jar、xwork
android渲染是skia与egl,opengl和skia哪个快游戏电脑问题解决分享！赵阿萌
从Honeycomb[3.x]版本起，Andorid便支持GPU加速，但目前Android并没有使用SkiaGPU进行Webkit渲染。SkiaGPU使用OpenGL进行后台加速渲染，未来也许会代替Skia。很多人觉得，即使Android成功使用了GPU加速Webkit渲染，在访问浏览如雅虎等一般的网站时，用户也感觉不到太大的差异。因为Webkit的资源大多数消耗在了Javascript脚本和布局
java实验报告_java实验一实验报告赵阿萌 java实验报告
Java实验报告一：Java开发环境的熟悉20135315宋宸宁实验要求：1.使用JDK编译、运行简单的Java程序2.使用Eclipse编辑、编译、运行、调试Java程序实验内容(一)命令行下Java程序开发(二)Eclipse下Java程序开发、调试(三)练习(通过命令行和Eclipse两种方式实现，在Eclipse下练习调试程序)5.实现求正整数1-N之间所有质数的功能，并进行测试。实验过程
机器狗监控系统软件工程师面试题道亦无名机器人面试机器狗
大部分企业会使用的面试题一、基础知识编程语言方面请简述C++中多态的实现方式，在机器狗监控系统中，哪里可能会用到多态来提高代码的扩展性？例如不同型号机器狗的运动控制模块。Python作为脚本语言在系统开发中有诸多应用，说说Python的GIL（全局解释锁）对多线程性能的影响，以及在实时数据采集与处理场景下如何规避。数据结构与算法若要实现机器狗的路径规划，你会选择哪种数据结构来存储地图信息，比如栅格
web网页毕业设计，非遗文化网站期末大作业html+css+JS网页制作成品 qq_904336929 大学生网页设计源码前端课程设计 html
此非遗文化网站为本本人纯手写代码，HTML代码简洁，修改方便。页面丰富，总共6个html页面全站采用HTML+CSS+JavaScript来完成。一、项目规划非遗文化网站是以四川的变脸川剧来开的，网站设计的6个页面，包括首页、历史起源、川剧分类、川剧的艺术特点、川剧剧目、精彩图集、联系我们二、网站效果图其他几个页面由于图片超过了5M，无法上传效果图。三、网站结构1、历史起源起源与发展表演特色表演名
Java 数组 Mr_One_Zhang 学习JAVA java python 开发语言
数组对于每一门编程语言来说都是重要的数据结构之一，当然不同语言对数组的实现及处理也不尽相同。Java语言中提供的数组是用来存储固定大小的同类型元素。你可以声明一个数组变量，如numbers[100]来代替直接声明100个独立变量number0，number1，....，number99。本教程将为大家介绍Java数组的声明、创建和初始化，并给出其对应的代码。声明数组变量首先必须声明数组变量，才能在
JavaEE AOP详解(从原理到实践基于Spring AOP + AspectJ，附完整代码实例) 可问可问春风 JAVAEE java-ee spring java
一、AOP核心概念1.为什么需要AOP？传统OOP编程中，重复的逻辑（如日志、事务、权限）会散落在各业务方法中，造成代码冗余和维护困难。AOP通过横向切割将这些公共功能抽取成独立模块（切面），实现解耦。2.AOP核心术语术语描述生活类比Aspect（切面）封装横切逻辑的类（如日志、事务）安保系统：处理监控、门禁等统一功能JoinPoint（连接点）程序执行期间的某个点（如方法执行、异常抛出）大楼出
JavaJDBC编程躲不过️动笔记
JAVA的JDBC编程数据库编程的必备条件数据库驱动包JDBC使用步骤JDBC优化部分代码JDBC，即JavaDatabaseConnectivity，java数据库连接。是一种用于执行SQL语句的JavaAPI，它是Java中的数据库连接规范。这个API由java.sql.,javax.sql.包中的一些类和接口组成，为Java开发人员操作数据库提供了一个标准的API，可以为多种关系数据库提供统
爬虫的精准识别：基于 User-Agent 的正则实现伏羲栈 Java 爬虫正则表达式 java javascript
博主简介：CSDN博客专家，历代文学网（PC端可以访问：https://literature.sinhy.com/#/?__c=1000，移动端可微信小程序搜索“历代文学”）总架构师，15年工作经验，精通Java编程，高并发设计，Springboot和微服务，熟悉Linux，ESXI虚拟化以及云原生Docker和K8s，热衷于探索科技的边界，并将理论知识转化为实际应用。保持对新技术的好奇心，乐于分
C语言指针 812503533 c语言开发语言
指针是C语言的核心概念之一，C语言是面向过程的语言，允许直接操作内存。指针使得程序能够非常灵活地控制内存、访问和修改数据。这种能力对于低级编程至关重要，尤其在操作系统开发、嵌入式编程、性能优化等领域中，直接操作内存可以带来极大的优势。是C语言与其他许多高级编程语言（例如Python、Java、JavaScript等）之间的一个重要区别之一1.指针的基本概念指针本质上是一个变量，它保存了另一个变量的
Java基础教程：dubbo源码解析-服务暴露与发现传智教育 dubbo java 分布式
概述dubbo是一个简单易用的RPC框架，通过简单的提供者，消费者配置就能完成无感的网络调用。那么在dubbo中是如何将提供者的服务暴露出去，消费者又是如何获取到提供者相关信息的呢？这就是本章我们要讨论的内容。dubbo与spring的整合在了解dubbo的服务注册和服务发现之前，我们首先需要掌握一个知识点：Spring中自定义Schema。Spring自定义SchemaDubbo现在的设计是完全
排序算法终极指南：从冒泡到快排，手把手教你玩转所有排序技巧三流搬砖艺术家算法排序算法算法
目录为什么排序如此重要？8大排序算法全家福一、经典排序算法详解1.冒泡排序（BubbleSort）2.插入排序（InsertionSort）二、高效排序算法3.快速排序（QuickSort）4.归并排序（MergeSort）三、进阶排序算法5.堆排序（HeapSort）6.希尔排序（ShellSort）四、特殊场景排序7.计数排序（CountingSort）8.基数排序（RadixSort）六、工
Struts 2.0核心架构详解与实战应用赵阿萌
本文还有配套的精品资源，点击获取简介：Struts2.0是一个广泛使用的JavaWeb框架，基于MVC设计模式，简化了Web应用开发流程。它包含多个关键组件，如Action类、配置文件、拦截器、OGNL表达式语言等，支持国际化、异常处理和Ajax集成。开发者可以通过继承ActionSupport类实现业务逻辑，并利用配置文件定义Action映射和拦截器链。Struts2.0还支持注解配置，提高了开
嵌入式FOC无刷电机控制器代码架构及实现详解嵌入式程序员小刘开源物联网单片机嵌入式硬件
非常感谢您提供的嵌入式产品图片和项目背景介绍。我深入理解您对这款小尺寸、高性能FOC无刷电机控制器的需求。这是一个极具挑战且富有价值的项目，它融合了硬件重构、先进控制算法、以及对成本和性能的严格把控。基于您提供的项目描述，并结合我在嵌入式系统开发领域的实践经验，我将为您详细阐述最适合该项目需求的代码设计架构，并提供具体的C代码实现示例，以及项目中采用的各种关键技术和方法。我的目标是为您构建一个可靠
【大模型篇】推理模型大作战（QwQ-32B vs DeepSeek-R1）大F的智能小课大模型资讯速读 DeepSeek技术解析和实战大模型理论和实战人工智能
大家好，我是大F，深耕AI算法十余年，互联网大厂技术岗。分享AI算法干货、技术心得。欢迎关注《大模型理论和实战》、《DeepSeek技术解析和实战》，一起探索技术的无限可能！写在前面当我让QwQ-32BvsDeepSeek-R1写一封未来自己的信大家更喜欢哪种风格？QwQ-32B模型介绍及使用指南一、模型简介（一&
java多线程——单例模式 invictusQAQ 单例模式
目录1.概念2.实现1.概念1.1什么是单例模式单例模式能保证某个类在程序中只存在唯一一份实例,而不会创建出多个实例.这一点在很多场景上都需要。比如JDBC中的DataSource实例就只需要一个1.2单例模式分类单例模式具体的实现方式,分成"饿汉"和"懒汉"两种.所谓”饿汉“模式，就是指程序启动则立刻创建实例，可以形象理解为”饿汉“迫不及待想要吃饭（创建实例）。但不管是否使用都创建对象可能会浪费
Vue项目构建与启动中的版本依赖问题及解决方案码农阿豪@新空间包罗万象 vue.js 前端 javascript
个人名片作者简介：java领域优质创作者个人主页：码农阿豪工作室：新空间代码工作室（提供各种软件服务)个人邮箱：[2435024119@qq.com]个人微信：15279484656个人导航网站：www.forff.top座右铭：总有人要赢。为什么不能是我呢？专栏导航：码农阿豪系列专栏导航面试专栏：收集了java相关高频面试题，面试实战总结️Spring5系列专栏：整理了Spring5重要知识点与
如何增强机器学习基础，提升大模型面试通过概率 weixin_40941102 机器学习面试人工智能
我的好朋友没有通过面试所以我给我的好朋友准备了这一篇学习路线随着大模型（如Transformer、GPT-4、LLaMA等）在自然语言处理（NLP）、计算机视觉（CV）和多模态任务中的广泛应用，AI行业的招聘竞争愈发激烈。面试官不仅要求候选人熟练使用深度学习框架（如PyTorch、TensorFlow），还希望他们具备扎实的机器学习理论基础、算法实现能力和实际问题解决经验。本文将从机器学习基础入手
java线程安全的单例模式小小书童J java java 单例模式开发语言
java有多种设计模式，单例模式是我们平时开发中最常用到的一种设计模式，它确保一个类只能创建一个实例，并提供一种全局访问这个实例的方式。单例模式实现方式有很多，本文主要讨论的是线程安全的单例模式，因为项目中用的也是线程安全的单例模式。1.静态成员变量通过静态常量实现单例，利用jvm本身来控制线程安全(JVM保证静态变量在类加载时被初始化,只会被初始化一次)，但该方法实现单例的缺点是：它是饿汉式，类
使用服务器搭建开源建站工具Halo 2.0 莱卡云（Lcayun） github 服务器游戏 linux 云计算
一、服务器环境准备‌实例与系统选择‌‌推荐配置‌：莱卡云‌L1型实例（1核2GB内存）‌，操作系统选择‌Ubuntu22.04LTS‌，满足Halo2.0的Java运行需求‌13。‌端口开放‌：在莱卡云控制台开放‌8090（Halo默认端口）‌、‌80（HTTP）‌及‌443（HTTPS）‌‌13。‌安装Docker与依赖‌bashCopyCodesudoaptupdatesudoaptinsta
每日一练———C语言算法题--平年闰年问题给我高高飞起来啊 C语言算法题 c语言算法
C语言算法题--平年闰年问题概念一、平年、闰年的判断二、给出年、月、日，判断日期是否存在概念平年与闰年！！！（闰年比平年多一天，闰年二月29天，平年28天） 1.普通闰年：能被4整除，且不能被100整除为闰年。 2.世纪闰年：能被400整除为闰年。一、平年、闰年的判断题目：输入一个不大于3000的年份，判断其是否为“闰年”. 程序框图：程序示例：#includeintma
2025年北京市海淀区信息奥赛真题解析（小学组）热爱编程的通信人 c++白名单信息学奥赛
欢迎大家订阅我的专栏：算法题解：C++与Python实现！本专栏旨在帮助大家从基础到进阶，逐步提升编程能力，助力信息学竞赛备战！专栏特色1.经典算法练习：根据信息学竞赛大纲，精心挑选经典算法题目，提供清晰的代码实现与详细指导，帮助您夯实算法基础。2.系统化学习路径：按照算法类别和难度分级，从基础到进阶，循序渐进，帮助您全面提升编程能力与算法思维。适合人群：准备参加蓝桥杯、GESP、CSP-J、CS
如何使用Promise进行异步处理？几何心凉前端小常识前端
文章目录1.引言2.Promise基本概念3.创建Promise4.使用Promise处理异步操作4.1链式调用4.2错误处理4.3并发处理5.实际应用案例6.总结1.引言在JavaScript中，异步操作是非常常见的，如网络请求、文件操作、定时任务等。传统的回调函数虽然可以解决异步问题，但容易造成回调地狱，代码难以维护。Promise是一种用于管理异步操作的解决方案，它使得异步代码变得更易读、易
每天一道算法题【蓝桥杯】【山脉数组的峰顶索引】桦0 题解算法蓝桥杯 c++leetcode
思路二分查找算法注意二段性两段性为peak前arr[mid]arr[mid+1]#define_CRT_SECURE_NO_WARNINGS1#includeusingnamespacestd;classSolution{public:intpeakIndexInMountainArray(vector&arr){intleft=0,right=arr.size()-1,mid=0;//置二分查找
mysql主从数据同步林鹤霄 mysql主从数据同步
配置mysql5.5主从服务器(转) 教程开始：一、安装MySQL 说明：在两台MySQL服务器192.168.21.169和192.168.21.168上分别进行如下操作，安装MySQL 5.5.22 二、配置MySQL主服务器（192.168.21.169）mysql -uroot -p &nb
oracle学习笔记 caoyong oracle
1、ORACLE的安装 a>、ORACLE的版本 8i,9i : i是internet 10g,11g : grid (网格) 12c : cloud (云计算) b>、10g不支持win7 &
数据库，SQL零基础入门天子之骄 sql 数据库入门基本术语
数据库，SQL零基础入门做网站肯定离不开数据库，本人之前没怎么具体接触SQL，这几天起早贪黑得各种入门，恶补脑洞。一些具体的知识点，可以让小白不再迷茫的术语，拿来与大家分享。数据库，永久数据的一个或多个大型结构化集合，通常与更新和查询数据的软件相关
pom.xml 一炮送你回车库 pom.xml
1、一级元素dependencies是可以被子项目继承的 2、一级元素dependencyManagement是定义该项目群里jar包版本号的，通常和一级元素properties一起使用，既然有继承，也肯定有一级元素modules来定义子元素 3、父项目里的一级元素<modules> <module>lcas-admin-war</module> <
sql查地区省市县 3213213333332132 sql mysql
-- db_yhm_city SELECT * FROM db_yhm_city WHERE class_parent_id = 1 -- 海南 class_id = 9 港、奥、台 class_id = 33、34、35 SELECT * FROM db_yhm_city WHERE class_parent_id =169 SELECT d1.cla
关于监听器那些让人头疼的事宝剑锋梅花香画图板监听器鼠标监听器
本人初学JAVA，对于界面开发我只能说有点蛋疼，用JAVA来做界面的话确实需要一定的耐心（不使用插件，就算使用插件的话也没好多少）既然Java提供了界面开发，老师又要求做，只能硬着头皮上啦。但是监听器还真是个难懂的地方，我是上了几次课才略微搞懂了些。
JAVA的遍历MAP darkranger map
Java Map遍历方式的选择 1. 阐述　　对于Java中Map的遍历方式，很多文章都推荐使用entrySet，认为其比keySet的效率高很多。理由是：entrySet方法一次拿到所有key和value的集合；而keySet拿到的只是key的集合，针对每个key，都要去Map中额外查找一次value，从而降低了总体效率。那么实际情况如何呢？　　为了解遍历性能的真实差距，包括在遍历ke
POJ 2312 Battle City 优先多列+bfs aijuans 搜索
来源：http://poj.org/problem?id=2312 题意：题目背景就是小时候玩的坦克大战，求从起点到终点最少需要多少步。已知S和R是不能走得，E是空的，可以走，B是砖，只有打掉后才可以通过。思路：很容易看出来这是一道广搜的题目，但是因为走E和走B所需要的时间不一样，因此不能用普通的队列存点。因为对于走B来说，要先打掉砖才能通过，所以我们可以理解为走B需要两步，而走E是指需要1
Hibernate与Jpa的关系，终于弄懂 avords java Hibernate 数据库 jpa
我知道Jpa是一种规范，而Hibernate是它的一种实现。除了Hibernate，还有EclipseLink(曾经的toplink)，OpenJPA等可供选择，所以使用Jpa的一个好处是，可以更换实现而不必改动太多代码。在play中定义Model时，使用的是jpa的annotations，比如javax.persistence.Entity, Table, Column, OneToMany
酸爽的console.log bee1314 console
在前端的开发中，console.log那是开发必备啊，简直直观。通过写小函数，组合大功能。更容易测试。但是在打版本时，就要删除console.log，打完版本进入开发状态又要添加，真不够爽。重复劳动太多。所以可以做些简单地封装，方便开发和上线。 /** * log.js hufeng * The safe wrapper for `console.xxx` functions *
哈佛教授：穷人和过于忙碌的人有一个共同思维特质 bijian1013 时间管理励志人生穷人过于忙碌
一个跨学科团队今年完成了一项对资源稀缺状况下人的思维方式的研究，结论是：穷人和过于忙碌的人有一个共同思维特质，即注意力被稀缺资源过分占据，引起认知和判断力的全面下降。这项研究是心理学、行为经济学和政策研究学者协作的典范。　　这个研究源于穆来纳森对自己拖延症的憎恨。他7岁从印度移民美国，很快就如鱼得水，哈佛毕业
other operate 征客丶 OS osx
一、Mac Finder 设置排序方式，预览栏在显示－》查看显示选项中二、有时预览显示时，卡死在那，有可能是一些临时文件夹被删除了，如：/private/tmp[有待验证] -------------------------------------------------------------------- 若有其他凝问或文中有错误，请及时向我指出，我好及时改正，同时也让我们一
【Scala五】分析Spark源代码总结的Scala语法三 bit1129 scala
1. If语句作为表达式 val properties = if (jobIdToActiveJob.contains(jobId)) { jobIdToActiveJob(stage.jobId).properties } else { // this stage will be assigned to "default" po
ZooKeeper 入门 BlueSkator 中间件 zk
ZooKeeper是一个高可用的分布式数据管理与系统协调框架。基于对Paxos算法的实现，使该框架保证了分布式环境中数据的强一致性，也正是基于这样的特性，使得ZooKeeper解决很多分布式问题。网上对ZK的应用场景也有不少介绍，本文将结合作者身边的项目例子，系统地对ZK的应用场景进行一个分门归类的介绍。值得注意的是，ZK并非天生就是为这些应用场景设计的，都是后来众多开发者根据其框架的特性，利
MySQL取得当前时间的函数是什么格式化日期的函数是什么 BreakingBad mysql Date
取得当前时间用 now() 就行。在数据库中格式化时间用DATE_FORMA T(date, format) . 根据格式串format 格式化日期或日期和时间值date，返回结果串。可用DATE_FORMAT( ) 来格式化DATE 或DATETIME 值，以便得到所希望的格式。根据format字符串格式化date值: %S, %s 两位数字形式的秒（ 00,01,
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
4_JAVA+Oracle面试题(有答案) chenke oracle
基础测试题卷面上不能出现任何的涂写文字，所有的答案要求写在答题纸上，考卷不得带走。选择题 1、 What will happen when you attempt to compile and run the following code? （3） public class Static { static { int x = 5; // 在static内有效 } st
新一代工作流系统设计目标 comsci 工作算法脚本
用户只需要给工作流系统制定若干个需求，流程系统根据需求，并结合事先输入的组织机构和权限结构，调用若干算法，在流程展示版面上面显示出系统自动生成的流程图，然后由用户根据实际情况对该流程图进行微调，直到满意为止，流程在运行过程中，系统和用户可以根据情况对流程进行实时的调整，包括拓扑结构的调整，权限的调整，内置脚本的调整。。。。。在这个设计中，最难的地方是系统根据什么来生成流
oracle 行链接与行迁移 daizj oracle 行迁移
表里的一行对于一个数据块太大的情况有二种(一行在一个数据块里放不下) 第一种情况: INSERT的时候，INSERT时候行的大小就超一个块的大小。Oracle把这行的数据存储在一连串的数据块里(Oracle Stores the data for the row in a chain of data blocks)，这种情况称为行链接(Row Chain)，一般不可避免(除非使用更大的数据
[JShop]开源电子商务系统jshop的系统缓存实现 dinguangx jshop 电子商务
前言 jeeshop中通过SystemManager管理了大量的缓存数据，来提升系统的性能，但这些缓存数据全部都是存放于内存中的，无法满足特定场景的数据更新（如集群环境）。JShop对jeeshop的缓存机制进行了扩展，提供CacheProvider来辅助SystemManager管理这些缓存数据，通过CacheProvider,可以把缓存存放在内存,ehcache,redis，memcache
初三全学年难记忆单词 dcj3sjt126com english word
several 儿子；若干 shelf 架子 knowledge 知识；学问 librarian 图书管理员 abroad 到国外，在国外 surf 冲浪 wave 浪；波浪 twice 两次；两倍 describe 描写；叙述 especially 特别；尤其 attract 吸引 prize 奖品；奖赏 competition 比赛；竞争 event 大事；事件 O
sphinx实践 dcj3sjt126com sphinx
安装参考地址:http://briansnelson.com/How_to_install_Sphinx_on_Centos_Server yum install sphinx 如果失败的话使用下面的方式安装 wget http://sphinxsearch.com/files/sphinx-2.2.9-1.rhel6.x86_64.rpm yum loca
JPA之JPQL（三） frank1234 orm jpa JPQL
1 什么是JPQL JPQL是Java Persistence Query Language的简称，可以看成是JPA中的HQL， JPQL支持各种复杂查询。 2 检索单个对象 @Test public void querySingleObject1() { Query query = em.createQuery("sele
Remove Duplicates from Sorted Array II hcx2013 remove
Follow up for "Remove Duplicates":What if duplicates are allowed at most twice? For example,Given sorted array nums = [1,1,1,2,2,3], Your function should return length
Spring4新特性——Groovy Bean定义DSL jinnianshilongnian spring 4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装Mysql5.5 liuxingguome centos
CentOS下以RPM方式安装MySQL5.5 首先卸载系统自带Mysql： yum remove mysql mysql-server mysql-libs compat-mysql51 rm -rf /var/lib/mysql rm /etc/my.cnf 查看是否还有mysql软件： rpm -qa|grep mysql 去http://dev.mysql.c
第14章工具函数（下） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
POJ 1050 SaraWon 二维数组子矩阵最大和
POJ ACM第1050题的详细描述，请参照 http://acm.pku.edu.cn/JudgeOnline/problem?id=1050 题目意思：给定包含有正负整型的二维数组，找出所有子矩阵的和的最大值。如二维数组 0 -2 -7 0 9 2 -6 2 -4 1 -4 1 -1 8 0 -2 中和最大的子矩阵是 9 2 -4 1 -1 8 且最大和是15
Java8全新打造，英语学习supertool yangshangchuan java superword 闭包 java8 函数式编程
superword是一个Java实现的英文单词分析软件，主要研究英语单词音近形似转化规律、前缀后缀规律、词之间的相似性规律等等。Clean code、Fluent style、Java8 feature: Lambdas, Streams and Functional-style Programming。升学考试、工作求职、充电提高，都少不了英语的身影，英语对我们来说实在太重要

Geohash应用——附近乡镇信息挖掘（提升检索召回与准确）

摘要

一、背景介绍

二、解决方案

三、拓展与思考

四、代码实现

五、参考文献

你可能感兴趣的:(数据挖掘,算法,scala,java,经验分享)