zhuyuping

公开图像识别匹配技术之一 Bow方式过程讲解。

今天我主要讲一下这个过程，以及运行的结果，这是我创业自己研发的图像匹配之一的Bow的进化搜索方式，

后面还有更好的方式，本章节主要讲实现过程，境界到了的人自然能看懂LSH 怎么搜索，怎么提取，因为我还有部分深度学习核心代码，不过某些觉得我什么都不懂的，我可以给你看所有代码，欢迎您来审查审查。

由于一些核心代码我还不能公开。很多都写在一块，后面我慢慢的抽离开来时候，我会将该项目开源到Github上，以后大家图像搜索匹配，百度识图相关的技术的话比如blippAR 亮风台AR 还有 voforia 咔嚓购物等以为轮廓搜索的都差不多，换成以为一维特征就行了，你们就不再需要使用他们的技术了，直接按照我的过程来吧。

首先第一步使用Opencv提取特征

这里我才用了 spark 所以我把它变成了 spark中的vector 稠密向量。也可以变成double[]

final static FeatureDetector detector = FeatureDetector.create(FeatureDetector.ORB);//ORB
final static DescriptorExtractor extractor = DescriptorExtractor.create(DescriptorExtractor.ORB);//BRIEF

public static List<Vector> readFeature(InputStream datas) throws IOException{
MatOfKeyPoint keypoints = new MatOfKeyPoint();
Mat mat = OpenCVUtil.bufferedImageToMat(ImageIO.read(datas));
Mat descriptors = new Mat();
detector.detect(mat, keypoints);
extractor.compute(mat, keypoints, descriptors);
int numPoints = (int) keypoints.rows();
int descrpnum = (int) descriptors.rows();
List<Vector> descriptions = Lists.newArrayList();
for (int i = 0; i < descriptors.rows(); i++) {
int cols = descriptors.cols();
double[] desc = new double[cols];
for (int j = 0; j < cols; j++) {
desc[j] = descriptors.get(i, j)[0];
}
descriptions.add(Vectors.dense(desc));
}
return descriptions;
}

上面的OpencvUtils 是一个工具类，其实文件的可以直接ImgCodes.read了，

public static Mat bufferedImageToMat(BufferedImage myBufferedImage){
BufferedImage image = myBufferedImage;
byte[] data = ((DataBufferByte) image.getRaster().getDataBuffer()).getData();
Mat mat = new Mat(image.getHeight(), image.getWidth(), CvType.CV_8UC3);//RGB 3通道 Highgui.imread(imgName,0) 
mat.put(0, 0, data);
return mat;
}

2. 下面我们使用Kmean 进行聚类

这是Bovw的使用方式。。。这种方式也是一种不错的方式还有Vlad 向量聚合器

其实就是提取一千万个bov词汇，然后把一张图像用这其中的10000个词汇来表示

比如 c1c2c3c4c5c6c7c8c9c....c10000

vectors.persist(StorageLevel.MEMORY_AND_DISK_SER());
int numClusters = 1000000;
int numIterations = 1000;
//long startTime = System.nanoTime();
KMeansModel clusters = KMeans.train(vectors.rdd(), numClusters,
numIterations);
//double WSSSE = clusters.computeCost(vectors.rdd());
//long endTime = System.nanoTime();
//System.out.println("Execution Time: " + (endTime - startTime) / 1000000
//+ " ms");
//System.out.println("Within Set Sum of Squared Errors = " + WSSSE);
//clusters.toPMML("/tmp/kmeans.xml")
// Export the model to a directory on a distributed file system in PMML format
//clusters.toPMML(sc,"/tmp/kmeans")
//clusters.save(context, "");sc.parallelize(Seq(model), 1).saveAsObjectFile("hdfs:///user/root/linReg.model")
clusters.save(context.sc(), AliyunOSSUtils.BASEURL+"/bovw/bovwaggrate.clusters");
Vector[] vs = clusters.clusterCenters();
double[][] dd=new double[vs.length][];
int i=0;
for (Vector vector : vs) {
dd[i++]=vector.toArray();
}
vectors.unpersist();
BovwAggrate bovwAggrate=new BovwAggrate(dd,10000);

其实这里用户可以做余弦定理运算了，也可以直接TF-IDF ,但是我们不需要

我们使用LSH本地敏感Hash 比如 sign-random-projection 用来做cos运算

Locality Sensitive Hashing

这里我将不变展示全部源代码了。大致结构就是这样的。

RDD<CosHashFunctions> functions

RDD<HashTable> tables

Random rand  = new Random();
randomProjection = new Vector(dimensions);
for(int d=0; d<dimensions; d++) {
double val = rand.nextGaussian();
randomProjection.set(d, val);
}

然后分别将上面的存储到Hbase中。为什么存储Hbase中，因为Hbase列数据库行号代表索引id 列代表每个HashTable 的bucket 的 w 等相应部分

然后就是LSH 的hash查找了，这个很简单。

下面我们来进一步进化。。。怎么让bov更加高效

我们使用AutoEncoder 自动编码机或者深度学习DNN。来提取特征来代替词汇，一样可以达到效果，我们进入caffe

下面是googleNet识别图像的模型的部分，caffe源码里面有，

https://github.com/BVLC/caffe 下面然后训练大量数据。进行模型训练

name: "GoogleNet"
layer {
  name: "googlenet"
  type: "MemoryData"
  top: "data"
  top: "label"
  memory_data_param {
    batch_size: 32
    channels: 3
    height: 224
    width: 224
  }
}
layer {
  name: "conv1/7x7_s2"
  type: "Convolution"
  bottom: "data"
  top: "conv1/7x7_s2"
  param {
    lr_mult: 1
    decay_mult: 1
  }
  param {
    lr_mult: 2
    decay_mult: 0
  }
  convolution_param {
    num_output: 64
    pad: 3
    kernel_size: 7
    stride: 2
    weight_filler {
      type: "constant"
      std: 0.1
    }
    bias_filler {
      type: "constant"
      value: 0.2
    }
  }
}
layer {
  name: "conv1/relu_7x7"
  type: "ReLU"
  bottom: "conv1/7x7_s2"
  top: "conv1/7x7_s2"
}
layer {
  name: "pool1/3x3_s2"
  type: "Pooling"
  bottom: "conv1/7x7_s2"
  top: "pool1/3x3_s2"
  pooling_param {
    pool: MAX
    kernel_size: 3
    stride: 2
  }
}
layer {
  name: "pool1/norm1"
  type: "LRN"
  bottom: "pool1/3x3_s2"
  top: "pool1/norm1"
  lrn_param {
    local_size: 5
    alpha: 0.0001
    beta: 0.75
  }
}
layer {
  name: "conv2/3x3_reduce"
  type: "Convolution"
  bottom: "pool1/norm1"
  top: "conv2/3x3_reduce"
  param {
    lr_mult: 1
    decay_mult: 1
  }
  param {
    lr_mult: 2
    decay_mult: 0
  }
  convolution_param {
    num_output: 64
    kernel_size: 1
    weight_filler {
      type: "constant"
      std: 0.1
    }
    bias_filler {
      type: "constant"
      value: 0.2
    }
  }
}
layer {
  name: "conv2/relu_3x3_reduce"
  type: "ReLU"
  bottom: "conv2/3x3_reduce"
  top: "conv2/3x3_reduce"
}
layer {
  name: "conv2/3x3"
  type: "Convolution"
  bottom: "conv2/3x3_reduce"
  top: "conv2/3x3"
  param {
    lr_mult: 1
    decay_mult: 1
  }
  param {
    lr_mult: 2
    decay_mult: 0
  }
  convolution_param {
    num_output: 192
    pad: 1
    kernel_size: 3
    weight_filler {
      type: "constant"
      std: 0.03
    }
    bias_filler {
      type: "constant"
      value: 0.2
    }
  }
}
layer {
  name: "conv2/relu_3x3"
  type: "ReLU"
  bottom: "conv2/3x3"
  top: "conv2/3x3"
}
layer {
  name: "conv2/norm2"
  type: "LRN"
  bottom: "conv2/3x3"
  top: "conv2/norm2"
  lrn_param {
    local_size: 5
    alpha: 0.0001
    beta: 0.75
  }
}
layer {
  name: "pool2/3x3_s2"
  type: "Pooling"
  bottom: "conv2/norm2"
  top: "pool2/3x3_s2"
  pooling_param {
    pool: MAX
    kernel_size: 3
    stride: 2
  }
}
layer {
  name: "inception_3a/1x1"
  type: "Convolution"
  bottom: "pool2/3x3_s2"
  top: "inception_3a/1x1"
  param {
    lr_mult: 1
    decay_mult: 1
  }
  param {
    lr_mult: 2
    decay_mult: 0
  }
  convolution_param {
    num_output: 64
    kernel_size: 1
    weight_filler {
      type: "constant"
      std: 0.03
    }
    bias_filler {
      type: "constant"
      value: 0.2
    }
  }
}
layer {
  name: "inception_3a/relu_1x1"
  type: "ReLU"
  bottom: "inception_3a/1x1"
  top: "inception_3a/1x1"
}
layer {
  name: "inception_3a/3x3_reduce"
  type: "Convolution"
  bottom: "pool2/3x3_s2"
  top: "inception_3a/3x3_reduce"
  param {
    lr_mult: 1
    decay_mult: 1
  }
  param {
    lr_mult: 2
    decay_mult: 0
  }
  convolution_param {
    num_output: 96
    kernel_size: 1
    weight_filler {
      type: "constant"
      std: 0.09
    }
    bias_filler {
      type: "constant"
      value: 0.2
    }
  }

大概过程类似于上面的深度残差网络，听到了吧。我跟你说152层而不说深度残差不是我说的太泛，而是对你说这些你也不知道听不听的动

我们知道这是图像分类怎么来进行图像搜索匹配呢怎么从定性用于定量呢===============

下面看看 caffe 中有一个extrctor抽取特征的一个工具类，能够抽取每一层输出特征，我们知道卷积层 ---池化层 -------relu激活层 --------梯度下降层 -------------然后最后的全连接层输出的是Nx1x1x1的shape特征。好了我们就是需要这个全连接层的第一层输出，这种方式需要大量的图像进行训练，因为图像提取最后一层的是当前图像的特征，所以只有大量图像情况下才有代表意义。，其实自动编码器可以用来做特征值的进一步抽取的，所以一样可以用来做替代Kmean聚类，dbscan 方式我没有尝试，有兴趣的可以尝试尝试。

使用方法请自行百度。。extract_feature fc

这个需要C++工程师配合了。得到的这个就是一个特征，这个特征比bow更好哦，每次使用该模型的输出特征具有很明显的物体区分的特征规则，用它来做bow 词汇也能很好的进行图像搜索哦，后面一样呢，进行cos 余弦定理的LSH搜索就可以了。

我上面说的是一种很普通的Bow的图像搜索的方法，最后面选取前面几个进行比较就可以知道是否匹配了

java版本

FastQueue<SurfFeature> descTemplate = createQueue(template,100);
        FastQueue<SurfFeature> descRegion = createQueue(template,100);
        //DetectDescribePoint<ImageFloat32, SurfFeature> df=getDesc(src)
        describeImage(template, descTemplate);
        describeImage(region, descRegion);
        AssociateDescription<SurfFeature> associate = greedy(defaultScore(SurfFeature.class), Double.MAX_VALUE, true);
        associate.setSource(descTemplate);
        associate.setDestination(descRegion);
        associate.associate();
        FastQueue<AssociatedIndex> matches = associate.getMatches();
        float sumScore = 0;
        float average = Float.MAX_VALUE;
        for(int i = 0; i < matches.size(); i++){
        sumScore += matches.get(i).fitScore;
        }
           
//        System.out.println("sumScore: " + sumScore);
//        System.out.println("matches: " + matches.size());
        if(matches.size() > 0){
        average = (sumScore/matches.size());
        }

OpenCV版本

这种方式太过精确，实际中需要进行一些阈值调整，比如grabcut 以及轮廓的提取

List<DMatch> matches_original = matches.toList();
List<DMatch> matches_filtered = new ArrayList<DMatch>();
int DIST_LIMIT = 30;
// Check all the matches distance and if it passes add to list of filtered matches  
//System.out.println("DISTFILTER ORG SIZE:" + matches_original.size() + "");
int org=matches_original.size();
for (int i = 0; i < matches_original.size(); i++) {
DMatch d = matches_original.get(i); 
//System.out.println("=============="+d.distance);
if (Math.abs(d.distance) <= DIST_LIMIT) {
matches_filtered.add(d);
}
}
int filter=matches_filtered.size();
//System.out.println("DISTFILTER FIL SIZE:" + matches_filtered.size() + "");
//MatOfDMatch mat = new MatOfDMatch();
//mat.fromList(matches_filtered);
return filter/(org*1.0);

上面只是一种简单的方式，还有一种方式就是使用TF-IDF ，搜索比重大的然后进行比较就可以了。这种方式已经被人申请了专利。所以我也不在叙述了，上面的bow 只是讲解一个流程。如果哪位觉得我乱七八糟的说的话，我可以那电脑给你看源码一步一步讲解给你看。看看我是不是你说的能力太差，2年前你可以说我水平很烂，今天你要是觉得没有面试过我就说我水平很差，我们可以PK一下。后面章节开始讲解VLAD向量的使用

这上面是截图。

http://www.evervc.com/startups/48257 这有更详细的截图。。。大家可以看看。至于支持多少量搜索，根据LSH 以及你的spark的集群。这都不是问题。

详细介绍网关getway以及如何使用，常出现的面试题以及答案酷爱码经验分享 gateway 智能路由器分布式
网关（gateway）是计算机网络中一个重要的设备，用于连接不同网络之间进行数据交换和传输。网关的作用是在不同网络之间传递数据包，根据目标地址将数据包传送到合适的目标网络中。网关可以实现不同网络协议之间的转换，提供网络安全和管理功能。常见的网关包括路由器、防火墙等设备。使用网关的过程通常包括以下步骤：配置网关：设置网关的IP地址、子网掩码等网络参数。连接网络设备：将需要连接到网关的设备通过网线或无
备考六级：词汇量积累（day3）无敌大饺子 dot 职场和发展
grab抓住interview面试采访interviewer面试者，采访者interviewee被采访者，被面试者intervene介入，出面interfere干扰，干预highlight高光delegate代表investgate调查threshould门槛，起点justice公平justify证明....正确log原木，航海日志petition祈求，请求Sheispetitioningfora
2025年了，java后端还有未来吗？大厂资深架构师老汪 java
2025年了，java后端还有未来吗？2025年还死磕Java？劝你先看这3个保命趋势后台10个Java兄弟8个在焦虑：“投20份简历全凉”、“3年经验要15K被压到10K”、“面试问k8s和云原生直接懵”...作为帮1635个Java人通过优化简历+面试指导逆袭上岸的实战派，说点可能挨骂的大实话：Java不会死，但纯CRUD开发真的危了。趋势1：中小厂正在偷偷换需求上周和杭州某电商CTO吃饭，他
Buffer overFolw---Kryo序列化出现缓冲区溢出的问题解决 Matrix70 #spark 大数据分布式
问题：由于我的数据量太大，我设置批次为10000万，50w数据大概有400M左右，然后进行spark数据处理时候报错为org.apache.spark.SparkException:Kryoserializationfailed:BufferoverFolw.Available:0,rquired58900977,Toavoidthis,increasespark.kryoserializer.b
用Js怒刷LeetCode hellocoder2028 leetcode javascript
简介文中所有题目均为精心挑选过的超高频题目，所以大家可以收藏起来适用人群针对有一定数据结构基础(了解链表,二叉树,二叉堆,递归)的基本概念,并对时间空间复杂度有基本认知的。食用指南将文中列出的每道题至少手写3遍面试前可以按照本文整理出来的题目直接过一遍说明文章更新频率:除休息日外,每天在题目下方更新一道题的题解有LeetCode原题的将贴上原地址，不在文章内做题目描述Tc:Timecomplexi
Milvus 在多模态数据（图像、文本、音频）向量搜索中的应用莫比乌斯之梦技术#Milvus milvus 音视频数据库向量数据库多模态数据
随着人工智能和深度学习的发展，多模态数据检索逐渐成为热门技术，广泛应用于图像搜索、语音识别、跨模态检索、推荐系统等领域。传统的基于关键词或规则的检索方式已经难以满足智能应用的需求，因此，基于向量搜索的近似最近邻（ANN）检索成为主流方案。Milvus作为一款开源的向量数据库，可以高效地存储和检索图像、文本、音频等多模态数据的向量表示。本文将介绍Milvus如何处理多模态数据的向量搜索，以及如何构建
前端开发简历书写，30Koffer轻松拿到小鸭呱呱呱前端面试深度学习职场和发展求职招聘职场发展开发语言
又到了互联网行业的求职季，也是各大互联网公司招人的旺季，对于前端开发行业来说，也不例外，那如何去为跳槽面试做好充分的准备呢？简历关不可忽视！其中，简历模板的选择也很讲究，有些简历基本不看内容就会被刷掉，这些简历⼀般会对⾯试官进⾏视觉攻击，让简历给⾯试官的第⼀印象就是反感。两种令⼈反感的简历模板:⼀种是经典简历模板，真是堪称经典，配⾊⽐较魔幻，加上表格类的简历属于low到底端的简历类型，基本上扫⼀眼
深度学习--【完整代码+数据集】线性回归数据模型构建案例 qq_469603589 人工智能大数据深度学习线性回归人工智能
作者简介：Java、前端、Python开发多年，做过高程，项目经理，架构师主要内容：Java项目开发、Python项目开发、大学数据和AI项目开发、单片机项目设计、面试技术整理、最新技术分享收藏点赞不迷路关注作者有好处文末获得源码根据炮哥所讲授内容进行学习心得整理与分享：现在假设这样的一个案例，现在有一组这样的数据，是小明每天学习的时间和最后考试的分数的数据。数据如下表所示，同时想知道小明假设学习
pytorch与其他ai工具 weixin_47868976 人工智能 pytorch python
PyTorch、TensorFlow及其他工具面试考点与回答策略一、PyTorch高频考点与回答模板1.核心特性与原理动态计算图（DynamicGraph）考点：动态图与静态图的区别、优缺点。回答：“PyTorch使用动态图（Define-by-Run），允许在运行时修改计算逻辑，调试直观（如print张量值），适合研究场景；缺点是部署时需转为静态图（TorchScript）以优化性能。”自动微分
二叉树理论基础详解：从零开始理解数据结构的核心 weixin_47868976 数据结构算法深度优先
二叉树理论基础详解：从零开始理解数据结构的核心在算法与数据结构的学习中，二叉树是一种非常基础但又极其重要的数据结构。无论是编程面试还是实际开发，对二叉树的理解都是必不可少的技能。本文将从头开始，系统地介绍二叉树的基本概念、实现方式以及相关操作。目录二叉树简介二叉树的种类满二叉树完全二叉树二叉树的存储方式顺序存储（数组）链式存储（指针结构）二叉树的遍历方式深度优先遍历前序遍历中序遍历后序遍历广度优先
浏览器 http 状态码 weixin_44356698 前端面试2025 http 前端
在面试中回答关于HTTP状态码的问题时，可以按照以下结构来组织你的回答，确保既专业又清晰：1.简要介绍HTTP状态码定义：HTTP状态码是服务器对客户端请求的响应结果，用于表示请求的成功、失败或需要进一步操作。分类：状态码分为5类，分别是：1xx（信息性状态码）：表示请求已被接收，需要继续处理。2xx（成功状态码）：表示请求已成功处理。3xx（重定向状态码）：表示需要进一步操作以完成请求。4xx（
字节跳动创始人张一鸣演讲后端从入门到精通强化学习
张一鸣演讲：大家好！各位都非常年轻，我今天来的时候挺有压力，因为我毕业快11年了，看到你们，真是觉得“长江后浪推前浪”。我去年参加了武汉的校招，感觉新一代年轻人的素质确实都非常好。我作为面试官，过去10年里，可能面试过小2000个年轻人。有的和我在一家公司，有的去了别家公司，他们发展差别其实非常大。那为何毕业多年后，原本水平差不多的同学都拉开了差距？我昨天就在想这个问题，也在想应该跟大家分享些什么
网络安全面试分享：HVV行动题目及答案（非常详细）零基础入门到精通，收藏这一篇就够了网络安全大白网络安全科技程序员 web安全面试安全
hvv面试题owasptop10问漏洞原理和修复方法略内网渗透拿到webshell，查看本机权限、用户登录情况，是否需要提权查看本机是否存在域，是否有内网使用lcx或直接上线cs，建立隧道以便于对内网进一步进行攻击。(使用frp、nps也是一样的)目标机器上lcx.exe-slavevpsip12345127.0.0.13389vps上./lcx-m2-p112345-p26666探测内网存活主机
Java面试黄金宝典11 ylfhpy Java面试黄金宝典 java 面试开发语言面经职场和发展
1.什么是JMM内存模型定义JMM（JavaMemoryModel）即Java内存模型，它并非真实的物理内存结构，而是一种抽象的概念。其主要作用是规范Java虚拟机与计算机主内存（MainMemory）之间的交互方式，目的是屏蔽不同硬件和操作系统在内存访问上的差异，确保Java程序在各种平台上都能获得一致的内存访问效果。在JMM的体系中，线程之间的共享变量存于主内存之中。而每个线程都拥有自己的本地
【中大厂面试题】阿里云Java 后端校招最新面试题扫地僧009 互联网大厂面试题阿里云 java 数据库开发语言面试
目录MySQL事务隔离级别有哪些？幻读和脏读的区别？如何防止幻读？事务的mvcc机制原理是什么？mysql的什么命令会加上间隙锁？Java双亲委派机制是什么？垃圾回收cms和g1的区别是什么？spring三级缓存解决循环依赖问题？如何使用spring实现事务？介绍事务传播模型有哪些？springboot常用注解有哪些？介绍NIOBIOAIO？Redisredis高级数据结构的使用场景linuxli
Spark大数据分析与实战笔记（第四章 Spark SQL结构化数据文件处理-01）想你依然心痛 #Spark大数据分析与实战 spark 数据分析笔记
文章目录每日一句正能量第4章SparkSQL结构化数据文件处理章节概要4.1SparkSQL概述4.1.1SparkSQL的简介4.1.2SparkSQL架构每日一句正能量世事洞明皆学问，人情练达即文章。第4章SparkSQL结构化数据文件处理章节概要在很多情况下，开发工程师并不了解Scala语言，也不了解Spark常用API，但又非常想要使用Spark框架提供的强大的数据分析能力。Spark的开
Hadoop/Spark 生态不辉放弃大数据
Hadoop/Spark生态是大数据处理的核心技术体系，专为解决海量数据的存储、计算和分析问题而设计。以下从底层原理到核心组件详细讲解，帮助你快速建立知识框架！一、为什么需要Hadoop/Spark？传统单机瓶颈：数据量超过单机存储极限（如PB级数据）计算任务无法在合理时间内完成（如TB级日志分析）核心解决思路：分布式存储：数据拆分到多台机器存储（如HDFS）分布式计算：任务拆分到多台机器并行处理
ABAP 百科全书的阅读目录汪子熙零基础快速学习 ABAP ABAP 百科全书 ABAP 开发语言 SAP 思爱普 NetWeaver
文章目录合集基于ABAP技术栈的SAP系统设计原理的深入介绍工作中的实战经验分享回答网友提问：各种ABAP错误消息和问题的分析，处理和解决方案ABAP和其他流行编程技术的比较ABAP内核深入介绍ABAPCDSView相关基于ABAP技术栈的SAP产品的一些业务知识ABAPDevelopmentTool相关云端编程环境的ABAP算法和面试题类型ABAP工作效率提升的技巧和工具笔者之前发布了一套系统地
CSS 预处理器 weixin_44356698 前端面试2025 css 前端
在面试中回答关于CSS预处理器的问题时，你可以从以下几个方面进行回答，展示你的知识深度和实践经验：1.什么是CSS预处理器？你可以从定义和目的入手：“CSS预处理器是一种扩展CSS功能的工具，它允许开发者使用变量、嵌套规则、混合（mixins）、函数等高级特性来编写CSS。通过预处理器，我们可以更高效地组织和维护样式代码，减少重复代码，提升开发效率。常见的CSS预处理器包括Sass、Less和St
2025年01月13日字节（本地生活）前端面试 uperficialyu 前端面试实战前端面试
目录自我介绍项目介绍（拷问）js事件循环浏览器如何解析html文件输入url到页面呈现的过程http与https，https为什么安全，证书是如何获取的？require引入与import的引入的区别vite打包工具相比webpack优势手写promise手写发布订阅模式3.js事件循环以下是对JavaScript事件循环的更深入解释：基本概念单线程执行模型：JavaScript是单线程的，即在同一
2024年令人兴奋的10篇大模型研究和论文福福很能吃人工智能自然语言处理语言模型 transformer 开发语言
后台回复"资料"，即可获取整理好的算法面试题(大模型、深度学习、机器学习)2024年对于人工智能来说是一个绝对精彩的年份。每次我觉得我们已经达到了创新的极限时，总有人会突破它，然后又有人将其碎片整合成一个更好的版本。从复杂的推理语言模型到VLMs和视频模型，进步是可以看得到的。VisionMamba:EfficientVisualRepresentationLearningwithBidirect
数据湖和Apache Iceberg，Apache Hudi，Delta Lake 西土城计划 apache big data 大数据
1什么是数据湖？数据湖这个词目前已经流行开来，逐步被数据相关的从业者接受，可能还有很多人不太清楚它和Hadoop，Hive，Spark这些大数据系统的区别，简单说数据湖是个业务概念，主要是为了区别传统数仓这个概念的（传统数仓的定义：datawarehouse，是用于报告和数据分析的系统，被认为是商业智能的核心组件）。为什么说是“传统数仓”，因为Hadoop于2006年诞生至今已有10多年了，在这期
怎么解决父元素高度塌陷 weixin_44356698 前端面试2025 前端
在面试中，当被问到“怎么解决父元素高度塌陷”时，你可以从以下几个方面来回答：1.问题描述父元素高度塌陷通常发生在子元素浮动（float）或绝对定位（position:absolute）时，父元素无法正确计算子元素的高度，导致父元素高度为0。2.解决方案你可以介绍以下几种常见的解决方案：2.1使用clearfix技巧通过给父元素添加一个clearfix类，来清除浮动。.clearfix::after
Spring AI相关的面试题努力的搬砖人. java 后端面试 spring
以下是150道SpringAI相关的面试题目及答案：###SpringAI基础概念类**1.什么是SpringAI？**SpringAI是Spring框架的扩展，旨在简化人工智能模型在Java应用中的集成与使用，提供与Spring生态无缝衔接的工具和抽象，降低AI技术接入门槛。它为开发者提供了一套简洁的API和注解，使得在Spring应用中调用AI服务变得像使用普通服务一样简单。通过SpringA
springbus类是做什么用的_Spring Cloud学习教程2【面试+工作】 blockchaininfos
1.使用Feign实现声明式的REST调用1.1.分析之前我们通过RestTemplate调用REST服务，代码是这样的：虽然使用了Ribbon和Hystrix可以实现负载均衡和容错处理，但是这个编码在实现大量业务时会显得太过于冗余(如，多参数的URL拼接)。有没有更加优雅的实现呢？1.2.Feign的简介项目主页：https://github.com/OpenFeign/feign1.3.快速入
RabbitMQ面试整理问不倒呀 rabbitmq 面试分布式
1、RabbitMQ有哪些重要的组件？RabbitMQ的核心组件包括以下几部分，他们共同构成了RabbitMQ的基本架构：（1)Broker：RabbitMQ服务器，负责接收和分发消息的应用。（2)VirtualHost：虚拟主机，是RabbitMQ中的逻辑容器，用于隔离不同环境或不同应用程序的信息流。每个虚拟主机都有自己的队列、交换机等设置，可以理解为一个独立的RabbitMQ服务。（3)Con
RabbitMQ 面试备战指南宋发元 rabbitmq 面试分布式
RabbitMQ面试备战指南基础概念什么是RabbitMQ？答：RabbitMQ是一个开源的消息中间件，用来在不同应用程序之间传递消息。类似于邮局，发送方投递消息，接收方取走消息。RabbitMQ的核心组件有哪些？答：生产者（发消息）、消费者（收消息）、交换机（路由消息）、队列（存消息）、绑定（交换机和队列的连接规则）。AMQP协议是什么？答：高级消息队列协议，是RabbitMQ的底层通信标准，定
vue设计模式总结-vue中主要用到了那些设计模式-面试篇 Jacky（易小天） vue.js 设计模式面试
Vue中主要用到的设计模式包括：一.观察者模式（ObserverPattern）：Vue使用观察者模式来实现数据的响应式，当数据发生变化时，相关的视图会自动更新。举个栗子：数据绑定：在Vue模板中使用双向数据绑定v-model，当输入框中的内容发生变化时，绑定的数据也会相应地更新，这就是观察者模式的应用。计算属性：Vue中的计算属性会依赖于其所引用的数据，在相关数据发生变化时，计算属性会重新计算并
PySpark二：常见数据格式及如何读写 pysparkpython
在日常工作中，常见的数据文件格式有csv,json和parquet.Comma-separatedvalues(CSV)是一种直接以纯文本方式保存的文件，通常第一行定义了列名，后面是数据。没列之间用逗号分割。因为这个格式是纯文本的，几乎可以用文本编辑器都可以打开。Json也是常见的格式，个人理解可以看做是Key-valuepair来保存数据。如果有很多行数据，每一行的数据都有相同的key的话，个人
字节跳动前端开发实习生面试总结章鱼小丸子逃跑中面经面试职场和发展
面试时间开始，等着等着面试官进了视频会议。首先调试设备问问对方是否听得到以及面试官介绍事项（比如面试分为理论和实践后续问的问题不适可以打断之类的巴拉巴拉请做自我介绍吧）。我：巴拉巴拉自我介绍......面试官：看你简历中有很多项目，请问有没有令你印象深刻的问题，你是怎么解决的？面试官：简单说一下你的某一个项目前端是怎么构建的？面试官：你的简历上写有前后端跨域问题，你是怎么解决的？具体是怎么跨域的呢
java观察者模式 3213213333332132 java 设计模式游戏观察者模式
观察者模式——顾名思义，就是一个对象观察另一个对象，当被观察的对象发生变化时，观察者也会跟着变化。在日常中，我们配java环境变量时，设置一个JAVAHOME变量,这就是被观察者，使用了JAVAHOME变量的对象都是观察者，一旦JAVAHOME的路径改动，其他的也会跟着改动。这样的例子很多，我想用小时候玩的老鹰捉小鸡游戏来简单的描绘观察者模式。老鹰会变成观察者，母鸡和小鸡是
TFS RESTful API 模拟上传测试 ronin47
TFS RESTful API 模拟上传测试。　　细节参看这里：https://github.com/alibaba/nginx-tfs/blob/master/TFS_RESTful_API.markdown 模拟POST上传一个图片： curl --data-binary @/opt/tfs.png http
PHP常用设计模式单例, 工厂, 观察者, 责任链, 装饰, 策略,适配,桥接模式 dcj3sjt126com 设计模式 PHP
// 多态, 在JAVA中是这样用的, 其实在PHP当中可以自然消除, 因为参数是动态的, 你传什么过来都可以, 不限制类型, 直接调用类的方法 abstract class Tiger { public abstract function climb(); } class XTiger extends Tiger { public function climb()
hibernate 171815164 Hibernate
main,save Configuration conf =new Configuration().configure(); SessionFactory sf=conf.buildSessionFactory(); Session sess=sf.openSession(); Transaction tx=sess.beginTransaction(); News a=new
Ant实例分析 g21121 ant
下面是一个Ant构建文件的实例，通过这个实例我们可以很清楚的理顺构建一个项目的顺序及依赖关系，从而编写出更加合理的构建文件。下面是build.xml的代码： <?xml version="1
[简单]工作记录_接口返回405原因 53873039oycg 工作
最近调接口时候一直报错，错误信息是: responseCode:405 responseMsg:Method Not Allowed 接口请求方式Post.
关于java.lang.ClassNotFoundException 和 java.lang.NoClassDefFoundError 的区别程序员是怎么炼成的
真正完成类的加载工作是通过调用 defineClass来实现的；而启动类的加载过程是通过调用 loadClass来实现的；就是类加载器分为加载和定义 protected Class<?> findClass(String name) throws ClassNotFoundExcept
JDBC学习笔记-JDBC详细的操作流程 aijuans jdbc
所有的JDBC应用程序都具有下面的基本流程：　　1、加载数据库驱动并建立到数据库的连接。　　2、执行SQL语句。　　3、处理结果。　　4、从数据库断开连接释放资源。下面我们就来仔细看一看每一个步骤：其实按照上面所说每个阶段都可得单独拿出来写成一个独立的类方法文件。共别的应用来调用。 1、加载数据库驱动并建立到数据库的连接： Html代码 St
rome创建rss antonyup_2006 tomcat cms xml struts Opera
引用 1.RSS标准 RSS标准比较混乱，主要有以下3个系列 RSS 0.9x / 2.0 : RSS技术诞生于1999年的网景公司(Netscape)，其发布了一个0.9版本的规范。2001年，RSS技术标准的发展工作被Userland Software公司的戴夫温那(Dave Winer)所接手。陆续发布了0.9x的系列版本。当W3C小组发布RSS 1.0后，Dave W
html表格和表单基础百合不是茶 html 表格表单 meta 锚点
第一次用html来写东西,感觉压力山大,每次看见别人发的都是比较牛逼的再看看自己什么都还不会, html是一种标记语言,其实很简单都是固定的格式 _----------------------------------------表格和表单表格是html的重要组成部分,表格用在body里面的主要用法如下; <table> &
ibatis如何传入完整的sql语句 bijian1013 java sql ibatis
ibatis如何传入完整的sql语句？进一步说，String str ="select * from test_table"，我想把str传入ibatis中执行，是传递整条sql语句。解决办法： <
精通Oracle10编程SQL(14)开发动态SQL bijian1013 oracle 数据库 plsql
/* *开发动态SQL */ --使用EXECUTE IMMEDIATE处理DDL操作 CREATE OR REPLACE PROCEDURE drop_table(table_name varchar2) is sql_statement varchar2(100); begin sql_statement:='DROP TABLE '||table_name;
【Linux命令】Linux工作中常用命令 bit1129 linux命令
不断的总结工作中常用的Linux命令 1.查看端口被哪个进程占用通过这个命令可以得到占用8085端口的进程号，然后通过ps -ef|grep 进程号得到进程的详细信息 netstat -anp | grep 8085 察看进程ID对应的进程占用的端口号 netstat -anp | grep 进程ID &
优秀网站和文档收集白糖_ 网站
集成 Flex, Spring, Hibernate 构建应用程序性能测试工具-JMeter Hmtl5-IOCN网站 Oracle精简版教程网站鸟哥的linux私房菜 Jetty中文文档 50个jquery必备代码片段 swfobject.js检测flash版本号工具
angular.extend boyitech AngularJS angular.extend AngularJS API
angular.extend 复制src对象中的属性去dst对象中. 支持多个src对象. 如果你不想改变一个对象，你可以把dst设为空对象{}: var object = angular.extend({}, object1, object2). 注意: angular.extend不支持递归复制. 使用方法: angular.extend(dst, src); 参数:
java-谷歌面试题-设计方便提取中数的数据结构 bylijinnan java
网上找了一下这道题的解答，但都是提供思路，没有提供具体实现。其中使用大小堆这个思路看似简单，但实现起来要考虑很多。以下分别用排序数组和大小堆来实现。使用大小堆： import java.util.Arrays; public class MedianInHeap { /** * 题目：设计方便提取中数的数据结构 * 设计一个数据结构，其中包含两个函数，1.插
ajaxFileUpload 针对 ie jquery 1.7+不能使用问题修复版本 Chen.H ajaxFileUpload ie6 ie7 ie8 ie9
jQuery.extend({ handleError: function( s, xhr, status, e ) { // If a local callback was specified, fire it if ( s.error ) { s.error.call( s.context || s, xhr, status, e ); }
[机器人制造原则]机器人的电池和存储器必须可以替换 comsci 制造
机器人的身体随时随地可能被外来力量所破坏,但是如果机器人的存储器和电池可以更换,那么这个机器人的思维和记忆力就可以保存下来,即使身体受到伤害,在把存储器取下来安装到一个新的身体上之后,原有的性格和能力都可以继续维持..... 另外,如果一
Oracle Multitable INSERT 的用法 daizj oracle
转载Oracle笔记-Multitable INSERT 的用法 http://blog.chinaunix.net/uid-8504518-id-3310531.html 一、Insert基础用法语法： Insert Into 表名 (字段1,字段2,字段3...） Values (值1,
专访黑客历史学家George Dyson datamachine on
20世纪最具威力的两项发明——核弹和计算机出自同一时代、同一群年青人。可是，与大名鼎鼎的曼哈顿计划（第二次世界大战中美国原子弹研究计划）相比，计算机的起源显得默默无闻。出身计算机世家的历史学家George Dyson在其新书《图灵大教堂》（Turing’s Cathedral）中讲述了阿兰·图灵、约翰·冯·诺依曼等一帮子天才小子创造计算机及预见计算机未来
小学6年级英语单词背诵第一课 dcj3sjt126com english word
always 总是 rice 水稻，米饭 before 在...之前 live 生活，居住 usual 通常的 early 早的 begin 开始 month 月份 year 年 last 最后的 east 东方的 high 高的 far 远的 window 窗户 world 世界 than 比...更
在线IT教育和在线IT高端教育 dcj3sjt126com 教育
codecademy http://www.codecademy.com codeschool https://www.codeschool.com teamtreehouse http://teamtreehouse.com lynda http://www.lynda.com/ Coursera https://www.coursera.
Struts2 xml校验框架所定义的校验文件蕃薯耀 Struts2 xml校验 Struts2 xml校验框架 Struts2校验
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 15:54:59 星期六 http://fa
mac下安装rar和unrar命令 hanqunfeng mac
1.下载：http://www.rarlab.com/download.htm 选择 RAR 5.21 for Mac OS X 2.解压下载后的文件 tar -zxvf rarosx-5.2.1.tar 3.cd rar sudo install -c -o $USER unrar /bin #输入当前用户登录密码 sudo install -c -o $USER rar
三种将list转换为map的方法 jackyrong list
在本文中，介绍三种将list转换为map的方法： 1）传统方法假设有某个类如下 class Movie { private Integer rank; private String description; public Movie(Integer rank, String des
年轻程序员需要学习的5大经验 lampcy 工作 PHP 程序员
在过去的7年半时间里，我带过的软件实习生超过一打，也看到过数以百计的学生和毕业生的档案。我发现很多事情他们都需要学习。或许你会说，我说的不就是某种特定的技术、算法、数学，或者其他特定形式的知识吗？没错，这的确是需要学习的，但却并不是最重要的事情。他们需要学习的最重要的东西是“自我规范”。这些规范就是：尽可能地写出最简洁的代码；如果代码后期会因为改动而变得凌乱不堪就得重构；尽量删除没用的代码，并添加
评“女孩遭野蛮引产致终身不育 60万赔偿款1分未得”医腐深入骨髓 nannan408
先来看南方网的一则报道：再正常不过的结婚、生子，对于29岁的郑畅来说，却是一个永远也无法实现的梦想。从2010年到2015年，从24岁到29岁，一张张新旧不一的诊断书记录了她病情的同时，也清晰地记下了她人生的悲哀。　　粗暴手术让人发寒　　2010年7月，在酒店做服务员的郑畅发现自己怀孕了，可男朋友却联系不上。在没有和家人商量的情况下，她决定堕胎。　　12月5日，
使用jQuery为input输入框绑定回车键事件 VS 为a标签绑定click事件 Everyday都不同 jsp input 回车键绑定 click enter
假设如题所示的事件为同一个，必须先把该js函数抽离出来，该函数定义了监听的处理： function search() { //监听函数略...... } 为input框绑定回车事件，当用户在文本框中输入搜索关键字时，按回车键，即可触发search(): //回车绑定 $(".search").keydown(fun
EXT学习记录 tntxia ext
1. 准备（1）官网：http://www.sencha.com/ 里面有源代码和API文档下载。 EXT的域名已经从www.extjs.com改成了www.sencha.com ，但extjs这个域名会自动转到sencha上。（2）帮助文档：想要查看EXT的官方文档的话，可以去这里h
mybatis3的mapper文件报Referenced file contains errors xingguangsixian mybatis
最近使用mybatis.3.1.0时无意中碰到一个问题： The errors below were detected when validating the file "mybatis-3-mapper.dtd" via the file "account-mapper.xml". In most cases these errors can be d

公开图像识别匹配技术之一 Bow方式 过程讲解。

Locality Sensitive Hashing

你可能感兴趣的:(面试,spark,图像搜索,图像匹配,BOW)

公开图像识别匹配技术之一 Bow方式过程讲解。