jiang1st2010

百度图像搜索探秘

本文转自：http://blog.sina.com.cn/s/blog_6ae183910101gily.html

---------------------------------------------------------------

昨天，百度上线了新的相似图(similar image search)搜索，试了风景、人物、文字等不同类型query的效果，感觉效果非常赞。尤其对于人物搜索，返回的结果在颜色、以及姿态方面具有非常大的相似性。特别是在输入某个pose的美女图片时，会搜到一系列相近pose的美女图片，真的是宅男之福啊。

我们知道这个产品底层的技术是余凯老师领导的百度多媒体图像组做的，但是到底是如何做到的，我相信大家一定都非常好奇。在这里，我按照自己的理解，讲讲我认为其背后的具体技术方案，更希望能和大家进行更深入的讨论，我们共同进步。

首先，百度识图（shitu.baidu.com）输入是一幅图片（可以支持本地图片上载以及图片url），输出是返回的相同/相似/相同人脸图像。如果图像中检测到人脸（就是确定某一个位置是一个人脸而不是猫脸或其他），则会在结果页有三个tab，分别是“全部”，“相似图片”和“人脸搜索”，如下图：

而如果query的图片中没有人脸，则只会有前两个tab“全部”和“相似图片”。

而实际上，底层的图像相关的技术（content based）支持的是三个不同的功能，分别是相同图片搜索（near duplicate search）、相似图片搜索（similar image search）和人脸搜索（face search），而这三个功能对应的技术也有比较大的区别。从功能角度，“全部”tab里面主要包含了两部分功能，上面是相同图片搜索（以及对应的图片周围的文本，把图片看作是信息载体）以及下面的相似图片搜索功能。

下面我会一一剖析一下相同图片搜索（near duplicate search）、相似图片搜索（similar image search）和人脸搜索（face search）这三个不同功能背后可能用到的技术。

对于图片搜索而言，一种最直观的思路就是对图像进行表示（表示为特征），然后计算query图像和库中索引的所有图像的特征之间的相似度（或距离）度量，然后排序就可以得到搜索结果了。在早期的image retrieval学术中，大家一般这样处理就够了。但是，这样做的问题是，只能处理数据规模小的数据库（比如百万量级以下），否则速度将十分难以接受。

为了提高搜索速度，一个可以借鉴的思路来自于文字搜索。在文字搜索里面，基本的框架是基于tf-idf表示以及倒排的索引结构来处理的。所谓tf是文章中的词频，idf是逆文档频率。如果将图像和文章对应，visual word和词（term）对应，则图像也存在对应的tf和idf。所以，真正实用的大规模图像搜索系统一般都是采用类似文本搜索的框架，首先通过visual word表示为视觉词频表示，或者采用某种hash的方法转化为binary code的方法来处理，提高搜索速度。这是最基本最核心的思路。

对于相同图片搜索，做的最早的应该算tineye.com，国内搜狗和百度识图都有这个功能，当然，之前我觉得做的最好的是image.google.com。这个技术主要目标是找到同一张图像的不同变形版本（亮度变化、部分裁剪、加水印等），衡量其效果的一个重要因素就是抗击上述变形大小的能力，此外，为了能够提供召回，所以索引量一定要非常大。这块的应用，主要是用来找到同一张图片的更高质量版本或者可以用来做图片版权追踪。

下面，来讲讲这里面的基本框架。

其中，兴趣点检测和局部特征描述有很多方法可以选择，SIFT特征是大家比较常用的特征。将图像表示为很多兴趣点上定义的sift特征之后，离线训练一个词表（一般采用层次型kmean等方法，当然还有其他类似random projection的方法），总之，就是一个vector quantization，从而，能够得到一幅图像的关于词的频率统计（也可以看作是一种直方图累积）。于是，后面的流程就可以借鉴文本里面用到的方法了。由于上述过程中，没有考虑到兴趣点的位置，因此，为了过滤掉误检结果，一般在re-rank模块，会采用基于兴趣点位置约束的过滤方法过滤掉兴趣点位置和query图像不同的结果，当然，由于此时，返回的结果已经远远小于所有的索引量，因此可以采用运算复杂度更高的方法来进一步重新排列结果。

为了，提高召回率，一个比较好的方法是采用query expansion的方法，采用query得到的结果中选择相似度最高的几项（相似度大于某个阈值），得到和query最相近的结果，然后将这些结果和query组合成为新的query，重新到索引中搜素。一种简单的方式是做feature级别的平均。这样，可以得到更高的召回率。

当然，上述只是相同图像检测框架的综述，具体的处理方式可能会不同，也可能采用一些特别的trick来提高响应速度和精度以及召回率。这方面可以参考的两篇文献是[1]、[2]。

下面来接着聊相似图搜索的技术方案。相似图相对相同图的难度更高，相似图本身的定义就不是非常确定，目前，在百度推出相似图之前，google的相似度检测是做得比较好的。不过百度新推出的相似图搜索确实非常惊艳。目前，大家所做的都是视觉上面的相似，而不是真正语义上的相似。

相同图检测可以算作是比较成熟的技术，而相似度搜索的方法则具有不确定性。下面，我猜测一下百度的方案。

首先，百度的相似图检测应该是基于全图特征的，和相同图检测不同的是，相似图前面没有采用兴趣点检测，而是直接将全图分辨率归一化之后，直接表示为某种特征（feature representation）。而这个特征直接决定了后续搜索结果的优劣。由于一幅图像就表示为一个定长的feature，因此，没办法采用visual word的方法进行表示（或者说我不知道如何做）。为了快速搜索，我猜测其后面应该是将这个特征转化为hash序列，然后根据hash值将其映射到多个区间，只处理落在同一个区间的图像，从而减少需要处理的索引量而提高了搜索速度。具体的，一种比较容易想到的方式是采用类似minhash等LSH方法进行处理，将特征表示为K个独立的hash，并根据hash结果映射到M个不同的区间上，然后只需要处理和输入query落在某一个区间中的索引，这样，可以大大降低搜索的运算量。这样做的依据是，两幅图像之间的相似度，可以转化为minhash所度量的相似度，通过调整上述的hash函数数目，以及划分的区间的数目，如果两个图片对应的minhash相似度大于某个阈值，则两者必然会落在至少一个共同的区间中，从而保证了召回率。具体原理可以google simhash了解。

基于上述猜测，我画了一个框图：

由于上述处理过程中存在近似以及hash可能产生的碰撞，因此，在获取到候选索引后，需要进一步采用re-rank的方法来重新排列结果。此时，由于待处理的数据量已经降低，因此，可以采用更原始的特征表示来进行处理（当然，猜测这一步里面也有很多trick，是决定效果的十分重要的因素）。

让我们回头来猜测相似图搜索的全局表示。对于图像的全局表示，有很多传统方法，诸如颜色直方图、纹理、边缘、形状等，但是，百度的相似图搜索应该是采用了深度学习（deep learning）技术，原因呢？一个是因为效果实在是非常赞，感觉传统方法很难达到这样的结果（原谅我作为深度学习粉的脑残程度吧），另外一个重要原因是余凯老师自己承认了，哈哈。当然，在看到他承认之前，很多同学已经高度怀疑是用深度学习做的了。

那么具体是用什么方法实现的呢？我能明确的是：首先输入一定是用了彩色图像（不是灰度图像），因为一看结果就能看到颜色的相似性；其次，由于其对形状出现的位置具有较好的鲁棒性和位置相关性，因为，在逐层抽特征时，一方面，在全局上，用了图像位置相关的结构，同时，在小局部，用了能提高局部鲁棒性的pooling技术。当然，在相似图片搜索中不存在类别概念，因此，可以推测其deep learning是采用了非监督（unsupervised learning）的方法得到的对图像更抽象更具有区分度的表示。至于具体方案，我想是可以有不同选择的。我们不妨猜测是用了深层cnn的结构吧。对上层的输入和当前层链接时，抽取了重叠的很多区域来进行处理，局部小块共用了权重，然后采用pooling逐层降低特征的维度。当然，在顶层也可以采用其它DNN结构，这应该都是可行的。

对于相似图搜索而言，如果只需要做到视觉的相似性（不考虑语义上的相似），如果你能搞定全局的表示问题，那么后面的快速搜索应该可以用相对成熟的技术去搞定。而深度学习是进行全局表示的非常有前途的方法。当然，在具体实现中，一定有很多技巧和困难，做了的人才知道，我没做过，只好yy一下。

好了，下面让我们来看看人脸搜索。对于人脸搜索，百度推出的全网人脸搜索确实没有先例，虽然还存在一些问题，但是，已经是非常牛的一个尝试了。其实，人脸搜索和相似搜索在框架上，我认为会非常相似。具体的也是分为两步，一步是表示，一步是快速搜索。对于人脸表示，具体需要几步，第一步，采用人脸检测找到图像中人脸的数目和位置，当一幅图像中存在多个人脸时，可以选择最大的一张或者置信度最高的一张作为query；第二步，采用人脸对齐（face alignment）来进行特征点定位，得到眼睛中心和嘴巴中心以及脸颊等轮廓点位置；根据得到的特征点位置（可以有很多不同选择,一般采用眼睛中心点和嘴巴中心点）,割取得到归一化的人脸区域，然后，对人脸区域提取鉴别特征，得到人脸的表示。下面给个简单的示意图。

关于人脸检测、特征点定位都具有比较成熟的算法，比如可以参考文献[4][5]。而对于人脸表示，值得一提的是，按照余凯老师在公开场合讲的，百度也采用了具有深度结构（deep structure）的方法做的，也就是说也是应用了深度学习的方法做的。关于人脸识别领域的深度学习方法应用，我看到的一篇最好结果[3]是在LFW数据上4种特征融合达到92%的结果，其实这个结果并不足够好，比如最新的MSRA的工作单种特征可以达到93%的结果[6]。而百度的方法属于自创，在公开的文献中是找不到参考的。不过，我认为条条大路通罗马，其它deep learning的框架也应该可以达到很好的效果，只是，还需要我们大家摸索一段时间。

在得到人脸的表示之后，下面要讨论的是如何快速的搜索到人脸。和相似图像搜索类似，人脸搜索得到的特征，对于每个人脸都是定长的一个feature，容易想到的方法也是采用类似minhash的lsh方法进行处理。由于，在query名人照片时，得到的返回结果中存在很多和输入人脸差别较大的结果，所以我比较倾向于认为在人脸搜索中也用了query expansion的方法来提高召回率。下面给出我心目中的人脸搜索处理流程图：

同样，在re-rank环节可以采用运算量较大的处理手段提高结果的精度。

好了，猜测时间结束。如果大家认为我猜测的是错误的或者有更好的思路，请提出来讨论，帮助我提高。

多yy几句。

我们看到，其一，在图像搜索领域，以百度为代表的国内工业界做到了非常高的水准，可以和世界上的最高水平进行pk（这句话我是认真比较过说的）；其二，深度学习方法在图像理解各个领域（人脸识别、OCR、以及相似图搜索）的应用以及所取得了非常赞的结果；其三，在大规模图像处理方面的方法，具有很多相通之处，比如文字搜索的方法可以对图像搜索的方法有所启发，进一步，可以对人脸搜索的方法进行启发；其四，大规模图像数据和深度学习给传统的图像理解带来了新的思路和方法。

从技术角度，一方面，这个时期对于搞计算机视觉的人而言，这是个令人激动的时间点，大规模数据以及深度学习，使得很多原本进展缓慢的应用都取得了明显的提高。而另外一方面，我们也需要看到基于智能图像的应用还没有非常成功的先例，即使是百度新推出的人脸搜索和相似图像搜索，在应用上也没有找到非常成功的应用。所以，革命尚未成功，做计算机视觉的各位同志还需要努力。

在应用方面，我觉得后面可以关注的几个点包括：一个是关于移动方面的图像应用，语音已经成为移动的一个重要交互手段，图像是否能抢得一点入口呢？另外一个是和硬件结合的智能图像技术已经成为非常重要的交互设备，由于有硬件传感器/光源的帮助，在技术上可以做到相对成熟，能够大规模产品化，这其中的代表包括kinect、leap motion等，未来是否能出现和手机、智能电视结合更好的交互设备呢？

参考论文：

1. J. Sivic and A. Zisserman. Video google: a text retrieval approach to object matching in videos. ICCV 2003.

2. Relja Arandjelovic, Andrew Zisserman . Three things everyone should know to improve object retrieval. CVPR 2012.

3. Xinyuan Cai, Chunheng Wang, Baihua Xiao, Xue Chen, Ji Zhou. Deep nonlinear metric learning with independent subspace analysis for face verification. ACM Multimedia 2012: 749-752.

4. Jianguo Li, Tao Wang, Yimin Zhang. Face detection using SURF cascade. ICCV Workshops 2011: 2183-2190.

5. Xudong Cao; Yichen Wei; Fang Wen; Jian Sun. Face Alignment by Explicit Shape Regression. CVPR 2012.

6. Dong Chen, Xudong Cao, Fang Wen, Jian Sun . Higher is Better: High-dimensional Feature and Its Efficient Compression for Face Verification. CVPR 2013.

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
JavaScript 中，深拷贝（Deep Copy）和浅拷贝（Shallow Copy）跳房子的前端前端面试 javascript 开发语言 ecmascript
在JavaScript中，深拷贝（DeepCopy）和浅拷贝（ShallowCopy）是用于复制对象或数组的两种不同方法。了解它们的区别和应用场景对于避免潜在的bugs和高效地处理数据非常重要。以下是对深拷贝和浅拷贝的详细解释，包括它们的概念、用途、优缺点以及实现方式。1.浅拷贝（ShallowCopy）概念定义：浅拷贝是指创建一个新的对象或数组，其中包含了原对象或数组的基本数据类型的值和对引用数
Python多线程实现大规模数据集高效转移 sand&wich 网络 python 服务器
背景在处理大规模数据集时，通常需要在不同存储设备、不同服务器或文件夹之间高效地传输数据。如果采用单线程传输方式，当数据量非常大时，整个过程会非常耗时。因此，通过多线程并行处理可以大幅提升数据传输效率。本文将分享一个基于Python多线程实现的高效数据传输工具，通过遍历源文件夹中的所有文件，将它们移动到目标文件夹。工具和库这个数据集转移工具主要依赖于以下Python标准库：os：用于文件系统操作，如
深度 Qlearning：在直播推荐系统中的应用 AGI通用人工智能之禅程序员提升自我硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
深度Q-learning：在直播推荐系统中的应用关键词：深度Q-learning,强化学习,直播推荐系统,个性化推荐1.背景介绍1.1问题的由来随着互联网技术的飞速发展,直播平台如雨后春笋般涌现。面对海量的直播内容,用户很难快速找到自己感兴趣的内容。因此,个性化推荐系统在直播平台中扮演着越来越重要的角色。1.2研究现状目前,主流的个性化推荐算法包括协同过滤、基于内容的推荐等。这些方法在一定程度上缓
[转载] NoSQL简介 weixin_30325793 大数据数据库运维
摘自“百度百科”。NoSQL，泛指非关系型的数据库。随着互联网web2.0网站的兴起，传统的关系数据库在应付web2.0网站，特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心，暴露了很多难以克服的问题，而非关系型的数据库则由于其本身的特点得到了非常迅速的发展。NoSQL数据库的产生就是为了解决大规模数据集合多重数据种类带来的挑战，尤其是大数据应用难题。虽然NoSQL流行语
大模型训练数据库Common Crawl WindyChanChan 数据集语言模型数据库
CommonCrawl介绍‌‌CommonCrawl是一个非营利组织，致力于通过大规模分布式爬虫系统定期抓取整个Web并将其存储在一个可公开访问的数据库中。CommonCrawl的数据收集和处理过程包括使用Python开源爬虫工具收集全球范围内的网站数据，并将其上传到‌CommonCrawl基金会的数据仓库中。该项目从2008年开始，至今已经积累了大量的原始网页数据、元数据和文本提取数据。这些数据
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
不简单的简化之路颜小婧
简化16年前，畅销书作者理查德·科克向世人介绍了80/20法则，即我们80%的成就源于仅仅20%的时间、努力和关键决策。对于这个80/20法则，我相信大家都很熟悉了。而被称为80/20法则之父的的理查德·科克和格雷格·洛克伍德一起合作了一本《极简法则》，揭示了：简化是创造大规模市场、建立高盈利企业的秘密。通过对亚马逊、苹果、宜家、福特等成功的企业所采取的商业模式的分析得出两种简化策略：价格简化和命
遥感图像分割系统：融合空间金字塔池化（FocalModulation)改进YOLOv8 xuehaisj YOLO 人工智能计算机视觉 yolov8
1.研究背景与意义项目参考AAAIAssociationfortheAdvancementofArtificialIntelligence研究背景与意义遥感图像分割是遥感技术领域中的一个重要研究方向，它的目标是将遥感图像中的不同地物或地物类别进行有效的分割和识别。随着遥感技术的不断发展和遥感图像数据的大规模获取，遥感图像分割在农业、城市规划、环境监测等领域具有广泛的应用前景。然而，由于遥感图像的特
GEE 将本地 GeoJSON 文件上传到谷歌资产 ThsPool GIS java android 前端 envi gis
在地理信息系统（GIS）领域，GoogleEarthEngine（GEE）是一个强大的平台，它允许用户处理和分析大规模地理空间数据。本文将介绍如何使用Python脚本批量上传本地GeoJSON文件到GEE资产存储，这对于需要将地理数据上传到GEE进行进一步分析的用户来说非常有用。应用场景数据集成：将本地GeoJSON数据集成到GEE中，以便进行更复杂的地理空间分析。数据共享：与团队成员共享GeoJ
Flume：大规模日志收集与数据传输的利器傲雪凌霜，松柏长青后端大数据 flume 大数据
Flume：大规模日志收集与数据传输的利器在大数据时代，随着各类应用的不断增长，产生了海量的日志和数据。这些数据不仅对业务的健康监控至关重要，还可以通过深入分析，帮助企业做出更好的决策。那么，如何高效地收集、传输和存储这些海量数据，成为了一项重要的挑战。今天我们将深入探讨ApacheFlume，它是如何帮助我们应对这些挑战的。一、Flume概述ApacheFlume是一个分布式、可靠、可扩展的日志
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构汤萌妮Margaret
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构scalable_agent项目地址:https://gitcode.com/gh_mirrors/sc/scalable_agent在当今的人工智能研究前沿，深度强化学习（DRL）因其在复杂任务中的卓越表现而备受瞩目。本文要介绍的是一个开源于GitHub的重量级项目：“ScalableDistributedDeep-RLwithImp
云服务业界动态简报-20180128 Captain7
一、青云青云QingCloud推出深度学习平台DeepLearningonQingCloud，包含了主流的深度学习框架及数据科学工具包，通过QingCloudAppCenter一键部署交付，可以让算法工程师和数据科学家快速构建深度学习开发环境，将更多的精力放在模型和算法调优。二、腾讯云1.腾讯云正式发布腾讯专有云TCE(TencentCloudEnterprise)矩阵，涵盖企业版、大数据版、AI
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
ResNet的半监督和半弱监督模型 Valar_Morghulis
Billion-scalesemi-supervisedlearningforimageclassificationhttps://arxiv.org/pdf/1905.00546.pdfhttps://github.com/facebookresearch/semi-supervised-ImageNet1K-models/权重在timm中也有：https://hub.fastgit.org/r
联邦学习 Federated learning Google I/O‘19 笔记努力搬砖的星期五笔记联邦学习机器学习机器学习 tensorflow
FederatedLearning:MachineLearningonDecentralizeddatahttps://www.youtube.com/watch?v=89BGjQYA0uE文章目录FederatedLearning:MachineLearningonDecentralizeddata1.DecentralizeddataEdgedevicesGboard:mobilekeyboa
PCL 怎样可视化深度图像 LeonDL168 PCL 计算机视觉人工智能视觉检测图像处理算法
本小节讲解如何可视化深度图像的两种方法，在3D视窗中以点云形式进行可视化（深度图像来源于点云），另一种是，将深度值映射为颜色，从而以彩色图像方式可视化深度图像。代码首先，在PCL（PointCloudLearning）中国协助发行的书提供光盘的第7章例2文件夹中，打开名为range_image_visualization.cpp的代码文件，同文件夹下可以找到相关的测试点云文件room_scan1.
如何看待 IBM 中国研发部裁员专家大圣经验分享
一、引言在全球信息技术飞速发展的时代，跨国科技企业一直扮演着重要的角色。IBM，作为全球知名的信息技术和业务解决方案公司，在中国市场也有着长期的发展历程。然而，近日IBM中国宣布撤出在华两大研发中心，进行大规模裁员，这一举措引发了广泛的关注和讨论。这不仅对众多IT从业者的职业发展产生了重大影响，也让人们开始思考全球化背景下中国IT产业的竞争力和未来发展方向。本文将从整体分析、人才发展和产业未来三个
系统架构师软考历年论文题目（2009-2024年）及分析 pccai-vip 系统架构师系统架构
时间题目20091.论基于DSSA的软件架构设计与应用；2.论信息系统建模方法；3.论基于REST服务的Web应用系统设计；4.论软件可靠性设计与应用20101.论软件的静态演化和动态演化及其应用；2.论数据挖掘技术的应用；3.论大规模分布式系统缓存设计策略；4.论软件可靠性评价20111.论模型驱动架构在系统开发中的应用；2.论企业集成平台的架构设计；3.论企业架构管理与应用；4.论软件需求获取
el-dialog高度设置夏之小星星前端 vue.js elementui css
el-dialog高度设置::v-deep.el-dialog{height:78vh;overflow:auto;}
Python 课程8-多线程编程和多进程编程可愛小吉 Python教學 python 开发语言 threading multiprocessing
前言在现代编程中，处理并发任务是提高程序性能的关键之一。Python提供了多线程（threading）和多进程（multiprocessing）两种方式来实现并发编程。多线程适用于I/O密集型任务，而多进程则更适合CPU密集型任务。通过这两种技术，你可以高效地处理大规模数据、加速程序执行并优化资源利用。在本篇详细教程中，我们将讨论如何使用Python的threading模块实现多线程，以及如何使用
VLSI电路单元的自动布局：全局布局基础介绍 Jaaiko 数学建模算法开源图论 matlab
2024年华数杯全国大学生数学建模竞赛B题为：VLSI电路单元的自动布局。本题主要关注的是全局布局问题。学术界针对全局布局的评估模型和优化方法的研究历史悠久。本文借题顺势介绍全局布局的一些重点基础内容和相关工具/资料，以期为对EDA算法设计领域感兴趣、对数学建模感兴趣的人降低研究门槛。VLSI是超大规模集成电路的简称。完成一个VLSI设计的流程十分复杂，包含多种数据格式的转化，其中将逻辑网表转变为
VLSI 电路单元的自动布局-2024华数杯B题 2401_84314384 算法 python 数学建模
摘要超大规模集成电路设计通常采用电子设计自动化(EDA)的方式进行，布局是EDA工具的核心的核心。本文通过构建的线长评估模型及网格密度评估模型，并在此基础上对模型进行优化，最后利用模型实现VLSI电路单元的自动布局。问题一：基于结合直线型斯坦纳最小树思想的优化HPWL模型评估与电路单元连线接口坐标相关的线长。本题需要建立与电路单元连线接口坐标相关的线长评估模型，最小化每组估计线长与对应RSMT的差
elementuiPlus取消el-input的边框 qq_39016177 elementui
elementuiPlus取消el-input的边框1.通常取消边框的方法设置border为none2.还有其他类似边框的例如outlinebox-shadow这两个属性都是会产生边框效果3.el-input需要更改的话–如下需要修改box-shadow为空即可上代码:deep(.el-input__wrapper){align-items:center;background-color:#F7F
2024京东年货节开始时间及红包领取满减规则一览帮忙赚赏金
2024京东年货节开始时间及红包领取满减规则一览2024年货节将于今年的1月17日正式拉开帷幕，为期一个月，将在2月3日圆满结束。这个一个月的时间里，电商平台将推出各种优惠活动和大规模促销，让消费者在过年前享受到超值的购物体验。在活动时间内，每天都可以打开手机京东搜索"红包到手183"，领取最高9999元京东京享年货节红包，进入京东年货节满减活动入口享满多少减多少优惠。【重点】京东年货节京享红包福
开源模型应用落地-qwen2-7b-instruct-LoRA微调-unsloth（让微调起飞）-单机单卡-V100（十七）开源技术探险家开源模型-实际应用落地 #深度学习语言模型自然语言处理
一、前言本篇文章将在v100单卡服务器上，使用unsloth去高效微调QWen2系列模型，通过阅读本文，您将能够更好地掌握这些关键技术，理解其中的关键技术要点，并应用于自己的项目中。使用unsloth能够使模型的微调速度提高2-5倍。在处理大规模数据或对时间要求较高的场景下，这可以大大节省微调所需的时间，提高开发效率。其次，可减少80%的内存使用。这对于资源有限的环境或者需要同时运行多个微调任务的
掌握检索技术：构建高效知识检索系统的架构与算法23 是小旭啊人工智能
在检索专业知识层需要涵盖更高级的检索技术，包括工程架构和算法策略。一、工程架构工程架构在构建检索系统中决定了系统的可扩展性、高可用性和性能。比如需要考虑的基本点：分布式架构：水平扩展：采用分布式架构，将检索任务分布到多个节点上，实现水平扩展。这可以通过将索引数据分片存储在不同的节点上，并使用分布式文件系统或对象存储来存储大规模的索引数据。任务分配：设计任务调度器，负责将查询请求分配到空闲的节点上进
掌握检索技术：构建高效知识检索系统的架构与算法21 是小旭啊人工智能
在检索专业知识层需要涵盖更高级的检索技术，包括工程架构和算法策略。一、工程架构工程架构在构建检索系统中决定了系统的可扩展性、高可用性和性能。比如需要考虑的基本点：分布式架构：水平扩展：采用分布式架构，将检索任务分布到多个节点上，实现水平扩展。这可以通过将索引数据分片存储在不同的节点上，并使用分布式文件系统或对象存储来存储大规模的索引数据。任务分配：设计任务调度器，负责将查询请求分配到空闲的节点上进
tomcat基础与部署发布暗黑小菠萝 Tomcat java web
从51cto搬家了，以后会更新在这里方便自己查看。做项目一直用tomcat，都是配置到eclipse中使用，这几天有时间整理一下使用心得，有一些自己配置遇到的细节问题。 Tomcat：一个Servlets和JSP页面的容器，以提供网站服务。一、Tomcat安装安装方式：①运行.exe安装包 &n
网站架构发展的过程 ayaoxinchao 数据库应用服务器网站架构
1.初始阶段网站架构：应用程序、数据库、文件等资源在同一个服务器上 2.应用服务和数据服务分离：应用服务器、数据库服务器、文件服务器 3.使用缓存改善网站性能：为应用服务器提供本地缓存，但受限于应用服务器的内存容量，可以使用专门的缓存服务器，提供分布式缓存服务器架构 4.使用应用服务器集群改善网站的并发处理能力：使用负载均衡调度服务器，将来自客户端浏览器的访问请求分发到应用服务器集群中的任何
[信息与安全]数据库的备份问题 comsci 数据库
如果你们建设的信息系统是采用中心-分支的模式,那么这里有一个问题如果你的数据来自中心数据库,那么中心数据库如果出现故障,你的分支机构的数据如何保证安全呢? 是否应该在这种信息系统结构的基础上进行改造,容许分支机构的信息系统也备份一个中心数据库的文件呢? &n
使用maven tomcat plugin插件debug关联源代码商人shang maven debug 查看源码 tomcat-plugin
*首先需要配置好'''maven-tomcat7-plugin'''，参见[[Maven开发Web项目]]的'''Tomcat'''部分。 *配置好后，在[[Eclipse]]中打开'''Debug Configurations'''界面，在'''Maven Build'''项下新建当前工程的调试。在'''Main'''选项卡中点击'''Browse Workspace...'''选择需要开发的
大访问量高并发 oloz 大访问量高并发
大访问量高并发的网站主要压力还是在于数据库的操作上，尽量避免频繁的请求数据库。下面简要列出几点解决方案： 01、优化你的代码和查询语句，合理使用索引 02、使用缓存技术例如memcache、ecache将不经常变化的数据放入缓存之中 03、采用服务器集群、负载均衡分担大访问量高并发压力 04、数据读写分离 05、合理选用框架，合理架构(推荐分布式架构)。
cache 服务器小猪猪08 cache
Cache 即高速缓存.那么cache是怎么样提高系统性能与运行速度呢？是不是在任何情况下用cache都能提高性能？是不是cache用的越多就越好呢？我在近期开发的项目中有所体会，写下来当作总结也希望能跟大家一起探讨探讨，有错误的地方希望大家批评指正。　　1.Cache 是怎么样工作的? 　　Cache 是分配在服务器上
mysql存储过程香水浓 mysql
Description:插入大量测试数据 use xmpl; drop procedure if exists mockup_test_data_sp; create procedure mockup_test_data_sp( in number_of_records int ) begin declare cnt int; declare name varch
CSS的class、id、css文件名的常用命名规则 agevs JavaScript UI 框架 Ajax css
CSS的class、id、css文件名的常用命名规则 (一)常用的CSS命名规则　　头：header 　　内容：content/container 　　尾：footer 　　导航：nav 　　侧栏：sidebar 　　栏目：column 　　页面外围控制整体布局宽度：wrapper 　　左右中：left right
全局数据源 AILIKES java tomcat mysql jdbc JNDI
实验目的：为了研究两个项目同时访问一个全局数据源的时候是创建了一个数据源对象，还是创建了两个数据源对象。 1：将diuid和mysql驱动包（druid-1.0.2.jar和mysql-connector-java-5.1.15.jar）copy至%TOMCAT_HOME%/lib下；2：配置数据源，将JNDI在%TOMCAT_HOME%/conf/context.xml中配置好,格式如下：&l
MYSQL的随机查询的实现方法 baalwolf mysql
MYSQL的随机抽取实现方法。举个例子，要从tablename表中随机提取一条记录，大家一般的写法就是：SELECT * FROM tablename ORDER BY RAND() LIMIT 1。但是，后来我查了一下MYSQL的官方手册，里面针对RAND()的提示大概意思就是，在ORDER BY从句里面不能使用RAND()函数，因为这样会导致数据列被多次扫描。但是在MYSQL 3.23版本中，
JAVA的getBytes()方法 bijian1013 java eclipse unix OS
在Java中，String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组。这个表示在不同OS下，返回的东西不一样！ String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示，如： byte[] b_gbk = "
AngularJS中操作Cookies bijian1013 JavaScript AngularJS Cookies
如果你的应用足够大、足够复杂，那么你很快就会遇到这样一咱种情况：你需要在客户端存储一些状态信息，这些状态信息是跨session(会话)的。你可能还记得利用document.cookie接口直接操作纯文本cookie的痛苦经历。幸运的是，这种方式已经一去不复返了，在所有现代浏览器中几乎
[Maven学习笔记五]Maven聚合和继承特性 bit1129 maven
Maven聚合在实际的项目中，一个项目通常会划分为多个模块，为了说明问题，以用户登陆这个小web应用为例。通常一个web应用分为三个模块： 1. 模型和数据持久化层user-core, 2. 业务逻辑层user-service以 3. web展现层user-web， user-service依赖于user-core user-web依赖于user-core和use
【JVM七】JVM知识点总结 bit1129 jvm
1. JVM运行模式 1.1 JVM运行时分为-server和-client两种模式，在32位机器上只有client模式的JVM。通常，64位的JVM默认都是使用server模式，因为server模式的JVM虽然启动慢点，但是，在运行过程，JVM会尽可能的进行优化 1.2 JVM分为三种字节码解释执行方式：mixed mode, interpret mode以及compiler
linux下查看nginx、apache、mysql、php的编译参数 ronin47
在linux平台下的应用，最流行的莫过于nginx、apache、mysql、php几个。而这几个常用的应用，在手工编译完以后，在其他一些情况下（如：新增模块），往往想要查看当初都使用了那些参数进行的编译。这时候就可以利用以下方法查看。 1、nginx [root@361way ~]# /App/nginx/sbin/nginx -V nginx: nginx version: nginx/
unity中运用Resources.Load的方法？ brotherlamp unity视频 unity资料 unity自学 unity unity教程
问：unity中运用Resources.Load的方法？答：Resources.Load是unity本地动态加载资本所用的方法,也即是你想动态加载的时分才用到它,比方枪弹,特效,某些实时替换的图像什么的,主张此文件夹不要放太多东西,在打包的时分,它会独自把里边的一切东西都会集打包到一同,不论里边有没有你用的东西,所以大多数资本应该是自个建文件放置 1、unity实时替换的物体即是依据环境条件
线段树-入门 bylijinnan java 算法线段树
/** * 线段树入门 * 问题：已知线段[2,5] [4,6] [0,7]；求点2,4,7分别出现了多少次 * 以下代码建立的线段树用链表来保存，且树的叶子结点类似[i,i] * * 参考链接：http://hi.baidu.com/semluhiigubbqvq/item/be736a33a8864789f4e4ad18 * @author lijinna
全选与反选 chicony 全选
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <title>全选与反选</title>
vim一些简单记录 chenchao051 vim
mac在/usr/share/vim/vimrc linux在/etc/vimrc 1、问：后退键不能删除数据，不能往后退怎么办？答：在vimrc中加入set backspace=2 2、问：如何控制tab键的缩进？答：在vimrc中加入set tabstop=4 (任何
Sublime Text 快捷键 daizj 快捷键 sublime
[size=large][/size]Sublime Text快捷键：Ctrl+Shift+P：打开命令面板Ctrl+P：搜索项目中的文件Ctrl+G：跳转到第几行Ctrl+W：关闭当前打开文件Ctrl+Shift+W：关闭所有打开文件Ctrl+Shift+V：粘贴并格式化Ctrl+D：选择单词，重复可增加选择下一个相同的单词Ctrl+L：选择行，重复可依次增加选择下一行Ctrl+Shift+L：
php 引用(&)详解 dcj3sjt126com PHP
在PHP 中引用的意思是：不同的名字访问同一个变量内容. 与Ｃ语言中的指针是有差别的．Ｃ语言中的指针里面存储的是变量的内容在内存中存放的地址变量的引用 PHP 的引用允许你用两个变量来指向同一个内容复制代码代码如下: <? $a="ABC"; $b =&$a; echo
SVN中trunk,branches,tags用法详解 dcj3sjt126com SVN
Subversion有一个很标准的目录结构，是这样的。比如项目是proj，svn地址为svn://proj/，那么标准的svn布局是svn://proj/|+-trunk+-branches+-tags这是一个标准的布局，trunk为主开发目录，branches为分支开发目录，tags为tag存档目录（不允许修改）。但是具体这几个目录应该如何使用，svn并没有明确的规范，更多的还是用户自己的习惯。
对软件设计的思考 e200702084 设计模式数据结构算法 ssh 活动
软件设计的宏观与微观软件开发是一种高智商的开发活动。一个优秀的软件设计人员不仅要从宏观上把握软件之间的开发，也要从微观上把握软件之间的开发。宏观上，可以应用面向对象设计，采用流行的SSH架构，采用web层，业务逻辑层，持久层分层架构。采用设计模式提供系统的健壮性和可维护性。微观上，对于一个类，甚至方法的调用，从计算机的角度模拟程序的运行情况。了解内存分配，参数传
同步、异步、阻塞、非阻塞 geeksun 非阻塞
同步、异步、阻塞、非阻塞这几个概念有时有点混淆，在此文试图解释一下。同步：发出方法调用后，当没有返回结果，当前线程会一直在等待（阻塞）状态。场景：打电话，营业厅窗口办业务、B/S架构的http请求-响应模式。异步：方法调用后不立即返回结果，调用结果通过状态、通知或回调通知方法调用者或接收者。异步方法调用后，当前线程不会阻塞，会继续执行其他任务。实现：
Reverse SSH Tunnel 反向打洞實錄 hongtoushizi ssh
實際的操作步驟： # 首先，在客戶那理的機器下指令連回我們自己的 Server，並設定自己 Server 上的 12345 port 會對應到幾器上的 SSH port ssh -NfR 12345:localhost:22 [email protected] # 然後在 myhost 的機器上連自己的 12345 port，就可以連回在客戶那的機器 ssh localhost -p 1
Hibernate中的缓存 Josh_Persistence 一级缓存 Hiberante缓存查询缓存二级缓存
Hibernate中的缓存一、Hiberante中常见的三大缓存：一级缓存，二级缓存和查询缓存。 Hibernate中提供了两级Cache，第一级别的缓存是Session级别的缓存，它是属于事务范围的缓存。这一级别的缓存是由hibernate管理的，一般情况下无需进行干预；第二级别的缓存是SessionFactory级别的缓存，它是属于进程范围或群集范围的缓存。这一级别的缓存
对象关系行为模式之延迟加载 home198979 PHP 架构延迟加载
形象化设计模式实战 HELLO!架构一、概念 Lazy Load：一个对象，它虽然不包含所需要的所有数据，但是知道怎么获取这些数据。延迟加载貌似很简单，就是在数据需要时再从数据库获取，减少数据库的消耗。但这其中还是有不少技巧的。二、实现延迟加载实现Lazy Load主要有四种方法：延迟初始化、虚
xml 验证 pengfeicao521 xml xml解析
有些字符，xml不能识别，用jdom或者dom4j解析的时候就报错 public static void testPattern() { // 含有非法字符的串 String str = "Jamey친Ñ&#1282
div设置半透明效果 spjich css 半透明
为div设置如下样式： div{filter:alpha(Opacity=80);-moz-opacity:0.5;opacity: 0.5;} 说明： 1、filter：对win IE设置半透明滤镜效果，filter:alpha(Opacity=80)代表该对象80%半透明，火狐浏览器不认2、-moz-opaci
你真的了解单例模式么？ w574240966 java 单例设计模式 jvm
单例模式，很多初学者认为单例模式很简单，并且认为自己已经掌握了这种设计模式。但事实上，你真的了解单例模式了么。一，单例模式的5中写法。（回字的四种写法，哈哈。） 1，懒汉式（1）线程不安全的懒汉式 public cla

百度图像搜索探秘

你可能感兴趣的:(deep,learning,大规模图像检索)