哀酱

MPEG-CDVS标准概述论文粗译 Overview of the MPEG-CDVS Standard

Overview of the MPEG-CDVS Standard论文粗译，仅为自己学习所用，参考需谨慎。

摘要

CDVS标准，Compact Descriptors for visual search，视觉搜索紧凑描述子，是ISO/IEC运动图像专家组即MPEG最近发布的一个完整的标准。此标准的主要目标是提供一套标准化的比特流语法实现图像搜索应用的上下文中的互操作性。标准化的过程在减小图像特征数据，以及减少特征提取过程中的计算量和降低内存占用（memory footprint）方面取得了显著的进步与提高。本篇论文对MPEG-CDVS标准的技术特征（technical features）做了概述，并总结了它的制定过程。

关键词

紧凑描述子（compact descriptors），特征压缩（feature compression），MPEG-CDVS，视觉搜索（visual search）

INTRODUCTION

略，主要是讲最近十年移动智能设备普及，移动视觉搜索需要做得更快更准确。
首先，移动设备上的处理过程必须快，轻量级，耗电少；其次，通过网络传输的数据量必须要小到足够降低网络延迟；最后，搜索和匹配所使用的算法，对于潜在可能出现的极大规模数据库必须是可伸缩的（scalable），并且在部分遮挡，视角变化，相机参数的光照变化的情况下，对目标的识别保有鲁棒性。
……略
理想中的MPEG-CDVS标准应该具备以下特性

确保视觉搜索应用和数据库的互操作性
减少无线网络传输视觉搜索相关信息的负载
提供一套在移动设备上进行硬件支持的描述子提取和匹配的基本方法。
能够使与标准相一致的实现（implementations）有高水平表现。
简化视觉搜索应用中的描述子提取和匹配设计。

并且，理想中的表中应该能同其他已经存在的MPEG和JPEG标准结合使用，比如说，MPEG Query Format，HTTP，XML，JPEG，以及JPSearch。
略……

HIGHLIGNTS

MPEG-CDVS标准定义了描述子的比特流（比如说，二进制表示语法），以及描述子的提取过程。图2中描述了这一标准的主要构成模块。

为了保证兼容性，描述子的语法需要与CDVS标准相一致。
CDVS通过两种方式支持互操作性。第一种是，它标准化了描述子的比特流语法。第二种是它提供了在不同位率下编码描述子并匹配的框架。后一种特征考虑到了一个存有压缩特征的紧凑数据库（什么？），以及搜索的位率可伸缩性。
检索和匹配的算法并不在标准中。视频压缩专家会注意到这个方法是应用于（Video compression experts will note that the approach is the dual of what is performed for video coding standards in which the bitstream syntax and the decoder are standardized）。对于CDVS来说，比特流语法和编码器是被标准化了的。图2中的模块是保证互操作性所需要的最少模块。

A. Data Sets and Evaluation

CDVS的评价数据集是一份比其他像INRIA Holidays和Oxford Buildings这样的流行数据集规模更大的数据集。这个数据集与INRIA Holidays和Oxford Buildings相比，拥有更多的包含不同类型的物体，尺度，旋转，遮挡和光照情况的数据。成对匹配和搜索实验都纳入了评价框架之中，性能也作为位率的一种功能（a function of bitrate？）纳入其中。数据集中有10155个匹配图像对和112175个不匹配图像对的标准数据（ground-truth data）用作成对匹配的评价；还有8314幅待搜索图像和18840幅参考图像，以及从Filckr中得来的规模为一百万幅图像的干扰数据集用作图像检索实验。

B.Interest Point Detection and Local Feature Description兴趣点检测和局部特征描述

CDVS标准在使用了流行的SIFT描述子后，应用了一种低阶多项式（low-degree polynomial,ALP）的检测子。为了找到兴趣点，ALP方法使用多项式估计了LoG（高斯拉普拉斯）滤波的结果，这种方法在尺度空间中寻找极值，改善检测到的点的空间位置。虽然没有被标准采用，但是一个基于分块的频率域高斯拉普拉斯方法可以与ALP检测子整合实现一个基于分块的尺度空间兴趣点检测子ALP_BFLoG。ALP_BFLoG方法将原始的尺度空间分割成重叠的块，并对每块做独立的兴趣点检测，从而使滤波器所需的内存开销和尺度空间缓存降低了一个数量级。基于分块的兴趣点检测使整个流水线在低内存开销的硬件实现中经得起检验。

C. Local Feature Selection 局部特征选择

一个特征描述子的自己被选取出来，以满足不同描述子长度的速率约束。每个局部特征都要计算表明一个待搜索特征与数据库特征相匹配的可能性的相关性。计算相关性的方法是统计学习的（statistically learned），以尺度，LoG的峰值响应（peak response）每个局部特征与图像中心的距离，以及其他文章后续将会讨论的特性为基础。各个特征会基于相关性排序，然后根据总共的特征数据预算和每个特征所占位数，选出数量固定的一部分特征。

D. Local Feature Descriptor Compression 局部特征描述子压缩

CDVS标准中采用了一种低复杂度的变换编码的方法。三元标量量化（ternary scalar quantization）和瞬时变长编码（instantaneous variable-length coding）完成后，描述子再做变换。此方法对SIFT描述子的8个方位上的值做小型的线性变换，而不是对整个描述子做变换。比特流中只包含变换后的描述子元素的一个子集。这个子集根据标准化的优先级表被选择出来，并且这个表格已经为了得到最佳搜索性能而优化过了。（This subset is selected according to a standardized priority table that has been optimized for the best retrieval performance.）对于图像描述子长度从最短的512到1024B到最长的16384B来说，转换后的描述子包含的元素的个数（？）从20/128到128/128不等。

E. Local Feature Location Compression 局部特征位置压缩

CDVS标准中的位置信息编码模式是基于这样一个基本观点：特征的原始排序可以被舍弃，从而在熵编码的比特流之外为n个特征节省log(n!)位（？）。直方图编码模式被采用，这种模式基于x，y坐标重新对特征数据进行了排序，节省了log(n!)的排序开销(？）。位置数据以直方图的形式出现，直方图由二进制映射和一组直方图计数组成。直方图映射和计数使用一种二进制的基于上下文的算术编码模式进行编码。

F. Local Feature Descriptor Aggregation 局部特征描述子聚合

CDVS标准中采用了一种可伸缩的压缩费舍尔向量方法（scalable compressed Fisher Vector SCFV)进行局部特征描述子的聚合。为了压缩高维的费舍尔向量，此方法从高斯混合模型（Gaussian Mixture Model GMM）中选了高斯成分的一个子集，并且只保留了被选择出来的这些成分的信息。不同的高斯成分的集合是根据每一幅图像费舍尔向量能量最集中的部分选择出的。一个小规模的首部数据位的集合表明哪些成分被选出做每一个聚合的全局特征。SCFV算法有较高的匹配准确度，以及与传统的基于PCA主成分分析或者向量量化的费舍尔向量压缩方法相比，有着几乎可以忽略的内存开销。

NORMATIVE BLOCKS 正式模块

A. Interest Point Detection and Local Feature Description 兴趣点检测和局部特征描述

局部特征提取包括检测兴趣点和使用特征描述子刻画这些兴趣点—-描述尺度和旋转不变块（rotation invariant patches）的的高维呈现。CDVS标准在使用了流行的SIFT描述子之后使用了LoG高斯拉普拉斯尺度空间兴趣点检测子。图像的尺度空间以图像金字塔的形式展现，图像金字塔中，an image is successively filtered by a family of smoothing kernels at increasing scale factors. 图像金字塔中每一个尺度的归一化导数都将被计算出来，兴趣点也通过在尺度空间中寻找局部极值被计算出来。
这一标准最重要的创新点就是基于多项式近似的LoG兴趣点检测子。被采纳的低维多项式ALP方法估测了LoG滤波的结果。随后，寻找并改善尺度空间的极值以计算被检测到的点的精确的空间位置。特别地，为了估计LoG尺度空间，ALP使用了一个与尺度参数 σ 和图像中的每一个像素点的(x,y)坐标相关的多项式函数：

p (x, y, σ) = \sum K - 1 k = 0 a k L k (x, y) σ 3 + \sum K - 1 k = 0 b k L k (x, y) σ 2 + \sum K - 1 k = 0 c k L k (x, y) σ + \sum K - 1 k = 0 d k L k (x, y)

系数a _k,b _k,c _k和d _k存储在一张标准表中， K=4（待写）

为了检测出尺度空间的极值，ALP方法首先通过使 σ 方向上的导数为0得出局部极值，然后将这个极值点与它在X-Y平面上的8个邻居点相比较。
与其他模式相比较：ALP的兴趣点检测比传统的尺度空间极值检测子方法—-将每一个点与在尺度空间中相邻的3 × 3 × 3-1=26个邻居点比较，更为高效，因为ALP方法是建立在用4幅LoG滤波图像估计LoG尺度空间的基础上，而不是用在LoG检测子中使用5幅或以上的LoG滤波图像或者是在典型的DoG高斯差分尺度空间中使用6幅以上的高斯滤波图像。

B. Local Feature Selection局部特征选择

在图像内容的基础上，兴趣点检测部分会产生成百上千的特征，即使是对于VGA分辨率的图像来说。512B到4KB的特征数据不足以包含所有的特征，即使每个描述子的位数都足够短。因此，选取特征描述子的子集就很重要。做特征选择也有其他的优势。局部特征描述子会聚合成为全局特征描述子。合并噪声多的局部描述子会降低全局描述子的取分离。并且，特征选择还可以在特征提取模块有效降低计算开销：CDVS标准之中，对每一个局部特征都会计算一个相关性。相关性表明了一个待搜索特征与一个数据库特征相匹配的先验概率。比如说，距离图像中心更近的待搜索特征更加容易匹配。相似的，从特征更显著区域提取的特征更加特殊和更具有区分力。相关性是基于兴趣点的五个特征用统计学习的方法得到的：兴趣点的尺度 σ ，LoG的峰值响应值p，兴趣点到图像中心的距离d，Hessian矩阵行列式的？？the ratio ρ of the squared trace to the determinant of the Hessian.以及关于尺度的尺度空间函数的二阶导数 pσσ 。
通过假设在给定特征匹配的情况下不同的兴趣点特征是条件独立的，在标准化期间，使用独立的数据集针对每个特征学习特征匹配的条件分布。这些学习条件分布的参数，被间隔两化，并在标准表中列出，每一个量化间隔都在标准表中有一个相关的标量。为了学习这个条件分布，在大量匹配图像对的数据集上应用SIFT特征成对特征匹配和比率测试，以及几何一致性检验，得到一个匹配和不匹配的特征对的集合。这个匹配过程使用ALP方法做检测子，使用SIFT（未压缩）做描述子。在几何验证中，匹配图像对的inliers（有效数据，内点）被设置成一个比较紧的阈值—-30，以保证匹配特征对的outliers（无效数据，外点）较少，以及匹配的高质量。匹配特征对的统计资料被用来估计条件分布。
相关性r通过各个参数的条件概率函数相乘而得：

r (σ, p, d, ρ, p σ σ) = f 1 (σ) f 2 (p) f 3 (d) f 4 (ρ) f 5 (p σ σ)

f ₁~f ₅都可以从根据兴趣点特征学习条件条件分布的标准表中得到。最后特征基于相关性r进行排序，根于总体的特征数据量的预算和每个特征所占位数，选出一部分固定数目的特征。图三……略
与其他方法相比：特征选择的一个简单方法（naive approach?）是使用基于兴趣点检测子的峰值响应排序特征。标准中采用的方法，考虑了若干个兴趣点特征，具有相当优异的性能，尤其是在低位率状态下。另一个性能方面的显著提高体现在特征基于全局描述子中的相关性，而被有选择地聚合时。标准的初稿中还包含第六个参数，是的特征选择可以独立于特征方向。然而，由于带来的改善不多，方向独立性在CDVS标准最终确立是被去掉了。

C.Local Feature Descriptor Compression

未经压缩的SIFT描述子，存储时每个描述子占1024位（128个维度，每个维度1B）。即使未压缩的SIFT描述子很小，也会带来数十KB的数据，因此，局部特征描述子压缩对于减少特征数据大小具有重要意义。使用具有创新性的压缩模式，每个描述子所占位数可以压缩一个量级，而仅仅损失很少的匹配精度。基于PQ（Product Quantization）乘积量化，PTSVQ（Product Tree Structured Vector Quantization）乘积树结构向量量化，MSVQ（Multi-stage Vector Quantizer）多级向量量化，格子编码和变换编码的几种压缩方法，都曾在标准化过程中被提出。不过最终，在经过全面评估之后，使用了一种低复杂度的变换编码方式。
具体的标准所采用的变换编码的方法可参见（待引用）。对于一个局部的特征描述子来说，如图5所示的每一个单元直方图H₀,……H₁₅，每一个都有8个angular bins（不知道怎么翻译这八个方位）h₀，……，h₇，它们是独立变换的。

变换编码分为两步：描述子变换，先做简单的SIFT成分的加减，再做三元标量量化和变换后的元素的熵编码。此方法对于SIFT描述子的独立的spatial bins做small order-8 小型的八维线性变换，而不是对整个描述子（会降低性能）应用一个order-128 128维的线性变换。以下等式定义了两组分别对A和B做的线性变换。

h0~h7表示每个局部特征描述子的每个单元直方图的bin……
变换还可以用其他的方法实现。……
SIFT描述子中邻近的spatial bins有相似的值，因此，对不同的临近bins应用不同的变换可以提升性能，特别是在超低位率比如说每个描述子32位的情况下。变换元素的子集，每个描述子的位数和描述子的数量根据经验做优化，在描述子长度分别为512bytes，1KB，2KB，4KB，8KB，和16KB的情况下，描述子的位数分别为32，32，65，103，129和205位。可选的栅格模式，……略。The alternating grid pattern shown in Figure 5 also emerges from the greedy rate allocation scheme proposed in.
给定两个量化的局部特征描述子{ Vq=vqi|i=0,1,…127andVr=vri|i=0,1,…127 },他们的相似性距离Dis(·)在变换域中使用L₁计算：

D i s (V q, V r) = \sum 127 i = 0 s q i s r i | | v q i - v r i | | L 1

sqi 和

sri 表示

Vq 和

Vr 中的第i个元素被选中。注意到以上公式可以实现，仅通过比较描述子共有的变换的描述子元素，实现在不同位率情况下的编码后的描述子的比较。标准的固定优先次序模式保证了低位率情况下描述子的每一个元素仍可以表现出高位率情况下的性能。
与其他方法相比：选择变换编码模式而不是其他VQ和格子编码方法是因为变化编码模式简单易行，内存消耗低，计算复杂度低以及在低位率状态下有卓越的表现。变换编码模式的内存消耗与乘积向量量化product vector quantization方法的数以KB和MB计的内存消耗相比，可以忽略不计。对主存的要求约为256bytes（变换的元素个数128*2三元SQ门限）。另外，此方法比需要通过密码本进行最近邻搜索的VQ方法有更低的计算复杂度。在低位率情况下，变换编码模式的性能也优于或等同于集中基于VQ的方法，格子编码，和二进制哈希方法。这种变换编码的方法的性能与熵约束向量量化entropy constrained vector quantization和贪心速率分配方法greedy rate allocation的性能接近。
除了变换编码之外，MSVQ方法曾被……略。

D.Local Feature Location Compression

每一个特征的位置数据x,y的压缩是与描述子压缩相关的一个问题。每一个描述子都有一个x,y位置，在GCC几何一致性校验步骤中会使用。如果x,y位置数据是浮点数类型，则位置数据的大小会与压缩后的描述子本身的大小相当。
CDVS标准中采用了位置直方图编码方式。位置直方图方法是基于如果舍弃n个特征的原始顺序，则可以在原来的熵编码比特流之外，节省额外的log(n!)位空间。提取出的特征的原始顺序会在两个步骤：视觉搜索流水线—用词袋或者全局描述子，以及GCC几何一致性校验步骤中被舍弃。位置直方图编码模式是一种实现节省log(n!)速率的可行方法。排序开销随特征数量的变化表示在图*中：排序的开销随着特征数量的增长而增长，对于成百上千个特征来说，每个特征需要6-8位表示顺序，在每个特征编码为32-100位时还是很重要的。

图7表示位置直方图编码方法。每一幅图像都被分成3*3的互不交叠的小块，每个特征的位置数据(x,y)都量化到了栅格中去。位置数据被表示成由(a)直方图映射和(b)直方图计数组成的直方图。直方图计数表示直方图中的哪一个bin是非空的，直方图计数表示在每一个非空块中的特征数量。这些描述子会根据直方图映射中的位置顺序重新排序。

直方图计数使用64symbol?，单一模型，静态算术编码的方式进行编码。直方图映射使用二进制的基于上下文的静态算术编码的方式进行编码。如图8中所示，邻居块中的特征作为给定块直方图计数编码时的上下文使用。sum-based的上下文利用了特征位置的集群–可明显在图像中找到。由于特征会高密度集中在图像中心，所以使用顺时针扫描而不是光栅扫描对直方图映射进行扫描。此外，每一个特征有约6位用于位置编码，而对原始位置坐标(存储原始位置坐标，每个特征需要使用log₂(640*640) = 18.6位）使用算术编码，在默认块大小为1*1的情况下，做无损位置编码时，每一个特征需用约12位。有损的位置直方图编码方式在成对匹配和检索实验中带来的匹配性能的损失可忽略不计。
与其他方式相比：
暂略

E.Local Feature Descriptor Aggregation

最先进的图像检索系统是基于VLAD(Vector of Locally Aggregated Descriptors)局部聚合描述子向量和FV(Fisher Vector)费舍尔向量这样的全局描述子的。BoW(Bag-of-Words)词袋模型也是一个普遍的选择。在BoW的框架里，图像用直方图来表示，直方图是由一棵大型词汇树（比如说一百万个视觉词汇）中得到的量化描述子得到的，词汇树中有倒排索引用来快速匹配。在全局描述子的框架中，图像用稠密的高维向量（维度约为10K-100K）表示。找到一个有高性能和低内存消耗的紧凑的全局描述子是CDVS标准化过程中面临的主要挑战之一。CDVS标准要求低的内存开销（整个编码过程最多使用1MB），使得BoW词袋模型的方法并不适用。
经过大量实验之后，CDVS标准采用了SCFV(Scalable Compressed Fisher Vector)可伸缩的压缩费舍尔向量方法。它使用了一个有512个成分的GMM(Gaussian Mixture Model)高斯混合模型来得到多达250个局部特征描述子的分布。the gradient of the log-likelihood for an observed set of local feature descriptors with respect to the mean and for higher bitrates,the variances of the GMM are concatenated to form the FV representation.（啊啊啊翻译不通顺啊）。Each descriptor is assigned to multiple Gaussians(visual words) in a soft assignment step。费舍尔向量方法与BoW模型的方法相比，需要的词汇数目小很多，能够满足CDVS对于内存的要求。
没有压缩过的费舍尔向量，以浮点数的方式存储，需要上千字节的空间，有时比压缩后的局部特征描述子更大。为了压缩费舍尔向量，SCFV方法使用了一位标量量化，使用汉明距离做快速匹配。对于？每个描述子长度，需要在压缩的全局描述子和一组压缩的局部特征描述子之间共享位预算。出于这个目的，SCFV使用了速率可伸缩的表示方法（对于六种特定位率，平均大小为304，384，404，1117，1117和1117字节），这种方法使用基于对完全填充的费舍尔向量的特定成分（表示与成分平均值相关的梯度？)的标准差的GMM高斯混合模型中的高斯成分的一个子集（好长的句子），并且只保留与被选中的成分相关的信息。大量的实验表明，所使用的基于标准差的方法，擅长移除non- or less(?)有区分力的成分去实现一个更加鲁棒的FV呈现，and selecting informative components to undergo less negative performance impact from sign quantization,has outperformed the quantization error-based selection method.特别地，对于每一个高斯成分i，32维的与高斯成分平均值相关的累积梯度向量 g=[g0,g1,……,g31] 标准差 δ(i) 用一下公式计算：

δ (i) = 1 32 \sum 31 j = 0 (g j - 1 32 \sum 31 k = 0 g k) 2 ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ \sqrt

之后，高斯成分根据 δ(i) 进行递减排序。对于较短的三种长度分别为512B，1KB,2KB的描述子，前k个高斯成分会提前被挑选出来；对于更长的三种长度分别为4KB，8KB，和16KB的描述子，会选出 δ(i)>τδ ， τδ 表示一个选择阈值。除此之外的内存预算会被不同描述子长度下的压缩过的局部特征描述子用掉。注意到每幅图像的GMM成分的不同集合是基于哪些成分提供了最多的信息这一标准选择出来的。头几位标志着选中了哪些成分。SCFV包含了4KB,8KB,16KB长度的描述子的与GMM方差参数有关的对数似然梯度。对于更短的图像描述子，只是用与平均值有关的梯度。
给定两幅图像X和Y，我们可以计算出SCFV的基于汉明距离的相似性S（·）：

S (X, Y) = \sum 511 i = 0 b X i b Y i ω H a ( u X i , u Y i ) ( 32 - 2 H a ( u X i , u Y i ) 32 \sum 511 i = 0 b X i ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ \sqrt \sum 511 i = 0 b Y i ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ \sqrt

uYi 表示GMM中第i个二进制化的高斯成分（梯度与平均值有关或与方差有关)。如果第i个成分被选中，

bXi = 1，否则为0。

Ha(uXi,uYi) 代表第i个高斯成分，X和Y之间的汉明距离，范围是0-32。

ωHa(uXi,uYi) 表示第i个高斯成分的相关权重。
与其它方法相比：略。

【算法刷题记录（简单题）002】字符串字符匹配（java代码实现）挺菜的 java 算法开发语言
一、题目描述对于给定的字符串s和t，检查s中的所有字符是否都在t中出现。（一）输入描述第一行输入一个长度为1≤len(s)≤200、仅由小写字母组成的字符串s。第二行输入一个长度为1≤len(t)≤200、仅由小写字母组成的字符串t。（二）输出描述如果s中的所有字符都在t中出现，则输出true，否则输出false。（三）示例输入：bcabc输出：true二、题目解答（一）解题思路1.使用HashM
21天刷题计划之10.1—统计大写字母个数（Java语言描述） justlikeu777 21天刷题计划 java基础算法基础
题目描述：找出给定字符串中大写字符(即’A’-‘Z’)的个数接口说明原型：intCalcCapital(Stringstr);返回值：int输入描述:输入一个String数据输出描述:输出string中大写字母的个数示例1输入add123#$%#%#O输出1分析：获取输出的字符串，将字符串转换成字符数组，遍历字符数组并判断是否为大写字母即可。importjava.util.Scanner;publ
c++求同构数 *Allen* c++算法数据结构
题目描述所谓同构数是指这样的数，即它出现在它的平方数的右端。例如，5的平方是25（即5×5=25），5是25右端的数，那么5就是同构数。又如，25的平方是625（即25×25=625），同理25也是同构数。找出通过键盘输入的两个正整数N和M（0usingnamespacestd;intn,m,t,s,a[100],b[100],sum,s1,s2,k;intmain(){cin>>n>>m;for
【心灵鸡汤】深度学习技能形成树：从零基础到AI专家的成长路径全解析智算菩萨人工智能深度学习
引言：技能树的生长哲学在这个人工智能浪潮汹涌的时代，深度学习犹如一棵参天大树，其根系深深扎入数学与计算科学的沃土，主干挺拔地承载着机器学习的核心理念，而枝叶则繁茂地延伸至计算机视觉、自然语言处理、强化学习等各个应用领域。对于初入此领域的新手而言，理解这棵技能树的生长规律，掌握其形成过程中的关键节点和发展阶段，将直接决定其在人工智能道路上能够走多远、攀多高。技能树的概念源于游戏设计，但在学习深度学习
视觉设计全栈解析：必知的8大核心方向与应用场景
在数字时代，视觉设计早已渗透到生活的方方面面——从手机APP界面到街头广告牌，从书籍的版式到产品的包装，这些统统离不开视觉设计的支撑！所以，了解视觉设计分类，不仅能帮助我们理清设计的边界与应用场景，更能让初学者找到学习的方向，让从业者精准定位创作目标哦。接下来，我们就来详细解析视觉设计分类中的8大常见类型，一起来享受这场视听盛宴吧~一、视觉识别图形设计在视觉设计分类中，视觉识别图形设计是构建品牌形
牛顿迭代法求平方根 william_djj python python
sqrt.py求y的平方根#-*-coding:UTF-8-*-#sqrt.py求y的平方根y=1010EPSILON=1e-10x=ywhileabs(x-y/x)>(EPSILON):#x=y/x就是解x=(x+y/x)/2.0#二分法缩小搜索范围#print(x)print("anser=%f"%x)求k次方根#-*-coding:UTF-8-*-#sqrtn.py求y的k次方根y=64k=
搜索、广告与推荐的比较
搜索搜索广告显示广告推荐首要准则相关性投资回报率(ROI)用户兴趣其他需求各垂直领域独立定义质量，安全性(Safety)多样性(diversity),新鲜度(freshness)索引规模~十亿级~百万级--千万级~百万级~百万级--亿级个性化较少的个性化需求~亿级用户规模上的个性化检索信号较为集中较为丰富Downstream优化不适用`适用广告明显比搜索容易部分的是不需要复杂的爬虫技术和PageR
推荐算法（推广搜）——广告和推荐有什么不同？
导语近几年新兴起一个行业：推广搜。即推荐、广告、搜索算法的简称。各大厂都隐隐将其作为公司核心技术来发展。此文将带领大家探秘广告和推荐有什么区别以及其相似处。再此强调一下，广告算法里面的推荐广告和自然推荐结果里的推荐系统进行对比，但因为广告算法里面还有“搜索广告”，搜索广告和推荐系统差异性就太大了，这里不做讨论。一、不同点1.1本质不同推荐广告和自然推荐本质中要处理的群体和衡量的利益完全不一样。（图
Python 编程基础作业总结
本周主要围绕Python基础编程展开了学习，通过一系列的作业题来巩固所学知识。这些题目涵盖了输入输出、条件判断、循环结构等多个基础知识点，下面将对每道作业题进行详细分析。1.计算指定月份第一天是星期几题目描述编写一个程序，接受用户输入的一个年份和一个月份，输出该月份的第一天是星期几。使用蔡乐公式计算星期。提示：使用蔡乐公式计算星期。W=((26*M-2)/10+D+Y+Y/4+C/4-2*C)%7
如何自定义R语言函数？参数中的省略号`...`有什么用？「已注销」 python 编程语言 java 人工智能 c++
学习R未必要学习很多工具包，有时候根据自己的理解去自定义函数也是一个不错的选择。本篇推文主要介绍两方面的内容：在R语言中自定义函数的一般方法；函数参数中...的作用。在看函数的帮助文档时会发现许多函数的参数中都有...符号，它是表示被省略的参数吗？如果是，作者为什么会省略它？如果不是，那又表示什么含义呢？不久前，学堂君分享了自己编写的计算空间可达性的函数，详见推文：两步移动搜索法（2SFCA）计算
行业案例| MongoDB在腾讯零售优码中的应用 MongoDB中文社区 MongoDB 数据库 mongodb
本文主要分享腾讯智慧零售团队优码业务在MongoDB中的应用，采用腾讯云MongoDB作为主存储服务给业务带来了较大收益，主要包括：高性能、快捷的DDL操作、低存储成本、超大存储容量等收益，极大的降低了业务存储成本，并提高了业务迭代开发效率。一.业务场景腾讯优码从连接消费者到连接渠道终端，实现以货的数字化为基础的企业数字化升级，包含营销能力升级和动销能力升级。腾讯优码由正品通、门店通和会员通三个子
ViP-LLaVA: 使大型多模态模型理解任意视觉提示 AI专题精讲 Paper阅读多模态人工智能 AI
摘要现有的大型视觉-语言多模态模型主要关注整体图像理解，但在实现区域特定的理解方面仍存在显著差距。目前，使用文本坐标或空间编码的方法通常无法为视觉提示提供用户友好的接口。为了解决这个问题，我们提出了一种新颖的多模态模型，能够解码任意（自由形式）视觉提示。这使得用户可以通过自然提示（如“红色边框”或“指向箭头”）直观地标记图像并与模型互动。我们的简单设计直接将视觉标记叠加在RGB图像上，避免了复杂的
基于高斯两步移动搜寻法（2SFCA）的城市绿地可达性分析 yorov GIS技巧算法
【2SFCA的基本思路，可以略过】对每个供给点j，搜索所有在j搜寻半径（d0）范围内的需求点（k），计算供需比Rj；对每个需求点i，搜索所有在i搜寻半径（d0）范围内的供【数据】成都市城区绿地数据、各街道小区数据、路网数据OSM【那再来理解一下高斯两步移动搜索法】对于最初的两步移动模型相当于二分，而高斯型相当于是缓慢下降—急速下降—趋于平缓的状态。很像上次莫兰指数里说的空间关系概念化。第一步，对于
两步移动搜索法（2SFCA）python 我在北京coding python python 开发语言
实现两步移动搜索法（Two-StepFloatingCatchmentAreaMethod,2SFCA）是一种广泛应用于地理信息系统（GIS）领域的方法，用于评估设施的空间可达性。以下是基于Python和GeoPandas的一种实现方式。准备工作为了实现2SFCA方法，需要准备以下数据集：供给点：表示服务提供方的位置及其服务能力。需求点：表示潜在使用者的位置及其需求量。距离矩阵：描述供给点与需求点
1.线性神经网络--线性回归温柔济沧海深度学习神经网络线性回归 python
1.1从零实现线性回归importrandomimporttorch#fromd2limporttorchasd2limportmatplotlib.pyplotaspltdeftrain_data_make(batch_size,X,y):num_examples=len(X)idx=list(range(num_examples))#生成0-999random.shuffle(idx)#样本需
多模态大模型的技术应用与未来展望：重构AI交互范式的新引擎 zhaoyi_he 重构人工智能
一、引言：为什么多模态是AI发展的下一场革命？过去十年，深度学习推动了计算机视觉和自然语言处理的飞跃，但两者的发展路径长期割裂。随着生成式AI和大模型时代的到来，**多模态大模型（MultimodalFoundationModels）**以统一的建模方式处理图像、文本、音频、视频等多源数据，重塑了“感知-认知-决策”链条，为AGI迈出关键一步。OpenAI的GPT-4o、Google的Gemini
vllm推理实践 try2find java 前端服务器
1.vllm推理demo实验fromvllmimportLLM,SamplingParams#定义生成参数sampling_params=SamplingParams(temperature=0.7,top_p=0.9,max_tokens=100,)#加载DeepSeek模型（以deepseek-llm-7b为例）#model_name="deepseek-ai/deepseek-llm-7b"
OneCode 通用组件开发配置指南低代码老李软件行业领域设计 DDD 数据可视化低代码
一、布局组件1.1xui.UI.Layout核心属性：columns:布局列数配置dock:停靠方向（left/right/top/bottom）width:宽度设置（支持百分比和像素值）height:高度设置（支持百分比和像素值）iniProp.sub:子布局组配置场景说明：用于构建应用程序的整体布局框架，支持多列划分和元素停靠，是页面结构的基础组件。代码示例：{id:'xui.UI.Layou
Vue 开发问题：Missing required prop: “value“ 我命由我12345 vue.js javascript 前端前端框架 ecmascript 开发语言 js
在Vue项目中，出现如下警告信息[Vuewarn]:Missingrequiredprop:"value"[Vue警告]：缺少必需属性："value"问题原因这个警告表明在组件中存在一个必需的属性value没有被提供，即父组件没有传递该属性给子组件处理策略确保在使用组件时，父组件正确传递了属性给子组件
【前后端联调】MethodArgumentNotValidException 宣布无人罪前后端联调 java tomcat spring boot spring
【前后端联调】MethodArgumentNotValidException01问题描述前后端联调，前端传了一个参数是null，但是这个参数设置了校验不能为null，所以报了这个错误handleMethodArgumentNotValidException,132]-Validationfailedforargument[0]inpubliccom.ruoyi.common.core.domain
机器人动力学模型及其线性化阻抗控制模型
机器人动力学模型机器人动力学模型描述了机器人的运动与所受力和力矩之间的关系。这个模型考虑了机器人的质量、惯性、关节摩擦、重力等多种因素，用于预测和解释机器人在给定输入下的动态行为。动力学模型是设计机器人控制器的基础，它可以帮助我们理解机器人如何响应控制指令，并优化机器人的运动性能。具体来说，机器人动力学模型通常由一组微分方程组成，这些方程描述了机器人各关节的加速度、速度和位置与施加在关节上的力和力
图像分割技术详解：从原理到实践 lanjieying
本文还有配套的精品资源，点击获取简介：图像分割是图像处理领域将图像分解为多个区域的过程，用于图像分析、特征提取等。文章介绍了图像分割的原理，并通过一个将图像划分为2*4子块的示例，展示了如何使用Python和matplotlib库中的tight_subplot函数进行图像分割和展示。文章还探讨了图像分割在不同领域的应用，以及如何在机器学习项目中作为数据预处理步骤。1.图像分割基本概念在图像处理领域
ShaderGraph节点解析(136):矩形节点（Rectangle Node）详解小李也疯狂 #Unity ShaderGraph Rectangle
目录一、节点功能概述二、端口详解三、控制选项四、技术原理解析4.1数学原理（距离场计算）4.2生成代码解析4.3视觉特性五、应用场景与实战案例5.1UI元素（矩形按钮/面板）场景：在UI中生成无纹理的矩形按钮或面板，支持动态调整大小和圆角（配合其他节点）5.2材质纹理（网格/条纹）场景：为材质添加矩形网格或条纹纹理（如布料格子、屏幕像素感）5.3粒子形状（矩形粒子/条纹）场景：控制粒子的形状为矩形
RTX 30、40、50 系列显卡全面对比：谁才是你的最佳选择？小李也疯狂其他人工智能显卡
目录前言一、架构设计：不断进化的核心驱动力1.1RTX30系列（Ampere架构）1.2RTX40系列（AdaLovelace架构）1.3RTX50系列（Blackwell架构，假设信息，实际可能不同）二、性能表现：数字背后的实力较量2.1游戏性能1080P分辨率2K分辨率4K分辨率2.2创作性能视频编辑3D建模与渲染三、功能特性：前沿科技的魅力呈现3.1DLSS技术对比3.2光线追踪性能3.3编
Linux报错解决——导入了gcc版本，但是还是显示原来的gcc版本的解决办法 William.csj 报错解决 Ubuntu linux 运维服务器
一、问题描述我想要切换gcc版本，于是我用sudo安装了gcc-11，接着我在终端运行了：exportCC=/usr/bin/gcc-11exportCXX=/usr/bin/g++-11运行gcc--version还是显示：gcc(Ubuntu13.3.0-6ubuntu2~24.04)13.3.0二、原因分析即使你exportCC=/usr/bin/gcc-11，但gcc--version还是
模块化汽车基础设施的正面交锋---区域架构与域架构汽车电子实验室车载电子与软件框架汽车架构 OEM怎么掌握软件开发能力 ZEVonUDS-J1979 车载通信网络槪述 HPC软件架构
我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：做到欲望极简，了解自己的真实欲望，不受外在潮流的影响，不盲从，不跟风。把自己的精力全部用在自己。一是去掉多余，凡事找规律，基础是诚信；二是系统思考、大胆设计、小心求证；三是“一张纸制度”，也就是无论多么复杂的工作内容，要在一张纸上描述清楚；四是要坚决反对虎头蛇尾，反对繁文缛节，反对老
OpenCV 图像操作：颜色识别、替换与水印添加
目录引言代码实现1.导入必要的库2.图像加法3.图像直接相加4.颜色加权加法5.HSV颜色空间转换概念作用6.查找颜色范围对应的像素点7.与运算-生成掩膜8.添加水印9.主函数总结引言在计算机视觉领域，OpenCV是一个强大的库，提供了丰富的图像操作功能。本文将详细介绍如何使用OpenCV进行图像加法、颜色加权加法、HSV颜色空间转换、颜色范围查找、与运算生成掩膜以及添加水印等操作，并给出相应的P
【Python】simulink与python联合仿真
1.1Simulink的边界：事件驱动、算法复杂性与AI集成瓶颈Simulink的核心优势在于其强大的微分方程求解器和对连续时间系统、离散时间系统的精确描述能力。其基于“信号流”和“框图”的建模范式，使得工程师可以直观地构建与物理现实高度对应的数学模型。然而，这种优势也带来了其天然的局限性：基于时间的驱动核心(Time-BasedCoreEngine):Simulink的“心脏”是一个时间驱动的仿
python profile_python程序之profile分析
操作系统：CentOS7.3.1611_x64python版本：2.7.5问题描述1、Python开发的程序在使用过程中很慢，想确定下是哪段代码比较慢；2、Python开发的程序在使用过程中占用内存很大，想确定下是哪段代码引起的；解决方案使用profile分析分析cpu使用情况可以使用profile和cProfile对python程序进行分析，这里主要记录下cProfile的使用，profile参
将有序数组转化为二叉树
本文参考代码随想录将一个按照升序排列的有序数组，转换为一棵高度平衡二叉搜索树。思路：寻找分割点，分割点作为当前节点，然后递归左区间和右区间。递归法取中间值为root，递归左区间成为root的左孩子，右区间成为root的右孩子，最后返回rootclassSolution{private:TreeNode*traversal(vector&nums,intleft,intright){//若数组为空则
java数字签名三种方式知了ing java jdk
以下3钟数字签名都是基于jdk7的 1，RSA String password="test"; // 1.初始化密钥 KeyPairGenerator keyPairGenerator = KeyPairGenerator.getInstance("RSA"); keyPairGenerator.initialize(51
Hibernate学习笔记 caoyong Hibernate
1>、Hibernate是数据访问层框架，是一个ORM(Object Relation Mapping)框架，作者为:Gavin King 2>、搭建Hibernate的开发环境 a>、添加jar包: aa>、hibernatte开发包中/lib/required/所
设计模式之装饰器模式Decorator（结构型）漂泊一剑客 Decorator
1. 概述若你从事过面向对象开发，实现给一个类或对象增加行为，使用继承机制，这是所有面向对象语言的一个基本特性。如果已经存在的一个类缺少某些方法，或者须要给方法添加更多的功能（魅力），你也许会仅仅继承这个类来产生一个新类—这建立在额外的代码上。
读取磁盘文件txt，并输入String 一炮送你回车库 String
public static void main(String[] args) throws IOException { String fileContent = readFileContent("d:/aaa.txt"); System.out.println(fileContent);
js三级联动下拉框 3213213333332132 三级联动
//三级联动省/直辖市<select id="province"></select> 市/省直辖<select id="city"></select> 县/区 <select id="area"></select>
erlang之parse_transform编译选项的应用 616050468 parse_transform 游戏服务器属性同步 abstract_code
最近使用erlang重构了游戏服务器的所有代码，之前看过C++/lua写的服务器引擎代码，引擎实现了玩家属性自动同步给前端和增量更新玩家数据到数据库的功能，这也是现在很多游戏服务器的优化方向，在引擎层面去解决数据同步和数据持久化，数据发生变化了业务层不需要关心怎么去同步给前端。由于游戏过程中玩家每个业务中玩家数据更改的量其实是很少
JAVA JSON的解析 darkranger java
// { // “Total”：“条数”， // Code: 1, // // “PaymentItems”:[ // { // “PaymentItemID”:”支款单ID”, // “PaymentCode”:”支款单编号”, // “PaymentTime”:”支款日期”, // ”ContractNo”:”合同号”， //
POJ-1273-Drainage Ditches aijuans ACM_POJ
POJ-1273-Drainage Ditches http://poj.org/problem?id=1273 基本的最大流，按LRJ的白书写的 #include<iostream> #include<cstring> #include<queue> using namespace std; #define INF 0x7fffffff int ma
工作流Activiti5表的命名及含义 atongyeye 工作流 Activiti
activiti5 - http://activiti.org/designer/update在线插件安装 activiti5一共23张表 Activiti的表都以ACT_开头。第二部分是表示表的用途的两个字母标识。用途也和服务的API对应。 ACT_RE_*: 'RE'表示repository。这个前缀的表包含了流程定义和流程静态资源（图片，规则，等等）。 A
android的广播机制和广播的简单使用百合不是茶 android 广播机制广播的注册
Android广播机制简介在Android中，有一些操作完成以后，会发送广播，比如说发出一条短信，或打出一个电话，如果某个程序接收了这个广播，就会做相应的处理。这个广播跟我们传统意义中的电台广播有些相似之处。之所以叫做广播，就是因为它只负责“说”而不管你“听不听”，也就是不管你接收方如何处理。另外，广播可以被不只一个应用程序所接收，当然也可能不被任何应
Spring事务传播行为详解 bijian1013 java spring 事务传播行为
在service类前加上@Transactional，声明这个service所有方法需要事务管理。每一个业务方法开始时都会打开一个事务。 Spring默认情况下会对运行期例外(RunTimeException)进行事务回滚。这
eidtplus operate 征客丶 eidtplus
开启列模式: Alt+C 鼠标选择 OR Alt+鼠标左键拖动列模式替换或复制内容(多行): 右键-->格式-->填充所选内容-->选择相应操作 OR Ctrl+Shift+V(复制多行数据,必须行数一致) -------------------------------------------------------
【Kafka一】Kafka入门 bit1129 kafka
这篇文章来自Spark集成Kafka(http://bit1129.iteye.com/blog/2174765)，这里把它单独取出来，作为Kafka的入门吧下载Kafka http://mirror.bit.edu.cn/apache/kafka/0.8.1.1/kafka_2.10-0.8.1.1.tgz 2.10表示Scala的版本，而0.8.1.1表示Kafka
Spring 事务实现机制 BlueSkator spring 代理事务
Spring是以代理的方式实现对事务的管理。我们在Action中所使用的Service对象，其实是代理对象的实例，并不是我们所写的Service对象实例。既然是两个不同的对象，那为什么我们在Action中可以象使用Service对象一样的使用代理对象呢？为了说明问题，假设有个Service类叫AService，它的Spring事务代理类为AProxyService，AService实现了一个接口
bootstrap源码学习与示例：bootstrap-dropdown（转帖） BreakingBad bootstrap dropdown
bootstrap-dropdown组件是个烂东西，我读后的整体感觉。一个下拉开菜单的设计： <ul class="nav pull-right"> <li id="fat-menu" class="dropdown">
读《研磨设计模式》-代码笔记-中介者模式-Mediator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 中介者模式（Mediator）：用一个中介对象来封装一系列的对象交互。 * 中介者使各对象不需要显式地相互引用，从而使其耦合松散，而且可以独立地改变它们之间的交互。 * * 在我看来，Mediator模式是把多个对象（
常用代码记录 chenjunt3 UI Excel J#
1、单据设置某行或某字段不能修改 //i是行号,"cash"是字段名称 getBillCardPanelWrapper().getBillCardPanel().getBillModel().setCellEditable(i, "cash", false); //取得单据表体所有项用以上语句做循环就能设置整行了 getBillC
搜索引擎与工作流引擎 comsci 算法工作搜索引擎网络应用
最近在公司做和搜索有关的工作，(只是简单的应用开源工具集成到自己的产品中)工作流系统的进一步设计暂时放在一边了，偶然看到谷歌的研究员吴军写的数学之美系列中的搜索引擎与图论这篇文章中的介绍，我发现这样一个关系(仅仅是猜想) -----搜索引擎和流程引擎的基础--都是图论，至少像在我在JWFD中引擎算法中用到的是自定义的广度优先
oracle Health Monitor daizj oracle Health Monitor
About Health Monitor Beginning with Release 11g, Oracle Database includes a framework called Health Monitor for running diagnostic checks on the database. About Health Monitor Checks Health M
JSON字符串转换为对象 dieslrae java json
作为前言,首先是要吐槽一下公司的脑残编译部署方式,web和core分开部署本来没什么问题,但是这丫居然不把json的包作为基础包而作为web的包,导致了core端不能使用,而且我们的core是可以当web来用的(不要在意这些细节),所以在core中处理json串就是个问题.没办法,跟编译那帮人也扯不清楚,只有自己写json的解析了.
C语言学习八结构体，综合应用，学生管理系统 dcj3sjt126com C语言
实现功能的代码： # include <stdio.h> # include <malloc.h> struct Student { int age; float score; char name[100]; }; int main(void) { int len; struct Student * pArr; int i,
vagrant学习笔记 dcj3sjt126com vagrant
想了解多主机是如何定义和使用的, 所以又学习了一遍vagrant 1. vagrant virtualbox 下载安装 https://www.vagrantup.com/downloads.html https://www.virtualbox.org/wiki/Downloads 查看安装在命令行输入vagrant 2.
14.性能优化-优化-软件配置优化 frank1234 软件配置性能优化
1.Tomcat线程池修改tomcat的server.xml文件： <Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" maxThreads="1200" m
一个不错的shell 脚本教程入门级 HarborChung linux shell
一个不错的shell 脚本教程入门级建立一个脚本　　Linux中有好多中不同的shell，但是通常我们使用bash (bourne again shell) 进行shell编程，因为bash是免费的并且很容易使用。所以在本文中笔者所提供的脚本都是使用bash（但是在大多数情况下，这些脚本同样可以在 bash的大姐，bourne shell中运行）。　　如同其他语言一样
Spring4新特性——核心容器的其他改进 jinnianshilongnian spring 动态代理 spring4 依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
Linux设置tomcat开机启动 liuxingguome tomcat linux 开机自启动
执行命令sudo gedit /etc/init.d/tomcat6 然后把以下英文部分复制过去。（注意第一句#!/bin/sh如果不写，就不是一个shell文件。然后将对应的jdk和tomcat换成你自己的目录就行了。 #!/bin/bash # # /etc/rc.d/init.d/tomcat # init script for tomcat precesses
第13章 Ajax进阶（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Troubleshooting Crystal Reports off BW blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Troubleshooting+Crystal+Reports+off+BW#TroubleshootingCrystalReportsoffBW-TracingBOE Quite useful, especially this part: SAP BW connectivity For t
Java开发熟手该当心的11个错误 tomcat_oracle java jvm 多线程单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
正则表达式大全 yang852220741 html 编程正则表达式
今天向大家分享正则表达式大全，它可以大提高你的工作效率正则表达式也可以被当作是一门语言，当你学习一门新的编程语言的时候，他们是一个小的子语言。初看时觉得它没有任何的意义，但是很多时候，你不得不阅读一些教程，或文章来理解这些简单的描述模式。一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,}$ m-n位的数字：^\d{m,n}$