sing_sing

车牌识别及验证码识别的一般思路

下文为车牌识别的一些思路，实现方式不是通过opencv实现的，作为思路参考一下也不错，故转帖于此。

原文地址：

http://www.cnblogs.com/xiaotie/archive/2009/01/15/1376677.html

一、车牌 /验证码识别的普通方法

车牌、验证码识别的普通方法为：

（1）将图片灰度化与二值化

（2）去噪，然后切割成一个一个的字符

（3）提取每一个字符的特征，生成特征矢量或特征矩阵

（4）分类与学习。将特征矢量或特征矩阵与样本库进行比对，挑选出相似的那类样本，将这类样本的值作为输出结果。

下面借着代码，描述一下上述过程。因为更新 SVN Server，我以前以 bdb储存的代码访问不了，因此部分代码是用 Reflector反编译过来的，望见谅。

（1）图片的灰度化与二值化

这样做的目的是将图片的每一个象素变成 0或者255 ，以便以计算。同时，也可以去除部分噪音。

图片的灰度化与二值化的前提是 bmp图片，如果不是，则需要首先转换为 bmp图片。

用代码说话，我的将图片灰度化的代码（算法是在网上搜到的）：

1 protected static Color Gray(Color c)
2 {
3 int rgb = Convert.ToInt32(( double ) ((( 0.3 * c.R) + ( 0.59 * c.G)) + ( 0.11 * c.B)));
4 return Color.FromArgb(rgb, rgb, rgb);
5 }
6

通过将图片灰度化，每一个象素就变成了一个 0-255的灰度值。

然后是将灰度值二值化为 0 或 255。一般的处理方法是设定一个区间，比如， [a,b]，将 [a,b]之间的灰度全部变成 255，其它的变成 0。这里我采用的是网上广为流行的自适应二值化算法。

1 public static void Binarizate(Bitmap map)
2 {
3       int tv = ComputeThresholdValue(map);
4       int x = map.Width;
5       int y = map.Height;
6       for ( int i = 0 ; i < x; i ++ )
7      {
8           for ( int j = 0 ; j < y; j ++ )
9          {
10               if (map.GetPixel(i, j).R >= tv)
11              {
12                  map.SetPixel(i, j, Color.FromArgb( 0xff , 0xff , 0xff ));
13              }
14               else
15              {
16                  map.SetPixel(i, j, Color.FromArgb( 0 , 0 , 0 ));
17              }
18          }
19      }
20 }
21
22 private static int ComputeThresholdValue(Bitmap img)
23 {
24       int i;
25       int k;
26       double csum;
27       int thresholdValue = 1 ;
28       int [] ihist = new int [ 0x100 ];
29       for (i = 0 ; i < 0x100 ; i ++ )
30      {
31          ihist[i] = 0 ;
32      }
33       int gmin = 0xff ;
34       int gmax = 0 ;
35       for (i = 1 ; i < (img.Width - 1 ); i ++ )
36      {
37           for ( int j = 1 ; j < (img.Height - 1 ); j ++ )
38          {
39               int cn = img.GetPixel(i, j).R;
40              ihist[cn] ++ ;
41               if (cn > gmax)
42              {
43                  gmax = cn;
44              }
45               if (cn < gmin)
46              {
47                  gmin = cn;
48              }
49          }
50      }
51       double sum = csum = 0.0 ;
52       int n = 0 ;
53       for (k = 0 ; k <= 0xff ; k ++ )
54      {
55          sum += k * ihist[k];
56          n += ihist[k];
57      }
58       if (n == 0 )
59      {
60           return 60 ;
61      }
62       double fmax = - 1.0 ;
63       int n1 = 0 ;
64       for (k = 0 ; k < 0xff ; k ++ )
65      {
66          n1 += ihist[k];
67           if (n1 != 0 )
68          {
69               int n2 = n - n1;
70               if (n2 == 0 )
71              {
72                   return thresholdValue;
73              }
74              csum += k * ihist[k];
75               double m1 = csum / (( double ) n1);
76               double m2 = (sum - csum) / (( double ) n2);
77               double sb = ((n1 * n2) * (m1 - m2)) * (m1 - m2);
78               if (sb > fmax)
79              {
80                  fmax = sb;
81                  thresholdValue = k;
82              }
83          }
84      }
85       return thresholdValue;
86 }
87
88

灰度化与二值化之前的图片：

灰度化与二值化之后的图片：

注：对于车牌识别来说，这个算法还不错。对于验证码识别，可能需要针对特定的网站设计特殊的二值化算法，以过滤杂色。

（2）去噪，然后切割成一个一个的字符

上面这张车牌切割是比较简单的，从左到右扫描一下，碰见空大的，咔嚓一刀，就解决了。但有一些车牌，比如这张：

简单的扫描就解决不了。因此需要一个比较通用的去噪和切割算法。这里我采用的是比较朴素的方法：

将上面的图片看成是一个平面。将图片向水平方向投影，这样有字的地方的投影值就高，没字的地方投影得到的值就低。这样会得到一根曲线，像一个又一个山头。下面是我手画示意图：

然后，用一根扫描线（上图中的 S）从下向上扫描。这个扫描线会与图中曲线存在交点，这些交点会将山头分割成一个又一个区域。车牌图片一般是 7个字符，因此，当扫描线将山头分割成七个区域时停止。然后根据这七个区域向水平线的投影的坐标就可以将图片中的七个字符分割出来。

但是，现实是复杂的。比如，“川”字，它的水平投影是三个山头。按上面这种扫描方法会将它切开。因此，对于上面的切割，需要加上约束条件：每个山头有一个中心线，山头与山头的中心线的距离必需在某一个值之上，否则，则需要将这两个山头进行合并。加上这个约束之后，便可以有效的切割了。

以上是水平投影。然后还需要做垂直投影与切割。这里的垂直投影与切割就一个山头，因此好处理一些。

切割结果如下：

水平投影及切割代码：

1 public static IList < Bitmap > Split(Bitmap map, int count)
2 {
3       if (count <= 0 )
4      {
5           throw new ArgumentOutOfRangeException( " Count 必须大于0. " );
6      }
7      IList < Bitmap > resultList = new List < Bitmap > ();
8       int x = map.Width;
9       int y = map.Height;
10       int splitBitmapMinWidth = 4 ;
11       int [] xNormal = new int [x];
12       for ( int i = 0 ; i < x; i ++ )
13      {
14           for ( int j = 0 ; j < y; j ++ )
15          {
16               if (map.GetPixel(i, j).R == CharGrayValue)
17              {
18                  xNormal[i] ++ ;
19              }
20          }
21      }
22      Pair pair = new Pair();
23       for ( int i = 0 ; i < y; i ++ )
24      {
25          IList < Pair > pairList = new List < Pair > (count + 1 );
26           for ( int j = 0 ; j < x; j ++ )
27          {
28               if (xNormal[j] >= i)
29              {
30                   if ((j == (x - 1 )) && (pair.Status == PairStatus.Start))
31                  {
32                      pair.End = j;
33                      pair.Status = PairStatus.End;
34                       if ((pair.End - pair.Start) >= splitBitmapMinWidth)
35                      {
36                          pairList.Add(pair);
37                      }
38                      pair = new Pair();
39                  }
40                   else if (pair.Status == PairStatus.JustCreated)
41                  {
42                      pair.Start = j;
43                      pair.Status = PairStatus.Start;
44                  }
45              }
46               else if (pair.Status == PairStatus.Start)
47              {
48                  pair.End = j;
49                  pair.Status = PairStatus.End;
50                   if ((pair.End - pair.Start) >= splitBitmapMinWidth)
51                  {
52                      pairList.Add(pair);
53                  }
54                  pair = new Pair();
55              }
56               if (pairList.Count > count)
57              {
58                   break ;
59              }
60          }
61           if (pairList.Count == count)
62          {
63               foreach (Pair p in pairList)
64              {
65                   if (p.Width < (map.Width / 10 ))
66                  {
67                       int width = (map.Width / 10 ) - p.Width;
68                      p.Start = Math.Max( 0 , p.Start - (width / 2 ));
69                      p.End = Math.Min(( int ) (p.End + (width / 2 )), ( int ) (map.Width - 1 ));
70                  }
71              }
72               foreach (Pair p in pairList)
73              {
74                   int newMapWidth = (p.End - p.Start) + 1 ;
75                  Bitmap newMap = new Bitmap(newMapWidth, y);
76                   for ( int ni = p.Start; ni <= p.End; ni ++ )
77                  {
78                       for ( int nj = 0 ; nj < y; nj ++ )
79                      {
80                          newMap.SetPixel(ni - p.Start, nj, map.GetPixel(ni, nj));
81                      }
82                  }
83                  resultList.Add(newMap);
84              }
85               return resultList;
86          }
87      }
88       return resultList;
89 }
90

代码中的 Pair,代表扫描线与曲线的一对交点：

1 private class Pair
2 {
3       public Pair();
4       public int CharPixelCount {   get ; set ; }
5       public int CharPixelXDensity { get ; }
6       public int End { get ;   set ; }
7       public int Start {   get ;   set ; }
8       public BitmapConverter.PairStatus Status {   get ;   set ; }
9       public int Width { get ; }
10 }
11

PairStatus 代表 Pair 的状态。具体哪个状态是什么意义，我已经忘了。

1 private enum PairStatus
2 {
3      JustCreated,
4      Start,
5      End
6 }
7

以上这一段代码写的很辛苦，因为要处理很多特殊情况。那个 PairStatus 也是为处理特殊情况引进的。

垂直投影与切割的代码简单一些，不贴了，见附后的 dll 的 BitmapConverter.TrimHeight 方法。

以上用到的是朴素的去噪与切割方法。有些图片，尤其是验证码图片，需要特别的去噪处理。具体操作方法就是，打开 CxImage （ http://www.codeproject.com/KB/graphics/cximage.aspx ），或者 Paint.Net ，用上面的那些图片处理方法，看看能否有效去噪。记住自己的操作步骤，然后翻他们的源代码，将其中的算法提取出来。还有什么细化啊，滤波啊，这些处理可以提高图片的质量。具体可参考 ITK 的代码或图像处理书籍。

（3）提取每一个字符的特征，生成特征矢量或特征矩阵

将切割出来的字符，分割成一个一个的小块，比如 3 × 3 ， 5 × 5 ，或 3 × 5 ，或 10 × 8 ，然后统计一下每小块的值为 255 的像素数量，这样得到一个矩阵 M ，或者将这个矩阵简化为矢量 V 。

通过以上 3 步，就可以将一个车牌中的字符数值化为矢量了。

（ 1 ） - （ 3 ）步具体的代码流程如下：

2              BitmapConverter.ToGrayBmp(bitmap);     // 图片灰度化
3              BitmapConverter.Binarizate(bitmap); // 图片二值化
4              IList < Bitmap > mapList = BitmapConverter.Split(bitmap, DefaultCharsCount); // 水平投影然后切割
5              Bitmap map0 = BitmapConverter.TrimHeight(mapList[ 0 ], DefaultHeightTrimThresholdValue);     // 垂直投影然后切割
6              ImageSpliter spliter = new ImageSpliter(map0);
7              spliter.WidthSplitCount = DefaultWidthSplitCount;
8              spliter.HeightSplitCount = DefaultHeightSplitCount;
9              spliter.Init();
10

然后，通过spliter.ValueList就可以获得 Bitmap map0 的矢量表示。

（4）分类

分类的原理很简单。用 (Vij,Ci) 表示一个样本。其中， Vij 是样本图片经过上面过程数值化后的矢量。 Ci 是人肉眼识别这张图片，给出的结果。 Vij 表明，有多个样本，它们的数值化后的矢量不同，但是它们的结果都是 Ci 。假设待识别的图片矢量化后，得到的矢量是 V’ 。

直观上，我们会有这样一个思路，就是这张待识别的图片，最像样本库中的某张图片，那么我们就将它当作那张图片，将它识别为样本库中那张图片事先指定的字符。

在我们眼睛里，判断一张图片和另一张图片是否相似很简单，但对于电脑来说，就很难判断了。我们前面已经将图片数值化为一个个维度一样的矢量，电脑是怎样判断一个矢量与另一个矢量相似的呢？

这里需要计算一个矢量与另一个矢量间的距离。这个距离越短，则认为这两个矢量越相似。

我用 SampleVector <T> 来代表矢量：

1       public class SampleVector < T >
2      {
3           protected T[] Vector { get ; set ; }
4           public Int32 Dimension { get { return Vector.Length; } }
5          ……
6      }
7

T 代表数据类型，可以为 Int32 ，也可以为 Double 等更精确的类型。

测量距离的公共接口为： IMetric

1       public interface IMetric < TElement,TReturn >
2      {
3          TReturn Compute(SampleVector < TElement > v1, SampleVector < TElement > v2);
4      }
5

常用的是 MinkowskiMetric 。

1       /// <summary>
2       /// Minkowski 测度。
3       /// </summary>
4       public class MinkowskiMetric < TElement > : IMetric < TElement, Double >
5      {
6           public Int32 Scale { get ; private set ; }
7           public MinkowskiMetric(Int32 scale)
8          { Scale = scale; }
9
10           public Double Compute(SampleVector < TElement > v1, SampleVector < TElement > v2)
11          {
12               if (v1 == null || v2 == null ) throw new ArgumentNullException();
13               if (v1.Dimension != v2.Dimension) throw new ArgumentException( " v1 和 v2 的维度不等. " );
14              Double result = 0 ;
15               for ( int i = 0 ; i < v1.Dimension; i ++ )
16              {
17                  result += Math.Pow(Math.Abs(Convert.ToDouble(v1[i]) - Convert.ToDouble(v2[i])), Scale);
18              }
19               return Math.Pow(result, 1.0 / Scale);
20          }
21 }
22
23 MetricFactory 负责生产各种维度的MinkowskiMetric：
24
25       public class MetricFactory
26      {
27           public static IMetric < TElement, Double > CreateMinkowskiMetric < TElement > (Int32 scale)
28          {
29               return new MinkowskiMetric < TElement > (scale);
30          }
31
32           public static IMetric < TElement, Double > CreateEuclideanMetric < TElement > ()
33          {
34               return CreateMinkowskiMetric < TElement > ( 2 );
35          }
36      }
37

MinkowskiMetric 是普遍使用的测度。但不一定是最有效的量。因为它对于矢量 V 中的每一个点都一视同仁。而在图像识别中，每一个点的重要性却并不一样，例如， Q 和 O 的识别，特征在下半部分，下半部分的权重应该大于上半部分。对于这些易混淆的字符，需要设计特殊的测量方法。在车牌识别中，其它易混淆的有 D 和 0 ， 0 和 O ， I 和 1 。 Minkowski Metric 识别这些字符，效果很差。因此，当碰到这些字符时，需要进行特别的处理。由于当时时间紧，我就只用了 Minkowski Metric 。

我的代码中，只实现了哪个最近，就选哪个。更好的方案是用 K 近邻分类器或神经网络分类器。 K 近邻的原理是，找出和待识别的图片（矢量）距离最近的 K 个样本，然后让这 K 个样本使用某种规则计算（投票），这个新图片属于哪个类别（ C ）；神经网络则将测量的过程和投票判决的过程参数化，使它可以随着样本的增加而改变，是这样的一种学习机。有兴趣的可以去看《模式分类》一书的第三章和第四章。

二、变态字符的识别

有些字符变形很严重，有的字符连在一起互相交叉，有的字符被掩盖在一堆噪音海之中。对这类字符的识别需要用上特殊的手段。

下面介绍几种几个经典的处理方法，这些方法都是被证实对某些问题很有效的方法：

（1）切线距离（ Tangent Distance ）：可用于处理字符的各种变形， OCR 的核心技术之一。

（2）霍夫变换（ Hough Transform ）：对噪音极其不敏感，常用于从图片中提取各种形状。图像识别中最基本的方法之一。

（3）形状上下文（ Shape Context ）：将特征高维化，对形变不很敏感，对噪音也不很敏感。新世纪出现的新方法。

因为这几种方法我均未编码实现过，因此只简单介绍下原理及主要应用场景。

（1）切线距离

前面介绍了 MinkowskiMetric 。这里我们看看下面这张图：一个正写的 1 与一个歪着的 1.

用 MinkowskiMetric 计算的话，两者的 MinkowskiMetric 很大。

然而，在图像识别中，形状形变是常事。理论上，为了更好地识别，我们需要对每一种形变都采足够的样，这样一来，会发现样本数几乎无穷无尽，计算量越来越大。

怎么办呢？那就是通过计算切线距离，来代替直接距离。切线距离比较抽象，我们将问题简化为二维空间，以便以理解。

上图有两条曲线。分别是两个字符经过某一形变后所产生的轨迹。 V1 和 V2 是 2 个样本。 V’ 是待识别图片。如果用样本之间的直接距离，比较哪个样本离 V’ 最近，就将 V’ 当作哪一类，这样的话，就要把 V’ 分给 V1 了。理论上，如果我们无限取样的话，下面那一条曲线上的某个样本离 V’ 最近，V’ 应该归类为V2。不过，无限取样不现实，于是就引出了切线距离：在样本 V1 ， V2 处做切线，然后计算 V’ 离这两条切线的距离，哪个最近就算哪一类。这样一来，每一个样本，就可以代表它附近的一个样本区域，不需要海量的样本，也能有效的计算不同形状间的相似性。

深入了解切线距离，可参考这篇文章。 Transformation invariance in pattern recognition – tangent distance and tangent propagation (http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.32.9482) 这篇文章。

（2）霍夫变换

霍夫变换出自 1962 年的一篇专利。它的原理非常简单：就是坐标变换的问题。

如，上图中左图中的直线，对应着有图中 k-b 坐标系中的一个点。通过坐标变换，可以将直线的识别转换为点的识别。点的识别就比直线识别简单的多。为了避免无限大无限小问题，常用的是如下变换公式：

下面这张图是 wikipedia 上一张霍夫变换的示意图。左图中的两条直线变换后正对应着右图中的两个亮点。

通过霍夫变换原理可以看出，它的抗干扰性极强极强：如果直线不是连续的，是断断续续的，变换之后仍然是一个点，只是这个点的强度要低一些。如果一个直线被一个矩形遮盖住了，同样不影响识别。因为这个特征，它的应用性非常广泛。

对于直线，圆这样容易被参数化的图像，霍夫变换是最擅长处理的。对于一般的曲线，可通过广义霍夫变换进行处理。感兴趣的可以 google之，全是数学公式，看的人头疼。

（3）形状上下文

图像中的像素点不是孤立的，每个像素点，处于一个形状背景之下，因此，在提取特征时，需要将像素点的背景也作为该像素点的特征提取出来，数值化。

形状上下文（Shape Context，形状背景）就是这样一种方法：假定要提取像素点 O 的特征，采用上图（ c ）中的坐标系，以 O 点作为坐标系的圆心。这个坐标系将 O 点的上下左右切割成了 12 × 5=60 小块，然后统计这 60 小块之内的像素的特征，将其数值化为 12 × 5 的矩阵，上图中的（ d ），（ e ），（ f ）便分别是三个像素点的 Shape Context 数值化后的结果。如此一来，提取的每一个点的特征便包括了形状特征，加以计算，威力甚大。来看看 Shape Context 的威力：

上图中的验证码，对 Shape Context 来说只是小 Case 。

看看这几张图。嘿嘿，硬是给识别出来了。

Shape Context 是新出现的方法，其威力到底有多大目前还未见底。这篇文章是 Shape context 的必读文章： Shape Matching and Object Recognitiom using shape contexts （ http://www.cs.berkeley.edu/~malik/papers/BMP-shape.pdf ）。最后那两张验证码识别图出自 Greg Mori,Jitendra Malik 的《 Recognizing Objects in Adversarial Clutter:Breaking a Visual CAPTCHA 》一文。

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
121. 买卖股票的最佳时机薄荷糖的味道_fb40
给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
k均值聚类算法考试例题_k均值算法(k均值聚类算法计算题) 寻找你83497 k均值聚类算法考试例题
?算法：第一步：选K个初始聚类中心，z1(1),z2(1)，…，zK(1)，其中括号内的序号为寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定，例如可选开始的K个.k均值聚类：---------一种硬聚类算法，隶属度只有两个取值0或1，提出的基本根据是“类内误差平方和最小化”准则；模糊的c均值聚类算法：--------一种模糊聚类算法，是.K均值聚类算法是先随机选取K个对象作为初始的聚类
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
推荐算法_隐语义-梯度下降 _feivirus_ 算法机器学习和数学推荐算法机器学习隐语义
importnumpyasnp1.模型实现"""inputrate_matrix:M行N列的评分矩阵，值为P*Q.P:初始化用户特征矩阵M*K.Q:初始化物品特征矩阵K*N.latent_feature_cnt:隐特征的向量个数max_iteration:最大迭代次数alpha:步长lamda:正则化系数output分解之后的P和Q"""defLFM_grad_desc(rate_matrix,l
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
数据结构 | 栈和队列 TT-Kun 数据结构与算法数据结构栈队列 C语言
文章目录栈和队列1.栈：后进先出（LIFO）的数据结构1.1概念与结构1.2栈的实现2.队列：先进先出（FIFO）的数据结构2.1概念与结构2.2队列的实现3.栈和队列算法题3.1有效的括号3.2用队列实现栈3.3用栈实现队列3.4设计循环队列结论栈和队列在计算机科学中，栈和队列是两种基本且重要的数据结构，它们在处理数据存储和访问顺序方面有着独特的规则和应用。本文将详细介绍栈和队列的概念、结构、实
[Python] 数据结构详解及代码 AIAdvocate 算法 python 数据结构链表
今日内容大纲介绍数据结构介绍列表链表1.数据结构和算法简介程序大白话翻译,程序=数据结构+算法数据结构指的是存储,组织数据的方式.算法指的是为了解决实际业务问题而思考思路和方法,就叫:算法.2.算法的5大特性介绍算法具有独立性算法是解决问题的思路和方式,最重要的是思维,而不是语言,其(算法)可以通过多种语言进行演绎.5大特性有输入,需要传入1或者多个参数有输出,需要返回1个或者多个结果有穷性,执行
ArrayList 源码解析程序猿进阶 Java基础 ArrayList List java 面试性能优化架构设计 idea
ArrayList是Java集合框架中的一个动态数组实现，提供了可变大小的数组功能。它继承自AbstractList并实现了List接口，是顺序容器，即元素存放的数据与放进去的顺序相同，允许放入null元素，底层通过数组实现。除该类未实现同步外，其余跟Vector大致相同。每个ArrayList都有一个容量capacity，表示底层数组的实际大小，容器内存储元素的个数不能多于当前容量。当向容器中添
Python算法L5：贪心算法小熊同学哦 Python算法算法 python 贪心算法
Python贪心算法简介目录Python贪心算法简介贪心算法的基本步骤贪心算法的适用场景经典贪心算法问题1.**零钱兑换问题**2.**区间调度问题**3.**背包问题**贪心算法的优缺点优点：缺点：结语贪心算法（GreedyAlgorithm）是一种在每一步选择中都采取当前最优或最优解的算法。它的核心思想是，在保证每一步局部最优的情况下，希望通过贪心选择达到全局最优解。虽然贪心算法并不总能得到全
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
Python实现下载当前年份的谷歌影像 sand&wich python 开发语言
在GIS项目和地图应用中，获取最新的地理影像数据是非常重要的。本文将介绍如何使用Python代码从Google地图自动下载当前年份的影像数据，并将其保存为高分辨率的TIFF格式文件。这个过程涉及地理坐标转换、多线程下载和图像处理。关键功能该脚本的核心功能包括：坐标转换：支持WGS-84与WebMercator投影之间转换，以及处理中国GCJ-02偏移。自动化下载：多线程下载地图瓦片，提高效率。图像
Python实现TIFF 文件转换为 PNG 和 JPG 格式 sand&wich python 开发语言
在日常的图像处理工作中，可能会遇到需要将TIFF格式的图像转换为其他格式的情况，例如PNG和JPG。下面，本文将介绍如何使用Python和GDAL库实现这一功能。准备工作在开始之前，请确保已经安装了必要的库：GDAL（GeospatialDataAbstractionLibrary）可以使用以下命令安装GDAL：pipinstallgdal代码实现以下是一个将TIFF文件转换为PNG文件的示例代码
【RabbitMQ 项目】服务端：数据管理模块之绑定管理月夜星辉雪 rabbitmq 分布式
文章目录一.编写思路二.代码实践一.编写思路定义绑定信息类交换机名称队列名称绑定关键字：交换机的路由交换算法中会用到没有是否持久化的标志，因为绑定是否持久化取决于交换机和队列是否持久化，只有它们都持久化时绑定才需要持久化。绑定就好像一根绳子，两端连接着交换机和队列，当一方不存在，它就没有存在的必要了定义绑定持久化类构造函数：如果数据库文件不存在则创建，打开数据库，创建binding_table插入
非对称加密算法原理与应用2——RSA私钥加密文件私语茶馆云部署与开发架构及产品灵感记录 RSA2048 私钥加密
作者：私语茶馆1.相关章节（1）非对称加密算法原理与应用1——秘钥的生成-CSDN博客第一章节讲述的是创建秘钥对，并将公钥和私钥导出为文件格式存储。本章节继续讲如何利用私钥加密内容，包括从密钥库或文件中读取私钥，并用RSA算法加密文件和String。2.私钥加密的概述本文主要基于第一章节的RSA2048bit的非对称加密算法讲述如何利用私钥加密文件。这种加密后的文件，只能由该私钥对应的公钥来解密。
粒子群优化 (PSO) 在三维正弦波函数中的应用 subject625Ruben 机器学习人工智能 matlab 算法
在这篇博客中，我们将展示如何使用粒子群优化（PSO）算法求解三维正弦波函数，并通过增加正弦波扰动，使优化过程更加复杂和有趣。本文将介绍目标函数的定义、PSO参数设置以及算法执行的详细过程，并展示搜索空间中的动态过程和收敛曲线。1.目标函数定义我们使用的目标函数是一个三维正弦波函数，定义如下：objectiveFunc=@(x)sin(sqrt(x(1).^2+x(2).^2))+0.5*sin(5
c++ opencv4.3 sift匹配图像处理大大大大大牛啊图像处理 opencv实战代码讲解 opencv sift c++opencv4 特征点
c++opencv4.3sift匹配main.cppintmain(){vectorkeypoints1,keypoints2;Matimg1,img2,descriptors1,descriptors2;intnumF
非对称加密算法————RSA理论及详情 hu19930613
转自：https://www.kancloud.cn/kancloud/rsa_algorithm/48484一、一点历史1976年以前，所有的加密方法都是同一种模式：（1）甲方选择某一种加密规则，对信息进行加密；（2）乙方使用同一种规则，对信息进行解密。由于加密和解密使用同样规则（简称"密钥"），这被称为"对称加密算法"（Symmetric-keyalgorithm）。这种加密模式有一个最大弱点
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
【加密算法基础——对称加密和非对称加密】 XWWW668899 网络安全服务器笔记
对称加密与非对称加密对称加密和非对称加密是两种基本的加密方法，各自有不同的特点和用途。以下是详细比较：1.对称加密特点密钥:使用相同的密钥进行加密和解密。发送方和接收方必须共享这个密钥。速度:通常速度较快，适合处理大量数据。实现:算法相对简单，计算效率高。常见算法AES(高级加密标准)DES(数据加密标准)3DES(三重数据加密标准)RC4(流密码)应用场景文件加密磁盘加密传输大量数据时的加密2.
【算法练习】IDEA集成leetcode插件实现快速刷 2401_84102892 2024年程序员学习算法 intellij-idea leetcode
============点击右侧边leetcode->设置->配置地址、用户名、密码、存放目录、文件模板用户名要登录后在账号信息里看模板代码1.codefilename!velocityTool.camelC
【加密算法基础——RSA 加密】 XWWW668899 网络服务器笔记 python
RSA加密RSA（Rivest-Shamir-Adleman）加密是非对称加密，一种广泛使用的公钥加密算法，主要用于安全数据传输。公钥用于加密，私钥用于解密。RSA加密算法的名称来源于其三位发明者的姓氏：R:RonRivestS:AdiShamirA:LeonardAdleman这三位计算机科学家在1977年共同提出了这一算法，并发表了相关论文。他们的工作为公钥加密的基础奠定了重要基础，使得安全通
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
java短路运算符和逻辑运算符的区别 3213213333332132 java基础
/* * 逻辑运算符——不论是什么条件都要执行左右两边代码 * 短路运算符——我认为在底层就是利用物理电路的“并联”和“串联”实现的 * 原理很简单，并联电路代表短路或（||），串联电路代表短路与（&&）。 * * 并联电路两个开关只要有一个开关闭合，电路就会通。 * 类似于短路或（||），只要有其中一个为true（开关闭合）是
Java异常那些不得不说的事白糖_ java exception
一、在finally块中做数据回收操作比如数据库连接都是很宝贵的，所以最好在finally中关闭连接。 JDBCAgent jdbc = new JDBCAgent(); try{ jdbc.excute("select * from ctp_log"); }catch(SQLException e){ ... }finally{ jdbc.close();
utf-8与utf-8(无BOM)的区别 dcj3sjt126com PHP
BOM——Byte Order Mark，就是字节序标记在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符，它的编码是FEFF。而FFFE在UCS中是不存在的字符，所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前，先传输字符"ZERO WIDTH NO-BREAK SPACE"。这样如
JAVA Annotation之定义篇周凡杨 java 注解 annotation 入门注释
Annotation: 译为注释或注解 An annotation, in the Java computer programming language, is a form of syntactic metadata that can be added to Java source code. Classes, methods, variables, pa
tomcat的多域名、虚拟主机配置 g21121 tomcat
众所周知apache可以配置多域名和虚拟主机，而且配置起来比较简单，但是项目用到的是tomcat，配来配去总是不成功。查了些资料才总算可以，下面就跟大家分享下经验。很多朋友搜索的内容基本是告诉我们这么配置：在Engine标签下增面积Host标签，如下： <Host name="www.site1.com" appBase="webapps"
Linux SSH 错误解析（Capistrano 的cap 访问错误 Permission ） 510888780 linux capistrano
1.ssh -v [email protected] 出现 Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). 错误运行状况如下： OpenSSH_5.3p1, OpenSSL 1.0.1e-fips 11 Feb 2013 debug1: Reading configuratio
log4j的用法 Harry642 java log4j
一、前言： log4j 是一个开放源码项目，是广泛使用的以Java编写的日志记录包。由于log4j出色的表现，当时在log4j完成时，log4j开发组织曾建议sun在jdk1.4中用log4j取代jdk1.4 的日志工具类，但当时jdk1.4已接近完成，所以sun拒绝使用log4j，当在java开发中
mysql、sqlserver、oracle分页，java分页统一接口实现 aijuans oracle jave
定义：pageStart 起始页，pageEnd 终止页,pageSize页面容量 oracle分页：　　　　select * from ( select mytable.*,rownum num from (实际传的SQL) where rownum<=pageEnd) where num>=pageStart sqlServer分页：
Hessian 简单例子 antlove java Web service hessian
hello.hessian.MyCar.java package hessian.pojo; import java.io.Serializable; public class MyCar implements Serializable { private static final long serialVersionUID = 473690540190845543
数据库对象的同义词和序列百合不是茶 sql 序列同义词 ORACLE权限
回顾简单的数据库权限等命令; 解锁用户和锁定用户 alter user scott account lock/unlock; //system下查看系统中的用户 select * dba_users; //创建用户名和密码 create user wj identified by wj; identified by //授予连接权和建表权 grant connect to
使用Powermock和mockito测试静态方法 bijian1013 持续集成单元测试 mockito Powermock
实例： package com.bijian.study; import static org.junit.Assert.assertEquals; import java.io.IOException; import org.junit.Before; import org.junit.Test; import or
精通Oracle10编程SQL(6)访问ORACLE bijian1013 oracle 数据库 plsql
/* *访问ORACLE */ --检索单行数据 --使用标量变量接收数据 DECLARE v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; BEGIN select ename,sal into v_ename,v_sal from emp where empno=&no; dbms_output.pu
【Nginx四】Nginx作为HTTP负载均衡服务器 bit1129 nginx
Nginx的另一个常用的功能是作为负载均衡服务器。一个典型的web应用系统，通过负载均衡服务器，可以使得应用有多台后端服务器来响应客户端的请求。一个应用配置多台后端服务器，可以带来很多好处：负载均衡的好处增加可用资源增加吞吐量加快响应速度，降低延时出错的重试验机制 Nginx主要支持三种均衡算法： round-robin l
jquery-validation备忘白糖_ jquery css F#Firebug
留点学习jquery validation总结的代码： function checkForm(){ validator = $("#commentForm").validate({// #formId为需要进行验证的表单ID errorElement :"span",// 使用"div"标签标记错误，默认:&
solr限制admin界面访问（端口限制和http授权限制） ronin47 限定Ip访问
solr的管理界面可以帮助我们做很多事情，但是把solr程序放到公网之后就要限制对admin的访问了。可以通过tomcat的http基本授权来做限制，也可以通过iptables防火墙来限制。我们先看如何通过tomcat配置http授权限制。第一步：在tomcat的conf/tomcat-users.xml文件中添加管理用户，比如： <userusername="ad
多线程-用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 bylijinnan java 多线程
public class IncDecThread { private int j=10; /* * 题目:用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 * 两个问题： * 1、线程同步--synchronized * 2、线程之间如何共享同一个j变量--内部类 */ public static
买房历程 cfyme
2015-06-21: 万科未来城，看房子 2015-06-26: 办理贷款手续，贷款73万，贷款利率5.65=5.3675 2015-06-27: 房子首付,签完合同 2015-06-28，央行宣布降息 0.25，就2天的时间差啊，没赶上。首付，老婆找他的小姐妹接了5万，另外几个朋友借了1-
[军事与科技]制造大型太空战舰的前奏 comsci 制造
天气热了........空调和电扇要准备好.......... 最近,世界形势日趋复杂化,战争的阴影开始覆盖全世界.......... 所以,我们不得不关
dateformat dai_lm DateFormat
"Symbol Meaning Presentation Ex." "------ ------- ------------ ----" "G era designator (Text) AD" "y year
Hadoop如何实现关联计算 datamachine mapreduce hadoop 关联计算
选择Hadoop，低成本和高扩展性是主要原因，但但它的开发效率实在无法让人满意。以关联计算为例。假设：HDFS上有2个文件，分别是客户信息和订单信息，customerID是它们之间的关联字段。如何进行关联计算，以便将客户名称添加到订单列表中？ &nbs
用户模型中修改用户信息时，密码是如何处理的 dcj3sjt126com yii
当我添加或修改用户记录的时候对于处理确认密码我遇到了一些麻烦，所有我想分享一下我是怎么处理的。场景是使用的基本的那些(系统自带)，你需要有一个数据表(user)并且表中有一个密码字段(password),它使用 sha1、md5或其他加密方式加密用户密码。面是它的工作流程: 当创建用户的时候密码需要加密并且保存，但当修改用户记录时如果使用同样的场景我们最终就会把用户加密过的密码再次加密，这
中文 iOS/Mac 开发博客列表 dcj3sjt126com Blog
本博客列表会不断更新维护，如果有推荐的博客，请到此处提交博客信息。本博客列表涉及的文章内容支持定制化Google搜索，特别感谢 JeOam 提供并帮助更新。本博客列表也提供同步更新的OPML文件（下载OPML文件），可供导入到例如feedly等第三方定阅工具中，特别感谢 lcepy 提供自动转换脚本。这里有导入教程。
js去除空格，去除左右两端的空格蕃薯耀去除左右两端的空格 js去掉所有空格 js去除空格
js去除空格，去除左右两端的空格 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>&g
SpringMVC4零配置--web.xml hanqunfeng springmvc4
servlet3.0+规范后，允许servlet，filter，listener不必声明在web.xml中，而是以硬编码的方式存在，实现容器的零配置。 ServletContainerInitializer：启动容器时负责加载相关配置 package javax.servlet; import java.util.Set; public interface ServletContainer
《开源框架那些事儿21》：巧借力与借巧力 j2eetop 框架 UI
同样做前端UI，为什么有人花了一点力气，就可以做好？而有的人费尽全力，仍然错误百出？我们可以先看看几个故事。故事1：巧借力，乌鸦也可以吃核桃有一个盛产核桃的村子，每年秋末冬初，成群的乌鸦总会来到这里，到果园里捡拾那些被果农们遗落的核桃。核桃仁虽然美味，但是外壳那么坚硬，乌鸦怎么才能吃到呢？原来乌鸦先把核桃叼起，然后飞到高高的树枝上，再将核桃摔下去，核桃落到坚硬的地面上，被撞破了，于是，
JQuery EasyUI 验证扩展可怜的猫 jquery easyui 验证
最近项目中用到了前端框架-- EasyUI，在做校验的时候会涉及到很多需要自定义的内容，现把常用的验证方式总结出来，留待后用。以下内容只需要在公用js中添加即可。使用类似于如下： <input class="easyui-textbox" name="mobile" id="mobile&
架构师之httpurlconnection----------读取和发送(流读取效率通用类) nannan408
1.前言. 如题. 2.代码. /* * Copyright (c) 2015, S.F. Express Inc. All rights reserved. */ package com.test.test.test.send; import java.io.IOException; import java.io.InputStream
Jquery性能优化 r361251 JavaScript jquery
一、注意定义jQuery变量的时候添加var关键字这个不仅仅是jQuery，所有javascript开发过程中，都需要注意，请一定不要定义成如下： $loading = $('#loading'); //这个是全局定义，不知道哪里位置倒霉引用了相同的变量名，就会郁闷至死的二、请使用一个var来定义变量如果你使用多个变量的话，请如下方式定义： . 代码如下: var page
在eclipse项目中使用maven管理依赖 tjj006 eclipse maven
概览: 如何导入maven项目至eclipse中建立自有Maven Java类库服务器建立符合maven代码库标准的自定义类库 Maven在管理Java类库方面有巨大的优势，像白衣所说就是非常“环保”。我们平时用IDE开发都是把所需要的类库一股脑的全丢到项目目录下，然后全部添加到ide的构建路径中，如果用了SVN/CVS，这样会很容易就把
中国天气网省市级联页面 x125858805 级联
1、页面及级联js <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> &l

车牌识别及验证码识别的一般思路

你可能感兴趣的:(算法,vector,transformation,图像处理,pair,distance)