xholes

Kmeans聚类算法及其matlab源码

本文介绍了K-means聚类算法，并注释了部分matlab实现的源码。

K-means算法

K-means算法是一种硬聚类算法，根据数据到聚类中心的某种距离来作为判别该数据所属类别。K-means算法以距离作为相似度测度。

假设将对象数据集分为个不同的类，k均值聚类算法步骤如下：

Step1：随机从对象集中抽取个对象作为初始聚类中心；

Step2：对于所有的对象，分别计算其到各个聚类中的欧氏距离，相互比较后将其归属于距离最小的那一类；

Step3：根据step2得到的初始分类，对每个类别计算均值用来更新聚类中心；

Step4：根据新的聚类中心，重复进行step2和step3,直至满足算法终止条件。

K-means算法是基于划分的思想，因此算法易于理解且实现方法简单易行，但需要人工选择初始的聚类数目即算法是带参数的。类的数目确定往往非常复杂和具有不确定性，因此需要专业的知识和行业经验才能较好的确定。而且因为初始聚类中心的选择是随机的，因此会造成部分初始聚类中心相似或者处于数据边缘，造成算法的迭代次数明显增加，甚至会因为个别数据而造成聚类失败的现象。

其流程图大致如下：

matlab源码

function varargout = kmeans(X, k, varargin)
%K均值聚类.
%   IDX = KMEANS(X, K) 分割X[N P]的数据矩阵中的样本为K个类，是一种最小化类内点到中心距离和的总和的分割。 
%   矩阵X中的行对应的是数据样本，列对应的是变量。
%   提示: 当X是一个向量，本函数会忽略它的方向，将其当作一个[N 1]的数据矩阵。 
%   KMEANS 函数返回一个代表各个数据样本所属类别索引的[N 1]维向量，函数默认使用平方的欧氏距离。 
%   KMEANS 将NaNs当作丢失的数据并且忽略X中任何包含NaNs的行 
%   
%
%   [IDX, C] = KMEANS(X, K) 返回一个包含K个聚类中心的[K P]维的矩阵C.
%
%   [IDX, C, SUMD] = KMEANS(X, K) 返回一个类间点到聚类中心距离和的[K 1]维向量SUMD。
%
%   [IDX, C, SUMD, D] = KMEANS(X, K) 返回一个每个点到任一聚类中心距离的[N K]维矩阵D。
%
%   [ ... ] = KMEANS(..., 'PARAM1',val1, 'PARAM2',val2, ...) 指定了可选参数对（参数名/参数值）来控制算法的迭代。
%   参数如下：
%
%   'Distance' - 距离测度,  P维空间,  KMEANS算法需要最小化的值
%         可以选择:
%          'sqeuclidean'  - 平方的欧氏距离 (默认)
%          'cityblock'    - 曼哈顿距离，各维度差异的绝对值之和。
%          'cosine'       - 1减去两个样本（当作向量）夹角的余弦值 
%          'correlation'  - 1减去两个样本(当作值的序列)的相关系数 
%                           
%          'hamming'      - 汉明距离，二进制数据相匹配位置的不同比特百分比。 
%
%   'Start' - 选择初始聚类中心的方法,有时候也称作种子。
%         可以选择:
%          'plus'    - 默认值。 利用k-means++算法从X中选择K个观测值：从X中随机的选取第一个聚类中心；之后的
%                      聚类中心以一定的概率从剩余的样本中根据其到最近的聚类中心的比例来随机的选取。  
%          'sample'  - 随机的从X中选取K个观测值。
%          'uniform' - 根据X的取值范围均匀的随机选取K个样本，对汉明距离不适用。
%          'cluster' - 随机的利用X中10%的样本进行一个预聚类的阶段，预聚类阶段的初始聚类中心选取采用‘sample’。 
%           matrix   - 一个初始聚类中心的[K P]维矩阵。此时,你可以用[]代替K，算法会自动的根据矩阵的第一个维度推算K值。
%                      你也可以使用3D数组，暗含着第三维为参数'Replicates'的值。
%
%   'Replicates' - 重复聚类的次数,默认为1。 每次都会有一个新的初始聚类中心。 
%
%   'EmptyAction' - 发生空类时的处理措施。
%         可以选择:
%          'singleton' - 默认方法。利用据该中心最远的一个观测值建立一个新的类。
%          'error'     - 将产生空类作为一个错误(error)。
%          'drop'      - 移除空类并将对应的C和D中的值设置为NaN。
%         
%
%   'Options' - 迭代算法最小化拟合准则(？)的选项，通过STATSET创建。 Choices of STATSET
%          STATSET参数可以选择:
%
%          'Display'  - 显示输出的哪一阶段的值，可以为 'off'(默认），‘iter’和‘final’;
%          'MaxIter'  - 最大的迭代次数，默认值为100。
%
%          'UseParallel'  - 在满足条件下，如果为真则开启并行计算否则使用串行模式。默认使用串行模式。  
%          'UseSubstreams'  - 默认不使用。
%          'Streams'  - 这些区域指明是否执行并行的多个‘Start’值和当产生初始聚类中心时如何使用随机数值，
%                       更详细的参考 PARALLELSTATS。 
%                       提示: 如果 'UseParallel'为TRUE且 'UseSubstreams'为FALSE,
%                       那么'Streams'的长度必须等于KMEANS使用的workers的数目。 
%                       如果打开了并行池，那么它的大小和并行池一样。如果没有打开并行池，
%                       那么MATLAB可能会自动的打开(这取决于你的安装设置)。为了得到更好的结果，
%                       建议运用PARPOOL命令创建并行池的优先级以便当'UseParallel'为TRUE时执行算法。
%
%         'OnlinePhase' - 标志位，表示KMEANS是否除了运行一个"batch update"阶段还需一个"on-line
%                         update"阶段 。on-line阶段在大数据量时耗时很多。默认为‘off’。
%
%   示例:
%
%       X = [randn(20,2)+ones(20,2); randn(20,2)-ones(20,2)];
%       opts = statset('Display','final');
%       [cidx, ctrs] = kmeans(X, 2, 'Distance','city', ...
%                             'Replicates',5, 'Options',opts);
%       plot(X(cidx==1,1),X(cidx==1,2),'r.', ...
%            X(cidx==2,1),X(cidx==2,2),'b.', ctrs(:,1),ctrs(:,2),'kx');
%
%   也可以参考LINKAGE, CLUSTERDATA, SILHOUETTE。

%   KMEANS 运用两阶段迭代算法来最小化K个类中样本到中心的距离和。 
%   第一阶段利用文献中经常描述的"batch" 更新, 其中每次迭代中都一
%   次性地将样本分配到最近的聚类中心，然后更新聚类中心。这一阶段
%   偶尔(特别实在小样本的时候)会陷入局部最优。因此，"batch"阶段可
%   以考虑为第二阶段提供一个快速且可能为近似解的初始聚类中心。第二
%   阶段利用文献中常提及的"on-line"更新， 其中。如果能够减小距离
%   的总和那么其中的样本点都是单独地重新分配且每次分配后都重新计算
%   聚类中心。第二阶段中的每次迭代都会遍历所有的点，但是on-line阶段会收
%   敛到一个局部最小值。寻找全局最优的问题一般只能通过详细(幸运)地选择初始
%   聚类中心，但是使用重复多次的使用随机初始聚类中心中的典型结果是一个全局最小。
%
%  参考文献:
%
%   [1] Seber, G.A.F. (1984) Multivariate Observations, Wiley, New York.
%   [2] Spath, H. (1985) Cluster Dissection and Analysis: Theory, FORTRAN
%       Programs, Examples, translated by J. Goldschmidt, Halsted Press,
%       New York.

%判断输入变量是否少于两个
if nargin < 2 
    error(message('stats:kmeans:TooFewInputs'));
end
%判断X是否是实数矩阵；
if ~isreal(X) 
    error(message('stats:kmeans:ComplexData'));
end
%查找是否有NaN数据，有的话就删除，更新X矩阵；
wasnan = any(isnan(X),2);
hadNaNs = any(wasnan);
if hadNaNs
    warning(message('stats:kmeans:MissingDataRemoved'));
    X = X(~wasnan,:);
end

% 获取X矩阵的维数
[n, p] = size(X);
%参数名与默认参数值设置
pnames = {   'distance'  'start' 'replicates' 'emptyaction' 'onlinephase' 'options' 'maxiter' 'display'};
dflts =  {'sqeuclidean' 'plus'          []  'singleton'         'off'        []        []        []};
[distance,start,reps,emptyact,online,options,maxit,display] ...
    = internal.stats.parseArgs(pnames, dflts, varargin{:});

distNames = {'sqeuclidean','cityblock','cosine','correlation','hamming'};
distance = internal.stats.getParamVal(distance,distNames,'''Distance''');

switch distance
    case 'cosine'
        Xnorm = sqrt(sum(X.^2, 2));%模长
        if any(min(Xnorm) <= eps(max(Xnorm)))
            error(message('stats:kmeans:ZeroDataForCos'));
        end
        X =  bsxfun(@rdivide,X,Xnorm);%标准化
    case 'correlation'
        X = bsxfun(@minus, X, mean(X,2));
        Xnorm = sqrt(sum(X.^2, 2));
        if any(min(Xnorm) <= eps(max(Xnorm)))
            error(message('stats:kmeans:ConstantDataForCorr'));
        end
        X =  bsxfun(@rdivide,X,Xnorm);
     case 'hamming'
       if  ~all( X(:) ==0 | X(:)==1)
            error(message('stats:kmeans:NonbinaryDataForHamm'));
      end
end

Xmins = [];
Xmaxs = [];
CC = [];
if ischar(start)
    startNames = {'uniform','sample','cluster','plus','kmeans++'};
    j = find(strncmpi(start,startNames,length(start)));
    if length(j) > 1
        error(message('stats:kmeans:AmbiguousStart', start));
    elseif isempty(j)
        error(message('stats:kmeans:UnknownStart', start));
    elseif isempty(k)
        error(message('stats:kmeans:MissingK'));
    end
    start = startNames{j};
    if strcmp(start, 'uniform')
        if strcmp(distance, 'hamming')
            error(message('stats:kmeans:UniformStartForHamm'));
        end
        Xmins = min(X,[],1);%求每一列的最小值
        Xmaxs = max(X,[],1);%求每一列的最大值
    end
elseif isnumeric(start) %如果初始中心是数值类型(numeric)
    CC = start;
    start = 'numeric';
    if isempty(k)
        k = size(CC,1);%如果K为空通过数值的初始聚类中心获取K值
    elseif k ~= size(CC,1);%检测初始聚类中心行是否合法
        error(message('stats:kmeans:StartBadRowSize'));
    elseif size(CC,2) ~= p %检测初始聚类中心列是否合法
        error(message('stats:kmeans:StartBadColumnSize'));
    end
    if isempty(reps) 
        reps = size(CC,3);%如果重复次数参数为空，检测初始聚类中心的第三维获取
    elseif reps ~= size(CC,3);
        error(message('stats:kmeans:StartBadThirdDimSize'));
    end
    
    % Need to center explicit starting points for 'correlation'. (Re)normalization
    % for 'cosine'/'correlation' is done at each iteration.
    if isequal(distance, 'correlation')
          CC = bsxfun(@minus, CC, mean(CC,2));%如果距离测度为相关性需要中心化数据
    end
else
    error(message('stats:kmeans:InvalidStart'));
end

emptyactNames = {'error','drop','singleton'};
emptyact = internal.stats.getParamVal(emptyact,emptyactNames,'''EmptyAction''');

[~,online] = internal.stats.getParamVal(online,{'on','off'},'''OnlinePhase''');
online = (online==1);

% 'maxiter' and 'display' are grandfathered as separate param name/value pairs
if ~isempty(display)
    options = statset(options,'Display',display);
end
if ~isempty(maxit)
    options = statset(options,'MaxIter',maxit);
end

options = statset(statset('kmeans'), options);
display = find(strncmpi(options.Display, {'off','notify','final','iter'},...
    length(options.Display))) - 1;
maxit = options.MaxIter;%确定最大迭代次数

if ~(isscalar(k) && isnumeric(k) && isreal(k) && k > 0 && (round(k)==k))
    error(message('stats:kmeans:InvalidK'));
    % elseif k == 1
    % this special case works automatically
elseif n < k
    error(message('stats:kmeans:TooManyClusters'));
end

% Assume one replicate 检测重复次数的值
if isempty(reps)
    reps = 1;
elseif ~internal.stats.isScalarInt(reps,1)
    error(message('stats:kmeans:BadReps'));
end

[useParallel, RNGscheme, poolsz] = ...
    internal.stats.parallel.processParallelAndStreamOptions(options,true);

usePool = useParallel && poolsz>0;%检测是否使用并行池

% Prepare for in-progress
if display > 1 % 'iter' or 'final'
    if usePool
        % If we are running on a parallel pool, each worker will generate
        % a separate periodic report.  Before starting the loop, we
        % seed the parallel pool so that each worker will have an
        % identifying label (eg, index) for its report.
        internal.stats.parallel.distributeToPool( ...
            'workerID', num2cell(1:poolsz) );
        
        % Periodic reports behave differently in parallel than they do
        % in serial computation (which is the baseline).
        % We advise the user of the difference.
        
        if display == 3 % 'iter' only
            warning(message('stats:kmeans:displayParallel2'));
            fprintf('    worker\t  iter\t phase\t     num\t         sum\n' );
        end
    else
        if useParallel
            warning(message('stats:kmeans:displayParallel'));
        end
        if display == 3 % 'iter' only
            fprintf('  iter\t phase\t     num\t         sum\n');
        end
    end
end

if issparse(X) || ~isfloat(X) || strcmp(distance,'cityblock') || ...
        strcmp(distance,'hamming')
    [varargout{1:nargout}] = kmeans2(X,k, distance, emptyact,reps,start,...
        Xmins,Xmaxs,CC,online,display, maxit,useParallel, RNGscheme,usePool,...
        wasnan,hadNaNs,varargin{:});
    return;
end

emptyErrCnt = 0;

% Define the function that will perform one iteration of the
% loop inside smartFor
loopbody = @loopBody;%定义循环体函数

% Initialize nested variables so they will not appear to be functions here
%初始化循环嵌套变量
totsumD = 0;
iter = 0;

%将数据转置
X = X'; 
Xmins = Xmins';
Xmaxs = Xmaxs';

% 执行KMEANS多次(reps)在各自的工作区上.
ClusterBest = internal.stats.parallel.smartForReduce(...
    reps, loopbody, useParallel, RNGscheme, 'argmin');

% 选出最优解
varargout{1} = ClusterBest{5};%最优解的索引idx
varargout{2} = ClusterBest{6}';%最优解的聚类中心C
varargout{3} = ClusterBest{3}; %最优解的类内距离和sumD
totsumDbest = ClusterBest{1};%最优解的所有类内距离和的总和

if nargout > 3
    varargout{4} = ClusterBest{7}; %最优解的点到任意聚类中心的距离
end

if display > 1 % 'final' or 'iter'
    fprintf('%s\n',getString(message('stats:kmeans:FinalSumOfDistances',sprintf('%g',totsumDbest))));
end
 
if hadNaNs
    varargout{1} = statinsertnan(wasnan, varargout{1});% idxbest 
    if nargout > 3
        varargout{4} = statinsertnan(wasnan, varargout{4}); %Dbest
    end
end

    function cellout = loopBody(rep,S)%循环体函数
        
        if isempty(S)
            S = RandStream.getGlobalStream;
        end
        
        if display > 1 % 'iter'
            if usePool
                dispfmt = '%8d\t%6d\t%6d\t%8d\t%12g\n';
                labindx = internal.stats.parallel.workerGetValue('workerID');
            else
                dispfmt = '%6d\t%6d\t%8d\t%12g\n';
            end
        end

        %定义元胞数组
        cellout = cell(7,1);  % cellout{1}类间距离总和
                              % cellout{2}重复次数
                              % cellout{3}类内距离总和
                              % cellout{4}迭代次数
                              % cellout{5}索引
                              % cellout{6}聚类中心
                              % cellout{7}距离
        
        % Populating total sum of distances to Inf. This is used in the
        % reduce operation if update fails due to empty cluster.
        cellout{1} = Inf;%赋值
        cellout{2} = rep;

        %初始化聚类中心
        switch start
            case 'uniform'
                %C = Xmins(:,ones(1,k)) + rand(S,[p,k]).*(Xmaxs(:,ones(1,k))-Xmins(:,ones(1,k)));
                C = Xmins(:,ones(1,k)) + rand(S,[k,p])'.*(Xmaxs(:,ones(1,k))-Xmins(:,ones(1,k)));
                % For 'cosine' and 'correlation', these are uniform inside a subset
                % of the unit hypersphere.仍需要为'correlation'进行中心化.  
                %  'cosine'/'correlation'的正交化在每次迭代中完成

                if isequal(distance, 'correlation')
                    C = bsxfun(@minus, C, mean(C,1));
                end
                if isa(X,'single')
                    C = single(C);
                end
            case 'sample'
                C = X(:,randsample(S,n,k));
            case 'cluster'
                Xsubset = X(:,randsample(S,n,floor(.1*n)));
                % Turn display off for the initialization
                optIndex = find(strcmpi('options',varargin));
                if isempty(optIndex)
                    opts = statset('Display','off');
                    varargin = [varargin,'options',opts];
                else
                    varargin{optIndex+1}.Display = 'off';
                end
                [~, C] = kmeans(Xsubset', k, varargin{:}, 'start','sample', 'replicates',1);
                C = C';
            case 'numeric'
                C = CC(:,:,rep)';
                if isa(X,'single')
                    C = single(C);
                end
            case {'plus','kmeans++'}
                % Select the first seed by sampling uniformly at random
                index = zeros(1,k);
                [C(:,1), index(1)] = datasample(S,X,1,2);
                minDist = inf(n,1);
           
                % Select the rest of the seeds by a probabilistic model
               for ii = 2:k                    
                    minDist = min(minDist,distfun(X,C(:,ii-1),distance));
                    denominator = sum(minDist);
                    if denominator==0 || isinf(denominator) || isnan(denominator)
                        C(:,ii:k) = datasample(S,X,k-ii+1,2,'Replace',false);
                        break;
                    end
                    sampleProbability = minDist/denominator;
                    [C(:,ii), index(ii)] = datasample(S,X,1,2,'Replace',false,...
                        'Weights',sampleProbability);        
                end
        end
        if ~isfloat(C)      % X may be logical
            C = double(C);
        end
        
        % 计算点到聚类中心的距离和归属到各个类别
        D = distfun(X, C, distance, 0, rep, reps);%计算点到个中心的距离
        [d, idx] = min(D, [], 2);%根据最短距离归属到各个类
        m = accumarray(idx,1,[k,1])';%计算各个类中样本的个数
        
        try % catch空类错误并转移到下一个重复次
            
            %开始第一阶段:批分配
            converged = batchUpdate();
            
            % 开始第二阶段：单个分配
            if online
                converged = onlineUpdate();
            end
            
            
            if display == 2 % 'final'
                fprintf('%s\n',getString(message('stats:kmeans:IterationsSumOfDistances',rep,iter,sprintf('%g',totsumD) )));
            end
            
            if ~converged
                if reps==1
                    warning(message('stats:kmeans:FailedToConverge', maxit));
                else
                    warning(message('stats:kmeans:FailedToConvergeRep', maxit, rep));
                end
            end
            
            % 计算类内距离和
            nonempties = find(m>0);%判断没有空类，生成非空类的线性目录
            D(:,nonempties) = distfun(X, C(:,nonempties), distance, iter, rep, reps);
            d = D((idx-1)*n + (1:n)');
            sumD = accumarray(idx,d,[k,1]);% 计算类内距离和
            totsumD = sum(sumD(nonempties));% 计算所有类内距离和的总和
            
            % 保存目前最好的解
            cellout = {totsumD,rep,sumD,iter,idx,C,D}';
           
            % 如果在重复运行中发生空类现象,进行捕获并警告，然后继续下一次重复运行，
            %  只有在所有的重复运行失败才会ERROR，再次引发另一种ERROR。
        catch ME
            if reps == 1 || (~isequal(ME.identifier,'stats:kmeans:EmptyCluster')  && ...
                         ~isequal(ME.identifier,'stats:kmeans:EmptyClusterRep'))
                rethrow(ME);
            else
                emptyErrCnt = emptyErrCnt + 1;
                warning(message('stats:kmeans:EmptyClusterInBatchUpdate', rep, iter));
                if emptyErrCnt == reps
                    error(message('stats:kmeans:EmptyClusterAllReps'));
                end
            end
        end % catch
        
        %------------------------------------------------------------------
        
        function converged = batchUpdate()
            
            % 遍历每个点，更新每个类
            moved = 1:n;
            changed = 1:k;
            previdx = zeros(n,1);
            prevtotsumD = Inf;
            
            %
            % 开始第一阶段
            %
            
            iter = 0;
            converged = false;
            while true
                iter = iter + 1;
                
                % 更新新的聚类中心和数目以及每个样本到新聚类中心的距离 
                [C(:,changed), m(changed)] = gcentroids(X, idx, changed, distance);
                D(:,changed) = distfun(X, C(:,changed), distance, iter, rep, reps);
                
                %处理空类
                empties = changed(m(changed) == 0);
                if ~isempty(empties)
                    if strcmp(emptyact,'error')
                        if reps==1
                            error(message('stats:kmeans:EmptyCluster', iter));
                        else
                            error(message('stats:kmeans:EmptyClusterRep', iter, rep));
                        end
                    end
                    switch emptyact
                        case 'drop'
                            if reps==1
                                warning(message('stats:kmeans:EmptyCluster', iter));
                            else
                                warning(message('stats:kmeans:EmptyClusterRep', iter, rep));
                            end
                            % Remove the empty cluster from any further processing
                            D(:,empties) = NaN;
                            changed = changed(m(changed) > 0);
                        case 'singleton'
                            for i = empties
                                d = D((idx-1)*n + (1:n)'); % use newly updated distances
                                
                                % 选取一个距离当前类最远的样本作为一个新的类
                                [~, lonely] = max(d);
                                from = idx(lonely); % taking from this cluster
                                if m(from) < 2
                                    % In the very unusual event that the cluster had only
                                    % one member, pick any other non-singleton point.
                                    from = find(m>1,1,'first');
                                    lonely = find(idx==from,1,'first');
                                end
                                C(:,i) = X(:,lonely);
                                m(i) = 1;
                                idx(lonely) = i;
                                D(:,i) = distfun(X, C(:,i), distance, iter, rep, reps);
                                
                                % Update clusters from which points are taken
                                [C(:,from), m(from)] = gcentroids(X, idx, from, distance);
                                D(:,from) = distfun(X, C(:,from), distance, iter, rep, reps);
                                changed = unique([changed from]);
                            end
                    end
                end
                
                % 在当前配置下计算总距离
                totsumD = sum(D((idx-1)*n + (1:n)'));
                % 循环测试: 如果目标为减少,返回出去
                % 最后一步，之后进行单个更新阶段
                if prevtotsumD <= totsumD
                    idx = previdx;
                    [C(:,changed), m(changed)] = gcentroids(X, idx, changed, distance);
                    iter = iter - 1;
                    break;
                end
                if display > 2 % 'iter'
                    if usePool
                        fprintf(dispfmt,labindx,iter,1,length(moved),totsumD);
                    else
                        fprintf(dispfmt,iter,1,length(moved),totsumD);
                    end
                end
                if iter >= maxit
                    break;
                end
                
                %对每个点根据就近原则归属到各自的类 
                previdx = idx;
                prevtotsumD = totsumD;
                [d, nidx] = min(D, [], 2);
                
                % 决定哪个样本点移动
                moved = find(nidx ~= previdx);
                if ~isempty(moved)
                    % Resolve ties in favor of not moving
                    moved = moved(D((previdx(moved)-1)*n + moved) > d(moved));
                end
                if isempty(moved)
                    converged = true;
                    break;
                end
                idx(moved) = nidx(moved);
                
                % 寻找得到或者失去样本点的类
                changed = unique([idx(moved); previdx(moved)])';
                
            end % phase one
            
        end % nested function
        
        %------------------------------------------------------------------
        
        function converged = onlineUpdate()
                       
            %
            % 第二阶段开始: 单个分配
            %
            changed = find(m > 0);
            lastmoved = 0;
            nummoved = 0;
            iter1 = iter;
            converged = false;
            Del = NaN(n,k); % 重新分配的准则
            while iter < maxit
                %计算每个样本点到各个类的距离以及因每个类中添加或者移除样本点引起的误差和的变化
                %没有发生变化的类并不用更新。仅含单个样本点的类是总距离计算中的特殊情况。
                %移除它们仅有的样本点并不是最好的选择，根据分配准则最好保证它们能够得到保留， 
                %令人高兴地是，对于这种情况我们自动的使用Del(i,idx(i)) == 0。 
                switch distance
                    case 'sqeuclidean'
                        for i = changed
                            mbrs = (idx == i)';
                            sgn = 1 - 2*mbrs; % -1 for members, 1 for nonmembers
                            if m(i) == 1
                                sgn(mbrs) = 0; % prevent divide-by-zero for singleton mbrs
                            end
                          Del(:,i) = (m(i) ./ (m(i) + sgn)) .* sum((bsxfun(@minus, X, C(:,i))).^2, 1);
                        end
                      case {'cosine','correlation'}
                        % The points are normalized, centroids are not, so normalize them
                        normC = sqrt(sum(C.^2, 1));
                        if any(normC < eps(class(normC))) % small relative to unit-length data points
                            if reps==1
                                error(message('stats:kmeans:ZeroCentroid', iter));
                            else
                                error(message('stats:kmeans:ZeroCentroidRep', iter, rep));
                            end
                            
                        end
                        % This can be done without a loop, but the loop saves memory allocations
                        for i = changed
                            XCi =  C(:,i)'*X;
                            mbrs = (idx == i)';
                            sgn = 1 - 2*mbrs; % -1 for members, 1 for nonmembers
                            Del(:,i) = 1 + sgn .*...
                                (m(i).*normC(i) - sqrt((m(i).*normC(i)).^2 + 2.*sgn.*m(i).*XCi + 1));
                        end
                end
                
                % 对于任意一个样本点，确定可能是最好的移动方式。然后选择其中的一个进行移动
                previdx = idx;
                prevtotsumD = totsumD;
                [minDel, nidx] = min(Del, [], 2);
                moved = find(previdx ~= nidx);
                moved(m(previdx(moved))==1)=[];
                if ~isempty(moved)
                    % Resolve ties in favor of not moving
                    moved = moved(Del((previdx(moved)-1)*n + moved) > minDel(moved));
                end
                if isempty(moved)
                    % Count an iteration if phase 2 did nothing at all, or if we're
                    % in the middle of a pass through all the points
                    if (iter == iter1) || nummoved > 0
                        iter = iter + 1;
                        if display > 2 % 'iter'
                            if usePool
                                fprintf(dispfmt,labindx,iter,2,length(moved),totsumD);
                            else
                                fprintf(dispfmt,iter,2,length(moved),totsumD);
                            end
                        end
                    end
                    converged = true;
                    break;
                end
                
                % Pick the next move in cyclic order
                %循环地选择下一次的移动
                moved = mod(min(mod(moved - lastmoved - 1, n) + lastmoved), n) + 1;
                
                % 遍历完所有的样本点，则完成一次迭代
                if moved <= lastmoved
                    iter = iter + 1;
                    if display > 2 % 'iter'
                        if usePool
                            fprintf(dispfmt,labindx,iter,2,length(moved),totsumD);
                        else
                            fprintf(dispfmt,iter,2,length(moved),totsumD);
                        end
                    end
                    if iter >= maxit, break; end
                    nummoved = 0;
                end
                nummoved = nummoved + 1;
                lastmoved = moved;
                
                oidx = idx(moved);
                nidx = nidx(moved);
                totsumD = totsumD + Del(moved,nidx) - Del(moved,oidx);
                
                %更新类的索引向量、新旧类别各自的样本数目和中心
                idx(moved) = nidx;
                m(nidx) = m(nidx) + 1;
                m(oidx) = m(oidx) - 1;
                switch distance
                    case {'sqeuclidean','cosine','correlation'}
                        C(:,nidx) = C(:,nidx) + (X(:,moved) - C(:,nidx)) / m(nidx);
                        C(:,oidx) = C(:,oidx) - (X(:,moved) - C(:,oidx)) / m(oidx);
                end
                changed = sort([oidx nidx]);
            end % phase two
            
        end % nested function
        
    end

end % main function

%------------------------------------------------------------------

function D = distfun(X, C, dist, iter,rep, reps)
%DISTFUN计算样本点到中心的距离

switch dist
    case 'sqeuclidean'
        D = pdist2mex(X,C,'sqe',[],[],[]);  
    case {'cosine','correlation'}
        % 样本点已被标准化而中心点没有,因此对它们进行标准化 
        normC = sqrt(sum(C.^2, 1));
        if any(normC < eps(class(normC))) % small relative to unit-length data points(?)
            if reps==1
                error(message('stats:kmeans:ZeroCentroid', iter));
            else
                error(message('stats:kmeans:ZeroCentroidRep', iter, rep));
            end
            
        end
        C = bsxfun(@rdivide,C,normC);
        D = pdist2mex(X,C,'cos',[],[],[]); 
end
end % function

%------------------------------------------------------------------
function [centroids, counts] = gcentroids(X, index, clusts, dist)
%GCENTROIDS Centroids and counts stratified by group.
%计算各类的样本数目和中心点
p = size(X,1);
num = length(clusts);

centroids = NaN(p,num,'like',X);
counts = zeros(1,num,'like',X);

for i = 1:num
    members = (index == clusts(i));
    if any(members)
       counts(i) = sum(members);
       switch dist
           case {'sqeuclidean','cosine','correlation'}
              centroids(:,i) = sum(X(:,members),2) / counts(i);
      end
    end
end
end % function

探索Vearch：高效的深度学习向量相似度搜索系统 scaFHIO 深度学习人工智能 python
Vearch是一个可扩展的分布式系统，用于高效搜索深度学习向量的相似度。在本文中，我们将介绍Vearch的技术背景及其核心原理，演示如何使用VearchPythonSDK进行安装和设置，并分析一些实际应用场景，最后提供一些实战建议。技术背景介绍随着深度学习技术的发展，向量相似度搜索在各类应用中变得越来越重要。从图像识别、推荐系统到自然语言处理，向量搜索可以极大地提升系统的性能。然而，随着数据量的增
如何用matlab进行部分式展开_[转载]用MATLAB进行部分分式展开麦克羊
为了方便LAPLACE反变换，先对F(s)进行部分分式展开。根据F(s)分为具有不同极点的部分分式展开和具有多重极点的部分分式展开。分别讨论。不同极点的部分分式展开：F(s)=B(s)/A(s)=num/den=(b0*s^n+b1*s^(n-1)+...+bn)/(s^n+a1*s^(n-1)+...an)在matlab行向量中，num和den分别表示传递函数分子和分母的系数num=[b0b1.
《第2章位置与姿态描述》代码神笔馬良人工智能
最近在学习《视觉伺服/机器人学、机器视觉与控制》，发现书中的代码运行不通顺，原因可能是matlab升级后，部分函数的参数变化了。所以需要记录错误的代码和正确的代码。第一处：为了使上述推导更形象具体，下面我们将使用MATLAB工具箱展示一些具体数值化的例子。首先用函数se2创建一个齐次变换：错误代码T1=se2(1,2,30*pi/180)报错提示：错误使用matlabshared.spatialm
生态碳汇涡度相关监测与通量数据分析岁月如歌，青春不败生态遥感数据分析碳汇生态科学涡度通量大涡模拟 MATLAB
1、以涡度通量塔的高频观测数据，基于MATLAB：2、涡度通量观测基本概况：观测技术方法、数据获取与预处理等3、涡度通量数据质量控制：通量数据异常值识别与剔除等4、涡度通量数据缺失插补：结合气象数据进行通量数据缺失插补等5、涡度通量数据组分拆分：计算生态系统呼吸和总初级生产力等6、涡度通量数据可视化分析：绘制不同通量组分数据的时间变化等7、涡度通量与气象数据相关性：时间序列相关分析、回归分析等8、
【多微电网】含多微电网租赁共享储能的配电网博弈优化调度（Matlab代码实现）科研_研学社 matlab
‍个人主页欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录1概述2运行结果2.1原文运行结果12.1复现结果图12.2原文结果图22.2复现结果图23文献来源4Matlab代码、数据、文章1概述文献来源：摘要：该文提出多微电网并网系统租赁共享储能组成微电网联盟参与配电网调峰调度的优化调度策略，促进储能高效应用和新能
【多微电网】含多微电网租赁共享储能的配电网博弈优化调度（Matlab代码实现）科研_G.E.M. matlab
‍个人主页欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录1概述2运行结果2.1原文运行结果12.1复现结果图12.2原文结果图22.2复现结果图23文献来源4Matlab代码、数据、文章1概述文献来源：摘要：该文提出多微电网并网系统租赁共享储能组成微电网联盟参与配电网调峰调度的优化调度策略，促进储能高效应用和新能
基于基于强化学习(Q-Learning)用于底层动态频谱接入(DSA)认知无线电网络的资源分配研究（Matlab代码实现）长安程序猿网络 matlab 开发语言
欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录⛳️赠与读者1概述一、动态频谱接入（DSA）的基本原理与挑战1.DSA的核心机制2.关键挑战二、Q-Learning在DSA资源分配中的应用框架1.算法原理2.典型应用场景三、关键参数与模型设计1.状态空间定义2.动作空间设计3.奖励函数设计四、研究进展与优化方法1.
MATLAB算法实战应用案例精讲-【目标检测】机器视觉-工业相机（补充篇）林聪木数码相机 matlab 算法
目录知识储备光学系统设计全过程算法原理工业相机基本参数以及选型工业相机基本参数：如何选择合适的工业相机：分辨率分辨率的定义与“检测/测量精度”的区别分辨率与相机的匹配相机关键参数设置工业相机的曝光、曝光时间、快门、增益什么是曝光？什么是快门影响曝光的因素工业相机-坐标系和机械手坐标系的标定工业相机-缺陷检测一、相机的选择（1）工业数字相机的分类：（2）相机的主要参数（3）工业数字摄像机主要接口类型
【matlab】大小键盘对应的Kbname 有点傻的小可爱计算机外设
matlab中可以通过Kbname来识别键盘上的键。在写范式的时候，遇到一个问题，我想用大键盘上排成一行的数字按键评分，比如Kbname('1')表示键盘上的数字1，但是这种写法只能识别小键盘上的数字，无法达到我的目的，网上也没找到相关的资料，于是自己尝试。在尝试的过程中，我注意到大键盘上的数字shift之后是一些标点符号，于是我分别尝试了两种思路：1）Kbname('数字对应的标点符号')，比如
【卡车无人机】遗传算法GA求解卡车联合无人机配送路径规划【含Matlab源码 XYDG001期】 Matlab领域 Matlab路径规划（高阶版）matlab
Matlab领域博客之家博主简介：985研究生，Matlab领域科研开发者；个人主页：Matlab领域代码获取方式：CSDNMatlab领域—代码获取方式座右铭：路漫漫其修远兮，吾将上下而求索。更多Matlab路径规划仿真内容点击①Matlab路径规划（高阶版）②付费专栏Matlab路径规划（进阶版）③付费专栏Matlab路径规划（初级版）⛳️关注CSDNMatlab领域，更多资源等你来！！⛄一、
6种最新算法（小龙虾优化算法COA、螳螂搜索算法MSA、红尾鹰算法RTH、新雀优化算法NOA、鳑鲏鱼优化算法BFO、蜘蛛蜂优化算法SWO）求解机器人路径规划（提供MATLAB代码） IT猿手机器人路径规划优化算法无人机路径规划算法机器人 matlab 宽度优先开发语言人工智能前端
一、机器人路径规划介绍移动机器人（Mobilerobot，MR）的路径规划是移动机器人研究的重要分支之，是对其进行控制的基础。根据环境信息的已知程度不同，路径规划分为基于环境信息已知的全局路径规划和基于环境信息未知或局部已知的局部路径规划。随着科技的快速发展以及机器人的大量应用，人们对机器人的要求也越来越高，尤其表现在对机器人的智能化方面的要求，而机器人自主路径规划是实现机器人智能化的重要步骤，路
K-means聚类：解锁数据隐藏结构的钥匙小村学长毕业设计 kmeans 聚类机器学习
K-means聚类：解锁数据隐藏结构的钥匙在机器学习的广阔领域中，无监督学习以其独特的魅力吸引了众多研究者和实践者。其中，K-means聚类作为一种经典且实用的无监督学习算法，以其简单高效的特点，广泛应用于市场细分、图像分割和基因聚类等领域。本文将深入探讨K-means聚类的工作原理、应用实例及其在这些领域中的具体应用，旨在揭示其如何智能划分数据，解锁隐藏结构，为相关领域提供精准导航。一、K-me
【机器学习】半监督和无监督极限学习机SS-US-ELM附Matlab代码默默科研仔粉丝福利机器学习人工智能
标题：【机器学习】半监督和无监督极限学习机SS-US-ELM附Matlab代码一、引言1.1研究背景和意义概述研究的背景以及该研究在领域内的重要性。1.2研究现状分析当前领域的研究进展和存在的问题。二、极限学习机（ELM）基本原理2.1ELM的基本模型描述ELM的基本模型结构和工作原理。2.2ELM的学习过程介绍ELM的学习算法和训练过程。三、半监督极限学习机（SS-ELM）3.1SS-ELM的提
机器学习基本篇胖胖的小肥猫机器学习
1基本概念机器学习，分为回归，分类，聚类，降维有监督学习回归，分类，有特征，有标签，进行训练，然后对新数据进行预测无监督学习聚类，降维。题目越多，训练越好，2基本流程数据预处理——模型训练与评估可以优化为获取数据——数据预处理——EDA分析——特征工程——模型训练——可解释性分析2.0数据获取利用kaggle,天池等平台的开源数据，2.1预处理目的：让数据更符合逻辑让数据更容易计算借助函数实现变换
解锁机器学习核心算法 | 支持向量机：机器学习中的分类利刃紫雾凌寒 AI 炼金厂机器学习算法支持向量机 python 深度学习分类人工智能
一、引言在机器学习的庞大算法体系中，有十种算法被广泛认为是最具代表性和实用性的，它们犹如机器学习领域的“十大神器”，各自发挥着独特的作用。这十大算法包括线性回归、逻辑回归、决策树、随机森林、K-近邻算法、K-平均算法、支持向量机、朴素贝叶斯算法、降维算法、梯度增强算法。它们涵盖了回归、分类、聚类、降维等多个机器学习任务领域，是众多机器学习应用的基础和核心。而在这十大算法中，支持向量机（Suppor
Python字符模糊匹配指南 RapidFuzz | python小知识 aiweker 跟我学python python 服务器 linux
Python字符模糊匹配指南RapidFuzz|python小知识最近在看一个rag评估的框架中，看一个字符模糊匹配的库RapidFuzz，在这里介绍给大家。1.RapidFuzz简介RapidFuzz是一个用于Python的快速模糊字符串匹配库，它基于Levenshtein距离和其他相似度度量方法，能够高效地进行字符串比较和匹配。RapidFuzz旨在提供一个快速、准确、易用的模糊匹配工具，特别
LSTM-SVM故障诊断 | 基于长短期记忆神经网络-支持向量机多特征分类预测/故障诊断Matlab代码实现机器学习之心分类预测神经网络 lstm 支持向量机 LSTM-SVM 故障诊断
LSTM-SVM故障诊断|基于长短期记忆神经网络-支持向量机多特征分类预测/故障诊断Matlab代码实现完整代码私信回复LSTM-SVM故障诊断|基于长短期记忆神经网络-支持向量机多特征分类预测/故障诊断Matlab代码实现一、引言1.1、研究背景和意义在现代工业生产中，机械设备的高效稳定运行对保障生产安全和提高生产效率至关重要。因此，故障诊断技术作为预防和维护设备性能的关键手段，受到了广泛关注和
matlab绘图相关技巧记录猪猪虾的业余生活 matlab操作小技巧 matlab
1.matlabfo循环在一个figure上画图，实时清空上一次绘图fori=1:5:1800ione_view=prj(:,:,i);[judge,position]=JudgeView(one_view);figure(1);holdon;h1=plot(one_view);title(['view:',num2str(i)])xlabel("channelnumber");ylabel("p
matlab中功率因数怎样测量,如何测量功率因数?功率因数测量方法 liubotian1995 matlab中功率因数怎样测量
功率因数测量方法有：1、功率因数表法直接测量。用功率因数表直接测即可。这样测量到的瞬时功率因数值。2、功率法测量：测量负载的有功功率和无功功率(也有测视在功率的)，在用勾股定理或三角函数计算出功率因数，这是依据功率因数的定义得出的测量方法。数据也是瞬时功率因数值。3、电量法测量：供电局使用的方法，抄录当期用电的有功电量和无功电量数据，用三角函数计算出功率因数值。这是当期的平均功率因数值。我们都知道
matlab中将数据保存为txt文件_matlab中将数据输出保存为txt格式文件的方法安检
将matlab中数据输出保存为txt或dat格式总结网上各大论坛，主要有三种方法。第一种方法：save(最简单基本的)具体的命令是：用save*.txt-asciixx为变量*.txt为文件名,该文件存储于当前工作目录下，再打开就可以打开后,数据有可能是以指数形式保存的.例子：a=[17241815;23571416;46132022;101219213;11182529]；saveafile.t
Matlab 机器人雅可比矩阵 CodingAlgo 算法
===工业机器人运动学与Matlab正逆解算法学习笔记（用心总结一文全会）（四）——雅可比矩阵_staubli机器人正逆向运动学实例验证matlab-CSDN博客===matlab求雅可比矩阵_六轴机械臂矢量积法求解雅可比矩阵-CSDN博客===(63封私信/80条消息)MATLAB机器人工具箱中机器人逆解是如何求出来的？-知乎===https://zhuanlan.zhihu.com/p/638
书籍-《控制理论的数学导论（第三版）》机器人数学
书籍：AMathematicalIntroductiontoControlTheory作者：ShlomoEngelberg出版：WorldScientificPublishingCompany编辑：陈萍萍的公主@一点人工一点智能下载：《控制理论的数学导论（第三版）》01书籍介绍本书在数学严谨性和工程应用之间达到了完美的平衡，有助于学生全面理解控制理论的数学和工程层面。本书不仅有效运用了MATLAB
MATLAB代码实现了一个图形用户界面（GUI）程序，主要用于处理与水的物理性质相关的计算和绘图任务 go5463158465 MATLAB专栏深度学习算法 matlab 前端 javascript
functionvarargout=ruanjian(varargin)%RUANJIANMATLABcodeforruanjian.fig%RUANJIAN,byitself,createsanewRUANJIANorraisestheexisting%singleton*.%%H=RUANJIANreturnsthehandletoanewRUANJIANorthehandleto%theex
MATLAB中count函数用法 jk_101 Matlab matlab 开发语言
目录语法说明示例对出现次数计数使用模式对数字和字母进行计数多个子字符串的所有出现次数忽略大小写对字符向量中的子字符串进行计数count函数的功能是计算字符串中模式的出现次数。语法A=count(str,pat)A=count(str,pat,'IgnoreCase',true)说明A=count(str,pat)返回pat在str中的出现次数。如果pat是包含多个模式的数组，则count返回pat
基于图像处理的裂缝宽度检测系统-matlab 人工智能专属驿站计算机视觉图像处理人工智能
图像处理技术广泛地应用于桥梁、房屋、道路等工程施工中出现的表面裂缝,利用数字图像处理技术来测量结构物表面裂缝宽度是一种无损检测方法.基于图像处理的裂缝宽度检测系统需采用的图像处理算法有:（1）读取裂缝图像；（2）图像转化为灰度图像；（3）图像的增强；（4）平滑滤波；（5）阈值分割；（6）形态学去噪；（7）边缘检测(Canny算子)；（8）边缘坐标点的提取；结果见：源程序见：基于图像处理的裂缝宽度检
通过MATLAB/Simulink平台，使用时域分析法评估一个典型控制系统的响应速度性能指标 xiaoheshang_123 MATLAB 开发项目实例 1000 例专栏手把手教你学 MATLAB 专栏 simulink matlab
目录基于Simulink的时域分析法评估系统的响应速度性能指标1.背景介绍1.1项目背景1.2系统描述1.3应用场景2.系统架构设计2.1系统框图2.2数学模型3.Simulink仿真模型步骤3.1创建Simulink模型3.2添加模块3.2.1阶跃输入模块3.2.2系统模型模块3.2.3输出显示模块3.2.4数据记录模块3.3连接模块3.4设置仿真参数3.5运行仿真4.响应速度性能指标计算5.参
matlab 延迟算子,时间序列分析-----2---时间序列预处理这块必被安排 matlab 延迟算子
既然有了序列，那怎么拿来分析呢？时间序列分析方法分为描述性时序分析和统计时序分析。1、描述性时序分析通过直观的数据比较或绘图观测，寻找序列中蕴含的发展规律，这种分析方法就称为描述性时序分析。描述性时序分析方法具有操作简单、直观有效的特点，它通常是人们进行统计时序分析的第一步。2、统计时序分析(1)频域分析方法原理：假设任何一种无趋势的时间序列都可以分解成若干不同频率的周期波动发展过程：1)早期的频
【论文精读】MotionLM EEPI 自动驾驶深度学习论文阅读
【论文精读】MotionLM1背景2存在的问题3具体方案轨迹转运动序列模型轨迹去重和聚类loss1背景团队：Waymo时间：2023.9代码：简介：采用自回归的方式做轨迹生成，能够更好地建模交互，且避免模态坍缩，在数据集达到了SOTA。2存在的问题轨迹回归方面：原本xy预测认为空间过大，有的xy很大（t大速度快的时候），有的xy很小（t小速度慢的时候）。3具体方案Encoder采用了之前的论文Wa
智能优化算法应用：基于群居蜘蛛算法与双伽马校正的图像自适应增强算法智能算法研学社（Jack旭）智能优化算法应用图像增强算法计算机视觉人工智能
智能优化算法应用：基于群居蜘蛛算法与双伽马校正的图像自适应增强算法-附代码文章目录智能优化算法应用：基于群居蜘蛛算法与双伽马校正的图像自适应增强算法-附代码1.全局双伽马校正2.群居蜘蛛算法3.适应度函数设计4.实验与算法结果5.参考文献6.Matlab代码摘要：本文主要介绍基于群居蜘蛛算法与双伽马校正的图像自适应增强算法。1.全局双伽马校正设图像的灰度值范围被归一化到[0,1]范围之内，基于全局
机器学习：k均值 golemon. ML 机器学习均值算法人工智能
所有代码和文档均在golitter/Decoding-ML-Top10:使用Python优雅地实现机器学习十大经典算法。(github.com)，欢迎查看。在“无监督学习”中，训练样本的标记信息是未知的，目标是通过对无标记训练样本的学习来揭示数据的内在性质及规律，为进一步的数据分析提供基础，较为经典的是聚类。**聚类试图将数据集中的样本划分为若干个通常是不相交的子集，每个子集称为一个“簇”。**聚
Dom 周华华 JavaScript html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
【Spark九十六】RDD API之combineByKey bit1129 spark
1. combineByKey函数的运行机制 RDD提供了很多针对元素类型为(K,V)的API，这些API封装在PairRDDFunctions类中，通过Scala隐式转换使用。这些API实现上是借助于combineByKey实现的。combineByKey函数本身也是RDD开放给Spark开发人员使用的API之一首先看一下combineByKey的方法说明：
msyql设置密码报错：ERROR 1372 (HY000): 解决方法详解 daizj mysql 设置密码
MySql给用户设置权限同时指定访问密码时，会提示如下错误： ERROR 1372 (HY000): Password hash should be a 41-digit hexadecimal number；问题原因：你输入的密码是明文。不允许这么输入。解决办法：用select password('你想输入的密码');查询出你的密码对应的字符串，然后
路漫漫其修远兮吾将上下而求索周凡杨学习思索
王国维在他的《人间词话》中曾经概括了为学的三种境界古今之成大事业、大学问者，罔不经过三种之境界。“昨夜西风凋碧树。独上高楼，望尽天涯路。”此第一境界也。“衣带渐宽终不悔，为伊消得人憔悴。”此第二境界也。“众里寻他千百度，蓦然回首，那人却在灯火阑珊处。”此第三境界也。学习技术，这也是你必须经历的三种境界。第一层境界是说，学习的路是漫漫的，你必须做好充分的思想准备，如果半途而废还不如不要开始。这里，注
Hadoop(二)对话单的操作朱辉辉33 hadoop
Debug： 1、 A = LOAD '/user/hue/task.txt' USING PigStorage(' ') AS (col1,col2,col3); DUMP A; //输出结果前几行示例： (>ggsnPDPRecord(21),,) (-->recordType(0),,) (-->networkInitiation(1),,)
web报表工具FineReport常用函数的用法总结（日期和时间函数）老A不折腾 finereport 报表工具 web开发
web报表工具FineReport常用函数的用法总结（日期和时间函数）说明：凡函数中以日期作为参数因子的，其中日期的形式都必须是yy/mm/dd。而且必须用英文环境下双引号(" ")引用。 DATE DATE(year,month,day):返回一个表示某一特定日期的系列数。 Year:代表年，可为一到四位数。 Month:代表月份。
c++ 宏定义中的##操作符墙头上一根草 C++
#与##在宏定义中的--宏展开 #include <stdio.h> #define f(a,b) a##b #define g(a) #a #define h(a) g(a) int main() { &nbs
分析Spring源代码之，DI的实现 aijuans spring DI 现源代码
(转) 分析Spring源代码之，DI的实现 2012/1/3 by tony 接着上次的讲，以下这个sample [java] view plain copy print
for循环的进化 alxw4616 JavaScript
// for循环的进化 // 菜鸟 for (var i = 0; i < Things.length ; i++) { // Things[i] } // 老鸟 for (var i = 0, len = Things.length; i < len; i++) { // Things[i] } // 大师 for (var i = Things.le
网络编程Socket和ServerSocket简单的使用百合不是茶网络编程基础 IP地址端口
网络编程;TCP/IP协议网络:实现计算机之间的信息共享,数据资源的交换协议:数据交换需要遵守的一种协议,按照约定的数据格式等写出去端口:用于计算机之间的通信每运行一个程序，系统会分配一个编号给该程序，作为和外界交换数据的唯一标识 0~65535 查看被使用的
JDK1.5 生产消费者 bijian1013 java thread 生产消费者 java多线程
ArrayBlockingQueue：一个由数组支持的有界阻塞队列。此队列按 FIFO（先进先出）原则对元素进行排序。队列的头部是在队列中存在时间最长的元素。队列的尾部是在队列中存在时间最短的元素。新元素插入到队列的尾部，队列检索操作则是从队列头部开始获得元素。 ArrayBlockingQueue的常用方法：
JAVA版身份证获取性别、出生日期及年龄 bijian1013 java 性别出生日期年龄
工作中需要根据身份证获取性别、出生日期及年龄，且要还要支持15位长度的身份证号码，网上搜索了一下，经过测试好像多少存在点问题，干脆自已写一个。 CertificateNo.java package com.bijian.study; import java.util.Calendar; import
【Java范型六】范型与枚举 bit1129 java
首先，枚举类型的定义不能带有类型参数，所以，不能把枚举类型定义为范型枚举类，例如下面的枚举类定义是有编译错的 public enum EnumGenerics<T> { //编译错，提示枚举不能带有范型参数 OK, ERROR; public <T> T get(T type) { return null;
【Nginx五】Nginx常用日志格式含义 bit1129 nginx
1. log_format 1.1 log_format指令用于指定日志的格式，格式： log_format name(格式名称) type(格式样式) 1.2 如下是一个常用的Nginx日志格式： log_format main '[$time_local]|$request_time|$status|$body_bytes
Lua 语言 15 分钟快速入门 ronin47 lua 基础
- - 单行注释 - - [[ [多行注释] - - ]] - - - - - - - - - - - 1. 变量 & 控制流 - - - - - - - - - - num = 23 - - 数字都是双精度 str = 'aspythonstring'
java-35.求一个矩阵中最大的二维矩阵 ( 元素和最大 ) bylijinnan java
the idea is from: http://blog.csdn.net/zhanxinhang/article/details/6731134 public class MaxSubMatrix { /**see http://blog.csdn.net/zhanxinhang/article/details/6731134 * Q35 求一个矩阵中最大的二维
mongoDB文档型数据库特点开窍的石头 mongoDB文档型数据库特点
MongoDD: 文档型数据库存储的是Bson文档-->json的二进制特点：内部是执行引擎是js解释器，把文档转成Bson结构，在查询时转换成js对象。 mongoDB传统型数据库对比传统类型数据库：结构化数据，定好了表结构后每一个内容符合表结构的。也就是说每一行每一列的数据都是一样的文档型数据库：不用定好数据结构，
[毕业季节]欢迎广大毕业生加入JAVA程序员的行列 comsci java
一年一度的毕业季来临了。。。。。。。。正在投简历的学弟学妹们。。。如果觉得学校推荐的单位和公司不适合自己的兴趣和专业，可以考虑来我们软件行业，做一名职业程序员。。。软件行业的开发工具中，对初学者最友好的就是JAVA语言了，网络上不仅仅有大量的
PHP操作Excel – PHPExcel 基本用法详解 cuiyadll PHP Excel
导出excel属性设置//Include classrequire_once('Classes/PHPExcel.php');require_once('Classes/PHPExcel/Writer/Excel2007.php');$objPHPExcel = new PHPExcel();//Set properties 设置文件属性$objPHPExcel->getProperties
IBM Webshpere MQ Client User Issue (MCAUSER) darrenzhu IBM jms user MQ MCAUSER
IBM MQ JMS Client去连接远端MQ Server的时候，需要提供User和Password吗？答案是根据情况而定，取决于所定义的Channel里面的属性Message channel agent user identifier (MCAUSER)的设置。 http://stackoverflow.com/questions/20209429/how-mca-user-i
网线的接法 dcj3sjt126com
一、PC连HUB (直连线)A端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。 B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。二、PC连PC （交叉线）A端：(568A)：白绿，绿，白橙，蓝，白蓝，橙，白棕，棕； B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。三、HUB连HUB&nb
Vimium插件让键盘党像操作Vim一样操作Chrome dcj3sjt126com chrome vim
什么是键盘党？键盘党是指尽可能将所有电脑操作用键盘来完成，而不去动鼠标的人。鼠标应该说是新手们的最爱，很直观，指哪点哪，很听话！不过常常使用电脑的人，如果一直使用鼠标的话，手会发酸，因为操作鼠标的时候，手臂不是在一个自然的状态，臂肌会处于绷紧状态。而使用键盘则双手是放松状态，只有手指在动。而且尽量少的从鼠标移动到键盘来回操作，也省不少事。在chrome里安装 vimium 插件
MongoDB查询（2）——数组查询[六] eksliang mongodb MongoDB查询数组
MongoDB查询数组转载请出自出处：http://eksliang.iteye.com/blog/2177292 一、概述 MongoDB查询数组与查询标量值是一样的，例如，有一个水果列表，如下所示： > db.food.find() { "_id" : "001", "fruits" : [ "苹
cordova读写文件（1） gundumw100 JavaScript Cordova
使用cordova可以很方便的在手机sdcard中读写文件。首先需要安装cordova插件：file 命令为： cordova plugin add org.apache.cordova.file 然后就可以读写文件了，这里我先是写入一个文件，具体的JS代码为： var datas=null;//datas need write var directory=&
HTML5 FormData 进行文件jquery ajax 上传到又拍云 ileson jquery Ajax html5 FormData
html5 新东西：FormData 可以提交二进制数据。页面test.html <!DOCTYPE> <html> <head> <title> formdata file jquery ajax upload</title> </head> <body> <
swift appearanceWhenContainedIn:(version1.2 xcode6.4) 啸笑天 version
swift1.2中没有oc中对应的方法： + (instancetype)appearanceWhenContainedIn:(Class <UIAppearanceContainer>)ContainerClass, ... NS_REQUIRES_NIL_TERMINATION; 解决方法：在swift项目中新建oc类如下： #import &
java实现SMTP邮件服务器 macroli java 编程
电子邮件传递可以由多种协议来实现。目前，在Internet 网上最流行的三种电子邮件协议是SMTP、POP3 和 IMAP，下面分别简单介绍。　　◆ SMTP 协议　　简单邮件传输协议(Simple Mail Transfer Protocol,SMTP)是一个运行在TCP/IP之上的协议，用它发送和接收电子邮件。SMTP 服务器在默认端口25上监听。SMTP客户使用一组简单的、基于文本的
mongodb group by having where 查询sql qiaolevip 每天进步一点点学习永无止境 mongo 纵观千象
SELECT cust_id, SUM(price) as total FROM orders WHERE status = 'A' GROUP BY cust_id HAVING total > 250 db.orders.aggregate( [ { $match: { status: 'A' } }, { $group: {
Struts2 Pojo（六） Luob. POJO strust2
注意：附件中有完整案例 1.采用POJO对象的方法进行赋值和传值 2.web配置 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee&q
struts2步骤 wuai struts
1、添加jar包 2、在web.xml中配置过滤器 <filter> <filter-name>struts2</filter-name> <filter-class>org.apache.st

Kmeans聚类算法及其matlab源码

K-means算法

matlab源码

你可能感兴趣的:(matlab,相似度,聚类,kmeans)