King_DJF

ISODATA聚类分析算法原理与C++实现

文章目录

Kmeans聚类算法的原理
ISODATA聚类算法的原理

ISODATA算法的基本步骤
关键步骤原理

代码实现

代码结构
主要类实现
代码使用
代码地址

聚类效果分析
内容参考
最后

最近在填之前的坑，尝试用C++实现一个ISODATA的聚类分析算法，目前代码已经码完了，就慢慢的把文档给补上，记录一下自己零零碎碎做的工作；给自己立的flag画一个句号吧。

Kmeans聚类算法的原理

在分析一些数据前，我们需要选取通过一些方式对数据的种类进行划分，“物以类聚，人以群分”，分类是为了进一步的分析数据的性质。
Kmeans聚类算法的一般步骤为
1. 随机选取k个中心点
2. 遍历所有样本，将数据划分到最近的中心点中（所谓近，即欧式距离近）
3. 计算每个聚类的平均值，得到新的聚类中心
4. 重复上述2-3步骤，直至所有中心点趋于收敛（变化幅度较小）或达到一定的迭代次数
kmeans的原理简单，应用也很多，但是k的选取很重要，如果没有数据的先验知识，可能需要多次尝试不同的k值进行迭代计算，观察效果。

ISODATA聚类算法的原理

可以看作Kmeans的一种衍生，既然我们有时候只能大致确定k的范围，而不能确定k，那么可以加入分裂、合并机制，通过更自动化的机制，灵活的确定k的值

ISODATA算法的基本步骤

参数设置，需要设置的参数包括：
- nc : 初始聚类中心个数
- c : 预期的聚类个数
- tn : 每一类中允许的样本最少数目（少于该数目的聚类可能会被删除）
- te : 类内相对标准差上限（超过该上限的聚类，可能会被分裂）
- tc : 聚类中心点之间的最小距离
- nt : 每次迭代中最多可以合并的次数
- ns : 最多迭代次数
初始化
1. 在所有样本中，随机选取nc个不重复样本作为聚类中心，之后根据距离最小法判断所有样本属于哪一种聚类
2. 对第一次初始化后的聚类，检测是否符合tn条件，样本数目小于tn的类别被取消，重新根据上一步的距离最小法进行分配
计算分类后的聚类参数，包含以下参数：
- 聚类中心
- 各类中样本到聚类中心的平均距离
- 各个样本到其所属类别中心的总体平均距离
根据当前的状态选择下一步的行为，进行分裂、合并或停止
1. 若迭代次数达到要求，则停止
2. 若当前聚类数量小于期望数量的一般，则进行分裂检测，判断当前是否需要分裂，若需要则执行分裂行为
3. 若聚类数量大于期望数量的两倍，则进行合并检测，判断是否需要合并，若需要则执行合并行为
4. 若聚类数量在期望聚类数量的1/2到2倍之间，奇数次迭代则执行分裂检测，偶数次迭代则进行合并检测

关键步骤原理

分裂检测步骤
1. 计算各个类别中，各个样本到类别中心的标准差，标准差为一矢量，求出每一类内标准差向量中的最大分量
2. 若标准差向量中的最大分量大于te，同时满足以下条件之一，则对该类别进行分裂
  - 聚类个数小于期望个数一半
  - 聚类内部平均距离大于总体平均距离且聚类样本数量大于tn两倍
3. 分裂操作：
  1. 在类内标准差最大的维度上分裂聚类中心点
  2. 利用距离最小法将当前聚类的样本点分配到两个聚类中
  3. 更新平均距离等聚类参数
合并检测步骤
1. 计算聚类中心两两之间的距离，距离小于tc的聚类对，按照距离越小优先级越大的原则，进行合并
2. 合并的总次数小于设定值，且一次迭代中，一个聚类只能被合并一次
3. 更新聚类参数

代码实现

代码结构

Cluster.h/cpp : 聚类结构体
common.h.cpp : 公共函数，包含一些矢量的操作符重载，主要为了编程时候的便捷
isodata.h/cpp : isodata聚类分析算法类
error.h : 定义了一些出错的输出字符，为了简便，会做一些出错的检查，然后报出错误，用于提示，但是本身不会做额外错误处理

主要类实现

Cluster

//Cluster.h
//
// Created by Jeff on 2019/1/6 0006.
//
#ifndef ISODATA_CLUSTER_H
#define ISODATA_CLUSTER_H
#include 
#include 
using namespace std;
struct Cluster{
    double innerMeanDis; // 类内平均距离
    vector<double> sigma; // 每个聚类的标准差
    static double allMeanDis; // 总体平均距离
    vector<double> center; // 聚类中心位置的
    unordered_set<unsigned> ids; // 从属于此聚类的样本的id，位于isodata的data中的
    Cluster():
        center{}, innerMeanDis(0), sigma(vector<double>{}){}
    explicit Cluster(vector<double> &c):
        center(c), innerMeanDis(0), sigma(vector<double>(c.size(), 0)) {}
    void add_point(int p_index);
    void clear_ids();
};
#endif //ISODATA_CLUSTER_H
//Cluster.cpp
#include "Cluster.h"
#include "common.h"
double Cluster::allMeanDis = 0;
/**
 * 向聚类中添加点
 * @param p_index 点的id
 */
void Cluster::add_point(int p_index) {
    if (ids.find(static_cast<const unsigned int &>(p_index)) != ids.end())
    {
        cout << WARN_POINT_REPEAT << endl;
        return;
    }
    ids.emplace(p_index);
}
/**
 * 清除聚类中的所有点
 */
void Cluster::clear_ids() {
    ids.clear();
}

ISODATA

//
// Created by Jeff on 2019/1/2 0002.
//
#ifndef ISODATA_ISODATA_H
#define ISODATA_ISODATA_H
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include "error.h"
#include "Cluster.h"
#include 
#include 
#include "common.h"
using namespace std;
// 实现ISODATA聚类算法
class isodata {
private:
    typedef function<vector<vector<double>>(void)> READFUNC;
    // 直接初始化的数据
    // 为了简单，不预留更改设置的接口，只在初始化时设置
    unsigned _c; // 预期的聚类个数
    unsigned _nc; // 初始聚类中心数目
    unsigned _tn; // 每一类中允许的样本最少数目
    double _te; // 类内相对标准差上限
    double _tc; // 聚类中心点之间的最小距离
    unsigned _nt; // 每次迭代中最多可以合并的次数
    unsigned _ns; // 最多迭代次数
    // 不直接在构造函数中初始化
    unsigned row; // 数据的行数，也就是样本个数
    unsigned col; // 数据的列数，也就是特征个数
    vector<vector<double>> data; // 待分类的数据
    deque<Cluster> clusters; // 聚类
    READFUNC read_func; // 读取数据的函数，可以自定义
    double alpha; // 分裂系数
public:
    /**
     * 构造函数
     * @param _c 预期的聚类个数
     * @param _nc 初始聚类中心数目
     * @param _tn 每一类中允许的样本最少数目
     * @param _te 类内相对标准差上限
     * @param _tc 聚类中心点之间的最小距离
     * @param _nt 每次迭代中最多可以合并的次数
     * @param _ns 最多迭代次数
     * @param func 读取数据的函数，无输入，返回二维double vector
     */
    explicit isodata(unsigned int c, unsigned int _nc, unsigned int _tn,
                     double _te, double _tc, unsigned int _nt,
                     unsigned int _ns, READFUNC func) :
                     _c(c), _nc(_nc), _tn(_tn),
                     _te(_te), _tc(_tc), _nt(_nt),
                     _ns(_ns), row(0), col(0),
                     clusters(), read_func(std::move(func)), alpha(0.3) {
    }
    void run()
    {
        setData();
        init_clusters();
        for (int i = 0; i < _ns; ++i) {
            re_assign();
            check_tn();
            update_centers();
            update_meandis();
            switch_method(i);
        }
        output();
    }
private:
    void setData();
    void init_clusters();
    pair<int, double> get_nearest_cluster(int p_index, int ignore);
    pair<int, double> get_nearest_cluster(int p_index, unordered_set<unsigned>&);
    void re_assign();
    void check_tn();
    void update_centers();
    void update_center(Cluster& cluster);
    void update_sigmas();
    void update_sigma(Cluster& cluster);
    void update_meandis();
    void check_split();
    void split(const int& c_index);
    void check_merge();
    void merge(const int& id1, const int& id2);
    void switch_method(const int& index);
    void output() const;
};
#endif //ISODATA_ISODATA_H
//isodata.cpp
void isodata::setData()
{
    data = std::move(read_func());
    if (data.size() < _c || data.size() < _tn)
    {
        cout << WARN_DATA_SIZE << endl;
        return;
    }
    row  = static_cast<unsigned int>(data.size());
    col = static_cast<unsigned int>(data[0].size());
    for (vector<double> & d : data)
    {
        if (d.size() != col)
        {
            cout << WARN_DATA_SIZE << endl;
            data.clear();
            return;
        }
    }
}
/**
 * 初始化 随机选取_nc个聚类中心
 */
void isodata::init_clusters() {
    // 选取随机id
    std::default_random_engine rand(static_cast<unsigned int>(time(nullptr)));
    std::uniform_int_distribution<unsigned> rnd(0, row-1);
    unordered_set<unsigned> ids;
    while (ids.size() < _nc)
    {
        auto id = rnd(rand);
        // 避免数据之间有重复的 选取出重复的中心点坐标
        bool flg = false;
        for (auto &item : ids)
        {
            if (get_distance(data[item], data[id]) == 0.0)
                flg = true;
        }
        if (!flg)
            ids.emplace(id);
    }
    // 初始化聚类
    for (auto &id : ids)
    {
        clusters.emplace_back(Cluster{this->data[id]});
    }
}
/**
 * 根据距离聚类中心的最小距离 选取当前点所属的聚类
 * @p_index 当前点在data中的序号
 * @ignore 设置忽略序号， 缺省为-1， 主要用于删除聚类时使用
 * @return 序号+距离
 */
pair<int, double> isodata::get_nearest_cluster(int p_index, int ignore = -1) {
    if (ignore != -1 && clusters.size() == 1)
        cout << WARN_CLUSTER_SIZE_SMALL << endl;
    int c_index = 0;
    double dis(get_distance(data[p_index], clusters[c_index].center));
    for (int i = 1; i < clusters.size(); ++i) {
        if (ignore != -1 && i == ignore)
            continue;
        auto d = get_distance(data[p_index], clusters[i].center);
        if (d < dis)
        {
            dis = d;
            c_index = i;
        }
    }
    return {c_index, dis};
}
/**
 * 根据距离聚类中心的最小距离 选取当前点所属的聚类
 * @param p_index
 * @param cluster_ids 一个集合，集合内的聚类中心不做考虑
 * @return 序号+距离
 */
pair<int, double> isodata::get_nearest_cluster(int p_index, unordered_set<unsigned> &cluster_ids) {
    // 选择第一个不在cluster_ids中的聚类
    int c_index = 0;
    while (cluster_ids.find(static_cast<const unsigned int &>(c_index)) != cluster_ids.end())
        ++c_index;
    //初始一个距离
    double dis(get_distance(data[p_index], clusters[c_index].center));
    for (int i = c_index+1;
    i < clusters.size() && (cluster_ids.find(static_cast<const unsigned int &>(i)) == cluster_ids.end());
    ++i)
    {
        auto d = get_distance(data[p_index], clusters[i].center);
        if (d < dis)
        {
            dis = d;
            c_index = i;
        }
    }
    return {c_index, dis};
}
/**
 * 依据距离最小原则重新分配点
 */
void isodata::re_assign() {
    for (auto &cluster : clusters) {
        cluster.clear_ids();
    }
    for (int i = 0; i < row; ++i) {
        auto&& res = get_nearest_cluster(i);
        clusters[res.first].add_point(i);
    }
}
/**
 * 检测每个聚类中的个数是否少于_tn，如果少于则取消此类别
 */
void isodata::check_tn() {
    unordered_set<unsigned> to_erase;
    for (int i = 0; i < clusters.size(); ++i) {
        if (clusters[i].ids.size() >= _tn)
            continue;
        to_erase.emplace(i);
        auto &indexs = clusters[i].ids;
        for (unsigned int index : indexs) {
            auto &&res = get_nearest_cluster(index, to_erase);
            clusters[res.first].add_point(index);
        }
        clusters[i].ids.clear();

    }
    for (auto it = clusters.begin(); it != clusters.end();)
    {
        if (it->ids.empty())
            it = clusters.erase(it);
        else
            ++it;
    }
}
/**
 * 更新各个聚类的中心坐标
 */
void isodata::update_centers() {
    for (auto &cluster : clusters)
    {
        update_center(cluster);
    }
}
/**
 * 更新某个聚类的中心坐标
 */
void isodata::update_center(Cluster& cluster) {
    vector<double> sum(col, 0);
    for (auto &index : cluster.ids)
    {
        sum += data[index];
    }
    cluster.center = sum/ static_cast<double>(cluster.ids.size());
}
/**
 * 更新各个聚类的标准差
 */
void isodata::update_sigmas() {
    for ( auto& cluster : clusters) {
        update_sigma(cluster);
    }
}
/**
 * 更新单个聚类的标准差
 */
void isodata::update_sigma(Cluster& cluster) {
    cluster.sigma.clear();
    auto &sigma = cluster.sigma;
    sigma.resize(col, 0);
    for (auto& id : cluster.ids) {
        sigma += mypow(cluster.center - data[id], 2);
    }
    auto &&res(vector_sqrt(sigma));
    swap(res, sigma);
}
/**
 * 更新平均距离
 */
void isodata::update_meandis() {
    Cluster::allMeanDis = 0;
    for (auto &&cluster : clusters) {
        double dis(0.0);
        for (auto &id : cluster.ids) {
            dis += get_distance(data[id], cluster.center);
        }
        Cluster::allMeanDis += dis;
        cluster.innerMeanDis = dis/cluster.ids.size();
    }
    Cluster::allMeanDis /= row;
}
/**
 * 检测是否需要分裂，如果需要则执行分裂操作
 */
void isodata::check_split() {
    update_sigmas();
    while (true)
    {
        bool flag = false;
        for (unsigned j = 0; j < clusters.size(); ++j) {
            auto& cluster = clusters[j];
            for (int i = 0; i < col; ++i) {
                if (cluster.innerMeanDis > Cluster::allMeanDis) {
                    if (cluster.sigma[i] > _te && (cluster.ids.size() > 2 * _tn + 1 || clusters.size() < _c / 2)) {
                        flag = true;
                        split(j);
                    }
                } else {
                    if (cluster.sigma[i] > _te && clusters.size() < _c / 2) {
                        flag = true;
                        split(j);
                    }
                }
            }
        }
        if (!flag)
            break;
        else
            update_meandis();
    }
}
/**
 * 分裂第c_index个聚类
 * @param c_index
 */
void isodata::split(const int &c_index) {
    //根据标准差选取分裂维度
    auto& cluster = clusters[c_index];
    auto iter = max_element(cluster.sigma.begin(), cluster.sigma.end());
    auto pos = distance(cluster.sigma.begin(), iter);
    Cluster newcluster(cluster.center);
    //分裂
    newcluster.center[pos] -= alpha*cluster.center[pos];
    cluster.center[pos] += alpha*cluster.center[pos];
    for (const auto &id : cluster.ids) {
        auto d1 = get_distance(data[id], cluster.center);
        auto d2 = get_distance(data[id], newcluster.center);
        if (d2 < d1)
            newcluster.ids.emplace(id);
    }
    unordered_set<unsigned> dids;
    set_difference(cluster.ids.begin(), cluster.ids.end(),
                   newcluster.ids.begin(), newcluster.ids.end(),
                   inserter(dids, dids.begin()));
    swap(dids, cluster.ids);
    // 更新参数并保存新聚类
    update_center(newcluster);
    update_sigma(newcluster);
    update_center(cluster);
    update_sigma(cluster);
    clusters.emplace_back(newcluster);
}
/**
 * 检测是否需要合并，如果需要则执行合并操作
 */
void isodata::check_merge() {
    // 自定义数据类型
    typedef pair<pair<unsigned, unsigned>, double> UNIT;
    //1 计算聚类中心两两之间的距离，保留小于_tc的，并从小到达排序
    vector<UNIT> uvec;
    for (unsigned i = 0; i < clusters.size(); ++i) {
        for (unsigned j = i+1; j < clusters.size(); ++j) {
            auto dis = get_distance(clusters[i].center, clusters[j].center);
            if (dis < _tc)
                uvec.emplace_back(UNIT({i,j}, dis));
        }
    }
    sort(uvec.begin(), uvec.end(), [](UNIT& left, UNIT& right){ return left.second < right.second;});
    //2 执行合并操作
    unordered_set<unsigned> clusterIds{};
    unsigned cnt(0);
    for (const auto &unit : uvec) {
        auto& cids = unit.first;
        auto& cdis = unit.second;
        if (clusterIds.find(cids.first) == clusterIds.end() &&
            clusterIds.find(cids.second) == clusterIds.end())
        {
            merge(cids.first, cids.second);
            clusterIds.emplace(cids.first);
            clusterIds.emplace(cids.second);
        }
        // 检测是否超过最大次数
        if (++cnt > _ns)
            break;
    }
    //3 清除被合并的聚类
    for (auto iter = clusters.begin(); iter != clusters.end();)
    {
        if (iter->ids.empty())
            iter = clusters.erase(iter);
        else
            iter++;
    }
}
/**
 * 合并操作 合并id1 id2的聚类
 * @param id1
 * @param id2
 */
void isodata::merge(const int &id1, const int &id2) {
    auto &c1 = clusters[id1];
    auto &c2 = clusters[id2];
    c1.center = (c1.center* c1.ids.size() + c2.center*c2.ids.size())/(c1.ids.size()+c2.ids.size());
    c2.ids.clear();
}
/**
 * 根据情况选择下一步操作
 */
void isodata::switch_method(const int& index) {
    if (index == _ns-1)
    {
        _tc = 0;
        check_merge();
    } else if (clusters.size() <= _c/2)
    {
        check_split();
    } else if (index % 2 == 0 || clusters.size() >= 2*_c)
    {
        check_merge();
    } else
    {
        check_split();
    }
}
/**
 * 输出聚类分析的结果
 */
void isodata::output() const {
    // 在命令行窗口打印
    cout << "Original Data Number : " << row << endl;
    cout << "Cluster Number : " << clusters.size() << endl;
    for (int i = 0; i < clusters.size(); ++i) {
        cout << "Number " << to_string(i+1) << " : " << clusters[i].ids.size() << endl;
        cout << "cluster center : " << clusters[i].center << endl;
    }
    // 输出到文件
    ofstream res(R"(E:\CPP\Clion\ISODATA\clusters.txt)");
    if (!res.is_open())
        cout << WARN_FILE_OPEN_FAIL << endl;
    res << clusters.size() << endl;
    for (int j = 0; j < clusters.size(); ++j) {
        res << j+1 << " " << clusters[j].ids.size() << endl;
        for (const auto &id : clusters[j].ids) {
            res << data[id] << endl;
        }
    }
}

代码使用

只需要包含isodata一个头文件即可
我提供了一份数据和使用样例
使用前需要自定义读数据的函数，在common.cpp中，自定义read_data函数即可
新建isodata对象，初始化参数
调用成员函数run
具体如下所示

#include "isodata.h"
#include "MyTime.h"
/**
 * 在运行前，需要自定义common.cpp中的read_data函数
 * @return
 */
int main() {
    CMyTimeWrapper c;
    c.tic();
    isodata isodata1(4, 90, 10, 90, 20, 5, 500, read_data);
    isodata1.run();
    c.tocMs();
    return 0;
}

聚类分析的结果保存在txt文件中，具体见isodata中的output函数，命令行输出的结果如下所示

Original Data Number : 927
Cluster Number : 4
Number 1 : 25
cluster center : 4.77319,16.0967
Number 2 : 604
cluster center : 30.4196,-2.65259
Number 3 : 277
cluster center : 33.988,24.7817
Number 4 : 21
cluster center : -18.4698,-33.7524
cost time: 239.088 ms

代码地址

Github

聚类效果分析

利用python将聚类分析的结果绘制出来，结果如下

内容参考

李伯韬的博客
华东博客

最后

觉得文章对你有帮助的，欢迎扫码关注我的公众号，我会时不时的分享我的学习经验、收获。

【打卡d5】快速排序归并排序吧啦吧啦吡叭卜排序算法算法 java
快速排序算法模板——模板题AcWing785.快速排序voidquick_sort(intq[],intl,intr){if(l>=r)return;inti=l-1,j=r+1,x=q[(l+r)/2];while(ix);if(i=r)return;intmid=（l+r）>>1;merge_sort(q,l,mid);merge_sort(q,mid+1,r);intk=0,i=l,j=mi
C++ 树状数组 LIUJH1233 c++开发语言
一.树状数组是什么?二.树状数组的特性？可以解决大部分区间上面的修改以及查询的问题，例如1.单点修改，单点查询，2.区间修改，单点查询，3.区间查询，区间修改等问题；三.树状数组讲解lowbit的使用如何计算一个非负整数n在二进制下的最低为1及其后面的0构成的数？答案就是lowbit(x)。那么lowbit运算时怎么实现的呢？44的二进制=(101100)，我们对44的二进制数取反+1，也即~44
什么是机器视觉3D引导大模型视觉人机器视觉机器视觉3D 3d 数码相机机器人人工智能大数据
机器视觉3D引导大模型是结合深度学习、多模态数据融合与三维感知技术的智能化解决方案，旨在提升工业自动化、医疗、物流等领域的操作精度与效率。以下从技术架构、行业应用、挑战与未来趋势等方面综合分析：一、技术架构与核心原理多模态数据融合与深度学习3D视觉引导大模型通常整合RGB图像、点云数据、深度信息等多模态输入，通过深度学习算法（如卷积神经网络、Transformer）进行特征提取与融合。例如，油田机
探索AI知识库的无限潜力：定义、应用与未来展望知识库知识库管理知识库软件
一、AI知识库的定义AI知识库，作为人工智能技术与传统知识库概念的融合，是指利用人工智能算法和技术构建、管理和维护的信息存储系统。它不仅包含了大量的结构化、半结构化和非结构化数据，还具备智能检索、推理分析、自我学习和优化等高级功能。AI知识库通过模拟人类的认知过程，实现了对知识的有效组织和高效利用，为各种应用场景提供了强大的支持。二、AI知识库的应用1.客户服务与支持在电子商务领域，AI知识库的应
【Go基础】Go入门与实践资源帖小超人冲鸭 golang 开发语言后端
看到好的持续更新……Go系统教程从语法讲起：李文周博客七天快速上手项目Go测试驱动开发博客孔令飞项目开发实战课程，孔令飞图文教程《Go语言高级编程》书籍Go算法刷题模板Go实战项目KV系统crawlab分布式爬虫平台seaweedfs分布式文件系统Cloudreve云盘系统gfast后台管理系统（基于GoFrame）alist多存储文件列表（基于Gin、React）Yearning开源SQL审核平
【Hinton论文精读】The Forward-Forward Algorithm: Some Preliminary Investigations-202212 tyhj_sf 论文研读笔记 ML理论系列人工智能深度学习 FF算法
博文导航0引言1论文摘要2反向传播有什么问题呢？3Forward-Forward算法3.1使用逐层优化函数学习多层表示4Forward-Forward算法的实验4.1反向传播baseline4.2FF算法的一个简单的无监督的例子4.3FF算法的一个简单的监督例子4.4使用FF算法来模拟感知中自上而下的效应4.5作为教师使用空间环境的预测4.6CIFAR-10实验5睡眠6FF算法与其他对比性学习技术
基于粒子滤波与卡尔曼滤波的锂离子电池放电时间预测与使用特征研究算法如诗电池建模(RUL BC)粒子滤波锂离子电池放电时间预测
基于粒子滤波与卡尔曼滤波的锂离子电池放电时间预测与使用特征研究一、研究背景与意义锂离子电池作为现代储能系统的核心组件，其放电时间（End-of-DischargeTime,EOD）的准确预测对电池管理系统（BMS）的可靠性和安全性至关重要。传统方法（如安时积分法）易受噪声、温度漂移等因素干扰，而基于状态估计的滤波算法（粒子滤波/PF、卡尔曼滤波/KF）通过动态更新模型参数，能显著提升预测精度。二、
选择排序算法解析与代码实例展示程序员总部 java 排序算法算法 java
选择排序是一种简单、直观的排序算法，适合用来处理小规模的数据。它的基本思想是每次从待排序的元素中选择最小的元素，然后将其放到已排序序列的末尾。听起来挺简单吧？接下来，让我们详细了解一下选择排序的工作原理、代码实现和一些性能特点。选择排序的步骤可以分为几个关键部分：初始状态：假设我们有一个数组，里面存放了一系列的数字。比如说，数组是[64,25,12,22,11]。在排序之前，这些数字是无序的。选择
Ai斗地主智能出牌算法 zzzzzzzzzzzw___ ——灌水算法人工智能斗地主
去年有想写个斗地主的小游戏，自己玩玩。找了很多资料，后来好不容易在网上找到了一个AI算法。转过的的时候是贴在自己电脑的TXT文本上，再次感谢下原作者。现在借花献佛发给你参考下。我以前写过一个斗地主机器人。思路如下，希望对你有帮助。斗地主AI设计一、牌型1火箭：大小王在一起的牌型，即双王牌，此牌型最大，什么牌型都可以打。2炸弹：相同点数的四张牌在一起的牌型，比如四条A。除火箭外，它可以打任何牌型，炸
基于android平台的斗地主AI 清源Eamonmon cocos2d-x学习笔记
本软件是基于android平台的斗地主AI，我们在源代码的基础之上，旨在改进AI的算法，使玩家具有更丰富的体验感，让NPC可以更为智能。（一）玩法解析：（1）发牌和叫牌：一副扑克54张，先为每个人发17张，剩下的3张作为底牌，玩家视自己手中的牌来确定自己是否叫牌。按顺序叫牌，谁出的分多谁就是地主，一般分数有1分，2分，3分。地主的底牌需要给其他玩家看过后才能拿到手中，最后地主20张牌，农民分别17
C++：关联容器（pair、map、set、multiset）今朝一九九三学习C++
关联容器和顺序容器的本质区别：关联容器是通过键存取和读取元素、顺序容器通过元素在容器中的位置顺序存储和访问元素。两个基本的关联容器类型是map和set。map的元素以键-值对的形式组织：键用作元素在map的索引，而值则表示所存储和读取的数据。set仅包含一个键，并有效地支持关于某个键是否存在的查询。set和map类型的对象不允许为同一个键添加第二个元素。如果一个键必须对应多个实例，则需使用mult
C++ 类和对象友元内部类 this指针默认成员函数初始化列表…… azaz_plus C++c++类和对象 this指针默认成员函数友元初始化列表内部类
1.类和对象的基本概念类：用户自定义的数据类型，包含数据成员（属性）和成员函数（方法）。对象：类的实例，占用内存空间，具有类中定义的属性和方法。示例：classDog{//定义类public:std::stringname;//属性intage;voidbark(){//方法std::coutdraw();//输出：Drawingacircle（多态）deleteshape;return0;}4.
深入解析Java跨平台原理 KBkongbaiKB java 开发语言
一、操作系统屏障的本质挑战源代码编译方式直接编译为机器码Windows的可执行文件.exeLinux的可执行文件.elfmacOS的可执行文件.machJava独特的中间格式字节码文件.classJVM虚拟机1.1传统语言的平台困局语言类型编译方式执行依赖跨平台能力C/C++直接生成机器码特定操作系统❌不可直接移植Python解释型执行Python解释器✅但性能较低Java字节码中间件JVM虚拟机
C++关联容器1——map，multimap，set，multiset介绍，pair类型掘根 C++STL c++开发语言
目录关联容器使用关联容器使用map使用set关联容器概述定义关联容器初始化multimap或multiset关键字类型的要求有序容器的关键字类型使用关键字类型的比较函数pair类型创建pair对象的函数关联容器关联容器支持高效的关键字查找和访问。两个主要的关联容器（associative-container)类型是map和set。map中的元素是一些关键字一值（key-value）对：关键字起到索
Python 机器学习基础之学习基础环境搭建仙魁XAN Python 机器学习基础+实战案例 python 学习开发语言机器学习 machine learning
Python机器学习基础之学习基础环境搭建目录Python机器学习基础之学习基础环境搭建一、简单介绍二、什么是机器学习三、python环境的搭建1、Python安装包下载2、这里以下载Python3.10.9为例3、安装Python3.10.94、检验python是否安装成功，win+R快捷打开运行，输入cmd，打开cmd四、Pycharm环境搭建1、下载Pycharm安装包2、安装Pycharm
深度学习在医学影像分析中的应用：DeepSeek系统的实践与探索 Evaporator Core #深度学习 #DeepSeek快速入门 DeepSeek进阶开发与应用深度学习人工智能
随着人工智能技术的迅猛发展，深度学习在医学领域的应用逐渐成为研究热点。医学影像分析作为医疗诊断的重要组成部分，正受益于深度学习技术的突破。DeepSeek系统是一种基于深度学习的医学影像分析平台，旨在通过高效、精准的算法辅助医生进行疾病诊断和治疗决策。本文将深入探讨DeepSeek系统的技术原理、实现方法及其在医学影像分析中的实际应用，并结合代码示例展示其核心功能。1.DeepSeek系统的技术架
【机器学习】主成分分析法（PCA）若兰幽竹机器学习机器学习信息可视化人工智能
【机器学习】主成分分析法（PCA）一、摘要二、主成分分析的基本概念三、主成分分析的数学模型五、主成分分析法目标函数公式推导（`梯度上升法`求解目标函数）六、梯度上升法求解目标函数第一个主成分七、求解前n个主成分及PCA在数据预处理中的处理步骤（后续实现）一、摘要本文主要讲述了主成分分析法（PCA）的原理和应用。PCA通过选择最重要的特征，将高维数据映射到低维空间，同时保持数据间的关系，实现降维和去
STOPWATCH类抗争到底zhy 前端
在C#中，Stopwatch类属于System.Diagnostics命名空间，它的主要用途是精准测量代码块的执行时间。在性能分析、算法优化以及其他需要时间测量的场景里，这个类非常实用。下面为你详细介绍Stopwatch类。基本使用步骤1.引入命名空间usingSystem.Diagnostics;2.创建Stopwatch实例Stopwatchstopwatch=newStopwatch();3
华为OD机试题库清单以及考点说明，2025.3.16切换2025A卷（Python/JS/C/C++）哪吒搬砖工逆袭Java架构师华为od python javascript 2025A卷华为OD机试
专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。2024年8月14日，华为官方已经将华为OD机试（D卷）切换为E卷。目前正在考的是E卷，按照华为OD往常的操作，E卷题目是由往
华为OD机试 - 字符串分割转换（Python/JS/C/C++ 2024 E卷 100分）哪吒华为od python javascript
一、题目描述给定一个非空字符串QS，其被N个‘;’分隔成N+1个子串，给定正整数数组K，要求除第一个子串外，其余的子串每K个字符组成新的子串，并‘-’分隔。对于新组成的每一个子串，如果它含有的小写字母比大写字母多，则将这个子串的所有大写字母转换为小写Q字母；反之，如果它含有的大写字母比小写字母多，则将这个子串的所有小写字母转换为大写字母；大小写字母的数量相等时，不做转换。二、输入描述输入为两行，第
C++语言的声明式编程俞嫦曦包罗万象 golang 开发语言后端
C++语言的声明式编程引言声明式编程是一种编程范式，它强调描述程序的“要做什么”而不是“怎么做”。在传统的命令式编程中，程序员通常需要详细地指定操作步骤，而在声明式编程中，程序员则可以专注于结果的描述。这一编程风格在C++语言的使用中，虽然不如某些其他语言（如Haskell或SQL）那样突出，但依然通过一些特性和标准库提供了支持。本文将深入探讨C++中的声明式编程，包括其基本概念、与命令式编程的对
C++学习笔记:函数重载及函数模板 etp_ c++学习笔记
函数重载默认参数能让你使用不同数目的参数调用同一个函数，而函数多态（函数重载）能让你使用多个同名函数。----一般完成类似的工作，但一定使用不同的参数列表（函数特征标）。下面定义一组原型如下的print()函数voidprint(constchar*str,intwidth);voidprint(doubled,intwidth);voidprint(longl,intwidth);编译器根据参数
Git 分支使用规范全解（附项目示例）滴答滴答滴嗒滴开发 Ai 入门指南 git elasticsearch 大数据个人开发
Git分支使用规范全解（附项目示例）本文结合实际项目开发，详细讲解如何在多人协作中使用Git分支，包括main、develop、feature/*、bugfix/*、release/*、hotfix/*等分支类型。场景背景：开发一个“智能垃圾分类系统”目标是开发一套运行于边缘设备上的垃圾识别系统，使用AI算法模型识别投放物，并分类投放，同时配有后台管理页面。分支说明与实际应用示例main分支（生产
华为OD机试 - 日志采集系统（Python/JS/C/C++ 2024 E卷 100分）哪吒华为od python javascript
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述日志采集是运维系统的的核心组件。日志是按行生成，每行记做一条，由
【优化选址】基于多目标遗传NSGAII、多目标免疫遗传算法求解考虑成本、救援时间和可靠性的海上救援选址多目标优化问题研究（Matlab代码实现）荔枝科研社 matlab 数据结构算法
欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录⛳️赠与读者1概述基于多目标遗传NSGAII、多目标免疫遗传算法求解考虑成本、救援时间和可靠性的海上救援选址多目标优化问题研究一、引言二、海上救援选址多目标优化问题分析（一）成本因素（二）救援时间因素（三）可靠性因素三、多目标遗传NSGAII算法（一）算法原理（二）在
用 C++ 打造综合管理系统：功能实现与代码解析他是只猫 C++教程 c++算法学习开发语言
文章目录系统功能概述设计与实现可逆素数模块计算数字总和模块各位数字之和排序模块字符串中的最大整数模块字符串解压模块输出指定图形模块计算学生信息操作之最高分模块字符串反转模块菜单界面与主函数总结完整代码在C++编程学习过程中，将所学知识应用到实际项目里是提升编程能力的有效途径。今天，我们就来构建一个综合管理系统，这个系统集成了多个实用功能模块，能帮助我们解决不同类别的问题。通过这个项目，我们不仅能巩
算法-动态规划-最大子数组和程序员南飞算法动态规划 leetcode java 开发语言数据结构职场和发展
力扣题目：53.最大子数组和53.描述：给你一个整数数组nums，请你找出一个具有最大和的连续子数组（子数组最少包含一个元素），返回其最大和。子数组是数组中的一个连续部分。示例1：输入：nums=[-2,1,-3,4,-1,2,1,-5,4]输出：6解释：连续子数组 [4,-1,2,1]的和最大，为 6。示例2：输入：nums=[1]输出：1示例3：输入：nums=[5,4,-1,7,8]输出：2
算法-合并区间程序员南飞算法数据结构职场和发展 java 动态规划
力扣题目：56.合并区间-力扣（LeetCode）题目描述：以数组intervals表示若干个区间的集合，其中单个区间为intervals[i]=[starti,endi]。请你合并所有重叠的区间，并返回一个不重叠的区间数组，该数组需恰好覆盖输入中的所有区间。示例1：输入：intervals=[[1,3],[2,6],[8,10],[15,18]]输出：[[1,6],[8,10],[15,18]]
面试经典算法150题系列-除自身以外数组的乘积 betterManchester 面试经典算法题150题算法面试 java
除自身以外数组的乘积给你一个整数数组nums，返回数组answer，其中answer[i]等于nums中除nums[i]之外其余各元素的乘积。题目数据保证数组nums之中任意元素的全部前缀元素和后缀的乘积都在32位整数范围内。请不要使用除法，且在O(n)时间复杂度内完成此题。示例1:输入:nums=[1,2,3,4]输出:[24,12,8,6]示例2:输入:nums=[-1,1,0,-3,3]输出
算法通关----除自己自身以外数组乘积 fang4084 算法通关算法
题目来源：leetcode--238题目内容：给你一个整数数组nums，返回数组answer，其中answer[i]等于nums中除nums[i]之外其余各元素的乘积。题目数据保证数组nums之中任意元素的全部前缀元素和后缀的乘积都在32位整数范围内。请不要使用除法，且在O(n)时间复杂度内完成此题。示例1:输入:nums=[1,2,3,4]输出:[24,12,8,6]示例2:输入:nums=[-
springmvc 下 freemarker页面枚举的遍历输出杨白白 enum freemarker
spring mvc freemarker 中遍历枚举 1枚举类型有一个本地方法叫values（），这个方法可以直接返回枚举数组。所以可以利用这个遍历。 enum public enum BooleanEnum { TRUE(Boolean.TRUE, "是"), FALSE(Boolean.FALSE, "否");
实习简要总结 byalias 工作
来白虹不知不觉中已经一个多月了，因为项目还在需求分析及项目架构阶段，自己在这段时间都是在学习相关技术知识，现在对这段时间的工作及学习情况做一个总结：（1）工作技能方面大体分为两个阶段，Java Web 基础阶段和Java EE阶段 1）Java Web阶段在这个阶段，自己主要着重学习了 JSP, Servlet, JDBC, MySQL，这些知识的核心点都过了一遍，也
Quartz——DateIntervalTrigger触发器 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208559 一.概述 simpleTrigger 内部实现机制是通过计算间隔时间来计算下次的执行时间，这就导致他有不适合调度的定时任务。例如我们想每天的 1：00AM 执行任务，如果使用 SimpleTrigger，间隔时间就是一天。注意这里就会有一个问题，即当有 misfired 的任务并且恢复执行时，该执行时间
Unix快捷键 18289753290 unix Unix；快捷键;
复制，删除，粘贴： dd:删除光标所在的行 &nbs
获取Android设备屏幕的相关参数酷的飞上天空 android
包含屏幕的分辨率以及屏幕宽度的最大dp 高度最大dp TextView text = (TextView)findViewById(R.id.text); DisplayMetrics dm = new DisplayMetrics(); text.append("getResources().ge
要做物联网？先保护好你的数据蓝儿唯美数据
根据Beecham Research的说法，那些在行业中希望利用物联网的关键领域需要提供更好的安全性。在Beecham的物联网安全威胁图谱上，展示了那些可能产生内外部攻击并且需要通过快速发展的物联网行业加以解决的关键领域。 Beecham Research的技术主管Jon Howes说：“之所以我们目前还没有看到与物联网相关的严重安全事件，是因为目前还没有在大型客户和企业应用中进行部署，也就
Java取模（求余）运算随便小屋 java
整数之间的取模求余运算很好求，但几乎没有遇到过对负数进行取模求余，直接看下面代码： /** * * @author Logic * */ public class Test { public static void main(String[] args) { // TODO A
SQL注入介绍 aijuans sql注入
二、SQL注入范例这里我们根据用户登录页面 <form action="" > 用户名：<input type="text" name="username"><br/> 密码：<input type="password" name="passwor
优雅代码风格 aoyouzi 代码
总结了几点关于优雅代码风格的描述：代码简单：不隐藏设计者的意图，抽象干净利落，控制语句直截了当。接口清晰：类型接口表现力直白，字面表达含义，API 相互呼应以增强可测试性。依赖项少：依赖关系越少越好，依赖少证明内聚程度高，低耦合利于自动测试，便于重构。没有重复：重复代码意味着某些概念或想法没有在代码中良好的体现，及时重构消除重复。战术分层：代码分层清晰，隔离明确，
布尔数组百合不是茶 java 布尔数组
androi中提到了布尔数组; 布尔数组默认的是false, 并且只会打印false或者是true 布尔数组的例子; 根据字符数组创建布尔数组 char[] c = {'p','u','b','l','i','c'}; //根据字符数组的长度创建布尔数组的个数 boolean[] b = new bool
web.xml之welcome-file-list、error-page bijian1013 java web.xml servlet error-page
welcome-file-list 1.定义： <welcome-file-list> <welcome-file>login.jsp</welcome> </welcome-file-list> 2.作用：用来指定WEB应用首页名称。 error-page1.定义： <error-page&g
richfaces 4 fileUpload组件删除上传的文件 sunjing clear Richfaces 4 fileupload
页面代码 <h:form id="fileForm"> <rich:
技术文章备忘 bit1129 技术文章
Zookeeper http://wenku.baidu.com/view/bab171ffaef8941ea76e05b8.html http://wenku.baidu.com/link?url=8thAIwFTnPh2KL2b0p1V7XSgmF9ZEFgw4V_MkIpA9j8BX2rDQMPgK5l3wcs9oBTxeekOnm5P3BK8c6K2DWynq9nfUCkRlTt9uV
org.hibernate.hql.ast.QuerySyntaxException: unexpected token: on near line 1解决方案白糖_ Hibernate
文章摘自：http://blog.csdn.net/yangwawa19870921/article/details/7553181 在编写HQL时，可能会出现这种代码： select a.name,b.age from TableA a left join TableB b on a.id=b.id 如果这是HQL，那么这段代码就是错误的，因为HQL不支持
sqlserver按照字段内容进行排序 bozch 按照内容排序
在做项目的时候，遇到了这样的一个需求：从数据库中取出的数据集，首先要将某个数据或者多个数据按照地段内容放到前面显示，例如:从学生表中取出姓李的放到数据集的前面； select * fro
编程珠玑-第一章-位图排序 bylijinnan java 编程珠玑
import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.io.Writer; import java.util.Random; public class BitMapSearch {
Java关于==和equals chenbowen00 java
关于==和equals概念其实很简单，一个是比较内存地址是否相同，一个比较的是值内容是否相同。虽然理解上不难，但是有时存在一些理解误区，如下情况： 1、 String a = "aaa"; a=="aaa"; ==> true 2、 new String("aaa")==new String("aaa
[IT与资本]软件行业需对外界投资热情保持警惕 comsci it
我还是那个看法,软件行业需要增强内生动力,尽量依靠自有资金和营业收入来进行经营,避免在资本市场上经受各种不同类型的风险,为企业自主研发核心技术和产品提供稳定,温和的外部环境... 如果我们在自己尚未掌握核心技术之前,企图依靠上市来筹集资金,然后使劲往某个领域砸钱,然
oracle 数据块结构 daizj oracle 块数据块块结构行目录
oracle 数据块是数据库存储的最小单位，一般为操作系统块的N倍。其结构为：块头－－〉空行－－〉数据，其实际为纵行结构。块的标准大小由初始化参数DB_BLOCK_SIZE指定。具有标准大小的块称为标准块（Standard Block）。块的大小和标准块的大小不同的块叫非标准块（Nonstandard Block）。同一数据库中，Oracle9i及以上版本支持同一数据库中同时使用标
github上一些觉得对自己工作有用的项目收集 dengkane github
github上一些觉得对自己工作有用的项目收集技能类 markdown语法中文说明回到顶部全文检索 elasticsearch bigdesk elasticsearch管理插件回到顶部 nosql mapdb 支持亿级别map, list, 支持事务. 可考虑做为缓存使用 C
初二上学期难记单词二 dcj3sjt126com english word
dangerous 危险的 panda 熊猫 lion 狮子 elephant 象 monkey 猴子 tiger 老虎 deer 鹿 snake 蛇 rabbit 兔子 duck 鸭 horse 马 forest 森林 fall 跌倒；落下 climb 爬；攀登 finish 完成；结束 cinema 电影院；电影 seafood 海鲜；海产食品 bank 银行
8、mysql外键(FOREIGN KEY)的简单使用 dcj3sjt126com mysql
一、基本概念 1、MySQL中“键”和“索引”的定义相同，所以外键和主键一样也是索引的一种。不同的是MySQL会自动为所有表的主键进行索引，但是外键字段必须由用户进行明确的索引。用于外键关系的字段必须在所有的参照表中进行明确地索引，InnoDB不能自动地创建索引。 2、外键可以是一对一的，一个表的记录只能与另一个表的一条记录连接，或者是一对多的，一个表的记录与另一个表的多条记录连接。 3、如
java循环标签 Foreach shuizhaosi888 标签 java循环 foreach
1. 简单的for循环 public static void main(String[] args) { for (int i = 1, y = i + 10; i < 5 && y < 12; i++, y = i * 2) { System.err.println("i=" + i + " y="
Spring Security（05）——异常信息本地化 234390216 exception Spring Security 异常信息本地化
异常信息本地化 Spring Security支持将展现给终端用户看的异常信息本地化，这些信息包括认证失败、访问被拒绝等。而对于展现给开发者看的异常信息和日志信息（如配置错误）则是不能够进行本地化的，它们是以英文硬编码在Spring Security的代码中的。在Spring-Security-core-x
DUBBO架构服务端告警Failed to send message Response javamingtingzhao 架构 DUBBO
废话不多说，警告日志如下，不知道有哪位遇到过，此异常在服务端抛出(服务器启动第一次运行会有这个警告)，后续运行没问题，找了好久真心不知道哪里错了。 WARN 2015-07-18 22:31:15,272 com.alibaba.dubbo.remoting.transport.dispatcher.ChannelEventRunnable.run(84)
JS中Date对象中几个用法 leeqq JavaScript Date 最后一天
近来工作中遇到这样的两个需求 1. 给个Date对象，找出该时间所在月的第一天和最后一天 2. 给个Date对象，找出该时间所在周的第一天和最后一天需求1中的找月第一天很简单，我记得api中有setDate方法可以使用使用setDate方法前，先看看getDate var date = new Date(); console.log(date); // Sat J
MFC中使用ado技术操作数据库你不认识的休道人 sql mfc
1.在stdafx.h中导入ado动态链接库 #import"C:\Program Files\Common Files\System\ado\msado15.dll" no_namespace rename("EOF","end")2.在CTestApp文件的InitInstance()函数中domodal之前写::CoIniti
Android Studio加速 rensanning android studio
Android Studio慢、吃内存！启动时后会立即通过Gradle来sync & build工程。（1）设置Android Studio a) 禁用插件 File -> Settings... Plugins 去掉一些没有用的插件。比如：Git Integration、GitHub、Google Cloud Testing、Google Cloud
各数据库的批量Update操作 tomcat_oracle java oracle sql mysql sqlite
MyBatis的update元素的用法与insert元素基本相同，因此本篇不打算重复了。本篇仅记录批量update操作的 sql语句，懂得SQL语句，那么MyBatis部分的操作就简单了。　　注意：下列批量更新语句都是作为一个事务整体执行，要不全部成功，要不全部回滚。 MSSQL的SQL语句　WITH R AS（　　SELECT 'John' as name, 18 as
html禁止清除input文本输入缓存 xp9802 input
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; eg: <input type="text" autocomplete="off" name

ISODATA聚类分析算法原理与C++实现

文章目录

Kmeans聚类算法的原理

ISODATA聚类算法的原理

ISODATA算法的基本步骤

关键步骤原理

代码实现

代码结构

主要类实现

代码使用

代码地址

聚类效果分析

内容参考

最后

你可能感兴趣的:(聚类分析算法,C++,算法,机器学习,C++,算法,机器学习)