ytusdc

目标检测(IOU) + 语义分割(mIOU) +NMS

一、IOU--目标检测

我们先来看下IOU的公式：

现在我们知道矩形T的左下角坐标(X0,Y0)，右上角坐标(X1,Y1);
矩形G的左下角坐标(A0,B0)，右上角坐标(A1,B1)

这里我们可以看到和在确定坐标而不确定两个矩形是否相交的情况下，为已知的常量．

所以，我们只需要求解就行

这里我们先来看一下水平方向上的情况：

从上述的三种情况中我们可以看出：
当有重叠或者是内含的情况时，我们可以通过

计算得到重叠部分的长度．当满足第一种情况时，我们发现W<=0
竖直方向上的处理方式类似．得到H

所以处理成代码的时候可得：

下面的代码使用的坐标是，左下角和右上角。这是为了计算方便。

#RT:RightTop  右上角坐标
#LB:LeftBottom 左下角坐标
def IOU(rectangle A, rectangleB):
    W = min(A.RT.x, B.RT.x) - max(A.LB.x, B.LB.x)
    H = min(A.RT.y, B.RT.y) - max(A.LB.y, B.LB.y)
    if W <= 0 or H <= 0:
        return 0;
    SA = (A.RT.x - A.LB.x) * (A.RT.y - A.LB.y)
    SB = (B.RT.x - B.LB.x) * (B.RT.y - B.LB.y)
    cross = W * H
    return cross/(SA + SB - cross)

def bb_intersection_over_union(boxA, boxB):
    # determine the (x, y)-coordinates of the intersection rectangle
    xA = max(boxA[0], boxB[0])
    yA = max(boxA[1], boxB[1])
    xB = min(boxA[2], boxB[2])
    yB = min(boxA[3], boxB[3])

    # compute the area of intersection rectangle
    interArea = (xB - xA + 1) * (yB - yA + 1)

    # compute the area of both the prediction and ground-truth
    # rectangles
    boxAArea = (boxA[2] - boxA[0] + 1) * (boxA[3] - boxA[1] + 1)
    boxBArea = (boxB[2] - boxB[0] + 1) * (boxB[3] - boxB[1] + 1)

    # compute the intersection over union by taking the intersection
    # area and dividing it by the sum of prediction + ground-truth
    # areas - the interesection area
    iou = interArea / float(boxAArea + boxBArea - interArea)

    # return the intersection over union value
    return iou

参考：https://blog.csdn.net/qq_30490125/article/details/52887389

目标窗口检测算法-NMS非极大值抑制

这篇文章总结的很好：https://oldpan.me/archives/iu-iou-intersection-over-union-python

二、NMS（非极大值抑制--Non-Maximum Suppression）

NMS具体原理描述参考：https://www.cnblogs.com/makefile/p/nms.html

https://oldpan.me/archives/write-hard-nms-c

一文打尽目标检测NMS——精度提升篇

目标检测算法中检测框合并策略技术综述

优化后的：

# dets(N, 5) 的二维数组: box的集合，N为框的数量，5即4(位置信息)+1(可能为物体的概率得分)
def nms2(dets, thresh):
    # x1、y1、x2、y2、以及score赋值
    x1 = dets[:, 0]
    y1 = dets[:, 1]
    x2 = dets[:, 2]
    y2 = dets[:, 3]
    scores = dets[:, 4]

    areas = (x2 - x1 + 1) * (y2 - y1 + 1)  # 每一个检测框box面积

    order = scores.argsort()[::-1]  # 按照score置信度从大到小排列，得到排序后的坐标索引

    keep = []  # 保留的结果框集合（索引）
    while order.size > 0:
        i = order[0]  # 最大得分box的坐标索引
        keep.append(i)

        # 第一个索引（0）已经保留， 取剩下的素有索引
        # 要与 order[0] 计算IOU
        order = order[1:]

        # 得到相交区域,左上及右下
        xx1 = np.maximum(x1[i], x1[order])
        yy1 = np.maximum(y1[i], y1[order])
        xx2 = np.minimum(x2[i], x2[order])
        yy2 = np.minimum(y2[i], y2[order])

        # 计算相交的面积,不重叠时面积为0
        w = np.maximum(0.0, xx2 - xx1 + 1)
        h = np.maximum(0.0, yy2 - yy1 + 1)  # 求高和宽，并使数值合法化
        inter = w * h  # 其他所有box的面积

        # 计算IoU：交并比 =重叠面积 /（面积1+面积2-重叠面积）
        ovr = inter / (areas[i] + areas[order] - inter)

        # 保留IoU小于阈值的box， ovr小表示两个box交集少，可能是另一个物体的框，故需要保留
        inds = np.where(ovr <= thresh)[0]

        # 保留所有iou小于阈值的框的索引
        order = order[inds]

    return keep

# dets(N, 5) 的二维数组: box的集合，N为框的数量，5即4(位置信息)+1(可能为物体的概率得分)
def py_cpu_nms(dets, thresh):
    
    # x1、y1、x2、y2、以及score赋值
    x1 = dets[:, 0]
    y1 = dets[:, 1]
    x2 = dets[:, 2]
    y2 = dets[:, 3]
    scores = dets[:, 4]

    areas = (x2 - x1 + 1) * (y2 - y1 + 1) #每一个检测框box面积

    order = scores.argsort()[::-1]  # 按照score置信度从大到小排列，得到排序后的坐标索引

    keep = [] #保留的结果框集合（索引）
    while order.size > 0:
        i = order[0]  # 最大得分box的坐标索引
        keep.append(i)

        # 得到相交区域,左上及右下
        xx1 = np.maximum(x1[i], x1[order[1:]])
        yy1 = np.maximum(y1[i], y1[order[1:]])
        xx2 = np.minimum(x2[i], x2[order[1:]])
        yy2 = np.minimum(y2[i], y2[order[1:]])

        # 计算相交的面积,不重叠时面积为0
        w = np.maximum(0.0, xx2 - xx1 + 1)
        h = np.maximum(0.0, yy2 - yy1 + 1)  # 求高和宽，并使数值合法化
        inter = w * h  # 其他所有box的面积

        # 计算IoU：交并比 =重叠面积 /（面积1+面积2-重叠面积）
        ovr = inter / (areas[i] + areas[order[1:]] - inter)

        # 保留IoU小于阈值的box， ovr小表示两个box交集少，可能是另一个物体的框，故需要保留
        inds = np.where(ovr <= thresh)[0]

        # iou小于阈值的框，因为ovr数组的长度比order数组少一个,所以这里要将所有下标后移一位
        # 算iou的时候没把第一个参考框索引考虑进来，所以这里都要+1
        order = order[inds + 1] 
    return keep

代码确实很精炼，其中一些可能需要解释，能够理解更充分：

1、argsort() 的作用是：返回数组从小到大排序后的索引值

2、np.where(condition): 输出满足条件condition元素的坐标。这里的坐标以tuple的形式给出，通常原数组有多少维，输出的tuple中就包含几个数组，分别对应符合条件元素的各维坐标。需要注意的是如果原数组是一维数组，返回元组是（index，），因此用[0]取出tuple中的第一个元素。

3、order = order[inds + 1] ：order存储的是原数组score排序后的索引值，inds 存储的是 ovr 数组中面积小于阈值的ovr 数组元素的索引值，但是因为ovr数组的长度比order数组少一个（第一个元素，也就是得分最高的元素，已经去除放到keep中），所以这里要将 order 中所有下标后移一位。

给出一个测试程序：具体可以打印出来

#coding=utf-8
import cv2
import numpy as np
import random

def mainfun():

    img = np.zeros((300, 400), np.uint8)
    dets = np.array([[83, 54, 165, 163, 0.8], [67, 48, 118, 132, 0.5], [91, 38, 192, 171, 0.6],[77, 40, 100, 100, 0.7]], np.float)

    img_cp = img.copy()
    for box in dets.tolist():  # 显示待测试框及置信度
        x1, y1, x2, y2, score = int(box[0]), int(box[1]), int(box[2]), int(box[3]), box[-1]
        y_text = int(random.uniform(y1, y2))
        cv2.rectangle(img_cp, (x1, y1), (x2, y2), (255, 255, 255), 2)
        cv2.putText(img_cp, str(score), (x2 - 30, y_text), 2, 1, (255, 255, 0))
    cv2.imshow("ori_img", img_cp)

    rtn_box = nms(dets, 0.3)  # 改成自己的nms实现函数
    cls_dets = dets[rtn_box, :]
    print "nms box:", cls_dets

    img_cp = img.copy()
    for box in cls_dets.tolist():
        x1, y1, x2, y2, score = int(box[0]), int(box[1]), int(box[2]), int(box[3]), box[-1]
        y_text = int(random.uniform(y1, y2))
        cv2.rectangle(img_cp, (x1, y1), (x2, y2), (255, 255, 255), 2)
        cv2.putText(img_cp, str(score), (x2 - 30, y_text), 2, 1, (255, 255, 0))
    cv2.imshow("nms box:", img_cp)
    cv2.waitKey(0)


if __name__ == "__main__":
    mainfun()

NMS C++ 实现：

typedef struct {
    int x;
    int y;
    int w;
    int h;
    float score;
}Bbox;

//从大到小排序
bool compScore(Bbox box1,Bbox box2){
	return box1.score > box2.score ? true : false;
}


float iou(Bbox box1,Bbox box2){
	int x1 = max(box1.x,box2.x);
	int y1 = max(box1.y,box2.y);
	int x2 = min(box1.x+box1.w,box2.x+box2.w);
	int y2 = min(box1.y+box1.h,box2.y+box2.h);
	int w = max(0,x2 - x1 + 1);
	int h = max(0,y2 - y1 + 1);
	if( w == 0 || h == 0 ){
		retrun 0;
		}
	float over_area = w*h;
	return over_area/(box1.w * box1.h + box2.w * box2.h - over_area);
}
//第一种写法
vector nms(vector &vec_boxs,float threshold){
	vector results;

	sort(vec_boxs.begin(),vec_boxs.end(),compScore);
	while(vec_boxs.size() > 0)
	{
		results.push_back(vec_boxs[0]);

		index = 1 ;
		while(index < vec_boxs.size()){
			float iou_value = iou(vec_boxs[0],vec_boxs[index]);

			if(iou_value > threshold)
				vec_boxs.erase(vec_boxs.begin() + index);
			else
				index++;
		}
		
		//删除第一个，已经保存
		vec_boxs.erase(vec_boxs.begin());
	}
	return results;
}


//第二种写法
vector nms(vector &vec_boxs,float threshold){
	vector results;

	sort(vec_boxs.begin(),vec_boxs.end(),compScore);
	while(vec_boxs.size() > 0)
	{
		// 保存第一个最大的IOU，并从原vec中删除
		Bbox temp_box = vec_boxs[0]
		results.push_back(temp_box);
		vec_boxs.erase(vec_boxs.begin());
        
		// vec_boxs.begin()
		vector::iterator it ;
		for (it = vec_boxs.begin(); it != vec_boxs.end();)
		{
			float iou_value = iou(vec_boxs[0], *it)；
			
			if(iou_value > threshold)
				vec_boxs.erase(it); //erase返回删除元素的下一个元素
			else
				it++;		
		}	
	}
	return results;
}

三、soft-NMS

参考：https://zhuanlan.zhihu.com/p/42018282

https://zhuanlan.zhihu.com/p/41046620

python代码：

# soft_nms操作，这里假设boxes是无序(未按score做降序)的，所以每轮soft_nms迭代都需要类似冒泡排序操作，选择当前top-1 bbox做NMS
# Nt：计算IoU的阈值，IoU > Nt，对应bbox的score权重就要降低 score*weight
# threshold：上面的降权后，如果 score*weight < threshold 则要剔除掉这个box
def soft_nms(boxes, sigma=0.5, Nt=0.1, threshold=0.001, method=1):
    N = boxes.shape[0]

    for i in range(N):
        # 找到最大得分的box 的位置maxpos
        maxpos = np.argmax(boxes[:, 4])

        # 交换位置 i 和 maxpos 的box值
        # tx1，ty1，tx2，ty2，ts 现在当前 i 位置的坐标和score 不一定是最大
        tx1 = boxes[i, 0]
        ty1 = boxes[i, 1]
        tx2 = boxes[i, 2]
        ty2 = boxes[i, 3]
        ts = boxes[i, 4]

        # add max box as a detection
        boxes[i, 0] = boxes[maxpos, 0]
        boxes[i, 1] = boxes[maxpos, 1]
        boxes[i, 2] = boxes[maxpos, 2]
        boxes[i, 3] = boxes[maxpos, 3]
        boxes[i, 4] = boxes[maxpos, 4]

        # swap ith box with position of max box
        boxes[maxpos, 0] = tx1
        boxes[maxpos, 1] = ty1
        boxes[maxpos, 2] = tx2
        boxes[maxpos, 3] = ty2
        boxes[maxpos, 4] = ts

        # 此时 位置 i 保存的是最大score的bbox信息了
        # 上面交换后，位置 i 处的 tx1，ty1，tx2，ty2，ts 就是现在保存的是最大的分box的坐标和score
        tx1 = boxes[i, 0]
        ty1 = boxes[i, 1]
        tx2 = boxes[i, 2]
        ty2 = boxes[i, 3]
        ts = boxes[i, 4]

        # 现在pos位置是得分最大的box，从pos+1位置开始与最大得分的bbox比较
        pos = i + 1
        # NMS iterations, note that N changes if detection boxes fall below threshold
        while pos < N:  # 向后做NMS比较
            x1 = boxes[pos, 0]  # 当前位置的bbox
            y1 = boxes[pos, 1]
            x2 = boxes[pos, 2]
            y2 = boxes[pos, 3]
            s = boxes[pos, 4]

            area = (x2 - x1 + 1) * (y2 - y1 + 1)
            iw = (min(tx2, x2) - max(tx1, x1) + 1)
            if iw > 0:         # 计算Insection的宽iw，如果iw < 0，说明没相交，可以直接忽略了
                ih = (min(ty2, y2) - max(ty1, y1) + 1)
                if ih > 0:     # 计算Insection的宽ih，如果ih < 0，说明没相交，可以直接忽略了
                    ua = float((tx2 - tx1 + 1) * (ty2 - ty1 + 1) + area - iw * ih)
                    ov = iw * ih / ua  # iou between max box and detection box

                    if method == 1:  # linear降权操作
                        if ov > Nt:
                            weight = 1 - ov
                        else:
                            weight = 1
                    elif method == 2:  # gaussian 降权
                        weight = np.exp(-(ov * ov) / sigma)
                    else:  # original NMS weight = 0就直接把score置0
                        if ov > Nt:
                            weight = 0
                        else:
                            weight = 1

                    boxes[pos, 4] = weight * boxes[pos, 4]
                    print(boxes[:, 4])

                    # update N
                    # 如果bbox调整后的权重，已经小于阈值threshold，那么这个bbox就可以忽略了
                    # 操作方式是直接用最后一个N-1位置的有效的bbox替换当前pos上的bbox
                    if boxes[pos, 4] < threshold:
                        boxes[pos, 0] = boxes[N - 1, 0]
                        boxes[pos, 1] = boxes[N - 1, 1]
                        boxes[pos, 2] = boxes[N - 1, 2]
                        boxes[pos, 3] = boxes[N - 1, 3]
                        boxes[pos, 4] = boxes[N - 1, 4]

                        N = N - 1  # 更新N， 最后一个box（小于阈值）忽略掉

                        # 当 第 N-1 位置的 box 被 替换到 pos 位置时，这个box是还没有计算过IOU的，
                        # 因此再次进行计算一遍IOU，因此 pos = pos
                        pos = pos
                    else:
                        # 当box 没有置换时， 则计算 pos + 1 位置IOU
                        # 因此再次进行计算一遍IOU，因此 pos = pos
                        pos = pos + 1

    # bbox也做了对应的调整、筛选，bbox list中top-N就对应着最高score，且soft-nms筛选通过的bbox
    
    keep = [i for i in range(N)]
    return keep

# 测试代码
boxes = np.array([[100, 100, 150, 168, 0.63], [166, 70, 312, 190, 0.55],
                  [221, 250, 389, 500, 0.79], [12, 190, 300, 399, 0.9], [28, 130, 134, 302, 0.3]])
keep = soft_nms(boxes)
print(keep)

四、mIOU - 语义分割

参考文章（必须读）：语义分割之MIoU原理与实现

mIoU相关

在计算机视觉深度学习图像分割领域中，mIoU值是一个衡量图像分割精度的重要指标。mIoU可解释为平均交并比，即在每个类别上计算IoU值，然后求平均值。Pixel Accuracy(PA，像素精度)，mIoU的介绍参考链接：论文笔记 |　基于深度学习的图像语义分割技术概述之5.1度量标准

混淆矩阵介绍

fast_hist()函数用于产生n*n的分类统计表，还不理解的可以看如下分析：

假如输入的标签图a是3*3的，如下左图，图中的数字表示该像素点的归属，即每个像素点所属的类别（其中n=3，即共有三种类别）；预测标签图b的大小和a相同，如右图所示（图中的数字也代表每个像素点的类别归属）。

a-真实标签 b-预测标签

直观上看，b中预测的标签有两个像素点预测出错，即上图所示 b01， b20

源码中的这句语句是精华：

np.bincount( num_cls * label_true[mask].astype(int) +
        label_pred[mask], minlength=num_cls ** 2).reshape(num_cls, num_cls)

其作用是产生一行n*n个元素的向量，向量中的每个元素存储统计结果，假如该向量为d，则其中的d(i*n+j)表示预测结果为类别 j，实际标签为类别 i 的所有像素点的数目。

将上述的a、b和n输入fast_hist(a, b, n)，所产生的d为：d=(3,0,0,0,2,1,0,1,2)，其中的d(1*3+1)=d(4)表示预测类别为1，实际标签也为1的所有像素点数目为2。

通过reshape(n, n)将向量d转换为3*3的矩阵，其结果如下表（该矩阵即为下表中的绿色部分）：

其中绿色的3*3表格统计的含义，拿数字3所在的这一格为例，即预测标签中被预测为类别0的且其真实标签也为0的所有像素点数目之和。

上述表格有几点需要注意的是（这三条是用于计算一开始所讲的四个指标的基础）：

①绿色表格中对角线元素上的数字即为该类别预测正确的像素点（样本）数，非对角线元素都是预测错误的，拿最后一行的数字1为例，其含义即为有一个原本应属于类别2的像素点被错误地预测为类别1；

②绿色表格的每一行求和得到的数字的含义是真实标签中属于某一类别的所有像素点（样本）数，拿第一行为例，3+0+0=3，即真实属于类别0的像素点一共3个；

③绿色表格的每一列求和得到的数字的含义是被预测为某一类别的所有像素点数，拿第二列为例，0+2+1=3，即预测为类别1的所有像素点共有3个。

'''
产生n×n的分类统计表
参数a：标签图（转换为一维数组），即真实的标签
参数b：score层输出的预测图（转换为一维数组），即预测的标签
参数n: 类别数
'''
def fast_hist(label_pred, label_true, num_cls):
	# 找出标签中需要计算的类别,去掉了背景
	mask = (label_true >= 0) & (label_true < num_cls)

	# np.bincount计算了从0到n**2-1这n**2个数中每个数出现的次数，返回值形状(n, n)
	hist = np.bincount(
		num_cls * label_true[mask].astype(int) +
		label_pred[mask], minlength=num_cls ** 2).reshape(num_cls, num_cls)
	return hist

# 输入：预测值和真实值
# 语义分割的任务是为每个像素点分配一个label
def evaluate(predictions, gts):

	hist = np.zeros((num_cls, num_cls))
	for lp, lt in zip(predictions, gts):
		assert len(lp.flatten()) == len(lt.flatten())
        # 对每一（预测，真实）标签，生成num_cls×num_cls矩阵，并累加
		hist += fast_hist(lp.flatten(), lt.flatten())
		
	# 分别为每个类别计算mIoU，hist的形状(n, n)
	iou = np.diag(hist) / (hist.sum(axis=1) + hist.sum(axis=0) - np.diag(hist))
	miou = np.nanmean(iou)  # 求所有类别平均的mIoU值，计算时忽略NaN值
	
	return miou

代码释意：

1、np.bincount计算了从0到n**2-1这n**2个数中每个数出现的次数，返回值形状(n, n)
bincount()函数用于统计数组内每个非负整数的个数
详见 https://numpy.org/doc/stable/reference/generated/numpy.bincount.html

2、iou = np.diag(hist) / (hist.sum(axis=1) + hist.sum(axis=0) - np.diag(hist))

np.diag(hist) -- 矩阵的对角线上的值组成的一维数组

(hist.sum(axis=1) + hist.sum(axis=0) - np.diag(hist)) -- 矩阵的所有某一类别行列元素之和组成的一维数组，返回值形状(n,)

参考文章：

深度学习计算机视觉图像分割领域指标mIoU（平均交并比）计算代码与逐行解析

FCN源码解读之score.py

语义分割代码阅读---评价指标mIoU的计算

iphone se 一代不完美越狱 14.6 视频壁纸教程(踩坑笔记) YANG_301 ios iphone
iphonese一代不完美越狱14.6加视频壁纸教程-踩坑笔记越狱流程1.爱思助手制作启动u盘坑点:2.越狱好后视频壁纸软件1.源2.软件安装越狱流程1.爱思助手制作启动u盘https://www.i4.cn/news_detail_42302.html此网址为具体流程,但要注意!!!坑点:下图中最后一排quickmode应被勾选(勾选后是×(´ཀ`」∠))进入options后不禁要勾选allow
Docker+Portainer 离线安装 qq_30024063 docker 容器运维
1.Docker安装步骤一：官网下载docker安装包步骤二：解压安装包;tar-zxvfdocker-24.0.6.tgz步骤三：将解压之后的docker文件移到/usr/bin目录下;cpdocker/*/usr/bin/步骤四：将docker注册成系统服务;vim/etc/systemd/system/docker.service然后在文件中添加以下内容，退出并保存（:wq!）[Unit]D
【LlamaIndex核心组件指南 | 模型篇】一文通晓 LlamaIndex 模型层：LLM、Embedding 及多模态应用全景解析
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
Python_计算两个省市之间的直线距离_2506 夏天里的肥宅水 PYTHON python spring 开发语言
更新代码上一版链接importpandasaspdimporttimeimportpickleimportosimportsysfromgeopy.geocodersimportNominatimfromgeopy.distanceimportgeodesicfromtqdmimporttqdm#ConfigurationINPUT_FILE=r"距离.xlsx"#输入文件路径OUTPUT_FIL
python中的*args 和 **kwargs Hi_kenyon python python
简单来说，它们允许一个函数接收不定数量的参数。这在我们预先不知道会传递多少个参数给函数时非常有用。*args(任意数量的位置参数)*args用于在一个函数中接收任意数量的位置参数(positionalarguments)。当你在函数定义中使用*args时，Python会将所有传入的多余的位置参数收集到一个元组(tuple)中。这个名字args只是一个约定俗成的惯例(arguments的缩写)，你也
iPhone越狱基本流程王景程 github iphone xcode macos
目录一、什么是越狱（Jailbreak）？二、越狱前的准备工作三、越狱方式总览（按iOS版本划分）越狱类型：主流越狱工具一览：四、以Checkra1n为例讲解越狱流程（适合iPhoneX及更早）✅支持设备（iOS12–14）：步骤：五、越狱后的操作（以Cydia为例）⚠️六、越狱风险与注意事项总结流程图：一、iPhone16+iOS26：是否可以越狱？当前情况（截至2025年中）：二、为何新设备（
《AI颠覆编码：GPT-4在编译器层面的奇幻漂流》的深度技术解析踢足球的，程序猿人工智能 python c语言
一、传统编译器的黄昏：LLVM面临的AI降维打击1.1经典优化器的性能天花板//LLVM循环优化Pass传统实现（LoopUnroll.cpp）voidLoopUnrollPass::runOnLoop(Loop*L){unsignedTripCount=SE->getSmallConstantTripCount(L);if(!TripCount||TripCount>UnrollThreshol
c语言实现2的n次方 network爬虫算法 c语言
#include#includeintmain(){intn;scanf("%d",&n);doublea=pow(2,n);printf("%lf\n",a);}
用 Python 开发文字冒险游戏：从零开始的教程晓天天天向上 python microsoft 开发语言
文字冒险游戏(Text-basedAdventureGame)是一种经典的游戏类型，玩家通过输入文字指令与游戏世界互动。这种游戏不依赖复杂的图形界面，非常适合初学者学习编程逻辑和用户交互。在本篇博客中，我们将用Python开发一个简单的文字冒险游戏，体验游戏开发的乐趣。1.游戏设计思路游戏背景玩家醒来发现自己身处一个神秘的地下城，需要探索房间、收集物品、战胜敌人并找到出口。核心机制房间导航：玩家可
从零开始理解零样本学习：AI人工智能必学技术 AI天才研究院 Agentic AI 实战 AI人工智能与大数据 AI大模型企业级应用开发实战 ai
从零开始理解零样本学习：AI人工智能必学技术关键词：零样本学习、人工智能、机器学习、知识迁移、语义嵌入摘要：本文旨在全面深入地介绍零样本学习这一在人工智能领域具有重要意义的技术。首先阐述零样本学习的背景和基本概念，通过详细的解释和直观的示意图让读者建立起对零样本学习的初步认识。接着深入剖析其核心算法原理，结合Python代码进行详细说明，同时引入相关数学模型和公式并举例阐释。通过项目实战部分，带领
稳定币独角兽：Circle InnoLink_1024 区块链稳定币区块链
Circle公司背景分析CircleInternetFinancial（以下简称Circle）是一家成立于2013年的美国金融科技公司，总部位于波士顿，由JeremyAllaire和SeanNeville联合创立。公司最初专注于点对点加密货币支付和交易，后转型为全球领先的稳定币发行机构，其核心产品是与美元1:1挂钩的USDCoin（USDC），目前为全球第二大稳定币，仅次于Tether的USDT。
Cline中配置MCP Alexon Xu MCP
1、自动安装MCP默认AI生成的配置会报错：spawnnpxENOENTspawnnpxENOENT，然后排查了npx安装都是OK的，需要使用cmd运行npx，配置如下：{"mcpServers":{"sequentialthinking":{"autoApprove":[],"disabled":false,"timeout":60,"command":"cmd.exe","args":["/c
js递归性能优化啃火龙果的兔子开发DEMO javascript 开发语言 ecmascript
JavaScript递归性能优化递归是编程中强大的技术，但在JavaScript中如果不注意优化可能会导致性能问题甚至栈溢出。以下是几种优化递归性能的方法：1.尾调用优化(TailCallOptimization,TCO)ES6引入了尾调用优化，但只在严格模式下有效：'usestrict';//普通递归functionfactorial(n){if(n===1)return1;returnn*fa
卷积神经网络（Convolutional Neural Network, CNN）不想秃头的程序神经网络语音识别人工智能深度学习网络卷积神经网络
卷积神经网络（ConvolutionalNeuralNetwork,CNN）是一种专门用于处理图像、视频等网格数据的深度学习模型。它通过卷积层自动提取数据的特征，并利用空间共享权重和池化层减少参数量和计算复杂度，成为计算机视觉领域的核心技术。以下是CNN的详细介绍：一、核心思想CNN的核心目标是从图像中自动学习层次化特征，并通过空间共享权重和平移不变性减少参数量和计算成本。其关键组件包括：卷积层（
ResNet（Residual Network）不想秃头的程序神经网络语音识别人工智能深度学习网络残差网络神经网络
ResNet（ResidualNetwork）是深度学习中一种经典的卷积神经网络（CNN）架构，由微软研究院的KaimingHe等人在2015年提出。它通过引入残差连接（SkipConnection）解决了深度神经网络中的梯度消失问题，使得网络可以训练极深的模型（如上百层），并在图像分类、目标检测、语义分割等任务中取得了突破性成果。以下是ResNet的详细介绍：一、核心思想ResNet的核心创新是
平台再升级！接入DeepSeek AI，三大能力一键生成橙武科技低代码 AI deepseek 人工智能
在数字化项目落地过程中，很多企业都会面临相同的问题：数据库建模要写SQL表结构；业务流程需要画LogicFlow流程图；前端页面还要写AMISJSON配置。从想法到实现，中间至少要经历产品经理、架构师、后端、前端多轮沟通。每个环节都耗时，改起来还要推翻重来。demo地址：https://admin.cwcode.top✨我们的平台，现在直接整合了DeepSeekAI大模型只要输入一句需求，就能：✅
P25：LSTM实现糖尿病探索与预测 ?Agony lstm 人工智能 rnn
本文为365天深度学习训练营中的学习记录博客原作者：K同学啊一、相关技术1.LSTM基本概念LSTM（长短期记忆网络）是RNN（循环神经网络）的一种变体，它通过引入特殊的结构来解决传统RNN中的梯度消失和梯度爆炸问题，特别适合处理序列数据。结构组成：遗忘门：决定丢弃哪些信息，通过sigmoid函数输出0-1之间的值，表示保留或遗忘的程度。输入门：决定更新哪些信息，同样通过sigmoid函数控制更新
Python训练营打卡——DAY16（2025.5.5） cosine2025 Python训练营打卡 python 开发语言机器学习
目录一、NumPy数组基础笔记1.理解数组的维度(Dimensions)2.NumPy数组与深度学习Tensor的关系3.一维数组(1DArray)4.二维数组(2DArray)5.数组的创建5.1数组的简单创建5.2数组的随机化创建5.3数组的遍历5.4数组的运算6.数组的索引6.1一维数组索引6.2二维数组索引6.3三维数组索引二、SHAP值的深入理解三、总结1.NumPy数组基础总结2.SH
AI助力基因遗传疾病检测：现状与未来 t0_54program 大数据与人工智能人工智能个人开发
在现代医学领域，与基因紊乱相关疾病的早期检测至关重要。像肺癌，早期诊断的患者5年生存率可达57%，而四期癌症患者生存率仅3%。阿尔茨海默病的早期检测，能让患者改变生活方式、参与临床试验并提前治疗脑部退化症状，有效延长生命。尽管基因检测对评估晚发性阿尔茨海默病的可能性有帮助，对早发性阿尔茨海默病也有指示作用，但其检测技术仍有待完善。目前，仅基于生物学研究的疾病检测技术多样，虽对特定病例精确，但通常需
Python的一点基础教程------文件读写卡提西亚 python 开发语言
最近在看大佬写的Python教程自学,但是感觉有点头痛,因为大佬讲了一些底层的结构和原理,但是又没那么详细,然后作为一个初学者自学的情况下,看的很费劲.看完就有感而发,想写一篇更基础的教程,教会大家怎么去用它,尽量少的去讲原理.但是当然,你也需要有一定的编程语言基础,了解基本的语法和函数等功能.正所谓师傅领进门,修行在个人,有时候我们学了一个东西,如果觉得很有趣,自然就会去了解关于它的更多信息,但
1.2 Python 的特点与优势 Utopia Reverie python python 开发语言
1.语法简洁易读Python以简洁的语法著称，代码可读性强，减少了不必要的符号和冗余代码。例如，使用缩进来表示代码块，而非传统的大括号。这使得代码更易于理解和维护，尤其适合初学者。示例：python运行【#计算斐波那契数列的前10项n=10a,b=0,1for_inrange(n);print(a,end='')a,b=b,a+b#输出:0112358132134】2.开源与社区支持Python是
AI写作实战：从零开始撰写项目提案 SuperMale-zxq AI编程写作投资专栏 AI写作 java 人工智能 AI编程 python
AI写作实战：从零开始撰写项目提案为什么大多数项目提案一出生就已经死亡？还记得上周看到一封邮件吗？一位读者小李发了他精心准备的项目提案，希望有人给些建议。打开附件的那一刻，我叹了口气——这又是一份"自嗨式提案"：密密麻麻的文字堆砌、技术术语泛滥、价值主张模糊不清。我发现数千份项目提案中，有超过80%在开头几分钟就失去了读者的注意力。更残酷的是，决策者通常只会花60秒浏览你的提案，如果没有在这短暂时
动手学Python：从零开始构建一个“文字冒险游戏” network爬虫 python python 开发语言
动手学Python：从零开始构建一个“文字冒险游戏”大家好，我是你的技术向导。今天，我们不聊高深的框架，也不谈复杂的算法，我们来做一点“复古”又极具趣味性的事情——用Python亲手打造一个属于自己的文字冒险游戏（TextAdventureGame）。你是否还记得那些在早期计算机上，通过一行行文字描述和简单指令来探索未知世界的日子？这种游戏的魅力在于它能激发我们最原始的想象力。而对于我们程序员来说
【重构推荐系统】国产大模型驱动的电商个性化推荐完整实战：架构设计、推理优化与在线部署闭环观熵国产大模型部署实战全流程指南重构人工智能 Agent 智能体落地方案
个人简介作者简介：全栈研发，具备端到端系统落地能力，专注大模型的压缩部署、多模态理解与Agent架构设计。热爱“结构”与“秩序”，相信复杂系统背后总有简洁可控的可能。我叫观熵。不是在控熵，就是在观测熵的流动个人主页：观熵个人邮箱：[email protected]座右铭：愿科技之光，不止照亮智能，也照亮人心！专栏导航观熵系列专栏导航：AI前沿探索：从大模型进化、多模态交互、AIGC内容生成，到
python 脚本遍历目录，并把目录下的非utf-8文件改成utf8 还债大湿兄 python 开发语言数据库
从网上下载的qt项目我本地编译里面经常包含中文，提示编译不过，实际上以前经常手动转，发觉还是用脚本不，毕竟这次下的有点大，我只改.h.cpp#pythonD:\python\filetoUtf.pyE:\EasyCanvas-master\EasyCanvas-masterimportosimportcodecsimportargparseimportsysdefconvert_to_utf8_b
深入详解：决策树算法的概念、原理、实现与应用场景猿享天开算法决策树机器学习
深入详解：决策树算法的概念、原理、实现与应用场景决策树（DecisionTree）是机器学习中一种直观且广泛应用的监督学习算法，适用于分类和回归任务。其树形结构易于理解，特别适合初学者。本文将从概念、原理、实现到应用场景，全面讲解决策树，并通过流程图和可视化示例增强理解，通俗易懂，帮助小白快速掌握决策树算法相关知识。1.决策树的概念1.1什么是决策树？决策树通过一系列条件判断（决策节点）将输入数据
树莓派中 Python+opencv打开摄像头 68lizi 光电设计 python
树莓派中Python+opencv打开摄像头注意不要使用cap=cv2.VideoCapture(0,cv2.CAP_DSHOW)，我在树莓派使用这个的时候会报错，在windows不会报错，具体原因不清楚cap=cv2.VideoCapture(0)#使用cap=cv2.VideoCapture(0,cv2.CAP_DSHOW)会报错whileTrue:status,img=cap.read()i
代码随想录算法训练营第52天 | 101.孤岛的总面积、102.沉没孤岛、103.水流问题、104.建造最大岛屿 Amor_Fati_Yu 算法 java 数据结构
101.孤岛的总面积importjava.util.*;publicclassMain{privatestaticintcount=0;privatestaticfinalint[][]dir={{0,1},{1,0},{-1,0},{0,-1}};//四个方向privatestaticvoidbfs(int[][]grid,intx,inty){Queueque=newLinkedList=gr
python实现读取文件的指定某行内容 Fitz1318 Python3学习 python
python实现读取文件的指定某行内容最近有一个需求就是读取一个文件中的指定某行的内容，现将方法记录如下importlinecache#这里填写你自己的文件位置和行号text=linecache.getline("../TestFile/test_C1.json",2)print(text)
Git使用基本指南 LEIX_lll git
一、Git基础配置首先需要配置用户信息，让Git知道你是谁：gitconfig--globaluser.name"你的名字"gitconfig--globaluser.email"你的邮箱@example.com"如果需要查看配置信息，可以使用：gitconfig--list二、仓库操作1.创建新仓库gitinit该命令会在当前目录下创建一个新的Git仓库。2.克隆已有仓库gitclone[远程仓
web报表工具FineReport常见的数据集报错错误代码和解释老A不折腾 web报表 finereport 代码可视化工具
在使用finereport制作报表，若预览发生错误，很多朋友便手忙脚乱不知所措了，其实没什么，只要看懂报错代码和含义，可以很快的排除错误，这里我就分享一下finereport的数据集报错错误代码和解释，如果有说的不准确的地方，也请各位小伙伴纠正一下。 NS-war-remote=错误代码\:1117 压缩部署不支持远程设计 NS_LayerReport_MultiDs=错误代码
Java的WeakReference与WeakHashMap bylijinnan java 弱引用
首先看看 WeakReference wiki 上 Weak reference 的一个例子： public class ReferenceTest { public static void main(String[] args) throws InterruptedException { WeakReference r = new Wea
Linux——（hostname）主机名与ip的映射 eksliang linux hostname
一、什么是主机名无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。但IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。域名类型 linuxsir.org 这样的；主机名是用于什么的呢？答：在一个局域网中，每台机器都有一个主
oracle 常用技巧 18289753290
oracle常用技巧 ①复制表结构和数据 create table temp_clientloginUser as select distinct userid from tbusrtloginlog ②仅复制数据如果表结构一样 insert into mytable select * &nb
使用c3p0数据库连接池时出现com.mchange.v2.resourcepool.TimeoutException 酷的飞上天空 exception
有一个线上环境使用的是c3p0数据库，为外部提供接口服务。最近访问压力增大后台tomcat的日志里面频繁出现 com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.v2.resourcepool.BasicResou
IT系统分析师如何学习大数据蓝儿唯美大数据
我是一名从事大数据项目的IT系统分析师。在深入这个项目前需要了解些什么呢？学习大数据的最佳方法就是先从了解信息系统是如何工作着手，尤其是数据库和基础设施。同样在开始前还需要了解大数据工具，如Cloudera、Hadoop、Spark、Hive、Pig、Flume、Sqoop与Mesos。系统分析师需要明白如何组织、管理和保护数据。在市面上有几十款数据管理产品可以用于管理数据。你的大数据数据库可能
spring学习——简介 a-john spring
Spring是一个开源框架，是为了解决企业应用开发的复杂性而创建的。Spring使用基本的JavaBean来完成以前只能由EJB完成的事情。然而Spring的用途不仅限于服务器端的开发，从简单性，可测试性和松耦合的角度而言，任何Java应用都可以从Spring中受益。其主要特征是依赖注入、AOP、持久化、事务、SpringMVC以及Acegi Security 为了降低Java开发的复杂性，
自定义颜色的xml文件 aijuans xml
<?xml version="1.0" encoding="utf-8"?> <resources> <color name="white">#FFFFFF</color> <color name="black">#000000</color> &
运营到底是做什么的？ aoyouzi 运营到底是做什么的？
文章来源：夏叔叔（微信号：woshixiashushu），欢迎大家关注！很久没有动笔写点东西，近些日子，由于爱狗团产品上线，不断面试，经常会被问道一个问题。问：爱狗团的运营主要做什么？答：带着用户一起嗨。为什么是带着用户玩起来呢？究竟什么是运营？运营到底是做什么的？那么，我们先来回答一个更简单的问题——互联网公司对运营考核什么？以爱狗团为例，绝大部分的移动互联网公司，对运营部门的考核分为三块——用
js面向对象类和对象百合不是茶 js 面向对象函数创建类和对象
接触js已经有几个月了,但是对js的面向对象的一些概念根本就是模糊的,js是一种面向对象的语言但又不像java一样有class,js不是严格的面向对象语言 ,js在java web开发的地位和java不相上下 ,其中web的数据的反馈现在主流的使用json,json的语法和js的类和属性的创建相似下面介绍一些js的类和对象的创建的技术一:类和对
web.xml之资源管理对象配置 resource-env-ref bijian1013 java web.xml servlet
resource-env-ref元素来指定对管理对象的servlet引用的声明，该对象与servlet环境中的资源相关联 <resource-env-ref> <resource-env-ref-name>资源名</resource-env-ref-name> <resource-env-ref-type>查找资源时返回的资源类
Create a composite component with a custom namespace sunjing
https://weblogs.java.net/blog/mriem/archive/2013/11/22/jsf-tip-45-create-composite-component-custom-namespace When you developed a composite component the namespace you would be seeing would
【MongoDB学习笔记十二】Mongo副本集服务器角色之Arbiter bit1129 mongodb
一、复本集为什么要加入Arbiter这个角色回答这个问题，要从复本集的存活条件和Aribter服务器的特性两方面来说。什么是Artiber？ An arbiter does not have a copy of data set and cannot become a primary. Replica sets may have arbiters to add a
Javascript开发笔记白糖_ JavaScript
获取iframe内的元素通常我们使用window.frames["frameId"].document.getElementById("divId").innerHTML这样的形式来获取iframe内的元素，这种写法在IE、safari、chrome下都是通过的，唯独在fireforx下不通过。其实jquery的contents方法提供了对if
Web浏览器Chrome打开一段时间后，运行alert无效 bozch Web chorme alert 无效
今天在开发的时候，突然间发现alert在chrome浏览器就没法弹出了，很是怪异。试了试其他浏览器，发现都是没有问题的。开始想以为是chorme浏览器有啥机制导致的，就开始尝试各种代码让alert出来。尝试结果是仍然没有显示出来。这样开发的结果，如果客户在使用的时候没有提示，那会带来致命的体验。哎，没啥办法了就关闭浏览器重启。结果就好了，这也太怪异了。难道是cho
编程之美-高效地安排会议图着色问题贪心算法 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Collections; import java.util.List; import java.util.Random; public class GraphColoringProblem { /**编程之美高效地安排会议图着色问题贪心算法 * 假设要用很多个教室对一组
机器学习相关概念和开发工具 chenbowen00 算法 matlab 机器学习
基本概念：机器学习(Machine Learning, ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，它主要使用归纳、综合而不是演绎。开发工具 M
[宇宙经济学]关于在太空建立永久定居点的可能性 comsci 经济
大家都知道,地球上的房地产都比较昂贵,而且土地证经常会因为新的政府的意志而变幻文本格式........ 所以,在地球议会尚不具有在太空行使法律和权力的力量之前,我们外太阳系统的友好联盟可以考虑在地月系的某些引力平衡点上面,修建规模较大的定居点
oracle 11g database control 证书错误 daizj oracle 证书错误 oracle 11G 安装
oracle 11g database control 证书错误 win7 安装完oracle11后打开 Database control 后，会打开em管理页面，提示证书错误，点“继续浏览此网站”，还是会继续停留在证书错误页面解决办法：是 KB2661254 这个更新补丁引起的，它限制了 RSA 密钥位长度少于 1024 位的证书的使用。具体可以看微软官方公告：
Java I/O之用FilenameFilter实现根据文件扩展名删除文件游其是你 FilenameFilter
在Java中，你可以通过实现FilenameFilter类并重写accept(File dir, String name) 方法实现文件过滤功能。在这个例子中，我们向你展示在“c:\\folder”路径下列出所有“.txt”格式的文件并删除。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
C语言数组的简单以及一维数组的简单排序算法示例，二维数组简单示例 dcj3sjt126com c array
# include <stdio.h> int main(void) { int a[5] = {1, 2, 3, 4, 5}; //a 是数组的名字 5是表示数组元素的个数，并且这五个元素分别用a[0], a[1]...a[4] int i; for (i=0; i<5; ++i) printf("%d\n",
PRIMARY, INDEX, UNIQUE 这3种是一类 PRIMARY 主键。就是唯一且不能为空。 INDEX 索引，普通的 UNIQUE 唯一索引 dcj3sjt126com primary
PRIMARY, INDEX, UNIQUE 这3种是一类PRIMARY 主键。就是唯一且不能为空。INDEX 索引，普通的UNIQUE 唯一索引。不允许有重复。FULLTEXT 是全文索引，用于在一篇文章中，检索文本信息的。举个例子来说，比如你在为某商场做一个会员卡的系统。这个系统有一个会员表有下列字段：会员编号 INT会员姓名
java集合辅助类 Collections、Arrays shuizhaosi888 Collections Arrays HashCode
Arrays、Collections 1 ）数组集合之间转换 public static <T> List<T> asList(T... a) { return new ArrayList<>(a); } a）Arrays.asL
Spring Security（10）——退出登录logout 234390216 logout Spring Security 退出登录 logout-url LogoutFilter
要实现退出登录的功能我们需要在http元素下定义logout元素，这样Spring Security将自动为我们添加用于处理退出登录的过滤器LogoutFilter到FilterChain。当我们指定了http元素的auto-config属性为true时logout定义是会自动配置的，此时我们默认退出登录的URL为“/j_spring_secu
透过源码学前端之 Backbone 三 Model 逐行分析JS源代码 backbone 源码分析 js学习
Backbone 分析第三部分 Model 概述： Model 提供了数据存储，将数据以JSON的形式保存在 Model的 attributes里，但重点功能在于其提供了一套功能强大，使用简单的存、取、删、改数据方法，并在不同的操作里加了相应的监听事件，如每次修改添加里都会触发 change，这在据模型变动来修改视图时很常用，并且与collection建立了关联。
SpringMVC源码总结（七）mvc:annotation-driven中的HttpMessageConverter 乒乓狂魔 springMVC
这一篇文章主要介绍下HttpMessageConverter整个注册过程包含自定义的HttpMessageConverter，然后对一些HttpMessageConverter进行具体介绍。 HttpMessageConverter接口介绍： public interface HttpMessageConverter<T> { /** * Indicate
分布式基础知识和算法理论 bluky999 算法 zookeeper 分布式一致性哈希 paxos
分布式基础知识和算法理论 BY [email protected] 本文永久链接：http://nodex.iteye.com/blog/2103218 在大数据的背景下，不管是做存储，做搜索，做数据分析，或者做产品或服务本身，面向互联网和移动互联网用户，已经不可避免地要面对分布式环境。笔者在此收录一些分布式相关的基础知识和算法理论介绍，在完善自我知识体系的同
Android Studio的.gitignore以及gitignore无效的解决 bell0901 android gitignore
　　github上.gitignore模板合集，里面有各种.gitignore ： https://github.com/github/gitignore 　　自己用的Android Studio下项目的.gitignore文件，对github上的android.gitignore添加了　　　　　　# OSX files　　　　　　//mac os下　　　　　　.DS_Store
成为高级程序员的10个步骤 tomcat_oracle 编程
What 软件工程师的职业生涯要历经以下几个阶段：初级、中级，最后才是高级。这篇文章主要是讲如何通过 10 个步骤助你成为一名高级软件工程师。 Why 得到更多的报酬！因为你的薪水会随着你水平的提高而增加提升你的职业生涯。成为了高级软件工程师之后，就可以朝着架构师、团队负责人、CTO 等职位前进历经更大的挑战。随着你的成长，各种影响力也会提高。
mongdb在linux下的安装 xtuhcy mongodb linux
一、查询linux版本号： lsb_release -a LSB Version: :base-4.0-amd64:base-4.0-noarch:core-4.0-amd64:core-4.0-noarch:graphics-4.0-amd64:graphics-4.0-noarch:printing-4.0-amd64:printing-4.0-noa