满船清梦压星河HK

【Kaggle：UW-Madison GI Tract Image Segmentation】肠胃分割比赛：赛后复盘+数据再理解

前言
一、任务介绍
三、我们的探索
- 3.1、baseline
- - 3.1.1、K折交叉验证
- 3.2、数据层面
- - 3.2.1、删除错误数据
  - 3.2.2、2.5D方案探索
  - 3.2.3、数据增强
- 3.3、Loss
- 3.4、模型融合
- 3.5、TTA
- 3.6、训练技巧：梯度累加
- 3.7、不work
- - 3.7.1、多尺度训练
  - 3.7.2、伪标签
四、其他的优秀方案
- 4.1、两阶段方法
- 4.2、2.5D+3D融合
五、经验、教训
六、最后看看牌子
Reference

前言

花了一个多月的时间，打了一个kaggle比赛，这是我第一次做分割任务，还是很有意思的。

比赛地址 Kaggle肠胃分割比赛: UW-Madison GI Tract Image Segmentation

给我最大的感受就是，打比赛和发论文最大的不同在于，发论文首先会从model的角度去看待问题，会先想的是怎么让这个model更强，怎么让这个trick听起来更高大上，然后去编故事发论文。但是打比赛一定是先考虑数据的事，一定是根据对数据的理解然后去想可能有用的trick去尝试提分。

比赛最后是拿了铜牌（本来A榜是银尾的，后来B榜shake到了铜尾，别人都是shake up的，我是shake down，唉，还是对数据理解的不深入啊），然后我是组队参加的，建议大家多组队啊，可以从队友身上学到很多东西。

这篇博客主要是记录下自己打这个比赛自己探索的过程，以及比赛后看了一些top方案重新对数据的反思。

一、任务介绍

这是一个多标签、3类别、语义分割问题。

训练集共85个病例，每个病例有1-5次MRI扫描，每次扫描会截取 144张单通道的图片。比赛方给的数据如下，train下面放的是所有的扫描图像，按 train/casexxx/dayx 每个病例的每次扫描的图片分开存储。train.csv存放训练的mask标签，train.csv总共有三列，分别是：

id：每个切片图片的唯一标识符，如case123_day20_slice_0001，标识第123号病例第20天的第0001张MRI切片图片，id列可以展开成三列信息：case、day和slice，通过这三个信息一样可以标记到唯一的图片；
class，一共三类：大肠large bowel, 小肠small bowel or 胃stomach；
segmentation：RLE segmentation mask，一种非常高效的mask编码存放方式，后面需要用RLE解码得到mask图片；

经过简单的数据探索，我们得到数据集的一些基本特点，这里总结下：

多标签、3类、语义分割问题；
训练集有85例病例，每个病例有1-5天的扫描，每次扫描144张slice切片；
训练集有38496张图片，有mask的16590张，没有mask的21906张；
大肠出现图片：小肠出现图片：胃出现图片 = 14085 ： 11201 ： 8627
图片有四种尺寸，266 x 266、360 x 310、276 x 276 、234 x 234，前两种尺寸占90%
测试集完全不可见，有部分是训练集出现的病例，但是有50例是训练集完全没出现过的病例，A榜和B榜各占50%的测试集；
每个病例每天会扫描很多的切面（1-144），slice1是最底部的图像，slice144是最上面的图像；
测试集虽然不可见，但是测试目录中的图像分布和格式将与训练目录中的相同；

可视化图片和mask（单通道原图）
病例18，day0，切片0060-0069的图片和mask标签可视化长这样：

三、我们的探索

3.1、baseline

我是在比赛结束前一个半月开始打的，为了快速的上手这个项目，我的baseline直接用的就是 Discussion 中的项目：UWMGI: Unet [Train] [PyTorch] 和 UWMGI: Unet [Infer] [PyTorch]

amp配置（这里做了几组消融实验才确定这个amp配置）：

unet-effb3
320x320
epoch12
lr=1e-3
train_bs=64
fold=5
# 数据增强  直接用的肾小球比赛的数据增强参数
dict(type='RandomFlip', direction='horizental', p=0.5)
dict(type='RandomFlip', direction='vertical', p=0.5)
dict(type='RandomRotate',prob=0.5, degree=90, pad_val=0, seg_pad_val=255),
transforms=[dict(type='ElasticTransform', alpha=1, sigma=50, alpha_affine=50, p=0.2)
           dict(type='GridDistortion', num_steps=5, distort_limit=0.05, p=0.2)
           dict(type='OpticalDistortion', distort_limit=2, shift_limit=0.5, p=0.2)]
           ,p=0.5),
0.5bce+0.5dice

lb：0.855

3.1.1、K折交叉验证

这个trick应该是一个kaggle比赛必涨点的trick了，所以我这个比赛也直接用了这个trick。关于原理不理解的可以看下这篇博文：【Kaggle比赛常用trick】K折交叉验证、TTA。

不过这个比赛比较特殊，我是这样用的：

# 划分为CFG.n_fold折，打乱数据集顺序进行训练
skf = StratifiedGroupKFold(n_splits=CFG.n_fold, shuffle=True, random_state=CFG.seed)
# 先按病例分group, 保证每一个病例的所有图片只在一折上，防止出现同一病例的图片既在训练集又在验证集上 
# 再在group的基础上按照empty进行分层采样，保证每一折有mask和无mask的样本尽量均衡
for fold, (train_idx, val_idx) in enumerate(skf.split(df, df['empty'], groups = df["case"])):

3.2、数据层面

3.2.1、删除错误数据

这部分我们主要是参考这个 kaggle: discussion 和 kaggle: discussion，看看大佬的发现，说实话自己不太可能一张张的检测数据，而且这个任务的数据还是 1 channel 的数据，不是很好观察，所以我就直接去 Discussion找，没想到还真有人探索这个问题，Discussion牛皮！

我把大佬们的发现总结了一下，下面这些数据都是有问题的：

mask是错的：CASE 7 –– DAY 0 
mask是错的：CASE 43 –– DAY 18  –– Day26
mask是错的：CASE 81 –– DAY 30
缺少mask：Case85 –– Day23 slices 119-124
缺少mask：Case90 –– Day29 slices 115-119
缺少mask：case133 –– Day25 slices 111-113
mask是错的：CASE 138 –– DAY 0

代码：

# 删除脏数据
from tqdm.notebook import tqdm
Case138_Day0 = [i for i in range(76,145)]
Case85_Day23 = [119,120,121,122,123,124]
Case90_Day29 = [115,116,117,118,119]
Case133_Day25 = [111,112,113]
df3 = df1.copy()
Case7 = []
Case43 = []
Case81 = []
Case85 = []
Case90 = []
Case133 = []
Case138 = []
for i,row in tqdm(df1.iterrows(), total=len(df1)):
    if row.id.rsplit("_",2)[0]=='case7_day0':
        Case7.append(i)
    elif row.id.rsplit("_",2)[0]=='case43_day18' or row.id.rsplit("_",2)[0]=='case43_day26':
        Case43.append(i)
    elif row.id.rsplit("_",2)[0]=='case81_day30':
        Case81.append(i)
    elif row.id.rsplit("_",2)[0]=='case138_day0':
        if int(row.id.rsplit("_",1)[-1]) in Case138_Day0:
            Case138.append(i)
print(len(Case7),len(Case43),len(Case138))
df1.drop(index=Case7+Case43+Case81+Case138 ,inplace=True)
df3 = df1.reset_index(drop=True)

删除前后数据对比：

-	删除前数据	删除后数据
总图片数量	38496	37851
空mask图片数量	21906	21553
有mask图片数量	16590	16298
病例数量	85	85

总共删除645张图片，有mask的292张，没mask的353张。

性能提升：lb=0.856

3.2.2、2.5D方案探索

原先的数据是单通道的数据，为了让这种单通道的数据能在2D的网络上跑起来，baseline是将每个图片复制3份，然后直接concat拼接，送入网络进行训练的。

我自己探索数据一星期左右，又看到大佬开源了对2.5D数据的探讨： UWMGI: 2.5D [Train] [PyTorch] 和 UWMGI: 2.5D [Infer] [PyTorch]

2.5D的思路：对于slice3这张训练图片而言，我不再是把slice3复制3份再concat送入网络了，而是将slice1、slice3、slice5这三种图片concat起来，再送入网络中训练，mask还是实验slice3的mask。依次增加模型的深度信息/空间上的信息。

代码：

channels=3
stride=2
for i in range(channels):
    df[f'image_path_{i:02}'] = df.groupby(['case','day'])['image_path'].shift(-i*stride).fillna(method="ffill")
df['image_paths'] = df[[f'image_path_{i:02d}' for i in range(channels)]].values.tolist()

几个细节：

测试集的格式，也是按照跟训练集一样的形式组织的，这就为我们造2.5D格式的依据创造了条件；测试集我们看不到，但是测试集也要进行构造2.5D再推理的。构造方法和train类似，直接修改csv中每条mask_path对应的img_paths的路径，把s-2和s+2的图片路径加入进来，推理的时候直接concat拼接即可。
stride=2的想法就是说，如果太相近的时间序列的图片，它的信息太相近了，不能带来太多的深度信息；太远了也不行，太远了差异性太大，会造成那次重叠信息反而效果更差（因为mask用的是中间slice的mask）。
对于所有病人的每一天（1-5）天图片数据进行2.5D化，如果s-2没有那么就复制s+2的图片，比如slice3+slice1+slice3+mask1、slice4+slice2+slice4+mask2；如果s+2没有就复制s-2的图片，比如slice142+slice144+slice142+mask144、slice141+slice143+slice141+mask143。

2.5D改造后的图片和mask：

效果提升最大，lb=0.869

对比实验：s=1 3channel、s=2 3channel、s=1 5channel

3.2.3、数据增强

看了看大佬关于数据的理解分析： Data augmentations that make sense

这个比赛的胸腔位置相对固定，肠胃分布也相对固定，所以初步分析数据增强：

水平翻转是可行的，竖着翻转是不可行的，因为数据集中整个胸腔的位置不会颠倒的；
小范围的旋转是非常正常的，但是大范围的旋转是没有意义的；
缩放是完全有意义的，因为人的胃、大肠、小肠大小是不一样的；
位移是没有意义的，几乎所有的胸腔都是位于图片的中心区域，位移了反而打乱数据的分布；
颜色变换和亮度增强也没有意义，图像就是黑白色的，亮度也差不多是一样的；

最终的实验方案：

CenterCrop  # 上下左右各裁剪5%
dict(type='RandomFlip', direction='horizental', p=0.5)
# 三种非刚性变换  描述的是对几何物体大小的改变  形变比较小的
transforms=[dict(type='ElasticTransform', alpha=1, sigma=50, alpha_affine=50, p=0.5)  # 弹性变换
           dict(type='GridDistortion', num_steps=5, distort_limit=0.05, p=0.5)  # 网格失真
           dict(type='OpticalDistortion', distort_limit=2, shift_limit=0.5, p=0.5)]  # 光学畸变
           ,p=1)

def CenterCrop(image, crop_ratio=0.9):
   height, width, channel = image.shape
   xmin, ymin, xmax, ymax = int(width  * (1 - crop_ratio) / 2), \
                            int(height * (1 - crop_ratio) / 2), \
                            int(width  * (1 + crop_ratio) / 2), \
                            int(height * (1 + crop_ratio) / 2)
   crop_image = image[ymin:ymax, xmin:xmax, ...]
   extra_info = [height, width, xmin, ymin, xmax, ymax]
   return crop_image, extra_info

实验结果：

中心裁剪是一个非常常用的一个trick，在很多比赛上都能看到它的身影。这个比赛由于胸腔几乎都是位于图片的中心区域，所以我第一个想到的trick就是中心裁剪；
水平翻转ok，竖着翻转直接掉点；
小范围旋转试了好久，10度、15度、30度都没用，可能是医学数据集它数据集真的就全是正正方方的吧，没有一点歪；
位移有可能会使胸腔区域不完整；
颜色全是黑白的没用，亮度也没用，猜测可能数据集是在同一个房间拍的，那它的亮度都是相同的，没有差异；

性能效果，lb=0.873

3.3、Loss

因为数据集当中有mask的16590张，没有mask的21906张，没有mask的图片比有mask的图片还多，而且有mask的图片当中也有一些背景区域的，所以整个数据集我认为是有正负样本不平衡问题的。所以这里尝试使用focal loss来代替bce。

最后的方案，0.5focal loss+0.5dice loss
focal loss: gamma=1.0，alpha=0.5

lb = 0.875

到此为止，单模总共最高是打到了0.875，从baseline的0.854到现在的单模0.875还是很爽的，到此，比赛也快结束了，下面是尝试模型融合部分。

3.4、模型融合

对齐单模的所有超参，我又跑了effb4、b5、b6、b7，因为我单卡3090，后面4个模型没法bs=64跑了，我就用了梯度累加的方法，把bs降到了32，每两个mini-batch更新一次梯度，具体原理下面会讲。

跑完之后发现可能是因为b6、b7的模型太大太复杂了，而我们本次的数据集真的算小了，所以可能出现过拟合了，b6、b7反而降分了。

b2	b3	b4	b5	b6	b7
0.873	0.875	0.877	0.876	0.873	0.873

最终用（b3、b4、b5三个模型）* 5折进行模型融合，代码如下：

    for _, (images, ids, h, w) in pbar:
        
        images  = images.to(CFG.device, dtype=torch.float) # [b, c, w, h]
        size = images.size()
        masks = torch.zeros((size[0], 3, size[2], size[3]), device=CFG.device, dtype=torch.float32) # [b, c, w, h]
        
        # cross validation infer 
        for sub_ckpt_path in ckpt_paths:
            model = build_model(CFG, test_flag=True)
            model.load_state_dict(torch.load(sub_ckpt_path))
            model.eval()
            y_preds = model(images) # [b, c, w, h]
            y_preds   = torch.nn.Sigmoid()(y_preds)
            # 每个channel对应位置相加
            masks += y_preds/len(ckpt_paths)
        # 最后大于0.5的保留
        masks = (masks.permute((0, 2, 3, 1))>CFG.thr).to(torch.uint8).cpu().detach().numpy() # [n, h, w, c]

说白了就是讲这15个模型全部进行前向推理，得到15个mask，然后让这15个mask进行element-wise add，再除以15，然后再进行阈值判断，如果>0.5说明属于这个类别。

lb=0.880

3.5、TTA

使用horizental进行测试增强，代码如下：

 for _, (images, ids, h, w) in pbar:
        images  = images.to(CFG.device, dtype=torch.float) # [b, c, w, h]
        size = images.size()
        masks = torch.zeros((size[0], 3, size[2], size[3]), device=CFG.device, dtype=torch.float32) # [b, c, w, h]
        
        # cross validation and TTA 
        total_ckpt_paths = len(ckpt_paths_dict) * CFG.n_fold

        for backbone_name, ckpt_paths in ckpt_paths_dict.items():
            CFG.backbone = backbone_name
            for sub_ckpt_path in ckpt_paths:
                model = build_model(CFG, test_flag=True)
                model.load_state_dict(torch.load(sub_ckpt_path))
                model.eval()
                y_preds = model(images) # [b, c, w, h]
                y_preds   = torch.nn.Sigmoid()(y_preds)
                masks += y_preds

                if CFG.tta:
                    # flips = [[-1],[-2],[-2,-1]]  # x,y,xy flips as TTA
                    flips = [[-1]]  # x flip as TTA
                    for f in flips:
                        images_f = torch.flip(images, f)
                        y_preds = model(images_f) # [b, c, w, h]
                        y_preds = torch.flip(y_preds, f)
                        y_preds   = torch.nn.Sigmoid()(y_preds)
                        masks += y_preds

        if CFG.tta:
            total_ckpt_paths = len(ckpt_paths_dict) * CFG.n_fold * 2
        else:
            total_ckpt_paths = len(ckpt_paths_dict) * CFG.n_fold
        masks /= total_ckpt_paths
        
        masks = (masks.permute((0, 2, 3, 1))>CFG.thr).to(torch.uint8).cpu().detach().numpy() # [n, h, w, c]

可以看出TTA的原理就是先对原图进行水平翻转，再送进模型，推理得到mask，再对mask进行水平翻转，然后和其他的模型一起做模型融合。最后呢我们的整个程序相当于有30个权重文件进行进行融合。

涨点了0.001，lb=0.881

3.6、训练技巧：梯度累加

原来的bs我们一直设置的64，但是effb4之后就无法使用64继续进行训练了（单张3090太伤了，只能找这种曲线救国的方法~），为了继续控制变量进行对比实验，这里我们使用梯度累加的方法。将bs变为32，但是2个batch再更新一次梯度，相当于变相的增大bs。不清楚的可以看看这篇文章：深度学习节省显存的trick之梯度累积。

具体使用方法如下：

计算损失
loss = loss / 2  # 计算当前mini-batch的loss  注意要/2 否则可能发生梯度爆炸
loss.backward()  # 反向传播计算梯度 并累加梯度

if step % 2 == 0
    optimizer.step()  # 每2个mini-batch更新一次参数
    optimizer.zero_grad()  # 梯度清零
    step+=1

注意这里是梯度进行累加，并不是累加loss。
梯度累加可能会让BN失效，但是我这里bs是从64->32，个人认为差别还是不大的，但是如果你的bs是从8->4/4->2这种，感觉还是慎用梯度累加，可能会让BN失效，效果反而变差。

3.7、不work

3.7.1、多尺度训练

因为这个数据集给了四种图片尺寸，266 x 266、360 x 310、276 x 276 、234 x 234，加上每个人的器官的大小都是不一样的，所以我认为多尺度训练可以有利于我们检测不同个体的不同大小的器官。所以探索了很久，设置224x224、256x256、288x288、320x320四种尺度随机进行多尺度训练，但是发现怎么也不涨点，反而还掉0.001-0.002，气死。

但是比赛完了之后，看到一个大佬的多尺度渐进式训练方案：使用 [224, 256], [256, 288], [288, 320],[320, 384]这四个尺度，每隔5个epoch涨一次分辨率，直到涨到[320, 384]。测试使用最大分辨率进行测试。然后他居然涨点了…

我的随机多尺度训练为什么不涨点?

3.7.2、伪标签

伪标签的思想来自于俄罗斯的第一位kaggle master。

我把我训练最好的单模去预测我删除的哪些脏数据，然后预测完再将所有的数据重新训练，相当于增大了数据量。但是发现几乎没有涨点；
还有一种伪标签，不过因为时间原因比赛到这就差不多结束了，我就没试了。这里我说下思想吧：在训练好单模去预测测试集的时候，把每个测试打出预测的label，然后存放在测试集的目录下，再对测试集和训练集一起训练一个epoch（kaggle有9个小时限制），训练完之后再对测试集进行test，得到csv，提交。这种方式，相当于就是让我们训练好的模型偷看了一下测试集。

四、其他的优秀方案

4.1、两阶段方法

因为这个比赛是有没有mask的数据，而且训练集当中没有mask的数据比有mask的数据还要多，测试集的比例并不知道，但是肯定也是有没用标注的mask的。

我的解决方案是使用focal loss代替BCE去解决它的正负样本不平衡问题。但是我看了大佬的方案后发现，有很多人都是使用两阶段的算法来更精确的解决这个问题的：

第一阶段使用yolov5对图片中的胸腔进行目标检测，如果有目标就将胸腔区域裁剪出来，然后继续进行第二阶段的分割。如果没用目标直接过下一张。训练时打了200张胸腔目标数据进行目标检测网络yolov5的训练，使用所有裁剪出来的胸腔图片进行分割训练。
第一阶段先使用一个分类网络对图片进行分类，如果有胸腔，就对这张图片进行分割，如果没有胸腔就直接过下一张。训练时使用所有数据进行分类训练，使用所有有mask的数据进行分割训练。

4.2、2.5D+3D融合

3D模型的思路后面有机会再讲吧，现在还不是很了解3D UNet模型。

3D图像分x、y、z轴，增加的z轴信息 / 空间信息 / 深度信息。

五、经验、教训

其实我们A榜是在银牌尾部的，但是最后B榜就变成铜牌区末尾了，我感觉的主要原因：

测试数据中肯定也有很多的没用mask的图片，虽然我用了focal loss，但是可以发现其实A榜其实只涨了0.002分，其实还是有很大问题的。相反几乎前10名全是使用了两阶段网络的，而且全是shape up进前10名的，所以两阶段能更彻底的解决这个数据集很多图片没用mask的问题；
模型融合，我没有使用3D的模型，后来发现几乎所有前面的大佬都融合了3D的模型，最后都涨了分，而且第一名的大佬根本就没有自己训3D模型，他直接拿了这个Discussion 开源的3D模型权重和推理文件直接融合的，涨了0.004+，然后我当时觉得我的电脑跑个unet都费劲，我就不费劲去训练模型了，然后就后悔了…，真的是第一次参加没经验，鬼知道直接拿别人的权重就涨了，唉，应该试试的，直接拿权重和推理文件融合一下又不难。

经验：

多用模型融合，多使用不同类型的模型进行融合，也许可以起到一个补充的作用；
多思考数据，少思考模型

六、最后看看牌子

没吹牛逼啊，真的第一次做分割任务，拿到铜牌了~

Reference

比赛地址: UW-Madison GI Tract Image Segmentation

比赛快速理解: Collection of My Resources/Thoughts For This Competition

数据集理解1: EDA & In Depth Mask Exploration

2.5D数据: UWMGI: 2.5D stride=2 Data

关于这个比赛数据增强的理解：Data augmentations that make sense

3D模型解决方案：[LB 0.877] A 3D solution with MONAI

Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element((1) 2401_84976182 程序员 c语言 c++学习
既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上CC++开发知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新如果你需要这些资料，可以戳这里获取#include#include#includeusingnamespacestd;boolcmp(int
LeetCode 148. 排序链表：归并排序的细节解析进击的小白菜 2025 Top100 详解 leetcode 链表算法
文章目录题目描述一、方法思路：归并排序的核心步骤二、关键实现细节：快慢指针分割链表1.快慢指针的初始化问题2.为什么选择`fast=head.next`？示例1：链表长度为偶数（`1->2->3->4`）三、完整代码实现四、复杂度分析五、总结题目描述LeetCode148题要求对链表进行排序，时间复杂度需为O(nlogn)，且空间复杂度为O(logn)。由于链表的特殊结构（无法随机访问），归并排序
前端项目架构设计要领
1.架构设计的核心目标在设计前端项目架构时，核心目标是模块化、可维护、可扩展、可测试，以及开发效率的最大化。这些目标可以通过以下几个方面来实现：组件化：将UI功能封装为可复用的组件。模块化：将业务逻辑分解为独立的模块或服务。自动化构建与部署：实现自动化构建、测试和部署流程，减少人为操作的错误。代码规范化与检查：确保团队协作时，代码风格和质量一致。2.项目目录结构设计一个清晰合理的目录结构对大型项目
精通Canvas：15款时钟特效代码实现指南烟幕缭绕
本文还有配套的精品资源，点击获取简介：HTML5的Canvas是一个用于绘制矢量图形的API，通过JavaScript实现动态效果。本项目集合了15种不同的时钟特效代码，帮助开发者通过学习绘制圆形、线条、时间更新、旋转、颜色样式设置及动画效果等概念，深化对Canvas的理解和应用。项目中的CSS文件负责时钟的样式设定，而JS文件则包含实现各种特效的逻辑，通过不同的函数或类处理时间更新和动画绘制，提
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）阿牛的药铺算法移植部署 fpga开发 verilog
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）引言：为什么这个FPGA入门路线能帮你快速上岗？本文设计了一条**"Verilog语法→工具链操作→光学项目实战→岗位技能对标"的阶梯式学习路径。不同于泛泛而谈的FPGA教程，我们聚焦光学类产品开发**核心能力（时序接口设计、图像处理算法移植、高速接口应用），通过3个递进式项目（从LED闪烁到图像边缘检测），
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
基于链家网的二手房数据采集清洗与可视化分析 Mint_Datazzh 项目 selenium 网络爬虫
个人学习内容笔记，仅供参考。项目链接：https://gitee.com/rongwu651/lianjia原文链接：基于链家网的二手房数据采集清洗与可视化分析–笔墨云烟研究内容该课题的主要目的是通过将二手房网站上的存量与已销售房源，构建一个二手房市场行情情况与房源特点的可视化平台。该平台通过HTML架构和Echarts完成可视化的搭建。因此，该课题的主要研究内容就是如何利用相关技术设计并实现这样
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
本地包解决npm error code E404 雅痞yuppie npm 前端 node.js
这个错误提示表明npm找不到名为create-vue-admin-cli的包。这是因为你开发的CLI工具还没有发布到npm官方注册表。要解决这个问题，有两种方法：方法一：使用本地开发模式测试1.确保你的CLI已正确链接到全局在你的vue-admin-cli项目根目录下执行：npmlink这会在全局环境中创建一个符号链接，指向你本地的CLI项目。2.使用本地链接的CLI创建项目直接使用命令：vue-
前端 NPM 包的依赖可视化分析工具推荐前端视界前端艺匠馆前端 npm arcgis ai
前端NPM包的依赖可视化分析工具推荐关键词：NPM、依赖管理、可视化分析、前端工程、包管理、依赖冲突、性能优化摘要：本文将深入探讨前端开发中NPM包依赖可视化分析的重要性，介绍5款主流工具的使用方法和特点，并通过实际案例展示如何利用这些工具优化项目依赖结构、解决版本冲突问题以及提升构建性能。文章将帮助开发者更好地理解和掌控项目依赖关系，提高开发效率和项目可维护性。背景介绍目的和范围本文旨在为前端开
cesium添加原生MVT矢量瓦片方案 zhu_zhu_xia cesium vue arcgis cesium webgl javascript
项目中需要基于cesium接入mvt格式的服务并支持属性拾取查询，通过一系列预研测试，最后选择cesium-mvt-imagery-provider开源插件完成，关键源码信息如下：npmicesiumcesium-mvt-imagery-provider//安装依赖包//加载图层importCesiumMVTImageryProviderfrom"cesium-mvt-imagery-provid
npm 切换 node 版本和npm的源爱敲代码的小冰 npm 前端 node.js
在开发过程中，不同项目可能需要不同版本的Node.js，同时于由XX原因，我们需要切换npm的源。这时如果需要切换node版本或者npm的源，我们可以使用以下方法。使用nvm切换Node版本1、安装npminstallnvm-g2、使用#列出所有可用版本nvmlist-remote#安装指定版本nvminstall16.15.1#使用指定版本nvmuse16.15.1#查看当前使用的版本nvmcu
EasyCwmp源码分析与接口实现详解：深入理解源码架构，掌握核心接口
EasyCwmp源码分析与接口实现详解：深入理解源码架构，掌握核心接口去发现同类优质开源项目:https://gitcode.com/在开源项目中，寻找一款能够提升开发效率、简化流程的工具是每个开发者的追求。今天，我们要介绍的这款开源项目EasyCwmp，正是为了帮助开发者深入了解源码架构，掌握核心接口实现，从而加速项目开发进程。以下是关于EasyCwmp源码分析与接口实现详解的项目推荐文章。项目
Python多版本管理与pip升级全攻略：解决冲突与高效实践码界奇点 Python python pip 开发语言 python3.11 源代码管理虚拟现实依赖倒置原则
引言Python作为最流行的编程语言之一，其版本迭代速度与生态碎片化给开发者带来了巨大挑战。据统计，超过60%的Python开发者需要同时维护基于Python3.6+和Python2.7的项目。本文将系统解决以下核心痛点：如何安全地在同一台机器上管理多个Python版本pip依赖冲突的根治方案符合PEP标准的生产环境最佳实践第一部分：Python多版本管理核心方案1.1系统级多版本共存方案Wind
react-native android 环境搭建
环境：macjava版本：Java11最重要：一定要一定要一定要react涉及到很多的依赖下载，gradle和react相关的，第一次安装环境时有外网环境会快速很多。安装nodejs安装react-nativenpminstallreact-native-clinpminstallreact-native创建一个新项目react-nativeinitfirstReact替换gradle下载源rep
RocketMQ 核心特性实战详解愤怒的代码 RocketMQ实战 rocketmq
RocketMQ核心特性实战详解本文基于RocketMQ4.x+rocketmq-spring-boot-starter2.3.1，从零搭建，逐步讲解RocketMQ11大核心特性，每一段代码都能直接跑。0.项目环境准备依赖引入在pom.xml文件添加：org.apache.rocketmqrocketmq-spring-boot-starter2.3.1配置文件application.ymlse
Java 调用 HTTP 接口的 7 种方式：全网最全指南
Java调用HTTP接口的7种方式：全网最全指南在开发过程中，调用HTTP接口是最常见的需求之一。本文将详细介绍Java中7种主流的调用HTTP接口的方式，包括每种工具的优缺点和完整代码实现。1.使用RestTemplateRestTemplate是Spring提供的同步HTTP客户端，适用于传统项目。尽管从Spring5开始被标记为过时，它仍然是许多开发者的首选。示例代码importorg.sp
无面试无offer? 你需要AI 求职co-pilot的帮助!
大家好啊，我写的开源免费求职AIco-pilot工具发布了v3.0.0，欢迎大家参与、使用!https://github.com/weicanie/prisma-ai一、项目介绍开源免费的求职co-pilot，自动化简历准备至offer到手的整个流程。优化您的项目、定制您的简历、为您匹配工作，并帮助您做好面试准备。二、核心价值prisma-ai旨在解决求职者在准备简历和寻找工作时最头疼的3个问题:
反光衣识别漏检率 30%？陌讯多尺度模型实测优化
在建筑工地、交通指挥等场景中，反光衣是保障作业人员安全的重要装备，对其进行精准识别是智能监控系统的核心功能之一。但传统视觉算法在实际应用中却屡屡碰壁：强光下反光衣易与背景混淆、远距离小目标漏检率高达30%、复杂场景下模型泛化能力不足[实测数据来源：某智慧工地项目2024年Q1日志]。这些问题直接导致安全监控系统预警滞后，给安全生产埋下隐患。一、技术解析：反光衣识别的核心难点与陌讯算法创新反光衣识别
Java设计模式实战：高频场景解析与避坑指南 mckim_ 笔记学习 java 设计模式
引言设计模式是软件开发的基石，但许多开发者面对23种模式时容易陷入“学完就忘”或“滥用模式”的困境。本文从工业级项目视角出发，精选10种高频设计模式，结合真实代码案例与主流框架应用，帮你建立模式思维，拒绝纸上谈兵。一、创建型模式：告别new的暴力美学1.工厂方法模式（FactoryMethod）核心痛点：对象创建逻辑散落各处，难以统一管理。场景案例：电商平台需要支持多种支付方式（支付宝、微信、银联
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
android中百度定位、城市选择列表，右侧字母展示
好久好久没光顾过自己空空的博客了，做项目的时候都是逛着别人的博客急着把功能实现，近来闲下来了总结总结。这个城市选择功能也是当时做项目急着实现从哪找来的框架不记得了，然后改改用到项目中来的。非常感谢提供最初源码的博主，主要的区别是添加了搜索功能、定位功能，把以前的操作本地数据库sqlite的部分，改为操作对assest文件的操作，封装的有百度地图定位方法、可删除的edittext。百度地图的key需
Ubuntu基础（Python虚拟环境和Vue） aaiier ubuntu python linux
Python虚拟环境sudoaptinstallpython3python3-venv进入项目目录cdXXX创建虚拟环境python3-mvenvvenv激活虚拟环境sourcevenv/bin/activate退出虚拟环境deactivateVue安装Node.js和npm#安装Node.js和npm（Ubuntu默认仓库可能版本较旧，适合入门）sudoaptinstallnodejsnpm#验
GoView 强势入驻 GitCode：拖拽低代码，打造高颜值数据大屏 GitCode 代码君 gitcode 低代码开源
信息可视化时代，数字大屏日益成为展示核心KPI、运营状态、监控预警的主流形式。然而，用传统方式开发一个定制化数字大屏需要解决多少问题？1.繁复的数据源集成，各种不同的协议和格式……2.让人晕头转向的可视化逻辑，调动艰难的样式、布局、动画，和往往难以统一的风格3.牵一发而动全身的代码结构，就想换个主题色结果开启的全局CSS大冒险……现在，一个开源项目即可搞定上述问题——拖拽式低代码数字可视化平台Go
为Layui Table组件添加前端搜索功能 caifox菜狐狸 JavaScript 学习之旅：从新手到专家前端 layui javascript table 前端搜索表格搜索前端框架
在现代Web开发中，数据展示和交互功能是构建高效、用户友好界面的关键要素之一。Layui作为一款广受欢迎的前端UI框架，以其简洁的代码、丰富的组件和强大的功能，为开发者提供了极大的便利。其中，Layui的Table组件更是以其强大的数据展示能力和灵活的配置选项，成为了许多项目中不可或缺的部分。然而，在实际应用中，仅仅展示数据往往是不够的。用户通常需要根据自己的需求快速查找特定信息，这就需要为表格添
JVM与Spring Boot核心解析 AIHacksCash Java场景面试宝典 Java JVM Spring Boot
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
java封装继承多态等麦田的设计者 java eclipse jvm c encapsulatopn
最近一段时间看了很多的视频却忘记总结了，现在只能想到什么写什么了，希望能起到一个回忆巩固的作用。 1、final关键字译为：最终的 &
F5与集群的区别 bijian1013 weblogic 集群 F5
http请求配置不是通过集群，而是F5；集群是weblogic容器的，如果是ejb接口是通过集群。 F5同集群的差别，主要还是会话复制的问题，F5一把是分发http请求用的，因为http都是无状态的服务，无需关注会话问题，类似
LeetCode[Math] - #7 Reverse Integer Cwind java 题解 Math LeetCode Algorithm
原题链接：#7 Reverse Integer 要求：按位反转输入的数字例1：输入 x = 123, 返回 321 例2：输入 x = -123, 返回 -321 难度：简单分析：对于一般情况，首先保存输入数字的符号，然后每次取输入的末位（x%10）作为输出的高位（result = result*10 + x%10）即可。但
BufferedOutputStream 周凡杨
首先说一下这个大批量，是指有上千万的数据量。例子：有一张短信历史表，其数据有上千万条数据，要进行数据备份到文本文件，就是执行如下SQL然后将结果集写入到文件中！ select t.msisd
linux下模拟按键输入和鼠标被触发 linux
查看/dev/input/eventX是什么类型的事件， cat /proc/bus/input/devices 设备有着自己特殊的按键键码，我需要将一些标准的按键，比如0－9，X－Z等模拟成标准按键，比如KEY_0,KEY-Z等，所以需要用到按键模拟，具体方法就是操作/dev/input/event1文件，向它写入个input_event结构体就可以模拟按键的输入了。 linux/in
ContentProvider初体验肆无忌惮_ ContentProvider
ContentProvider在安卓开发中非常重要。与Activity，Service，BroadcastReceiver并称安卓组件四大天王。在android中的作用是用来对外共享数据。因为安卓程序的数据库文件存放在data/data/packagename里面，这里面的文件默认都是私有的，别的程序无法访问。如果QQ游戏想访问手机QQ的帐号信息一键登录，那么就需要使用内容提供者COnte
关于Spring MVC项目（maven）中通过fileupload上传文件 843977358 mybatis spring mvc 修改头像上传文件 upload
Spring MVC 中通过fileupload上传文件，其中项目使用maven管理。 1.上传文件首先需要的是导入相关支持jar包：commons-fileupload.jar,commons-io.jar 因为我是用的maven管理项目，所以要在pom文件中配置（每个人的jar包位置根据实际情况定） <!-- 文件上传 start by zhangyd-c --&g
使用svnkit api，纯java操作svn，实现svn提交，更新等操作 aigo svnkit
原文：http://blog.csdn.net/hardwin/article/details/7963318 import java.io.File; import org.apache.log4j.Logger; import org.tmatesoft.svn.core.SVNCommitInfo; import org.tmateso
对比浏览器，casperjs，httpclient的Header信息 alleni123 爬虫 crawler header
@Override protected void doGet(HttpServletRequest req, HttpServletResponse res) throws ServletException, IOException { String type=req.getParameter("type"); Enumeration es=re
java.io操作 DataInputStream和DataOutputStream基本数据流百合不是茶 java 流
1，java中如果不保存整个对象，只保存类中的属性，那么我们可以使用本篇文章中的方法，如果要保存整个对象先将类实例化后面的文章将详细写到 2，DataInputStream 是java.io包中一个数据输入流允许应用程序以与机器无关方式从底层输入流中读取基本 Java 数据类型。应用程序可以使用数据输出流写入稍后由数据输入流读取的数据。
车辆保险理赔案例 bijian1013 车险
理赔案例：一货运车，运输公司为车辆购买了机动车商业险和交强险，也买了安全生产责任险，运输一车烟花爆竹，在行驶途中发生爆炸，出现车毁、货损、司机亡、炸死一路人、炸毁一间民宅等惨剧，针对这几种情况，该如何赔付。赔付建议和方案：客户所买交强险在这里不起作用，因为交强险的赔付前提是：“机动车发生道路交通意外事故”；如果是交通意外事故引发的爆炸，则优先适用交强险条款进行赔付，不足的部分由商业
学习Spring必学的Java基础知识(5)—注解 bijian1013 java spring
文章来源：http://www.iteye.com/topic/1123823，整理在我的博客有两个目的：一个是原文确实很不错，通俗易懂，督促自已将博主的这一系列关于Spring文章都学完；另一个原因是为免原文被博主删除，在此记录，方便以后查找阅读。有必要对
【Struts2一】Struts2 Hello World bit1129 Hello world
Struts2 Hello World应用的基本步骤创建Struts2的Hello World应用，包括如下几步： 1.配置web.xml 2.创建Action 3.创建struts.xml，配置Action 4.启动web server，通过浏览器访问配置web.xml <?xml version="1.0" encoding="
【Avro二】Avro RPC框架 bit1129 rpc
1. Avro RPC简介 1.1. RPC RPC逻辑上分为二层，一是传输层，负责网络通信；二是协议层，将数据按照一定协议格式打包和解包从序列化方式来看，Apache Thrift 和Google的Protocol Buffers和Avro应该是属于同一个级别的框架，都能跨语言，性能优秀，数据精简，但是Avro的动态模式（不用生成代码，而且性能很好）这个特点让人非常喜欢，比较适合R
lua　set get cookie ronin47 lua cookie
lua: local access_token = ngx.var.cookie_SGAccessToken if access_token then ngx.header["Set-Cookie"] = "SGAccessToken="..access_token.."; path=/;Max-Age=3000" end
java-打印不大于N的质数 bylijinnan java
public class PrimeNumber { /** * 寻找不大于N的质数 */ public static void main(String[] args) { int n=100; PrimeNumber pn=new PrimeNumber(); pn.printPrimeNumber(n); System.out.print
Spring源码学习-PropertyPlaceholderHelper bylijinnan java spring
今天在看Spring 3.0.0.RELEASE的源码，发现PropertyPlaceholderHelper的一个bug 当时觉得奇怪，上网一搜，果然是个bug，不过早就有人发现了，且已经修复：详见： http://forum.spring.io/forum/spring-projects/container/88107-propertyplaceholderhelper-bug
[逻辑与拓扑]布尔逻辑与拓扑结构的结合会产生什么? comsci 拓扑
如果我们已经在一个工作流的节点中嵌入了可以进行逻辑推理的代码,那么成百上千个这样的节点如果组成一个拓扑网络,而这个网络是可以自动遍历的,非线性的拓扑计算模型和节点内部的布尔逻辑处理的结合,会产生什么样的结果呢? 是否可以形成一种新的模糊语言识别和处理模型呢? 大家有兴趣可以试试,用软件搞这些有个好处,就是花钱比较少,就算不成
ITEYE 都换百度推广了 cuisuqiang Google AdSense 百度推广广告外快
以前ITEYE的广告都是谷歌的Google AdSense，现在都换成百度推广了。为什么个人博客设置里面还是Google AdSense呢？都知道Google AdSense不好申请，这在ITEYE上也不是讨论了一两天了，强烈建议ITEYE换掉Google AdSense。至少，用一个好申请的吧。什么时候能从ITEYE上来点外快，哪怕少点
新浪微博技术架构分析 dalan_123 新浪微博架构
新浪微博在短短一年时间内从零发展到五千万用户，我们的基层架构也发展了几个版本。第一版就是是非常快的，我们可以非常快的实现我们的模块。我们看一下技术特点，微博这个产品从架构上来分析，它需要解决的是发表和订阅的问题。我们第一版采用的是推的消息模式，假如说我们一个明星用户他有10万个粉丝，那就是说用户发表一条微博的时候，我们把这个微博消息攒成10万份，这样就是很简单了，第一版的架构实际上就是这两行字。第
玩转ARP攻击 dcj3sjt126com r
我写这片文章只是想让你明白深刻理解某一协议的好处。高手免看。如果有人利用这片文章所做的一切事情，盖不负责。网上关于ARP的资料已经很多了，就不用我都说了。用某一位高手的话来说，“我们能做的事情很多，唯一受限制的是我们的创造力和想象力”。 ARP也是如此。以下讨论的机子有一个要攻击的机子：10.5.4.178 硬件地址：52:54:4C:98
PHP编码规范 dcj3sjt126com 编码规范
一、文件格式 1. 对于只含有 php 代码的文件，我们将在文件结尾处忽略掉 "?>" 。这是为了防止多余的空格或者其它字符影响到代码。例如：<?php$foo = 'foo';2. 缩进应该能够反映出代码的逻辑结果，尽量使用四个空格，禁止使用制表符TAB，因为这样能够保证有跨客户端编程器软件的灵活性。例
linux 脱机管理（nohup） eksliang linux nohup nohup
脱机管理 nohup 转载请出自出处：http://eksliang.iteye.com/blog/2166699 nohup可以让你在脱机或者注销系统后，还能够让工作继续进行。他的语法如下 nohup [命令与参数] --在终端机前台工作 nohup [命令与参数] & --在终端机后台工作但是这个命令需要注意的是，nohup并不支持bash的内置命令，所
BusinessObjects Enterprise Java SDK greemranqq java BO SAP Crystal Reports
最近项目用到oracle_ADF 从SAP/BO 上调用水晶报表，资料比较少，我做一个简单的分享，给和我一样的新手提供更多的便利。首先，我是尝试用JAVA JSP 去访问的。官方API：http://devlibrary.businessobjects.com/BusinessObjectsxi/en/en/BOE_SDK/boesdk_ja
系统负载剧变下的管控策略 iamzhongyong 高并发
假如目前的系统有100台机器，能够支撑每天1亿的点击量（这个就简单比喻一下），然后系统流量剧变了要，我如何应对，系统有那些策略可以处理，这里总结了一下之前的一些做法。 1、水平扩展这个最容易理解，加机器，这样的话对于系统刚刚开始的伸缩性设计要求比较高，能够非常灵活的添加机器，来应对流量的变化。 2、系统分组假如系统服务的业务不同，有优先级高的，有优先级低的，那就让不同的业务调用提前分组
BitTorrent DHT 协议中文翻译 justjavac bit
前言做了一个磁力链接和BT种子的搜索引擎 {Magnet & Torrent}，因此把 DHT 协议重新看了一遍。 BEP: 5Title: DHT ProtocolVersion: 3dec52cb3ae103ce22358e3894b31cad47a6f22bLast-Modified: Tue Apr 2 16:51:45 2013 -070
Ubuntu下Java环境的搭建 macroli java 工作 ubuntu
配置命令：　　$sudo apt-get install ubuntu-restricted-extras 　　再运行如下命令：　　$sudo apt-get install sun-java6-jdk 　　待安装完毕后选择默认Java. 　　$sudo update- alternatives --config java 　　安装过程提示选择，输入“2”即可，然后按回车键确定。
js字符串转日期（兼容IE所有版本） qiaolevip TO Date String IE
/** * 字符串转时间（yyyy-MM-dd HH:mm:ss） * result （分钟） */ stringToDate : function(fDate){ var fullDate = fDate.split(" ")[0].split("-"); var fullTime = fDate.split("
【数据挖掘学习】关联规则算法Apriori的学习与SQL简单实现购物篮分析 superlxw1234 sql 数据挖掘关联规则
关联规则挖掘用于寻找给定数据集中项之间的有趣的关联或相关关系。关联规则揭示了数据项间的未知的依赖关系，根据所挖掘的关联关系，可以从一个数据对象的信息来推断另一个数据对象的信息。例如购物篮分析。牛奶 ⇒ 面包 [支持度：3%，置信度：40%] 支持度3%：意味3%顾客同时购买牛奶和面包。置信度40%：意味购买牛奶的顾客40%也购买面包。规则的支持度和置信度是两个规则兴
Spring 5.0 的系统需求，期待你的反馈 wiselyman spring
Spring 5.0将在2016年发布。Spring5.0将支持JDK 9。 Spring 5.0的特性计划还在工作中，请保持关注，所以作者希望从使用者得到关于Spring 5.0系统需求方面的反馈。