X_Student737

YOLOv3_目标检测

YOLOv1最初是由Joseph Redmon实现的，和大型NLP transformers不同，YOLOv1设计的很小，可为设备上的部署提供实时检测速度。

YOLO-9000是Joseph Redmon实现的第二个版本YOLOv2目标检测器，它对YOLOv1做了很多技巧上的改进，并强调该检测器能够推广到检测世界上的任何物体。

YOLOv3对YOLOv2做了进一步的改进，引入多尺度特征融合，针对不同网格尺寸并行处理，大大提升了不同尺寸目标的检测精度。

文章目录

YOLOv3_目标检测
一、VOC2007数据集
二、先验框Anchors聚类
三、数据结构编码
四、Bounding Box变换
五、Loss损失函数
六、YOLOv3网络结构
七、训练过程
八、实验结果
九、深入思考
十、源码
十一、项目链接

一、VOC2007数据集

本次实验我采用的是VOC2007数据集。

我只选用了其中的JEPGImages、Annotations两个文件夹。JEPGImages文件夹含有9963张RGB图片，总共20个类别，Annotations文件夹含有9963个xml文件，分别记录了每张图片中目标物体的类别与信息。

class_dictionary = {'aeroplane': 0, 'bicycle': 1, 'bird': 2, 'boat': 3, 'bottle': 4, 'bus': 5,
                    'car': 6, 'cat': 7, 'chair': 8, 'cow': 9, 'diningtable': 10, 'dog': 11,
                    'horse': 12, 'motorbike': 13, 'person': 14, 'pottedplant': 15, 'sheep': 16,
                    'sofa': 17, 'train': 18, 'tvmonitor': 19}

二、先验框Anchors聚类

在基于anchor的目标检测网络中，一个至关重要的步骤就是科学的设置anchor，可以说anchor设置的合理与否，极大的影响着检测模型最终性能的好坏。

anchor到底是什么？如果用一句话概括，就是在图像上预设好的不同大小、不同长宽比的参照框。如果我们想要去检测某个目标物体，很容易可以想到，该目标物体的长宽比大致是固定的，比如说想要检测人脸，人脸的长宽比会近似在1:1.5。如果我们往模型里预先加入这个先验知识，网络就不必再大费力气重头学起，可以轻松舍弃掉一些不合理的学习结果，模型学习起来更加简单，检测效果自然会更好。

假设有一张416x416大小的图片，经过卷积上采样，得到13x13、26x26、52x52大小的特征图。我们在这三个特征图的每个点都设置三个不同大小的anchor。第一个13 x 13的特征图上设置了13 x 13 x 3 = 507个anchor，尺寸分别是：[179 265]、[303 170]、[371 318]。第二个26 x 26的特征图上设置了26 x 26 x 3 = 2028个anchor，尺寸分别是：[69 52]、[100 196]、[149 112]。第三个52 x 52的特征图上设置了52 x 52 x 3 = 8112个anchor，尺寸分别是：[25 35]、[34 77]、[64 112]。

这9个anchor尺寸是利用k_means算法聚类得到的。

从8000张训练数据集图片中取出所有bounding box，可以得到19670个box，其记录着每个目标物体的w和h。我们对这个二维数据集进行k_means聚类，得到9个聚类中心，并按w和h的大小依次排序，后续在YOLOv3模型中用来设置anchor。

三、数据结构编码

在read_data_path.py文件中，read_image_path()函数用来读取存储图片的绝对路径，read_coordinate_txt()函数用来读取目标物体的位置、种类，都以字符串的形式记录。整个数据集划分成三部分：8000个训练样本、1000个验证样本、963个测试样本。

train_x : （8000，），列表形式
train_y : （8000，），列表形式
val_x : （1000，），列表形式
val_y : （1000，），列表形式
test_x :（963，），列表形式
test_y :（963，），列表形式

在train.py文件中，data_encoding()函数对数据结构进行第一次编码。对于一个batch的train_x，先用opencv读取图片，再像素值除以255归一化，最后resize到(416, 416)尺寸。对于一个batch的train_y，首先将x1、y1、x2、y2转化为center_x、center_y、w、h，然后将center_x、center_y、w、h除以图片长和宽，转化成占整张图片的比例，最后针对每个目标物体的边框，根据IOU计算出最近似的那个anchor，将坐标值存储在那个位置，其他位置全部置0，得到(batch, 13, 13, 3, 25)、(batch, 26, 26, 3, 25)、(batch, 52, 52, 3, 25)的数据结构。

在这里，center_x_ratio、center_y_ratio记录的是占整张图片的比例，而不是针对于每个grid的比例。这一点还需要后续再处理，因为YOLOv3有三种不同尺寸的grid，不适合在这里立马就转换好，最好放在loss函数中用for循环分三种情况分别处理。

在yolov3_loss.py文件中，yolo_loss()函数对数据结构进行第二次编码。对(batch, 13, 13, 3, 25)、(batch, 26, 26, 3, 25)、(batch, 52, 52, 3, 25)的y_true再做处理。针对(13, 13)、(26, 26)、(52, 52)三种的网格，center_x_ratio、center_y_ratio转化成相对于不同小格子的偏移，w_ratio、h_ratio要转化为相对于anchor长宽的偏移。

四、Bounding Box变换

首先必须想明白一个问题：YOLOv3卷积网络最终输出的结果，到底是在拟合什么？

YOLOv1网络最终输出的结果，其实就是目标物体位置的直接刻画；VGG网络最终输出的结果，其实就是分类结果的直接刻画。但YOLOv3完全不同，它借助残差网络的思想，网络学习的不是目标物体位置的直接刻画，而是目标物体位置的残差，这一点可以在解码函数中完全体现出来。

YOLOv3借用了bounding box回归的思想。对真实数据y进行bounding box变换后，拟合起来会更简单，网络学习效果更好。

对于真实y_true：xy要转化成相对于每个小格子的比例，wh要除以最接近的anchor的长宽再取ln，confidence、class不做处理。

对于网络最终输出结果y_pre：xy、confidence、class进行sigmid变换，wh不做处理，此时它们就可以作为真实数据bounding box变换后的数值拟合。

五、Loss损失函数

进行bounding box变换后的y_true，与进行sigmoid变换后的y_pre计算损失。代码中y_pre的xy、confidence、class的sigmoid变换，隐藏在k.binary_crossentropy函数的from_logits=True中。

xy、confidence、class采用二项交叉熵损失，wh采用均方误差损失。

六、YOLOv3网络结构

YOLOv3网络主要由两部分构成：第一部分是Darknet_53特征提取网络，第二部分是FPN多尺度特征融合网络。

Darknet_53特征提取网络：由DBL、res1、…、res8构成。DBL可作为YOLOv3网络的最小组建，由一个卷积层一个BN层一个LeakyReLu层组成。整个Darknet_53网络没有池化层和全连接层，所有下采样过程通过卷积stride = 2实现。

FPN多尺度特征融合网络：输出三个尺度的预测结果。对于Darknet_53提取到的特征，先经过一系列的卷积变换，第一个分支输出(13, 13, 75)的预测结果。然后对特征图进行上采样，与之前提取到的特征进行融合，经过一系列的卷积变换，第二个分支输出(26, 26, 75)的预测结果。最后再对特征图进行上采样，与更之前提取到的特征进行融合，经过一系列的卷积变换，第三个分支输出(52, 52, 75)的预测结果。

七、训练过程

网上下载得到yolo_weights.h5网络权重，原模型总共有252层，载入权重后将前249层网络参数冰冻起来，针对特定的数据集，只训练最后3层的网络权重。

总共训练了三天时间，每个epoch花费1.5个小时。

第一轮训练：Adam(lr=1e-3)，epoch = 10。train loss从15844.1下降到31.6，val loss从95.7下降到33.5，此时目标检测效果已经不错。

第二轮训练：sgd = optimizers.SGD(lr=1e-4, momentum=0.9)，epoch=15。
train loss从32.40下降到26.35，val loss从31.03下降到28.37，此时训练已经达到瓶颈，损失函数很难再降下去。

第三轮训练：sgd = optimizers.SGD(lr=1e-8, momentum=0.9)，epoch = 10。
我将学习率调整到一个非常低的水平，期望损失函数能缓慢下降，但结果不尽如人意，train loss和val loss均达到瓶颈，无法再进一步降低了。

八、实验结果

从测试集中随意选取10张图片，检测结果如下：

可以看出，YOLOv3的目标检测效果的确比YOLOv1好太多，在引入anchor机制之后，网络学习出来的边框长宽更加精确，检测效果更好。

九、深入思考

Ques1：YOLOv2对YOLOv1做了哪些改进？

YOLOv2的论文全名为YOLO9000: Better, Faster, Stronger，它斩获了CVPR 2017 Best Paper Honorable Mention。这篇文章包含了两个模型：YOLOv2和YOLO9000，二者的主体结构是一致的，只是YOLO9000采用了一种混合训练的方式，号称能实现9000个类别的目标检测，所以作者给它取名为YOLO9000。

YOLOv2是在YOLOv1的基础上改进得来的，模型主体思路没什么变化，主要是引入了很多cv领域的trick，这些trick大幅提高了目标检测精度。

（1）引入BN层。Batch Normalization可以提升模型收敛速度，而且可以起到一定的正则化效果，降低模型的过拟合。YOLOv2的每个卷积层后面都添加了BN层，使用BN层后，YOLOv2的mAP提升了2.4%。

（2）Anchor Boxes。YOLOv1采用全连接层直接对边框进行预测，边框的宽与高是相对整张图片大小的，由于各个图片中存在不同尺度的物体，训练过程中学习不同物体的形状非常困难，这也导致了YOLOv1在精确定位方面表现较差。YOLOv2借鉴了RPN网络的先验框策略，使得模型更容易学习。使用Anchor boxes之后，YOLOv2的召回率由原来的81%提升至88%。

（3）Dimension Clusters。在Faster RCNN、SSD中，先验框的长宽都是手动设定的，带有一定的主观性，而如果选取的先验框长宽比较合适，模型会更容易学习。YOLOv2利用k-means算法对训练集的边界框做了聚类分析。

（4）Darknet-19特征提取器。YOLOv2采用了一个新的特征提取器Darknet-19，包括19个卷积层和5个maxpooling层，而之前一直都是使用VGG16进行特征提取。

Ques2：YOLOv3对YOLOv2做了哪些改进？

YOLOv3：An Incremental Improvement，按照原文说法，这仅是他们近一年的一个工作报告，并不算一个完整的paper，只是把其它论文的一些工作在YOLO上尝试了一下。相比于YOLOv2，YOLOv3最大的改进包括两点：使用残差模型和采用FPN架构。

YOLOv3的特征提取器是一个包含53个卷积层的残差模型，称为Darknet-53。相比于Darknet-19特征提取器，Darknet-53采用了残差单元所以可以构建得更深。YOLOv3采用FPN实现多尺度检测，通过金字塔特征融合策略，提取得到更好的图像特征。

Ques3：深度学习网络层数构建太深会出现什么问题？

VGG卷积网络达到了19层，GoogleNet卷积网络达到了22层，但实际上算法精度并不会随着网络层数的增多而提高，网络层数过多反而会出现以下问题：计算资源的消耗、模型容易过拟合、梯度消失、梯度爆炸。

但更重要的是，随着网络层数的增加，网络会发生退化（degradation）现象：

随着网络层数的增多，训练集loss逐渐下降，然后趋于饱和，但如果再增加网络深度的话，训练集loss反而会增大。注意这并不是过拟合，因为过拟合中训练loss是一直减小的，这里训练loss莫名其妙反而变大了。

Ques4：残差网络的思想是什么，为什么能提取得到更好的特征？

当网络发生退化时，浅层网络能够达到比深层网络更好的特征提取效果，这时如果我们把浅层的特征也传递到深层，那么最终效果至少不会比浅层网络差。如果在VGG的第98层和VGG的第14层之间添加一条直接映射，网络的特征提取效果会更佳。

从信息论的角度理解，前向传输过程中随着层数的加深，Feature Map包含的图像信息会逐层减少，而残差网络直接映射的加入，保证了第l+1层的网络一定比第l层包含更多的图像信息。基于这种直接映射跨层连接的思想，残差网络应运而生。

Ques5：YOLOv3为什么能解决同一位置检测多个重叠的目标？

YOLOv1算法中图片被划分为(7, 7)的网格，每个grid只能检测该网格内一个目标物体。

YOLOv3算法引入了多尺度检测，图片具有(13, 13)、(26, 26)、(52, 52)三种网格划分。目标物体重叠情况下，虽然目标物体的位置相同，但它们的长宽尺寸往往不同。尽管此时每个grid还是只负责一个目标物体的检测，但借助三种不同尺度，YOLOv3可以实现同一位置多个重叠目标的检测。

Ques6：YOLOv3是如何融入Anchors思想的？

关于如何将Anchors思想融入模型算法中，YOLOv3和Faster RCNN处理方法完全不同。

Faster RCNN类似于RCNN的思路，先在原图上生成许许多多的anchors，把它们作为候选区域，一个一个的进行分类和回归调整。而YOLOv3完全不同，它直接在输出数据结构上融入anchors，网络最终输出的结果，就代表着针对不同anchors的位置调整情况。

Ques7：总结一下自己复现YOLOv3时代码出的BUG。

（1）训练数据y结构出错，代码无法运行。最后找到错误原因，针对训练数据y我之前设置的是(batch, 3)的结构，其中每个代表的含义是zeros(13, 13, 3, 25), zeros(26, 26, 3, 25), zeros(52, 52, 3, 25)。实际上要改成[zeros(batch, 13, 13, 3, 25), zeros(batch, 13, 13, 3, 25), zeros(batch, 13, 13, 3, 25)]的结构。

（2）训练起始阶段损失函数值巨大，50万的loss。查找后发现，训练数据结构转换中出了问题，写成了center_x / w， center_y / h，改成center_x / size[1]， center_y / size[2]后训练就正常了，起始阶段loss在15000左右。

（3）训练过程中，train loss能不断减小到几十，但val loss依然是上千之巨降低不了。之前在YOLOv1训练过程中也遇到这个问题，最后发现是权重文件加载不匹配，特征提取层未能读取到正确权重就被冰冻起来了。

我重新运行convert.py文件，转化生成yolo_weights.h5，权重文件被成功加载。

之前权重文件加载失败：

之后权重文件加载成功：

（4）最后我还发现源码逻辑上的一个BUG。

源码在生成Anchors时，是直接对图片数据集中目标物体的边框进行聚类。但在实际网络拟合中，图片被resize到(416, 416)大小，我由原边框长宽设计出来的先验信息，并没起到想要的效果。因此在生成Anchors时，应该先把图片数据集中目标物体边框长宽先缩放，让它与网络实际处理过程所拟合的数值相匹配。

十、源码

数据集读取：

import os
import xml.etree.ElementTree as ET


class_dictionary = {'aeroplane': 0, 'bicycle': 1, 'bird': 2, 'boat': 3, 'bottle': 4, 'bus': 5,
                    'car': 6, 'cat': 7, 'chair': 8, 'cow': 9, 'diningtable': 10, 'dog': 11,
                    'horse': 12, 'motorbike': 13, 'person': 14, 'pottedplant': 15, 'sheep': 16,
                    'sofa': 17, 'train': 18, 'tvmonitor': 19}
class_list = list(class_dictionary.keys())


def read_image_path():
    data_x = []
    filename = os.listdir('/home/archer/CODE/YOLOv3/JPEGImages')
    filename.sort()
    for name in filename:
        path = '/home/archer/CODE/YOLOv3/JPEGImages/' + name
        data_x.append(path)

    print('JPEGImages has been download ! ')
    return data_x


def read_coordinate_txt():
    data_y = []
    filename = os.listdir('/home/archer/CODE/YOLOv3/Annotations')
    filename.sort()
    for name in filename:
        tree = ET.parse('/home/archer/CODE/YOLOv3/Annotations/' + name)
        root = tree.getroot()

        coordinate = ''
        for obj in root.iter('object'):

            difficult = obj.find('difficult').text
            cls = obj.find('name').text
            if cls not in class_list or int(difficult) == 1:
                continue

            cls_id = class_list.index(cls)
            xml_box = obj.find('bndbox')
            x_min = int(xml_box.find('xmin').text)
            y_min = int(xml_box.find('ymin').text)
            x_max = int(xml_box.find('xmax').text)
            y_max = int(xml_box.find('ymax').text)

            loc = (str(x_min) + ',' + str(y_min) + ',' + str(x_max) + ',' + str(y_max) + ',' + str(cls_id) + '  ')
            coordinate = coordinate + loc

        data_y.append(coordinate)

    print('Object Coordinate has been download ! ')
    return data_y


def make_data():
    data_x = read_image_path()
    data_y = read_coordinate_txt()

    n = len(data_x)
    train_x = data_x[0:8000]
    train_y = data_y[0:8000]
    val_x = data_x[8000:9000]
    val_y = data_y[8000:9000]
    test_x = data_x[9000:n]
    test_y = data_y[9000:n]

    return train_x, train_y, val_x, val_y, test_x, test_y

Anchors生成：

import numpy as np
import cv2


# the anchor_iou between 19670 box and 9 clusters
def anchor_iou(boxes, clusters):
    n = boxes.shape[0]    # 19670
    k = clusters.shape[0]    # 9

    box_area = boxes[:, 0] * boxes[:, 1]    # 19670
    # repeat function : [1 1 1 2 2 2 3 3 3]
    box_area = box_area.repeat(k)    # 19670 * 9 = 177030
    box_area = np.reshape(box_area, (n, k))    # (19670, 9), every column is the box_area vector

    cluster_area = clusters[:, 0] * clusters[:, 1]    # 9
    # tile function : [1 2 3 1 2 3 1 2 3]
    cluster_area = np.tile(cluster_area, [1, n])    # 9 * 19670 = 177030
    cluster_area = np.reshape(cluster_area, (n, k))    # (19670, 9), every row is the cluster_area vector

    box_w_matrix = np.reshape(boxes[:, 0].repeat(k), (n, k))    # (19670, 9)
    cluster_w_matrix = np.reshape(np.tile(clusters[:, 0], (1, n)), (n, k))    # (19670, 9)
    min_w_matrix = np.minimum(cluster_w_matrix, box_w_matrix)    # (19670, 9)

    box_h_matrix = np.reshape(boxes[:, 1].repeat(k), (n, k))    # (19670, 9)
    cluster_h_matrix = np.reshape(np.tile(clusters[:, 1], (1, n)), (n, k))    # (19670, 9)
    min_h_matrix = np.minimum(cluster_h_matrix, box_h_matrix)    # (19670, 9)

    inter_area = np.multiply(min_w_matrix, min_h_matrix)    # (19670, 9)
    iou = inter_area / (box_area + cluster_area - inter_area)    # (19670, 9)

    return iou


def k_means(box, k):
    box_number = len(box)    # 19670
    last_nearest = np.zeros(box_number)

    # init k clusters
    np.random.seed(1)
    clusters = box[np.random.choice(box_number, k, replace=False)]
    # (9, 2)

    while True:

        # calculate the iou_distance between 19670 boxes and 9 clusters
        # distance :  (19670, 9)
        distances = 1 - anchor_iou(box, clusters)

        # calculate the mum anchor index for 19670 boxes
        # current_nearest : (19670, 1)
        current_nearest = np.argmin(distances, axis=1)

        if (last_nearest == current_nearest).all():
            break

        for num in range(k):
            clusters[num] = np.median(box[current_nearest == num], axis=0)
        last_nearest = current_nearest

    return clusters


def calculate_anchor(train_x, train_y):
    box = []

    # len(train_y) : 19670
    for i in range(len(train_y)):
        img = cv2.imread(train_x[i])
        size = img.shape

        obj_all = train_y[i].strip().split()
        for j in range(len(obj_all)):
            obj = obj_all[j].split(',')
            x1, y1, x2, y2 = [int(obj[0]), int(obj[1]), int(obj[2]), int(obj[3])]
            w = x2 - x1
            h = y2 - y1

            w = int(w / size[1] * 416)
            h = int(h / size[0] * 416)

            box.append([w, h])
    box = np.array(box)
    # box : (19670, 2)

    anchors = k_means(box, 9)
    # anchors : (9, 2)

    index = np.argsort(anchors[:, 0])
    # [0 5 6 8 2 7 4 3 1]

    anchors = anchors[index]

    # [[22  37]
    #  [26  82]
    #  [49  132]
    #  [56  57]
    #  [89  211]
    #  [113 108]
    #  [162 298]
    #  [238 177]
    #  [341 340]]

    return anchors

YOLOv3模型结构：

from functools import reduce
from keras.layers import Conv2D, Add, ZeroPadding2D, UpSampling2D, Concatenate, Input
from keras.layers.advanced_activations import LeakyReLU
from keras.layers.normalization import BatchNormalization
from keras.models import Model
from keras.regularizers import l2
from functools import wraps


def compose(*funcs):
    # Compose arbitrarily many functions, evaluated left to right.
    # Reference: https://mathieularose.com/function-composition-in-python/
    # return lambda x: reduce(lambda v, f: f(v), funcs, x)

    if funcs:
        return reduce(lambda f, g: lambda *a, **kw: g(f(*a, **kw)), funcs)
    else:
        raise ValueError('Composition of empty sequence not supported.')


@wraps(Conv2D)
def DarknetConv2D(*args, **kwargs):

    darknet_conv_kwargs = {'kernel_regularizer': l2(5e-4)}
    darknet_conv_kwargs['padding'] = 'valid' if kwargs.get('strides') == (2, 2) else 'same'
    darknet_conv_kwargs.update(kwargs)
    return Conv2D(*args, **darknet_conv_kwargs)


def DarknetConv2D_BN_Leaky(*args, **kwargs):

    no_bias_kwargs = {'use_bias': False}
    no_bias_kwargs.update(kwargs)
    return compose(
        DarknetConv2D(*args, **no_bias_kwargs),
        BatchNormalization(),
        LeakyReLU(alpha=0.1))


def resblock_body(x, num_filters, num_blocks):

    # Darknet uses left and top padding instead of 'same' mode

    x = ZeroPadding2D(((1, 0), (1, 0)))(x)
    x = DarknetConv2D_BN_Leaky(num_filters, (3, 3), strides=(2, 2))(x)
    for i in range(num_blocks):
        y = compose(
                DarknetConv2D_BN_Leaky(num_filters//2, (1, 1)),
                DarknetConv2D_BN_Leaky(num_filters, (3, 3)))(x)
        x = Add()([x, y])
    return x


def darknet_body(x):

    x = DarknetConv2D_BN_Leaky(32, (3, 3))(x)
    x = resblock_body(x, 64, 1)
    x = resblock_body(x, 128, 2)
    x = resblock_body(x, 256, 8)
    x = resblock_body(x, 512, 8)
    x = resblock_body(x, 1024, 4)
    return x


def make_last_layers(x, num_filters, out_filters):

    x = compose(
            DarknetConv2D_BN_Leaky(num_filters, (1, 1)),
            DarknetConv2D_BN_Leaky(num_filters*2, (3, 3)),
            DarknetConv2D_BN_Leaky(num_filters, (1, 1)),
            DarknetConv2D_BN_Leaky(num_filters*2, (3, 3)),
            DarknetConv2D_BN_Leaky(num_filters, (1, 1)))(x)
    y = compose(
            DarknetConv2D_BN_Leaky(num_filters*2, (3, 3)),
            DarknetConv2D(out_filters, (1, 1)))(x)
    return x, y


def create_yolo_model():

    # Create YOLO_V3 model CNN body in Keras

    inputs = Input((416, 416, 3))
    darknet = Model(inputs, darknet_body(inputs))
    # darknet.summary()
    x, y1 = make_last_layers(darknet.output, 512, 75)

    x = compose(DarknetConv2D_BN_Leaky(256, (1, 1)), UpSampling2D(2))(x)
    x = Concatenate()([x, darknet.layers[152].output])
    x, y2 = make_last_layers(x, 256, 75)

    x = compose(DarknetConv2D_BN_Leaky(128, (1, 1)), UpSampling2D(2))(x)
    x = Concatenate()([x, darknet.layers[92].output])
    x, y3 = make_last_layers(x, 128, 75)

    yolo3_model = Model(inputs, [y1, y2, y3])
    yolo3_model.summary()

    return yolo3_model

损失函数：

from keras import backend as k
import numpy as np


with open("yolo_anchors.txt", "r") as f:
    string = f.read().strip().split(',')
anchors = [int(s) for s in string]
anchors = np.reshape(anchors, (9, 2))


def yolo_head(y_pre_part):

    # y_pre_part : Tensor, shape=(batch, 13, 13, 75), float32

    grid_shape = k.shape(y_pre_part)[1:3]
    # Tensor, shape=(2, ), [13 13]

    grid_y = k.tile(k.reshape(k.arange(0, stop=grid_shape[0]), [-1, 1, 1, 1]), [1, grid_shape[1], 1, 1])
    # Tensor, shape=(13, 13, 1, 1), int32
    grid_x = k.tile(k.reshape(k.arange(0, stop=grid_shape[1]), [1, -1, 1, 1]), [grid_shape[0], 1, 1, 1])
    # Tensor, shape=(13, 13, 1, 1), int32
    grid = k.concatenate([grid_x, grid_y])
    # Tensor, shape=(13, 13, 1, 2), int32
    grid = k.cast(grid, k.dtype(y_pre_part))
    # Tensor, shape=(13, 13, 1, 2), float32

    return grid


def yolo_loss(args):

    y_pre = args[:3]
    y_true = args[3:]
    # y_pre :  [ Tensor (batch, 13, 13, 75) , Tensor (batch, 26, 26, 75) , Tensor (batch, 52, 52, 75) ]
    # y_true : [ Tensor (batch, 13, 13, 3, 25) , Tensor (batch, 26, 26, 3, 25) , Tensor (batch, 52, 52, 3, 25) ]

    # little grid predict large bounding box and
    # large grid predict little bounding box
    anchor_mask = [[6, 7, 8], [3, 4, 5], [0, 1, 2]]

    input_shape = k.shape(y_pre[0])[1:3] * 32
    input_shape = k.cast(input_shape, k.dtype(y_true[0]))
    # [13, 13] * 32 = [416, 416] - tensor, float

    grid_shapes = [k.cast(k.shape(y_pre[l])[1:3], k.dtype(y_true[0])) for l in range(3)]
    # [[13, 13]-tensor, [26, 26]-tensor, [52, 52]-tensor]

    loss = 0
    m = k.cast(k.shape(y_pre[0])[0], k.dtype(y_pre[0]))    # batch size, tensor-32, float

    for l in range(3):
        # y_pre[l] : shape=(batch, ?, ?, 75), float32
        # single_y_pre : shape=(batch, ?, ?, 3, 25), float32
        # grid : shape=(?, ?, 1, 2), float32

        grid_shape = k.shape(y_pre[l])[1:3]    # Tensor, shape=(2, ), [13, 13] or [26, 26] or [52, 52]
        single_y_pre = k.reshape(y_pre[l], [-1, grid_shape[0], grid_shape[1], 3, 25])
        # Tensor, shape=(batch, ?, ?, 3, 25), float32
        grid = yolo_head(y_pre[l])
        # Tensor, shape=(?, ?, 1, 2), float32

        # calculate the y_true_confidence, y_true_class, y_true_xy, y_true_wh---------------------------------------

        y_true_confidence = y_true[l][..., 4:5]    # Tensor, (batch, 13, 13, 3, 1), float32
        object_mask = y_true_confidence

        y_true_class = y_true[l][..., 5:]    # Tensor, (batch, 13, 13, 3, 20), float32

        y_true_xy = y_true[l][..., :2]*grid_shapes[l][::-1] - grid    # Tensor, shape=(batch, 13, 13, 3, 2), float32

        y_true_wh = k.log(y_true[l][..., 2:4] / anchors[anchor_mask[l]] * input_shape[::-1])
        y_true_wh = k.switch(object_mask, y_true_wh, k.zeros_like(y_true_wh))
        # avoid log(0)=-inf
        # Tensor, shape=(batch, 13, 13, 3, 2), float32

        box_loss_scale = 2 - y_true[l][..., 2:3] * y_true[l][..., 3:4]
        # Tensor, shape=(batch, 13, 13, 3, 1), float32

        # calculate the y_pre_confidence, y_pre_class, y_pre_xy, y_pre_wh-----------------------------------------

        y_pre_confidence = single_y_pre[..., 4:5]
        # Tensor, shape=(batch, 13, 13, 3, 1), float32
        y_pre_class = single_y_pre[..., 5:]
        # Tensor, shape=(batch, 13, 13, 3, 20), float32
        y_pre_xy = single_y_pre[..., 0:2]
        # Tensor, shape=(batch, 13, 13, 3, 2), float32
        y_pre_wh = single_y_pre[..., 2:4]
        # Tensor, shape=(batch, 13, 13, 3, 2), float32

        # calculate the sum loss ---------------------------------------------------------------------------------

        xy_loss = object_mask * box_loss_scale * k.binary_crossentropy(y_true_xy, y_pre_xy, from_logits=True)
        wh_loss = object_mask * box_loss_scale * 0.5 * k.square(y_true_wh - y_pre_wh)

        confidence_loss1 = object_mask * k.binary_crossentropy(y_true_confidence, y_pre_confidence, from_logits=True)
        confidence_loss2 = (1-object_mask) * k.binary_crossentropy(y_true_confidence, y_pre_confidence, from_logits=True)
        confidence_loss = confidence_loss1 + confidence_loss2

        class_loss = object_mask * k.binary_crossentropy(y_true_class, y_pre_class, from_logits=True)

        xy_loss = k.sum(xy_loss) / m
        wh_loss = k.sum(wh_loss) / m
        confidence_loss = k.sum(confidence_loss) / m
        class_loss = k.sum(class_loss) / m
        loss += xy_loss + wh_loss + confidence_loss + class_loss

    return loss

训练函数：

import numpy as np
from keras.models import load_model
import cv2
import yolov3_model
from yolov3_loss import yolo_loss
from keras.utils import Sequence
import math
from keras.callbacks import ModelCheckpoint
from keras import optimizers
from keras.models import Model
from keras.layers import Input, Lambda
from keras.optimizers import Adam


with open("yolo_anchors.txt", "r") as f:
    string = f.read().strip().split(',')
anchors = [int(s) for s in string]
anchors = np.reshape(anchors, (9, 2))

# [[22  37]
#  [26  82]
#  [49  132]
#  [56  57]
#  [89  211]
#  [113 108]
#  [162 298]
#  [238 177]
#  [341 340]]


def max_iou_index(w, h):

    # (w, h) : 253 177
    box_area = np.array([w * h]).repeat(9)
    # box_area : [44781 44781 44781 44781 44781 44781 44781 44781 44781]
    anchor_area = anchors[:, 0] * anchors[:, 1]
    # anchor_area : [875 2618 7168 3588 19600 16688 47435 51510 117978]

    anchor_w_matrix = anchors[:, 0]
    # anchor_w_matrix : [25 34 64 69 100 149 179 303 371]
    min_w_matrix = np.minimum(anchor_w_matrix, w)
    # min_w_matrix : [25 34 64 69 100 149 179 253 253]

    anchor_h_matrix = anchors[:, 1]
    # anchor_h_matrix : [35 77 112 52 196 112 265 170 318]
    min_h_matrix = np.minimum(anchor_h_matrix, h)
    # min_h_matrix : [35 77 112 52 177 112 177 170 177]

    inter_area = np.multiply(min_w_matrix, min_h_matrix)
    # inter_area : [875 2618 7168 3588 17700 16688 31683 43010 44781]
    iou = inter_area / (box_area + anchor_area - inter_area)
    # iou : [0.01953954 0.05846229 0.16006789 0.08012327 0.37916926 0.37265805 0.52340046 0.80722959 0.37957077]
    index = np.argmax(iou)

    return index


def data_encoding(batch_image_path, batch_true_boxes):

    # batch_image_path : (32, str)， str recorded the image path
    # batch_true_boxes : (32, str)， str has absolute x_min, y_min, x_max, y_max, class_id
    # encoding_y : x、y、w、h are relative value

    anchor_mask = [[6, 7, 8], [3, 4, 5], [0, 1, 2]]
    grid_shapes = [[13, 13], [26, 26], [52, 52]]
    batch_encoding_y = [np.zeros((32, 13, 13, 3, 25)), np.zeros((32, 26, 26, 3, 25)), np.zeros((32, 52, 52, 3, 25))]
    batch_images = []

    for i in range(len(batch_true_boxes)):

        img = cv2.imread(batch_image_path[i])
        size = img.shape

        img1 = img / 255
        resize_img = cv2.resize(img1, (416, 416), interpolation=cv2.INTER_AREA)
        batch_images.append(resize_img)

        obj_all = batch_true_boxes[i].strip().split()

        for j in range(len(obj_all)):
            obj = obj_all[j].split(',')
            x1, y1, x2, y2 = [int(obj[0]), int(obj[1]), int(obj[2]), int(obj[3])]
            category = int(obj[4])    # 0 - 19

            center_x = (x1 + x2) / 2
            center_y = (y1 + y2) / 2
            w = x2 - x1
            h = y2 - y1

            center_x_ratio = center_x / size[1]
            center_y_ratio = center_y / size[0]
            w_ratio = w / size[1]
            h_ratio = h / size[0]

            anchor_index = max_iou_index(w, h)

            for num in range(3):
                if anchor_index in anchor_mask[num]:

                    # anchor_mask[0] : [6, 7, 8]
                    # anchor_mask[1] : [3, 4, 5]
                    # anchor_mask[0] : [0, 1, 2]
                    inner_index = anchor_mask[num].index(anchor_index)   # 0 or 1 or 2

                    grid_x = int(center_x / size[1] * grid_shapes[num][1])
                    grid_y = int(center_y / size[0] * grid_shapes[num][0])

                    batch_encoding_y[num][i, grid_y, grid_x, inner_index, 0:4] = np.array([center_x_ratio,
                                                                                           center_y_ratio,
                                                                                           w_ratio, h_ratio])
                    batch_encoding_y[num][i, grid_y, grid_x, inner_index, 4] = 1
                    batch_encoding_y[num][i, grid_y, grid_x, inner_index, 5 + category] = 1

    return batch_images, batch_encoding_y


class SequenceData(Sequence):

    def __init__(self, data_x, data_y, batch_size):
        self.batch_size = batch_size
        self.data_x = data_x
        self.data_y = data_y
        self.indexes = np.arange(len(self.data_x))

    def __len__(self):
        return math.floor(len(self.data_x) / float(self.batch_size))

    def on_epoch_end(self):
        np.random.shuffle(self.indexes)

    def __getitem__(self, idx):

        batch_index = self.indexes[idx * self.batch_size:(idx + 1) * self.batch_size]
        batch_x = [self.data_x[k] for k in batch_index]
        batch_y = [self.data_y[k] for k in batch_index]

        x, y = data_encoding(batch_x, batch_y)
        x = np.array(x)

        return [x, *y], np.zeros(32)


# create model and train and save
def train_network(train_generator, validation_generator, epoch):

    model_body = yolov3_model.create_yolo_model()
    model_body.load_weights('/home/archer/CODE/YOLOv3/yolo_weights.h5', by_name=True, skip_mismatch=True)

    print('model_body layers : ', len(model_body.layers))
    for i in range(249):
        model_body.layers[i].trainable = False
    print('249 Layers has been frozen ! ')

    grid_shape = np.array([[13, 13], [26, 26], [52, 52]])

    y_true = [Input(shape=(grid_shape[l, 0], grid_shape[l, 1], 3, 25)) for l in range(3)]
    # [Tensor-(?, 13, 13, 3, 25), Tensor-(?, 26, 26, 3, 25), Tensor-(?, 52, 52, 3, 25)]

    model_loss = Lambda(yolo_loss, output_shape=(1, ), name='yolo_loss')([*model_body.output, *y_true])
    model = Model([model_body.input, *y_true], model_loss)
    # model_body.input : Tensor, shape=(?, 416, 416, 3), float32

    model.compile(optimizer=Adam(lr=1e-3), loss={'yolo_loss': lambda y_true, y_pre: y_pre})

    checkpoint = ModelCheckpoint('/home/archer/CODE/YOLOv3/best_weights.hdf5', monitor='val_loss',
                                 save_weights_only=True, save_best_only=True)

    model.fit_generator(
        train_generator,
        steps_per_epoch=len(train_generator),
        epochs=epoch,
        validation_data=validation_generator,
        validation_steps=len(validation_generator),
        callbacks=[checkpoint]
    )

    model_body.save_weights('first_weights.hdf5')


def load_network_then_train(train_generator, validation_generator, epoch, input_name, output_name):

    model_body = yolov3_model.create_yolo_model()
    model_body.load_weights(input_name, by_name=True, skip_mismatch=True)

    for i in range(249):
        model_body.layers[i].trainable = False

    grid_shape = np.array([[13, 13], [26, 26], [52, 52]])
    y_true = [Input(shape=(grid_shape[l, 0], grid_shape[l, 1], 3, 25)) for l in range(3)]
    model_loss = Lambda(yolo_loss, output_shape=(1,), name='yolo_loss')([*model_body.output, *y_true])
    model = Model([model_body.input, *y_true], model_loss)

    sgd = optimizers.SGD(lr=1e-8, momentum=0.9)
    model.compile(optimizer=sgd, loss={'yolo_loss': lambda y_true, y_pre: y_pre})

    checkpoint = ModelCheckpoint('/home/archer/CODE/YOLOv3/best_weights.hdf5', monitor='val_loss',
                                 save_weights_only=True, save_best_only=True)

    model.fit_generator(
        train_generator,
        steps_per_epoch=len(train_generator),
        epochs=epoch,
        validation_data=validation_generator,
        validation_steps=len(validation_generator),
        callbacks=[checkpoint]
    )

    model.save_weights(output_name)

main函数调用：

import numpy as np
import cv2
import read_data_path as rp
import get_anchors as ga
import yolov3_model as ym
import train as tr


class_dictionary = {'aeroplane': 0, 'bicycle': 1, 'bird': 2, 'boat': 3, 'bottle': 4, 'bus': 5,
                    'car': 6, 'cat': 7, 'chair': 8, 'cow': 9, 'diningtable': 10, 'dog': 11,
                    'horse': 12, 'motorbike': 13, 'person': 14, 'pottedplant': 15, 'sheep': 16,
                    'sofa': 17, 'train': 18, 'tvmonitor': 19}
class_list = list(class_dictionary.keys())


def txt_document(matrix):
    f = open("yolo_anchors.txt", 'w')
    row = np.shape(matrix)[0]
    for i in range(row):
        if i == 0:
            x_y = "%d,%d" % (matrix[i][0], matrix[i][1])
        else:
            x_y = ", %d,%d" % (matrix[i][0], matrix[i][1])
        f.write(x_y)

    f.close()


def sigmoid(x):
    return 1/(1 + np.exp(-x))


if __name__ == "__main__":

    train_x, train_y, val_x, val_y, test_x, test_y = rp.make_data()

    anchors = ga.calculate_anchor(train_x, train_y)

    # [[22  37]
    #  [26  82]
    #  [49  132]
    #  [56  57]
    #  [89  211]
    #  [113 108]
    #  [162 298]
    #  [238 177]
    #  [341 340]]

    txt_document(anchors)
    print('The anchors have been documented ! ')

    train_generator = tr.SequenceData(train_x, train_y, 32)
    validation_generator = tr.SequenceData(val_x, val_y, 32)

    # tr.train_network(train_generator, validation_generator, epoch=10)
    # tr.load_network_then_train(train_generator, validation_generator, epoch=15,
    #                            input_name='first_weights.hdf5', output_name='second_weights.hdf5')

    yolo3_model = ym.create_yolo_model()

    yolo3_model.load_weights('second_weights.hdf5')

    for i in range(len(train_x) - 1010, len(train_x) - 999):

        img1 = cv2.imread(train_x[i])
        size = img1.shape

        img2 = img1 / 255
        img3 = cv2.resize(img2, (416, 416), interpolation=cv2.INTER_AREA)
        img4 = img3[np.newaxis, :, :, :]

        pre = yolo3_model.predict(img4)

        pre_13 = np.reshape(pre[0][0], [13, 13, 3, 25])
        pre_26 = np.reshape(pre[1][0], [26, 26, 3, 25])
        pre_52 = np.reshape(pre[2][0], [52, 52, 3, 25])

        grid_y_13 = np.tile(np.reshape(np.arange(0, 13), [-1, 1]), [1, 13]) * size[0] / 13
        # 0   0   0   ...
        # 32  32  32  ...
        # ... ...     ...
        # 384 384 384 ...

        grid_x_13 = np.tile(np.reshape(np.arange(0, 13), [1, -1]), [13, 1]) * size[1] / 13
        # 0  32  64 ...
        # 0  32  64 ...
        # ...  ...  ...
        # 0  32  64 ...

        grid_y_26 = np.tile(np.reshape(np.arange(0, 26), [-1, 1]), [1, 26]) * size[0] / 26   # (26, 26)
        grid_x_26 = np.tile(np.reshape(np.arange(0, 26), [1, -1]), [26, 1]) * size[1] / 26   # (26, 26)
        grid_y_52 = np.tile(np.reshape(np.arange(0, 52), [-1, 1]), [1, 52]) * size[0] / 52   # (52, 52)
        grid_x_52 = np.tile(np.reshape(np.arange(0, 52), [1, -1]), [52, 1]) * size[1] / 52   # (52, 52)

        for j in range(3):
            pre_13[:, :, j, 0] = sigmoid(pre_13[:, :, j, 0]) * size[1] / 13 + grid_x_13
            pre_13[:, :, j, 1] = sigmoid(pre_13[:, :, j, 1]) * size[0] / 13 + grid_y_13
            pre_13[:, :, j, 2] = np.exp(pre_13[:, :, j, 2]) * anchors[j + 6, 0]
            pre_13[:, :, j, 3] = np.exp(pre_13[:, :, j, 3]) * anchors[j + 6, 1]
            pre_13[:, :, j, 4] = sigmoid(pre_13[:, :, j, 4])
            pre_13[:, :, j, 5:] = sigmoid(pre_13[:, :, j, 5:])

            pre_26[:, :, j, 0] = sigmoid(pre_26[:, :, j, 0]) * size[1] / 26 + grid_x_26
            pre_26[:, :, j, 1] = sigmoid(pre_26[:, :, j, 1]) * size[0] / 26 + grid_y_26
            pre_26[:, :, j, 2] = np.exp(pre_26[:, :, j, 2]) * anchors[j + 3, 0]
            pre_26[:, :, j, 3] = np.exp(pre_26[:, :, j, 3]) * anchors[j + 3, 1]
            pre_26[:, :, j, 4] = sigmoid(pre_26[:, :, j, 4])
            pre_26[:, :, j, 5:] = sigmoid(pre_26[:, :, j, 5:])

            pre_52[:, :, j, 0] = sigmoid(pre_52[:, :, j, 0]) * size[1] / 52 + grid_x_52
            pre_52[:, :, j, 1] = sigmoid(pre_52[:, :, j, 1]) * size[0] / 52 + grid_y_52
            pre_52[:, :, j, 2] = np.exp(pre_52[:, :, j, 2]) * anchors[j, 0]
            pre_52[:, :, j, 3] = np.exp(pre_52[:, :, j, 3]) * anchors[j, 1]
            pre_52[:, :, j, 4] = sigmoid(pre_52[:, :, j, 4])
            pre_52[:, :, j, 5:] = sigmoid(pre_52[:, :, j, 5:])

        candidate_box = []

        for k1 in range(13):
            for k2 in range(13):
                for k3 in range(3):

                    if pre_13[k1, k2, k3, 4] > 0.1:

                        center_x = pre_13[k1, k2, k3, 0]
                        center_y = pre_13[k1, k2, k3, 1]
                        w = pre_13[k1, k2, k3, 2]
                        h = pre_13[k1, k2, k3, 3]
                        confidence = pre_13[k1, k2, k3, 4]
                        category = np.argmax(pre_13[k1, k2, k3, 5:])

                        x1 = center_x - w/2
                        y1 = center_y - h/2
                        x2 = center_x + w/2
                        y2 = center_y + h/2
                        category = int(category)

                        candidate_box.append([x1, y1, x2, y2, confidence, category])
                        print('Grid 13 * 13 :', x1, y1, x2, y2, confidence, category)

        for k1 in range(26):
            for k2 in range(26):
                for k3 in range(3):

                    if pre_26[k1, k2, k3, 4] > 0.1:

                        center_x = pre_26[k1, k2, k3, 0]
                        center_y = pre_26[k1, k2, k3, 1]
                        w = pre_26[k1, k2, k3, 2]
                        h = pre_26[k1, k2, k3, 3]
                        confidence = pre_26[k1, k2, k3, 4]
                        category = np.argmax(pre_26[k1, k2, k3, 5:])

                        x1 = center_x - w / 2
                        y1 = center_y - h / 2
                        x2 = center_x + w / 2
                        y2 = center_y + h / 2
                        category = int(category)

                        candidate_box.append([x1, y1, x2, y2, confidence, category])
                        print('Grid 26 * 26 :', x1, y1, x2, y2, confidence, category)

        for k1 in range(52):
            for k2 in range(52):
                for k3 in range(3):

                    if pre_52[k1, k2, k3, 4] > 0.1:

                        center_x = pre_52[k1, k2, k3, 0]
                        center_y = pre_52[k1, k2, k3, 1]
                        w = pre_52[k1, k2, k3, 2]
                        h = pre_52[k1, k2, k3, 3]
                        confidence = pre_52[k1, k2, k3, 4]
                        category = np.argmax(pre_52[k1, k2, k3, 5:])

                        x1 = center_x - w / 2
                        y1 = center_y - h / 2
                        x2 = center_x + w / 2
                        y2 = center_y + h / 2
                        category = int(category)

                        candidate_box.append([x1, y1, x2, y2, confidence, category])
                        print('Grid 52 * 52 :', x1, y1, x2, y2, confidence, category)

        candidate_box = np.array(candidate_box)

        for num in range(len(candidate_box)):
            a1 = int(candidate_box[num, 0])
            b1 = int(candidate_box[num, 1])
            a2 = int(candidate_box[num, 2])
            b2 = int(candidate_box[num, 3])
            confidence = str(candidate_box[num, 4])
            index = int(candidate_box[num, 5])
            pre_class = class_list[index]

            cv2.rectangle(img1, (a1, b1), (a2, b2), (0, 0, 255), 2)
            cv2.putText(img1, pre_class, (a1, int((b1+b2)/2)), 1, 1, (0, 0, 255))
            cv2.putText(img1, confidence, (a2, int((b1+b2)/2)), 1, 1, (0, 0, 255))

        cv2.namedWindow("Final_Image")
        cv2.imshow("Final_Image", img1)
        cv2.waitKey(0)

        cv2.imwrite("/home/archer/CODE/YOLOv3/demo/" + str(i) + '.jpg', img1)

十一、项目链接

如果代码跑不通，或者想直接使用训练好的模型，可以去下载项目链接：
https://blog.csdn.net/Twilight737

你可能感兴趣的:(计算机视觉图像处理,自动驾驶,深度学习,神经网络)

目前常用的机器视觉工具库总结，选一个适合自己的机器视觉库才是最好的。 yuanpan 计算机视觉图像处理 ai AI编程
以下是常用机器视觉工具的总结，包括它们的特点、优点、缺点和是否付费：1.Halcon特点：由MVTec公司开发，专注于工业机器视觉。提供强大的图像处理、模式匹配、OCR和3D视觉功能。优点：高性能，适合复杂的工业应用。提供图形化编程界面（HDevelop），用户友好。支持多种硬件设备（如相机、采集卡）。缺点：付费：价格较高，适合企业级用户。开放性较低，定制化能力有限。学习曲线较高，文档复杂。是否付
Open3D 点云DBSCAN聚类算法 MelaCandy 算法聚类 numpy 计算机视觉图像处理 3d
目录一、DBSCAN基本原理二、代码实现2.1关键函数2.2完整代码三、实现效果3.1原始点云3.2聚类后点云Open3D点云算法汇总及实战案例汇总的目录地址：Open3D点云算法与点云深度学习案例汇总（长期更新）-CSDN博客一、DBSCAN基本原理DBSCAN（Density-BasedSpatialClusteringofApplicationswithNoise）是一种基于密度的聚类算法，
目标检测领域总结：从传统方法到 Transformer 时代的革新 DoYangTan 目标检测系列目标检测 transformer 人工智能
目标检测领域总结：从传统方法到Transformer时代的革新目标检测是计算机视觉领域的一个核心任务，它的目标是从输入图像中识别并定位出目标物体。随着深度学习的兴起，目标检测方法已经取得了显著的进展。从最早的传统方法到现如今基于Transformer的先进算法，目标检测的发展经历了多个重要的阶段。本文将详细总结目标检测领域的演进，涵盖传统方法、两阶段检测方法、单阶段检测方法和基于Transform
2024MathorCup数学建模之——MathorCup奖杯”获得者经验思路分享美赛数学建模数学建模
一、经验分享1.工具选择：顺手即可。Matlab和Python都是比较主流的选择，二者的应用场合各有不同。Python在数据分析、深度学习方面的优势愈发明显，而Matlab更适合进行物理仿真和数值计算。不过随着Python社区不断发展，其功能也愈发全面与强大，因此我们比较推荐学有余力的情况下可以更早接触Python。2.模型算法：多多益善。不一定要精通所有的算法，但是手上至少要准备一些常用的算法（
万字深度解析：DeepSeek-V3为何成为大模型时代的“速度之王“？羊不白丶大模型算法
引言在AI军备竞赛白热化的2024年，DeepSeek-V3以惊人的推理速度震撼业界：相比前代模型推理速度提升3倍，训练成本降低70%。这背后是十余项革命性技术的叠加创新，本文将为您揭开这艘"AI超跑"的性能密码。DeepSeek-V3的技术路径证明：计算效率的本质是知识组织的效率。其MoE架构中2048个专家的动态协作，恰似人脑神经网络的模块化运作——每个专家不再是被动执行计算的"劳工"，而是具
AI人工智能软件开发方案：开启智能时代的创新钥匙广州硅基技术官方人工智能
一、引言：AI浪潮下的软件开发新机遇近年来，人工智能（AI）技术的迅猛发展如同一股汹涌澎湃的浪潮，席卷了全球各个领域。从最初的概念提出到如今的广泛应用，AI历经了漫长的发展历程，终于迎来了属于它的黄金时代。回首过去，AI的发展并非一帆风顺，早期由于计算能力和算法的限制，经历了多次起伏。但随着大数据、云计算、机器学习、深度学习等技术的不断突破，AI迎来了爆发式增长。如今，AI已经深入到人们生活和工作
深度学习框架PyTorch——从入门到精通（6.2）自动微分机制 Fansv587 深度学习 pytorch 人工智能经验分享 python 机器学习
本节自动微分机制是上一节自动微分的扩展内容自动微分是如何记录运算历史的保存张量非可微函数的梯度在本地设置禁用梯度计算设置requires_grad梯度模式（GradModes）默认模式（梯度模式）无梯度模式推理模式评估模式（`nn.Module.eval()`）自动求导中的原地操作原地操作的正确性检查多线程自动求导CPU上的并发不确定性计算图保留自动求导节点的线程安全性C++钩子函数不存在线程安全
神经网络中层与层之间的关联 iisugar 神经网络深度学习计算机视觉
目录1.层与层之间的核心关联：数据流动与参数传递1.1数据流动（ForwardPropagation）1.2参数传递（BackwardPropagation）2.常见层与层之间的关联模式2.1典型全连接网络（如手写数字分类）2.2卷积神经网络（CNN，如图像分类）2.3循环神经网络（RNN/LSTM，如文本生成）2.4Transformer（如机器翻译）3.层间关联的核心原则3.1数据传递的“管道
Pytorch深度学习教程_9_nn模块构建神经网络 tRNA做科研深度学习保姆教程深度学习 pytorch 神经网络
欢迎来到《深度学习保姆教程》系列的第九篇！在前面的几篇中，我们已经介绍了Python、numpy及pytorch的基本使用，进行了梯度及神经网络的实践并学习了激活函数和激活函数，在上一个教程中我们学习了优化算法。今天，我们将开始使用pytorch构建我们自己的神经网络。欢迎订阅专栏进行系统学习：深度学习保姆教程_tRNA做科研的博客-CSDN博客目录1.理解nn模块：(1)使用nn.Sequent
图神经网络实战——分层自注意力网络盼小辉丶图神经网络从入门到项目实战神经网络人工智能深度学习
图神经网络实战——分层自注意力网络0.前言1.分层自注意力网络1.1模型架构1.2节点级注意力1.3语义级注意力1.4预测模块2.构建分层自注意力网络相关链接0.前言在异构图数据集上，异构图注意力网络的测试准确率为78.39%，比之同构版本有了较大提高，但我们还能进一步提高准确率。在本节中，我们将学习一种专门用于处理异构图的图神经网络架构，分层自注意力网络(hierarchicalself-att
Radiance Fields from VGGSfM和Mast3r:两种先进3D重建方法的比较与分析 2401_87458718 3d
VGGSfM和Mast3r:3D场景重建的新方向在计算机视觉和3D重建领域,如何从2D图像重建3D场景一直是一个充满挑战的研究课题。近年来,随着深度学习技术的发展,一些新的方法被提出并取得了显著的进展。本文将重点介绍两种最新的基于深度学习的3D重建方法:VGGSfM和Mast3r,并通过GaussianSplatting技术对它们的性能进行全面比较和分析。VGGSfM:基于视觉几何的深度结构运动恢
基于 PyTorch 的 MNIST 手写数字分类模型欣然～ pytorch 分类人工智能
一、概述本代码使用PyTorch框架构建了一个简单的神经网络模型，用于解决MNIST手写数字分类任务。代码主要包括数据的加载与预处理、神经网络模型的构建、损失函数和优化器的定义、模型的训练、评估以及最终模型的保存等步骤。二、依赖库torch：PyTorch深度学习框架的核心库，提供了张量操作、自动求导等功能。torch.nn：PyTorch的神经网络模块，包含了各种神经网络层、损失函数等。torc
高效快速教你DeepSeek如何进行本地部署并且可视化对话大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 经验分享
科技文章：高效快速教你DeepSeek如何进行本地部署并且可视化对话摘要：随着自然语言处理（NLP）技术的进步，DeepSeek作为一款基于深度学习的语义搜索技术，广泛应用于文本理解、对话系统及信息检索等多个领域。本文将探讨如何高效快速地在本地部署DeepSeek，并结合可视化工具实现对话过程的监控与分析。通过详尽的步骤、案例分析与代码示例，帮助开发者更好地理解和应用DeepSeek技术。同时，本
机器学习——分类、回归、聚类、LASSO回归、Ridge回归（自用）代码的建筑师模型学习模型训练机器学习机器学习分类回归正则化项 LASSO Ridge 朴素
纠正自己的误区：机器学习是一个大范围，并不是一个小的方向，比如：线性回归预测、卷积神经网络和强化学都是机器学习算法在不同场景的应用。机器学习最为关键的是要有数据，也就是数据集名词解释：数据集中的一行叫一条样本或者实例，列名称为特征或者属性。样本的数量称为数据量，特征的数量称为特征维度机器学习常用库：Numpy和sklearn朴素的意思是特征的各条件都是相互独立的机器学习（模型、策略、算法）损失函数
Python基于深度学习的动物图片识别技术的研究与实现 Java老徐 Python 毕业设计 python 深度学习开发语言深度学习的动物图片识别技术 Python动物图片识别技术
博主介绍：✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w+、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌文末获取源码联系精彩专栏推荐订阅不然下次找不到哟2022-2024年最全的计算机软件毕业设计选题大全：1000个热门选题推荐✅Java项目精品实战案例《100套》Java微信小程序项目实战《100套》感兴趣的可以先收藏起来，还有大家
【深度学习与大模型基础】第7章-特征分解与奇异值分解 lynn-66 深度学习与大模型基础算法机器学习人工智能
一、特征分解特征分解（EigenDecomposition）是线性代数中的一种重要方法，广泛应用于计算机行业的多个领域，如机器学习、图像处理和数据分析等。特征分解将一个方阵分解为特征值和特征向量的形式，帮助我们理解矩阵的结构和性质。1.特征分解的定义对于一个n×n的方阵A，如果存在一个非零向量v和一个标量λ，使得：则称λ为矩阵A的特征值，v为对应的特征向量。特征分解将矩阵A分解为：其中：Q是由特征
【论文阅读】Persistent Homology Captures the Generalization of Neural Networks Without A Validation Set 开心星人论文阅读论文阅读
将神经网络表征为加权的无环图，直接根据模型的权重矩阵构造PD。计算相邻batch的权重矩阵PD之间的距离。比较同调收敛性与神经网络的验证精度变化趋势摘要机器学习从业者通常通过监控模型的某些指标来估计其泛化误差，并在训练数值收敛之前停止训练，以防止过拟合。通常，这种误差度量或任务相关的指标是通过一个验证集（holdoutset）来计算的。因为这些数据没有直接用于更新模型参数，通常假设模型在验证集上的
【论文阅读】实时全能分割模型万里守约论文阅读论文阅读图像分割图像处理计算机视觉
文章目录导言1、论文简介2、论文主要方法3、论文针对的问题4、论文创新点总结导言在最近的计算机视觉领域，针对实时多任务分割的需求日益增长，特别是在交互式分割、全景分割和视频实例分割等多种应用场景中。为了解决这些挑战，本文介绍了一种新方法——RMP-SAM（Real-TimeMulti-PurposeSegmentAnything），旨在实现实时的多功能分割。RMP-SAM结合了动态卷积与高效的模型
震惊！ “深度学习”都在学习什么扉间798 深度学习学习人工智能
常见的机器学习分类算法俗话说三个臭皮匠胜过诸葛亮这里面集成学习就是将单一的算法弱弱结合算法融合用投票给特征值加权重AdaBoost集成学习算法通过迭代训练一系列弱分类器，给予分类错误样本更高权重，使得后续弱分类器更关注这些样本，然后将这些弱分类器线性组合成强分类器，提高整体分类性能。（一）投票机制投票是一种直观且常用的算法融合策略。在多分类问题中，假设有多个分类器对同一数据进行分类判断。每个分类器
深度学习 | pytorch + torchvision + python 版本对应及环境安装 zfgfdgbhs 深度学习 python pytorch
目录一、版本对应二、安装命令（pip）1.版本（1）v2.5.1~v2.0.0（2）v1.13.1~v1.11.0（3）v1.10.1~v1.7.02.安装全过程（1）选择版本（2）安装结果参考文章一、版本对应下表来自pytorch的github官方文档：pytorch/vision:Datasets,TransformsandModelsspecifictoComputerVisionpytor
卷积神经网络 - 理解卷积核的尺寸 k×k×Cin 谦亨有终 AI学习笔记 cnn 人工智能神经网络深度学习机器学习
卷积神经网络中，每个卷积核的尺寸为k×k×Cin，这一设计的核心原因在于多通道输入的数据结构和跨通道特征整合的需求。以下是详细解释：1.输入数据的结构输入形状：假设输入数据为三维张量，形状为H×W×Cin，其中：H：高度（Height）W：宽度（Width）Cin：通道数（Channelsin）多通道的物理意义：对于RGB图像，Cin=3（红、绿、蓝三通道）。对于中间层的特征图，Cin可能为64、
机器学习：让计算机学会思考的艺术平凡而伟大. 机器学习机器学习人工智能
目录什么是机器学习？机器学习的基本步骤常见的机器学习算法机器学习的实际应用如何入门机器学习？结语在当今数字化时代，机器学习（MachineLearning,ML）已经成为一个炙手可热的话题。从推荐系统到自动驾驶汽车，再到语音助手，机器学习的应用无处不在。然而，对于许多人来说，机器学习仍然是一个神秘而复杂的领域。本文将用通俗易懂的语言，带你走进机器学习的世界，了解它的基本原理和应用。什么是机器学习？
一文讲清楚深度学习和机器学习平凡而伟大. 机器学习人工智能深度学习机器学习人工智能
目录1.定义机器学习（MachineLearning,ML）深度学习（DeepLearning,DL）2.工作原理机器学习深度学习3.应用场景机器学习深度学习4.主要区别5.为什么选择深度学习？6.总结深度学习和机器学习是人工智能（AI）领域中两个密切相关但有所区别的概念。要清楚地解释它们之间的关系，我们可以从定义、工作原理、应用场景以及两者的主要区别等方面进行探讨。1.定义机器学习（Machin
DeepSeek：智能搜索与分析的新纪元 XRC2231 学习
在人工智能浪潮席卷全球的今天，DeepSeek如同一颗璀璨的新星，以其独特的魅力和强大的功能，在AI领域脱颖而出。DeepSeek，这一基于深度学习和数据挖掘技术的智能搜索与分析系统，不仅重新定义了搜索引擎的边界，更以其卓越的性能和广泛的应用场景，为全球用户带来了前所未有的智能体验。本文将从DeepSeek的定义、特点、应用场景、优势等方面进行全面而深入的介绍，带您领略这一新兴技术的独特魅力。一、
大模型学习终极指南：从新手到专家的必经之路，全网最详尽解析，你敢挑战吗？大模型入门教程学习人工智能 AI 大模型大模型学习大模型教程 AI大模型
随着人工智能技术的飞速发展，大模型（Large-ScaleModels）已经成为推动自然语言处理（NLP）、计算机视觉（CV）等领域进步的关键因素。本文将为您详细介绍从零开始学习大模型直至成为专家的全过程，包括所需掌握的知识点、学习资源以及实践建议等。无论您是初学者还是有一定基础的专业人士，都能从中获得有价值的指导。一、基础知识准备在开始学习大模型之前，需要先掌握一些基础知识，这些知识将为后续的学
AI模型技术演进与行业应用图谱智能计算研究中心其他
内容概要当前AI模型技术正经历从基础架构到行业落地的系统性革新。主流深度学习框架如TensorFlow和PyTorch持续优化动态计算图与分布式训练能力，而MXNet凭借高效的异构计算支持在边缘场景崭露头角。与此同时，模型压缩技术通过量化和知识蒸馏将参数量降低60%-80%，联邦学习则通过加密梯度交换实现多机构数据协同训练。在应用层面，医疗诊断模型通过迁移学习在CT影像分类任务中达到98.2%的准
【第1章＞第6节】CMAC小脑模型神经网络的理论学习与MATLAB仿真 fpga和matlab #第1章·神经网络学习 matlab CMAC 小脑模型神经网络人工智能
目录1.使用软件和版本2.CMAC小脑模型神经网络概述2.1CMAC网络结构2.2CMAC地址映射2.3学习过程3.CMAC网络的MATLAB编程实现4.分辨率，重叠度，学习率对CMAC网络的训练性能影响分析4.1分辨率4.2重叠度4.3学习率5.视频操作步骤演示欢迎订阅FPGA/MATLAB/Simulink系列教程《★教程1:matlab入门100例》《★教程2:fpga入门100例》《★教程
AI大模型训练教程 Small踢倒coffee_氕氘氚 python自学经验分享笔记
1.引言随着人工智能技术的快速发展，大模型（如GPT-3、BERT等）在自然语言处理、计算机视觉等领域取得了显著的成果。训练一个大模型需要大量的计算资源、数据和专业知识。本教程将带你了解如何从零开始训练一个AI大模型。2.准备工作2.1硬件要求GPU：推荐使用NVIDIA的高性能GPU，如A100、V100等。内存：至少64GBRAM。存储：SSD存储，至少1TB。#2.2软件环境操作系统：Lin
使用Jupyter Notebook进行深度学习编程 - 深度学习教程 shandianfk_com ChatGPT AI jupyter 深度学习 ide
大家好，今天我们要聊聊如何使用JupyterNotebook进行深度学习编程。深度学习是人工智能领域中的一项重要技术，通过模仿人脑神经网络的方式进行学习和分析。JupyterNotebook作为一个强大的工具，可以帮助我们轻松地进行深度学习编程，尤其适合初学者和研究人员。本文将带领大家一步步了解如何在JupyterNotebook中开展深度学习项目。一、什么是JupyterNotebook？Jup
Opencv之计算机视觉一闭月之泪舞计算机视觉计算机视觉 opencv python
一、环境准备使用opencv库来实现简单的计算机视觉。需要安装两个库：opencv-python和opencv-contrib-python，版本可以自行选择，注意不同版本的opencv中的某些函数名和用法可能不同pipinstallopencv-python==3.4.18.65-ihttps://pypi.tuna.tsinghua.edu.cn/simplepipinstallopencv-
VMware Workstation 11 或者 VMware Player 7安装MAC OS X 10.10 Yosemite iwindyforest vmware mac os 10.10 workstation player
最近尝试了下VMware下安装MacOS 系统，安装过程中发现网上可供参考的文章都是VMware Workstation 10以下， MacOS X 10.9以下的文章，只能提供大概的思路，但是实际安装起来由于版本问题，走了不少弯路，所以我尝试写以下总结，希望能给有兴趣安装OSX的人提供一点帮助。写在前面的话：其实安装好后发现，由于我的th
关于《基于模型驱动的B/S在线开发平台》源代码开源的疑虑？ deathwknight JavaScript java 框架
本人从学习Java开发到现在已有10年整，从一个要自学 java买成javascript的小菜鸟，成长为只会java和javascript语言的老菜鸟（个人邮箱：[email protected]）一路走来，跌跌撞撞。用自己的三年多业余时间，瞎搞一个小东西（基于模型驱动的B/S在线开发平台，非MVC框架、非代码生成）。希望与大家一起分享，同时有许些疑虑，希望有人可以交流下平台
如何把maven项目转成web项目 Kai_Ge maven MyEclipse
创建Web工程，使用eclipse ee创建maven web工程 1.右键项目,选择Project Facets,点击Convert to faceted from 2.更改Dynamic Web Module的Version为2.5.(3.0为Java7的,Tomcat6不支持). 如果提示错误,可能需要在Java Compiler设置Compiler compl
主管？？？ Array_06 工作
转载：http://www.blogjava.net/fastzch/archive/2010/11/25/339054.html 很久以前跟同事参加的培训，同事整理得很详细，必须得转！前段时间，公司有组织中高阶主管及其培养干部进行了为期三天的管理训练培训。三天的课程下来，虽然内容较多，因对老师三天来的课程内容深有感触，故借着整理学习心得的机会，将三天来的培训课程做了一个
python内置函数大全 2002wmj python
最近一直在看python的document，打算在基础方面重点看一下python的keyword、Build-in Function、Build-in Constants、Build-in Types、Build-in Exception这四个方面，其实在看的时候发现整个《The Python Standard Library》章节都是很不错的，其中描述了很多不错的主题。先把Build-in Fu
JSP页面通过JQUERY合并行 357029540 JavaScript jquery
在写程序的过程中我们难免会遇到在页面上合并单元行的情况，如图所示如果对于会的同学可能很简单，但是对没有思路的同学来说还是比较麻烦的，提供一下用JQUERY实现的参考代码 function mergeCell(){ var trs = $("#table tr"); &nb
Java基础冰天百华 java基础
学习函数式编程 package base; import java.text.DecimalFormat; public class Main { public static void main(String[] args) { // Integer a = 4; // Double aa = (double)a / 100000; // Decimal
unix时间戳相互转换 adminjun 转换 unix 时间戳
如何在不同编程语言中获取现在的Unix时间戳(Unix timestamp)？ Java time JavaScript Math.round(new Date().getTime()/1000) getTime()返回数值的单位是毫秒 Microsoft .NET / C# epoch = (DateTime.Now.ToUniversalTime().Ticks - 62135
作为一个合格程序员该做的事 aijuans 程序员
作为一个合格程序员每天该做的事 1、总结自己一天任务的完成情况最好的方式是写工作日志，把自己今天完成了什么事情，遇见了什么问题都记录下来，日后翻看好处多多 2、考虑自己明天应该做的主要工作把明天要做的事情列出来，并按照优先级排列，第二天应该把自己效率最高的时间分配给最重要的工作 3、考虑自己一天工作中失误的地方，并想出避免下一次再犯的方法出错不要紧，最重
由html5视频播放引发的总结 ayaoxinchao html5 视频 video
前言项目中存在视频播放的功能，前期设计是以flash播放器播放视频的。但是现在由于需要兼容苹果的设备，必须采用html5的方式来播放视频。我就出于兴趣对html5播放视频做了简单的了解，不了解不知道，水真是很深。本文所记录的知识一些浅尝辄止的知识，说起来很惭愧。视频结构本该直接介绍html5的<video>的，但鉴于本人对视频
解决httpclient访问自签名https报javax.net.ssl.SSLHandshakeException: sun.security.validat bewithme httpclient
如果你构建了一个https协议的站点，而此站点的安全证书并不是合法的第三方证书颁发机构所签发，那么你用httpclient去访问此站点会报如下错误 javax.net.ssl.SSLHandshakeException: sun.security.validator.ValidatorException: PKIX path bu
Jedis连接池的入门级使用 bijian1013 redis redis数据库 jedis
Jedis连接池操作步骤如下： a.获取Jedis实例需要从JedisPool中获取； b.用完Jedis实例需要返还给JedisPool； c.如果Jedis在使用过程中出错，则也需要还给JedisPool； packag
变与不变 bingyingao 不变变亲情永恒
变与不变周末骑车转到了五年前租住的小区，曾经最爱吃的西北面馆、江西水饺、手工拉面早已不在，各种店铺都换了好几茬，这些是变的。三年前还很流行的一款手机在今天看起来已经落后的不像样子。三年前还运行的好好的一家公司，今天也已经不复存在。一座座高楼拔地而起，
【Scala十】Scala核心四：集合框架之List bit1129 scala
Spark的RDD作为一个分布式不可变的数据集合，它提供的转换操作，很多是借鉴于Scala的集合框架提供的一些函数，因此，有必要对Scala的集合进行详细的了解 1. 泛型集合都是协变的，对于List而言，如果B是A的子类，那么List[B]也是List[A]的子类，即可以把List[B]的实例赋值给List[A]变量 2. 给变量赋值(注意val关键字，a，b
Nested Functions in C bookjovi c closure
Nested Functions 又称closure，属于functional language中的概念，一直以为C中是不支持closure的，现在看来我错了，不过C标准中是不支持的，而GCC支持。既然GCC支持了closure，那么 lexical scoping自然也支持了，同时在C中label也是可以在nested functions中自由跳转的
Java-Collections Framework学习与总结-WeakHashMap BrokenDreams Collections
总结这个类之前，首先看一下Java引用的相关知识。Java的引用分为四种：强引用、软引用、弱引用和虚引用。强引用：就是常见的代码中的引用，如Object o = new Object();存在强引用的对象不会被垃圾收集
读《研磨设计模式》-代码笔记-解释器模式-Interpret bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 解释器（Interpreter）模式的意图是可以按照自己定义的组合规则集合来组合可执行对象 * * 代码示例实现XML里面1.读取单个元素的值 2.读取单个属性的值 * 多
After Effects操作&快捷键 cherishLC After Effects
1、快捷键官方文档中文版：https://helpx.adobe.com/cn/after-effects/using/keyboard-shortcuts-reference.html 英文版：https://helpx.adobe.com/after-effects/using/keyboard-shortcuts-reference.html 2、常用快捷键
Maven 常用命令 crabdave maven
Maven 常用命令 mvn archetype:generate mvn install mvn clean mvn clean complie mvn clean test mvn clean install mvn clean package mvn test mvn package mvn site mvn dependency:res
shell bad substitution daizj shell 脚本
#!/bin/sh /data/script/common/run_cmd.exp 192.168.13.168 "impala-shell -islave4 -q 'insert OVERWRITE table imeis.${tableName} select ${selectFields}, ds, fnv_hash(concat(cast(ds as string), im
Java SE 第二讲（原生数据类型 Primitive Data Type） dcj3sjt126com java
Java SE 第二讲： 1. Windows: notepad, editplus, ultraedit, gvim Linux: vi, vim, gedit 2. Java 中的数据类型分为两大类： 1）原生数据类型（Primitive Data Type） 2）引用类型（对象类型）（R
CGridView中实现批量删除 dcj3sjt126com PHP yii
1，CGridView中的columns添加 array( 'selectableRows' => 2, 'footer' => '<button type="button" onclick="GetCheckbox();" style=&
Java中泛型的各种使用 dyy_gusi java 泛型
Java中的泛型的使用：1.普通的泛型使用在使用类的时候后面的<>中的类型就是我们确定的类型。 public class MyClass1<T> {//此处定义的泛型是T private T var; public T getVar() { return var; } public void setVa
Web开发技术十年发展历程 gcq511120594 Web 浏览器数据挖掘
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
openSession()与getCurrentSession()区别： hetongfei java DAO Hibernate
来自 http://blog.csdn.net/dy511/article/details/6166134 1.getCurrentSession创建的session会和绑定到当前线程,而openSession不会。 2. getCurrentSession创建的线程会在事务回滚或事物提交后自动关闭,而openSession必须手动关闭。这里getCurrentSession本地事务(本地
第一章安装Nginx+Lua开发环境 jinnianshilongnian nginx lua openresty
首先我们选择使用OpenResty，其是由Nginx核心加很多第三方模块组成，其最大的亮点是默认集成了Lua开发环境，使得Nginx可以作为一个Web Server使用。借助于Nginx的事件驱动模型和非阻塞IO，可以实现高性能的Web应用程序。而且OpenResty提供了大量组件如Mysql、Redis、Memcached等等，使在Nginx上开发Web应用更方便更简单。目前在京东如实时价格、秒
HSQLDB In-Process方式访问内存数据库 liyonghui160com
HSQLDB一大特色就是能够在内存中建立数据库，当然它也能将这些内存数据库保存到文件中以便实现真正的持久化。先睹为快！下面是一个In-Process方式访问内存数据库的代码示例：下面代码需要引入hsqldb.jar包（hsqldb-2.2.8） import java.s
Java线程的5个使用技巧 pda158 java 数据结构
Java线程有哪些不太为人所知的技巧与用法？　　萝卜白菜各有所爱。像我就喜欢Java。学无止境，这也是我喜欢它的一个原因。日常工作中你所用到的工具，通常都有些你从来没有了解过的东西，比方说某个方法或者是一些有趣的用法。比如说线程。没错，就是线程。或者确切说是Thread这个类。当我们在构建高可扩展性系统的时候，通常会面临各种各样的并发编程的问题，不过我们现在所要讲的可能会略有不同。
开发资源大整合：编程语言篇——JavaScript（1） shoothao JavaScript
概述：本系列的资源整合来自于github中各个领域的大牛，来收藏你感兴趣的东西吧。程序包管理器管理javascript库并提供对这些库的快速使用与打包的服务。 Bower - 用于web的程序包管理。 component - 用于客户端的程序包管理，构建更好的web应用程序。 spm - 全新的静态的文件包管
避免使用终结函数 vahoa.ma java jvm C++
终结函数（finalizer）通常是不可预测的，常常也是很危险的，一般情况下不是必要的。使用终结函数会导致不稳定的行为、更差的性能，以及带来移植性问题。不要把终结函数当做C++中的析构函数（destructors）的对应物。我自己总结了一下这一条的综合性结论是这样的： 1）在涉及使用资源，使用完毕后要释放资源的情形下，首先要用一个显示的方