胖虎干嘛了

深度学习论文复现：MTCNN算法分析笔记

MTCNN算法分析笔记

1. 项目来源
- （1）论文题目
- （2）实现目标
- （3）相关资源
2. 代码运行
- i）图像标注
- ii）生成PNet训练数据
- iii）训练PNet
- iv）生成RNet训练数据
- v）训练RNet
- vi）生成ONet训练数据
- vii）训练ONet
3. 算法与代码分析

1. 项目来源

（1）论文题目

本次复现的论文：Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks ，原作者是使用Matlab进行算法实现的。

（2）实现目标

本次的任务是基于该论文的Pytorch实现，使用百度Paddle Paddle框架对其进行复现。这篇博客则是以论文的Pytorch复现为基础，对MTCNN论文与算法进行学习与分析。

（3）相关资源

按要求下载以下资源：

参考Github前辈的复现代码，自己做了一点点修改
百度网盘：https://pan.baidu.com/s/14otWIZM8ix-dNoBkCYGoiA
提取码：xwet
WIDER FACE数据集中的wider_face_split.zip与WIDER_train.zip压缩包，解压后存放路径分别为：
MTCNN_TUTORIAL-MASTER/data_set/wider_face_split/
MTCNN_TUTORIAL-MASTER/data_set/WIDER_train/
登录FDDB官网下载数据集，包括原图Original images与标注文件Face annotations,存放路径分别为：
MTCNN_TUTORIAL-MASTER/data_set/train/
MTCNN_TUTORIAL-MASTER/data_set/FDDB-folds/

2. 代码运行

由于本论文每个阶段的训练与测试过程都是按照PNet-RNet-ONet的顺序级联进行的，前一阶段的训练结果为后一阶段的网络输入，故而训练与测试均需要分多个阶段进行，下面将逐个对各阶段进行简要分析。

i）图像标注

在MTCNN_TUTORIAL-MASTER/data_preprocessing/文件夹下新建文件夹anno_store，并执行如下指令

python data_preprocessing/transform.py

将在该路径下生成文件anno_train.txt，以将预先下载的wider_face_split/wider_face_train.mat标记文件转换为txt格式。
转换后的wider_face_train.txt文件中记录有数据集中原图像地址，以及作为ground truth的人脸框坐标。

ii）生成PNet训练数据

输入PNet的训练数据，按图像交并比IOU的值，分为三部分：0-0.3划分为negative，0.4-0.65划分为part，0.65-1划分为positive。
执行如下指令

python data_preprocessing/gen_Pnet_train_data.py

该文件负责从原图中crop出图像并按照IOU值进行分类，将三种标签的数据分别存入data_set/train/12/negative/，data_set/train/12/part/，data_set/train/12/positive/
--------------------------------------一条分割线-------------------------------------------
再执行下述指令

python data_preprocessing/assemble_Pnet_imglist.py

组装PNet的数据集注释文件并完成shuffle，将其打乱，自此完成PNet训练数据的准备

iii）训练PNet

执行下述语句

python train/Train_Pnet.py

训练过程中，PNet网络的train模式与val模式交替进行。
值得一提的是，首次训练之前，需要创建验证集对应的文件夹data_set/val/12/，文件夹中将生成pos_12_val.txt，part_12_val.txt，neg_12_val.txt三个标注文件。

iv）生成RNet训练数据

创建data_set/train/24/文件夹，执行如下命令

python data_preprocessing/gen_Rnet_train_data.py
python data_preprocessing/assemble_Rnet_imglist.py

功能大致与第二步中PNet数据准备的功能相同，data_set/train/24/文件夹中将生成pos_24_val.txt，part_24_val.txt，neg_24_val.txt三个标注文件

v）训练RNet

执行下述语句，功能大致与第三步中PNet网络训练相同

python train/Train_Pnet.py

vi）生成ONet训练数据

创建data_set/train/48/文件夹，执行下列语句

python data_preprocessing/gen_Onet_train_data.py

功能与第二步中PNet数据准备功能相同，文件夹中将生成pos_48.txt, part_48.txt, neg_48.txt三个标注文件

由于第三阶段ONet，即Output Net需要输出脸部 landmark坐标，故而在数据准备阶段需要额外生成data_preprocessing/anno_store/landmark_48.txt文件，记录面部标志点信息，执行下述语句

python data_preprocessing/gen_landmark_48.py

为完成ONet训练数据的预处理与shuffle，执行下述语句

python data_preprocessing/assemble_Onet_imglist.py

vii）训练ONet

执行下述语句，功能大致与第三步中PNet网络训练相同

python train/Train_Onet.py

自此，训练、验证阶段完成

下面展示一下我们的训练过程与测试结果~

训练过程之模型导入

训练过程

测试过程：

测试效果：

加载了训练好的模型，我们又训练了几轮，效果还挺好的，是吧~

3. 算法与代码分析

对照代码通读论文，对模型与算法进行一系列分析。

整体来看，整个训练过程其实是三个网络按照P-R-O的顺序迭代进行的，包括训练与验证，都是级联进行的。同时，网络在整体上保持着数据准备（随机crop出训练用图像边框，并按其IOU值分为positive、part、negative三类）、数据扰乱、网络训练的顺序进行的，PRO三个网络首尾相接。
网络在训练过程中，每一个stage分别对人脸二分类，边界框回归、人脸关键点三个任务进行loss值的运算。至于loss函数的选取，人脸二分类问题使用交叉熵损失函数，其余问题则应用均方误差MSE。
值得一提的是，由于PNet与RNet中feature map尺寸较小，对于landmark的识别较为困难，故而我们只在最后的ONet中引入人脸关键点检测的任务，故而也只有在ONet的训练过程中对人脸标志点landmark进行均方误差的计算。
下面的这张图或许具有一定的误导性，让你以为在PNet与RNet中同样进行landmark任务的训练，但其实作者在代码中已经给出了明确的答案。
依靠上图，我们对网络架构进行解释：为了提升网络的性能，作者应用3x3滤波器代替5x5卷积核，激活函数方面则使用PReLu，大概是下图这个形状的。
至于PRO网络的具体形状，输入数据分别为12x12x3，24x24x3，48x48x3，后续经过一系列的卷积、池化、卷积、池化，完成主干网络的训练。将之感网络训练的结果分别输入到两个（ONet是三个）分支中，使用不同卷积核对其进行训练，分别对应face classification，bounding box regression，facial landmark localization三个任务。
值得一提的是，在ONet中，由于相较P、R网络更为复杂，故而多设置了一道卷积层，期望通过网络深度的增加换取更优的性能。
关于数据准备阶段，随机crop出样本框的技巧，即得到neg、part、pos三类样本的方法。以data_preprocessing/gen_Pnet_train_data.py为例，直接上代码，分一大一小两个for循环完成。
下面是一个小的for循环，只负责取35个负样本（其实第二个for循环中也取得了一些负样本）

neg_num = 0
while neg_num < 35:
    # 随机crop出一些不同大小的正方形框框（边长最小是12），35个负样本中允许较大的negative出现
    # width与height为image的宽和高
    size = np.random.randint(12, min(width, height) / 2)
    nx = np.random.randint(0, width - size)
    ny = np.random.randint(0, height - size)
    crop_box = np.array([nx, ny, nx + size, ny + size])

    Iou =IoU(crop_box, boxes)

    cropped_im = img[ny: ny + size, nx: nx + size, :]
    #放缩到固定大小，方便第一阶段PNet运算
    resized_im = cv2.resize(cropped_im, (12, 12), interpolation=cv2.INTER_LINEAR)

    if np.max(Iou) < 0.3:
        # Iou with all gts must below 0.3
        save_file = os.path.join(neg_save_dir, "%s.jpg" % n_idx)
        f2.write(save_file + ' 0\n')
        cv2.imwrite(save_file, resized_im)
        n_idx += 1
        neg_num += 1#每张图片找出35个negative样本为止

此部分代码的目的是为了在较大的范围内进行随机crop，取得35个negative样本。样本框为边长大于12的正方形，框的取值范围是分布在整张图片上的。

下面是一个大的for循环，positive，part，negative三种样本都有涉及


    # 在ground true的坐标内
    for box in boxes:
        # box (x_left, y_top, w, h)
        x1, y1, x2, y2 = box
        w = x2 - x1 + 1
        h = y2 - y1 + 1

        # ignore small faces
        # in case the ground truth boxes of small faces are not accurate
        if max(w, h) < 40 or x1 < 0 or y1 < 0 or w < 0 or h < 0:
            continue

        # generate negative examples that have overlap with gt，生成和ground true有重合的负样本
        for i in range(5):
            size = np.random.randint(12, min(width, height) / 2)
            # delta_x and delta_y are offsets of (x1, y1)

            delta_x = np.random.randint(max(-size, -x1), w)
            delta_y = np.random.randint(max(-size, -y1), h)
            nx1 = max(0, x1 + delta_x)
            ny1 = max(0, y1 + delta_y)

            if nx1 + size > width or ny1 + size > height:
                continue
            crop_box = np.array([nx1, ny1, nx1 + size, ny1 + size])
            Iou = IoU(crop_box, boxes)

            cropped_im = img[ny1: ny1 + size, nx1: nx1 + size, :]
            # 放缩为固定大小
            resized_im = cv2.resize(cropped_im, (12, 12), interpolation=cv2.INTER_LINEAR)

            if np.max(Iou) < 0.3:
                # Iou with all gts must below 0.3
                save_file = os.path.join(neg_save_dir, "%s.jpg" % n_idx)
                f2.write(save_file + ' 0\n')
                cv2.imwrite(save_file, resized_im)
                n_idx += 1

        # generate positive examples and part faces,在ground truth 的基础上，生成正样本和part样本
        for i in range(20):
            size = np.random.randint(int(min(w, h) * 0.8), np.ceil(1.25 * max(w, h)))

            # delta here is the offset of box center
            delta_x = np.random.randint(-w * 0.2, w * 0.2)
            delta_y = np.random.randint(-h * 0.2, h * 0.2)

            nx1 = max(x1 + w / 2 + delta_x - size / 2, 0)
            ny1 = max(y1 + h / 2 + delta_y - size / 2, 0)
            nx2 = nx1 + size
            ny2 = ny1 + size

            if nx2 > width or ny2 > height:
                continue    #随机失败，跳过
            crop_box = np.array([nx1, ny1, nx2, ny2])

            # 归一化
            offset_x1 = (x1 - nx1) / float(size)
            offset_y1 = (y1 - ny1) / float(size)
            offset_x2 = (x2 - nx2) / float(size)
            offset_y2 = (y2 - ny2) / float(size)

            cropped_im = img[int(ny1): int(ny2), int(nx1): int(nx2), :]
            resized_im = cv2.resize(cropped_im, (12, 12), interpolation=cv2.INTER_LINEAR)

            box_ = box.reshape(1, -1)
            if IoU(crop_box, box_) >= 0.65:#正样本
                save_file = os.path.join(pos_save_dir, "%s.jpg" % p_idx)
                f1.write(save_file + ' 1 %.2f %.2f %.2f %.2f\n' % (offset_x1, offset_y1, offset_x2, offset_y2))
                cv2.imwrite(save_file, resized_im)
                p_idx += 1
            elif IoU(crop_box, box_) >= 0.4 and d_idx < 1.2*p_idx + 1:#part样本，期望part图像的数目多于正样本的1.2倍
                save_file = os.path.join(part_save_dir, "%s.jpg" % d_idx)
                f3.write(save_file + ' -1 %.2f %.2f %.2f %.2f\n' % (offset_x1, offset_y1, offset_x2, offset_y2))
                cv2.imwrite(save_file, resized_im)
                d_idx += 1

代码很长，不逐行解释了，整体上是一个for循环套着两个for。关于小的for循环，前一个for，是在五次迭代中尽量取得一些negative样本，而后一个for循环，是在20次迭代中争取得到一些part和positive样本。
关于整体的这个大的for循环，其实可以发现是对于box的遍历，即对每个ground truth进行遍历。目的是什么呢？结合三种样本的crop过程，其实可以发现，这种crop是围绕在正确人脸框的周围进行随机取值，其实这已经是一种伪随机了。

比较重要但很容易忽视的一点是，代码中出现的宽w与高h，与之前的width、height代表的全图像尺寸不同，w与h是ground truth人脸框的大小，其实这样的取值才能保证crop出的三种样本均位于正确答案周围。

关于这种伪随机操作的意义，对于part与正样本来说，在正确答案周围的随机取值，得到指定数目样本的效率自然是大于在全图随机画框的方法；对于negative样本来说呢，在正确答案周围crop得到的负样本，或许更加具有迷惑性，是一种天然的“难样本”，这与后续代码中“难样本挖掘”的理念不谋而合。

至于循环数分别为5和20的原因，大概是为了使得各类样本的比例大致满足negatives：positives：part（：landmark）= 3：1：1（：2）了吧

其实还有一点质疑：为什么人脸框一定要选择一个正方形呢？毕竟胖成圆形的肉肉脸应该还是少数吧，或许可以在后续代码改进的过程中尝试维持宽度不变，而长度乘一个大于1的系数，假如说人脸的长宽比大致是1.5:1，这样可能更为合理，毕竟人脸框形状的选取也会影响IOU的计算，正方形的边框势必导致IOU的计算值较小，或许这一点会影响到模型的灵敏度，这个因素我们会在后面的模型复现中尝试改进。
其实我还没有很大量的看过数据集中的图像哈哈哈，不过我猜测作者可能有过我这种想法，但是数据集中人脸经常会出现不同的倾斜角度，这样的话，正方形的包容性显然比长方形更大了，如果是这样的话，作者大大应该在第五层~~至于具体如何选择，不同的数据集应该有不同的偏向性，还是要后续通过总结数据集特征和实验来证明。总的来说，这个因素我们会在后面的模型复现中尝试改进！
关于难样本挖掘的实现，作者是通过ohem思想改写损失函数，在loss函数运算的过程中，只在反向传播与梯度下降的过程中应用loss值在前70%的样本，也就是我们所说的难样本，还挺机智的是吧~
我发现论文中提到的nms，即非极大值抑制，只在网络的实例测试代码中有看到，而在训练过程中没有能够看到它的应用。这一点我暂时还没能搞明白，可能会和队友、老师讨论一下。

校招154W！DeepSeek待遇和核心成员曝光！ AI生成曾小健人工智能
校招154W！DeepSeek待遇和核心成员曝光！DeepSeek的薪酬模式极为慷慨，提供员工一年14薪的福利。其高薪职位如深度学习研究员，年薪最高可达税前154万元。同时，该公司也注重给予其他职位合理薪酬，如客户端研发工程师年薪30万，实习生日薪500元，并提供转正机会及房补。更有平台显示，DeepAGI大模型实习生日薪高达500-1000元。尽管这些待遇与硅谷相比仍有差距，但已相当优厚。Dee
我把DeepSeek-R1推理能力知识蒸馏到Qwen2，效果真的炸裂！！！ AI生成曾小健自然语言处理人工智能
我把DeepSeek-R1推理能力知识蒸馏到Qwen2，效果真的炸裂！！！关于NLP那些你不知道的事2025年01月29日13:08我把DeepSeek-R1推理能力知识蒸馏到Qwen2，效果真的炸裂！！！一、什么是知识蒸馏？知识蒸馏是一种模型压缩技术，用于将大型复杂模型（教师模型）的知识迁移到小型模型（学生模型）。其核心原理是教师模型通过预测结果（如概率分布或推理过程）向学生模型传授知识，学生模
（转） [it-ebooks]电子书列表 weixin_34233618
[it-ebooks]电子书列表[2014]:LearningObjective-CbyDevelopingiPhoneGames||LeverageXcodeandObjective-CtodevelopiPhonegameshttp://it-ebooks.info/book/3544/LearningWebAppDevelopment||BuildQuicklywithProvenJavaS
第十一届蓝桥杯——字串排序（DP） Dripping. 蓝桥杯练习题/试题算法
评论上有博友说这道题我的答案在蓝桥杯上只能通过7个数据点，我自己去测试了一下确实是这样的，根据一些博友在评论里提供的正确答案，我发现确实是我答案有问题，只能计算出最短长度，但字典序最小好像有些地方没有考虑完全，但是最近又很忙实在是抽不出时间来重新思考这道题，等过段时间我会重新来整理的。当然，如果你有正确的思路也希望你能够在评论里留下你的思路，万分感谢！问题描述小蓝最近学习了一些排序算法，其中冒泡排
Kafka 压缩算法详细介绍王多鱼的梦想～ kafka 分布式运维 apache
文章目录一、Kafka压缩算法概述二、Kafka压缩的作用2.1降低网络带宽消耗2.2提高Kafka生产者和消费者吞吐量2.3减少Kafka磁盘存储占用2.4减少KafkaBroker负载2.5降低跨数据中心同步成本三、Kafka压缩的原理3.1Kafka压缩的基本原理3.2.Kafka压缩的工作流程3.3Kafka压缩的数据存储格式四、Kafka压缩方式配置4.1Kafka生产者（Produce
《极致C语言》第2章 -- 从源文件到二进制文件 Fyang0906 极致C语言学习笔记 c语言 c++
《极致C语言》第2章–从源文件到二进制文件extreme-c-learning-notesch2《极致C语言》第2章--从源文件到二进制文件《极致C语言》第2章--从源文件到二进制文件1.编译过程1.1.构建C项目1.2.第1步--预处理1.3第2步--编译1.4第3步--汇编1.5第4步--链接2.预处理器3.编译器4.汇编器5.链接器1.编译过程预处理器编译器汇编器链接器C源代码通过：预处理-
深度学习过程是什么小松要进步李哥深度学习深度学习
问：深度学习是：一组原始数据，经过线性变换、非线性变换、偏差加和等操作后得到一组预测数据，再根据损失函数计算预测数据和原始数据的差值，用差值数据对权重和偏差求偏导，这里的偏导数的值也就是使得损失减小的最佳方向，然后根据偏导数的方向和步长更新权重和偏差，对吗答：您的描述大致正确，但有一些细节需要澄清和修正，以更准确地反映深度学习中模型训练的过程。以下是详细的解释：1.原始数据处理：一组原始数据首先通
大数据分析案例-基于逻辑回归算法构建抑郁非抑郁推文识别模型艾派森大数据分析案例合集机器学习人工智能 python 数据挖掘回归
‍♂️个人主页：@艾派森的个人主页✍作者简介：Python学习者希望大家多多支持，我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注+喜欢大数据分析项目的小伙伴，希望可以多多支持该系列的其他文章大数据分析案例合集
Java并发CAS中的ABA问题 fragrans Java Java 并发编程 CAS ABA
1.ABA产生的原因CAS会导致“ABA问题”。CAS算法实现一个重要前提需要取出内存中某时刻的数据并在当下时刻比较并替换，那么在这个时间差类会导致数据的变化。比如说一个线程1从内存位置V中取出A，这时候另一个线程2也从内存中取出A，并且线程2进行了一些操作将值变成了B，然后线程2又将V位置的数据变成了A，这时候线程1进行CAS操作发现内存中仍然是A，然后线程1操作成功。只关注开始和结尾，不关心中
TensorBoard可视化工具支持哪些类型的图表？ alankuo 人工智能
TensorBoard支持多种类型的图表，以下是详细介绍：标量图（Scalars）定义与用途：用于展示单个数值随时间（通常是训练步骤或迭代次数）的变化情况。在深度学习模型训练中，最常见的是损失函数值和评估指标（如准确率、精确率、召回率等）的变化曲线。示例：例如，在训练一个图像分类模型时，记录训练集和测试集上的损失函数值。通过标量图，可以直观地看到随着训练轮次（epochs）的增加，损失函数值是如何
Go Gin 框架学习笔记「已注销」 Go Web restful golang json
GoGin框架学习笔记Gin描述轻量级httpweb框架，允许速度非常快最擅长的是Api接口的高并发入门创建默认的路由引擎r=gin.Default()启动http服务，默认在8080端口r.Run(":8000")返回字符串c.String(200,"我是新闻页面")c.String(200,"值：%v","你好gin")gin支持RestFulr.PUT()r.GET()r.POST()r.D
【手写数据库内核组件】0301 缓存模型介绍，缓存分层架构与缓存映射算法，以及缓存淘汰替换算法，同步一致的策略韩楚风 C语言实战-手写数据库内核组件数据库缓存架构 c语言数据结构
0301缓存介绍专栏内容：postgresql使用入门基础手写数据库toadb并发编程个人主页：我的主页管理社区：开源数据库座右铭：天行健，君子以自强不息；地势坤，君子以厚德载物.文章目录0301缓存介绍一、概述二、多样的数据造就各异的缓存三、缓存的架构四、缓存算法4.1缓存组织算法4.2缓存映射算法4.3缓存替换算法4.4缓存同步算法五、总结结尾
Go语言学习笔记——gin实现验证码 PPPsych Go精进学习 gin
文章目录Golang验证码知识结构下载包导包配置session创建中间件生成图片生成验证码验证前端页面测试Golang验证码知识结构ginsession中间件表单处理路由下载包gogetgithub.com/dchest/captcha导包import("bytes""net/http""time""github.com/dchest/captcha""github.com/gin-contrib
gin框架学习笔记蛮吉(lambda) go gin json java 中间件
gin框架学习笔记官网reviewgin是用go编写的web框架，由于httprputer(基于radix树路由)速度快了40倍，支持中间件，路由组处理，json等多方式验证，内置了json/xml/html等渲染，是一个易于使用的go框架如果是用常量，比如http.statusOkimpport“net/http”gin使用默认的encoding/json作为默认的json包，但是可以通过其他标
留学生scratch计算机haskell函数ocaml编程ruby语言prolog作业VB matlabgoodboy ruby 开发语言后端
您列出了一系列编程语言和技术，这些可能是您在留学期间需要学习或完成作业的内容。以下是对每个项目的简要说明和它们可能涉及的领域或用途：Scratch：Scratch是一种图形化编程语言，专为儿童和初学者设计，用于教授编程基础概念。它通过拖拽代码块来创建程序，非常适合学习算法、逻辑和基本的编程概念。计算机（科学）：这是一个广泛的领域，涉及计算机硬件、软件、算法、数据结构、网络安全等多个方面。留学生可能
pytorch深度Q网络纠结哥_Shrek pytorch 人工智能 python
DQN引入了深度神经网络来近似Q函数，解决了传统Q-learning在处理高维状态空间时的瓶颈，尤其是在像Atari游戏这样的复杂环境中。DQN的核心思想是使用神经网络Q(s,a;θ)Q(s,a;\theta)Q(s,a;θ)来近似Q值函数，其中θ\thetaθ是神经网络的参数。DQN的关键创新包括：经验回放（ExperienceReplay）：在强化学习中，当前的学习可能会依赖于最近的经验，容易
学习python你必须弄懂的 Python、Pycharm、Anaconda 三者之间的关系经纬数智 python python pycharm 开发语言 conda
Python作为深度学习和人工智能学习的热门语言，学习一门语言，除了学会其简单的语法之外还需要对其进行运行和实现，才能实现和发挥其功能和作用。下面来介绍运行Python代码常用到的工具总结。一.Python、Pycharm、Anaconda关系介绍1.PythonPython是一种跨平台的计算机程序语言。是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。最初被设计用于编写自动化脚本(
代码随想录算法训练营第三十九天-动态规划-337. 打家劫舍 III taoyong001 算法动态规划 c++leetcode
老师讲这是树形dp的入门题目解题思路是以二叉树的遍历（递归三部曲）再结合动规五部曲dp数组如何定义：只需要定义一个二个元素的数组，dp[0]与dp[1]dp[0]表示不偷当前节点的最大价值dp[1]表示偷当前节点后的最大价值这样可以把每个节点的状态值都表示出来但这个数组的两个值只表示当前节点的状态值递归时要使用后序遍历：使用后序遍历的原因就是要从叶子结点一层一层向上统计出来/***Definiti
使用OpenSSL库接口，实现AES CBC加密，基于X509 base64编码证书的RSA非对称加密例子 GavinFj C语言相关工作学习总结算法数据安全
RSA加密的填充方式安全不一样，RSA算法PKCS1填充方式没有OAEP填充方式安全；同样的AES选择CBC模式更加安全。网上看了好多例子，都没有使用X509base64编码证书的RSAOAEP填充方式加密。研究记录下RSA、AES的加密，以供参考。话不多说，直接上demo。/*************************************************************
CUDA编程（一）：GPU计算与CUDA编程简介 AI Player CUDA 人工智能 CUDA NVIDIA
CUDA编程（一）：GPU计算与CUDA编程简介GPU计算GPU硬件资源GPU软件资源GPU存储资源CUDA编程GPU计算NVIDIA公司发布的CUDA是建立在GPU上的一个通用并行计算平台和编程模型，CUDA编程可以利用GPU的并行计算引擎来更加高效地解决比较复杂的计算难题。GPU的并行计算最成功的一个应用就是深度学习领域。GPU通常不作为一个独立运行的计算平台，而需要与CPU协同工作，它可以看
AI 大模型创业：如何利用商业优势？ AI天才研究院大数据AI人工智能 ChatGPT java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
第1章：AI大模型概述1.1AI大模型的概念与演进AI大模型（Large-scaleArtificialIntelligenceModels）是指通过大规模数据训练得到的复杂神经网络模型。这些模型通常具有数十亿甚至千亿个参数，能够实现从自然语言处理到计算机视觉、语音识别等广泛领域的任务。AI大模型的概念起源于20世纪80年代，当时研究人员提出了深度学习（DeepLearning）这一概念。深度学习
AI时代，大厂要被重新定义 AI浩编程哲学人工智能
在DeepSeekV3和DeepSeekR1爆火之后，李彦宏的预言又被人扒出来活了。他说：“中国不会再有OpenAI出现了，OpenAI能够成功是因为大厂都不会看好这个方向，现在，国内大厂都参与进来了，别的公司成功的概率就非常低了”。这样的观点放在互联网和移动互联网的时代，是非常正确的。从曾经的电商大战，到后来的团购争夺、再到后来的滴滴快滴的打车大战和共享单车之间厮杀无一例外的都是大厂背后的较量。
SpringBoot：RabbitMQ-延迟队列 csdnlaoban 程序员 java-rabbitmq spring boot rabbitmq
《一线大厂Java面试题解析+核心总结学习笔记+最新讲解视频+实战项目源码》，点击传送门，即可获取！com.alibabafastjson1.2.46org.springframework.bootspring-boot-starter-weborg.springframework.bootspring-boot-starter-testtest属性配置在application.propertie
语言模型与向量模型：深入解析与实例剖析 ♢.＊语言模型人工智能自然语言处理
亲爱的小伙伴们，在求知的漫漫旅途中，若你对深度学习的奥秘、Java与Python的奇妙世界，亦或是读研论文的撰写攻略有所探寻，那不妨给我一个小小的关注吧。我会精心筹备，在未来的日子里不定期地为大家呈上这些领域的知识宝藏与实用经验分享。每一个点赞，都如同春日里的一缕阳光，给予我满满的动力与温暖，让我们在学习成长的道路上相伴而行，共同进步✨。期待你的关注与点赞哟！在自然语言处理领域，语言模型和向量模型
Python 调用常见大模型 API 全解析 ♢.＊ python 开发语言语言模型 nlp
亲爱的小伙伴们，在求知的漫漫旅途中，若你对深度学习的奥秘、JAVA、PYTHON与SAP的奇妙世界，亦或是读研论文的撰写攻略有所探寻，那不妨给我一个小小的关注吧。我会精心筹备，在未来的日子里不定期地为大家呈上这些领域的知识宝藏与实用经验分享。每一个点赞，都如同春日里的一缕阳光，给予我满满的动力与温暖，让我们在学习成长的道路上相伴而行，共同进步✨。期待你的关注与点赞哟！调用通义千问接口获取APIKe
使用Ollama 在Ubuntu运行deepseek大模型：以DeepSeek-coder为例 skywalk8163 人工智能 ubuntu linux 人工智能 deepseek
DeepSeek大模型这几天冲上热搜啦！咱们来亲身感受下DeepSeek模型的魅力吧！整个操作流程非常简单方便，只需要2步，先安装Ollama，然后执行大模型即可。安装Ollama在Ubuntu下安装Ollama非常简单，直接snap安装即可：sudosnapinstallollama运行DeepSeek大模型直接用ollamarun后面跟模型名字即可，比如执行deepseek-coderolla
AI编译器之——为什么大模型需要Relax？ FF-Studio 人工智能深度学习自然语言处理机器学习语言模型
放在最前：Relax的关键创新深度学习模型（比如ChatGPT这种大模型）在运行时经常遇到“输入尺寸不固定”的情况。比如你问它一个问题，这次输入是10个字，下次可能是100个字。传统编译器处理这种“变来变去”的尺寸很笨——要么只能按固定尺寸优化（导致变尺寸时性能暴跌），要么每次都要重新编译（慢到没法用）。Relax的创新：符号形状：让编译器学会“代数”Relax允许编译器用“符号变量”（比如n）表
【DeepSeek】复现DeepSeek R1？快来看这个Open R1项目实践指南~ FF-Studio DeepSeek R1 语言模型自然语言处理深度学习人工智能
OpenR1项目基于DeepSeek-R1的技术报告和方法论，公开并复现R1的训练管线，并且希望所有开发者都能在这个基础上搭建自己的研究或应用。笔者研读了大量资料，对OpenR1的愿景、原理及在实践层面的具体操作，产生了许多想法。因此，这篇博客会从最初的概念入手，带领大家了解OpenR1的原理与技术细节，并侧重讲解其中最为关键的强化学习训练方法之一——GRPO(群组相对策略优化,GroupRela
实战LLM强化学习——使用GRPO（DeepSeek R1出圈算法） FF-Studio DeepSeek R1 算法语言模型人工智能自然语言处理机器学习
——关于使用Unsloth库、LoRa微调及GRPOTrainer自定义奖励函数实现“只输出10个英语单词”的探索为什么要进行“只输出10个英文单词”的极端尝试？在大模型的训练或微调当中，大多数场景我们都希望它能“自由发挥”，给出越丰富越好的答案。但，为了更好的理解强化学习在LLM训练过程中发挥的意义，也为了学习GPRO这个强化学习算法，笔者出此题目，方便大家学习理解。GRPO（GroupRela
deepseek v1手机端部署哎呀——哪是啥智能手机
在iPhone上部署DeepSeekR11.安装快捷指令：打开iPhone上的Safari浏览器，访问[这个链接](https://www.icloud.com/shortcuts/e0bc5445c39d45a78b90e1dc896cd010)下载快捷指令。下载后，按照提示完成安装。2.获取并配置APIKey：访问[这个链接](https://dev.hkgpt.top/shop/46)获取你
web前段跨域nginx代理配置刘正强 nginx cms Web
nginx代理配置可参考server部分 server { listen 80; server_name localhost;
spring学习笔记 caoyong spring
一、概述 a>、核心技术 : IOC与AOP b>、开发为什么需要面向接口而不是实现接口降低一个组件与整个系统的藕合程度，当该组件不满足系统需求时，可以很容易的将该组件从系统中替换掉，而不会对整个系统产生大的影响 c>、面向接口编口编程的难点在于如何对接口进行初始化,(使用工厂设计模式)
Eclipse打开workspace提示工作空间不可用 0624chenhong eclipse
做项目的时候，难免会用到整个团队的代码，或者上一任同事创建的workspace， 1.电脑切换账号后，Eclipse打开时，会提示Eclipse对应的目录锁定，无法访问，根据提示，找到对应目录，G:\eclipse\configuration\org.eclipse.osgi\.manager，其中文件.fileTableLock提示被锁定。解决办法，删掉.fileTableLock文件，重
Javascript 面向对面写法的必要性？一炮送你回车库 JavaScript
现在Javascript面向对象的方式来写页面很流行，什么纯javascript的mvc框架都出来了：ember 这是javascript层的mvc框架哦,不是j2ee的mvc框架我想说的是，javascript本来就不是一门面向对象的语言，用它写出来的面向对象的程序，本身就有些别扭，很多人提到js的面向对象首先提的是：复用性。那么我请问你写的js里有多少是可以复用的，用fu
js array对象的迭代方法换个号韩国红果果 array
1.forEach 该方法接受一个函数作为参数，对数组中的每个元素使用该函数 return 语句失效 function square(num) { print(num, num * num); } var nums = [1,2,3,4,5,6,7,8,9,10]; nums.forEach(square); 2.every 该方法接受一个返回值为布尔类型
对Hibernate缓存机制的理解归来朝歌 session 一级缓存对象持久化
在hibernate中session一级缓存机制中，有这么一种情况：问题描述：我需要new一个对象，对它的几个字段赋值，但是有一些属性并没有进行赋值，然后调用 session.save()方法，在提交事务后，会出现这样的情况： 1：在数据库中有默认属性的字段的值为空 2：既然是持久化对象，为什么在最后对象拿不到默认属性的值？通过调试后解决方案如下：对于问题一，如你在数据库里设置了
WebService调用错误合集 darkranger webservice
Java.Lang.NoClassDefFoundError: Org/Apache/Commons/Discovery/Tools/DiscoverSingleton 调用接口出错，一个简单的WebService import org.apache.axis.client.Call;import org.apache.axis.client.Service; 首先必不可
JSP和Servlet的中文乱码处理 aijuans Java Web
JSP和Servlet的中文乱码处理前几天学习了JSP和Servlet中有关中文乱码的一些问题，写成了博客，今天进行更新一下。应该是可以解决日常的乱码问题了。现在作以下总结希望对需要的人有所帮助。我也是刚学，所以有不足之处希望谅解。一、表单提交时出现乱码：在进行表单提交的时候，经常提交一些中文，自然就避免不了出现中文乱码的情况，对于表单来说有两种提交方式：get和post提交方式。所以
面试经典六问 atongyeye 工作面试
题记：因为我不善沟通，所以在面试中经常碰壁，看了网上太多面试宝典，基本上不太靠谱。只好自己总结，并试着根据最近工作情况完成个人答案。以备不时之需。以下是人事了解应聘者情况的最典型的六个问题： 1 简单自我介绍关于这个问题，主要为了弄清两件事，一是了解应聘者的背景，二是应聘者将这些背景信息组织成合适语言的能力。我的回答：(针对技术面试回答，如果是人事面试，可以就掌
contentResolver.query()参数详解百合不是茶 android query()详解
收藏csdn的博客,介绍的比较详细,新手值得一看 1.获取联系人姓名一个简单的例子，这个函数获取设备上所有的联系人ID和联系人NAME。 [java] view plain copy public void fetchAllContacts() {
ora-00054:resource busy and acquire with nowait specified解决方法 bijian1013 oracle 数据库 kill nowait
当某个数据库用户在数据库中插入、更新、删除一个表的数据，或者增加一个表的主键时或者表的索引时，常常会出现ora-00054:resource busy and acquire with nowait specified这样的错误。主要是因为有事务正在执行（或者事务已经被锁），所有导致执行不成功。 1.下面的语句
web 开发乱码征客丶 spring Web
以下前端都是 utf-8 字符集编码一、后台接收 1.1、 get 请求乱码 get 请求中，请求参数在请求头中；乱码解决方法： a、通过在web 服务器中配置编码格式：tomcat 中，在 Connector 中添加URIEncoding="UTF-8"； 1.2、post 请求乱码 post 请求中，请求参数分两部份， 1.2.1、url？参数，
【Spark十六】： Spark SQL第二部分数据源和注册表的几种方式 bit1129 spark
Spark SQL数据源和表的Schema case class apply schema parquet json JSON数据源准备源数据 {"name":"Jack", "age": 12, "addr":{"city":"beijing&
JVM学习之:调优总结 -Xms -Xmx -Xmn -Xss BlueSkator -Xss -Xmn -Xms -Xmx
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx355
jqGrid 各种参数详解(转帖) BreakingBad jqGrid
jqGrid 各种参数详解分类：源代码分享个人随笔请勿参考解决开发问题 2012-05-09 20:29 84282人阅读评论(22) 收藏举报 jquery 服务器 parameters function ajax string
读《研磨设计模式》-代码笔记-代理模式-Proxy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.lang.reflect.InvocationHandler; import java.lang.reflect.Method; import java.lang.reflect.Proxy; /* * 下面
应用升级iOS8中遇到的一些问题 chenhbc ios8 升级iOS8
1、很奇怪的问题，登录界面，有一个判断，如果不存在某个值，则跳转到设置界面，ios8之前的系统都可以正常跳转，iOS8中代码已经执行到下一个界面了，但界面并没有跳转过去，而且这个值如果设置过的话，也是可以正常跳转过去的，这个问题纠结了两天多，之前的判断我是在 -(void)viewWillAppear:(BOOL)animated 中写的，最终的解决办法是把判断写在 -(void
工作流与自组织的关系？ comsci 设计模式工作
目前的工作流系统中的节点及其相互之间的连接是事先根据管理的实际需要而绘制好的，这种固定的模式在实际的运用中会受到很多限制，特别是节点之间的依存关系是固定的，节点的处理不考虑到流程整体的运行情况，细节和整体间的关系是脱节的，那么我们提出一个新的观点，一个流程是否可以通过节点的自组织运动来自动生成呢？这种流程有什么实际意义呢？这里有篇论文，摘要是：“针对网格中的服务
Oracle11.2新特性之INSERT提示IGNORE_ROW_ON_DUPKEY_INDEX daizj oracle
insert提示IGNORE_ROW_ON_DUPKEY_INDEX 转自：http://space.itpub.net/18922393/viewspace-752123 在 insert into tablea ...select * from tableb中，如果存在唯一约束，会导致整个insert操作失败。使用IGNORE_ROW_ON_DUPKEY_INDEX提示，会忽略唯一
二叉树:堆 dieslrae 二叉树
这里说的堆其实是一个完全二叉树,每个节点都不小于自己的子节点,不要跟jvm的堆搞混了.由于是完全二叉树,可以用数组来构建.用数组构建树的规则很简单: 一个节点的父节点下标为: (当前下标 - 1)/2 一个节点的左节点下标为: 当前下标 * 2 + 1 &
C语言学习八结构体 dcj3sjt126com c
为什么需要结构体，看代码 # include <stdio.h> struct Student //定义一个学生类型，里面有age, score, sex, 然后可以定义这个类型的变量 { int age; float score; char sex; } int main(void) { struct Student st = {80, 66.6,
centos安装golang dcj3sjt126com centos
#在国内镜像下载二进制包 wget -c http://www.golangtc.com/static/go/go1.4.1.linux-amd64.tar.gz tar -C /usr/local -xzf go1.4.1.linux-amd64.tar.gz #把golang的bin目录加入全局环境变量 cat >>/etc/profile<
10.性能优化-监控-MySQL慢查询 frank1234 性能优化 MySQL慢查询
1.记录慢查询配置 show variables where variable_name like 'slow%' ; --查看默认日志路径查询结果：--不用的机器可能不同 slow_query_log_file=/var/lib/mysql/centos-slow.log 修改mysqld配置文件：/usr /my.cnf[一般在/etc/my.cnf，本机在/user/my.cn
Java父类取得子类类名 happyqing java this 父类子类类名
在继承关系中，不管父类还是子类，这些类里面的this都代表了最终new出来的那个类的实例对象，所以在父类中你可以用this获取到子类的信息！ package com.urthinker.module.test; import org.junit.Test; abstract class BaseDao<T> { public void
Spring3.2新注解@ControllerAdvice jinnianshilongnian @Controller
@ControllerAdvice，是spring3.2提供的新注解，从名字上可以看出大体意思是控制器增强。让我们先看看@ControllerAdvice的实现： @Target(ElementType.TYPE) @Retention(RetentionPolicy.RUNTIME) @Documented @Component public @interface Co
Java spring mvc多数据源配置 liuxihope spring
转自：http://www.itpub.net/thread-1906608-1-1.html 1、首先配置两个数据库 <bean id="dataSourceA" class="org.apache.commons.dbcp.BasicDataSource" destroy-method="close&quo
第12章 Ajax（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BW / Universe Mappings blueoxygen BO
BW Element OLAP Universe Element Cube Dimension Class Charateristic A class with dimension and detail objects (Detail objects for key and desription) Hi
Java开发熟手该当心的11个错误 tomcat_oracle java 多线程工作单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
推行国产操作系统的优劣 yananay windows linux 国产操作系统
最近刮起了一股风，就是去“国外货”。从应用程序开始，到基础的系统，数据库，现在已经刮到操作系统了。原因就是“棱镜计划”，使我们终于认识到了国外货的危害，开始重视起了信息安全。操作系统是计算机的灵魂。既然是灵魂，为了信息安全，那我们就自然要使用和推行国货。可是，一味地推行，是否就一定正确呢？先说说信息安全。其实从很早以来大家就在讨论信息安全。很多年以前，就据传某世界级的网络设备制造商生产的交