Felaim

DBFace: 源码阅读(二)

上篇链接

看LZ上篇博客的时间竟然是7月18日，着实是懈怠了，其实有很多东西需要总结归纳，这周末就补一下之前欠的债吧

上篇主要介绍了DBFace的大体框架，这篇主要介绍数据的预处理部分

5. 数据预处理

pytorch数据一般是要写一个类函数来继承Dataset类的，需要定义三个函数__init__(self), len(self), getitem(self)这三个函数，在DBFace中的代码如下所示：

class LDataset(Dataset):
    def __init__(self, labelfile, imagesdir, numlandmarks, mean, std, width=800, height=800):

        self.width = width
        self.height = height
        self.numlandmarks = numlandmarks
        self.items = common.load_webface(labelfile, imagesdir, numlandmarks)
        self.mean = mean
        self.std = std

    def __len__(self):
        return len(self.items)

    def __getitem__(self, index):
       ...

可以看到初始化还是比较简单的，主要是下载对应的参数，这边LZ其实是修改了一部分代码的，感兴趣的小伙伴可以在github上下载原始代码。

在初始化部分需要看的是这一行

self.items = common.load_webface(labelfile, imagesdir, numlandmarks)

我们来看下load_webface部分：

def load_webface(labelfile, imagesdir, numlandmarks):
    with open(labelfile, "r") as f:
        lines = f.readlines()
        lines = [line.replace("\n", "") for line in lines]

    stage = 0
    facials = []
    file = None
    files = []
    for index, line in enumerate(lines):
        if line.startswith("#"):
            if file is not None:
                files.append([f"{imagesdir}/{file}", parse_facials_webface(facials, numlandmarks)])

            file = line[2:]
            facials = []
        else:
            facials.append([float(item) for item in line.split(" ")])

    if file is not None:
        files.append([f"{imagesdir}/{file}", parse_facials_webface(facials, numlandmarks)])
    return files

widerface的label.txt如下所示：

# 0--Parade/0_Parade_marchingband_1_849.jpg
449 330 122 149 488.906 373.643 0.0 542.089 376.442 0.0 515.031 412.83 0.0 485.174 425.893 0.0 538.357 431.491 0.0 0.82
# 0--Parade/0_Parade_Parade_0_904.jpg
361 98 263 339 424.143 251.656 0.0 547.134 232.571 0.0 494.121 325.875 0.0 453.83 368.286 0.0 561.978 342.839 0.0 0.89
# 0--Parade/0_Parade_marchingband_1_799.jpg
...

“#”后面有一个空格，后面跟着图片名称，第二行分别是x，y，w，h也就是人脸框左上角的点坐标和对应框的宽度和高度，后面跟着关键点坐标，这个应该还是很好理解的，在parse_facials_webface 函数中要根据自己的关键点数量进行修改，这个看了源码应该很好理解

self.items里面就是保存的要读取图片的路径和对应人脸框和关键点的数据

 # 构建dataset部分,继承torch 的dataset类
        self.train_dataset = LDataset(labelfile, imagesdir, numlandmarks, mean=self.mean, std=self.std,
                                      width=self.width, height=self.height)
        self.train_loader = DataLoader(dataset=self.train_dataset, batch_size=self.batch_size, shuffle=True,num_workers=24)
        # 优化器adam,使用默认的weight_decay=0
        self.optimizer = torch.optim.Adam(self.model.parameters(), lr=self.lr)
        self.per_epoch_batchs = len(self.train_loader)
        self.iter = 0
        self.epochs = 150

使用DataLoader类生成一个迭代对象，在训练的时候可以给网络送不同的数据，优化器是adam，学习率是之前设置好的

# warm up一下
lr_scheduer = {
            1: 1e-3,
            2: 2e-3,
            3: 1e-3,
            60: 1e-4,
            120: 1e-5
        }

实际上很多数据的预处理是在训练的阶段进行的，DBFace中APP中的两个函数就是用来训练的

    def train_epoch(self, epoch):

        for indbatch, (images, heatmap_gt, heatmap_posweight, reg_tlrb, reg_mask, landmark_gt, landmark_mask, num_objs,
                       keep_mask) in enumerate(self.train_loader):

            self.iter += 1

            batch_objs = sum(num_objs)
            batch_size = self.batch_size

            if batch_objs == 0:
                batch_objs = 1

            heatmap_gt = heatmap_gt.to(self.gpu_master)
            heatmap_posweight = heatmap_posweight.to(self.gpu_master)
            keep_mask = keep_mask.to(self.gpu_master)
            reg_tlrb = reg_tlrb.to(self.gpu_master)
            reg_mask = reg_mask.to(self.gpu_master)
            landmark_gt = landmark_gt.to(self.gpu_master)
            landmark_mask = landmark_mask.to(self.gpu_master)
            images = images.to(self.gpu_master)

            hm, tlrb, landmark = self.model(images)
            # 把数据压到0-1的范围
            hm = hm.sigmoid()
            hm = torch.clamp(hm, min=1e-4, max=1 - 1e-4)
             # 为什么回归出来框坐标要进行exp处理？
             # 因为使用exp后的结果进行拟合，换句话说网络推断出来的是log（tlrb）
            tlrb = torch.exp(tlrb) 

            hm_loss = self.focal_loss(hm, heatmap_gt, heatmap_posweight, keep_mask=keep_mask) / batch_objs
            reg_loss = self.giou_loss(tlrb, reg_tlrb, reg_mask) * 5  # 这个权重要改吗?
            landmark_loss = self.landmark_loss(landmark, landmark_gt, landmark_mask) * 0.1
            loss = hm_loss + reg_loss + landmark_loss

            self.optimizer.zero_grad()
            loss.backward()
            self.optimizer.step()

            epoch_flt = epoch + indbatch / self.per_epoch_batchs

            if indbatch % 10 == 0:
                log.info(
                    f"iter: {self.iter}, lr: {self.lr:g}, epoch: {epoch_flt:.2f}, loss: {loss.item():.2f}, hm_loss: {hm_loss.item():.2f}, "
                    f"box_loss: {reg_loss.item():.2f}, lmdk_loss: {landmark_loss.item():.5f}"
                )

            if indbatch % 1000 == 0:
                log.info("save hm")
                hm_image = hm[0, 0].cpu().data.numpy()
                common.imwrite(f"{jobdir}/imgs/hm_image.jpg", hm_image * 255)
                common.imwrite(f"{jobdir}/imgs/hm_image_gt.jpg", heatmap_gt[0, 0].cpu().data.numpy() * 255)

                image = np.clip((images[0].permute(1, 2, 0).cpu().data.numpy() * self.std + self.mean) * 255, 0,
                                255).astype(np.uint8)
                outobjs = eval_tool.detect_images_giou_with_netout(hm, tlrb, landmark, threshold=0.1, ibatch=0)

                im1 = image.copy()
                for obj in outobjs:
                    common.drawbbox(im1, obj)
                common.imwrite(f"{jobdir}/imgs/train_result.jpg", im1)

    def train(self):
        # warm up?
        lr_scheduer = {
            1: 1e-3,
            2: 2e-3,
            3: 1e-3,
            60: 1e-4,
            120: 1e-5
        }

        # train

        self.model.train()
        for epoch in range(self.epochs):

            if epoch in lr_scheduer:
                self.set_lr(lr_scheduer[epoch])

            self.train_epoch(epoch)
            file = f"{jobdir}/models/{epoch + 1}.pth"
            common.mkdirs_from_file_path(f让ile)
            torch.save(self.model.module.state_dict(), file)

在训练的的函数中，pytorch就会调用LDataset中的__getitem__(self, index)，这个其实才是比较关键的数据预处理部分

    def __getitem__(self, index):
    # 获取对应的图片的路径，objs是对应图片中的人脸框和关键点，如果有多个人脸，就会有多个list
        imgfile, objs = self.items[index]
        image = common.imread(imgfile)

        if image is None:
            log.info("{} is empty, index={}".format(imgfile, index))
            return self[random.randint(0, len(self.items) - 1)]

        keepsize = 12
        # 进行数据增广
        image, objs = augment.webface(image, objs, self.numlandmarks, self.width, self.height, keepsize=0)

        # norm, 固定值可以放到NNIE上去做，进行数据归一化，这个可以在生成wk的时候做，也可以用网络做，当然也可以用cpu做，用neon加速
        # 现在真的每个操作都得节约时间，1ms也要节约，LZ哭了
        image = ((image / 255.0 - self.mean) / self.std).astype(np.float32)

        posweight_radius = 2  # 这个有啥用?,后面高斯核的半径
        # 这个是通过fpn，输出的feature map stride = 4，加速可以是stride=8，满脑子加速
        stride = 4
        fm_width = self.width // stride
        fm_height = self.height // stride

        # 这里需要根据关键点的数量进行修改，初始化一些map
        heatmap_gt = np.zeros((1, fm_height, fm_width), np.float32)
        heatmap_posweight = np.zeros((1, fm_height, fm_width), np.float32)
        keep_mask = np.ones((1, fm_height, fm_width), np.float32)
        reg_tlrb = np.zeros((1 * 4, fm_height, fm_width), np.float32)
        reg_mask = np.zeros((1, fm_height, fm_width), np.float32)
        distance_map = np.zeros((1, fm_height, fm_width), np.float32) + 1000
        # 我有25个关键点，有x，y坐标，要改成25×2
        # landmark_gt = np.zeros((1 * 10, fm_height, fm_width), np.float32)
        # landmark_mask = np.zeros((1, fm_height, fm_width), np.float32)
        landmark_gt = np.zeros((1 * 50, fm_height, fm_width), np.float32)
        landmark_mask = np.zeros((1, fm_height, fm_width), np.float32)

        hassmall = False
        for obj in objs:
            isSmallObj = obj.area < keepsize * keepsize

            if isSmallObj:
                cx, cy = obj.safe_scale_center(1 / stride, fm_width, fm_height)
                keep_mask[0, cy, cx] = 0
                w, h = obj.width / stride, obj.height / stride

                x0 = int(common.clip_value(cx - w // 2, fm_width - 1))
                y0 = int(common.clip_value(cy - h // 2, fm_height - 1))
                x1 = int(common.clip_value(cx + w // 2, fm_width - 1) + 1)
                y1 = int(common.clip_value(cy + h // 2, fm_height - 1) + 1)
                #这个是计算loss的时候的一个参数，也就是说只有有人脸的区域才参与loss的计算，如果不是人脸区域，不参与loss的计算
                if x1 - x0 > 0 and y1 - y0 > 0:
                    keep_mask[0, y0:y1, x0:x1] = 0
                hassmall = True

        for obj in objs:

            classes = 0
            cx, cy = obj.safe_scale_center(1 / stride, fm_width, fm_height)
            reg_box = np.array(obj.box) / stride #框的坐标除以对应的stride
            isSmallObj = obj.area < keepsize * keepsize

            if isSmallObj:
                if obj.area >= 5 * 5:
                    distance_map[classes, cy, cx] = 0
                    reg_tlrb[classes * 4:(classes + 1) * 4, cy, cx] = reg_box  # 通道数代表你回归的框的坐标乘以类别
                    reg_mask[classes, cy, cx] = 1
                continue

            w, h = obj.width / stride, obj.height / stride
            x0 = int(common.clip_value(cx - w // 2, fm_width - 1))
            y0 = int(common.clip_value(cy - h // 2, fm_height - 1))
            x1 = int(common.clip_value(cx + w // 2, fm_width - 1) + 1)
            y1 = int(common.clip_value(cy + h // 2, fm_height - 1) + 1)
            if x1 - x0 > 0 and y1 - y0 > 0:
                keep_mask[0, y0:y1, x0:x1] = 1
			# 参考cornernet
            w_radius, h_radius = common.truncate_radius((obj.width, obj.height))  # size/(4*stride)
            gaussian_map = common.draw_truncate_gaussian(heatmap_gt[classes, :, :], (cx, cy), h_radius, w_radius)

            mxface = 300
            miface = 25
            mxline = max(obj.width, obj.height)
            gamma = (mxline - miface) / (mxface - miface) * 10
            gamma = min(max(0, gamma), 10) + 1
            common.draw_gaussian(heatmap_posweight[classes, :, :], (cx, cy), posweight_radius, k=gamma)

            range_expand_x = math.ceil(w_radius)
            range_expand_y = math.ceil(h_radius)

            min_expand_size = 3
            range_expand_x = max(min_expand_size, range_expand_x)
            range_expand_y = max(min_expand_size, range_expand_y)

            icx, icy = cx, cy
            reg_landmark = None
            fill_threshold = 0.3
            # 这里也需要根据关键点数量进行修改
            if obj.haslandmark:
                reg_landmark = np.array(obj.x5y5_cat_landmark) / stride
                # x5y5 = [cx] * 5 + [cy] * 5
                x5y5 = [cx] * 25 + [cy] * 25
                rvalue = (reg_landmark - x5y5)
                # landmark_gt[0:10, cy, cx] = np.array(common.log(rvalue)) / 4
                # 注意这里的log
                landmark_gt[0:50, cy, cx] = np.array(common.log(rvalue)) / 4
                landmark_mask[0, cy, cx] = 1

            if not obj.rotate:
                for cx in range(icx - range_expand_x, icx + range_expand_x + 1):
                    for cy in range(icy - range_expand_y, icy + range_expand_y + 1):
                        if cx < fm_width and cy < fm_height and cx >= 0 and cy >= 0:

                            my_gaussian_value = 0.9
                            gy, gx = cy - icy + range_expand_y, cx - icx + range_expand_x
                            if gy >= 0 and gy < gaussian_map.shape[0] and gx >= 0 and gx < gaussian_map.shape[1]:
                                my_gaussian_value = gaussian_map[gy, gx]

                            distance = math.sqrt((cx - icx) ** 2 + (cy - icy) ** 2)
                            if my_gaussian_value > fill_threshold or distance <= min_expand_size:
                                already_distance = distance_map[classes, cy, cx]
                                my_mix_distance = (1 - my_gaussian_value) * distance

                                if my_mix_distance > already_distance:
                                    continue

                                distance_map[classes, cy, cx] = my_mix_distance
                                reg_tlrb[classes * 4:(classes + 1) * 4, cy, cx] = reg_box
                                reg_mask[classes, cy, cx] = 1

        # if hassmall:
        #     common.imwrite("test_result/keep_mask.jpg", keep_mask[0]*255)
        #     common.imwrite("test_result/heatmap_gt.jpg", heatmap_gt[0]*255)
        #     common.imwrite("test_result/keep_ori.jpg", (image*self.std+self.mean)*255)
        return T.to_tensor(image), heatmap_gt, heatmap_posweight, reg_tlrb, reg_mask, landmark_gt, landmark_mask, len(
            objs), keep_mask

6. 数据增广

数据增广函数在argument.py脚本中

def webface(image, objs, numlandmarks, outw=800, outh=800, keepsize=8):
    funcs = [[augmentWithColorJittering, 0.7], [augmentWithFlip, 0.7]]
    random.shuffle(funcs)
    num = len(funcs)
    for n in range(num):
        func, freq = funcs[n]
        if randrf(0, 1) < freq:
            image, objs = func(image, objs)

    if randrf(0, 1) > 0.5:
        image, objs = cubeTransform(image, objs, outw, outh, keepsize=keepsize)
        image, objs = augmentWithCropScaleWebface(image, objs, numlandmarks, outw, outh, 'cube', keepsize=keepsize)
    else:
        image, objs = augmentWithCropScaleWebface(image, objs, numlandmarks, outw, outh, keepsize=keepsize)

    return image, objs

主要是：

augmentWithColorJittering：对颜色的数据增强，包括图像的亮度，对比度和饱和度
augmentWithFlip：水平翻转，这个当中需要注意的是关键点要根据水平翻转后也要进行镜像处理
augmentWithCropScaleWebface：随机裁剪和尺度变换
cubeTransform：立方体转换

后面一篇准备写下网络推断部分，未完待续。。。

Python自动化办公实战：PDF文本提取技巧乔代码嘚 Python python脚本 python 自动化 pdf
哈喽大家好，今天来给大家介绍Python-PDF文本提取技巧PDF文件具有跨平台的特点，可以在不同的操作系统和设备上保持一致的显示效果。但是，PDF文件也有一些缺点，比如不易编辑、复制和搜索。如果我们想要从PDF文件中提取文本内容，该怎么办呢？在本教程中，我们将介绍如何使用Python中的PyPDF2库来提取PDF文件中的内嵌文字内容。PyPDF2是一个纯Python的库，可以读取、分割、合并、裁
机器学习数学通关指南——牛顿-莱布尼茨公式 Shockang 机器学习数学通关指南机器学习数学微积分
前言本文隶属于专栏《机器学习数学通关指南》，该专栏为笔者原创，引用请注明来源，不足和错误之处请在评论区帮忙指出，谢谢！本专栏目录结构和参考文献请见《机器学习数学通关指南》正文一句话总结∫abf(x) dx=F(b)−F(a)\int_{a}^{b}f(x)\,dx=F(b)-F(a)∫abf(x)dx=F(b)−F(a)其中，F(x)F(x)F(x)是f(x)f(x)f(x)的一个原函数（即F′(
终于明白了！人工智能、机器学习、深度学习、集成学习及大模型的定义与联系大模型玩家人工智能机器学习深度学习产品经理算法学习方法集成学习
在当今快速发展的科技领域，人工智能（ArtificialIntelligence,AI）、机器学习（MachineLearning,ML）、深度学习（DeepLearning,DL）、集成学习（EnsembleLearning）以及大模型（LargeModels）等概念频繁出现在人们的视野中。它们不仅推动了科技的进步，也深刻影响了社会生活的方方面面。本文将对这些概念进行全面解析，并探讨它们之间的联
Python酷库之旅-第三方库Pandas(021) 神奇夜光杯 python pandas 开发语言标准库及第三方库基础知识学习与成长
目录一、用法精讲52、pandas.from_dummies函数52-1、语法52-2、参数52-3、功能52-4、返回值52-5、说明52-6、用法52-6-1、数据准备52-6-2、代码示例52-6-3、结果输出53、pandas.factorize函数53-1、语法53-2、参数53-3、功能53-4、返回值53-5、说明53-6、用法53-6-1、数据准备53-6-2、代码示例53-6-3
机器学习笔记——特征工程好评笔记补档机器学习笔记人工智能 AIGC 深度学习计算机视觉面试八股
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本笔记介绍机器学习中常见的特征工程方法、正则化方法和简要介绍强化学习。热门专栏机器学习机器学习笔记合集深度学习深度学习笔记合集文章目录热门专栏机器学习深度学习特征工程（FzeatureEngineering）1.特征提取（FeatureExtraction）手工特征提取（ManualFeatureExtraction）：自
DeepSeek基础之机器学习珠峰日记机器学习 ai 人工智能
文章目录一、核心概念总结（一）机器学习基本定义（二）基本术语（三）假设空间（四）归纳偏好（五）“没有免费的午餐”定理（NFL定理）二、重点理解与思考（一）泛化能力的重要性（二）归纳偏好的影响（三）NFL定理的启示三、应用场景联想（一）电商推荐系统（二）医疗诊断四、机器学习的基本流程（一）问题定义（二）数据收集与预处理（三）模型选择与训练（四）模型评估与优化（五）模型部署与应用五、机器学习的挑战（一
[python]windows上安装pyaudio最简单方法萌萌哒240 python python windows 开发语言
PyAudio是一个用于处理音频流的Python库，它依赖于PortAudio库。如果直接使用pip命令无法安装PyAudio，可以尝试通过whl文件进行安装。以下是PyAudio通过whl文件安装的详细方法：一、准备阶段下载PyAudio的whl文件访问可靠的Python包分发网站，如镜像站点https://gitee.com/FIRC/pythonlibs_whl_mirror，或者使用其他可
【PyTorch 实战2：UNet 分割模型】10min揭秘 UNet 分割网络如何工作以及pytorch代码实现（详细代码实现） xiaoh_7 pytorch 网络图像处理计算机视觉
UNet网络详解及PyTorch实现一、UNet网络原理 U-Net，自2015年诞生以来，便以其卓越的性能在生物医学图像分割领域崭露头角。作为FCN的一种变体，U-Net凭借其Encoder-Decoder的精巧结构，不仅在医学图像分析中大放异彩，更在卫星图像分割、工业瑕疵检测等多个领域展现出强大的应用能力。UNet是一种常用于图像分割的卷积神经网络架构，其特点在于其U型结构，包括一个收缩路径
【PyTorch项目实战】图像分割 —— U-Net：Semantic segmentation with PyTorch 胖墩会武术深度学习 PyTorch项目实战 python unet pytorch
文章目录一、项目介绍二、项目实战2.1、环境搭建2.1.1、下载源码2.1.2、下载预训练模型2.1.3、下载训练集2.2、环境配置2.3、代码优化+架构优化2.4、模型预测：predict.pyU-Net是一种用于生物医学图像分割的卷积神经网络架构，最初由OlafRonneberger等人于2015年提出。论文：U-Net:ConvolutionalNetworksforBiomedicalIm
【亲测可行】最新ubuntu搭建rknn-toolkit2 computer_vision_chen 带你跑通人工智能项目 YOLO rknn 嵌入式AI
文章目录结构图（ONNX->RKNN）下载rknn-toolkit2搭建环境配置镜像源conda搭建python3.8版本的虚拟环境进入packages目录安装依赖库测试安装是否成功其它rknn-toolkit2rknn_model_zoo关于部署的博客发布本文的时间为2024.10.13rknn-toolkit2版本为2.2.0结构图（ONNX->RKNN）下载rknn-toolkit2gitc
Python微调DeepSeek-R1-Distill-Qwen-1.5B模型：使用Transformers和PyTorch进行训练煤炭里de黑猫 pytorch python 人工智能机器学习
前言近年来，基于Transformer架构的预训练语言模型如GPT、BERT等已经取得了显著的成果，广泛应用于自然语言处理（NLP）的各个领域。为了让这些模型更加适应特定任务，我们通常会进行微调（Fine-tuning）。本博客将详细介绍如何微调一个名为Qwen-1.5B的模型，使用HuggingFace的Transformers库与PyTorch框架来实现。我们将通过一步步的代码解析，帮助你理解
【matlab数学建模项目】matlab实现HSV空间的森林火灾监测系统——森林火灾监测系统阿里matlab建模师 matlab精品科研项目数学建模 matlab 开发语言科研项目算法美赛全国大学生数学建模竞赛
MATLAB实现HSV空间森林火灾监测系统1、项目下载：本项目完整讲解和全套实现源码见下资源，有需要的朋友可以点击进行下载说明文档（点击下载）全套源码+学术论文基于MATLAB的HSV空间森林火灾监测系统的技术实现与应用-机器学习-HSV色彩空间-图像处理-森林火灾监测-matlab更多阿里matlab精品数学建模项目可点击下方文字链接直达查看：matlab精品数学建模项目合集（算法+源码+论文）
基于UNet对DRIVE视网膜进行图像分割海洋之心深度学习 pytorch 人工智能 python
前言大家好，我是阿光。本专栏整理了《PyTorch深度学习项目实战100例》，内包含了各种不同的深度学习项目，包含项目原理以及源码，每一个项目实例都附带有完整的代码+数据集。正在更新中~✨我的项目环境：平台：Windows10语言环境：python3.7编译器：PyCharmPyTorch版本：1.8.1项目专栏：【PyTorch深度学习项目实战100例】一、基于UNet对DRIVE视网膜进行图像
函数式编程：概念、特性与应用老猿讲编程函数编程 python
1.函数式编程简介函数式编程，从名称上看就与函数紧密相关。它是一种我们常常使用却可能并未意识到的编程范式，关注代码的结构组织，强调一个纯粹但在实际中有些理想化的不可变世界，涉及数学、方程和副作用等概念，甚至还有有趣的“柯里化”。接下来，我们将探讨函数式编程与以往编程方式的不同之处。代码示例以下是一个简单的Python示例，展示了函数式编程中函数作为一等公民的特性：#定义一个简单的函数defadd(
yolov5转onnx模型，onnx转rknn模型部署在rk3588平台上 wtqpshhh YOLO python
安装python等环境，以及相关依赖库，然后克隆YOLOv5仓库的源码。#安装anaconda参考前面环境搭建教程，然后使用conda命令创建环境condacreate-nyolov5python=3.9condaactivateyolov5#拉取最新的yolov5(教程测试时是v7.0)，可以指定下版本分支#gitclonehttps://github.com/ultralytics/yolov
python3.8安装lxml库,Python3爬虫利器之lxml解析库的安装 Intopia
lxml是Python的一个解析库，支持HTML和XML的解析，支持XPath解析方式，而且解析效率非常高。本节中，我们了解一下lxml的安装方式，这主要从Windows、Linux和Mac三大平台来介绍。1.相关链接官方网站：http://lxml.deGitHub：https://github.com/lxml/lxmlPyPI：https://pypi.python.org/pypi/lxm
针对视频内容进行检测开源项目红豆和绿豆开源音视频
以下是10个可以实现视频是否涉及擦边或黄色内容检测的免费开源GitHub项目推荐：1.**OpenNSFW2**OpenNSFW2是一个用于检测图片和视频是否包含成人内容的开源库。它基于深度学习模型，能够实时分析视频帧并给出概率值，判断内容是否涉及黄色。2.**Watsor**Watsor是一个开源项目，支持实时视频流的物体检测。它允许通过配置检测区域和掩码，限制检测范围，并支持多种视频源输入。3
机器学习01 天行者@ 机器学习人工智能深度学习
机器学习的基本过程如下：1.数据获取2.数据划分3.特征提取4.模型选择与训练5.模型评估6.模型调优一、特征工程（重点）0.特征工程步骤为：特征提取(如果不是像dataframe那样的数据，要进行特征提取，比如字典特征提取，文本特征提取)无量纲化(预处理)归一化标准化降维底方差过滤特征选择主成分分析-PCA降维1.特征工程API实例化转换器对象，转换器类有很多，都是Transformer的子类,
机器学习02 天行者@ 机器学习人工智能深度学习
三、模型选择与调优1交叉验证(1)保留交叉验证HoldOutHoldOutCross-validation（Train-TestSplit）优点1.简单高效操作简便：这种方法的实现非常直接，只需要将原始数据集按照一定比例（常见的如70:30、80:20等）随机划分为训练集和测试集。例如，在Python的scikit-learn库中，使用train_test_split函数可以轻松完成划分，代码简洁
Python从0到100（三十三）：xpath和lxml类库是Dream呀 python 开发语言
1.为什么要学习xpath和lxmllxml是一款高性能的PythonHTML/XML解析器，我们可以利用XPath，来快速的定位特定元素以及获取节点信息2.什么是xpathXPath，全称为XMLPathLanguage，是一种用于在XML文档中进行导航和数据提取的语言，可用来在HTML\XML文档中对元素和属性进行遍历。W3School官方文档：http://www.w3school.com.
filelock，一个超酷的 Python 库！笑笑2520 python
Pythonfilelock库是一个用于文件锁定的工具，可以帮助开发者在多线程或多进程环境中管理文件的并发访问，避免数据竞争和冲突。本文将介绍如何安装和使用Pythonfilelock库，以及它的特性、基本功能、高级功能、实际应用场景和总结部分。安装可以使用pip工具轻松安装Pythonfilelock库：pipinstallfilelock安装完成后，可以在项目中导入filelock模块：fro
【算法 | Python】高斯消元法 weixin_43964993 算法 python 算法 python numpy
程序来源：GaussianEliminationArithmeticAnalysis原理说明源代码代码说明原理说明高斯消元法(GaussElimination)【超详解&模板】高斯消元法-百度百科源代码"""Gaussianeliminationmethodforsolvingasystemoflinearequations.Gaussianelimination-https://en.wikip
获取指定的python库安装路径 Xian-HHappy 技术知识点 python 开发语言
DataBall助力快速掌握数据集的信息和使用方式，会员享有百种数据集，持续增加中。需要更多数据资源和技术解决方案，知识星球：“DataBall-X数据球(free)”贵在坚持！----------------------------------------------------------------以下是获取指定的python库安装路径的脚步试下：importnumpyasnp#获取nump
在python中使用wkhtmltopdf结合jinja2库实现pdf的批量转换与导出鱼鱼鱼-YYY pdf python
目录1、简介1.1基本流程1.2wkhtmltopdf工具简介2、具体使用2.1安装并配置所需工具和库2.2结合上述几种工具实现pdf批量导出1、简介1.1基本流程（1）、本次采用html模版文件，使用jinja2库将数据动态渲染进入html模版，并生成新的html文件；（2）、使用wkhtmltopdf工具将html文件转换为pdf文件1.2wkhtmltopdf工具简介（1）、wkhtmlto
python读取excel丨换一种存储格式, 读取速度提升几倍 python技巧(数据分析及可视化) python数据分析技巧 python 数据分析数据挖掘文件读取 excel
您好,本博客将持续更新python数据分析技巧,一次解决一个问题，欢迎关注订阅!本次介绍提升excel文件读取速度问题工作中我们会有一些大文件(excel,csv等),作为基础数据经常会读取,如何减少读取时间,提升效率呢?今天用了一个88万行13列的表格,按不同的方式读取比较读取用时如下:excel文件:文大小61.9M,读取用时200秒csv文件:文件大小194M,读取用时5秒hdf文件:文件大
React之从0开始（2） ️○- 杂谈 react.js 前端前端框架
书接上回。我们介绍了index.html的基本结构。那么我就在想了，为啥必须得是index.html呢？我能不能换个名字？谁规定的运行React项目就要从index.html开始？好吧，应该是Facebook规定的。。。。。那没事了。反正结论就是不能改。如果硬要改，也不是不行，但是你得同时修改Vite或者其他构建工具的配置。然后我们还会发现，新建的一个项目里面有一个文件package.json。这
python开发翻译软件&PDF文档识别转换翻译 Juniper_fly AI模型 PDF格式转换 Python开发程序 python 开发语言
一、通过Helsinki-NLP模型实现离线翻译接口参考文档：https://blog.csdn.net/mzl87/article/details/1271234451.1、开发环境配置系统环境：WIN10开发环境：pycharm开发语言环境：Python3.8.10-64bitpip21.1.1（pip降级：python-mpipinstallpip==21.1.1）常用命令：查看python
使用 Helsinki-NLP 中英文翻译本地部署 - python 实现 Xian-HHappy 技术知识点自然语言处理 python 人工智能中英文翻译模型本地部署
通过Helsinki-NLP本地部署中英文翻译功能。该开源模型性价比相对高，资源占用少，对于翻译要求不高的应用场景可以使用，比如单词，简单句式的中英文翻译。该示例使用的模型下载地址：【免费】Helsinki-NLP中英文翻译本地部署-python实现模型资源-CSDN文库模型也可以在huggingface下载。1、英文翻译为中文示例：#-*-coding:utf-8-*-#date:2024#Au
python求2数之和 yangguanglukou1 算法 python 算法
1.题目给定一个整数数组nums和一个整数目标值target，请你在该数组中找出和为目标值target的那两个整数，并返回它们的数组下标。2.示例输入：nums=[2,7,11,15],target=9输出：[0,1]解释：因为nums[0]+nums[1]==9，返回[0,1]。来源：力扣（LeetCode）链接：https://leetcode-cn.com/problems/two-sum著
【Python】Python客户端开发 Python_魔力猿 python 开发语言
前言：工作需求，需要开发一个处理Execl数据并转换为Mike格式的小工具，因此选定了Python+openpyxl+re+pandas作为自己的开发框架，tkinter作为GUI展示框架，整个系统开发时间在半天左右技术选型openpyxl和pandas都是处理execl的第三方库，pandas功能较openpyxl相比更强大，本项目中的需要对execl表格进行排序，openpyxl只能添加排序头
web报表工具FineReport常见的数据集报错错误代码和解释老A不折腾 web报表 finereport 代码可视化工具
在使用finereport制作报表，若预览发生错误，很多朋友便手忙脚乱不知所措了，其实没什么，只要看懂报错代码和含义，可以很快的排除错误，这里我就分享一下finereport的数据集报错错误代码和解释，如果有说的不准确的地方，也请各位小伙伴纠正一下。 NS-war-remote=错误代码\:1117 压缩部署不支持远程设计 NS_LayerReport_MultiDs=错误代码
Java的WeakReference与WeakHashMap bylijinnan java 弱引用
首先看看 WeakReference wiki 上 Weak reference 的一个例子： public class ReferenceTest { public static void main(String[] args) throws InterruptedException { WeakReference r = new Wea
Linux——（hostname）主机名与ip的映射 eksliang linux hostname
一、什么是主机名无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。但IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。域名类型 linuxsir.org 这样的；主机名是用于什么的呢？答：在一个局域网中，每台机器都有一个主
oracle 常用技巧 18289753290
oracle常用技巧 ①复制表结构和数据 create table temp_clientloginUser as select distinct userid from tbusrtloginlog ②仅复制数据如果表结构一样 insert into mytable select * &nb
使用c3p0数据库连接池时出现com.mchange.v2.resourcepool.TimeoutException 酷的飞上天空 exception
有一个线上环境使用的是c3p0数据库，为外部提供接口服务。最近访问压力增大后台tomcat的日志里面频繁出现 com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.v2.resourcepool.BasicResou
IT系统分析师如何学习大数据蓝儿唯美大数据
我是一名从事大数据项目的IT系统分析师。在深入这个项目前需要了解些什么呢？学习大数据的最佳方法就是先从了解信息系统是如何工作着手，尤其是数据库和基础设施。同样在开始前还需要了解大数据工具，如Cloudera、Hadoop、Spark、Hive、Pig、Flume、Sqoop与Mesos。系统分析师需要明白如何组织、管理和保护数据。在市面上有几十款数据管理产品可以用于管理数据。你的大数据数据库可能
spring学习——简介 a-john spring
Spring是一个开源框架，是为了解决企业应用开发的复杂性而创建的。Spring使用基本的JavaBean来完成以前只能由EJB完成的事情。然而Spring的用途不仅限于服务器端的开发，从简单性，可测试性和松耦合的角度而言，任何Java应用都可以从Spring中受益。其主要特征是依赖注入、AOP、持久化、事务、SpringMVC以及Acegi Security 为了降低Java开发的复杂性，
自定义颜色的xml文件 aijuans xml
<?xml version="1.0" encoding="utf-8"?> <resources> <color name="white">#FFFFFF</color> <color name="black">#000000</color> &
运营到底是做什么的？ aoyouzi 运营到底是做什么的？
文章来源：夏叔叔（微信号：woshixiashushu），欢迎大家关注！很久没有动笔写点东西，近些日子，由于爱狗团产品上线，不断面试，经常会被问道一个问题。问：爱狗团的运营主要做什么？答：带着用户一起嗨。为什么是带着用户玩起来呢？究竟什么是运营？运营到底是做什么的？那么，我们先来回答一个更简单的问题——互联网公司对运营考核什么？以爱狗团为例，绝大部分的移动互联网公司，对运营部门的考核分为三块——用
js面向对象类和对象百合不是茶 js 面向对象函数创建类和对象
接触js已经有几个月了,但是对js的面向对象的一些概念根本就是模糊的,js是一种面向对象的语言但又不像java一样有class,js不是严格的面向对象语言 ,js在java web开发的地位和java不相上下 ,其中web的数据的反馈现在主流的使用json,json的语法和js的类和属性的创建相似下面介绍一些js的类和对象的创建的技术一:类和对
web.xml之资源管理对象配置 resource-env-ref bijian1013 java web.xml servlet
resource-env-ref元素来指定对管理对象的servlet引用的声明，该对象与servlet环境中的资源相关联 <resource-env-ref> <resource-env-ref-name>资源名</resource-env-ref-name> <resource-env-ref-type>查找资源时返回的资源类
Create a composite component with a custom namespace sunjing
https://weblogs.java.net/blog/mriem/archive/2013/11/22/jsf-tip-45-create-composite-component-custom-namespace When you developed a composite component the namespace you would be seeing would
【MongoDB学习笔记十二】Mongo副本集服务器角色之Arbiter bit1129 mongodb
一、复本集为什么要加入Arbiter这个角色回答这个问题，要从复本集的存活条件和Aribter服务器的特性两方面来说。什么是Artiber？ An arbiter does not have a copy of data set and cannot become a primary. Replica sets may have arbiters to add a
Javascript开发笔记白糖_ JavaScript
获取iframe内的元素通常我们使用window.frames["frameId"].document.getElementById("divId").innerHTML这样的形式来获取iframe内的元素，这种写法在IE、safari、chrome下都是通过的，唯独在fireforx下不通过。其实jquery的contents方法提供了对if
Web浏览器Chrome打开一段时间后，运行alert无效 bozch Web chorme alert 无效
今天在开发的时候，突然间发现alert在chrome浏览器就没法弹出了，很是怪异。试了试其他浏览器，发现都是没有问题的。开始想以为是chorme浏览器有啥机制导致的，就开始尝试各种代码让alert出来。尝试结果是仍然没有显示出来。这样开发的结果，如果客户在使用的时候没有提示，那会带来致命的体验。哎，没啥办法了就关闭浏览器重启。结果就好了，这也太怪异了。难道是cho
编程之美-高效地安排会议图着色问题贪心算法 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Collections; import java.util.List; import java.util.Random; public class GraphColoringProblem { /**编程之美高效地安排会议图着色问题贪心算法 * 假设要用很多个教室对一组
机器学习相关概念和开发工具 chenbowen00 算法 matlab 机器学习
基本概念：机器学习(Machine Learning, ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，它主要使用归纳、综合而不是演绎。开发工具 M
[宇宙经济学]关于在太空建立永久定居点的可能性 comsci 经济
大家都知道,地球上的房地产都比较昂贵,而且土地证经常会因为新的政府的意志而变幻文本格式........ 所以,在地球议会尚不具有在太空行使法律和权力的力量之前,我们外太阳系统的友好联盟可以考虑在地月系的某些引力平衡点上面,修建规模较大的定居点
oracle 11g database control 证书错误 daizj oracle 证书错误 oracle 11G 安装
oracle 11g database control 证书错误 win7 安装完oracle11后打开 Database control 后，会打开em管理页面，提示证书错误，点“继续浏览此网站”，还是会继续停留在证书错误页面解决办法：是 KB2661254 这个更新补丁引起的，它限制了 RSA 密钥位长度少于 1024 位的证书的使用。具体可以看微软官方公告：
Java I/O之用FilenameFilter实现根据文件扩展名删除文件游其是你 FilenameFilter
在Java中，你可以通过实现FilenameFilter类并重写accept(File dir, String name) 方法实现文件过滤功能。在这个例子中，我们向你展示在“c:\\folder”路径下列出所有“.txt”格式的文件并删除。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
C语言数组的简单以及一维数组的简单排序算法示例，二维数组简单示例 dcj3sjt126com c array
# include <stdio.h> int main(void) { int a[5] = {1, 2, 3, 4, 5}; //a 是数组的名字 5是表示数组元素的个数，并且这五个元素分别用a[0], a[1]...a[4] int i; for (i=0; i<5; ++i) printf("%d\n",
PRIMARY, INDEX, UNIQUE 这3种是一类 PRIMARY 主键。就是唯一且不能为空。 INDEX 索引，普通的 UNIQUE 唯一索引 dcj3sjt126com primary
PRIMARY, INDEX, UNIQUE 这3种是一类PRIMARY 主键。就是唯一且不能为空。INDEX 索引，普通的UNIQUE 唯一索引。不允许有重复。FULLTEXT 是全文索引，用于在一篇文章中，检索文本信息的。举个例子来说，比如你在为某商场做一个会员卡的系统。这个系统有一个会员表有下列字段：会员编号 INT会员姓名
java集合辅助类 Collections、Arrays shuizhaosi888 Collections Arrays HashCode
Arrays、Collections 1 ）数组集合之间转换 public static <T> List<T> asList(T... a) { return new ArrayList<>(a); } a）Arrays.asL
Spring Security（10）——退出登录logout 234390216 logout Spring Security 退出登录 logout-url LogoutFilter
要实现退出登录的功能我们需要在http元素下定义logout元素，这样Spring Security将自动为我们添加用于处理退出登录的过滤器LogoutFilter到FilterChain。当我们指定了http元素的auto-config属性为true时logout定义是会自动配置的，此时我们默认退出登录的URL为“/j_spring_secu
透过源码学前端之 Backbone 三 Model 逐行分析JS源代码 backbone 源码分析 js学习
Backbone 分析第三部分 Model 概述： Model 提供了数据存储，将数据以JSON的形式保存在 Model的 attributes里，但重点功能在于其提供了一套功能强大，使用简单的存、取、删、改数据方法，并在不同的操作里加了相应的监听事件，如每次修改添加里都会触发 change，这在据模型变动来修改视图时很常用，并且与collection建立了关联。
SpringMVC源码总结（七）mvc:annotation-driven中的HttpMessageConverter 乒乓狂魔 springMVC
这一篇文章主要介绍下HttpMessageConverter整个注册过程包含自定义的HttpMessageConverter，然后对一些HttpMessageConverter进行具体介绍。 HttpMessageConverter接口介绍： public interface HttpMessageConverter<T> { /** * Indicate
分布式基础知识和算法理论 bluky999 算法 zookeeper 分布式一致性哈希 paxos
分布式基础知识和算法理论 BY [email protected] 本文永久链接：http://nodex.iteye.com/blog/2103218 在大数据的背景下，不管是做存储，做搜索，做数据分析，或者做产品或服务本身，面向互联网和移动互联网用户，已经不可避免地要面对分布式环境。笔者在此收录一些分布式相关的基础知识和算法理论介绍，在完善自我知识体系的同
Android Studio的.gitignore以及gitignore无效的解决 bell0901 android gitignore
　　github上.gitignore模板合集，里面有各种.gitignore ： https://github.com/github/gitignore 　　自己用的Android Studio下项目的.gitignore文件，对github上的android.gitignore添加了　　　　　　# OSX files　　　　　　//mac os下　　　　　　.DS_Store
成为高级程序员的10个步骤 tomcat_oracle 编程
What 软件工程师的职业生涯要历经以下几个阶段：初级、中级，最后才是高级。这篇文章主要是讲如何通过 10 个步骤助你成为一名高级软件工程师。 Why 得到更多的报酬！因为你的薪水会随着你水平的提高而增加提升你的职业生涯。成为了高级软件工程师之后，就可以朝着架构师、团队负责人、CTO 等职位前进历经更大的挑战。随着你的成长，各种影响力也会提高。
mongdb在linux下的安装 xtuhcy mongodb linux
一、查询linux版本号： lsb_release -a LSB Version: :base-4.0-amd64:base-4.0-noarch:core-4.0-amd64:core-4.0-noarch:graphics-4.0-amd64:graphics-4.0-noarch:printing-4.0-amd64:printing-4.0-noa

DBFace: 源码阅读(二)

5. 数据预处理

6. 数据增广

你可能感兴趣的:(paper,face,detection,深度学习,深度学习,python,计算机视觉,机器学习,pytorch)