MiDnight_city

【Python | AI】人工智能实训笔记

文章目录

WEEK1
- day01
- - Python介绍
- day02
- - QT应用开发：哈哈镜
- day03
- - QT多线程：播放视频文件
  - 实践：截图视频图像实现哈哈镜
WEEK2
- day04
- - 创建新线程来逐帧捕获视频文件（本地文件、摄像头实时影像）
  - 人工智能、机器学习、深度学习相关
  - 线性单元与梯度下降
- day05
- - 用Pytorch实现梯度下降算法
- day06
- - 神经网络
  - 全连接神经网络
  - 卷积神经网络
  - torch卷积函数
  - 卷积神经网络LeNet-5实现
  - Torch框架结构说明
WEEK3
- day07
- - 任务发布
- day08
- - 开发阶层
  - 手写数字识别（开发第三层）
  - - loader.py
    - train.py
    - lenet.py
- day09
- - 垃圾识别
  - - loaddataset.py
    - train.py
    - recognize.py
  - 目标侦测
WEEK4
- dat10
- - YOLO4训练测试识别
  - - run_app.bat
    - run_detect.bat
- day11
- - - trans.py
    - mydetect.py
- day12
- - 人脸识别

WEEK1

day01

Python介绍

( )：包含的是元组

[ ]：包含的是列表

{ }：包含的是对象

day02

QT应用开发：哈哈镜

开发前提：安装PyQt5，Numpy，OpenCV

day03

QT多线程：播放视频文件

实践：截图视频图像实现哈哈镜

http://39.98.127.39:3000/zhangyuhao2018302110032/WHU_AI_exercise

WEEK2

day04

创建新线程来逐帧捕获视频文件（本地文件、摄像头实时影像）

人工智能、机器学习、深度学习相关

人工智能 > 机器学习 > 深度学习

经典编程输入数据和规则，得到答案

机器学习输入数据和答案，得到规则

机器学习和深度学习的区别

传统机器学习算法使用手写特征提取代码来训练算法
机器学习算法在结构化数据上运行良好，如：销售预测、推荐系统、个性化营销
深度学习算法使用现代化技术自动提取特征
深度学习得益于GPU运算、大数据、云服务、torch、TensorFlow框架的发展
深度学习：图像分类、语音识别、机器翻译、自动驾驶汽车

线性单元与梯度下降

线性运算模型
$y = h (x) = ω * x + b$
x成为特征，为一维向量；函数h(x)称为假设；ω、b为参数；输出y为特征x₁、x₂、x₃……的线性组合
$y = h(x) = ω^Tx(T表示转置)$
机器学习就是利用训练数据x、y来找到最合适的ω和b，即规律

监督学习和无监督学习

监督学习：已知特征x，标记y（实际值），根据模型h(x)得到输出y¯即预测值，用公式计算误差，修改算法减小误差

样本误差用两者的差的平方的二分之一表示
$\frac{1}{2}(y-\bar{y})^2$

e为单个样本的误差

多个样本误差为
$\begin{aligned} E(ω) &= e^{(1)}+e^{(2)}+e^{(3)}+…+e^{(n)}\\ &=\sum_{i=1}^n{e^{(i)}}\\ &=\frac{1}{2}\sum_{i=1}^n{(y^{(i)}-\bar{y}^{(i)})^2} \end{aligned}$
想要得到最优算法，就是取E(ω)的最小值，就是找到合适的ω使E取最小值，利用梯度下降算法实现

梯度下降算法

所有测试数据产生的误差组成的向量，用梯度下降算法减小误差，优化AI算法

原理：自变量向梯度的相反方向迭代，找到极值点

方法：用x_new = x_old - grad*η迭代找到最后的x

最后的实现
$ω_{new} = w_{old} + η\sum_{i=1}^n{(y^{(i)}-\bar{y}^{(i)})x^{(i)}}$
神经元

线性模型就是一个神经网络的一层的，也是一个线性模型的神经元

多层神经网络就是将上一层输入的y当做x输入到下一层进行计算，直到最后一层输入的y为预测值

技术框架选择：TensorFlow、Pytorch

UI实现：Qt

day05

用Pytorch实现梯度下降算法

先将普通列表利用torch.Tensor()转换成torch的张量
再开启该张量的跟踪操作，记录tensor的所有操作
计算完成后用backward()方法自动计算所有梯度
该张量的梯度将累积到.grad属性中

利用torch求导

import torch
x = torch.Tensor([5])
x.requires_grad=True
y = x**2
y.backward()
print(x.grad)
z = 2*x
z.backward()
print(x.grad)

输出：

tensor([10.])
tensor([12.])

不管对x进行了多少次计算，只要在每次计算后调用backward()方法，就会把梯度累加到.grad属性上

Numpy实现梯度下降

import numpy as np
x = 0
grad_fn = lambda x: 2*x-2
learning_rate = 0.01
epoch = 1000
x_list = []
for e in range(epoch):
    x_grad = grad_fn(x)
    x -= learning_rate * x_grad
    x_list.append(x)
print(x)

实现图表的可视化工具

import matplotlib.pyplot as plt
plt.plot(range(epoch),x_list)
plt.show()

Pytorch实现梯度下降

import torch
x = torch.Tensor([1000.0])# 100
x.requires_grad = True

learning_rate = 0.01
opoch = 1000
x_list = []
for e in range(epoch):
    #1. 损失函数
    y = x ** 2 -2 * x + 1
    #2. 求导
    y.backward(retain_graph=True)
    #废除导数跟踪环境
    with torch.autograd.no_grad():
        # 3更新
        x -= learning_rate * x.grad
        # 4 记录
        x_list.append(x.detach().clone().numpy())
        x.grad.zero_()
print(x.detach().clone().numpy())

损失函数：需要被求导的函数即为损失函数，y表示损失或者是误差。等价于E(ω)=f(ω)

废除跟踪环境：在求导后需要更新x，此时需要废除跟踪，并清除累积的grad

数据集分类（鸢尾花）学习实现

准备数据集

import sklearn
import sklearn.datasets
data,target = sklearn.datasets.load_iris(return_X_y=True)
print(data.shape)
print(target.shape)

data为x张量，即150朵花，每朵花的4个属性；target为y张量，即150朵花的分类

输出：

(150,4)
(150,)

截取数据：切片截取

x = torch.Tensor(data[0:100])
y = torch.Tensor(target[0:100]).view(100,1)

x的矩阵为100*4的形状，为了让x和y一一对应，将y转置成100*1的形状

创建学习参数

w = torch.randn(1,4)
b = torch.randn(1)
#记录操作
w.requires_grad = True
b.requires_grad = True
#轮数10000
epoch = 10000
#学习率
learning_rate = 0.0001

w随机生成，符合正态分布；b随机生成；epoch一般来说越大越好；learning_rate一般为小数，根据测试情况改变大小

网络模型

for e in range(epoch):
    #算法模型（此处为线性模型）
	y_ = torch.nn.functional.linear(input=x,weight=w,bias=b)
    #激活函数：把y_变成能与y计算误差的值
    sy_ = torch.sigmoid(y_)
    #损失函数：计算误差
    loss = torch.nn.functional.binary_cross_entropy(sy_,y,reduction="mean")
    #求导
    loss.backward()
    
    with torch.autograd.no_grad():
        #优化器：更新参数w = w - 导数*学习率
        w -= learning_rate * w.grad
        b -= learning_rate * b.grad
        #清零
        w.grad.zero_()
        b.grad.zero_()
        
        sy_[sy_>0.5] = 1
        sy_[sy_<=0.5] = 0
        #准确率
        correct_rate = (sy_ == y).float().mean()

利用torch提供的线性函数来计算出y_；利用激活函数把y_变成能和目标值y计算误差的预测值；利用损失函数计算预测值y_和目标值y的误差；对loss求导得到w和b的梯度；在优化器中利用梯度下降算法更新参数；计算准确率实时观察学习效果，求平均值mean()只能在float类型上处理

day06

神经网络

由许多神经元组成，每一个神经元都是一个优化模型

神经元的学习：梯度下降算法优化学习参数

神经网络的学习：反向传播算法优化学习参数

深度学习

神经网络中的神经元被分为若干层，层间神经元有连接，层内的神经元无连接。最左边的叫输入层，负责接受输入数据。最右边的叫输出层，可以从该层获取输出数据。中间的部分叫做隐藏层。隐藏层大于2的神经网络叫做深度神经网络，深度学习就是使用深层架构（如深度神经网络）的机器学习方法

反向传播算法

旨在得到最优的全局参数矩阵

前向传递输入信号直至产生误差，反向传播误差信息更新权重

常见损失函数

binary_cross_entropy(input, target, weight=None, size_average=None, reduce=None, reduction)：对数损失函数，没有做逻辑分布函数运算

binary_cross_entropy_with_logits(input, target, weight=None, size_average=None, reduce=None, reduction, pos_weight=None)：自动做逻辑分布函数运算

poisson_nll_loss(input, target, log_input, full, size_average, eps, reduce, reduction)：泊松负对数似然损失

……等

常见激活函数

threshold(input, threshold, value, inplace=False)：线性函数的阈值，本质是relu的功能增强版

relu(input, inplace=False)：线性整流函数，又称修正线性单元

……等

全连接神经网络

如果第n层的每个神经元与第n-1层的每个神经元全部相连；第n-1层的神经元的输出就是第n层神经元的输入；每个连接都有一个权值，那么该网络为全连接神经网络

多层全连接神经网络的实现

思路：神经网络分层为 4 -> 12 -> 6 -> 3；预测模型：采用默认求导实现，激活函数采用sigmoid；损失模型：采用交叉熵损失函数

演算：

第一层：150个元素，使用4个神经元表示每个元素4个特征。则用一个150*4的张量存储

第二层：使用12个神经元表示每个元素由4个特征计算得12个新特征，则用12个4*1的向量w即一个12*4的张量进行计算，每个4特征的元素与12个4*1的w计算得出该元素12个新特征。结果用一个150*12的张量存储

第三层：使用6个神经元表示每个元素由12个特征计算得6个新特征，则用6个12*1的向量w即一个6*12的张量进行计算，每个12特征的元素与6个12*1的w计算得出该元素的6个新特征。结果用一个150*6的张量存储

第四层：使用3个神经元表示每个元素由6个特征计算得3个新特征，则用3个6*1的向量w即一个3*6的张量进行计算，每个6特征的元素与3个6*1的w计算得出该元素的3个新特征。结果用一个150*3的张量存储

卷积神经网络

如果处理的是图片数据，使用线性网络会使图片像素的位置特征丢失，所以需要使用其他神经网络

图像的特征：两个像素点的差值/两个像素点的位置距离

卷积运算

用n*n的卷积核在m*m的图像中移动，使用卷积核对应的权重与图像中对应像素相乘并求和，得到卷积特征，然后卷积核右移（到边界后回到下一行的最左端）。得到所有卷积特征形成一个m-n+1*m-n+1的新图像。如果不想图片变小，可以用0补边

卷积核：卷积核本质是一个数值矩阵，由矩阵的大小和值来决定；卷积用来作为权重，卷积核就是一个权重矩阵

卷积操作：卷积操作就是加权求和操作，由步长和加权求和确定

卷积特征：卷积操作后得到的数值成为卷积特征，所有的卷积特征构成新的图像

补边

经过卷积操作的卷积特征图像与原始图像大小不同。为了使卷积特征图像大小与原始图像相同，采用补边方法。即在卷积操作前，对原始图像周边增加几圈0元素（也可以补1等其他值）

池化

也称向下采样，与卷积操作基本相同，不过向下采用只取对应位置的最大值、平均值等（最大池化、平均池化），采样的值成为池化特征

池化的步长与池化核的边长相同

torch卷积函数

主要使用2D卷积做图像处理

卷积函数

torch.nn.functional.conv2d(input, weight, bias=None, stride=1, padding=0, dilation=1, group)：input为一个四维张量（批量数，深度，高度，宽度）；weight为（输出数，深度，高度，宽度）；bias偏移量为一维张量；stride步长；padding补边长度；dilation卷积核的间隔

tips：读取图像后，需要将其转化成灰度图像，即单通道的二维图片，然后利用torch.Tensor().view()转化成一个四维张量

池化函数

torch.nn.functional.avg_pool2d(input, kernel_size, stride=None, padding=0, ceil_mode=False, count_include_pad=True, divisor_override=None)：平均池化函数。input同卷积函数；kernel_size为池化核大小；padding为补边大小；count_include_pad表示计算平均的时候是否考虑padding的0；ceil_mode表示当计算输出形状时，采用取最大还是最小

torch.nn.functional.max_pool2d(\*arg, \*\*kwargs)：最大池化函数。同平均池化一样，就是运算方式不同

卷积神经网络LeNet-5实现

演算：

输入为N张深度为1层的32*32的图像

第一层：1层32*32的图像经过6个5*5的卷积核，每个卷积核分别和图像的每一层进行卷积运算，共得到6张28*28的卷积特征图像，即6层28*28的图像。再经过2*2的池化核进行池化得到6层14*14的池化特征图像，输出给下层

第二层：6层14*14的图像经过16个5*5的卷积核，每个卷积核分别和图像的每一层进行卷积运算，同一卷积核下的6张图像进行元素相加变成1张10*10的图像，共得到16层10*10的图像。再经过2*2的池化核进行池化得到16层5*5的池化特征图像，输出给下层

第三层：16层5*5的图像经过120个5*5的卷积核分别进行卷积运算，每个卷积核分别和图像的每一层进行卷积运算，同一卷积核下的16张图像进行元素相加变成1张1*1的图像，共得到120层1*1的图像，即一个大小为120的一维张量，输出给下层

第四层：由全连接的线性层将120个特征转换成84个特征，输出给下层

第五层：由全连接的线性层将84个特征转换成10个特征，输出10个特征

Torch框架结构说明

核心模块

基本模块：函数调用torch；数据结构管理torch.Tensor；数据存储管理torch.Stroage；数据类型管理torch.finfo与torch.iinfo

机器学习和深度学习运算模块：torch.nn.functional

自动求导模块：求导函数backward和grad；上下文管理enable_grad、no_grad、set_grad_enabled(mode)

前向传播深度学习模块：决策模型容器封装；决策模型的运算封装；训练参数封装；其他运算的封装

数据集管理模块：数据集管理，包含数据切分、随机洗牌、交叉验证

样本数据集模块：获取训练数据集

GPU运算模块：torch.cuda

分布式运算模块：torch.distributed

其他模块：持久化模型存储、模型评估、可视化仪表盘、调试诊断

WEEK3

day07

任务发布

完整的功能设计文档

目录
功能设计
类图、类图说明、类详细设计（时序图）
技术分层
- UI层
- 数据处理层
- AI功能实现
  - 模型训练
  - 模型测试
  - 模型使用的封装

技术文档（md格式）

学习笔记两篇

code

源代码、安装包、答辩包

类图

需要提交类图

包管理

QT包管理、AI包管理、项目脚本、工具脚本

模块发布

配置setup.py
使用python setup.py sdist命令打包
使用python setup.py install命令安装

setup.py：

from distutils.core import setup
setup(
	name="haha",
    version="1.0",
    description="haha",
    author="ming"
    package=[
        "app",
        "app.uis"
    ],
    scripts=["haha.bat"]
)

工作场景使用Git服务器

组员操作

git init
git remote add origin ...git
git pull --rebase origin master
git branch ming 创建自己的分支
git checkout ming 切换到自己的分支
工作新建代码文件 coding...
git pull --rebase origin master 拉取远程主分支最新代码
git add .
git commit -m "提交注释"
git push -u origin ming
下班
上班
git pull --rebase origin master 拉取远程主分支最新代码
工作新建代码文件 coding
git pull --rebase origin master 拉取远程主分支最新代码
git add .
git commit -m "提交注释"
git push -u origin ming
下班

组长操作

git clone ......git
git checkout -b ming origin/ming b选项指定本地分支名
git checkout master
git merge ming 把ming分支的代码合并到主分支
git push --set-upstream origin master 把合并后的代码推送到主分支

day08

开发阶层

自定义学习模型，自定义求导函数，自定义更新权重
自定义学习模型，使用第三方库求导，使用第三方库更新权重，自定义层级结构
自定义学习模型，使用第三方库求导，使用第三方库更新权重，使用第三方库定义层级结构
使用第三方库模型

手写数字识别（开发第三层）

loader.py

读取图片、标签

import struct
import numpy as np
# 读取图片
def load_image_fromfile(filename):
    with open(filename, 'br') as fd:
        # 读取图像的信息
        header_buf = fd.read(16)   # 16字节，4个int整数
        # 按照字节解析头信息（具体参考python SL的struct帮助）  解包
        magic_, nums_, width_, height_ = struct.unpack('>iiii', header_buf)  # 解析成四个整数：>表示大端字节序，i表示4字节整数
        # 保存成ndarray对象
        imgs_ = np.fromfile(fd, dtype=np.uint8)
        imgs_ = imgs_.reshape(nums_, height_, width_)
    return imgs_

# 读取标签
def load_label_fromfile(filename):
    with open(filename, 'br') as fd:
        header_buf = fd.read(8) 
        magic, nums = struct.unpack('>ii' ,header_buf) 
        labels_ = np.fromfile(fd, np.uint8) 
    return labels_

train.py

读取训练数据集

import loader
import torch
import torch.utils.data
from lenet import LeNet5
train_x = loader.load_image_fromfile('data/train-images.idx3-ubyte') 
train_y = loader.load_label_fromfile('data/train-labels.idx1-ubyte')

读取测试数据集

test_x = loader.load_image_fromfile('data/t10k-images.idx3-ubyte')
test_t = loader.load_label_fromfile('data/t10k-labels.idx1-ubyte')

将数据转换成（N, C, H, W）格式的四维张量

import torch
x = torch.Tensor(train_x).view(train_x.shape[0],1,train_x.shape[1],train_x.shape[2])
y = torch.Tensor(train_y)

t_x = torch.Tensor(test_x).view(test_x.shape[0],1,test_x.shape[1],test_x.shape[2])
t_y = torch.Tensor(test_y)

使用torch封装数据

train_dataset = torch.utils.data.TensorDataSet(x,y)
test_dataset = torch.utils.data.TensorDataSet(t_x,t_y)

在之后取数据的时候可以直接用过utils的方法按批次来取

数据随机加载，按批切分

train_loader = torch.utils.data.DataLoader(dataset=train_dataset,shuffle=True,batch_size=2000)
test_loader = torch.utils.data.DataLoader(dataset=test_dataset,shuffle=True,batch_size=10000)

参数shuffle表示将数据随机打乱再取

训练模型：模型、优化器、损失函数、训练轮数、学习率

from lenet import LeNet5
model = LeNet5() #forward()的调动方法model(input)
params = model.paramaters()
cri = torch.nn.CrossEntropLoss() #损失函数
opt = torch.optim.Adam(model.parameters(), lr=0.001) #优化器、学习率
epoch = 2 #训练轮数
for e in range(epoch):
	#1轮 整个训练数据集学习一次
	for data,target in train_loader:
        #批处理：批梯度下降，权重更新
        opt.zero_grad()
        out = model(data)
        loss = cri(out, target)
        loss.backward()
        opt.step()
      
    #计算准确率 建议一百轮打印一次
    with torch.no_grad():
        for data,target in test_loader:
            y_ = model(data)
            predict = torch.argmax(y_,dim=1)
            c_rate = (predict == target).float().mean()
            print(F"准确率:{c_rate*100:5.2f}%")
            
	#保存模型：保存整个网络结构和参数 通过torch.load()使用
    torch.save(model,"lenet.pth")

可用可视化在线工具查看模型结构

torch.save(model.state_dict, "lenet.pth")只保存参数，不能用可视化工具查看

lenet.py

import torch
class LeNet5(torch.nn.Module):
    #重写__init__, forward()
    #定义层
    def __init__(self):
        super(LeNet5,self).__init__()
        #层 torch.nn.层
        #原始数据N=60000, C=1, H=28, W=28
        #第一层卷积 1@28*28 卷积得（含padding）6@28*28 池化得6@14*14
        self.layer1 = torch.nn.Conv2d(in_channels=1, out_channels=6, kernel_size=(5,5), padding=2)
        #第二层卷积 6@14*14 卷积得16@10*10 池化得16@5*5
        self.layer2 = torch.nn.Conv2d(in_channels=6, out_channels=16, kernel_size(5,5), padding=0)
        #第三层卷积 16@5*5 卷积得120@1*1
        self.layer3 = torch.nn.Conv2d(in_channels=16, out_channels=120, kernel_size=(5,5), padding=0)
        #第四层全连接 120 线性运算得84
        self.layer4 = torch.nn.Linear(120, 84)
        #第五层全连接 84 线性运算得10
        self.layer5 = torch.nn.Linear(84, 10)
    
    #计算
    def forward(self, input):
        #第一层计算
        t = self.later1(input)
        #激活函数
        t = torch.nn.functional.relu(t)
        #池化
        t = torch.nn.functional.max_pool2d(t, kernel_size=(2,2))
        
        #第二层计算
        t = self.layer2(t)
        t = torch.nn.functional.relu(t)
        t = torch.nn.functional.max_pool2d(t, kernel_size=(2,2))
        
        #第三层计算
        t = self.layer3(t)
        t = torch.nn.functional.relu(t)
        #降维操作
        t = t.squeeze()
       
        #第四层计算
        t = self.layer4(t)
        t = torch.nn.functional.relu(t)
        
        #第五层操作
        t = self.layer5(t)
        t = torch.nn.functional.log_softmax(t, dim=1)
        return t

线性层可以不作为层级结构，仅作为计算方式使用，方法为torch.nn.functional.linear()

同理池化可以作为层级结构使用，方法为torch.nn.MaxPool2d()

day09

垃圾识别

ImageFolder类

负责加载图像数据集

ImageFolder(root, transform=None, target_transform=None, loader=, is_valid_file=None)：root为指定图像的目录；transform为对图像的转换；target_transform为对标签的转换；loader为指定加载函数；is_valid_file为对文件进行格式验证

通过OpenCV读取到的图片是NumPy类型，通过ImageFolder读取到的图片是PIL类型

ImageFolder返回的数组，每个元素包含一个图片和一个类别下标

包含的属性：classes，列表类型，包含所有类别的名字；class_to_idx，字典类型，包含类名和类别下标；imgs，列表类型，包含图片路径和类别下标

loaddataset.py

加载图像数据集和训练前的预处理

from torchvision.datasets import ImageFolder 
from torchvision.transforms import Compose, ToTensor, Normalize, RandomHorizontalFlip, RandomVerticalFlip, RandomResizedCrop
# 随机切片的模块   数据加载器模块
from torch.utils.data import random_split, DataLoader
# 加载目录数据集的功能函数 进行预处理和训练数据 测试数据切分  返回数据加载器
# 数据目录   拆分比例    一批的图片个数
def load_data(img_dir, rate=0.8, batch_size=128):   
    #Compose 定义转换结构，是一个管道（[,,,,,,]）
    transform = Compose(
        [
            #修改尺寸 224*224
            RandomResizedCrop((224,224)),
            RandomHorizontalFlip(),
            RandomVerticalFlip(),
            # 转换为张量   并且值 0-1
            ToTensor(),     
            # 均值与方差（必须放在ToTensor之后）
            #[0.5,0.8.0.9]
            #(x1-mean1)/std1 序列化可以改变张量中元素的范围
            Normalize(mean=[0.5,0.5293289,0.48351972], std=[0.5,0.21455203,0.22451781]) # 均值与方差 （必须Tensor图像）
        ]
    )
    # ImageFolder（地址，数据转换管道（一系列预处理操作））
    ds = ImageFolder(img_dir,transform=transform) 
    #训练数据 测试数据切分 
    l = len(ds)
    #训练数据个数l_train    测试数据个数l-l_train
    l_train = int(l*rate)
    # 数据  [l_train ,l-l_train]
    train,test = random_split(ds,[l_train,l-l_train])
    #print(train[0])# 图片tensor数据  类别下标
    #print(train[0][1])
    #print(ds.classes)
    #print(ds.class_to_idx) 类别和类别下标的关系字典
    #print(ds.imgs)
    
    train_loader = DataLoader(dataset=train, shuffle=True, batch_size=batch_size)
    test_loader = DataLoader(dataset=test, shuffle=True, batch_size=batch_size)

    return train_loader, test_loader, ds.class_to_idx

# train_loader,test_loader,class_to_idx = load_data('./image')
# print(class_to_idx)

train.py

构建训练网络，封装训练模型

import torch 
from torchvision.models import resnet18 #18层残差网络  神经网络
from model.loaddataset import load_data # 数据加载模块
import os, sys # 系统模块
# 训练模型 封装一个训练模型的过程
# 定义神经网络  加载数据集  是否使用GPU   训练（轮 损失 优化）   测试准确率
class TrainResNet:
    # 构造函数  数据集路径ds_dir   轮数  学习率
    def __init__(self, ds_dir = './data', epoch = 10, lr = 0.0001):
        super(TrainResNet,self).__init__()

        print("训练准备.......")#开始
        # 二进制模型文件
        self.model_file= "./gb.mod"
        # self.CUDA true false
        self.CUDA = torch.cuda.is_available()
        # 1、数据集  self.tr, self.ts, self.cls_idx
        self.tr, self.ts, self.cls_idx = load_data(ds_dir, batch_size = 128)

        #模型是可以累加的 100 + 100
        # 2、网络
        if os.path.exists(self.model_file):
            print("加载本地模型")
            # 定义 self.net  = 残差神经网络（pretrained=False）
            self.net = resnet18(pretrained=False)
            # 设置类别个数 1000-40
            fc_features = self.net.fc.in_features
            #resnet网络最后一层分类层fc是对1000种类型进行划分， layer   
            self.net.fc = torch.nn.Linear(fc_features,40) # 40分类
            
            #torch中的所有数据和操作都可以加.cuda()，然后会使用GPU进行计算
            if self.CUDA:
                self.net.cuda()

            # 加载本地模型   
            state = torch.load(self.model_file)
            self.net.load_state_dict(state)  #加载本地参数

        else:
            print("初始化预训练模型")
            self.net = resnet18(pretrained=False)
            fc_features = self.net.fc.in_features
            self.net.fc = torch.nn.Linear(fc_features,40) # 40分类
            if self.CUDA:
                self.net.cuda()
          

        # 3、参数
        self.epoch = epoch
        self.lr = lr
        # 4、优化器 很多 选择 adam
        self.optimizer = torch.optim.Adam(self.net.parameters(), lr = self.lr)

        # 5、损失函数
        self.loss_function = torch.nn.CrossEntropyLoss()

        if self.CUDA:
            self.loss_function = self.loss_function.cuda()
    
    #执行训练
    def execute(self):
        print("训练开始.....")
        # 轮数迭代
        for e in range(self.epoch):
            #  self.net.train() 训练
            self.net.train()
            for samples,labels in self.tr:
                self.optimizer.zero_grad()
                if self.CUDA:
                    samples = samples.cuda()
                    labels = labels.cuda()

                # 计算输出 -1表示原数组长度，避免原数组长度为1时结构出错
                samples = samples.view(-1,3,224,224)
                # 计算预测值
                y = self.net(samples)

                # 计算损失y labels
                loss = self.loss_function(y,labels)

                # 求导
                loss.backward()
                # 更新梯度
                self.optimizer.step()    
            # 每轮 验证准确率  使用测试数据集
            # 使用数据集验证
            correct_rate = self.validate()
            print(F"轮数：{e+1:03d}")
            print(F"正确率：{correct_rate:5.4f}%")
            print(F"损失值：{loss:8.6f}")
        
        # 训练结束，保存模型
        torch.save(self.net.state_dict(), self.model_file) 
        # torch.save(self.net, 'gb.pth')   

    # 验证
    @torch.no_grad()
    def validate(self):
        num_samples = 0.0
        num_correct = 0.0
        self.net.eval()

        for samples, labels in self.ts:
            if self.CUDA:
                samples = samples.cuda()
                labels = labels.cuda()

            num_samples += len(samples)
            # 计算输出
            out = self.net(samples.view(-1, 3, 224, 224))
            # 激活 0--1
            out = torch.nn.functional.softmax(out, dim=1)
            # 概率最大的类别下标和概率值
            y = torch.argmax(out, dim=1)
            num_correct += (y == labels).float().sum()
        
        return num_correct * 100.0 / num_samples
 
#使用系统模块属性，动态传参
#sys.argv[0]为系统当前文件的路径
if (len(sys.argv)) >=4:
    trainer = TrainResNet(sys.argv[1],int(sys.argv[2]),float(sys.argv[3]))
else:
    trainer = TrainResNet()

trainer.execute()

recognize.py

识别测试数据

import torch
from torchvision.models import resnet18
from torchvision.transforms import Resize, Compose, ToTensor, Normalize, RandomHorizontalFlip, RandomVerticalFlip, RandomResizedCrop
import cv2 as cv
from PIL import Image
from torchvision.datasets import ImageFolder

# 设置管道 类别和类别下标
transform = Compose([
            Resize((224,224)),
            RandomHorizontalFlip(),
            RandomVerticalFlip(),
            ToTensor(),
            Normalize(mean=[0.56719673,0.5293289,0.48351972], std=[0.20874391,0.21455203,0.22451781]) # 均值与方差 （必须Tensor图像）
        ])
#类别和类别下标
ds = ImageFolder("./data",transform=transform)

#垃圾识别的类
class GarbageRecognizer:
    # 参数：模型文件的路径
    def __init__(self, model_file="./gb.mod"):
        super(GarbageRecognizer, self).__init__()

        #1 设置模型文件
        self.model_file = model_file
        # 判断cuda
        self.CUDA = torch.cuda.is_available()
        #2.模型定义
        self.net = resnet18(pretrained=False, num_classes=40)
        if self.CUDA:
            self.net.cuda()
        
        #3.加载模型
        state = torch.load(self.model_file)
        self.net.load_state_dict(state)
        print("模型加载完毕！")
        self.net.eval()
    
    @torch.no_grad()
    # 参数：要识别的图片的路径
    def recognize(self,img):
        with torch.no_grad():
            # 返回固定格式的图片数据
            img = self.trans_data(img)
            if self.CUDA:
                img = img.cuda()

            # 1 3 224 224
            img = img.view(-1,3,224,224)

            # 预测
            y = self.net(img)

            # 激活  生成目标个数 概率
            p_y = torch.nn.functional.softmax(y, dim=1)

            # 概率最大的元素 概率值p和类别下标cls_idx
            p, cls_idx = torch.max(p_y, dim=1)

            return cls_idx.cpu(), p.cpu()

    # 传入图片路径
    def trans_data(self,img):
        # 执行和训练数据一样的数据预处理
        transform = Compose([
            Resize((224,224)),
            RandomHorizontalFlip(),
            RandomVerticalFlip(),
            ToTensor(),
            Normalize(mean=[0.56719673,0.5293289,0.48351972], std=[0.20874391,0.21455203,0.22451781]) # 均值与方差 （必须Tensor图像）
        ])
        # 读取图片
        img = cv.imread(img)
        # BGR(OpenCV)--->RGB(PIL)
        img = cv.cvtColor(img,cv.COLOR_BGR2RGB)
        # 转换为PIL Image
        img = Image.fromarray(img) 
        # 执行 transform
        img = transform(img)
        return img



r = GarbageRecognizer()
cls, p = r.recognize('./data/13/fimg_1343.jpg')

# print(cls.numpy()[0])
# print(p.numpy()[0])

# 类别下标
cls = cls.numpy()[0]
print("类别下标",cls)

# print(ds.class_to_idx)
# 类别下标===>类别名称
cls = ds.classes[cls]
print("类别名称",cls)

# 把实际类别换成名称
from model.handle_by_dir import ClassifyRule
tool = ClassifyRule()
category = tool.read_rules()
print(category)

print(category[cls], ":", p.numpy()[0])

目标侦测

识别一张图片中的某一区域，需要手动在图片中进行标记

一张图片中可以包含多个类别

工具：精灵标注助手

WEEK4

dat10

YOLO4训练测试识别

YOLO实时检测

yolo的核心思想就是利用整张图像作为网络的输入，直接在输出层回归bounding box的位置和bounding box所属的类别

配置数据集

datasets中包含：coco128文件夹、coco.data、coco.names、train.txt

coco.names：类别名文件，其中类别名按照类别id进行索引

train.txt：训练使用的图像数据集文件。可以用脚本实现

coco.data：组织训练与测试的数据集工程文件。classes指定类别数；train指定训练数据集；valid指定验证测试数据集；names指定类别名

classes=80
train=datasets/train.txt
valid=datasets/train.txt
names=datasets/coco.names

tips：系统寻找类别id时，会将图像路径中的images字符自动替换成labels，来寻找图片对应的类别

模型文件准备

取自github上的cfg文件，常用yolov4-tiny.cfg文件

权重文件准备

取自github上的pt文件，本次使用的是yolov4-tiny.pt文件。使用的权重文件应该与模型文件相对应

训练调用

调用已有的train.py文件

run_app.bat

python train.py
	--epoch 3 ^
	--batch-size 3 ^
	--data datasets/coco.data ^
	--cfg cfg/yolov4-tiny.cfg ^
	--weights weights/yolov4-tiny.pt ^
	--name yolov4-tiny
	--img 640 640 640

epoch训练轮数；batch-size数据集批次大小；data datasets/coco.data数据集工程组织文件；cfg cfg/yolov4-tiny.cfg模型文件；weights weights/yolov4-tiny.pt预训练的权重文件；name yolov4-tiny保存训练过程产生的数据的文件名，会添加一个result前缀

tips：python中^表示符号后的所有字符都看作普通字符。用^加回车可以表示不换行

tips：yolov4-tiny.pt为预训练中的初始权重，在预训练结束后会生成一个best_yolov4-tiny.pt最好权重和一个last_yolov4-tiny.pt最后权重文件。在下次进行预训练时，可以删除多余的权重文件，留下更新过后的权重文件，并更名为yolov4-tiny.pt

目标侦测调用

调用已有的detect.py文件

run_detect.bat

python detect.py  ^
 --cfg cfg/yolov4-tiny.cfg ^
 --weights weights/yolov4-tiny.pt ^
 --names datasets/coco.names ^
 --source imgs/  ^
 --img-size 640 ^
 --iou-thres 0.2 ^
 --conf-thres 0.1 ^
 --device 0

source imgs/指定需要识别的图像所在目录；device 0识别使用GPU的编号；iou-thr目标重叠度阈值，根据重合度判断类别；conf-thres置信度阈值

tips：置信度阈值表示当识别出的事物概率大于某个值以后就认为识别出来了；目标重叠度阈值会影响识别后标记框在事物上的标记位置和准确度

day11

实现json向YOLOlabels的转换

trans.py

import os
import json
names = {
     
    "dog":0,
    "cat":1,
}
# 单个文件 格式转换
def format_label(json_file,out_path):
    file_name = os.path.basename(json_file)
    # '1.json'   1.txt
    only_name = file_name.split(".")[0]
    out_file = os.path.join(out_path,F"{only_name}.txt")
    #json_file   out_file
    with open(json_file) as fd:
        json_data = json.load(fd)
        #print(json_data)
        #解析
        is_labeled = json_data["labeled"]
        if is_labeled:
            # 图像宽高
            img_w = json_data["size"]["width"]
            img_h = json_data["size"]["height"]
            # 标注目标 数组
            objects = json_data["outputs"]["object"]
            # 打开新文件
            out_fd = open(out_file,"w")
            for obj in objects:
                name = obj["name"]
                xmin = obj["bndbox"]["xmin"]
                xmax = obj["bndbox"]["xmax"]
                ymin = obj["bndbox"]["ymin"]
                ymax = obj["bndbox"]["ymax"]
                #name对应的类别下标 中心点坐标 宽 高   
                name = names[name]
                w = float(xmax-xmin)
                h = float(ymax-ymin)
                xcenter = xmin + w / 2
                ycenter = ymin + h /2
                # 归一化 
                w /= img_w
                h /= img_h
                xcenter /= img_w
                ycenter /= img_h
                #写入一个目标
                out_fd.write(F"{name} {xcenter:.6f} {ycenter:.6f} {w:.6f} {h:.6f}")
            out_fd.close()
            print(F"完成{json_file}文件的转换")

#输入路径 输出路径
def to_yolo(in_path,out_path):
    #判断输出路径是否存在
    if not os.path.exists(out_path):
        os.mkdir(out_path)
    # 遍历in_path
    all_json_files = os.listdir(in_path)
    #print(all_json)
    for json_file in all_json_files:
        # 1.json 拼接路径
        path_file = os.path.join(in_path,json_file)
        format_label(path_file,out_path)

to_yolo("./outputs","labels")

目标侦测实现

mydetect.py

from  models import *
from utils.datasets import *
from utils.utils import *
import torch
import os

# 目标侦测
# 定义目标侦测类
# 步骤
# 1、init方法中 配置模型以及模型的参数
# 2、侦测图片目标 返回边界框 类别 概率
#    具体包括：
#	 加载图片 opencv
#    对图片数据预处理
#    侦测
#    数据处理
#    类别下标--》具体类别名字
#    返回边界框 类别 概率
# 3、侦测图片目标 返回带有标记的图片和类别

# 获取当前路径
current_path= os.path.dirname(__file__)
class YOLOv4Detector:
    def __init__(self, 
                img_size=640,
                cfg_file="yolov4-tiny.cfg",
                weights="yolov4-tiny.pt",
                names="coco.names"):
        #参数详细化
        self.img_size = img_size
        # 路径
        self.cfg_file = os.path.join(current_path,F"cfg/{cfg_file}")
        self.weights = os.path.join(current_path,F"weights/{weights}")
        self.names = os.path.join(current_path,F"datasets/{names}")

        #配置模型
        self.model = Darknet(self.cfg_file, self.img_size)
        # 加载训练好的模型
        self.model.load_state_dict(torch.load(self.weights)['model'])
        self.CUDA = torch.cuda.is_available()
        if self.CUDA:
            self.model.cuda()
        # 不调用求导 权重更新的方法
        self.model.eval()

        #self.names 路径  ====》具体的类别的值 
        #load_classes utils.utils 
        self.names = load_classes(self.names)
    
    def detect(self,img0):
        """
            img0:opencv读取的原始图片
        """
        #图片的预处理  
        img = self.format_img(img0)
        # print("--------format----------------")
        # print(img.shape)
        if self.CUDA:
            img = img.cuda()

        # 计算侦测结果
        pred = self.model(img, augment=False)[0]
        pred = pred.cpu()

        # 进行最大化抑制
        pred = non_max_suppression(pred, 0.3, 0.2, merge=False, classes=None, agnostic=False)
        # print("------pred最大化抑制------")
        # print(pred)
        # 解析识别结果
        for det in pred:
            if det is not None and len(det):
                det[:, :4] = scale_coords(img.shape[2:], det[:, :4], img0.shape).round()

        return pred  # 总长6：目标位置与大小（0:3），目标概率(4)，目标类别[5]

    # 图片的预处理  
    def format_img(self, img0):
        # utils.datasets的方法letterbox
        img = letterbox(img0, new_shape=self.img_size)[0]
        img = img[:, :, ::-1].transpose(2, 0, 1)  # BGR to RGB
        img = np.ascontiguousarray(img)
        img = torch.from_numpy(img)
        img = img.float()
        img /= 255.0  # 0 - 255 to 0.0 - 1.0
        if img.ndimension() == 3: 
            img = img.unsqueeze(0)
        return img
          
    def load_image(self,img_file):
        img0 = cv2.imread(img_file)
        return img0    
    def get_name(self,idx):
        return self.names[idx]

detector = YOLOv4Detector()
img = detector.load_image("imgs/000000000034.jpg")
pred = detector.detect(img)
print(pred)
result = pred[0][0]
# 边界框
rect = result[0:4].detach().numpy()
#概率
p = result[4].detach().item()
# 类别
clss = int(result[5].detach().item())
clss = detector.get_name(clss)
print(rect,p,clss)

tips：Tensor对象调用detach()，作用为去掉Tensor中的求导函数

day12

人脸识别

tips：移植python文件时，要注意在导入模块和代码中路径的使用。利用bat运行时，导入模块需要从项目根路径去导入模块，即需要使用完整了根路径

你可能感兴趣的:(笔记总结,python,人工智能,神经网络)

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
python_虚拟环境阿_焦 python
第一、配置虚拟环境：virtualenv（1）pipvirtualenv>安装虚拟环境包（2）pipinstallvirtualenvwrapper-win>安装虚拟环境依赖包（3）c盘创建虚拟目录>C:\virtualenv>配置环境变量【了解一下】：（1）如何使用virtualenv创建虚拟环境a、cd到C:\virtualenv目录下：b、mkvirtualenvname>创建虚拟环境nam
Python爱心光波
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Python流星雨 Want595 python 开发语言
文章目录系列文章写在前面技术需求完整代码代码分析1.模块导入2.画布设置3.画笔设置4.颜色列表5.流星类(Star)6.流星对象创建7.主循环8.流星运动逻辑9.视觉效果10.总结写在后面系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
Python之七彩花朵代码实现 PlutoZuo Python python 开发语言
Python之七彩花朵代码实现文章目录Python之七彩花朵代码实现下面是一个简单的使用Python的七彩花朵。这个示例只是一个简单的版本，没有很多高级功能，但它可以作为一个起点，你可以在此基础上添加更多功能。importturtleastuimportrandomasraimportmathtu.setup(1.0,1.0)t=tu.Pen()t.ht()colors=['red','skybl
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）了解和使用分支结构 EternityArt 基础篇 python
目录一、引言二、Python分支结构的类型与语法（一）if语句（单分支）（二）if-else语句（双分支）（三）if-elif-else语句（多分支）三、分支结构的应用场景（一）提示用户输入用户名，然后再提示输入密码，如果用户名是“admin”并且密码是“88888”则提示正确，否则，如果用户名不是admin还提示用户用户名不存在,（二）提示用户输入用户名，然后再提示输入密码，如果用户名是“adm
（Python基础篇）循环结构 EternityArt 基础篇 python
一、什么是Python循环结构？循环结构是编程中重复执行代码块的机制。在Python中，循环允许你：1.迭代处理数据：遍历列表、字典、文件内容等。2.自动化重复任务：如批量处理数据、生成序列等。3.控制执行流程：根据条件决定是否继续或终止循环。二、为什么需要循环结构？假设你需要打印1到100的所有偶数：没有循环：需手动编写100行print()语句。print(0)print(2)print(4)
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
Python七彩花朵 Want595 python 开发语言
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
Anaconda 详细下载与安装教程
Anaconda详细下载与安装教程1.简介Anaconda是一个用于科学计算的开源发行版，包含了Python和R的众多常用库。它还包括了conda包管理器，可以方便地安装、更新和管理各种软件包。2.下载Anaconda2.1访问官方网站首先，打开浏览器，访问Anaconda官方网站。2.2选择适合的版本在页面中，你会看到两个主要的下载选项：AnacondaIndividualEdition：适用于
python中 @注解及内置注解的使用方法总结以及完整示例慧一居士 Python python
在Python中，装饰器（Decorator）使用@符号实现，是一种修改函数/类行为的语法糖。它本质上是一个高阶函数，接受目标函数作为参数并返回包装后的函数。Python也提供了多个内置装饰器，如@property、@staticmethod、@classmethod等。一、核心概念装饰器本质：@decorator等价于func=decorator(func)执行时机：在函数/类定义时立即执行装饰
Python中的静态方法和类方法详解
在Python中，`@staticmethod`和`@classmethod`是两种装饰器，它们用于定义类中的方法，但是它们的行为和用途有所不同。###@staticmethod`@staticmethod`装饰器用于定义一个静态方法。静态方法不接收类或实例的引用作为第一个参数，因此它不能访问类的状态或实例的状态。静态方法可以看作是与类关联的普通函数，但它们可以通过类名直接调用。classMath
Python中类静态方法：@classmethod/@staticmethod详解和实战示例
在Python中，类方法(@classmethod)和静态方法(@staticmethod)是类作用域下的两种特殊方法。它们使用装饰器定义，并且与实例方法(deffunc(self))的行为有所不同。1.三种方法的对比概览方法类型是否访问实例(self)是否访问类(cls)典型用途实例方法✅是❌否访问对象属性类方法@classmethod❌否✅是创建类的替代构造器，访问类变量等静态方法@stati
Python多版本管理与pip升级全攻略：解决冲突与高效实践码界奇点 Python python pip 开发语言 python3.11 源代码管理虚拟现实依赖倒置原则
引言Python作为最流行的编程语言之一，其版本迭代速度与生态碎片化给开发者带来了巨大挑战。据统计，超过60%的Python开发者需要同时维护基于Python3.6+和Python2.7的项目。本文将系统解决以下核心痛点：如何安全地在同一台机器上管理多个Python版本pip依赖冲突的根治方案符合PEP标准的生产环境最佳实践第一部分：Python多版本管理核心方案1.1系统级多版本共存方案Wind
基于Python的健身数据分析工具的搭建流程day1 weixin_45677320 python 开发语言数据挖掘爬虫
基于Python的健身数据分析工具的搭建流程分数据挖掘、数据存储和数据分析三个步骤。本文主要介绍利用Python实现健身数据分析工具的数据挖掘部分。第一步：加载库加载本文需要的库，如下代码所示。若库未安装，请按照python如何安装各种库（保姆级教程）_python安装库-CSDN博客https://blog.csdn.net/aobulaien001/article/details/133298
seaborn又一个扩展heatmapz qq_21478261 #Python可视化 matplotlib
推荐阅读：Pythonmatplotlib保姆级教程嫌Matplotlib繁琐？试试Seaborn！
NGS测序基础梳理01-文库构建（Library Preparation） qq_21478261 #生物信息生物学
本文介绍Illumina测序平台文库构建（LibraryPreparation）步骤，文库结构。写作时间：2020.05。推荐阅读：10W字《Python可视化教程1.0》来了！一份由公众号「pythonic生物人」精心制作的PythonMatplotlib可视化系统教程，105页PDFhttps://mp.weixin.qq.com/s/QaSmucuVsS_DR-klfpE3-Q10W字《Rg
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
Python 常用内置函数详解（七）：dir()函数——获取当前本地作用域中的名称列表或对象的有效属性列表
目录一、功能二、语法和示例一、功能dir()函数获取当前本地作用域中的名称列表或对象的有效属性列表。二、语法和示例dir()函数有两种形式，如果没有实参，则返回当前本地作用域中的名称列表。如果有实参，它会尝试返回该对象的有效属性列表。如果对象有一个名为__dir__()的方法，那么该方法将被调用，并且必须返回一个属性列表。dir()函数的语法格式如下：C:\Users\amoxiang>ipyth
pythonjson中list操作_Python json.dumps 特殊数据类型的自定义序列化操作
场景描述：Python标准库中的json模块，集成了将数据序列化处理的功能；在使用json.dumps()方法序列化数据时候，如果目标数据中存在datetime数据类型，执行操作时，会抛出异常：TypeError:datetime.datetime(2016,12,10,11,04,21)isnotJSONserializable那么遇到json.dumps序列化不支持的数据类型，该怎么办！首先，
Python 日期格式转json.dumps的解决方法 douyaoxin python json 开发语言
classDateEncoder(json.JSONEncoder):defdefault(self,obj):ifisinstance(obj,datetime.datetime):returnobj.strftime('%Y-%m-%d%H:%M:%S')elifisinstance(obj,datetime.date):returnobj.strftime("%Y-%m-%d")json.d
Python 爬虫实战：视频平台播放量实时监控（含反爬对抗与数据趋势预测）西攻城狮北 python 爬虫音视频
一、引言在数字内容蓬勃发展的当下，视频平台的播放量数据已成为内容创作者、营销人员以及行业分析师手中极为关键的情报资源。它不仅能够实时反映内容的受欢迎程度，更能在竞争分析、营销策略制定以及内容优化等方面发挥不可估量的作用。然而，视频平台为了保护自身数据和用户隐私，往往会设置一系列反爬虫机制，对数据爬取行为进行限制。这就向我们发起了挑战：如何巧妙地突破这些限制，同时精准地捕捉并预测播放量的动态变化趋势
Python技能手册 - 模块module 金色牛神 Python python windows 开发语言
系列Python常用技能手册-基础语法Python常用技能手册-模块modulePython常用技能手册-包package目录module模块指什么typing数据类型int整数float浮点数str字符串bool布尔值TypeVar类型变量functools高阶函数工具functools.partial()函数偏置functools.lru_cache()函数缓存sorted排序列表排序元组排序
Ubuntu基础（Python虚拟环境和Vue） aaiier ubuntu python linux
Python虚拟环境sudoaptinstallpython3python3-venv进入项目目录cdXXX创建虚拟环境python3-mvenvvenv激活虚拟环境sourcevenv/bin/activate退出虚拟环境deactivateVue安装Node.js和npm#安装Node.js和npm（Ubuntu默认仓库可能版本较旧，适合入门）sudoaptinstallnodejsnpm#验
苦练Python第9天：if-else分支九剑 python后端前端人工智能
苦练Python第9天：if-else分支九剑前言大家好，我是倔强青铜三。是一名热情的软件工程师，我热衷于分享和传播IT技术，致力于通过我的知识和技能推动技术交流与创新，欢迎关注我，微信公众号：倔强青铜三。欢迎点赞、收藏、关注，一键三连！！！欢迎来到100天Python挑战第9天！今天我们不练循环，改磨“分支剑法”——ifelse三式：单分支、双分支、多分支，以及嵌套和三元运算符，全部实战演练，让
log4j对象改变日志级别 3213213333332132 java log4j level log4j对象名称日志级别
log4j对象改变日志级别可批量的改变所有级别，或是根据条件改变日志级别。 log4j配置文件： log4j.rootLogger=ERROR,FILE,CONSOLE,EXECPTION #log4j.appender.FILE=org.apache.log4j.RollingFileAppender log4j.appender.FILE=org.apache.l
elk+redis 搭建nginx日志分析平台 ronin47 elasticsearch kibana logstash
elk+redis 搭建nginx日志分析平台 logstash,elasticsearch,kibana 怎么进行nginx的日志分析呢？首先，架构方面，nginx是有日志文件的，它的每个请求的状态等都有日志文件进行记录。其次，需要有个队列，redis的l
Yii2设置时区 dcj3sjt126com PHP timezone yii2
时区这东西，在开发的时候，你说重要吧，也还好，毕竟没它也能正常运行，你说不重要吧，那就纠结了。特别是linux系统，都TMD差上几小时，你能不痛苦吗？win还好一点。有一些常规方法，是大家目前都在采用的1、php.ini中的设置，这个就不谈了，2、程序中公用文件里设置，date_default_timezone_set一下时区3、或者。。。自己写时间处理函数，在遇到时间的时候，用这个函数处理（比较
js实现前台动态添加文本框，后台获取文本框内容 171815164 文本框
<%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://w
持续集成工具 g21121 持续集成
持续集成是什么？我们为什么需要持续集成？持续集成带来的好处是什么？什么样的项目需要持续集成？... 持续集成(Continuous integration ,简称CI)，所谓集成可以理解为将互相依赖的工程或模块合并成一个能单独运行
数据结构哈希表(hash)总结永夜-极光数据结构
1.什么是hash 来源于百度百科: Hash，一般翻译做“散列”，也有直接音译为“哈希”的，就是把任意长度的输入，通过散列算法，变换成固定长度的输出，该输出就是散列值。这种转换是一种压缩映射，也就是，散列值的空间通常远小于输入的空间，不同的输入可能会散列成相同的输出，所以不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。
乱七八糟程序员是怎么炼成的
eclipse中的jvm字节码查看插件地址： http://andrei.gmxhome.de/eclipse/ 安装该地址的outline 插件后重启，打开window下的view下的bytecode视图 http://andrei.gmxhome.de/eclipse/ jvm博客： http://yunshen0909.iteye.com/blog/2
职场人伤害了“上司” 怎样弥补 aijuans 职场
由于工作中的失误，或者平时不注意自己的言行“伤害”、“得罪”了自己的上司，怎么办呢？　　在职业生涯中这种问题尽量不要发生。下面提供了一些解决问题的建议：　　一、利用一些轻松的场合表示对他的尊重　　即使是开明的上司也很注重自己的权威，都希望得到下属的尊重，所以当你与上司冲突后，最好让不愉快成为过去，你不妨在一些轻松的场合，比如会餐、联谊活动等，向上司问个好，敬下酒，表示你对对方的尊重，
深入浅出url编码 antonyup_2006 应用服务器浏览器 servlet weblogic IE
出处：http://blog.csdn.net/yzhz 杨争 http://blog.csdn.net/yzhz/archive/2007/07/03/1676796.aspx 一、问题：编码问题是JAVA初学者在web开发过程中经常会遇到问题，网上也有大量相关的
建表后创建表的约束关系和增加表的字段百合不是茶标的约束关系增加表的字段
下面所有的操作都是在表建立后操作的,主要目的就是熟悉sql的约束,约束语句的万能公式 1,增加字段(student表中增加姓名字段) alter table 增加字段的表名 add 增加的字段名增加字段的数据类型 alter table student add name varchar2(10); &nb
Uploadify 3.2 参数属性、事件、方法函数详解 bijian1013 JavaScript uploadify
一.属性属性名称默认值说明 auto true 设置为true当选择文件后就直接上传了，为false需要点击上传按钮才上传。 buttonClass ” 按钮样式 buttonCursor ‘hand’ 鼠标指针悬停在按钮上的样子 buttonImage null 浏览按钮的图片的路
精通Oracle10编程SQL(16)使用LOB对象 bijian1013 oracle 数据库 plsql
/* *使用LOB对象 */ --LOB(Large Object)是专门用于处理大对象的一种数据类型，其所存放的数据长度可以达到4G字节 --CLOB/NCLOB用于存储大批量字符数据，BLOB用于存储大批量二进制数据，而BFILE则存储着指向OS文件的指针 /* *综合实例 */ --建立表空间 --#指定区尺寸为128k,如不指定，区尺寸默认为64k CR
【Resin一】Resin服务器部署web应用 bit1129 resin
工作中，在Resin服务器上部署web应用，通常有如下三种方式：配置多个web-app 配置多个http id 为每个应用配置一个propeties、xml以及sh脚本文件配置多个web-app 在resin.xml中,可以为一个host配置多个web-app <cluster id="app&q
red5简介及基础知识白糖_ 基础
简介 Red5的主要功能和Macromedia公司的FMS类似，提供基于Flash的流媒体服务的一款基于Java的开源流媒体服务器。它由Java语言编写，使用RTMP作为流媒体传输协议，这与FMS完全兼容。它具有流化FLV、MP3文件，实时录制客户端流为FLV文件，共享对象，实时视频播放、Remoting等功能。用Red5替换FMS后,客户端不用更改可正
angular.fromJson boyitech AngularJS AngularJS 官方API AngularJS API
angular.fromJson 描述: 把Json字符串转为对象使用方法: angular.fromJson(json); 参数详解: Param Type Details json string JSON 字符串返回值: 对象, 数组, 字符串或者是一个数字示例: <!DOCTYPE HTML> <h
java-颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I bylijinnan java
public class ReverseWords { /** * 题目：颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I.词以空格分隔。 * 要求： * 1.实现速度最快,移动最少 * 2.不能使用String的方法如split,indexOf等等。 * 解答：两次翻转。 */ publ
web实时通讯 Chen.H Web 浏览器 socket 脚本
关于web实时通讯，做一些监控软件。由web服务器组件从消息服务器订阅实时数据，并建立消息服务器到所述web服务器之间的连接，web浏览器利用从所述web服务器下载到web页面的客户端代理与web服务器组件之间的socket连接，建立web浏览器与web服务器之间的持久连接；利用所述客户端代理与web浏览器页面之间的信息交互实现页面本地更新，建立一条从消息服务器到web浏览器页面之间的消息通路
[基因与生物]远古生物的基因可以嫁接到现代生物基因组中吗? comsci 生物
大家仅仅把我说的事情当作一个IT行业的笑话来听吧..没有其它更多的意思如果我们把大自然看成是一位伟大的程序员,专门为地球上的生态系统编制基因代码,并创造出各种不同的生物来,那么6500万年前的程序员开发的代码,是否兼容现代派的程序员的代码和架构呢?
oracle 外部表 daizj oracle 外部表 external tables
oracle外部表是只允许只读访问，不能进行DML操作，不能创建索引，可以对外部表进行的查询，连接，排序，创建视图和创建同义词操作。 you can select, join, or sort external table data. You can also create views and synonyms for external tables. Ho
aop相关的概念及配置 daysinsun AOP
切面(Aspect): 通常在目标方法执行前后需要执行的方法（如事务、日志、权限），这些方法我们封装到一个类里面，这个类就叫切面。连接点（joinpoint） spring里面的连接点指需要切入的方法，通常这个joinpoint可以作为一个参数传入到切面的方法里面（非常有用的一个东西）。通知（Advice）通知就是切面里面方法的具体实现，分为前置、后置、最终、异常环
初一上学期难记忆单词背诵第二课 dcj3sjt126com english word
middle 中间的，中级的 well 喔，那么；好吧 phone 电话，电话机 policeman 警察 ask 问 take 拿到；带到 address 地址 glad 高兴的，乐意的 why 为什么 China 中国 family 家庭 grandmother (外)祖母 grandfather (外)祖父 wife 妻子 husband 丈夫 da
Linux日志分析常用命令 dcj3sjt126com linux log
1.查看文件内容 cat -n 显示行号 2.分页显示 more Enter 显示下一行空格显示下一页 F 显示下一屏 B 显示上一屏 less /get 查询"get"字符串并高亮显示 3.显示文件尾 tail -f 不退出持续显示 -n 显示文件最后n行 4.显示头文件 head -n 显示文件开始n行 5.内容排序 sort -n 按照
JSONP 原理分析 fantasy2005 JavaScript jsonp jsonp 跨域
转自 http://www.nowamagic.net/librarys/veda/detail/224 JavaScript是一种在Web开发中经常使用的前端动态脚本技术。在JavaScript中，有一个很重要的安全性限制，被称为“Same-Origin Policy”（同源策略）。这一策略对于JavaScript代码能够访问的页面内容做了很重要的限制，即JavaScript只能访问与包含它的
使用connect by进行级联查询 234390216 oracle 查询父子 Connect by 级联
使用connect by进行级联查询 connect by可以用于级联查询，常用于对具有树状结构的记录查询某一节点的所有子孙节点或所有祖辈节点。来看一个示例，现假设我们拥有一个菜单表t_menu，其中只有三个字段：
一个不错的能将HTML表格导出为excel,pdf等的jquery插件 jackyrong jquery插件
发现一个老外写的不错的jquery插件，可以实现将HTML 表格导出为excel,pdf等格式，地址在： https://github.com/kayalshri/ 下面看个例子，实现导出表格到excel,pdf <html> <head> <title>Export html table to excel an
UI设计中我们为什么需要设计动效 lampcy UI UI设计
关于Unity3D中的Shader的知识首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，
如何禁止页面缓存 nannan408 html jsp cache
禁止页面使用缓存~ ------------------------------------------------ jsp:页面no cache： response.setHeader("Pragma","No-cache"); response.setHeader("Cache-Control","no-cach
以代码的方式管理quartz定时任务的暂停、重启、删除、添加等 Everyday都不同定时任务管理 spring-quartz
【前言】在项目的管理功能中，对定时任务的管理有时会很常见。因为我们不能指望只在配置文件中配置好定时任务就行了，因为如果要控制定时任务的 “暂停” 呢？暂停之后又要在某个时间点 “重启” 该定时任务呢？或者说直接 “删除” 该定时任务呢？要改变某定时任务的触发时间呢？ “添加” 一个定时任务对于系统的使用者而言，是不太现实的，因为一个定时任务的处理逻辑他是不
EXT实例 tntxia ext
（1）增加一个按钮 JSP: <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); Stri
数学学习在计算机研究领域的作用和重要性 xjnine Math
最近一直有师弟师妹和朋友问我数学和研究的关系，研一要去学什么数学课。毕竟在清华，衡量一个研究生最重要的指标之一就是paper,而没有数学，是肯定上不了世界顶级的期刊和会议的，这在计算机学界尤其重要！你会发现，不论哪个领域有价值的东西，都一定离不开数学！在这样一个信息时代，当google已经让世界没有秘密的时候，一种卓越的数学思维，绝对可以成为你的核心竞争力. 无奈本人实在见地