快乐活在当下

Pytorch学习笔记

学习视频:[B站up主:我是土堆]
一、help和dir指令
二、Pytorch加载数据
三、TensorBoard的使用
- 1. add_scalar()的使用
- 2. add_image()的使用
四、Transforms的使用
- 1. Transforms中的Compose类
- 2. Transforms中的ToTensor类
- 3. Transforms中的Normalize类
- 4. Transforms中的Resize类
- - 4.1 结合前面的compose
- 5. Transforms中的RandomCrop类
- 6. python知识点： _ _ call_ _函数
- 7. 总结知识点
五、torchvision中的数据集使用
- 1. 数据集的下载
- 2. CIFAR-10 dataset的下载
- - 2.1 CIFAR-10数据集介绍
六、DataLoader的使用
- 1. dataset类和datalodar的关系
- 2.Dataloader官方介绍
- 3.代码实例
七、神经网络的基本骨架-nn.Module的使用
- 7.1 官方文档介绍
- 7.2 代码实例
八、卷积层(Convolution Layers)
- 8.1 torch.nn.function.conv2d官方介绍
- 8.2 代码实例
- 8.3 torch.nn.Conv2d官方介绍
- 8.4 代码实例
九、最大池化的使用
- 9.1 MaxPool2d官方介绍
- 9.2 代码实例
- 9.3 最大池化的直观感受
十、非线性激活
- 10.1 线性激活官方介绍
- 10.2 代码实例
十一、线性层介绍
十二、搭建CIFAR-10网络模型
- 12.1 不使用Sequential
- 12.2 使用Sequential
- 12.3 模型的可视化
十三、损失函数与反向传播
- 13.1 官方文档介绍
- - 13.1.1 L1Loss
  - 13.1.2 MSELoss
  - 13.1.3 CrossEntropyLoss
- 13.2 为CIFAR-10网络模型添加损失函数
十四、优化器
- 14.1 官方文档介绍
- 14.2 为CIFAR-10网络模型添加优化器
十五、官网模型的加载(浅谈)
- 15.1 官网介绍
- 15.2 模型的使用与修改
十六、网络模型的保存与读取
十七、完整的模型训练套路
十八、使用CPU训练
- 18.1 第一种方式
- 18.2 第二种方式
- 18.3 测试时注意事项

学习视频:[B站up主:我是土堆]

一、help和dir指令

$p y t orc h$ 可以看作一个工作箱，里面有很多的小格子装有不同的工具。
可以使用 $d i r ()$ 指令来查看这个工作箱里面有哪些分格区：

想要继续探索这个工具箱第一个分格区装了哪些工具，继续使用 $d i r ()$ 指令：

想知道这个分格区的第二个工具的作用，使用 $h e lp ()$ 指令：

二、Pytorch加载数据

$D a t a se t 类$ ：
提供一种方式去获取数据及其label
$D a t a l o a d er 类$ ：
为网络提供不同的数据形式

以图片数据为例子：

仅读取一张图片可以使用 $P I L . I ma g e$ ：

from PIL import Image
#图片路径
img_path = 'data\\train\\ants\\0013035.jpg'
#读取图片
img = Image.open(img_path)
#打印图片尺寸
print('尺寸:',img.size)
#展示图片
img.show()

获取多个文件，需要使用 $os$ ：

import os
#数据所处文件夹
dir_path = 'data\\train\\ants'
#获取文件夹下文件的名字存于list数组中
img_path_list = os.listdir(dir_path)# 第一个列表元素指向文件夹第一个文件的名字

一、接下来读取一些数据(图片)，文件名为数据集的 $l ab e l$ ：
这里有很多蚂蚁和蜜蜂的图片，蚂蚁图片的路径是 $d a t a / t r ain / an t s$ ,蜜蜂图片的路径是 $d a t a / t r ain / b ee$ ；图片上一层就是该图片集的 $l ab e l$ 。

获取蚂蚁数据集

from PIL import Image
import os
from torch.utils.data import Dataset


class MyData(Dataset):
    '''
    需要重写Dataset的函数
    '''
    def __init__(self,root_dir,label_dir):
        '''
        初始化函数
        root_dir：根路径 如：data\\train
        label_dir：label 如：ants
        '''
        self.root_dir = root_dir
        self.label_dir = label_dir
        self.path = os.path.join(self.root_dir,self.label_dir)#文件路径:data\\train\\ants 这个函数会自动加 /
        self.img_path = os.listdir(self.path)#文件下的图片名：['img_1.jpg',img_2.jpg,……]
        
    def __getitem__(self, index):
        '''
        根据索引读取文件
        index:索引值
        '''
        img_name = self.img_path[index]#获取图片名字
        img_item_path = os.path.join(self.root_dir,self.label_dir,img_name)#拼接成指向一个图片的详细地址
        img = Image.open(img_item_path)#获取这一张图片
        label = self.label_dir#获取图片的标签
        return img,label
    
    def __len__(self):
        '''
        数据长度
        '''
        return len(self.img_path)

读取数据：

root_dir = 'data/train'
ants_label_dir = 'ants'
ants_data = MyData(root_dir,ants_label_dir)

#获取第2个数据
img,label = ants_data[1]
img.show()
print(label)#ants

展示的图片

获取蜜蜂数据集：

bees_label_dir = 'bees'
bees_data = MyData(root_dir,bees_label_dir)

#获取第2个数据
img,label = bees_data[1]
img.show()

获取训练集数据(train文件夹下的ants数据集+bees数据集)：

train_data = ants_data + bees_data#将两个数据拼接在一起
#len(ants_data)=124 ,len(bees_data)=121, len(train_data)=245

img1,label1 = train_data[1]
img1.show()
img2,label2 = train_data[124]
img2.show()

img1展示：

img2展示：

即按顺序拼接

二、读取 $l ab e l$ 和图片分开放的数据集：
这里有很多蚂蚁和蜜蜂的图片，蚂蚁图片的路径是 $data/train/ants_imge$ ,蜜蜂图片的路径是 $data/train/bees \_imge$ ； $d a t a / t r ain /$ 下还存在两个文件夹： $ants \_label$ 和 $bees \_label$ ，这两个文件夹里面放的是txt文档，文档与图片一一对应，保存图片的label。

train文件夹：

ants_image文件夹下：

ants_label文件夹下：

txt文档

在原先的MyData类上进行修改即可

from PIL import Image
import os
from torch.utils.data import Dataset

class MyData(Dataset):
    '''
    需要重写Dataset的函数
    '''
    def __init__(self,root_dir,target_dir,label_dir):
        '''
        初始化函数
        root_dir：根路径 如：data\\train
        target_dir：数据所在文件名 如：ants_image
        label_dir:标签所在文件名 如：ants_label
        '''
        self.root_dir = root_dir
        self.target_dir = target_dir
        
        self.img_path = os.path.join(self.root_dir,self.target_dir)#目标数据所在路径:data\\train\\ants_image
        self.img_name_list = os.listdir(self.img_path)#文件下的图片名：['img_1.jpg',img_2.jpg,……]
        
        self.label_path = os.path.join(self.root_dir,label_dir)#标签所在路径：data\\train\\ants_label
        #标签文件名与图片文件名只有后缀不一样，不用读取
    def __getitem__(self, index):
        '''
        根据索引读取文件
        index:索引值
        '''
        img_name = self.img_name_list[index]#获取图片名字
        img_item_path = os.path.join(self.root_dir,self.target_dir,img_name)#拼接成指向一个图片的详细地址
        img = Image.open(img_item_path)#获取这一张图片
        
        label_name = img_name.split('.')[0] + '.txt' #获取图片的标签文件名
        label_item_path = os.path.join(self.root_dir,label_dir,label_name)#拼接成指向一个图片label的详细地址
        with open(label_item_path,'r') as f:
            label = f.read()
        return img,label
    
    def __len__(self):
        '''
        数据长度
        '''
        return len(self.img_path)

读取文件：

root_dir='data\\train'
target_dir='ants_image'
label_dir='ants_label'

ants_data = MyData(root_dir,target_dir,label_dir)
img,label = ants_data[0]

三、TensorBoard的使用

$T e n sor B o a r d$ 作用：
记录日志信息并通过 $t e n sor b o a r d$ 可视化

1. add_scalar()的使用

from torch.utils.tensorboard import SummaryWriter

writer = SummaryWriter('logs')#写到logs文件夹下

for i in range(100):
    writer.add_scalar(tag='y=x',scalar_value=i,global_step=i)

writer.close()
'''
add_scalar(self, tag, scalar_value, global_step=None, walltime=None):
-tag:可视化图像标题
scalar_value：y轴
global_step：x轴
'''

改用端口：
在pytorch环境下输入：
tensorboard --logdir=日志文件所在绝对路径

可以看到端口号是6006
输入tensorboard --logdir=日志文件所在绝对路径 --port=6007

端口号变成6007

进入http://localhost:6007/后，可以看到绘制的图像：

2. add_image()的使用

from torch.utils.tensorboard import SummaryWriter
import numpy as np
from PIL import Image

writer = SummaryWriter('log')
#图片路径地址
image_path = './image.jpg'
#读取图片
img_PIL = Image.open(image_path)
#转换为numpy.array类型
img_array = np.array(img_PIL)
#绘制
writer.add_image('test',img_array,1,dataformats='HWC')
writer.close()

$add\_image(self, tag, img\_tensor, global\_step=None, walltime=None, dataformats='CHW')$

$img\_tensor$ ： $ima g e$ $d a t a$
格式要求为 $\ string/blobname$
默认的图片数据格式是 $H W C$

进入http://localhost:6007/后，可以看到绘制的图片：

四、Transforms的使用

$t orc h v i s i o n$ 是 $p y t orc h$ 的一个图形库，主要用于构建计算机视觉模型。
$t orc h v i s i o n . t r an s f or m s$ 用于图形的变换。

1. Transforms中的Compose类

$C o m p ose ()$ 类主要作用是串联多个图片变换的操作。
如下面代码，将图片先进行中心裁剪再转为 $T e n sor$ 。

transforms.Compose([
    transforms.CenterCrop(10),
    transforms.ToTensor(),
    ])

$C o m p ose ()$ 内放的是一个列表，列表里的元素是想要执行的 $t r an s f or m s$ 操作。

2. Transforms中的ToTensor类

作用是将类型为 $PIL\ Image$ 或 $n u m p y . n d a rr a y$ 的数据转变成 $t e n sor$ 类型。

$T o T e n sor$ 的使用：

from torchvision import transforms
from PIL import Image
from torch.utils.tensorboard import SummaryWriter

#创建tensorboard和读取PIL image
writer = SummaryWriter('logs')
img_path = './Zoro.png'
img = Image.open(img_path)

#实例化ToTensor类并进行调用
trans_totensor = transforms.ToTensor()、
#PIL格式转为tensor格式
img_tensor = trans_totensor(img)

#在tensorboard进行显示
writer.add_image('ToTensor',img_tensor)
writer.close()

结果：

转换前的 $PIL\ Image$ 或者 $n u m p y . n d a rr a y$ 是 $\times W \times C)$ 且范围在 $[0, 255]$ ，转换后的 $t e n sor$ 是 $\times H \times W)$ 且范围在 $[0.0, 1.0]$ 。

$T r an s f or m s$ 中的 $T o P I L I ma g e$ ：
将 $\times H \times W)$ 的tensor或者 $\times W \times C)$ 的 $n u m p y . n d a rr a y$ 转换为 $PIL\ Image$ 。

3. Transforms中的Normalize类

使用均值和方差对 $t e n sor$ 图片进行归一化。

对于 $n$ 个通道，需要提供均值 $m e an$ ： $(M 1, ..., M n)$ 和标准差 $s t d$ ： $(S 1, .., S n)$ ，然后对每个通道进行归一化：
$o u tp u t [c hann e l] = (in p u t [c hann e l] - m e an [c hann e l]) / s t d [c hann e l]$

#归一化前
print(img_tensor[0][0][0])
trans_norm = transforms.Normalize([0.5,0.5,0.5],[0.5,0.5,0.5])
#归一化后
img_norm = trans_norm(img_tensor)
print(img_norm[0][0][0])

writer.add_image('Normalize',img_norm)

writer.close()

输出：

tensor(0.9647)
tensor(0.9294)
#(0.9647-0.5)/0.5 = 0.9294

展示结果：

4. Transforms中的Resize类

作用：将输入的 $PIL\ Image$ 转换为所提供的尺寸 $s i ze$ 。

输入和输出都是 $P I L$

$s i ze$ 可以是一个序列 $(h, w)$ ；也可以是一个 $in t$ ，当只有一个数字，使用最小的边进行匹配(整体缩放，缩放后最小边的尺寸就是这个 $in t$ )

#转换前
print(img.size)
trans_reszie = transforms.Resize((512,512))
img_resize = trans_reszie(img)
#转换后
print(img_resize.size)

输出：

#转换前
(1092, 712)
#转换后
(512, 512)

4.1 结合前面的compose

#定义transforms操作
trans_totensor = transforms.ToTensor()
trans_reszie = transforms.Resize(512)

#组合
trans_compose = transforms.Compose([trans_reszie,trans_totensor])

#上面的transforms列表中的第一个是trans_reszie，所以需要传入的类型是PIL；最后返回的结果是resize后的tensor

img_resize_totensor = trans_compose(img)

注意：
当 $C o m p ose$ 中的参数顺序是 $trans_totensor，trans_reszie]$ ，会报错。因为 $trans\_reszie$ 的输入需要的是PIL类型， $trans\_totensor$ 输出是 $t e n sor$ 类型

5. Transforms中的RandomCrop类

作用：对输入 $P I L$ 图片进行随机裁剪

初始化参数：

$s i ze$ ：裁剪后的尺寸。可以是数字序列: $(h, w)$ ；或者是一个数字 $in t$ ，只有一个数字裁剪后是正方形的。
pad_if_needed:是否需要进行填充
$p a dd in g$ ：对图像边界进行填充的像素值。可以是数字序列: $(h, w)$ 、 $(l e f t, t o p, r i g h t, b o tt o m)$ ；或者是一个数字 $in t$ 。
$pad\_if\_needed$ ：是否进行填充
$f i ll$ ：填充的数值
$padding_mode$ ：填充的模式。“ $co n s t an t$ ”:利用常值进行填充；“ $e d g e$ ”:利用图像边缘像素点进行填充；“ $re f l ec t$ ”；“ $sy mm e t r i c$ ”

tans_rcrop = transforms.RandomCrop(512)

trans_compose = transforms.Compose([tans_rcrop,trans_totensor])

img_rcrop = trans_compose(img)

writer.add_image('RandomCrop',img_rcrop,global_step=1)
writer.close()

展示结果：

6. python知识点： _ _ call_ _函数

若A类中有 $_ _ \ \_ \ \_call\ \_ \ \_$ 函数，可以使用 $A (参数)$ 调用 $_ _ \ \_ \ \_call\ \_ \ \_$ 函数。

class Person:
    def __call__(self, name):
        print('call_',name)

    def hello(self,name):
        print('hello_',name)

person = Person()

#调用的是call函数，call函数的调用十分简便
person('张三')

#其他函数需要加 . 来进行调用
person.hello('李四')

输出结果:

call_ 张三
hello_ 李四

7. 总结知识点

关注某个 $c l a ss$ 时，要先了解这个 $c l a ss$ 的输入和输出。
多看官方文档
关注方法需要什么参数；如 $_ _ \ \_ \ \_init\ \_ \ \_$ 函数，在初始化时可以传入什么参数
不知道返回值的时候，多用 $p r in t ()$ 、 $t y p e ()$ 、 $d e b ug$

五、torchvision中的数据集使用

1. 数据集的下载

在官方网站可以找到很多的数据集和相关模型。
下图的 $P y T orc h$ 是一个核心模块； $t orc ha u d i o$ 是处理语言的一个模块； $t orc h t e x t$ 是处理文本的一个模块； $t orc h v i s i o n$ 是处理图像的一个模块。

点击进入 $t orc h v i s i o n$ 可以下载数据集或者训练好的模型和，如下图：

2. CIFAR-10 dataset的下载

可以通过 $t orc h v i s i o n$ 中的 $d a t a se t$ 类对数据集进行下载。如我们要下载 $C I F A R - 10$ 数据集，先在官方文档查看这个类方法的解释：

$roo t (s t r in g)$ :数据集存放在文件夹；当 $d o w n l o a d$ 设置为 $T r u e$ 会自动下载到这个文件夹下
$t r ain (b oo l)$ :是 $T r u e$ 则创建训练集数据，否则创建测试集。
$transform $:对图片的操作
$download $: 是否进行下载。$ True$则下载。

下载代码如下，下载到 $./ d a t a se t$ 文件夹下，并将数据集每张( $P I L$ )图片转成 $t e n sor$ 类型

import torchvision

dataset_transform = torchvision.transforms.Compose([
    torchvision.transforms.ToTensor()
])

#训练集
train_set = torchvision.datasets.CIFAR10(root='./dataset',transform=dataset_transform,train=True,download=True)
#测试集
test_set = torchvision.datasets.CIFAR10(root='./dataset',transform=dataset_transform,train=False,download=True)

运行结果如下，会有一个链接。这样下载速度很慢，所以建议复制链接到迅雷去下载。若运行没有出现链接，可以去到 $C I F A R 10$ 类里去 $u r l$ 属性。

打印类别并获取第一个数据：

#打印数据集类别，上面返回的target就是指classes的下标，即属于那一类
print(test_set.classes)  #['airplane', 'automobile', 'bird', 'cat', 'deer', 'dog', 'frog', 'horse', 'ship', 'truck']

img,target = test_set[0]
print(test_set.classes[target])  #cat

使用tensorboard进行展示
显示前 $10$ 张图片

from torch.utils.tensorboard import SummaryWriter

writer = SummaryWriter('p10')
for i in range(10):
    img,target = train_set[i]
    writer.add_image('CIFAR10',img,i)
writer.close()

展示结果：

2.1 CIFAR-10数据集介绍

官方介绍
这个数据集有 $60000$ 万张 $32\times32$ 的彩色图片；总共有 $10$ 个类别，每个类别都有 $6000$ 张图片；数据集的 $50000$ 张作为训练集， $10000$ 张作为测试集。

六、DataLoader的使用

1. dataset类和datalodar的关系

$d a t a se t$ 负责获取数据，如获得一副扑克牌； $d a t a l o a d er$ 负责从 $d a t a se t$ 中抽取数据，如怎么从一副扑克牌中抽取几张扑克。
如下图， $d a t a l o a d er$ 负责抽取数据放入神经网络中，抓住牌的手可以看出需要获取数据的神经网络。

2.Dataloader官方介绍

官方介绍链接

参数：

$d a t a se t (D a t a se t)$ :之前定义的 $D a t a se t$ ，作用是提供数据集的位置、长度等信息。
$batch\_size (int)$ :每次抽取数据的大小
$s h u ff l e (b oo l)$ ：每个 $e p oc h$ 是否打乱数据
$num\_workers (int)$ :线程数量。但在 $w in d o w$ 环境下不太好使
$drop\_last (bool)$ :最后抽取的数据抽不成一个完整的 $batch\_size$ ， $F a l se$ 的时候会保留这些数据， $T r u e$ 舍弃。

3.代码实例

import torchvision
from torch.utils.data import  DataLoader

#获取数据
import torchvision
from torch.utils.data import  DataLoader
from torch.utils.tensorboard import SummaryWriter

#获取数据
test_data = torchvision.datasets.CIFAR10(root='./dataset',transform=torchvision.transforms.ToTensor(),train=False,download=True)

#dataloder的使用
test_loader = DataLoader(dataset=test_data,batch_size=64,shuffle=True,num_workers=0,drop_last=False)

writer = SummaryWriter('dataloder')
step = 0

for data in test_loader:
    imgs,targets = data
    
	#注意是images
    writer.add_images('dataloder',imgs,step)
    step+=1

writer.close()

因为这里 $batch_size$ =64，所以data都是 $t orc h . S i ze ([64, 3, 32, 32])$ 。

$d a t a se t$ 取出数据， $d a t a l o a d er$ 将 $d a t a se t$ 中的数据每64个打包成一组。

展示结果：

七、神经网络的基本骨架-nn.Module的使用

7.1 官方文档介绍

官方nn.Module文档

$t orc h . nn$ 包含了很多的神经网络模块，其中的 $C o n t ain ers$ (容器)表示的是神经网络的基本骨架。

如其中的 $M o d u l e$ ，官方解释： $Base\ class\ for\ all\ neural\ network\ modules.$
当我们使用 $M o d u l e$ 时，创建的类都要继承这个类，如下面的代码：

import torch.nn as nn
import torch.nn.functional as F

class Model(nn.Module):
    def __init__(self):
    	#调用父类的初始化，必须有
        super().__init__()
        self.conv1 = nn.Conv2d(1, 20, 5)
        self.conv2 = nn.Conv2d(20, 20, 5)

	#前向传播
    def forward(self, x):
    	#x-->conv1-->relu-->conv2-->relu-->output
        x = F.relu(self.conv1(x))
        return F.relu(self.conv2(x))

7.2 代码实例

尝试一个 $+ 1$ 功能的神经网络：

import torch
from torch import  nn
class Model(nn.Module):
    def __index__(self):
        super().__init__()

    def forward(self,input):
        output = input+1
        return output

model = Model()
x = torch.tensor(1.0)
output = model(x)
print(output) #tensor(2.)

八、卷积层(Convolution Layers)

$t orc h . nn$ 是 $t orc h . nn . f u n c t i o n$ 的封装。即一个现成的工具( $t orc h . nn$ )和零件( $t orc h . nn . f u n c t i o n$ )的关系。

8.1 torch.nn.function.conv2d官方介绍

本小节讨论 $2 D$ 的卷积，即函数 $co n v 2 d$

torch.nn.functional.conv2d(input, weight, bias=None, stride=1, padding=0, dilation=1, groups=1)

参数:

$in p u t$ :输入的维度 $minibatch,in\_channels,iH,iW)$
$w e i g h t$ :卷积核维度 $out_channels , in_channels groups , k H , k W ) (\text{out\_channels} , \frac{\text{in\_channels}}{\text{groups}} , kH , kW)$
$s t r i d e$ :滑动的步数。一个数字或者一个数字序列 $(sH, s W)$
$p a dd in g$ :填充。可以是字符串{ $‘ v a l i d ’$ , $‘ s am e ’$ },或者是一个数字，或者是数字序列 $(p a d H, p a d W)$

8.2 代码实例

本小节将实现下面的卷积操作

代码：

import torch
import torch.nn.functional  as F

input = torch.tensor([[1,2,0,3,1],
                      [0,1,2,3,1],
                      [1,2,1,0,0],
                      [5,2,3,1,1],
                      [2,1,0,1,1]])

kernel = torch.tensor([[1,2,1],
                       [0,1,0],
                       [2,1,0]])

input = torch.reshape(input,(1,1,5,5))#(1,1,5,5) -- (样本数，通道数，w，h)
kernel = torch.reshape(kernel,(1,1,3,3))#(1,1,3,3) -- (卷积核数目，通道数，w，h)

output = F.conv2d(input,kernel,stride=1)
print(output)

输出结果：

tensor([[[[10, 12, 12],
          [18, 16, 16],
          [13,  9,  3]]]])

8.3 torch.nn.Conv2d官方介绍

官方介绍

参数：

$in\_channels (int)$ ：输入图像的通道数
$out\_channels (int)$ ：输出图像的通道数
$kernel\_size (int\ or\ tuple)$ ：卷积核尺寸
$(int\ or\ tuple)$ ：滑动步数
$tuple\ or\ str)$ ：填充方式
$bia s (b oo l)$ ：是否为输出结果添加偏置
$dilation(int\ or\ tuple)$ :间隔空隙。如下图中的卷积核覆盖是间隔着距离的

输入维度与输出维度：

$Input: (N,C_{in},H_{in},W_{in})\ or\ (C_{in},H_{in},W_{in})$
$Output:(N, C_{out}, H_{out}, W_{out})\ or\ (C_{out}, H_{out}, W_{out})$

8.4 代码实例

import torch
from torch import nn
from torch.utils.tensorboard import SummaryWriter
from torch.utils.data import DataLoader
import torchvision

#获取数据
dataset = torchvision.datasets.CIFAR10('.\dataset',transform=torchvision.transforms.ToTensor(),train=False,download=True)

#抽取数据
dataloder = DataLoader(dataset=dataset,batch_size=64)

#定义卷积模型  x-->conv2d-->output
class Model(nn.Module):
    def __init__(self):
        super().__init__()
        self.conv2d = nn.Conv2d(in_channels=3,out_channels=6,kernel_size=3,stride=1,padding=0)

    def forward(self,x):
        output = self.conv2d(x)
        return output

#模型实例化
model = Model()

#使用tensorboard进行可视化
writer = SummaryWriter('./logs')
step = 0

#遍历数据集
for data in dataloder:
    
    imgs,targets = data

    #输入前[64,3,32,32]
    writer.add_images('input',imgs,step)
    
    #放入模型
    outputs = model(imgs)

    #输入后[64,6,30,30]  转换成[……,3,30,30]才能可视化
    outputs = torch.reshape(outputs,(-1,3,30,30))
    writer.add_images('output', outputs, step)

    step += 1

writer.close()

展示结果：

九、最大池化的使用

最大池化目的：
保留最大特征同时减小输入维度。

9.1 MaxPool2d官方介绍

参数：

$kernel\_size$ ：窗口大小
$s t r i d e$ ：窗口移动步幅。默认值是 $kernel\_size$
$p a dd in g$ :填充数值
$ceil\_mode$ ：如下图所示，区别在于池化核移动到边缘时，不能完全覆盖输入，是否依然要输出其最大值。 $T r u e$ 则输出， $F a l se$ 不输出。

9.2 代码实例

我们要尝试下图的池化计算(注意 $kernel\_size=3$ ， $s t r i d e$ 也默认为 $3$ )

import torch
from torch import nn

input = torch.tensor([[1,2,0,3,1],
                      [0,1,2,3,1],
                      [1,2,1,0,0],
                      [5,2,3,1,1],
                      [2,1,0,1,1]],dtype=torch.float32)

input = torch.reshape(input,(1,1,5,5))#(1,1,5,5) -- (样本数，通道数，w，h)

class Model(nn.Module):
    def __init__(self):
        super().__init__()
        self.maxpool1 = nn.MaxPool2d(kernel_size=3,ceil_mode=True)

    def forward(self,x):
        output = self.maxpool1(x)
        return output

model = Model()
output = model(input)
print(output)
'''tensor([[[[2., 3.],
          [5., 1.]]]])'''

9.3 最大池化的直观感受

我们对CIFAR10数据集的测试集进行最大池化并可视化结果：

import torchvision
from torch import nn
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

dataset = torchvision.datasets.CIFAR10('./dataset',train=False,transform=torchvision.transforms.ToTensor(),download=True)

dataloder = DataLoader(dataset,batch_size=64)

class Model(nn.Module):
    def __init__(self):
        super().__init__()
        self.maxpool1 = nn.MaxPool2d(kernel_size=3,ceil_mode=True)

    def forward(self,x):
        output = self.maxpool1(x)
        return output

model = Model()

writer = SummaryWriter('logs')
step = 0

for data in dataloder:
    imgs,targets = data

    writer.add_images('input',imgs,step)
    output = model(imgs)
    writer.add_images('output',output,step)

    step+=1

writer.close()

展示结果：
原始输入

池化后输出：

输出的结果变模糊了，有点类似视频的画质。保留图像的大部分特征并缩小图像维度。

十、非线性激活

非线性函数的目的是为了给网络引入一些非线性特折，非线性特征足够多才能够拟合出符合各种曲线线(各种特征)的模型。

10.1 线性激活官方介绍

官方文档
以 $R e LU$ 为例子

class
torch.nn.ReLU(inplace=False)

参数：

$in pl a ce$ ：是否替换输入。
如 $R e LU (in p u t, in pl a ce = T r u e)$ ，这里的 $in p u t$ 的值会随着函数的使用而改变，可以不用变量接收返回值。

数学公式：
$R e LU (x) = (x) + = ma x (0, x)$

输入输出维度：

图像：

10.2 代码实例

import torch
from torch import nn

input = torch.tensor([[1,-0.5],
                      [-3,2]])

input = torch.reshape(input,(1,1,2,2))#(1,1,2,2) -- (样本数，通道数，w，h)

class Model(nn.Module):
    def __init__(self):
        super().__init__()
        self.relu1 = nn.ReLU()

    def forward(self,x):
        output = self.relu1(x)
        return output

model = Model()
output = model(input)
print(output)
'''
tensor([[[[1., 0.],
          [0., 2.]]]])
'''

十一、线性层介绍

官方链接
$L I NE A R$ 为例子

class
torch.nn.Linear(in_features, out_features, bias=True, device=None, dtype=None)

参数：

$in\_features$ ：输入特征数(前一层节点数)
$out\_features$ ：输出特征数(当前层节点数)
$bia s$ ：是否添加偏置

$l in e a r$ 就是计算 $y=xA^T+b$

经典的 $L R$ 算法的结构就是： $x - > l inn e a r - > S o f t ma x - > o u tp u t$ ，即线性层的输出一般作为激活函数的输入。

十二、搭建CIFAR-10网络模型

神经网络结构示意图如下：

12.1 不使用Sequential

import torch
from torch import nn
from torch.nn import Conv2d,MaxPool2d,Linear
from torch.nn.modules.flatten import Flatten


class Model(nn.Module):
    def __init__(self):
        super().__init__()
        self.conv1 = Conv2d(3,32,5,padding=2)
        self.maxpool1 = MaxPool2d(2)
        self.conv2 = Conv2d(32, 32, 5, padding=2)
        self.maxpool2 = MaxPool2d(2)
        self.conv3 = Conv2d(32, 64, 5, padding=2)
        self.maxpool3 = MaxPool2d(2)
        self.faltten = Flatten()
        self.linear1 = Linear(1024,64)
        self.linear2 = Linear(64,10)

    def forward(self,x):
        x = self.conv1(x)
        x = self.maxpool1(x)
        x = self.conv2(x)
        x = self.maxpool2(x)
        x = self.conv3(x)
        x = self.maxpool3(x)
        x= self.faltten(x)
        x = self.linear1(x)
        x = self.linear2(x)
        return x

model = Model()

#检测网络输出
input = torch.ones([64,3,32,32])
output = model(input)
print(output.shape)#torch.Size([64, 10])

要点：

对于 $p a dd in g 、 s t r i d e$ 的确定可以使用公式进行计算
$Fl a tt e n ()$ 的引用在 $t orc h . nn . m o d u l es . f l a tt e n$ 。【本人是 $1.4.1$ 版本的 $p y t orc h$ 】
如果不知道下一层的应该使用什么维度的卷积层，可以在 $f or w a r d$ 里面截断输出上一层的维度。
例如：不知道第一层 $FC$ 输入是多少，可以在 $f or w a r d$ 里面就前向传播到 $f a ltt e n$ ，查看它的输出维度就知道第一层 $FC$ 输入应该是 $1024$ 了。

12.2 使用Sequential

$S e q u e n t ia l$ 使代码更简洁和有序，代码如下：

import torch
from torch import nn
from torch.nn import Conv2d, MaxPool2d, Linear, Sequential
from torch.nn.modules.flatten import Flatten


class Model(nn.Module):
    def __init__(self):
        super().__init__()
        self.model1 = Sequential(
            Conv2d(3, 32, 5, padding=2),
            MaxPool2d(2),
            Conv2d(32, 32, 5, padding=2),
            MaxPool2d(2),
            Conv2d(32, 64, 5, padding=2),
            MaxPool2d(2),
            Flatten(),
            Linear(1024, 64),
            Linear(64, 10)
        )


    def forward(self,x):
        x = self.model1(x)
        return x

model = Model()

#检测网络输出
input = torch.ones([64,3,32,32])
output = model(input)
print(output.shape)##torch.Size([64, 10])

12.3 模型的可视化

from torch.utils.tensorboard import SummaryWriter

writer = SummaryWriter('./logs')
writer.add_graph(model,input)
writer.close()

展示结构如下，双击查看详细结构

十三、损失函数与反向传播

$L oss$ 的作用：

计算实际输出与目标之间的差距
为更新输出提供一定的依据(反向传播)

13.1 官方文档介绍

文档链接

13.1.1 L1Loss

torch.nn.L1Loss(size_average=None, reduce=None, reduction='mean')

$ℓ(x,y)=L=\{l_1,…,l_N\}^⊤,l_n=∣x_n−y_n∣$

13.1.2 MSELoss

平方差

class
torch.nn.MSELoss(size_average=None, reduce=None, reduction='mean')

$ℓ(x,y)=L=\{l_1,…,l_N\}^⊤,l_n=(x_n−y_n)^2$

13.1.3 CrossEntropyLoss

一般用于多分类问题， $C$ 表示分类个数

class
torch.nn.CrossEntropyLoss(weight=None, size_average=None, ignore_index=-100, reduce=None, reduction='mean')

$x$ 表示预测结果(多分类问题预测结果是数组)
$c l a ss$ 表示真实的分类
$j$ 的范围为 $[0, (C - 1)]$

13.2 为CIFAR-10网络模型添加损失函数

#获取数据
dataset = torchvision.datasets.CIFAR10('.\dataset',transform=torchvision.transforms.ToTensor(),train=False,download=True)

#抽取数据
dataloder = DataLoader(dataset=dataset,batch_size=64)

#定义模型
model = Model()
#定义损失函数
loss = nn.CrossEntropyLoss()

#一个mini_batch计算一次损失函数
for data in dataloder:
    imgs,targets = data
    output = model(imgs)
    res_loss = loss(output,targets)#损失函数值=loss(预测值,真实值)
    print(res_loss)

输出结果：

Files already downloaded and verified
tensor(2.3027, grad_fn=<NllLossBackward>)
tensor(2.3200, grad_fn=<NllLossBackward>)
tensor(2.2939, grad_fn=<NllLossBackward>)
tensor(2.3089, grad_fn=<NllLossBackward>)
tensor(2.3268, grad_fn=<NllLossBackward>)
…………不展示全部输出

添加反向传播：

#一个mini_batch计算一次损失函数
for data in dataloder:
    imgs,targets = data
    output = model(imgs)
    res_loss = loss(output,targets)#损失函数值=loss(预测值,真实值)
    #反向传播
    res_loss.backward()

在运行 $res\_loss.backward()$ 之前， $m o d e l$ 里面的梯度 $g r a d$ 是 $N o n e$ 的，如下图：

在运行之后，梯度 $g a r d$ 就被附上了值，如下图：

之后采取优化算法使用这些值来优化模型。

十四、优化器

14.1 官方文档介绍

官方介绍
使用流程：

$Constructing\ it$ (构建它)：

optimizer = optim.SGD(model.parameters(), lr=0.01, momentum=0.9)

参数：
$m o d e l . p a r am e t ers ()$ ：模型参数
$l r$ :学习率

$Taking\ an\ optimization\ step$ (进行优化步骤)：

for input, target in dataset:
    optimizer.zero_grad()#梯度归0
    output = model(input)
    loss = loss_fn(output, target)
    loss.backward()#计算梯度
    optimizer.step()#优化

14.2 为CIFAR-10网络模型添加优化器

如下面代码，在之前的基础上添加了外层 $e p oc h$ 迭代，一次迭代遍历一数据集。

优化器的添加要保证这三个的前后次序：
$(1) g r a d 清零 - - > (2) 反向传播计算 g r a d - - > (3) 优化算法根据 g r a d 执行梯度下降$

#获取数据
dataset = torchvision.datasets.CIFAR10('.\dataset',transform=torchvision.transforms.ToTensor(),train=False,download=True)

#抽取数据
dataloder = DataLoader(dataset=dataset,batch_size=64)

#定义模型
model = Model()
#定义损失函数
loss = nn.CrossEntropyLoss()

#优化器
optim = torch.optim.SGD(model.parameters(),lr=0.01)
for epoch in range(20):
    running_loss = 0.0
    for data in dataloder:
        optim.zero_grad()  # grad清零
        imgs, targets = data
        output = model(imgs)
        res_loss = loss(output, targets)  # 损失函数值=loss(预测值,真实值)
        res_loss.backward()  # 反向传播计算grad
        optim.step()  # 优化算法进行梯度下降
        running_loss += res_loss

十五、官网模型的加载(浅谈)

15.1 官网介绍

以 $V GG 16$ 为例子：

vgg = torchvision.models.vgg16(pretrained=False, progress=True, **kwargs)

$p re t r ain e d$ :是否下载权重进行预训练
当为 $T r u e$ 时，加载模型过程中会下载官网训练好的权重
$p ro g ress$ :是否显示进度条

这个模型使用的 $I ma g e N e t$ 数据集很大，官网不提供下载，可以去浏览器搜索资源下载。

在官网查看模型函数介绍时，要选择正确的 $t orc h v i s i o n$ 版本，不同版本函数之间存在一定的差异。

15.2 模型的使用与修改

下图是 $V GG 16$ 的结构图，最后一层的输出维度是 $1000$ ，是一个多分类问题。

如何修改 $V GG 16$ 应用到 $C I F A R - 10$ 这个数据集上呢？

添加新的输出层，可以添加一个输出维度为 $10$ 的 $FC$ 层

import torchvision
from torch.nn import Linear

vgg16 = torchvision.models.vgg16(pretrained=False,progress=True)

vgg16.add_module('add_linear',Linear(1000,10))

print(vgg16)

输出结果：
看下图红框，网络结构的最后一层成功的添加了一层全连接层。

若想把这个 $FC$ 层添加到 $c l a ss i f i er$ 中去，将

vgg16.add_module('add_linear',Linear(1000,10))

对原有输出层进行替换

vgg16.classifier[6]=Linear(4096,10)

十六、网络模型的保存与读取

第一种方式：
保存模型结构和参数

vgg16 = torchvision.models.vgg16(pretrained=False,progress=True)

#保存方式一
torch.save(vgg16,'vgg16_method1.pth')#(模型,文件名)
#会在文件夹下生成一个vgg16_method1.pth文件，包含模型结构和参数权重

#读取方式一
model = torch.load('vgg16_method1.pth')

第一种方式在保存和读取自己定义的模型时，会有陷阱：
在读取模型时会报错，所以需要把模型 $c l a ss$ 定义复制到读取的那个 $. p y$ 文件中。也可以从定义模型 $c l a ss$ 的那个类 $im p or t$ 进来。

第二种方式：
保存模型参数(官方推荐)

#保存方式二
torch.save(vgg16.state_dict(),'vgg16_method2.pth')#(模型的状态字典,文件名)
#状态字典中保存了模型的参数权重，不包含网络结构

#读取方式二
vgg16 = torchvision.models.vgg16(pretrained=False,progress=True)#重建网络结构
vgg16.load_state_dict(torch.load('vgg16_method2.pth'))#加载参数字典

十七、完整的模型训练套路

一、加载数据集

#加载数据集
train_data = torchvision.datasets.CIFAR10('./dataset',train=True,transform=torchvision.transforms.ToTensor(),download=True)
test_data = torchvision.datasets.CIFAR10('./dataset',train=False,transform=torchvision.transforms.ToTensor(),download=True)

train_data_len = len(train_data)
test_data_len = len(test_data)

#打印数据长度
print("训练集数据长度{}".format(train_data_len))
print("训练集数据长度{}".format(test_data_len))

#抽取数据
train_loader = DataLoader(train_data,batch_size=64)
test_loader = DataLoader(test_data,batch_size=64)

二、搭建网络模型与测试

这个网络模型的搭建可以在一个新py文件中定义，需要时从这个 $p y$ 文件 $im p or t$ 即可

#搭建模型
class Model(nn.Module):
    def __init__(self):
        super().__init__()
        self.model = Sequential(
            Conv2d(3, 32, 5, padding=2),
            MaxPool2d(2),
            Conv2d(32, 32, 5, padding=2),
            MaxPool2d(2),
            Conv2d(32, 64, 5, padding=2),
            MaxPool2d(2),
            Flatten(),
            Linear(1024, 64),
            Linear(64, 10)
        )

    def forward(self,x):
        x = self.model(x)
        return x

#测试模型输出维度
if __name__ == '__main__':
    model = Model()
    input = torch.ones((64,3,32,32))
    output = model(input)
    print(output.shape)

三、定义网络模型、损失函数、优化器与tensorboard的可视化

#创建网络模型
model = Model()

#添加tensorboard
writer = SummaryWriter('./logs')

#损失函数
loss_fn = nn.CrossEntropyLoss()

#优化器
learning_rate = 1e-2
optimizer = torch.optim.SGD(model.parameters(),lr=learning_rate)

#设置网络训练参数
#记录训练次数
total_train_step = 0
#记录测试次数
total_test_step = 0
#训练轮次
epochs = 10

for epoch in range(epochs):
    print("----第{}轮训练开始----".format(epoch+1))
    for data in train_loader:
        imgs,targets = data
        outputs = model(imgs)
        loss = loss_fn(outputs,targets)

        #优化器优化模型
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        total_train_step+=1
        if total_train_step%100 == 0:
            print("训练次数{},Loss:{}".format(total_train_step,loss.item()))
            writer.add_scalar("train_loss",loss,total_train_step)

    #测试集步骤开始
    total_test_loss = 0
    total_accuracy = 0
    
    with torch.no_grad():#确保不进行优化，仅测试
        for data in test_loader:
            imgs,targets = data
            outputs = model(imgs)
            loss = loss_fn(outputs,targets)
            total_test_loss += loss.item()
            #正确率计算
            accuracy = (outputs.argmax(1)==targets).sum()
            total_accuracy += accuracy
    print("测试集整体上的正确率:{}".format(total_accuracy/test_data_len))
    print("测试集整体上的Loss:{}".format(total_test_loss))
    writer.add_scalar("test_loss", total_test_loss, total_test_step)
    writer.add_scalar("test_accuracy", total_accuracy/test_data_len, total_test_step)
    total_test_step +=1
    
    #模型保存
    #torch.save(model,"model_{}.pth".format(epoch))
writer.close()

完整代码
$t r ain . p y$ :

from torch.utils.data import DataLoader
import torchvision
from torch.utils.tensorboard import SummaryWriter

from model import *

#加载数据集
train_data = torchvision.datasets.CIFAR10('./dataset',train=True,transform=torchvision.transforms.ToTensor(),download=True)
test_data = torchvision.datasets.CIFAR10('./dataset',train=False,transform=torchvision.transforms.ToTensor(),download=True)

train_data_len = len(train_data)
test_data_len = len(test_data)

#打印数据长度
print("训练集数据长度{}".format(train_data_len))
print("训练集数据长度{}".format(test_data_len))

#抽取数据
train_loader = DataLoader(train_data,batch_size=64)
test_loader = DataLoader(test_data,batch_size=64)

#创建网络模型
model = Model()

#添加tensorboard
writer = SummaryWriter('./logs')

#损失函数
loss_fn = nn.CrossEntropyLoss()

#优化器
learning_rate = 1e-2
optimizer = torch.optim.SGD(model.parameters(),lr=learning_rate)

#设置网络训练参数
#记录训练次数
total_train_step = 0
#记录测试次数
total_test_step = 0
#训练轮次
epochs = 10

for epoch in range(epochs):
    print("----第{}轮训练开始----".format(epoch+1))
    for data in train_loader:
        imgs,targets = data
        outputs = model(imgs)
        loss = loss_fn(outputs,targets)

        #优化器优化模型
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        total_train_step+=1
        if total_train_step%100 == 0:
            print("训练次数{},Loss:{}".format(total_train_step,loss.item()))
            writer.add_scalar("train_loss",loss,total_train_step)

    #测试集步骤开始
    total_test_loss = 0
    total_accuracy = 0
    #确保不进行优化，仅测试
    with torch.no_grad():
        for data in test_loader:
            imgs,targets = data
            outputs = model(imgs)
            loss = loss_fn(outputs,targets)
            total_test_loss += loss.item()
            accuracy = (outputs.argmax(1)==targets).sum()
            total_accuracy += accuracy.item()
    print("测试集整体上的正确率:{}".format(total_accuracy/test_data_len))
    print("测试集整体上的Loss:{}".format(total_test_loss))
    writer.add_scalar("test_loss", total_test_loss, total_test_step)
    writer.add_scalar("test_accuracy", total_accuracy/test_data_len, total_test_step)
    total_test_step +=1

    #模型保存
    #torch.save(model,"model_{}.pth".format(epoch))
writer.close()

$m o d e l . p y$

import torch
from torch import nn
from torch.nn import Sequential,Conv2d,MaxPool2d,Linear
from torch.nn.modules.flatten import Flatten

#搭建模型
class Model(nn.Module):
    def __init__(self):
        super().__init__()
        self.model = Sequential(
            Conv2d(3, 32, 5, padding=2),
            MaxPool2d(2),
            Conv2d(32, 32, 5, padding=2),
            MaxPool2d(2),
            Conv2d(32, 64, 5, padding=2),
            MaxPool2d(2),
            Flatten(),
            Linear(1024, 64),
            Linear(64, 10)
        )

    def forward(self,x):
        x = self.model(x)
        return x

if __name__ == '__main__':
    model = Model()
    input = torch.ones((64,3,32,32))
    output = model(input)
    print(output.shape)

展示结果(没有训练完，太耗时间了，下节使用GPU加速会快很多)：

注意：

关于 $t r ain (m o d e = T r u e)$ 和 $e v a l ()$ :
$t r ain ()$ 表示开启训练，后续代码是进行训练集训练的。
$e v a l ()$ 表示开启测试，后续代码是进行验证集训练的。
但大部分情况下可以不用添加这两行代码，除非使用了 $Dro p o u t, B a t c h N or m$
当数字和 $t e n sor$ 进行计算时，要使用 $t e n sor . i t e m$ 进行计算

十八、使用CPU训练

18.1 第一种方式

在网络模型、数据(输入、标注)、损失函数处加上 $. c u d a ()$

if torch.cuda.is_available()是为了在gpu和cpu环境下都能跑。

第一处：网络模型
第二处：数据(输入、标注)
第三处：损失函数处

使用GPU训练速度快了好多。
10个轮次的训练，测试集正确率能达到53%

如果电脑上没有不能使用GPU加速，可以使用国外的 $Google\ colab$ 或者国内的天池实验室来代跑我们的代码。

18.2 第二种方式

使用 $. t o (d i v i ce)$

先在开头定义训练的设备：

为了确保不能 $GP U$ 加速的情况下代码也能使用，可以替换成下面的代码：

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

第一处：网络模型
可以不用赋值
第二处：数据(输入、标注)
可以不用赋值
第三处：损失函数处

18.3 测试时注意事项

使用GPU加速训练的模型，在预测新数据时，要将数据进行转换,如 $im g = im g . c u d a ()$ 。
$p n g$ 格式是四个通道，除了RGB三通道外，还有一个透明的通道。因此应该使用 $ima g e = ima g e . co n v er t (^{'} RG B^{'})$ 保留颜色通道。
加载训练好的模型时，若 $map\_location$ 报错，应添加 $map\_location = torch.device('cpu')$ 【cpu或cuda】

model = torch.load("model_gpu.pth",map_location=torch.device('cpu'))

你可能感兴趣的:(深度学习框架学习,pytorch,学习,深度学习)

【30天玩转python】项目实战：从零开始开发一个Python项目爱技术的小伙子 30天玩转python linux 运维服务器
项目实战：从零开始开发一个Python项目在学习Python的过程中，开发一个完整的项目是非常重要的实战练习。它不仅能够帮助你巩固所学的知识，还能提高实际编程能力。本文将带领你从零开始开发一个Python项目，介绍从项目规划、环境搭建、代码实现到项目发布的完整过程。我们将以一个简单的“任务管理系统”为例，逐步讲解如何构建、测试和优化这个项目。1.项目规划1.1项目简介我们将开发一个基于命令行的任务
flink+kafka实现流数据处理学习上海研博数据 java
在应用系统的建设过程中，通常都会遇到需要实时处理数据的场景，处理实时数据的框架有很多，本文将以一个示例来介绍flink+kafka在流数据处理中的应用。1、概念介绍flink：是一个分布式、高可用、高可靠的大数据处理引擎，提供了一种高效、可靠、可扩展的方式来处理和分析实时数据。kafka：是用于构建实时数据管道和流应用程序并具有横向扩展，容错，wickedfast（变态快）等优点的一种消息中间件。
Python从0到100（七十六）：计算机视觉-直方图和自适应直方图均衡化是Dream呀 python 计算机视觉开发语言
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
Elasticsearch 入门教学：从零开始掌握分布式搜索引擎格子先生Lab 搜索引擎 elasticsearch 分布式
引言Elasticsearch是一个开源的分布式搜索引擎，基于ApacheLucene构建，能够实现近乎实时的数据搜索和分析。它广泛应用于日志分析、全文搜索、数据可视化等场景。本文将带你从零开始学习Elasticsearch，掌握其基本概念、安装配置、数据操作及搜索功能。1.Elasticsearch简介1.1什么是Elasticsearch？Elasticsearch是一个分布式的RESTful
【LLM】预训练的具体流程 FOUR_A LLM python 人工智能深度学习大模型
分词器训练预训练模型：就像你已经学会了一些基础知识的“大脑”，我们可以在这个基础上继续学习新东西。比如，有些模型已经学会了英语，但中文学得不够好。中文预训练：为了让这个“大脑”更好地理解中文，我们需要用大量的中文数据继续训练它。分词器（Tokenizer）：它的作用是把一句话拆分成一个个小单元（比如词语或字）。比如，“我喜欢学习”会被拆成“我/喜欢/学习”。这些拆分后的单元会被转换成数字，方便模型
递推和递归_一文学会递归递推 HR刀姐递推和递归
递归算法和递推算法无论是在ACM竞赛还是项目工程上都有着极为广泛的应用，但想要完全掌握两者的思想并不容易，对于刚刚接触编程的人来说更是这样，我在初次接触递归递推时就吃了很多的苦头，除了当时对编程语言不太熟悉之外，最大的原因就是难以理解其中的思想，本文将二者结合代码分别讲解，力求以"理论+实践"的方式使读者明白两种算法。一箭双雕，一文双递。一.递归和递推的区别学习递归递推的一个容易遇到的问题就是混淆
ZooKeeper学习总结（1）——ZooKeeper入门介绍一杯甜酒 ZooKeeper学习总结 Zookeeper
1.概述Zookeeper是Hadoop的一个子项目，它是分布式系统中的协调系统，可提供的服务主要有：配置服务、名字服务、分布式同步、组服务等。它有如下的一些特点：简单Zookeeper的核心是一个精简的文件系统，它支持一些简单的操作和一些抽象操作，例如，排序和通知。丰富Zookeeper的原语操作是很丰富的，可实现一些协调数据结构和协议。例如，分布式队列、分布式锁和一组同级别节点中的“领导者选举
Zookeeper+kafka学习笔记 CHR_YTU Zookeeper
Zookeeper是Apache的一个java项目，属于Hadoop系统，扮演管理员的角色。配置管理分布式系统都有好多机器，比如我在搭建hadoop的HDFS的时候，需要在一个主机器上（Master节点）配置好HDFS需要的各种配置文件，然后通过scp命令把这些配置文件拷贝到其他节点上，这样各个机器拿到的配置信息是一致的，才能成功运行起来HDFS服务。Zookeeper提供了这样的一种服务：一种集
Zookeeper【概念（集中式到分布式、什么是分布式、CAP定理、什么是Zookeeper、应用场景、为什么选择Zookeeper 、基本概念）】(一)-全面详解（学习总结---从入门到深化）童小纯中间件大全---全面详解 zookeeper 分布式
作者简介：大家好，我是小童，Java开发工程师，CSDN博客博主，Java领域新星创作者系列专栏：前端、Java、Java中间件大全、微信小程序、微信支付、若依框架、Spring全家桶如果文章知识点有错误的地方，请指正！和大家一起学习，一起进步如果感觉博主的文章还不错的话，请三连支持一下博主哦博主正在努力完成2023计划中：以梦为马，扬帆起航，2023追梦人目录Zookeeper概念_集中式到分布
深度学习：马氏距离壹十壹深度学习深度学习人工智能
马氏距离（MahalanobisDistance）是一种用于计算不同维度数据点之间距离的度量方法。它考虑了数据的协方差结构，因此在处理具有相关性的多维数据时更加有效。与欧氏距离不同，马氏距离不仅考虑了各个变量的量纲，还考虑了它们之间的相关性。公式马氏距离计算两个向量(x)和(y)之间的距离，定义为：DM(x,y)=(x−y)TS−1(x−y)\D_M(x,y)=\sqrt{(x-y)^TS^{-1
深度学习：CPU和GPU算力壹十壹深度学习深度学习 gpu算力人工智能
一、算力“算力”（ComputingPower）通常是指计算机或计算系统执行计算任务的能力。它是衡量系统处理数据、运行算法以及执行计算任务效率的重要指标。根据上下文，算力可以在以下几种场景中具体化：1.单机算力CPU算力：中央处理器的计算能力，通常用核心数量（cores）、时钟频率（GHz）、以及每秒浮点运算次数（FLOPS）等指标衡量。GPU算力：图形处理单元用于并行处理的能力，尤其是在深度学习
深度学习：偏差和方差壹十壹深度学习深度学习人工智能 python 机器学习
偏差（Bias）偏差衡量了模型预测值的平均值与真实值之间的差距。换句话说，偏差描述了模型预测的准确度。一个高偏差的模型容易出现欠拟合，即模型无法捕捉数据中的真实关系，因为它对数据的特征做出了错误的假设。特征：高偏差的模型通常是过于简单的模型，无法对数据中的复杂关系进行准确建模。高偏差模型的训练误差和测试误差可能都较高。解决方法：增加模型复杂度：例如增加多项式的阶数、增加神经网络的层数等。使用更多的
HarmonyNext实战案例：基于ArkTS的高性能音视频处理应用开发 harmonyos-next
HarmonyNext实战案例：基于ArkTS的高性能音视频处理应用开发引言在HarmonyNext生态系统中，ArkTS作为新一代的编程语言，为开发者提供了强大的工具来构建高性能、跨平台的应用。本文将深入探讨如何使用ArkTS12+语法开发一个高性能的音视频处理应用，涵盖从基础概念到高级技巧的全面讲解。通过本案例，您将学习到如何利用HarmonyNext的特性，结合ArkTS的强大功能，实现复杂
Solana中的程序派生地址（PDAs）：是什么，为什么，以及如何？ GTokenTool发币平台区块链
程序派生地址(PDA)在Solana中的应用：什么、为什么和如何？在学习Solana时，你会经常听到关于程序派生地址(PDAs)的讨论。它们就像这样——强大、多功能，而且最重要的是，稍微被误解。如果你是一个开发者，试图理解它们，不用担心。我们将在本文中一起揭开PDAs的面纱。在本文中，我将从基础开始解释PDAs，假设你刚刚开始接触Solana。因此，不需要任何先前的知识——让我们开始吧。什么是PD
Zookeeper与Kafka学习笔记上海研博数据 zookeeper kafka 学习
一、Zookeeper核心要点1.核心特性分布式协调服务，用于维护配置/命名/同步等元数据采用层次化数据模型（Znode树结构），每个节点可存储<1MB数据典型应用场景：HadoopNameNode高可用HBase元数据管理Kafka集群选举与状态管理2.设计限制内存型存储，不适合大数据量场景数据变更通过版本号（Version）控制，实现乐观锁机制采用ZAB协议保证数据一致性二、Kafka核心架构
Zookeeper学习种豆走天下 zookeeper 学习分布式
Zookeeper是一个开源的分布式协调框架，它主要用于处理分布式系统中的一些常见问题，如同步、配置管理、命名服务和集群管理等。Zookeeper是由Apache提供的，并且广泛应用于各种分布式应用中，特别是在高可用、高可靠性和高性能的系统中。Zookeeper的主要功能分布式协调：Zookeeper提供了协调多个节点（服务器）间行为的机制。例如，分布式锁、选举、配置管理等。命名服务：Zookee
机器学习之线性代数珠峰日记 AI理论与实践机器学习线性代数人工智能
文章目录一、引言：线性代数为何是AI的基石二、向量：AI世界的基本构建块（一）向量的定义（二）向量基础操作（三）重要概念三、矩阵：AI数据的强大容器（一）矩阵的定义（二）矩阵运算（三）矩阵特性（四）矩阵分解（五）Python示例（使用NumPy库）四、线性代数在AI中的应用（一）数据表示（二）降维：PCA（三）线性回归（四）计算机视觉（五）自然语言处理一、引言：线性代数为何是AI的基石在人工智能领
GO语言学习笔记螺旋式上升abc golang 学习笔记
一、viper笔记【七米】https://liwenzhou.com/posts/Go/viper/二、优雅关机和平滑重启https://liwenzhou.com/posts/Go/graceful-shutdown/三、gin使用zaphttps://liwenzhou.com/posts/Go/zap-in-gin/四、flag用于命令行传参https://liwenzhou.com/pos
《Quick Start Kubernetes》读后感 python
一、为什么选择这本书？面试的时候经常被问到kubernetes(下称k8s)，所以打算学习k8s。看到《QuickStartKubernetes》的作者对自己所写的书持续地更新，被这种认真打动了，外加这本书只有100多页，所以选择了这本书作为入门k8s的教材。二、这本书写了什么？这本书介绍了什么是k8s,k8s的组成结构(controlplanenode,workernode)，演示了在Windo
有趣的学习Python-第十篇：Python的“魔法宝库”：标准库之旅王盼达有趣的学习Python 学习 python 开发语言
Python不仅是一门强大的编程语言，更像是一座充满宝藏的“魔法宝库”，里面装满了各种各样的“魔法工具”（标准库）。这些“魔法工具”可以帮助你轻松地完成各种任务，从文件操作到网络编程，从数据处理到性能优化。接下来，让我们一起探索Python的“魔法宝库”，看看这些“魔法工具”到底有多神奇！10.1操作系统接口：与“魔法世界”互动os模块就像是一个“魔法接口”，可以帮助你与操作系统进行互动。你可以用
有趣的学习Python-第八篇：Python的“魔法盾牌”：错误与异常处理王盼达有趣的学习Python 学习 python 开发语言
在Python的魔法世界里，即使是经验丰富的魔法师也可能遇到一些“魔法失误”。这些失误分为两种：语法错误和异常。别担心，Python为你准备了一面强大的“魔法盾牌”，帮助你应对这些挑战。8.1语法错误：魔法咒语写错了语法错误就像是你在念魔法咒语时，不小心说错了单词。这是学习Python过程中最常见的问题。比如，你可能忘记在while循环后面加上冒号：whileTrueprint('Hellowor
基于transformer实现机器翻译(日译中) 小白_laughter 课程学习 transformer 机器翻译深度学习
文章目录一、引言二、使用编码器—解码器和注意力机制来实现机器翻译模型2.0含注意力机制的编码器—解码器2.1读取和预处理数据2.2含注意力机制的编码器—解码器2.3训练模型2.4预测不定长的序列2.5评价翻译结果三、使用Transformer架构和PyTorch深度学习库来实现的日中机器翻译模型3.1、导入必要的库3.2、数据集准备3.3、准备分词器3.4、构建TorchText词汇表对象，并将句
【NLP 39、激活函数 ⑤ Swish激活函数】 L_cl NLP 自然语言处理人工智能
我的孤独原本是座荒岛，直到你称成潮汐，原来爱是让个体失序的永恒运动——25.2.25Swish激活函数是一种近年来在深度学习中广泛应用的激活函数，由GoogleBrain团队在2017年提出。其核心设计结合了Sigmoid门控机制和线性输入的乘积，通过引入平滑性和非单调性来提升模型性能。一、数学定义与变体1.基础形式Swish的标准表达式为：Swish(x)=x⋅σ(βx)其中：σ(x)是Sigm
机器学习(Machine Learning) 七指琴魔御清绝大数据学习
原文链接：http://blog.csdn.net/zhoubl668/article/details/42921187希望转载的朋友，你可以不用联系我．但是一定要保留原文链接，因为这个项目还在继续也在不定期更新．希望看到文章的朋友能够学到更多．《BriefHistoryofMachineLearning》介绍:这是一篇介绍机器学习历史的文章，介绍很全面，从感知机、神经网络、决策树、SVM、Ada
web前端期末大作业：婚纱网页主题网站设计——唯一旅拍婚纱公司网站HTML+CSS+JavaScript IT-司马青衫前端课程设计 html
‍静态网站的编写主要是用HTMLDⅣV+CSSJS等来完成页面的排版设计‍，一般的网页作业需要融入以下知识点：div布局、浮动定位、高级css、表格、表单及验证、js轮播图、音频视频Fash的应用、uli、下拉导航栏、鼠标划过效果等知识点，学生网页作业源码，制作水平和原创度都适合学习或交作业用，记得点赞。精彩专栏推荐【作者主页——获取更多优质源码】【web前端期末大作业——毕设项目精品实战案例(1
【Go语言圣经1.1】 Pyroyster golang 开发语言后端
目标学习Go的编译方式、包的组织方式以及工具链的统一调用方式概念与定义packageGo语言通过包来组织代码。包类似于其它语言的库librarries或模块modules，每个包通常对应一个目录，目录中的所有.go文件都属于同一个包。特殊的main包:当代码使用packagemain声明时，表示这是一个可独立执行的程序而非一个库。程序的执行入口就是main函数import通过import语句，编译
大语言模型(LLM)入门学习路线图_llm教程，从零基础到精通，理论与实践结合的最佳路径！ AGI学习社语言模型学习人工智能 LLM 大模型大数据自然语言处理
Github项目上有一个大语言模型学习路线笔记，它全面涵盖了大语言模型的所需的基础知识学习，LLM前沿算法和架构，以及如何将大语言模型进行工程化实践。这份资料是初学者或有一定基础的开发/算法人员入门活深入大型语言模型学习的优秀参考。这份资料重点介绍了我们应该掌握哪些核心知识，并推荐了一系列优质的学习视频和博客，旨在帮助大家系统性地掌握大型语言模型的相关技术。大语言模型（LargeLanguageM
机器学习实战——音乐流派分类（主页有源码）喵了个AI 机器学习实战机器学习分类人工智能
✨个人主页欢迎您的访问✨期待您的三连✨✨个人主页欢迎您的访问✨期待您的三连✨✨个人主页欢迎您的访问✨期待您的三连✨1.简介音乐流派分类是音乐信息检索（MusicInformationRetrieval,MIR）中的一个重要任务，旨在通过分析音频信号的特征，将音乐自动分类到不同的流派（如古典、摇滚、爵士、流行等）。随着数字音乐平台的普及，音乐流派分类技术被广泛应用于音乐推荐、自动标签生成和音乐库管理
Flutter中使用NetworkImage加载网络图片缓存问题学习实践云水-禅心 flutter 缓存
Flutter中默认的NetworkImage会有缓存机制，如果图片的url不变化，但是url的图片已经发生变化，NetworkImage不会下载新的图片deepseek是这么解决问题的，但是在鸿蒙上禁用缓存无效在Flutter中，NetworkImage默认会使用缓存机制来优化性能。如果你想禁用缓存，可以通过以下几种方式实现：1.使用NetworkImage的headers参数你可以通过设置he
什么是XSS 藤原千花的败北 web漏洞 xss 前端 web安全网络安全
文章目录前言1.前端知识2.什么是XSS3.漏洞挖掘4.参考前言之前对XSS的理解就是停留在弹窗，认为XSS这种漏洞真的是漏洞吗？安全学习了蛮久了，也应该对XSS有更进一步的认识了。1.前端知识现代浏览器是一个高度复杂的软件系统，由多个核心组件协同工作，旨在高效、安全地呈现网页内容并执行交互逻辑。对一般用户来讲，其主要功能就是向服务器发出请求，在窗口中展示用户所选择的网络资源。这里所说的资源一般是
html页面js获取参数值 0624chenhong html
1.js获取参数值js function GetQueryString(name) { var reg = new RegExp("(^|&)"+ name +"=([^&]*)(&|$)"); var r = windo
MongoDB 在多线程高并发下的问题 BigCat2013 mongodb DB 高并发重复数据
最近项目用到 MongoDB , 主要是一些读取数据及改状态位的操作. 因为是结合了最近流行的 Storm进行大数据的分析处理，并将分析结果插入Vertica数据库，所以在多线程高并发的情境下, 会发现 Vertica 数据库中有部分重复的数据. 这到底是什么原因导致的呢？笔者开始也是一筹莫展，重复去看 MongoDB 的 API , 终于有了新发现： com.mongodb.DB 这个类有
c++ 用类模版实现链表(c++语言程序设计第四版示例代码) CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T> class Node { private: Node<T> * next; public: T data;
最近情况麦田的设计者感慨考试生活
在五月黄梅天的岁月里，一年两次的软考又要开始了。到目前为止，我已经考了多达三次的软考，最后的结果就是通过了初级考试（程序员）。人啊，就是不满足，考了初级就希望考中级，于是，这学期我就报考了中级，明天就要考试。感觉机会不大，期待奇迹发生吧。这个学期忙于练车，写项目，反正最后是一团糟。后天还要考试科目二。这个星期真的是很艰难的一周，希望能快点度过。
linux系统中用pkill踢出在线登录用户被触发 linux
由于linux服务器允许多用户登录，公司很多人知道密码，工作造成一定的障碍所以需要有时踢出指定的用户 1/#who 查出当前有那些终端登录（用 w 命令更详细） # who root pts/0 2010-10-28 09:36 (192
仿QQ聊天第二版肆无忌惮_ qq
在第一版之上的改进内容: 第一版链接: http://479001499.iteye.com/admin/blogs/2100893 用map存起来号码对应的聊天窗口对象,解决私聊的时候所有消息发到一个窗口的问题. 增加ViewInfo类,这个是信息预览的窗口,如果是自己的信息,则可以进行编辑. 信息修改后上传至服务器再告诉所有用户,自己的窗口
java读取配置文件知了ing
1，java读取.properties配置文件 InputStream in; try { in = test.class.getClassLoader().getResourceAsStream("config/ipnetOracle.properties");//配置文件的路径 Properties p = new Properties()
__attribute__ 你知多少？矮蛋蛋 C++gcc
原文地址: http://www.cnblogs.com/astwish/p/3460618.html GNU C 的一大特色就是__attribute__ 机制。__attribute__ 可以设置函数属性（Function Attribute ）、变量属性（Variable Attribute ）和类型属性（Type Attribute ）。 __attribute__ 书写特征是：
jsoup使用笔记 alleni123 java 爬虫 JSoup
<dependency> <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <version>1.7.3</version> </dependency> 2014/08/28 今天遇到这种形式，
JAVA中的集合 Collectio 和Map的简单使用及方法百合不是茶 list map set
List ,set ,map的使用方法和区别 java容器类类库的用途是保存对象，并将其分为两个概念： Collection集合：一个独立的序列，这些序列都服从一条或多条规则;List必须按顺序保存元素，set不能重复元素；Queue按照排队规则来确定对象产生的顺序（通常与他们被插入的
杀LINUX的JOB进程 bijian1013 linux unix
今天发现数据库一个JOB一直在执行，都执行了好几个小时还在执行，所以想办法给删除掉系统环境： ORACLE 10G Linux操作系统操作步骤如下：第一步.查询出来那个job在运行，找个对应的SID字段 select * from dba_jobs_running--找到job对应的sid &n
Spring AOP详解 bijian1013 java spring AOP
最近项目中遇到了以下几点需求，仔细思考之后，觉得采用AOP来解决。一方面是为了以更加灵活的方式来解决问题，另一方面是借此机会深入学习Spring AOP相关的内容。例如，以下需求不用AOP肯定也能解决，至于是否牵强附会，仁者见仁智者见智。 1.对部分函数的调用进行日志记录，用于观察特定问题在运行过程中的函数调用
[Gson六]Gson类型适配器(TypeAdapter) bit1129 Adapter
TypeAdapter的使用动机 Gson在序列化和反序列化时，默认情况下，是按照POJO类的字段属性名和JSON串键进行一一映射匹配，然后把JSON串的键对应的值转换成POJO相同字段对应的值，反之亦然，在这个过程中有一个JSON串Key对应的Value和对象之间如何转换(序列化/反序列化)的问题。以Date为例，在序列化和反序列化时，Gson默认使用java.
【spark八十七】给定Driver Program，如何判断哪些代码在Driver运行，哪些代码在Worker上执行 bit1129 driver
Driver Program是用户编写的提交给Spark集群执行的application，它包含两部分作为驱动： Driver与Master、Worker协作完成application进程的启动、DAG划分、计算任务封装、计算任务分发到各个计算节点(Worker)、计算资源的分配等。计算逻辑本身，当计算任务在Worker执行时，执行计算逻辑完成application的计算任务
nginx 经验总结 ronin47 nginx 总结
　　　深感nginx的强大，只学了皮毛，把学下的记录。　　　获取Header 信息，一般是以$http_XX（ＸＸ是小写）获取body,通过接口，再展开，根据Ｋ取Ｖ　　　获取uri,以$arg_XX &n
轩辕互动-1.求三个整数中第二大的数2.整型数组的平衡点 bylijinnan 数组
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class ExoWeb { public static void main(String[] args) { ExoWeb ew=new ExoWeb(); System.out.pri
Netty源码学习-Java-NIO-Reactor bylijinnan java 多线程 netty
Netty里面采用了NIO-based Reactor Pattern 了解这个模式对学习Netty非常有帮助参考以下两篇文章： http://jeewanthad.blogspot.com/2013/02/reactor-pattern-explained-part-1.html http://gee.cs.oswego.edu/dl/cpjslides/nio.pdf
AOP通俗理解 cngolon spring AOP
1.我所知道的aop 初看aop,上来就是一大堆术语，而且还有个拉风的名字，面向切面编程，都说是OOP的一种有益补充等等。一下子让你不知所措，心想着：怪不得很多人都和我说aop多难多难。当我看进去以后，我才发现：它就是一些java基础上的朴实无华的应用，包括ioc，包括许许多多这样的名词，都是万变不离其宗而已。 2.为什么用aop&nb
cursor variable 实例 ctrain variable
create or replace procedure proc_test01 as type emp_row is record( empno emp.empno%type, ename emp.ename%type, job emp.job%type, mgr emp.mgr%type, hiberdate emp.hiredate%type, sal emp.sal%t
shell报bash: service: command not found解决方法 daizj linux shell service jps
今天在执行一个脚本时，本来是想在脚本中启动hdfs和hive等程序，可以在执行到service hive-server start等启动服务的命令时会报错，最终解决方法记录一下：脚本报错如下： ./olap_quick_intall.sh: line 57: service: command not found ./olap_quick_intall.sh: line 59
40个迹象表明你还是PHP菜鸟 dcj3sjt126com 设计模式 PHP 正则表达式 oop
你是PHP菜鸟，如果你：1. 不会利用如phpDoc 这样的工具来恰当地注释你的代码2. 对优秀的集成开发环境如Zend Studio 或Eclipse PDT 视而不见3. 从未用过任何形式的版本控制系统，如Subclipse4. 不采用某种编码与命名标准，以及通用约定，不能在项目开发周期里贯彻落实5. 不使用统一开发方式6. 不转换（或）也不验证某些输入或SQL查询串（译注：参考PHP相关函
Android逐帧动画的实现 dcj3sjt126com android
一、代码实现： private ImageView iv; private AnimationDrawable ad; @Override protected void onCreate(Bundle savedInstanceState) { super.onCreate(savedInstanceState); setContentView(R.layout
java远程调用linux的命令或者脚本 eksliang linux ganymed-ssh2
转载请出自出处： http://eksliang.iteye.com/blog/2105862 Java通过SSH2协议执行远程Shell脚本(ganymed-ssh2-build210.jar) 使用步骤如下： 1.导包官网下载: http://www.ganymed.ethz.ch/ssh2/ ma
adb端口被占用问题 gqdy365 adb
最近重新安装的电脑，配置了新环境，老是出现： adb server is out of date. killing... ADB server didn't ACK * failed to start daemon * 百度了一下，说是端口被占用，我开个eclipse，然后打开cmd，就提示这个，很烦人。一个比较彻底的解决办法就是修改
ASP.NET使用FileUpload上传文件 hvt .net C#hovertree asp.net webform
前台代码： <asp:FileUpload ID="fuKeleyi" runat="server" /> <asp:Button ID="BtnUp" runat="server" onclick="BtnUp_Click" Text="上传" />
代码之谜（四）- 浮点数（从惊讶到思考） justjavac 浮点数精度代码之谜 IEEE
在『代码之谜』系列的前几篇文章中，很多次出现了浮点数。浮点数在很多编程语言中被称为简单数据类型，其实，浮点数比起那些复杂数据类型（比如字符串）来说，一点都不简单。单单是说明 IEEE浮点数就可以写一本书了，我将用几篇博文来简单的说说我所理解的浮点数，算是抛砖引玉吧。一次面试记得多年前我招聘 Java 程序员时的一次关于浮点数、二分法、编码的面试，多年以后，他已经称为了一名很出色的
数据结构随记_1 lx.asymmetric 数据结构笔记
第一章 1.数据结构包括数据的逻辑结构、数据的物理/存储结构和数据的逻辑关系这三个方面的内容。 2.数据的存储结构可用四种基本的存储方法表示，它们分别是顺序存储、链式存储、索引存储和散列存储。 3.数据运算最常用的有五种，分别是查找/检索、排序、插入、删除、修改。 4.算法主要有以下五个特性：输入、输出、可行性、确定性和有穷性。 5.算法分析的
linux的会话和进程组网络接口 linux
会话：一个或多个进程组。起于用户登录，终止于用户退出。此期间所有进程都属于这个会话期。会话首进程：调用setsid创建会话的进程1.规定组长进程不能调用setsid，因为调用setsid后，调用进程会成为新的进程组的组长进程.如何保证？先调用fork，然后终止父进程，此时由于子进程的进程组ID为父进程的进程组ID，而子进程的ID是重新分配的，所以保证子进程不会是进程组长，从而子进程可以调用se
二维数组元素的连续求解 1140566087 二维数组 ACM
import java.util.HashMap; public class Title { public static void main(String[] args){ f(); } // 二位数组的应用 //12、二维数组中，哪一行或哪一列的连续存放的0的个数最多，是几个0。注意，是“连续”。 public static void f(){
也谈什么时候Java比C++快 windshome java C++
刚打开iteye就看到这个标题“Java什么时候比C++快”，觉得很好笑。你要比，就比同等水平的基础上的相比，笨蛋写得C代码和C++代码，去和高手写的Java代码比效率，有什么意义呢？我是写密码算法的，深刻知道算法C和C++实现和Java实现之间的效率差，甚至也比对过C代码和汇编代码的效率差，计算机是个死的东西，再怎么优化，Java也就是和C