Yungang_Young

PyTorch学习笔记

文章目录

- 一、PyTorch基础知识
- - 1.1 张量
  - - 1.1.1 简介
    - 1.1.2 创建Tensor
    - 1.1.3 张量的操作
    - 1.1.4 广播机制
  - 1.2 自动求导
- 二、PyTorch的主要组成模块
- - 2.1 基本配置
  - 2.2 数据读入
  - 2.3 模型构建
  - 2.4 模型初始化
- 三、PyTorch基础实战

文章主要参考datawale组队学习- 深入浅出PyTorch

一、PyTorch基础知识

1.1 张量

1.1.1 简介

张量是基于向量和矩阵的推广，维度由低到高可以表示

0维张量–>标量（数字）
1维张量–>向量
2维张量–>矩阵
3维张量–>彩色图片（RGB）等

1.1.2 创建Tensor

import torch
# 构造随机初始化4*3的矩阵
x1 = torch.rand(4, 3)
# 构造矩阵全为0，dtype数据类型为long
x2 = torch.zeros(4, 3, dtype=torch.long)
# 构造矩阵全为1
x3 = torch.ones(4, 3)

print(x1)
# 获取维度信息
print(x1.size())
print(x1.shape)
print(x2)
print(x3)

输出：

tensor([[0.8275, 0.9382, 0.4360],
        [0.6193, 0.2424, 0.1184],
        [0.7378, 0.5127, 0.0595],
        [0.0323, 0.3910, 0.2825]])
torch.Size([4, 3])
torch.Size([4, 3])
tensor([[0, 0, 0],
        [0, 0, 0],
        [0, 0, 0],
        [0, 0, 0]])
tensor([[1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.]])

1.1.3 张量的操作

1.加法操作

# 加法操作1
print(x1 + x3)
# 加法操作2
print(torch.add(x1, x3))
# 加法操作3
result = torch.empty(4, 3)
torch.add(x1, x3, out=result)
print(result)

2.索引操作
索引出来的结果与原数据共享内存，修改一个，另一个会跟着修改。如果不想修改，可以考虑使用copy()等方法。

# 取第二列
print(result[:, 1])
# 改变观察角度
y1 = torch.rand(4, 4)
y2 = y1.view(16)
y3 = y1.view(-1, 8)  # -1是指这一维的维数由其他维度决定
print(y1.size(), y2.size(), y3.size())
print(y1)
print(y2)
print(y3)

输出：

tensor([1.2737, 1.0897, 1.6206, 1.8135])
torch.Size([4, 4]) torch.Size([16]) torch.Size([2, 8])
tensor([[0.8934, 0.6314, 0.7211, 0.8276],
        [0.6205, 0.9730, 0.6983, 0.2075],
        [0.7568, 0.2464, 0.0478, 0.7884],
        [0.8389, 0.7170, 0.5309, 0.5620]])
tensor([0.8934, 0.6314, 0.7211, 0.8276, 0.6205, 0.9730, 0.6983, 0.2075, 0.7568,
        0.2464, 0.0478, 0.7884, 0.8389, 0.7170, 0.5309, 0.5620])
tensor([[0.8934, 0.6314, 0.7211, 0.8276, 0.6205, 0.9730, 0.6983, 0.2075],
        [0.7568, 0.2464, 0.0478, 0.7884, 0.8389, 0.7170, 0.5309, 0.5620]])

view操作获得的y2与y3，实际上还是与y1共享内存，顾名思义，仅仅只是改变了观察角度而已，Pytorch还提供了一个reshape() 可以改变形状，但是此函数并不能保证返回的是其拷贝，所以不推荐使用。推荐先用 clone 创造一个副本然后再使用 view 。

1.1.4 广播机制

当对两个形状不同的Tensor按元素运算时，可能会触发广播(broadcasting)机制：先适当复制元素使这两个Tensor形状相同后再按元素运算。

# 广播机制
# arange产生[1, 10)的数字
z1 = torch.arange(1, 10).view(3, 3)
z2 = torch.ones(3, 1)
print(z1)
print(z2)
print(z1 + z2)

输出：

tensor([[1, 2, 3],
        [4, 5, 6],
        [7, 8, 9]])
tensor([[1.],
        [1.],
        [1.]])
tensor([[ 2.,  3.,  4.],
        [ 5.,  6.,  7.],
        [ 8.,  9., 10.]])

可以看到，z2自动扩充为了(3, 3)再与z1相加。

1.2 自动求导

可以使用requires_grad=True用来追踪其计算历史，它将会追踪对于该张量的所有操作。每个张量都有一个.grad_fn属性，该属性引用了创建Tensor自身的Function(除非这个张量是用户手动创建的，即这个张量的grad_fn是 None )。

x = torch.ones(2, 2, requires_grad=True)
print(x)
print(x.grad_fn)  # None 因为x由用户创建
y = x**2
print(y)
print(y.grad_fn)  # 引用

输出：

tensor([[1., 1.],
        [1., 1.]], requires_grad=True)
None
tensor([[1., 1.],
        [1., 1.]], grad_fn=)

对y进行更多操作

z = y * y * 3
out = z.mean()
print(z)
print(out)

如果需要计算导数，可以在Tensor上调用 .backward()。如果 Tensor 是一个标量(即它包含一个元素的数据），则不需要为backward()指定任何参数，但是如果它有更多的元素，则需要指定一个gradient参数，该参数是形状匹配的张量。

# 反向传播
out.backward()
# d(out)/dx
print(x.grad)

输出：

tensor([[3., 3.],
        [3., 3.]])

grad在反向传播过程中是累加的，一般在反向传播之前需把梯度清零。

# 再来反向传播⼀一次，注意grad是累加的
out2 = x.sum()
out2.backward()
print(x.grad)

out3 = x.sum()
x.grad.data.zero_()
out3.backward()
print(x.grad)

输出：

tensor([[4., 4.],
        [4., 4.]])
tensor([[1., 1.],
        [1., 1.]])

二、PyTorch的主要组成模块

2.1 基本配置

有以下几个超参数可以统一设置

batch size，每批处理的大小
lr，学习率
epochs，训练次数
GPU配置

关于GPU的设置，通常有两种方式

# 方案一：使用os.environ，这种情况如果使用GPU不需要设置
os.environ['CUDA_VISIBLE_DEVICES'] = '0,1'

# 方案二：使用“device”，后续对要使用GPU的变量用.to(device)即可
device = torch.device("cuda:1" if torch.cuda.is_available() else "cpu")

2.2 数据读入

PyTorch数据读入是通过Dataset+DataLoader的方式完成的，Dataset定义好数据的格式和数据变换形式，DataLoader用iterative的方式不断读入批次数据。
可以通过继承Dataset来实现自定义的灵活读取，主要包含三个函数

__init__: 用于向类中传入外部参数，同时定义样本集
__getitem__: 用于逐个读取样本集合中的元素，可以进行一定的变换，并将返回训练/验证所需的数据
__len__: 用于返回数据集的样本数

以实际的论文为例，摘自FGNN

# 定义数据
train_dataset = MultiSessionsGraph(cur_dir + '/datasets/' + opt.dataset, phrase='train')
test_dataset = MultiSessionsGraph(cur_dir + '/../datasets/' + opt.dataset, phrase='test')
# 读入数据
train_loader = DataLoader(train_dataset, batch_size=opt.batch_size, shuffle=True)
test_loader = DataLoader(test_dataset, batch_size=opt.batch_size, shuffle=False)

MultiSessionsGraph是自己定义的类，它继承于Dataset。

2.3 模型构建

Module 类是 nn 模块里提供的一个模型构造类，是所有神经⽹网络模块的基类，我们可以继承它来定义我们想要的模型。
1.不含参数的模型
以下MyLayer类通过继承 Module 类自定义了一个将输入减掉均值后输出的层，并将层的计算定义在了 forward 函数里。

import torch
from torch import nn

class MyLayer(nn.Module):
    def __init__(self, **kwargs):
    	# 调用MLP父类Block的构造函数来进行必要的初始化。这样在构造实例时还可以指定其他函数
        super(MyLayer, self).__init__(**kwargs)
    def forward(self, x):
        return x - x.mean()

测试，往该层喂入数据[1, 2, 3, 4, 5]，执行向前传播

layer = MyLayer()
res = layer(torch.tensor([1, 2, 3, 4, 5], dtype=torch.float))
print(res)

输出：

tensor([-2., -1.,  0.,  1.,  2.])

2.含模型参数的层
这里构造一个简单的多层感知机，带有模型参数隐藏层和输出层，进行前向传播后输出

class MLP(nn.Module):
    def __init__(self, **kwargs):
        super(MLP, self).__init__(**kwargs)
        self.hidden = nn.Linear(784, 256)
        self.act = nn.ReLU()
        self.output = nn.Linear(256, 10)

    def forward(self, x):
        o = self.act(self.hidden(x))
        return self.output(o)

测试：

X = torch.rand(2, 784)
net = MLP()
print(net)
res = net(X)
print(res.size())
print(res)

输出：

MLP(
  (hidden): Linear(in_features=784, out_features=256, bias=True)
  (output): Linear(in_features=256, out_features=10, bias=True)
)
torch.Size([2, 10])
tensor([[-0.1206, -0.2996,  0.2516, -0.0525,  0.2212,  0.0093,  0.0931, -0.1848,
         -0.3433, -0.1671],
        [-0.1767, -0.4206,  0.4729, -0.0081,  0.2569, -0.2523,  0.1119, -0.1536,
         -0.1935,  0.0160]], grad_fn=)

2.4 模型初始化

三、PyTorch基础实战

以FashionMNIST时装分类为例，探究如何搭建简单的CNN来预测数据

import os
import numpy as np
import pandas as pd
import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import Dataset, DataLoader
from torchvision import transforms

# 配置GPU
os.environ['CUDA_VISIBLE_DEVICES'] = '0'
# device = torch.device("cuda:1" if torch.cuda.is_available() else "cpu")

# 设置超参数
batch_size = 256
num_workers = 0
lr = 1e-4
epochs = 20

# 数据读入和加载
image_size = 28
data_transform = transforms.Compose([
    transforms.ToPILImage,
    transforms.Resize(image_size),
    transforms.ToTensor
])

class FMDataset(Dataset):
    def __init__(self, df, transform=None):
        self.df = df
        self.transform = transform
        self.images = df.iloc[:, 1:].values.astype(np.uint8)
        self.labels = df.iloc[:, 0].values
    def __len__(self):
        return len(self.images)
    def __getitem__(self, idx):
        image = self.images[idx].reshape(28, 28, 1)
        label = int(self.labels[idx])
        if self.transform is not None:
            image = self.transform(image)
        else:
            image = torch.tensor(image/255, dtype=torch/float)
        label = torch.tensor(label, dtype=torch.long)
        return image, label

train_df = pd.read_csv("./FashionMNIST/fashion-mnist_train.csv")
test_df = pd.read_csv("./FashionMNIST/fashion-mnist_test.csv")
train_data = FMDataset(train_df, data_transform)
test_data = FMDataset(test_df, data_transform)

train_loader = DataLoader(train_data, batch_size=batch_size, shuffle=True, num_works=num_workers, drop_last=True)
test_loader = DataLoader(test_data, batch_size=batch_size, shuffle=False, num_workers=num_workers)

# CNN模型
class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.conv = nn.Sequential(
            # 二维卷积 输入通道数为1，输出通道数为32
            nn.Conv2d(1, 32, 5),
            nn.ReLU,
            nn.MaxPool2d(2, stride=2),
            nn.Dropout(0.3),
            nn.Conv2d(32, 64, 5),
            nn.ReLU,
            nn.MaxPool2d(2, stride=2),
            nn.Dropout(0.3)
        )
        self.fc = nn.Sequential(
            nn.Linear(64*4*4, 512),
            nn.ReLU(),
            nn.Linear(512, 10)
        )

    def forward(self, x):
        x = self.conv(x)
        # 改变观看角度
        x = x.view(-1, 64*4*4)
        x = self.fc(x)
        return x

model = Net()
model = model.cuda()

# 损失函数
criterion = nn.CrossEntropyLoss()

# 优化器
optimizer = optim.Adam(model.parameters(), lr=0.001)

# 训练
def train(epoch):
    model.train()
    train_loss = 0
    for data, label in train_loader:
        data, label = data.cuda(), label.cuda()
        optimizer.zero_grad()
        output = model(data)
        loss = criterion(output, label)
        loss.backward()
        optimizer.step()
        train_loss += loss.item()*data.size(0)
    train_loss = train_loss/len(train_loader.dataset)
    print('Epoch: {} \tTraining Loss: {:.6f}'.format(epoch, train_loss))

# 验证
def val(epoch):
    model.eval()
    val_loss = 0
    gt_labels = []
    # 预测值
    pred_labels = []
    with torch.no_grad():
        for data, label in test_loader:
            data, label = data.cuda(), label.cuda()
            output = model(data)
            preds = torch.argmax(output, 1)
            gt_labels.append(label.cpu().data.numpy())
            pred_labels.append(preds.cpu().data.numpy())
            loss = criterion(output, label)
            val_loss += loss.item()*data.size(0)
    val_loss = val_loss/len(test_loader.dataset)
    gt_labels, pred_labels = np.concatenate(gt_labels), np.concatenate(pred_labels)
    acc = np.sum(gt_labels==pred_labels)/len(pred_labels)
    print('Epoch: {} \tValidation Loss: {:.6f}, Accuracy: {:6f}'.format(epoch, val_loss, acc))

for epoch in range(1, epochs+1):
    train(epoch)
    val(epoch)

python 爬虫智联招聘风华明远 Python 爬虫 python
本方法使用cookie的方法下载智联招聘的职位。主要就是要先登录智联招聘，然后将对应的cookie作为爬虫访问的header。代码如下：importrequestsimportreimportxlwtdefparse_one_page(html):'''解析HTML代码，提取有用信息并返回'''#正则表达式进行解析pattern=re.compile('(.*?).*?''(.*?).*?''\\
python使用osgeo库_MAC下python2.7的GDAL库配置问题 weixin_39974223 python使用osgeo库
通过三天的不懈努力解决了mac下GDAL配置问题，顺利的运行了一个简单的python代码1、使用了GDAL_Complete-2.1.dmg简单安装，失败告终，(应该没有正确配置路径、导致调用不出gdal)2、下载源码gdal在利用Swig在nmake.opt中编译，失败告终。安装Swig三次才成功，感谢博主LIANGJIANGLI(MacSwig3.0.12安装)，接着就是解译nmake，我是用
【深度学习】PYTORCH框架中采用训练数据“CIFAR-10”实现RESNET50 别出BUG求求了深度学习深度学习 pytorch cifar-10 resnet50 神经网络
一、ResNet网络结构二、基本块三、RESNET50代码实现resnet50.pyimporttorchimporttorch.nnasnnfromtorch.nnimportfunctionalasFclassResNet50BasicBlock(nn.Module):def__init__(self,in_channel,outs,kernerl_size,stride,padding):s
智联招聘python岗位_python智联招聘爬虫 weixin_39750854 智联招聘python岗位
博主写了一个智联招聘的爬虫，只要输入职位关键字，就能快速导出智联招聘上的数据，存在excel表里～importrequests,openpyxl#建立excel表joblist=[]wb=openpyxl.Workbook()sheet=wb.activesheet.title='智联招聘数据'sheet['A1']='职位名称'sheet['B1']='薪资'sheet['C1']='工作经验'
人工智能深度学习系列—深入探索KL散度：度量概率分布差异的关键工具学步_技术自动驾驶人工智能人工智能深度学习自动驾驶机器学习
人工智能深度学习系列—深度解析：交叉熵损失（Cross-EntropyLoss）在分类问题中的应用人工智能深度学习系列—深入解析：均方误差损失（MSELoss）在深度学习中的应用与实践人工智能深度学习系列—深入探索KL散度：度量概率分布差异的关键工具人工智能深度学习系列—探索余弦相似度损失：深度学习中的相似性度量神器人工智能深度学习系列—深度学习中的边界框回归新贵：GHM（GeneralizedH
python：使用gdal和numpy进行遥感时间序列最大值合成 _养乐多_ python处理遥感数据 python numpy 开发语言
作者：CSDN@_养乐多_本文将介绍使用python编程语言，进行遥感数据时间序列最大值合成的代码。代码中使用了numpy和gdal，通过numpy广播机制实现时间序列最大值合成，并以NDVI时间序列数据为例。代码方便易运行，逻辑简单，速度快。只需要输入单波段遥感数据，就可输出最大值合成影像。输入输出如下图所示，文章目录一、完整代码一、完整代码importosimportglobimportnum
点云配准（点云拼接）论文综述点云SLAM 点云数据处理技术点云数据处理点云配准 DeepICP ICP 深度学习配准方法特征匹配
点云配准（点云拼接）论文综述1.引言点云配准（PointCloudRegistration）是三维计算机视觉与机器人感知领域的核心任务，其目标是通过几何变换将多个点云对齐至统一坐标系，形成完整的场景表示。该技术广泛应用于自动驾驶、增强现实、工业检测、医学影像等领域。随着传感器技术（如LiDAR、RGB-D相机）的进步与深度学习的发展，点云配准方法经历了从传统优化算法到数据驱动模型的演变。本文系统综
YOLOv8实例分割训练自己的数据集 NoContours YOLO python 开发语言
转载https://blog.csdn.net/m0_51530640/article/details/1299752571.利用labelme进行数据标注1.1Labelme安装方法首先安装Anaconda，然后运行下列命令：####################forPython2####################condacreate--name=labelmepython=2.7s
青少年Python趣学编程：用代码开启无限可能【文末好书推荐】一键难忘好书推荐 python pygame 开发语言
文章目录青少年Python趣学编程：用代码开启无限可能1.为什么选择Python？2.从小游戏开始：让编程变得有趣3.学习编程的关键步骤4.提供项目和挑战：激发创造力《青少年Python趣学编程（微课视频版）》【好书推荐】购书链接本书特色✨内容亮点配套资源适用人群青少年Python趣学编程：用代码开启无限可能在当今数字化的时代，编程已成为一种基础技能，尤其对于青少年来说，学习编程不仅能帮助他们理解
从零开始玩转TensorFlow：小明的机器学习故事 4 山海青风机器学习 tensorflow 人工智能
探索深度学习1场景故事：小明的灵感前不久，小明一直在用传统的机器学习方法（如线性回归、逻辑回归）来预测学校篮球比赛的胜负。虽然在朋友们看来已经很不错了，但小明发现一个问题：当比赛数据越来越多、球队的特征越来越复杂时，模型的准确率提升得很慢。有一天，小明在学校图书馆翻看杂志时，看到这样一句话：“就像人的大脑有上百亿神经元，神经网络能够学习复杂的信息映射，从而取得卓越的表现。”他瞬间来了灵感：“或许我
智联招聘爬虫 m0_74823878 面试学习路线阿里巴巴爬虫
使用Python和Selenium进行招聘信息爬取在当今数字化时代，数据已成为企业决策的重要依据。对于人力资源部门或求职者而言，获取最新的招聘信息至关重要。然而，手动浏览和收集招聘信息不仅耗时费力，而且效率低下。为了解决这个问题，我们可以使用Python和Selenium库来自动化这一过程，实现从招聘网站上批量爬取招聘信息。准备工作在开始之前，你需要确保已经安装了以下库：Python（建议版本3.
【深度学习】Transformer入门：通俗易懂的介绍知识靠谱深度学习深度学习 transformer 人工智能
【深度学习】Transformer入门：通俗易懂的介绍一、引言二、从前的“读句子”方式三、Transformer的“超级阅读能力”四、Transformer是怎么做到的？五、Transformer的“多视角”能力六、Transformer的“位置记忆”七、Transformer的“翻译流程”八、Transformer为什么这么厉害？九、Transformer的应用十、总结一、引言在自然语言处理（N
Mac M1安装Python---kalrry kalrry Python python macos 开发语言
MacM1安装Python---kalrry一、准备二、安装三、配置环境变量1、配置环境2、测试3、pip3与pip建立软链接四、参考备份一、准备Python3.9.1发布后开始支持苹果M1和macOS11BigSur也就是我们要下载3.9.1以后的版本，最好选择最新稳定版python官网下载python阿里网盘下载—sa65二、安装双击正常一路next安装即可三、配置环境变量1、配置环境命令行输
记录一次M1芯片Mac折腾安装Python3的过程 Onemud macos python linux
记录一次M1芯片Mac折腾安装Python3的过程前言：是要用python搞一个跟url接口交互的脚本，来配合做服务迁移工作，但在开发和测试脚本是让python环境卡住了脖（电脑装了很多个python，并且多版本间管理的比较混乱）所以想先调试好一个版本能用就好；并且脚本用到requests库，需要给python安装一下。总结两件事：装好python3.9，得能用给python3.9装上reques
python正态检验_Python检验数据是否正态分布 weixin_39748858 python正态检验
在对数据进行处理前，有事需要判断数据是否呈正态分布，比如线性回归，比如使用3-sigma判断数据是否异常。常用的正态分布检测方法：Shapiro-WilktestShapiro-Wilktest是一种在频率上统计检验中检验正态性的方法。该检验的零检验是样本$x_1,\cdots,x_n$来自于一个正态分布的母体。这个检验的统计量是：$$W=\frac{(\sum_{i=1}^{n}a_{i}x_{
python爬取pdf_python爬取在线教程转成pdf weixin_39842237 python爬取pdf
1、网站介绍之前再搜资料的时候经常会跳转到如下图所示的在线教程：01.教程样式包括一些github的项目也纷纷将教程链接指向这个网站。经过一番查找，该网站是一个可以创建、托管和浏览文档的网站，其网址为：https://readthedocs.org。在上面可以找到很多优质的资源。该网站虽然提供了下载功能，但是有些教程并没有提供PDF格式文件的下载，如图：02.下载该教程只提供了HTML格式文件的下
Python常见库的使用浪子西科 Python python 开发语言
文章目录人工智能与机器学习1.NumPy2.Pandas3.Scikit-learn4.TensorFlow5.PyTorch数据可视化1.Matplotlib2.Seaborn网络请求与爬虫1.Requests2.Scrapy自动化测试1.unittest2.pytest自然语言处理1.NLTK2.SpaCy数据库操作1.SQLite32.SQLAlchemy日期和时间处理1.datetime2
python 绘制正态分布图点云侠 CloudCompare python 开发语言算法 3d
目录一、概述二、代码实现三、结果展示一、概述在Python中，可以使用numpy库中的normal()函数或random.normal()方法生成正态分布的随机数，同时也利用scipy库的norm.pdf()函数来计算正态分布的概率密度函数。二、代码实现importnumpyasnpimportmatplotlib.pyplotaspltfromscipy.statsimportnorm#创建
服务器/mac m1配置python环境 LoveSeven.Lin macos python 开发语言
目录服务器配置环境一、安装miniconda二、创建环境三、激活环境四、conda安装Macm1配置环境一、安装Miniforge3二、创建环境三、激活环境四、安装tensorflow五、测试运行服务器配置环境一、安装miniconda#step1:获取安装shell脚本文件wgethttps://repo.continuum.io/miniconda/Miniconda3-latest-Linu
GAN（Generative Adversarial Network）—生成对抗网络算法资料吧！深度学习机器学习人工智能
GAN（GenerativeAdversarialNetwork）代表了深度学习中生成建模的尖端方法，通常利用卷积神经网络等架构。生成建模的目标是自主识别输入数据中的模式，使模型能够生成与原始数据集相似的新示例。本文涵盖了您需要了解的有关GAN、GAN架构、GAN的工作原理以及GAN模型类型等的所有信息。目录什么是生成对抗网络？GAN的类型GAN的架构GAN是如何工作的？生成对抗网络（GAN）的应
Mac M1芯片通过源码安装Python2.7.x 乌萨奇敲代码 macos python
文章目录MacM1芯片通过源码安装Python2.7.x1.下载源码2.安装依赖3.配置环境4.配置编译选项5.编译6.验证安装MacM1芯片通过源码安装Python2.7.x首先，由于AppleM1芯片使用的是ARM架构，已经不支持Python2.7.x了，所以需要利用Rosetta手动编译Python2.7.x，这里以安装Python2.7.17为例。1.下载源码首先，从Python官方网站下
在Mac M1上安装Python 3并设置环境变量 JieLun_C macos python 开发语言 Python
在MacM1上安装Python3并设置环境变量MacM1是基于AppleSilicon芯片的新一代Mac电脑。如果你是MacM1用户，并且想要安装Python3并设置环境变量，那么你来对地方了。本文将为你提供详细的步骤和相应的源代码。以下是在MacM1上安装Python3并设置环境变量的步骤：步骤1：安装HomebrewHomebrew是一个流行的包管理器，可以帮助我们在Mac上安装各种软件包。打
golang深度学习-基础篇老狼伙计 golang 编程语言云原生学习笔记 golang 开发语言后端
基础数据结构及类型字符型-stringstring是Go标准库buildin内置的一个基础数据类型。string是由8比特字节的集合，通常不一定是UTF-8编码的文本。string可以为空(长度为0)，但不会是nil。stringisthesetofallstringsof8-bitbytes,conventionallybutnotnecessarilyrepresentingUTF-8-enc
基于Python的PDF文件自动下载爬虫技术——详细教程与实例 Python爬虫项目 2025年爬虫实战项目 python pdf 爬虫开发语言信息可视化
1.引言在信息时代，许多网站提供了PDF格式的文档，如新闻报道、学术论文、合同文件等。对于科研人员或数据分析师来说，批量下载和分析这些PDF文件是非常有用的。Python作为一种高效且易于学习的编程语言，在网络数据抓取（即爬虫技术）方面拥有强大的库和工具，使得自动化下载网站中的PDF文件变得十分简单。在本篇博客中，我们将详细介绍如何使用Python爬虫技术抓取网页中的所有PDF文件，并自动下载到本
Python 从基础到进阶（一套打通）浪子西科 Python python 开发语言
文章目录一、Python入门1.1Python简介1.2安装PythonWindowsLinuxmacOS1.3第一个Python程序交互式环境脚本文件二、Python基础语法2.1变量和数据类型变量数据类型数字类型字符串类型（str）布尔类型（bool）2.2运算符算术运算符比较运算符逻辑运算符位运算符2.3控制流语句条件语句循环语句`for`循环`while`循环三、Python数据结构3.1
Golang深度学习老狼伙计 golang 编程语言云原生学习笔记 golang 开发语言
前言在2009年，Google公司发布了一种新的编程语言，名为Go（或称为Golang），旨在提高编程效率、简化并发编程，并提供强大的标准库支持。Go语言的设计者们希望通过Go语言能够解决软件开发中的一些长期存在的问题，比如并发编程的复杂性、垃圾回收机制的效率以及跨平台的兼容性等。以下是Go语言的一些关键背景和特性：并发编程Go语言内置了并发原语，如goroutines和channels，这使得并
安装Miniconda3-Python 3.8环境管理工具 Lemaden
本文还有配套的精品资源，点击获取简介：Miniconda3-py38_4.11.0-Windows-x86_64.zip提供了一个针对Python3.8版本的轻量级Miniconda发行版，适用于64位Windows系统。它包括Python解释器、Conda包管理器和基本科学计算库，支持创建独立的Python环境。此版本的Conda包管理器版本号为4.11.0。用户可以通过安装后使用Conda命令
kitti数据集【图片、点云、IMU、GPS】话题发布（kitti2bag方式+python源码方式） liiiuzy ROS学习 python
kitti数据集传感器话题发布一、前期准备工作kitti数据集转bag安装vscode新建工作环境安装opencv-python二、发布图片三、发布点云数据四、整理前两次的代码五、添加汽车图片和摄像头视角常规写法优化写法六、发布IMU七、发布GPS一、前期准备工作kitti数据集转bag如果只是想把kitti数据集转成bag，直接用kiiti2bag指令就可以完成，教程在下面链接中。后文是详细的代
深入探讨Conda：Python环境与包管理器一休哥助手 python conda python 开发语言
目录引言Conda概述什么是CondaConda的优势Conda的安装与配置安装Conda配置CondaConda常用命令环境管理命令
CSDN 博客文章：Genesis 安装指南与环境配置（Python 3.9+） qq_27492797 python 开发语言
引言随着人工智能和机器学习的蓬勃发展，各式各样的框架和工具如雨后春笋般涌现，为科研人员和开发者的创新之路提供强大支持。今天，我们聚焦于Genesis——一个在物理模拟、计算机图形学以及机器人领域展现出卓越潜力的先进平台。需要特别说明的是，目前Genesis项目中备受期待的对话式生成AI接口，当前仍处于概念展示阶段，仅存在于PPT之中，尚未对外开放，大家在关注其发展时需留意这一情况。本文将着重介绍如
Nginx负载均衡 510888780 nginx 应用服务器
Nginx负载均衡一些基础知识: nginx 的 upstream目前支持 4 种方式的分配 1)、轮询（默认）每个请求按时间顺序逐一分配到不同的后端服务器，如果后端服务器down掉，能自动剔除。 2)、weight 指定轮询几率，weight和访问比率成正比
RedHat 6.4 安装 rabbitmq bylijinnan erlang rabbitmq redhat
在 linux 下安装软件就是折腾，首先是测试机不能上外网要找运维开通，开通后发现测试机的 yum 不能使用于是又要配置 yum 源，最后安装 rabbitmq 时也尝试了两种方法最后才安装成功机器版本： [root@redhat1 rabbitmq]# lsb_release LSB Version: :base-4.0-amd64:base-4.0-noarch:core
FilenameUtils工具类 eksliang FilenameUtils common-io
转载请出自出处：http://eksliang.iteye.com/blog/2217081 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
xml文件解析SAX 不懂事的小屁孩 xml
xml文件解析:xml文件解析有四种方式， 1.DOM生成和解析XML文档(SAX是基于事件流的解析) 2.SAX生成和解析XML文档(基于XML文档树结构的解析) 3.DOM4J生成和解析XML文档 4.JDOM生成和解析XML 本文章用第一种方法进行解析，使用android常用的DefaultHandler import org.xml.sax.Attributes;
通过定时任务执行mysql的定期删除和新建分区，此处是按日分区酷的飞上天空 mysql
使用python脚本作为命令脚本，linux的定时任务来每天定时执行 #!/usr/bin/python # -*- coding: utf8 -*- import pymysql import datetime import calendar #要分区的表 table_name = 'my_table' #连接数据库的信息 host,user,passwd,db =
如何搭建数据湖架构？听听专家的意见蓝儿唯美架构
Edo Interactive在几年前遇到一个大问题：公司使用交易数据来帮助零售商和餐馆进行个性化促销，但其数据仓库没有足够时间去处理所有的信用卡和借记卡交易数据 “我们要花费27小时来处理每日的数据量，”Edo主管基础设施和信息系统的高级副总裁Tim Garnto说道：“所以在2013年，我们放弃了现有的基于PostgreSQL的关系型数据库系统，使用了Hadoop集群作为公司的数
spring学习——控制反转与依赖注入 a-john spring
控制反转（Inversion of Control，英文缩写为IoC）是一个重要的面向对象编程的法则来削减计算机程序的耦合问题，也是轻量级的Spring框架的核心。控制反转一般分为两种类型，依赖注入（Dependency Injection，简称DI）和依赖查找（Dependency Lookup）。依赖注入应用比较广泛。
用spool+unixshell生成文本文件的方法 aijuans xshell
例如我们把scott.dept表生成文本文件的语句写成dept.sql,内容如下: 　　set pages 50000; 　　set lines 200; 　　set trims on; 　　set heading off; 　　spool /oracle_backup/log/test/dept.lst; 　　select deptno||','||dname||','||loc
1、基础--名词解析(OOA/OOD/OOP) asia007 学习基础知识
OOA:Object-Oriented Analysis（面向对象分析方法）是在一个系统的开发过程中进行了系统业务调查以后，按照面向对象的思想来分析问题。OOA与结构化分析有较大的区别。OOA所强调的是在系统调查资料的基础上，针对OO方法所需要的素材进行的归类分析和整理，而不是对管理业务现状和方法的分析。　　OOA（面向对象的分析）模型由5个层次（主题层、对象类层、结构层、属性层和服务层）
浅谈java转成json编码格式技术百合不是茶 json编码 java转成json编码
json编码;是一个轻量级的数据存储和传输的语言在java中需要引入json相关的包,引包方式在工程的lib下就可以了 JSON与JAVA数据的转换（JSON 即 JavaScript Object Natation，它是一种轻量级的数据交换格式，非常适合于服务器与 JavaScript 之间的数据的交
web.xml之Spring配置(基于Spring+Struts+Ibatis) bijian1013 java web.xml SSI spring配置
指定Spring配置文件位置 <context-param> <param-name>contextConfigLocation</param-name> <param-value> /WEB-INF/spring-dao-bean.xml,/WEB-INF/spring-resources.xml, /WEB-INF/
Installing SonarQube（Fail to download libraries from server） sunjing Install Sonar
1. Download and unzip the SonarQube distribution 2. Starting the Web Server The default port is "9000" and the context path is "/". These values can be changed in &l
【MongoDB学习笔记十一】Mongo副本集基本的增删查 bit1129 mongodb
一、创建复本集假设mongod,mongo已经配置在系统路径变量上，启动三个命令行窗口，分别执行如下命令： mongod --port 27017 --dbpath data1 --replSet rs0 mongod --port 27018 --dbpath data2 --replSet rs0 mongod --port 27019 -
Anychart图表系列二之执行Flash和HTML5渲染白糖_ Flash
今天介绍Anychart的Flash和HTML5渲染功能 HTML5 Anychart从6.0第一个版本起，已经逐渐开始支持各种图的HTML5渲染效果了，也就是说即使你没有安装Flash插件，只要浏览器支持HTML5，也能看到Anychart的图形（不过这些是需要做一些配置的）。这里要提醒下大家，Anychart6.0版本对HTML5的支持还不算很成熟，目前还处于
Laravel版本更新异常4.2.8-> 4.2.9 Declaration of ... CompilerEngine ... should be compa bozch laravel
昨天在为了把laravel升级到最新的版本，突然之间就出现了如下错误： ErrorException thrown with message "Declaration of Illuminate\View\Engines\CompilerEngine::handleViewException() should be compatible with Illuminate\View\Eng
编程之美-NIM游戏分析-石头总数为奇数时如何保证先动手者必胜 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class Nim { /**编程之美 NIM游戏分析问题：有N块石头和两个玩家A和B，玩家A先将石头随机分成若干堆，然后按照BABA...的顺序不断轮流取石头，能将剩下的石头一次取光的玩家获胜，每次取石头时，每个玩家只能从若干堆石头中任选一堆，
lunce创建索引及简单查询 chengxuyuancsdn 查询创建索引 lunce
import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Docume
[IT与投资]坚持独立自主的研究核心技术 comsci it
和别人合作开发某项产品....如果互相之间的技术水平不同,那么这种合作很难进行,一般都会成为强者控制弱者的方法和手段..... 所以弱者,在遇到技术难题的时候,最好不要一开始就去寻求强者的帮助,因为在我们这颗星球上,生物都有一种控制其
flashback transaction闪回事务查询 daizj oracle sql 闪回事务
闪回事务查询有别于闪回查询的特点有以下3个：（1）其正常工作不但需要利用撤销数据，还需要事先启用最小补充日志。（2）返回的结果不是以前的“旧”数据，而是能够将当前数据修改为以前的样子的撤销SQL（Undo SQL）语句。（3）集中地在名为flashback_transaction_query表上查询，而不是在各个表上通过“as of”或“vers
Java I/O之FilenameFilter类列举出指定路径下某个扩展名的文件游其是你 FilenameFilter
这是一个FilenameFilter类用法的例子，实现的列举出“c:\\folder“路径下所有以“.jpg”扩展名的文件。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
C语言学习五函数，函数的前置声明以及如何在软件开发中合理的设计函数来解决实际问题 dcj3sjt126com c
# include <stdio.h> int f(void) //括号中的void表示该函数不能接受数据，int表示返回的类型为int类型 { return 10; //向主调函数返回10 } void g(void) //函数名前面的void表示该函数没有返回值 { //return 10; //error 与第8行行首的void相矛盾 } in
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Pl dcj3sjt126com centos
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again 处理很简单，修改文件“/etc/yum.repos.d/epel.repo”，将baseurl的注释取消， mirrorlist注释掉。即可。 &n
单例模式 shuizhaosi888 单例模式
单例模式懒汉式 public class RunMain { /** * 私有构造 */ private RunMain() { } /** * 内部类，用于占位，只有 */ private static class SingletonRunMain { priv
Spring Security（09）——Filter 234390216 Spring Security
Filter 目录 1.1 Filter顺序 1.2 添加Filter到FilterChain 1.3 DelegatingFilterProxy 1.4 FilterChainProxy 1.5
公司项目NODEJS实践0.1 逐行分析JS源代码 mongodb nginx ubuntu nodejs
一、前言前端如何独立用nodeJs实现一个简单的注册、登录功能，是不是只用nodejs+sql就可以了？其实是可以实现，但离实际应用还有距离，那要怎么做才是实际可用的。网上有很多nod
java.lang.Math liuhaibo_ljf java Math lang
System.out.println(Math.PI); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1)); System.out.println(Math.abs(111111111)); System.out.println(Mat
linux下时间同步 nonobaba ntp
今天在linux下做hbase集群的时候，发现hmaster启动成功了，但是用hbase命令进入shell的时候报了一个错误 PleaseHoldException: Master is initializing，查看了日志，大致意思是说master和slave时间不同步，没办法，只好找一种手动同步一下，后来发现一共部署了10来台机器，手动同步偏差又比较大，所以还是从网上找现成的解决方
ZooKeeper3.4.6的集群部署 roadrunners zookeeper 集群部署
ZooKeeper是Apache的一个开源项目，在分布式服务中应用比较广泛。它主要用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步、集群管理、配置文件管理、同步锁、队列等。这里主要讲集群中ZooKeeper的部署。 1、准备工作我们准备3台机器做ZooKeeper集群，分别在3台机器上创建ZooKeeper需要的目录。数据存储目录
Java高效读取大文件 tomcat_oracle java
　　读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法：　　Files.readLines(new File(path), Charsets.UTF_8); 　　FileUtils.readLines(new File(path)); 　　这种方法带来的问题是文件的所有行都被存放在内存中，当文件足够大时很快就会导致
微信支付api返回的xml转换为Map的方法 xu3508620 xml map 微信api
举例如下： <xml> <return_code><![CDATA[SUCCESS]]></return_code> <return_msg><![CDATA[OK]]></return_msg> <appid><