鱼儿听雨眠

【动手学深度学习v2】学习笔记03：线性回归、基础优化算法、线性回归实现

前文回顾：线性代数、矩阵计算、自动求导

文章目录

一、线性回归
- 1.1 线性模型
- 1.2 流程
- - 1.2.1 损失函数
  - 1.2.2 训练数据
  - 1.2.3 参数学习
  - 1.2.4 显式解
- 1.3 总结
二、基础优化算法
- 2.1 梯度下降
- 2.2 小批量随机梯度下降
- 2.3 总结
三、线性回归的从零开始实现
- 3.1 导入的库
- 3.2 数据集
- - 3.2.1 构造数据集
  - 3.2.2 展示数据集
- 3.3 从零开始实现
- - 3.3.1 生成小批量
  - 3.3.2 模型和初始化模型参数
  - 3.3.3 定义损失函数
  - 3.3.4 定义优化方法
  - 3.3.5 训练过程
  - 3.3.6 分析
四、线性回归的简洁实现
- 4.1 用到的函数
- 4.2 导入库并生成数据集
- 4.3 读取数据
- 4.4 模型的定义
- 4.5 损失函数
- 4.6 优化方法
- 4.7 训练过程

一、线性回归

1.1 线性模型

给定n维输入 $\vec{x}=[x_1, x_2, \cdots, w_n]^T$
线性模型有一个n维权重和一个标准偏差
$\vec{w} = [w_1, w_2, \cdots, w_n]^T, \qquad b$ 输出时输入的加权和
$w_1 x_1 + w_2 x_2 + \cdots + w_n x_n + b$ 向量版本： $y=\langle \vec{w}, \vec{x} \rangle + b$

线性模型可以看做是单层神经网络。因为只有输入层和权重相关。

1.2 流程

1.2.1 损失函数

我们需要比较真实值和预估值，例如房屋售价和估价。
假设 $y$ 是真实值， $\hat{y}$ 是估计值，我们可以比较平方损失：
$\hat{y})=\frac{1}{2}(y-\hat{y})^2$

1.2.2 训练数据

收集一些数据点来决定参数值（权重和偏差），例如过去6个月卖的房子。这些数据点称为训练数据，通常越多越好。
假设我们有n个样本，记
$[\vec{x_1}, \vec{x_2}, \cdots, \vec{x_n}]^T \qquad \vec{y} = [y_1, y_2, \cdots , y_n]^T$

1.2.3 参数学习

训练损失
$\vec{y}, \vec{w}, b) = \frac{1}{2n}\sum_{i=1}^{n}(y_i-\langle \vec{x_i}, \vec{w} \rangle - b)^2 = \frac{1}{2n}||\vec{y} - X \vec{w} - b||^2$ 上式就是我们的损失函数了，我们的目标是找到值 $\vec{w},b$ 使损失函数值最小。
最小化损失来学习参数
$\vec{w}^*, \vec{b}^* = arg\;\mathop{min}\limits_{\vec{w}, b}\;l(X, \vec{y}, \vec{w}, b)$

1.2.4 显式解

由于是线性模型，所以会有显式解。这也是唯一一个有最优解的模型，之后的所有模型都不会有最优解了。

首先，将偏差加入权重
$\leftarrow \begin{bmatrix}W, \vec{1}\end{bmatrix} \qquad \vec{w} \leftarrow \begin{bmatrix}\vec{w} \\ b\end{bmatrix}$ 将偏差加入权重之后，我们的预测就等于 $X\vec{w}$ ，即 $\hat{y}=X\vec{w}$ 。
$\vec{y}, \vec{w}) = \frac{1}{2n}||\vec{y}-X\vec{w}||^2$ $\frac{\partial}{\partial \vec{w}}l(X, \vec{y}, \vec{w}) = \frac{1}{n}(\vec{y}-X\vec{w})^TX$
损失是凸函数，在梯度等于0时取最优解，所以最优解满足：
$\frac{\partial}{\partial \vec{w}}l(X, \vec{y}, \vec{w})=0$ $\Leftrightarrow \frac{1}{n}(\vec{y}-X\vec{w})^TX=0$ $\Leftrightarrow \vec{w}^*=(X^TX)^{-1}X\vec{y}$

1.3 总结

线性回归是对n维输入的加权，外加偏差。
使用平方损失来衡量预测值和真实值的差异。
线性回归有显式解。
线性回归可以看做是单层神经网络。

二、基础优化算法

2.1 梯度下降

挑选一个初始值 $\vec{W}_0$ ，之后不断更新 $\vec{W}_0$ ，使其接近最优解。
设置重复迭代参数 $\cdots$
$\vec{W}_t = \vec{W}_{t-1} - \eta \frac{\partial l}{\partial \vec{W}_{t-1}}$

$\frac{\partial l}{\partial \vec{W}_{t-1}}$ ：损失函数关于 $\partial \vec{W}_{t-1}$ 的梯度，沿梯度方向将增加损失函数值。
$\eta$ ：学习率，即步长的超参数，表示沿着负梯度方向上一次走的距离。
通过 $\frac{\partial l}{\partial \vec{W}_{t-1}}$ 和 $\eta$ ，我们可以沿着梯度下降最快的方向，一步步地得到最小的梯度值。

选择学习率不能太大，也不能太小。

如果学习率太小，每一次的步长将会很小，梯度下降的速度会大幅下降。
如果学习率太大，梯度可能会一直在震荡，并没有真正的下降。

2.2 小批量随机梯度下降

在深度学习中，我们很少直接使用梯度下降，通常会采用小批量梯度下降。
这是因为在整个训练集上算梯度的时间成本太高，一个深度神经网络模型可能需要数分钟至数小时。
我们可以随机采样b个样本 $i_1, i_2, \cdots, i_b$ 来计算近似损失：
$\frac{1}{b} \sum_{i \in I_b}l(\vec{x}_i, y_i, \vec{w})$ 其中，b是批量大小，是深度学习中的另一个重要的超参数。
同样地，批量大小不能太小，也不能太大。

如果批量大小太小，每次计算量太小，不适合并行来最大利用计算资源。
如果批量大小太大，则内存消耗增加；浪费计算，例如：如果所有样本都是相同的。

2.3 总结

梯度下降通过不断沿着反梯度方向更新参数求解。
小批量随机梯度下降是深度学习默认的求解算法。
两个重要的超参数是批量大小和学习率。

三、线性回归的从零开始实现

我们将从零开始实现整个方法，包括数据流水线、模型、损失函数和小批量随机梯度下降优化器。

3.1 导入的库

本文使用的编辑器为PyCharm，文中代码已针对PyCharm和jupyter的区别进行了修改。下面的代码中，jupyter可以使用%matplotlib inline来内嵌绘图；在PyCharm中使用这句代码则会报错，本文通过plt.show()来展示绘图。

# %matplotlib inline
import torch
import matplotlib.pyplot as plt
import random
from d2l import torch as d2l

3.2 数据集

3.2.1 构造数据集

这里我们采用自己构造的一个简单数据集。根据带有噪声的线性模型构造一个人造数据集。我们使用线性模型参数 $\vec{w}=\begin{bmatrix}2 & -3.4\end{bmatrix}^T$ 、 $b = 4.2$ 和噪声项 $\varepsilon$ 生成数据集及其标签：
$\vec{y}=X\vec{w}+b+\varepsilon$

# 生成数据集函数
def synthetic_data(w, b, num_examples):
    X = torch.normal(0, 1, (num_examples, len(w)))
    y = torch.matmul(X, w) + b
    y += torch.normal(0, 0.01, y.shape)
    return X, y.reshape((-1, 1))    # 将二维张量转化成一维列向量

# 生成人工数据集
true_w = torch.tensor([2, -3.4])
true_b = 4.2
features, labels = synthetic_data(true_w, true_b, 1000)

3.2.2 展示数据集

features中的每一行都包含一个二维数据样本，labels中的每一行都包含一个一维标签值（一个标量）
我们可以通过绘图来形象地看到我们的训练样本。

# 展示数据集
print('features: ', features[0], '\nlabels: ', labels[0])
d2l.set_figsize()
d2l.plt.scatter(features[:, (1)].detach().numpy(), labels.detach().numpy(), 1)
plt.show()

3.3 从零开始实现

3.3.1 生成小批量

定义一个data_iter函数，该函数接受批量大小、特征矩阵和标签向量作为输入，生成大小为batch_size的小批量。

# 生成小批量函数
def data_iter(batch_size, features, labels):
    num_examples = len(features)
    indices = list(range(num_examples))
    # 这些样本是随机读取的，没有特定的顺序
    random.shuffle(indices) # 随机打乱
    for i in range(0, num_examples, batch_size):
        batch_indices = torch.tensor(indices[i:min(i + batch_size, num_examples)])
        yield features[batch_indices], labels[batch_indices]

# 生成小批量
batch_size = 10
for x, y in data_iter(batch_size, features, labels):
	print(x, '\n', y)
	break

3.3.2 模型和初始化模型参数

读取了数据集之后，我们要定义初始化模型参数和模型。
我们将权重w随机初始化成均值为0、方差为0.01的正态分布。同时，因为我们要计算梯度，故设置参数requires_grad=True。

# 定义初始化模型参数
w = torch.normal(0, 0.01, size=(2, 1), requires_grad=True)
b = torch.zeros(1, requires_grad=True)

# 定义模型
def linreg(X, w, b):
    """ 线性回归模型 """
    return torch.matmul(X, w) + b

3.3.3 定义损失函数

我们采用均方损失函数。因为y和y_hat可能是行向量或者列向量，所以我们用reshape()方法将它们修改成同样的形状。

# 定义损失函数
def squard_loss(y_hat, y):
    """ 均方损失 """
    return (y_hat - y.reshape(y_hat.shape))**2 / 2

3.3.4 定义优化方法

我们采用SGD优化方法。SGD优化方法的输入需要给定所有的参数（包括w和b）、学习率和批量大小。

# 定义优化方法
def sgd(params, lr, batch_size):
    """ 小批量随机梯度下降 """
    with torch.no_grad():   # 更新的时候，不要进行梯度计算
        for param in params:
            param -= lr * param.grad / batch_size
            param.grad.zero_()

3.3.5 训练过程

# 训练过程
lr = 0.03           # 学习率
num_epochs = 3      # 整个数据扫3遍
net = linreg        # 模型
loss = squard_loss  # 损失函数采用均方损失

for epoch in range(num_epochs):
	for X, y in data_iter(batch_size, features, labels):
		l = loss(net(X, w, b), y)   # X和y的小批量损失
		# 因为l的形状是(batch_size, 1)，而不是一个标量。l中所有元素被加到一起。
		# 并以此计算关于(w, b)的梯度
		l.sum().backward()
		sgd([w, b], lr, batch_size)
	with torch.no_grad():   # 评价进度
		train_1 = loss(net(features, w, b), labels)
		print(f'epoch {epoch + 1}, loss {float(train_1.mean()):f}')

3.3.6 分析

由于我们使用的是自己构造的数据集，可以看到真实的参数，故我们可以比较真实参数和通过训练学到的参数来评估训练的成功程度。

# 比较真实参数和通过训练学到的参数来评估训练的成功程度
print(f'w的估计误差：{true_w - w.reshape(true_w.shape)}')
print(f'b的估计误差：{true_b - b}')

四、线性回归的简洁实现

我们可以通过使用深度学习框架来简洁地实现线性回归模型、生成数据集。

4.1 用到的函数

函数	功能	参数
`data.TensorDataset()`	用来对tensor进行打包	输入数据必须是tensor类型
`data.DataLoader()`	用来实现批量数据的迭代	`dataset`：数据集 `batch_size`：批量大小 `shuffle`：洗牌
`iter()`	生成迭代器一次能返回一个元素
`next()`	返回迭代器的下一个项目
`nn.Linear()`	设置网络中的全连接层	`in_features`：输入张量的形状 `out_features`：输出张量的形状
`nn.Sequential`	是一个Sequential容器
`nn.MSELoss()`	均分损失函数
`torch.optim.SGD()`	随机梯度下降算法	`params`：待优化参数的迭代器 `lr`：学习率

4.2 导入库并生成数据集

import numpy as np
import torch
from torch import nn
from torch.utils import data
from d2l import torch as d2l

true_w = torch.tensor([2, -3.4])
true_b = 4.2
features, labels = d2l.synthetic_data(true_w, true_b, 1000)

4.3 读取数据

我们可以调用框架中现有的API来读取数据。

def load_array(data_arrays, batch_size, is_train=True):
    """ 构造一个PyTorch数据迭代器 """
    dataset = data.TensorDataset(*data_arrays)
    return data.DataLoader(dataset, batch_size, shuffle=is_train)

# 调用框架中现有的API来读取数据
batch_size = 10
data_iter = load_array((features, labels), batch_size)
next(iter(data_iter))

4.4 模型的定义

使用框架的预定义好的层，并初始化模型参数。
我们使用nn.Linear()方法来构造一个线性层，并把这个层放到nn.Sequential()容器中。
之后，我们可以通过net[0]来访问到这个层，通过net[0].weight来访问这个层的权重w，因此可以通过net[0].weight.data.normal_(0, 0.01)来将线性层的权重的值替换为正态分布的值。
而net[0].bias则是线性层的偏差，我们通过net[0].bias.data.fill_(0)将这个线性层的偏差设置为0。

# 使用框架的预定义好的层
net = nn.Sequential(nn.Linear(2, 1))

# 初始化模型参数
net[0].weight.data.normal_(0, 0.01)
net[0].bias.data.fill_(0)

4.5 损失函数

我们的损失函数依然采用均方误差，使用MSELoss类。均方误差也成为平方范数（ $L_2$ 范数）。

loss = nn.MSELoss()

4.6 优化方法

实例化SGD实例。

# SGD
trainer = torch.optim.SGD(net.parameters(), lr=0.03)

4.7 训练过程

# 训练过程
num_epochs = 3
for epoch in range(num_epochs):
	for X, y in data_iter:
		l = loss(net(X), y)	# 损失函数
		trainer.zero_grad()	# 优化器清零梯度
		l.backward()		# 计算梯度
		trainer.step()  	# 模型更新
	l = loss(net(features), labels)
	print(f'epoch {epoch + 1}, loss {l:f}')

下一篇：【动手学深度学习v2李沐】学习笔记04：Softmax回归、损失函数、图片分类数据集、详细代码实现

第N11周：seq2seq翻译实战-Pytorch复现计算机真好丸 pytorch 人工智能 python
文章目录一、前期准备1.搭建语言类2.文本处理函数3.文件读取函数二、Seq2Seq模型1.编码器（encoder）2.解码器（decoder）三、训练1.数据预处理2.训练函数3.评估四、评估与训练1.Loss图2.可视化注意力五、总结本文为365天深度学习训练营中的学习记录博客原作者：K同学啊一、前期准备from__future__importunicode_literals,print_fu
第N5周：Pytorch文本分类入门计算机真好丸 pytorch 分类人工智能
文章目录一、前期准备1.环境安装2.加载数据3.构建词典4.生成数据批次和迭代器二、准备模型1.定义模型2.定义实例三、训练模型1.拆分数据集并运行模型2.使用测试数据集评估模型本文为365天深度学习训练营中的学习记录博客原作者：K同学啊一、前期准备1.环境安装确保安装了torchtext与portalocker库2.加载数据importtorch#强制使用CPUdevice=torch.devi
第TR5周：Transformer实战：文本分类计算机真好丸 transformer 分类深度学习
文章目录1.准备环境1.1环境安装1.2加载数据2.数据预处理2.1构建词典2.2生成数据批次和迭代器2.3构建数据集3.模型构建3.1定义位置编码函数3.2定义Transformer模型3.3初始化模型3.4定义训练函数3.5定义评估函数4.训练模型4.1模型训练5.总结：本文为365天深度学习训练营中的学习记录博客原作者：K同学啊1.准备环境1.1环境安装这是一个使用PyTorch通过Tran
[AcWing] 算法基础课（一）学算法强推哦 vo很懒算法算法 leetcode 数据结构
第一讲基础算法本文题目及代码全部来自AcWing，强推！(因为没有接触过C++所以一开始学起来不是很容易，慢慢听下去边查边学就好啦)文章目录第一讲基础算法1.排序1.1快速排序1.2归并排序2.二分2.1整数二分(较麻烦)2.2浮点数二分3.前缀和与差分3.1前缀和3.2差分4.双指针5.位运算6.离散化7.区间合并1.排序1.1快速排序快速排序基础算法：题目：#includeusingnames
双指针算法 AcWing 2816. 判断子序列飞滕人生TYF 算法算法 c++数据结构
双指针算法AcWing2816.判断子序列原题链接AcWing2816.判断子序列算法标签双指针思路子序列指序列的一部分项按原有次序排列而得的序列。在枚举序列a时，若匹配上，即a[i]==b[j]，需使i,j后移，若尚未匹配上，需使j后移。所以j满足单调性，可使用双指针算法代码#include#defineintlonglong#definerep(i,a,b)for(inti=a;ib;--i)
代码随想录算法训练营第一天：二分查找，移除元素，有序数组的平方坚持不懈的猫喵算法
一.数组1.要点：数组下标都是从0开始的。数组内存空间的地址是连续的数组的元素是不能删的，只能覆盖。C++中二维数组在地址空间上是连续的。（java就不是了）二.二分查找二分查找有两种方法1.target在左闭右闭[left,right]while(lefttarget)target偏小，在left与middle的左侧，right要赋值为middle-1，left不用改变，因为当前这个nums[m
【算法】【区间合并】acwing算法基础 803. 区间合并柠石榴算法输入输出算法 c++区间合并
题目给定n个区间[li,ri]，要求合并所有有交集的区间。注意如果在端点处相交，也算有交集。输出合并完成后的区间个数。例如：[1,3]和[2,6]可以合并为一个区间[1,6]。输入格式第一行包含整数n。接下来n行，每行包含两个整数l和r。输出格式共一行，包含一个整数，表示合并区间完成后的区间个数。数据范围1≤n≤100000−109≤li≤ri≤109输入样例：51224567879输出样例：3来
LeetCode Hot100刷题——最长连续序列圈圈编码 leetcode 算法职场和发展
128.最长连续序列给定一个未排序的整数数组nums，找出数字连续的最长序列（不要求序列元素在原数组中连续）的长度。请你设计并实现时间复杂度为O(n)的算法解决此问题。示例1：输入：nums=[100,4,200,1,3,2]输出：4解释：最长数字连续序列是[1,2,3,4]。它的长度为4。示例2：输入：nums=[0,3,7,2,5,8,4,6,0,1]输出：9HashSetHashSet是Ja
大数据知识图谱之深度学习——基于BERT+LSTM+CRF深度学习识别模型医疗知识图谱问答可视化系统_bert+lstm 2301_76348014 程序员深度学习大数据知识图谱
文章目录大数据知识图谱之深度学习——基于BERT+LSTM+CRF深度学习识别模型医疗知识图谱问答可视化系统一、项目概述二、系统实现基本流程三、项目工具所用的版本号四、所需要软件的安装和使用五、开发技术简介Django技术介绍Neo4j数据库Bootstrap4框架Echarts简介NavicatPremium15简介Layui简介Python语言介绍MySQL数据库深度学习六、核心理论贪心算法A
DeepSeek进阶开发与应用1：DeepSeek框架概述与基础应用 Evaporator Core #DeepSeek快速入门 DeepSeek进阶开发与应用 spring 自然语言处理
引言在当今的人工智能领域，深度学习技术已经成为了推动技术进步的核心动力之一。DeepSeek作为一个先进的深度学习框架，旨在为开发者和研究人员提供一个高效、灵活且易于扩展的平台，以便于他们能够快速地实现和部署各种深度学习模型。本文将深入探讨DeepSeek框架的核心架构、基础应用以及如何通过代码实现一个简单的深度学习模型。DeepSeek框架概述DeepSeek框架的设计理念是简洁而强大。它提供了
【Jvascript 算法】-- JavaScript实现对树结构数据的增删以及树型数据与数组的相互转换野生松
在日常开发中我们经常会碰到树结构数据，以下是我的笔记：constarr=[{id:2,name:'部门B',parentId:0},{id:3,name:'部门C',parentId:1},{id:1,name:'部门A',parentId:2},{id:4,name:'部门D',parentId:1},{id:5,name:'部门E',parentId:2},{id:6,name:'部门F',p
Leetcode No.46 全排列（DFS） AI算法攻城狮 #DFS深度优先遍历 leetcode 算法
一、题目介绍给定一个没有重复数字的序列，返回其所有可能的全排列。示例:输入:[1,2,3]输出:[[1,2,3],[1,3,2],[2,1,3],[2,3,1],[3,1,2],[3,2,1]]二、解题思路这个问题可以看作有n个排列成一行的空格，我们需要从左往右依此填入题目给定的n个数，每个数只能使用一次。那么很直接的可以想到一种穷举的算法，即从左往右每一个位置都依此尝试填入一个数，看能不能填完这
代码随想录算法训练营第三天| 反转链表，设计链表，移除链表元素坚持不懈的猫喵算法链表数据结构
206.反转链表-力扣（LeetCode）structListNode*reverseList(structListNode*head){typedefstructListNodeListNode;ListNode*tmp;ListNode*cur=head;ListNode*pre=NULL;while(cur){tmp=cur->next;cur->next=pre;pre=cur;cur=t
代码随想录算法训练营第六天 | 242.有效的字母异位词、349. 两个数组的交集、202. 快乐数、1. 两数之和虾饺爱下棋算法 leetcode java 哈希表
代码随想录算法训练营第六天|242.有效的字母异位词、349.两个数组的交集、202.快乐数、1.两数之和第五天休息，就没写文章，hh感悟：今天的任务相对轻松一些。242.有效的字母异位词link题目：给定两个字符串s和t，编写一个函数来判断t是否是s的字母异位词。注意：若s和t中每个字符出现的次数都相同，则称s和t互为字母异位词。先是展现暴力求解：比较好理解，大致思路就是先对两个字符串进行排序，
DeepSeek+WPS/Office手把手教你玩转智能办公 herosunly DeepSeek从入门到精通 deepseek 大模型人工智能 office wps 智能办公
大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于大模型算法的研究与应用。曾担任百度千帆大模型比赛、BPAA算法Q大赛评委，编写微软OpenAI考试认证指导手册。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第名。授权多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。
使用Python实现深度学习模型：知识蒸馏与模型压缩 Echo_Wish Python 笔记从零开始学Python人工智能 Python算法 python 深度学习开发语言
在深度学习领域，模型的大小和计算复杂度常常是一个挑战。知识蒸馏（KnowledgeDistillation）和模型压缩（ModelCompression）是两种有效的技术，可以在保持模型性能的同时减少模型的大小和计算需求。本文将详细介绍如何使用Python实现这两种技术。目录引言知识蒸馏概述模型压缩概述实现步骤数据准备教师模型训练学生模型训练（知识蒸馏）模型压缩代码实现结论1.引言在实际应用中，深
深度学习框架探秘｜TensorFlow vs PyTorch：AI 框架的巅峰对决紫雾凌寒智启前沿：AI 洞察・创未来人工智能深度学习 tensorflow pytorch ai
在深度学习框架中，TensorFlow和PyTorch无疑是两大明星框架。前面两篇文章我们分别介绍了TensorFlow（点击查看）和PyTorch（点击查看）。它们引领着AI开发的潮流，吸引着无数开发者投身其中。但这两大框架究竟谁更胜一筹？是TensorFlow的全面与稳健，还是PyTorch的灵活与便捷？让我们一同深入剖析，探寻答案。在深度学习框架中，TensorFlow和PyTorch无疑是
基于遗传算法求解带有时间窗、车载容量限制、多车辆、单配送中心路径优化VRPTW（多约束）matlab代码天天Matlab科研工作室智能优化算法matlab仿真无人机matlab仿真电子资源 matlab 算法自动驾驶
1数学模型(1)有关模型的说明和假设1)模型中的已知量有：各需求点的位置坐标、各需求点的物料需求数量，各需求点的物料的到达时间要求，配送中心到各需求点的最短行驶距离，各需求点互相之间的最短运输距离。2)现场调查发现，需要配送的物料是可以混装在同一物料架上的，且各需求点需要的物料数量小于物料仓库的库存量。3)忽略在配送过程中车辆遇到的拥挤排队等不利于生产进行的外界因素，也就是说整个装配车间正常运行。
《Python与C#：虚拟机与元宇宙的次元战争》虫洞没有虫科技资讯\好文分享 c#开发语言
一、运行时拓扑的「克莱因瓶」C#的CLR是三维环面结构的完美体现，IL代码在JIT编译时经历时空折叠。Unity引擎中，值类型在栈内存构建莫比乌斯环，使得800万顶点模型渲染保持16ms的帧同步。但当尝试将ECS架构推至理论极限时，发现GC的标记-清除算法会破坏拓扑结构，必须切换到UnityDOTS的Burst编译器实现量子退火优化。Python的PyPy则是四维超球面，JIT编译器在跟踪热点时创
Python说课内容介绍 laocooon523857886 算法算法
一、明确课程目标1.课程目标的确定面向整个专业：Python课程作为计算机专业或相关专业中的一部分，需要对学生的编程能力、问题解决能力以及软件开发的基础技能进行培养。通过本课程，学生能够掌握Python编程的基本语法、面向对象编程、常见数据结构和算法。面向岗位：课程目标还需要结合市场需求和岗位要求。例如，数据分析、人工智能、Web开发等方向都需要具备Python编程能力。学生通过学习Python，
【数据结构】排序算法---基数排序（动图演示） Crossoads C语言之数据结构初阶排序算法数据结构算法开发语言 c语言
文章目录1.定义2.算法步骤2.1MSD基数排序2.2LSD基数排序3.LSD基数排序动图演示4.性质5.算法分析6.代码实现C语言PythonJavaC++Go结语⚠本节要介绍的不是计数排序1.定义基数排序（英语：Radixsort）是一种非比较型的排序算法，最早用于解决卡片排序的问题。基数排序将待排序的元素拆分为k个关键字，逐一对各个关键字排序后完成对所有元素的排序。如果是从第1关键字到第k关
景联文科技数据处理平台：支持高质量图像标注服务景联文科技人工智能科技计算机视觉
图像标注是计算机视觉领域中不可或缺的一环，它通过为图像添加标签来帮助机器学习算法理解图像内容。这一过程对于创建高质量的训练数据集至关重要，使得AI模型能够准确地识别和分类现实世界中的物体。常见的图像标注类型：边界框标注：这是最常用的标注方式之一，通常用于物体检测任务。通过绘制矩形框来确定图像中目标物体的位置，可以是二维或三维形式。分割标注：包括语义分割（同一类别的所有实例被视为整体）和实例分割（每
OPPO 2025届校招补招正式开启 weixin_53585422 算法求职招聘前端硬件工程大数据
OPPO2025届校招补招正式开启（秋招投过的同学也可投递！）面向对象：2025届全球应届本科生与硕士研究生招聘岗位：AI/算法类、标准研究类、软件类、硬件类、产品类、设计类、工程技术类、销售服务类、品牌策划类、采购类、综合职能类（每人最多可投递2个岗位）工作城市：东莞、深圳、成都、上海、北京、西安、南京、重庆薪酬福利：极具竞争力的薪资+制化培养体系+多样化发展机制内推链接：https://sou
Spark 性能优化（四）：Cache LevenBigData spark 性能调优 spark 性能优化大数据
在Spark中，缓存是一种将计算结果存储在内存中的方式，目的是加速后续操作。当你执行迭代算法或查询时，如果多次重复使用相同的数据集，缓存可以避免每次都重新计算相同的转换操作。通过缓存，Spark可以将数据存储在内存中，这样在后续的处理阶段就能更快地访问。1.Spark缓存的关键点：缓存基本概念：通过调用.cache()对DataFrame或RDD进行缓存。默认情况下，数据会存储在内存中（RAM），
《深入浅出多模态》（五）：多模态经典模型ALBEF GoAI 深入浅出多模态多模态大模型 LLM 深度学习人工智能
AI学习星球推荐：GoAI的学习社区知识星球是一个致力于提供《机器学习|深度学习|CV|NLP|大模型|多模态|AIGC》各个最新AI方向综述、论文等成体系的学习资料，配有全面而有深度的专栏内容，包括不限于前沿论文解读、资料共享、行业最新动态以、实践教程、求职相关（简历撰写技巧、面经资料与心得）多方面综合学习平台，强烈推荐AI小白及AI爱好者学习，性价比非常高！加入星球➡️点击链接✨专栏介绍：</
轻量级的注意力网络（LANMSFF）模型详解及代码复现清风AI 深度学习算法详解及代码复现深度学习人工智能神经网络 python 计算机视觉
定义与特点在深度学习领域，轻量化网络设计已成为一个重要的研究方向。LANMSFF模型作为一种新型的轻量级网络架构，在保持高性能的同时，显著降低了模型的复杂度。LANMSFF模型的核心特点可以概括为以下几个方面：轻量级设计：通过精心设计的网络结构和参数优化，在保持较高性能的同时，显著降低了模型的复杂度。注意力机制：引入了一种新的注意力机制，能够有效地捕捉图像中的关键特征，提高模型的表达能力。多尺度特
字符串相似度算法 S Y H java工具类算法 java 开发语言
publicstaticvoidmain(String[]args){Stringaddress1="济南市历下区经十路69号12号楼1单元401号";Stringaddress2="济南市历下区经十路69号顺元街道12号楼1单元401号";intdistance=levenshteinDistance(address1,address2);System.out.println("Levensht
TPAMI 2024 | SSR-2D: 从2D图像进行语义3D场景重建小白学视觉论文解读 IEEE TPAMI 深度学习顶刊论文论文解读 TPAMI
论文信息题目：SSR-2D:Semantic3DSceneReconstructionFrom2DImagesSSR-2D:从2D图像进行语义3D场景重建作者：JunwenHuang,AlexeyArtemov,YujinChen,ShuaifengZhi,KaiXu,andMatthiasNießner论文创新点首次提出了一种基于深度学习的方法，能够在不使用任何3D标注的情况下，从不完整的RGB
C++优选算法五位运算 gkdpjj 优选算法算法 c++开发语言
一、位运算位运算（BitwiseOperations）是直接在整数的二进制表示上进行的操作。这些操作包括位与（AND）、位或（OR）、位非（NOT）、位异或（XOR）、左移（LeftShift）和右移（RightShift）等。位运算在处理低级别数据、优化性能、实现加密算法等方面非常有用。以下是这些操作的详细介绍：位与（BitwiseAND,&）：对应位都为1时，结果位才为1，否则为0。示例：5&
读算法简史：从美索不达米亚到人工智能时代15读后总结与感想兼导读躺柒人工智能算法导读总结 AI
1.基本信息算法简史：从美索不达米亚到人工智能时代克里斯·布利克利著中信出版集团股份有限公司,2024年9月出版1.1.读薄率书籍总字数18.6万字，笔记总字数51653字。读薄率51653÷186000≈27.77%1.2.读厚方向当我点击时，算法在想什么？算法霸权极简算法史：从数学到机器的故事算法的陷阱：超级平台、算法垄断与场景欺骗天才与算法：人脑与AI的数学思维算法图解1.3.笔记--章节对
TOMCAT在POST方法提交参数丢失问题 357029540 java tomcat jsp
摘自http://my.oschina.net/luckyi/blog/213209 昨天在解决一个BUG时发现一个奇怪的问题，一个AJAX提交数据在之前都是木有问题的，突然提交出错影响其他处理流程。检查时发现页面处理数据较多，起初以为是提交顺序不正确修改后发现不是由此问题引起。于是删除掉一部分数据进行提交，较少数据能够提交成功。恢复较多数据后跟踪提交FORM DATA ，发现数
在MyEclipse中增加JSP模板删除-2008-08-18 ljy325 jsp xml MyEclipse
在D:\Program Files\MyEclipse 6.0\myeclipse\eclipse\plugins\com.genuitec.eclipse.wizards_6.0.1.zmyeclipse601200710\templates\jsp 目录下找到Jsp.vtl，复制一份，重命名为jsp2.vtl,然后把里面的内容修改为自己想要的格式，保存。然后在 D:\Progr
JavaScript常用验证脚本总结 eksliang JavaScript javaScript表单验证
转载请出自出处：http://eksliang.iteye.com/blog/2098985 下面这些验证脚本，是我在这几年开发中的总结，今天把他放出来，也算是一种分享吧，现在在我的项目中也在用！包括日期验证、比较，非空验证、身份证验证、数值验证、Email验证、电话验证等等...! &nb
微软BI（4） 18289753290 微软BI SSIS
1） Q:查看ssis里面某个控件输出的结果： A MessageBox.Show(Dts.Variables["v_lastTimestamp"].Value.ToString()); 这是我们在包里面定义的变量 2):在关联目的端表的时候如果是一对多的关系，一定要选择唯一的那个键作为关联字段。 3) Q：ssis里面如果将多个数据源的数据插入目的端一
定时对大数据量的表进行分表对数据备份酷的飞上天空大数据量
工作中遇到数据库中一个表的数据量比较大，属于日志表。正常情况下是不会有查询操作的，但如果不进行分表数据太多，执行一条简单sql语句要等好几分钟。。分表工具：linux的shell + mysql自身提供的管理命令原理：使用一个和原表数据结构一样的表，替换原表。 linux shell内容如下： =======================开始
本质的描述与因材施教永夜-极光感想随笔
不管碰到什么事,我都下意识的想去探索本质,找寻一个最形象的描述方式。我坚信,世界上对一件事物的描述和解释,肯定有一种最形象,最贴近本质,最容易让人理解 &
很迷茫。。。随便小屋随笔
小弟我今年研一，也是从事的咱们现在最流行的专业（计算机）。本科三流学校，为了能有个更好的跳板，进入了考研大军，非常有幸能进入研究生的行业（具体学校就不说了，怕把学校的名誉给损了）。先说一下自身的条件，本科专业软件工程。主要学习就是软件开发，几乎和计算机没有什么区别。因为学校本身三流，也就是让老师带着学生学点东西，然后让学生毕业就行了。对专业性的东西了解的非常浅。就那学的语言来说
23种设计模式的意图和适用范围 aijuans 设计模式
Factory Method 意图定义一个用于创建对象的接口，让子类决定实例化哪一个类。Factory Method 使一个类的实例化延迟到其子类。　　适用性当一个类不知道它所必须创建的对象的类的时候。　　当一个类希望由它的子类来指定它所创建的对象的时候。　　当类将创建对象的职责委托给多个帮助子类中的某一个，并且你希望将哪一个帮助子类是代理者这一信息局部化的时候。 Abstr
Java中的synchronized和volatile aoyouzi java volatile synchronized
说到Java的线程同步问题肯定要说到两个关键字synchronized和volatile。说到这两个关键字，又要说道JVM的内存模型。JVM里内存分为main memory和working memory。 Main memory是所有线程共享的，working memory则是线程的工作内存，它保存有部分main memory变量的拷贝，对这些变量的更新直接发生在working memo
js数组的操作和this关键字百合不是茶 js 数组操作 this关键字
js数组的操作; 一:数组的创建: 1、数组的创建 var array = new Array();　//创建一个数组 var array = new Array([size]);　//创建一个数组并指定长度，注意不是上限，是长度 var arrayObj = new Array([element0[, element1[, ...[, elementN]]]
别人的阿里面试感悟 bijian1013 面试分享工作感悟阿里面试
原文如下：http://greemranqq.iteye.com/blog/2007170 一直做企业系统，虽然也自己一直学习技术，但是感觉还是有所欠缺，准备花几个月的时间，把互联网的东西，以及一些基础更加的深入透析，结果这次比较意外，有点突然，下面分享一下感受吧！ &nb
淘宝的测试框架Itest Bill_chen spring maven 框架单元测试 JUnit
Itest测试框架是TaoBao测试部门开发的一套单元测试框架，以Junit4为核心，集合DbUnit、Unitils等主流测试框架，应该算是比较好用的了。近期项目中用了下，有关itest的具体使用如下： 1.在Maven中引入itest框架： <dependency> <groupId>com.taobao.test</groupId&g
【Java多线程二】多路条件解决生产者消费者问题 bit1129 java多线程
package com.tom; import java.util.LinkedList; import java.util.Queue; import java.util.concurrent.ThreadLocalRandom; import java.util.concurrent.locks.Condition; import java.util.concurrent.loc
汉字转拼音pinyin4j 白糖_ pinyin4j
以前在项目中遇到汉字转拼音的情况，于是在网上找到了pinyin4j这个工具包，非常有用，别的不说了，直接下代码： import java.util.HashSet; import java.util.Set; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin
org.hibernate.TransactionException: JDBC begin failed解决方案 bozch ssh 数据库异常 DBCP
org.hibernate.TransactionException: JDBC begin failed: at org.hibernate.transaction.JDBCTransaction.begin(JDBCTransaction.java:68) at org.hibernate.impl.SessionImp
java-并查集（Disjoint-set）-将多个集合合并成没有交集的集合 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.HashMap; import java.util.HashSet; import java.util.Iterator; import java.util.List; import java.util.Map; import java.ut
Java PrintWriter打印乱码 chenbowen00 java
一个小程序读写文件，发现PrintWriter输出后文件存在乱码，解决办法主要统一输入输出流编码格式。读文件： BufferedReader 从字符输入流中读取文本，缓冲各个字符，从而提供字符、数组和行的高效读取。可以指定缓冲区的大小，或者可使用默认的大小。大多数情况下，默认值就足够大了。通常，Reader 所作的每个读取请求都会导致对基础字符或字节流进行相应的读取请求。因
[天气与气候]极端气候环境 comsci 环境
如果空间环境出现异变...外星文明并未出现,而只是用某种气象武器对地球的气候系统进行攻击,并挑唆地球国家间的战争,经过一段时间的准备...最大限度的削弱地球文明的整体力量,然后再进行入侵...... 那么地球上的国家应该做什么样的防备工作呢? &n
oracle order by与union一起使用的用法 daizj UNION oracle order by
当使用union操作时，排序语句必须放在最后面才正确，如下：只能在union的最后一个子查询中使用order by，而这个order by是针对整个unioning后的结果集的。So：如果unoin的几个子查询列名不同，如 Sql代码 select supplier_id, supplier_name from suppliers UNI
zeus持久层读写分离单元测试 deng520159 单元测试
本文是zeus读写分离单元测试,距离分库分表,只有一步了.上代码: 1.ZeusMasterSlaveTest.java package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Assert; import org.j
Yii 截取字符串(UTF-8) 使用组件 dcj3sjt126com yii
1.将Helper.php放进protected\components文件夹下。 2.调用方法： Helper::truncate_utf8_string($content,20,false); //不显示省略号 Helper::truncate_utf8_string($content,20); //显示省略号 &n
安装memcache及php扩展 dcj3sjt126com PHP
安装memcache tar zxvf memcache-2.2.5.tgz cd memcache-2.2.5/ /usr/local/php/bin/phpize (?) ./configure --with-php-confi
JsonObject 处理日期 feifeilinlin521 java json JsonOjbect JsonArray JSONException
写这边文章的初衷就是遇到了json在转换日期格式出现了异常 net.sf.json.JSONException: java.lang.reflect.InvocationTargetException 原因是当你用Map接收数据库返回了java.sql.Date 日期的数据进行json转换出的问题话不多说直接上代码 &n
Ehcache（06）——监听器 234390216 监听器 listener ehcache
监听器 Ehcache中监听器有两种，监听CacheManager的CacheManagerEventListener和监听Cache的CacheEventListener。在Ehcache中，Listener是通过对应的监听器工厂来生产和发生作用的。下面我们将来介绍一下这两种类型的监听器。
activiti 自带设计器中chrome 34版本不能打开bug的解决 jackyrong Activiti
在acitivti modeler中，如果是chrome 34，则不能打开该设计器，其他浏览器可以，经证实为bug，参考 http://forums.activiti.org/content/activiti-modeler-doesnt-work-chrome-v34 修改为，找到 oryx.debug.js 在最头部增加 if (!Document.
微信收货地址共享接口-终极解决 laotu5i0 微信开发
最近要接入微信的收货地址共享接口，总是不成功，折腾了好几天，实在没办法网上搜到的帖子也是骂声一片。我把我碰到并解决问题的过程分享出来，希望能给微信的接口文档起到一个辅助作用，让后面进来的开发者能快速的接入，而不需要像我们一样苦逼的浪费好几天，甚至一周的青春。各种羞辱、谩骂的话就不说了，本人还算文明。如果你能搜到本贴，说明你已经碰到了各种 ed
关于人才 netkiller.github.com 工作面试招聘 netkiller 人才
关于人才每个月我都会接到许多猎头的电话，有些猎头比较专业，但绝大多数在我看来与猎头二字还是有很大差距的。与猎头接触多了，自然也了解了他们的工作，包括操作手法，总体上国内的猎头行业还处在初级阶段。总结就是“盲目推荐，以量取胜”。目前现状许多从事人力资源工作的人，根本不懂得怎么找人才。处在人才找不到企业，企业找不到人才的尴尬处境。企业招聘，通常是需要用人的部门提出招聘条件，由人
搭建 CentOS 6 服务器 - 目录 rensanning centos
(1) 安装CentOS ISO（desktop/minimal）、Cloud（AWS/阿里云）、Virtualization（VMWare、VirtualBox）详细内容 (2) Linux常用命令 cd、ls、rm、chmod...... 详细内容 (3) 初始环境设置用户管理、网络设置、安全设置...... 详细内容 (4) 常驻服务Daemon
【求助】mongoDB无法更新主键 toknowme mongodb
Query query = new Query(); query.addCriteria(new Criteria("_id").is(o.getId())); &n
jquery 页面滚动到底部自动加载插件集合 xp9802 jquery
很多社交网站都使用无限滚动的翻页技术来提高用户体验，当你页面滑到列表底部时候无需点击就自动加载更多的内容。下面为你推荐 10 个 jQuery 的无限滚动的插件： 1. jQuery ScrollPagination jQuery ScrollPagination plugin 是一个 jQuery 实现的支持无限滚动加载数据的插件。 2. jQuery Screw S