-meteor-

深度学习基础——week1

更好的阅读体验

PyTorch

什么是PyTorch(来自官方文档)

PyTorch 是基于以下两个目的而打造的python科学计算框架：

无缝替换NumPy，并且通过利用GPU的算力来实现神经网络的加速。
通过自动微分机制，来让神经网络的实现变得更加容易。

Tensor（张量）

张量如同数组和矩阵一样, 是一种特殊的数据结构。在PyTorch中, 神经网络的输入、输出以及网络的参数等数据, 都是使用张量来进行描述。

张量初始化

import torch
import numpy as np

#由List直接生成张量, 张量类型由原始数据类型决定。
data = [[1, 2], [3, 4]]         
x_data = torch.tensor(data)	
print(f"{x_data}\n")


#通过Numpy数组来生成张量
np_array = np.array(data)
x_np = torch.from_numpy(np_array)
print(f"{x_np}\n")


#通过已有的张量来生成新的张量
x_ones = torch.ones_like(x_data)   # 保留 x_data 的属性()
print(f"Ones Tensor: \n {x_ones} \n")
x_rand = torch.rand_like(x_data, dtype=torch.float)   # 重写 x_data 的数据类型
                                                      #int -> float
print(f"Random Tensor: \n {x_rand} \n")


#创建Tensor有多种方法，包括：ones, zeros, eye, arange, linspace, rand, randn, normal, uniform, randperm
y_rand = torch.rand(5,3)
print(f"{y_rand}\n")
x = torch.arange(12) 
print(f"{x}\n")

tensor([[1, 2],
        [3, 4]])

tensor([[1, 2],
        [3, 4]])

Ones Tensor: 
 tensor([[1, 1],
        [1, 1]]) 

Random Tensor: 
 tensor([[0.6913, 0.0076],
        [0.0978, 0.3915]]) 

tensor([[0.3311, 0.6230, 0.4556],
        [0.4508, 0.9119, 0.1254],
        [0.3226, 0.4033, 0.5625],
        [0.1423, 0.4016, 0.3720],
        [0.6552, 0.2447, 0.0731]])

tensor([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11])

张量属性

从张量属性我们可以得到张量的维数、数据类型以及它们所存储的设备(CPU或GPU)。

tensor = torch.rand(3,4)

print(f"Shape of tensor: {tensor.shape}")
print(f"Datatype of tensor: {tensor.dtype}")
print(f"Device tensor is stored on: {tensor.device}")

Shape of tensor: torch.Size([3, 4])
Datatype of tensor: torch.float32
Device tensor is stored on: cpu

张量运算

运算例如转置、索引、切片、数学运算、线性代数、随机采样等，下面是一些常见的张量运算，其他有需要的话再查阅官方文档即可

运算符

x = torch.tensor([1.0, 2, 4, 8])
y = torch.tensor([2, 2, 2, 2])
x + y, x - y, x * y, x / y, x ** y,torch.exp(x)  # **运算符是求幂运算

(tensor([ 3.,  4.,  6., 10.]),
 tensor([-1.,  0.,  2.,  6.]),
 tensor([ 2.,  4.,  8., 16.]),
 tensor([0.5000, 1.0000, 2.0000, 4.0000]),
 tensor([ 1.,  4., 16., 64.])
 tensor([2.7183e+00, 7.3891e+00, 5.4598e+01, 2.9810e+03]))

拼接

通过torch.cat方法将一组张量按照指定的维度进行拼接

X = torch.arange(12, dtype=torch.float32).reshape((3,4))
Y = torch.tensor([[2.0, 1, 4, 3], [1, 2, 3, 4], [4, 3, 2, 1]])
torch.cat((X, Y), dim=0), torch.cat((X, Y), dim=1)

(tensor([[ 0.,  1.,  2.,  3.],
         [ 4.,  5.,  6.,  7.],
         [ 8.,  9., 10., 11.],
         [ 2.,  1.,  4.,  3.],
         [ 1.,  2.,  3.,  4.],
         [ 4.,  3.,  2.,  1.]]),
 tensor([[ 0.,  1.,  2.,  3.,  2.,  1.,  4.,  3.],
         [ 4.,  5.,  6.,  7.,  1.,  2.,  3.,  4.],
         [ 8.,  9., 10., 11.,  4.,  3.,  2.,  1.]]))

索引和切片

和Python数组一样，张量的元素支持索引，切片

print(X)
print(X[-1])
print(X[1:3])
print(X[0][0:2])

tensor([[ 0.,  1.,  2.,  3.],
        [ 4.,  5.,  6.,  7.],
        [ 8.,  9., 10., 11.]])
tensor([ 8.,  9., 10., 11.])
tensor([[ 4.,  5.,  6.,  7.],
        [ 8.,  9., 10., 11.]])
tensor([0., 1.])

数学基础

线性代数

基本概念：

标量 (scalar) ：标量由只有一个元素的张量表示
向量 (vector) ：将标量从零阶推广到一阶 $\mathbf{x}\in\mathbb{R}^n$
矩阵 (matrix) ：矩阵将向量从一阶推广到二阶， $\mathbf{A} \in \mathbb{R}^{m \times n}$
矩阵的转置(transpose)，对称矩阵(symmetric matrix)，正交矩阵（Orthogonal Matrix），矩阵乘法
范数 (norm) ： $L_1$ 范数： $\|\mathbf{x}\|_1 = \sum_{i=1}^n \left|x_i \right|.$

$L_2$ 范数： $\|\mathbf{x}\|_2 = \sqrt{\sum_{i=1}^n x_i^2},$

$F -$ 范数（矩阵）： $\|\mathbf{X}\|_F = \sqrt{\sum_{i=1}^m \sum_{j=1}^n x_{ij}^2}.$
…

微积分

矩阵求导：

矩阵求导的本质与分子布局、分母布局的本质

矩阵求导公式的数学推导

概率

基本概念：

样本空间（sample space）事件（event）互斥（mutually exclusive）
随机变量（random variable）离散（discrete）连续（continuous）
条件概率（conditional probability）Bayes定理（Bayes’ theorem）
联合分布（joint distribution）边缘分布（marginal distribution）。
期望（expectation）标准差（standard deviation）
马尔可夫链
…

线性神经网络

虽然线性神经网络的功能很有限，但它是一切的基础。

线性回归及其实现

基本元素

在机器学习的术语中，该数据集称为训练数据集（training data set）或训练集（training set）。每行数据样本（sample），也可以称为数据点（data point）或数据样本（data instance）。我们把试图预测的目标称为标签（label）或目标（target）。预测所依据的自变量称为特征（feature）或协变量（covariate）。

通常，我们使用 $n$ 来表示数据集中的样本数。对索引为 $i$ 的样本，其输入表示为 $\mathbf{x}^{(i)} = [x_1^{(i)}, x_2^{(i)}]^\top$ ，其对应的标签是 $y^{(i)}$ 。

线性模型

当我们的输入包含 $d$ 个特征时，我们将预测结果 $\hat{y}$ （通常使用“尖角”符号表示 $y$ 的估计值）表示为：

$\hat{y} = w_1 x_1 + ... + w_d x_d + b.$
将所有特征放到向量 $\mathbf{x} \in \mathbb{R}^d$ 中，并将所有权重放到向量 $\mathbf{w} \in \mathbb{R}^d$ 中，我们可以用点积形式来简洁地表达模型：

$\hat{y} = \mathbf{w}^\top \mathbf{x} + b.$

损失函数（loss function）

平方损失函数，一般这样定义： $l^{(i)}(\mathbf{w}, b) = \frac{1}{2} \left(\hat{y}^{(i)} - y^{(i)}\right)^2.$ ]

其实平方损失函数就是对参数的极大似然估计通俗讲解平方损失函数平方形式的数学解释？

小批量随机梯度下降（minibatch stochastic gradient descent）

梯度下降（gradient descent）：通过不断地在损失函数递减的方向上更新参数来降低误差。但实际中的执行可能会非常慢：因为在每一次更新参数之前，我们必须遍历整个数据集。因此，我们通常会在每次需要计算更新的时候随机抽取一小批样本，这种变体叫做小批量随机梯度下降（minibatch stochastic gradient descent）。

在每次迭代中，我们首先随机抽样一个小批量 $\mathcal{B}$ ，然后，我们计算小批量的平均损失关于模型参数的导数（梯度）。最后，我们将梯度乘以一个预先确定的正数（学习率），并从当前参数的值中减掉。
$(\mathbf{w},b) \leftarrow (\mathbf{w},b) - \frac{\eta}{|\mathcal{B}|} \sum_{i \in \mathcal{B}} \partial_{(\mathbf{w},b)} l^{(i)}(\mathbf{w},b)$

代码实现参考网站

参数 $\mathbf{w} = [2, -3.4]^\top$ 、 $b = 4.2$ ， $\mathbf{w}^\top \mathbf{x} + b.$ 生成1000组数据。

生成数据集

import numpy as np
import torch
from torch.utils import data
from d2l import torch as d2l

def synthetic_data(w, b, num_examples):  #    """生成y=Xw+b+噪声"""
    X = torch.normal(0, 1, (num_examples, len(w)))
    y = torch.matmul(X, w) + b
    y += torch.normal(0, 0.01, y.shape)
    return X, y.reshape((-1, 1))
  
  
true_w = torch.tensor([2, -3.4])
true_b = 4.2
features, labels = synthetic_data(true_w, true_b, 1000) 
#features：输入的特征矩阵  labels：试图预测的目标

读取数据集

使用iter构造Python迭代器

def load_array(data_arrays, batch_size, is_train=True):  
    """构造一个PyTorch数据迭代器"""
    dataset = data.TensorDataset(*data_arrays)
    return data.DataLoader(dataset, batch_size, shuffle=is_train)
  
batch_size = 10  #上面介绍的小批量随机梯度下降，每个批量的大小
data_iter = load_array((features, labels), batch_size)

定义模型

这里插播一件有趣的事情，为什么神经网络在考虑梯度下降的时候，网络参数的初始值不能设定为全0，而是要采用随机初始化？

在知乎上看到一个非常形象的答案：

设想你在爬山，但身处直线形的山谷中，两边是对称的山峰。

由于对称性，你所在之处的梯度只能沿着山谷的方向，不会指向山峰；你走了一步之后，情况依然不变。

结果就是你只能收敛到山谷中的一个极大值，而走不到山峰上去。

# nn是神经网络的缩写
from torch import nn
#第一个指定输入特征形状，即2，第二个指定输出特征形状，输出特征形状为单个标量，因此为1。
net = nn.Sequential(nn.Linear(2, 1))


# 随机初始化参数
net[0].weight.data.normal_(0, 0.01)
net[0].bias.data.fill_(0)

#定义损失函数（平方 2 范数）
loss = nn.MSELoss()

#小批量随机梯度下降算法SGD,学习率0.03
trainer = torch.optim.SGD(net.parameters(), lr=0.03)

训练

num_epochs = 3      #总共遍历3次样本
for epoch in range(num_epochs):
    for X, y in data_iter:   #遍历迭代器中元素
        l = loss(net(X) ,y)
        trainer.zero_grad()  #记得清空梯度
        l.backward()         #求导
        trainer.step()  
    l = loss(net(features), labels)
    print(f'epoch {epoch + 1}, loss {l:f}')     
    
    
#最后比较生成数据集的真实参数和通过有限数据训练获得的模型参数
w = net[0].weight.data
print('w的估计误差：', true_w - w.reshape(true_w.shape))
b = net[0].bias.data
print('b的估计误差：', true_b - b)

结果：

epoch 1, loss 0.000174
epoch 2, loss 0.000104
epoch 3, loss 0.000103

w的估计误差： tensor([0.0010, 0.0006])
b的估计误差： tensor([0.0003])

softmax回归及其实现

softmax回归用于分类

回归是估计一个连续的值

自然区间R
与真实值的区别作为损失

分类是预测一个离散的类别

通常多个输出
输出的i是预测第i类的置信度

注：如果觉得softmax回归难以理解，可以先看Logistic回归（softmax的二分类退化版）

网络架构

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Vs9FMOk7-1655473193629)(http://d2l.ai/_images/softmaxreg.svg)]
$\begin{aligned} &o_{1}=x_{1} w_{11}+x_{2} w_{12}+x_{3} w_{13}+x_{4} w_{14}+b_{1} \\ &o_{2}=x_{1} w_{21}+x_{2} w_{22}+x_{3} w_{23}+x_{4} w_{24}+b_{2} \\ &o_{3}=x_{1} w_{31}+x_{2} w_{32}+x_{3} w_{33}+x_{4} w_{34}+b_{3} \end{aligned}$

softmax运算

softmax函数将未规范化的预测变换为非负并且总和为1，同时要求模型保持可导。首先对每个未规范化的预测求幂，这样可以确保输出非负。为了确保最终输出的总和为1，我们再对每个求幂后的结果除以它们的总和。
$\hat{\mathbf{y}} = \mathrm{softmax}(\mathbf{o})\quad \text{其中}\quad \hat{y}_j = \frac{\exp(o_j)}{\sum_k \exp(o_k)}$
对于所有的 $j$ 总有 $\leq \hat{y}_j \leq 1$ 。因此， $\hat{\mathbf{y}}$ 可以视为一个正确的概率分布。

损失函数

交叉熵损失函数： $l(\mathbf{y}, \hat{\mathbf{y}}) = - \sum_{j=1}^q y_j \log \hat{y}_j.$ （好像下学期信息论也会讲这个东西？？）

代码实现参考网站

对Fashion-MNIST数据集的图形进行分类

初始化模型参数

import torch
from torch import nn
from d2l import torch as d2l

batch_size = 256
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)


# PyTorch不会隐式地调整输入的形状。因此，
# 我们在线性层前定义了展平层（flatten）意思是把矩阵铺平，来调整网络输入的形状
net = nn.Sequential(nn.Flatten(), nn.Linear(784, 10))       #10个类别

def init_weights(m):
    if type(m) == nn.Linear:
        nn.init.normal_(m.weight, std=0.01)

net.apply(init_weights);

使用现成的softmax

loss = nn.CrossEntropyLoss(reduction='none')

优化算法

#学习率为0.1的小批量随机梯度下降作为优化算法
trainer = torch.optim.SGD(net.parameters(), lr=0.1)

调用现成的接口训练模型，查看效果

num_epochs = 10
d2l.train_ch3(net, train_iter, test_iter, loss, num_epochs, trainer)

最简单的DNN——多层感知机

感知机

给定输入 $\mathbf{x}$ , 权重 $\mathbf{w}$ , 和偏移 $b$ , 感知机输出:
$o=\sigma(\langle\mathbf{w}, \mathbf{x}\rangle+b) \quad \sigma(x)= \begin{cases}1 & \text { if } x>0 \\ 0 & \text { otherwise }\end{cases}$

感知机是一个二分类模型, 是最早的AI模型之一
它的求解算法等价于使用批量大小为 1 的梯度下降
它不能拟合 XOR 函数, 导致的第一次 AI 寒冬

多层感知机（MLP）

我们可以通过在网络中加入一个或多个隐藏层来克服线性模型的限制，使其能处理更普遍的函数关系类型。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-8B7e6dnF-1655473193629)(http://d2l.ai/_images/mlp.svg)]

如上图，如果按如下方式计算单隐藏层多层感知机的输出
$$
\begin{aligned}

\mathbf{H} & = \mathbf{X} \mathbf{W}^{(1)} + \mathbf{b}^{(1)}, \

\mathbf{O} & = \mathbf{H}\mathbf{W}^{(2)} + \mathbf{b}^{(2)}.

\end{aligned}
$$
但这其实没起任何作用！证明如下：

令 $\mathbf{W} = \mathbf{W}^{(1)}\mathbf{W}^{(2)}$ $\mathbf{b} = \mathbf{b}^{(1)} \mathbf{W}^{(2)} + \mathbf{b}^{(2)}$
$\mathbf{O} = (\mathbf{X} \mathbf{W}^{(1)} + \mathbf{b}^{(1)})\mathbf{W}^{(2)} + \mathbf{b}^{(2)} = \mathbf{X} \mathbf{W}^{(1)}\mathbf{W}^{(2)} + \mathbf{b}^{(1)} \mathbf{W}^{(2)} + \mathbf{b}^{(2)} = \mathbf{X} \mathbf{W} + \mathbf{b}.$
本质上还是一个线性变换，无法拟合异或函数。那么怎么办呢？

激活函数

我们引入非线性函数：激活函数（activation function） $\sigma$
$$
\begin{aligned}

\mathbf{H} & = \sigma(\mathbf{X} \mathbf{W}^{(1)} + \mathbf{b}^{(1)}), \

\mathbf{O} & = \mathbf{H}\mathbf{W}^{(2)} + \mathbf{b}^{(2)}.\

\end{aligned}
$$
激活函数就像是将整个空间进行扭曲、拉伸了一样。一般来说，有了激活函数，就不可能再将我们的多层感知机退化成线性模型。

下面介绍几种激活函数：

ReLU函数

ReLU(Rectified linear unit) 是最常用的激活函数，名字花里胡哨，定义十分简单
$\operatorname{ReLU}(x) = \max(x, 0)$

sigmoid函数

$\operatorname{sigmoid}(x) = \frac{1}{1 + \exp(-x)}$

tanh函数

$\operatorname{tanh}(x) = \frac{1 - \exp(-2x)}{1 + \exp(-2x)}$

学到这里，我们大概有了1990年左右深度学习从业者的知识水平，那就赶快开始实战吧~~

实战：spiral classification问题

总结

看了老师给的视频，学到了好多东西，虽然大概明白了『是什么』，但并不是很清楚『为什么』。于是自己在网上找了一些学习资料，希望打好DL的基础。一些数学的推导很难，但也很有意思，收获满满，希望能够坚持吧~

Python 中链表的个人理解 python链表
链表组成Python中链表由head、节点、tail、三部分组成。节点为Python链表中最重要的部分，通过构建classNode（）类，节点引入并存储value和next变量，其中value为Node中存储的链表内容，next为Node中存储的指针，指向下一个Node。即Node由指针域next和结构域value构成。链表由上述Node连结而成，其中head指向链表的第一个节点，tail指向链表
Python 实现反转、合并链表有啥用？ python链表
大家好，我是V哥。使用Python实现反转链表、合并链表在开发中比较常见，我们先来看看各自的应用场景。先赞再看后评论，腰缠万贯财进门。反转链表比如，在处理时间序列数据时，有时需要将历史数据按照时间从近到远的顺序展示，如果数据是以链表形式存储的，通过反转链表可以高效地实现这一需求。再比如，判断一个链表是否为回文链表（即链表正序和逆序遍历的值相同）时，可以先反转链表的后半部分，然后与前半部分进行比较。
《深度学习实战》第12集：大模型的未来与行业应用带娃的IT创业者深度学习实战深度学习
深度学习实战|第12集：大模型的未来与行业应用随着深度学习技术的快速发展，大模型（如GPT、LLaMA、Bloom等）已经成为人工智能领域的核心驱动力。本篇博客将探讨大模型的发展趋势及其在医疗、金融、教育等行业的实际应用，并通过2个实战项目展示如何使用开源大模型构建问答系统。此外，我们还会分析大模型的前沿技术方向。图示：大模型发展历程与行业应用场景1.大模型发展历程图以下是大模型从早期到现在的关键
深度学习突破：LLaMA-MoE模型的高效训练策略人工智能大模型讲师培训咨询叶梓深度学习 llama 人工智能 Llama-Moe 大模型语言模型
在人工智能领域，大模型（LLM）的崛起带来了前所未有的进步，但随之而来的是巨大的计算资源需求。为了解决这一问题，Mixture-of-Expert（MoE）模型架构应运而生，而LLaMA-MoE正是这一架构下的重要代表。LLaMA-MoE是一种基于LLaMA系列和SlimPajama的MoE模型，它通过将LLaMA的前馈网络（FFNs）划分为稀疏专家，并为每层专家插入top-K个门，从而显著减小模
文档即产品！工程师必看的写作密码.md 写作技术文档
在撰写技术文章、文档、博客或项目说明时，遵循一定的写作规范可以提升内容的专业性、可读性和实用性。一、文章结构与逻辑标题清晰标题应简洁明确，反映核心内容（如《如何用Python实现快速排序》）。避免模糊标题（如《一个有趣的问题》）。分级标题层级明确（例如：#一级标题→##二级标题→###三级标题）。摘要/引言开篇简要说明文章目标、解决的问题或适用场景。本文档旨在记录一些在实际开发工作中用到的实用且高
基于 Python + Django 的学生成绩综合评价分析预测可视化系统源码空间站11 python django 开发语言课程设计机器学习成绩预测毕业设计
开发报告：一、项目概述本项目是一个基于Python和Django框架开发的学生成绩综合评价分析与预测可视化系统。系统的主要功能包括：学生成绩数据的管理与展示、成绩预测模型的建立与应用、以及预测结果的可视化展示。该系统利用机器学习算法（如线性回归）进行成绩预测，并通过DjangoWeb框架实现数据的展示和用户交互。二、系统功能概述学生信息管理：系统管理学生的基本信息，包括年龄、性别、爱好等，基于Dj
深度学习day1 孤城laugh 深度学习人工智能笔记学习机器学习
深度学习day11.深度学习与机器学习的区别1.1特征提取方面1.2数据量与计算性能要求1.3算法代表2.深度学习框架之TensorFlow2.1TensorFlow基础2.2TensorFlow基础知识1.**张量（Tensor）**：多维数组、多维列表2.**变量（Variable）**：用于表示程序处理的共享持久状态3.**图与函数**4.**可视化学习（TensorBoard）**：用来展
python-坦克大战游戏项目 tzzzzzztzzzz python pygame 游戏
'''尚学堂学习笔记，用于复习'''一.下载pygame，在cmd输入命令pipinstallpygame(也可以直接在pycharm中importpygame,提示你没有pygame,然后直接安装即可)二.分析项目需求:坦克大战游戏的基本需求：1).项目中需要定义的类2).每个类对应的方法1.坦克类显示坦克移动射击2.子弹显示子弹移动击中敌方坦克时产生的影响3.墙壁类显示墙壁（是否可以通过）4.
终于把所有的 Python 库都整理出来啦编程简单学程序员 python python django 后端
常用库Chardet字符编码探测器，可以自动检测文本、网页、xml的编码。colorama主要用来给文本添加各种颜色，并且非常简单易用。Prettytable主要用于在终端或浏览器端构建格式化的输出。difflib，[Python]标准库，计算文本差异Levenshtein，快速计算字符串相似度。fuzzywuzzy,字符串模糊匹配。esmre,正则表达式的加速器。shortuuid,一组简洁UR
python小游戏经典坦克大战-实验设计小哥儿最放纵 python 游戏
一.游戏流程概述游戏基本规则：按上下左右键移动我方坦克，按空格键进行发射子弹，击中坦克，坦克爆炸消失。若我方坦克被子弹击中或撞上，我方坦克死亡按ESC键可以重生。敌方坦克功能：白色敌方坦克为一般坦克。白色较小敌方坦克速度快，射击子弹频繁。黄色坦克被击中后会随机生成白色小坦克。地图：白色“铁”地图：子弹不能穿过此地图，坦克不能穿过此地图。蓝色“水地图”子弹和坦克均可以穿过此地图。游戏流程图基本流程如
Python模块之pywin32 宅羽 Python模块
◆问题汇总：1、多线程使用pywin32com造成的问题：pywintypes.com_error:(-2147221008,'尚未调用CoInitialize。',None,None)解决方法：在线程启动时先运行pythoncom.CoInitialize()importpythoncomclassSecretFile(object):def_save_tmpfile(self,passwd):
twilio给自己发短信 nutron-ma Python 数值分析数学物理基础 matlab python
使用python的twilio给自己发短信1.申请账号、虚拟电话号1.注册地址：https://www.twilio.comsignup,人机验证，邮箱验证，验证接收短信的电话号码。获得自己的虚拟号码，获得账号2.pipinstalltwilio#-*-coding:utf-8-*-"""用于发送短信需要pipinstalltwilio给自己发短信需要申请账号2020.8.29"""fromtwi
【Python环境】配置极简描述 Earnest～ python 开发语言
241220241220241220Python环境配置下载Python稳定版本：StableReleases【3.12.3】下载地址：PythonReleasesforWindows|Python.org.配环境注意勾上AddPython3.xtoPATH，然后点“InstallNow”即可完成安装。配置完成！检验：检验：win+R输入cmd，然后python回车。补充：python解释器Pyt
【Swift 算法实战】判断数组中是否存在重复元素网罗开发 Swift vue.js leetcode 算法
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
编程小白冲Kaggle每日打卡（6）--kaggle学堂：＜Python＞功能和获取帮助 AZmax01 编程小白冲Kaggle每日打卡 python 开发语言
Kaggle官方课程链接：FunctionsandGettingHelp本专栏旨在Kaggle官方课程的汉化，让大家更方便地看懂。目录FunctionsandGettingHelpGettingHelpDefiningfunctionsDocstringsFunctionsthatdon'treturnDefaultargumentsFunctionsAppliedtoFunctionsYourT
深度学习现状与未来发展趋势分析报告（深度学习还是主流吗？）与光同尘大道至简深度学习人工智能
此博客分析深度学习当前的主流应用领域、其受关注度的变化趋势、可能的技术替代或补充方案、产业界和学术界的不同发展方向，以及影响其受关注度变化的核心因素。报告将包括结构化分析（背景、现状、挑战、未来趋势）、数据驱动（市场趋势、论文发表量等数据支持）以及行业案例分析，以展示某些行业如何逐步减少对深度学习的依赖。背景深度学习的概念与发展历程：深度学习（DeepLearning）是机器学习中的一类方法，源于
从专利数据中提取IPC代码，构建共现矩阵（IPC共同出现在同一专利为1，否则为0），利用GCN提取特征，并进行链路预测以评估IPC之间的相似度概率 pk_xz123456 算法深度学习矩阵线性代数
要完成这个任务，你可以按照以下步骤进行：数据预处理：从专利数据中提取IPC代码，并构建共现矩阵。图卷积网络（GCN）：使用GCN提取特征。链路预测：评估IPC之间的相似度概率。以下是一个Python示例代码，展示了如何完成上述任务：importnumpyasnpimportnetworkxasnximporttorchimporttorch.nnasnnimporttorch.nn.functio
基于Python零基础制作一个自己的爬虫程序与光同尘大道至简 python 爬虫开发语言青少年编程 visual studio code github html5
此博客为一个详细的Python爬虫教程，从基础知识到完整实现，包括爬取网页内容、解析数据、存储数据、使用代理、反反爬策略等。稍后会提供完整的教程供你参考。1.爬虫基础什么是爬虫：网络爬虫（WebCrawler），又称网络蜘蛛（Spider），是一种自动化脚本或程序，用于按照一定规则批量获取网页数据。爬虫通过模拟浏览器行为向目标网站发送HTTP请求，获取网页的HTML源码，然后解析并提取所需的信息。
小学生python游戏编程arcade----坦克大战4 信息化未来助孩成长 python 游戏 word
小学生python游戏编程arcade----坦克大战4前言坦克大战41.1每单元英语单词学完升级效果1.2单词调用及敌坦克随机问题1.3效果图1.4代码实现源码获取前言接上篇文章继续解绍arcade游戏编程的基本知识。今天基本可玩了，让孩子试试坦克大战41.1每单元英语单词学完升级效果1.2单词调用及敌坦克随机问题self.scene.add_sprite_list_after(LAYER_ta
小学生python游戏编程arcade----坦克大战（1）信息化未来助孩成长 python 游戏开发语言
小学生python游戏编程arcade----坦克大战（1）前言坦克类，地图，角色的控制，声音等前期学习的汇总1、坦克类2、title地图加载2.1设置，tank类的引入2.2角色的引入2.3效果图2.4代码实现总结源码获取前言接上篇文章继续解绍arcade游戏编程的基本知识。坦克类，地图，角色的控制，声音等前期学习的汇总1、坦克类代码实现#_*_coding:UTF-8_*_"""坦克键盘控制转
【0009】Python运算符详解程序员张小厨【007】Python python Python运算符运算符 Python算术运算符 Python逻辑运算符 Python关系运算符 Python比较运算符
如果你觉得我的文章写的不错，请关注我哟，请点赞、评论，收藏此文章，谢谢！本文内容体系结构如下：运算符是用于执行各种运算的符号，例如加法、减法、乘法等。Python中的运算符可以分为算术运算符、赋值运算符、比较运算符、逻辑运算符、位运算符、成员运算符和身份运算符等。本文将详细讲解各个运算符的使用。一、算术运算符Python中的算术运算符主要用于执行数值计算，包括整数和浮点数的加减乘除等基本运算。具体
Python 基础（五）：基础语句 AI自学kuke-v Python教学 python 开发语言
在前几期我们讲了：Python基础（一）：基础常识Python基础（二）：变量与数据类型Python基础（三）：入门必备知识的思考与对之前内容的总结Python基础（四）：运算符与优先级这些内容后我们会开始将一些基础的题目来巩固学习的内容，这一期，我们讲基础语句。1条件语句在进行逻辑判断时，我们需要用到条件语句，Python提供了if、elif、else来进行逻辑判断。格式如下所示：if判断条件1
Swift语言的Web开发邵晨熙包罗万象 golang 开发语言后端
Swift语言的Web开发引言随着移动互联网的快速发展，Web开发的需求日益增长。传统上，Web开发主要使用JavaScript、Python、PHP等语言，但近年来，Swift作为一种新兴语言，也逐渐进入了Web开发的视野。Swift最初由苹果公司推出，主要用于iOS和macOS的应用开发。随着它的开源化，Swift逐步被应用于服务器端开发，形成了一种新的Web开发趋势。在本文中，我们将深入探讨
pywin32，一个超强的 Python 库！ Sitin涛哥 Python python 开发语言
更多Python学习内容：ipengtao.com大家好，今天为大家分享一个超强的Python库-pywin32。Github地址：https://github.com/mhammond/pywin32在Python的世界里，有许多优秀的第三方库可以帮助开发者更轻松地处理各种任务。其中，pywin32库是一个特别引人注目的工具，它提供了对WindowsAPI的完整访问，使得开发者能够利用Pytho
Python项目-基于深度学习的校园人脸识别考勤系统天天进步2015 Python项目实战 python
引言随着人工智能技术的快速发展，深度学习在计算机视觉领域的应用日益广泛。人脸识别作为其中的一个重要分支，已经在安防、金融、教育等多个领域展现出巨大的应用价值。本文将详细介绍如何使用Python和深度学习技术构建一个校园人脸识别考勤系统，该系统能够自动识别学生身份并记录考勤信息，大大提高了考勤效率，减轻了教师的工作负担。系统概述功能特点实时人脸检测与识别：能够从摄像头视频流中实时检测并识别人脸自动考
python小游戏-坦克大战 Wangawf python pygame 开发语言
完整的游戏状态管理：生命值系统得分系统游戏结束条件重新开始功能增强的坦克功能：坦克旋转无敌时间不同类型的坦克（玩家/敌人）改进的碰撞系统：子弹与墙壁碰撞子弹与坦克碰撞子弹与基地碰撞游戏机制的完善：敌人AI自动生成新敌人可破坏和不可破坏的墙壁用户界面改进：显示得分显示生命值游戏结束画面importpygameimportrandomimportos#初始化pygame和混音器pygame.init(
Python Cookbook-3.4 计算歌曲的总播放时间我不会编程555 #Python学习 python 开发语言
任务想获取一个列表中的所有歌曲的播放时间之和。解决方案使用datetime标准模块和内建的sum函数来完成这个任务:importdatetimedeftotaltimer(times):td=datetime.timedelta(0)#将总和初始化(必须是timedelta)duration=sum
Python从入门到精通航叔啦 python 开发语言
1.Python变量使用进阶在Python程序中创建、改变、查找变量名时，都是在一个保存变量名的空间中进行，我们称之为命名空间，也被称之为作用域。Python的作用域是静态的，在源代码中变量名被赋值的位置决定了该变量能被访问的范围。即Python变量的作用域由变量所在源代码中的位置决定。只有当变量在Module(模块)、Class(类)、def(函数)中定义的时候，才会有作用域的概念。在作用域中定
python常见面试题基础篇 (一) 航叔啦
Python基础篇1：为什么学习Python家里有在这个IT圈子里面，也想让我接触这个圈子，然后给我建议学的Python，然后自己通过百度和向有学过Python的同学了解了Python，Python这门语言，入门比较简单，它简单易学，生态圈比较强大，涉及的地方比较多，特别是在人工智能，和数据分析这方面。在未来我觉得是往自动化，人工智能这方面发展的，所以学习了Python2：通过什么途径学习Pyth
python正确的布尔值_Python小课笔记--Python基础：布尔值和空值处理处黑 python正确的布尔值
截图来自Python小课文|仟樱雪在Python小课-1--4节中，已经学习了：基础模块--数据--数据类型(整数、字符串，浮点数)，基础模块--变量，基础模块--函数(input函数、print函数，len函数，type函数，转换函数)。基础模块--控制流(条件判断)本节将继续学习本节继续学习：基础篇--数据截图来自Python小课一.基础知识：数据类型中的布尔值、空值1、布尔值：True还有F
jsonp 常用util方法 hw1287789687 jsonp jsonp常用方法 jsonp callback
jsonp 常用java方法 (1)以jsonp的形式返回:函数名(json字符串) /*** * 用于jsonp调用 * @param map : 用于构造json数据 * @param callback : 回调的javascript方法名 * @param filters : <code>SimpleBeanPropertyFilter theFilt
多线程场景 alafqq 多线程
0 能不能简单描述一下你在java web开发中需要用到多线程编程的场景？0 对多线程有些了解，但是不太清楚具体的应用场景，能简单说一下你遇到的多线程编程的场景吗？ Java多线程 2012年11月23日 15:41 Young9007 Young9007 4 0 0 4 Comment添加评论关注(2) 3个答案按时间排序按投票排序 0 0 最典型的如： 1、
Maven学习——修改Maven的本地仓库路径 Kai_Ge maven
安装Maven后我们会在用户目录下发现.m2 文件夹。默认情况下，该文件夹下放置了Maven本地仓库.m2/repository。所有的Maven构件(artifact)都被存储到该仓库中，以方便重用。但是windows用户的操作系统都安装在C盘，把Maven仓库放到C盘是很危险的，为此我们需要修改Maven的本地仓库路径。
placeholder的浏览器兼容 120153216 placeholder
【前言】自从html5引入placeholder后，问题就来了，不支持html5的浏览器也先有这样的效果，各种兼容，之前考虑，今天测试人员逮住不放，想了个解决办法，看样子还行，记录一下。【原理】不使用placeholder，而是模拟placeholder的效果，大概就是用focus和focusout效果。【代码】 <scrip
debian_用iso文件创建本地apt源 2002wmj Debian
1.将N个debian-506-amd64-DVD-N.iso存放于本地或其他媒介内，本例是放在本机/iso/目录下 2.创建N个挂载点目录如下： debian:~#mkdir –r /media/dvd1 debian:~#mkdir –r /media/dvd2 debian:~#mkdir –r /media/dvd3 …. debian:~#mkdir –r /media
SQLSERVER耗时最长的SQL 357029540 SQL Server
对于DBA来说，经常要知道存储过程的某些信息： 1. 执行了多少次 2. 执行的执行计划如何 3. 执行的平均读写如何 4. 执行平均需要多少时间列名 &
com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 7454103 eclipse
今天eclipse突然报了com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 错误，并且工程文件打不开了，在网上找了一下资料，然后按照方法操作了一遍，好了，解决方法如下：错误提示信息： An error has occurred.See error log for more details. Reason: com/genuitec/
用正则删除文本中的html标签 adminjun java html 正则表达式去掉html标签
使用文本编辑器录入文章存入数据中的文本是HTML标签格式，由于业务需要对HTML标签进行去除只保留纯净的文本内容，于是乎Java实现自动过滤。如下： public static String Html2Text(String inputString) { String htmlStr = inputString; // 含html标签的字符串 String textSt
嵌入式系统设计中常用总线和接口 aijuans linux 基础
嵌入式系统设计中常用总线和接口任何一个微处理器都要与一定数量的部件和外围设备连接，但如果将各部件和每一种外围设备都分别用一组线路与CPU直接连接，那么连线
Java函数调用方式——按值传递 ayaoxinchao java 按值传递对象基础数据类型
Java使用按值传递的函数调用方式，这往往使我感到迷惑。因为在基础数据类型和对象的传递上，我就会纠结于到底是按值传递，还是按引用传递。其实经过学习，Java在任何地方，都一直发挥着按值传递的本色。首先，让我们看一看基础数据类型是如何按值传递的。 public static void main(String[] args) { int a = 2;
ios音量线性下降 bewithme ios音量
直接上代码吧 //second 几秒内下降为0 - (void)reduceVolume:(int)second { KGVoicePlayer *player = [KGVoicePlayer defaultPlayer]; if (!_flag) { _tempVolume = player.volume;
与其怨它不如爱它 bijian1013 选择理想职业规划
抱怨工作是年轻人的常态，但爱工作才是积极的心态，与其怨它不如爱它。一般来说，在公司干了一两年后，不少年轻人容易产生怨言，除了具体的埋怨公司“扭门”，埋怨上司无能以外，也有许多人是因为根本不爱自已的那份工作，工作完全成了谋生的手段，跟自已的性格、专业、爱好都相差甚远。
一边时间不够用一边浪费时间 bingyingao 工作时间浪费
一方面感觉时间严重不够用，另一方面又在不停的浪费时间。每一个周末，晚上熬夜看电影到凌晨一点，早上起不来一直睡到10点钟，10点钟起床，吃饭后玩手机到下午一点。精神还是很差，下午像一直野鬼在城市里晃荡。为何不尝试晚上10点钟就睡，早上7点就起，时间完全是一样的，把看电影的时间换到早上，精神好，气色好，一天好状态。控制让自己周末早睡早起，你就成功了一半。有多少个工作
【Scala八】Scala核心二：隐式转换 bit1129 scala
Implicits work like this: if you call a method on a Scala object, and the Scala compiler does not see a definition for that method in the class definition for that object, the compiler will try to con
sudoku slover in Haskell (2) bookjovi haskell sudoku
继续精简haskell版的sudoku程序，稍微改了一下，这次用了8行，同时性能也提高了很多，对每个空格的所有解不是通过尝试算出来的，而是直接得出。 board = [0,3,4,1,7,0,5,0,0, 0,6,0,0,0,8,3,0,1, 7,0,0,3,0,0,0,0,6, 5,0,0,6,4,0,8,0,7,
Java-Collections Framework学习与总结-HashSet和LinkedHashSet BrokenDreams linkedhashset
本篇总结一下两个常用的集合类HashSet和LinkedHashSet。它们都实现了相同接口java.util.Set。Set表示一种元素无序且不可重复的集合；之前总结过的java.util.List表示一种元素可重复且有序
读《研磨设计模式》-代码笔记-备忘录模式-Memento bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; /* * 备忘录模式的功能是，在不破坏封装性的前提下，捕获一个对象的内部状态，并在对象之外保存这个状态，为以后的状态恢复作“备忘”
《RAW格式照片处理专业技法》笔记 cherishLC PS
注意，这不是教程！仅记录楼主之前不太了解的一、色彩（空间）管理作者建议采用ProRGB（色域最广），但camera raw中设为ProRGB，而PS中则在ProRGB的基础上，将gamma值设为了1.8（更符合人眼）注意：bridge、camera raw怎么设置显示、输出的颜色都是正确的（会读取文件内的颜色配置文件），但用PS输出jpg文件时，必须先用Edit->conv
使用 Git 下载 Spring 源码编译 for Eclipse crabdave eclipse
使用 Git 下载 Spring 源码编译 for Eclipse 1、安装gradle，下载 http://www.gradle.org/downloads 配置环境变量GRADLE_HOME，配置PATH %GRADLE_HOME%/bin，cmd，gradle -v 2、spring4 用jdk8 下载 https://jdk8.java.
mysql连接拒绝问题 daizj mysql 登录权限
mysql中在其它机器连接mysql服务器时报错问题汇总一、[running]root@192.168.9.136:~$mysql -uroot -h 192.168.9.108 -p //带-p参数，在下一步进行密码输入 Enter password: //无字符串输入 ERROR 1045 (28000): Access
Google Chrome 为何打压 H.264 dsjt apple html5 chrome Google
Google 今天在 Chromium 官方博客宣布由于 H.264 编解码器并非开放标准，Chrome 将在几个月后正式停止对 H.264 视频解码的支持，全面采用开放的 WebM 和 Theora 格式。 Google 在博客上表示，自从 WebM 视频编解码器推出以后，在性能、厂商支持以及独立性方面已经取得了很大的进步，为了与 Chromium 现有支持的編解码器保持一致，Chrome
yii 获取控制器名和方法名 dcj3sjt126com yii framework
1. 获取控制器名在控制器中获取控制器名: $name = $this->getId(); 在视图中获取控制器名: $name = Yii::app()->controller->id; 2. 获取动作名在控制器beforeAction()回调函数中获取动作名: $name =
Android知识总结（二） come_for_dream android
明天要考试了，速速总结如下 1、Activity的启动模式 standard：每次调用Activity的时候都创建一个（可以有多个相同的实例，也允许多个相同Activity叠加。） singleTop：可以有多个实例，但是不允许多个相同Activity叠加。即，如果Ac
高洛峰收徒第二期：寻找未来的“技术大牛” ——折腾一年，奖励20万元 gcq511120594 工作项目管理
高洛峰，兄弟连IT教育合伙人、猿代码创始人、PHP培训第一人、《细说PHP》作者、软件开发工程师、《IT峰播》主创人、PHP讲师的鼻祖！首期现在的进程刚刚过半，徒弟们真的很棒，人品都没的说，团结互助，学习刻苦，工作认真积极，灵活上进。我几乎会把他们全部留下来，现在已有一多半安排了实际的工作，并取得了很好的成绩。等他们出徒之日，凭他们的能力一定能够拿到高薪，而且我还承诺过一个徒弟，当他拿到大学毕
linux expect heipark expect
1. 创建、编辑文件go.sh #!/usr/bin/expect spawn sudo su admin expect "*password*" { send "13456\r\n" } interact 2. 设置权限 chmod u+x go.sh 3.
Spring4.1新特性——静态资源处理增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
idea ubuntuxia 乱码 liyonghui160com
1.首先需要在windows字体目录下或者其它地方找到simsun.ttf 这个字体文件。 2.在ubuntu 下可以执行下面操作安装该字体： sudo mkdir /usr/share/fonts/truetype/simsun sudo cp simsun.ttf /usr/share/fonts/truetype/simsun fc-cache -f -v
改良程序的11技巧 pda158 技巧
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短永远永远不要把同一个变量用于多个不同的
300个涵盖IT各方面的免费资源（下）——工作与学习篇 shoothao 创业免费资源学习课程远程工作
工作与生产效率: A. 背景声音 Noisli:背景噪音与颜色生成器。 Noizio:环境声均衡器。 Defonic:世界上任何的声响都可混合成美丽的旋律。 Designers.mx:设计者为设计者所准备的播放列表。 Coffitivity:这里的声音就像咖啡馆里放的一样。 B. 避免注意力分散 Self Co
深入浅出RPC uule rpc
深入浅出RPC-浅出篇深入浅出RPC-深入篇 RPC Remote Procedure Call Protocol 远程过程调用协议它是一种通过网络从远程计算机程序上请求服务，而不需要了解底层网络技术的协议。RPC协议假定某些传输协议的存在，如TCP或UDP，为通信程序之间携带信息数据。在OSI网络通信模型中，RPC跨越了传输层和应用层。RPC使得开发

深度学习基础——week1

更好的阅读体验

PyTorch

什么是PyTorch(来自官方文档)

Tensor（张量）

张量初始化

张量属性

张量运算

运算符

拼接

索引和切片

数学基础

线性代数

基本概念：

微积分

矩阵求导：

概率

基本概念：

线性神经网络

线性回归及其实现

基本元素

线性模型

损失函数（loss function）

小批量随机梯度下降（minibatch stochastic gradient descent）

代码实现 参考网站

生成数据集

读取数据集

定义模型

训练

结果：

softmax回归及其实现

网络架构

softmax运算

损失函数

代码实现参考网站

初始化模型参数

使用现成的softmax

优化算法

调用现成的接口训练模型，查看效果

最简单的DNN——多层感知机

感知机

多层感知机（MLP）

激活函数

ReLU函数

sigmoid函数

tanh函数

实战：spiral classification问题

总结

你可能感兴趣的:(深度学习入门,pytorch,python,深度学习)

代码实现参考网站